KR100617344B1

KR100617344B1 - 클러스터에서의 확실한 장애 해결 방법 및 시스템

Info

Publication number: KR100617344B1
Application number: KR1020040065873A
Authority: KR
Inventors: 라오수드히르; 잭슨브루스; 데이비스마크; 스리드하라스리카나스
Original assignee: 인터내셔널 비지네스 머신즈 코포레이션
Priority date: 2003-08-27
Filing date: 2004-08-20
Publication date: 2006-08-31
Also published as: TWI310494B; US20050050398A1; TW200511002A; CN1592225A; US20100115338A1; CN1303786C; JP3903437B2; US7284147B2; JP2005073277A; KR20050022329A; US7941690B2

Abstract

본 발명은 클러스터 환경에서 장애를 위치 검출하여 해결하는 방법 및 시스템에 관한 것이다. 클러스터(100)는 적어도 하나의 멀티 홈 노드(110)와, 각 네트워크 인터페이스에 대한 적어도 하나의 게이트웨이(180)를 포함한다. 피어 노드들 및 게이트웨이 간에는 소정의 주기적인 간격으로 하트비트를 보낸다(단계 202). 어떤 노드 또는 게이트웨이에 의해 하트비트 메시지가 손실되면(단계 204), 각 네트워크 인터페이스를 통해 클러스터의 각 노드와 게이트웨이에 ICMP 에코를 보낸다(단계 206). ICMP 에코 응답에 의해 노드 손실도 네트워크 손실도 아닌 것으로 확인되면, 애플리케이션 레벨의 핑을 발행하여(단계 224), 하트비트 메시지의 부재와 관련된 장애가 일시적인 에러 상태인지(단계 228) 애플리케이션 소프트웨어 장애인지(단계 230)를 판정한다.

Description

클러스터에서의 확실한 장애 해결 방법 및 시스템{RELIABLE FAULT RESOLUTION IN A CLUSTER}

도 1은 종래의 멀티 노드 컴퓨팅 시스템의 블록도.

도 2는 본 발명의 바람직한 실시예에 따른 멀티 노드 컴퓨팅 시스템의 블록도.

도 3a 및 도 3b는 컴퓨터 시스템에서 장애를 위치 검출하여 해결하는 프로세스를 도시한 흐름도.

<도면의 주요 부분에 대한 부호의 설명>

110, 120, 130 : 노드

112, 122, 132 : 네트워크 인터페이스₁

114, 124, 134 : 네트워크 인터페이스₂

180 : 게이트웨이

본 발명은 멀티 홈 노드 클러스터에서 장애를 해결하는 방법 및 시스템에 관 한 것이다. 더 구체적으로, 본 발명은 장애를 검출 및 분리시켜 장애의 기점을 판정함으로써 적절한 장애 극복(failover) 및 수리 활동을 가능하게 하는 것에 관한 것이다.

노드는 단일 또는 다수의 운영 체계 인스턴스를 실행하는 컴퓨터이다. 컴퓨팅 환경에 있어서 각 노드는 로컬 에어리어 네트워크(local area network : LAN)에서의 통신을 가능하게 해주는 네트워크 인터페이스를 포함한다. 클러스터는 통상적으로 스토리지 에어리어 네트워크를 통한 공유 스토리지 서브시스템 세트에의 액세스를 조정하는 하나 이상의 노드 세트이다. 일반적으로, 노드 그룹은 LAN을 다른 LAN이나 더 넓은 인트라넷 또는 글로벌 에어리어 네트워크에 접속시키는 게이트웨이와 통신한다. LAN에 있어서 각 네트워크 인터페이스와 각 게이트웨이는 식별 IP 어드레스를 갖는다.

또한, 잘 알려진 바와 같이, LAN 또는 WAN에 있어서 노드는 2개의 네트워크 인터페이스를 포함하며, "멀티 홈 노드"로도 알려져 있다. 2개의 네트워크 인터페이스 구성은 리던던트 접속성을 제공한다. 멀티 홈 노드는 양쪽의 네트워크 인터페이스에 액세스하는 소프트웨어를 포함한다. 어느 한 네트워크 인터페이스나 그 네트워크 인터페이스에 따른 경로에 장애가 일어난 경우에, 동일한 노드 상의 다른 네트워크 인터페이스로 통신이 전환될 수 있는데, 즉 그 노드로부터의 데이터 또는 서비스의 중단이나 손실 없이 장애를 극복할 수 있다.

네트워크에서 장애를 해결하는 한 방법은 피어 노드가 의심스러운 네트워크 인터페이스에 요청 응답 프로토콜 메시지를 발행할 것을 요구한다. 이러한 해결책은 네트워크 경로 손실을 확인하고, 장애가 로컬 네트워크 인터페이스와 관련된 것인지 아니면 리모트 네트워크 인터페이스와 관련된 것인지를 판정하는 특정 문제를 해결하려고 한다. 그러나, 이러한 기술은 리모트 노드 상의 어쩌면 신뢰할 수 없는 서버가 로컬 네트워크 인터페이스에 핑(ping)을 발행하는 것에 의존한다. 이러한 기술은 단지 단일 장애 시나리오 하에서만 유효하다. 리모트 노드에 영향을 미치는 네트워크 장애나 소프트웨어 장애는 로컬 노드에 대한 잘못된 판정을 제공할 것이다.

다른 해결책은 노드 간의 리던던트 하트비트 및 하트비트 채널과, 네트워크 장애를 해결하는 링크 장애 기술을 포함한다. 이러한 리던던트 하트비트 및 하트비트 채널을 이용하면, 확실한 노드 손실 검출과 관련된 문제는 해결할 수 있지만, 네트워크 손실과 관련된 문제는 해결할 수 없다. 마찬가지로, 네트워크 장애를 해결하는 링크 장애 기술은 네트워크 장애 극복을 지원할 수 있는 능력은 있지만, 노드와 네트워크로 이루어진 통합된 고이용도의 아키텍처를 감시할 수 있는 능력과, 통합된 노드 및 네트워크 경로 장애 극복을 지원할 수 있는 능력이 없다. 게다가, 링크 장애 기술은 장애 극복 시에 클러스터 재구성을 필요로 하여 네트워크 분할이 일어났는지를 판정할 수 있는 능력이 없다. 마지막으로, 통상적으로 네트워크 드라이버에 의해 제공되는 그러한 해결책은 단일 서브넷 네트워크 토폴로지에서만 유효하다.

장애를 확실하게 검출하여 해결하는 종래의 방법은 통합된 고이용도의 아키 텍처에서 효율적이거나 확실하지 않고, 또한 2개의 노드 클러스터에서 확실하게 문제를 해결하지 못한다. 따라서, 통합된 고이용도의 아키텍처에서 장애를 확실하고 효율적으로 검출하여 해결하는 방법 및 시스템이 요구된다.

본 발명은 컴퓨터 시스템에서 장애를 해결하는 방법 및 시스템을 포함한다.

본 발명의 제1 형태로서, 컴퓨터 시스템에서의 장애 해결 방법이 제공된다. 클러스터는 네트워크 인터페이스에 대한 게이트웨이를 갖도록 구성된다. 하트비트 손실 검출에 응답하여 운영 체계 인터넷 컨트롤 메시지 프로토콜(ICMP) 에코를 상기 네트워크 인터페이스를 통해 상기 클러스터의 모든 피어 노드와 상기 게이트웨이에 발행한다. 상기 클러스터에서의 장애의 위치를 판정하기 위해서 상기 에코로부터의 응답을 분석한다. 소정의 시간 내에 상기 에코 응답을 수신하는 것과 하트비트 손실 검출 모두에 응답하여 애플리케이션 레벨의 핑을 피어 노드에 발행할 수 있다.

본 발명의 제2 형태로서, 네트워크 인터페이스에 대한 게이트웨이를 갖는 클러스터를 포함하는 컴퓨터 시스템이 제공된다. 하트비트 손실 검출에 응답하여 운영 체계 ICMP 에코를 상기 네트워크 인터페이스를 통해 상기 클러스터의 모든 피어 노드와 상기 게이트웨이에 발행한다. 상기 클러스터에서의 장애의 위치를 판정하기 위해서 상기 에코로부터의 응답을 분석한다. 소정의 시간 내에 상기 에코를 수신하는 것과 상기 하트비트 손실 검출 모두에 응답하여 애플리케이션 레벨의 핑을 피어 노드에 발행할 수 있다.

본 발명의 제3 형태로서, 컴퓨터로 판독 가능한 신호 저장 매체를 포함하는 제품이 제공된다. 하트비트 손실 검출에 응답하여 운영 체계 ICMP 에코를 네트워크 인터페이스를 통해 클러스터의 피어 노드와 클러스터의 게이트웨이에 발행하는 매체 내 수단이 제공된다. 또한, 상기 클러스터에서의 장애의 위치를 판정하기 위해서 상기 에코로부터의 응답을 분석하는 매체 내 수단이 제공된다. 소정의 시간 내에 에코 응답을 수신하는 것과 하트비트 손실 검출 모두에 응답하여 애플리케이션 레벨의 핑을 피어 노드에 발행하는 매체 내 수단이 제공될 수 있다.

본 발명의 다른 특징 및 이점은 첨부한 도면과 함께 다음의 바람직한 실시예에 대한 설명으로부터 명백히 알 수 있을 것이다.

바람직한 실시예에 대한 설명

개요

클러스터는 멀티 홈 노드와 각 네트워크 인터페이스에 대한 적어도 하나의 게이트웨이로 구성된다. 클러스터의 피어 노드 간에는 소정의 주기적인 간격으로 하트비트 메시지를 보낸다. 하트비트 메시지가 손실되면, 양쪽의 네트워크 인터페이스를 통해 클러스터의 모든 노드와 게이트웨이에 ICMP 에코를 보낸다. 클러스터의 모든 노드와 게이트웨이에 ICMP 에코를 보내는 것은 장애 발생 여부 및 네트워크 분할 여부를 판정하는 데에 뿐만 아니라, 노드 손실, 네트워크 인터페이스와 관련된 장애 및/또는 케이블 장애의 위치를 판정하는 데에 도움이 된다. 또한, 애플리케이션 레벨의 핑을 발행하여 장애의 위치를 판정할 수도 있다. 따라서, 클러스터의 각 노드와 게이트웨이에 각 네트워크 인터페이스를 통해 ICMP 에코를 보냄으 로써, 장애의 위치를 확실하게 판정할 수 있고 그 장애 상태를 효율적으로 해결할 수 있다.

기술적 상세

네트워크의 피어 노드들에 소정의 간격으로 하트비트 메시지를 보내는 것은 잘 알려져 있다. 도 1은 종래의 멀티 노드 컴퓨팅 시스템의 블록도(10)이다. 이 예에 있어서, 화살표는 하트비트를 나타내고, 직선은 네트워크 경로를 나타낸다. 이 시스템에는 3개의 노드, 즉 노드₀(20), 노드₁(30), 노드₂(40)가 있다. 각 노드는 멀티 홈 노드이다. 도 1에 도시한 바와 같이, 노드₀(20)은 네트워크 인터페이스₁(22)과 네트워크 인터페이스₂(24)를 갖는다. 마찬가지로, 노드₁(30)은 네트워크 인터페이스₁(32)과 네트워크 인터페이스₂(34)를 갖고, 노드₂(40)는 네트워크 인터페이스₁(42)과 네트워크 인터페이스₂(44)를 갖는다. 도 1에 도시한 바와 같이, 네트워크의 인접한 피어 노드들에 하트비트를 보낸다. 예컨대, 노드₀(20)은 제1 네트워크 인터페이스(22, 32, 42)를 통해 제1 하트비트 메시지(50, 52)를 각각 노드₁(30) 및 노드₂(40)에 보내고, 제2 네트워크 인터페이스(24, 34, 44)를 통해 제2 하트비트 메시지(54, 56)를 각각 노드₁(30) 및 노드₂(40)에 보낸다. 마찬가지로, 노드₁(30)은 제1 네트워크 인터페이스(22, 32, 42)를 통해 제1 하트비트 메시지(50, 58)를 각각 노드₀(20) 및 노드₂(40)에 보내고, 제2 네트워크 인터페이스(24, 34, 44)를 통해 제2 하트비트 메시지(54, 60)를 각각 노드₀(20) 및 노드₂(40)에 보내며, 노드₂(40)는 제1 네트워크 인터페이스(22, 32, 42)를 통해 제1 하트비트 메시지(52, 58)를 노드₀(20) 및 노드₁(30)에 보내고, 제2 네트워크 인터페이스(24, 34, 44)를 통해 제2 하트비트 메시지(56, 60)를 노드₀(20) 및 노드₁(30)에 보낸다. 본질적으로, 각 노드는 각 네트워크 인터페이스를 통해 독립적이고 주기적인 하트비트 메시지를 인접한 피어 노드들에 보낸다. 이 하트비트 메시지는 양방향이며 인접한 노드 간에 존재하여 노드 내의 장애를 검사한다. 그러나, 하트비트 메시지는 네트워크 손실을 해결할 수 없다. 따라서, 하트비트 메시지는 그러한 장애가 있다 해도 그것을 해결할 수 없고 단지 노드 레벨의 장애만을 판정하는 데에 유용할 뿐이다.

도 2는 2개의 네트워크 인터페이스에 대한 게이트웨이(180)를 갖는 멀티 홈 멀티 노드 컴퓨팅 시스템의 일례의 블록도이다. 이 예에서, 상기 시스템에는 3개의 노드, 즉 노드₀(110), 노드₁(120), 노드₂(130)가 있다. 각 노드는 멀티 홈 노드이다. 도 2에 도시한 바와 같이, 노드₀(110)은 네트워크 인터페이스₁(112)과 네트워크 인터페이스₂(114)를 갖는다. 마찬가지로, 노드₁(120)은 네트워크 인터페이스₁(122)과 네트워크 인터페이스₂(124)를 갖고, 노드₂(130)는 네트워크 인터페이스₁(132)과 네트워크 인터페이스₂(134)를 갖는다. 다수의 네트워크 인터페이스 이외에도, 상기 시스템은 네트워크 인터페이스₁(112, 122, 132) 및 네트워크 인터페이스₂(114, 124, 134)와 통신하는 게이트웨이(180)를 갖는다. 도 2에 도시한 바와 같이, 네트워크의 인접한 피어 노드들에 하트비트를 보낸다. 예컨대, 노드₀(110)은 제1 네트워크 인터페이스(112, 122, 132)를 통해 제1 하트비트 메시지(152, 158)를 노드₁(120) 및 노드₂(130)에 보내고, 제2 네트워크 인터페이스(114, 124, 134)를 통해 제2 하트비트 메시지(150, 160)를 노드₁(120) 및 노드₂(130)에 보낸다. 마찬가지로, 노드₁(120)은 제1 네트워크 인터페이스(112, 122, 132)를 통해 제1 하트비트 메시지(152, 156)를 각각 노드₀(110) 및 노드₂(130)에 보내고, 제2 네트워크 인터페이스(114, 124, 134)를 통해 제2 하트비트 메시지(150, 154)를 노드₀(110) 및 노드₂(130)에 보내며, 노드₂(130)는 제1 네트워크 인터페이스(112, 122, 132)를 통해 제1 하트비트 메시지(156, 158)를 노드₁(120) 및 노드₀(110)에 보내고, 제2 네트워크 인터페이스(114, 124, 134)를 통해 제2 하트비트 메시지(154, 160)를 노드₁(120) 및 노드₀(110)에 보낸다. 또한, 게이트웨이(180)는 양쪽의 네트워크 인터페이스의 네트워크 경로에 존재한다. 게이트웨이(180)는 하트비트 메시지를 송신하거나 수신하지 않는데, 그 이유는 하트비트 메시지가 애플리케이션 레벨의 프로토콜이기 때문이며, 또한 게이트웨이(180)는 운영 체계 레벨의 프로토콜로 제한된다. 게이트웨이(180)가 존재함으로써, 운영 체계 레벨의 장애, 예컨대 네트워크 경로와 관련된 장애나, 네트워크 경로에 있는 구성 요소(예컨대, 카드, 스위치, 허브 등)와 관련된 장애 등을 검출 할 수 있다. 따라서, 각 노드는 주기적인 양방향의 하트비트 메시지를 각 네트워크 인터페이스를 통해 인접한 피어 노드들에 보내어, 네트워크 토폴로지에 있는 게이트웨이와 관련된 네트워크 내의 장애를 감시한다.

양방향 하트비트 메시지는 노드와의 통신의 손실을 감시하는 데에 이용된다. 피어 노드에 의해 하트비트 메시지가 손실된 경우에는, ICMP 메시지가 네트워크 동작 또는 그 장애에 관한 대역외 메시지에 이용된다. ICMP 에코 기능은 호스트 사이를 왕복 이동하는 인터넷 프로토콜 패킷을 보내는 것이다. 마찬가지로, 운영 체계 프로토콜 대신에 애플리케이션 레벨의 프로토콜을 이용하는 핑은 수신처가 에코백(echo back)하려는 메시지를 보내는 데에 이용된다. 애플리케이션 레벨의 핑은 송신하는 각 패킷에 유일한 시퀀스 번호를 부여하고, 다시 수신한 시퀀스 번호가 무엇인지를 보고한다. 이것에 의해, 시스템 오퍼레이터는 패킷이 드롭되었는지, 복사되었는지, 재정렬되었지를 판정할 수 있게 된다. 또한, 이러한 핑 기능은 각 패킷에 타임스탬프를 두는데, 이것은 에코백되어 각 패킷 교환에 걸린 시간, 즉 왕복 이동 시간을 계산하는 데에 이용될 수 있다. 또한, 핑은 예컨대 라우터가 타겟 호스트에의 도달이 불가능함을 나타내는 경우에 다른 ICMP 메시지를 보고한다.

도 3a 및 도 3b는 하트비트 메시지, ICMP 에코 및 선택적인 애플리케이션 레벨의 핑을 이용하여 도 2에 도시한 멀티 홈 멀티 노드 컴퓨팅 시스템(100)에서 장애를 위치 검출하여 해결하는 프로세스를 도시한 흐름도(200)이다. 하트비트 메시지를 피어 노드에 보내어 장애 검출을 감시한다(단계 202). 다음에, 어느 한쪽의 네트워크 인터페이스에 하트비트의 손실이 있는지를 판정한다(단계 204). 단계 204 에서의 질의에 대한 응답이 "아니오"인 경우에는 단계 202로 되돌아가서 소정의 간격으로 하트비트 메시지를 보내는 프로세스를 계속한다. 그러나, 단계 204에서의 질의에 대한 응답이 "예"인 경우에는 특정 노드에 의한 하트비트의 손실을 나타낸다. 다음에, 그 하트비트의 손실을 검출한 노드가 ICMP 에코를 발행한다(단계 206). 그 ICMP 에코는 그 하트비트의 손실을 검출한 노드로부터 양쪽의 네트워크 인터페이스를 통해 클러스터의 모든 피어 노드 및 게이트웨이에 보내어진다. ICMP 에코의 한 세트는 제1 네트워크 인터페이스를 통해 보내어지고, ICMP의 또 다른 한 세트는 제2 네트워크 인터페이스를 통해 보내어진다. 하트비트의 손실에 응답하여 발행되는 에코의 수는 다음과 같다:

에코의 수 = [(N-1) + (게이트웨이의 수)] * (네트워크 인터페이스의 수)

여기서 N은 상기 시스템에 있는 노드의 수를 나타낸다. ICMP 에코는 각 노드 상의 운영 체계에 발행된다. 따라서, 그 에코의 발행은 하나 이상의 노드에 장애가 일어날 수 있는 클러스터의 하나 이상의 노드 상에서 실행되는 운영 체계로부터의 응답 메시지를 요구한다.

ICMP 에코 응답은 노드 손실 또는 네트워크 경로 손실에 대한 의심을 확인하는 기능을 한다. ICMP 에코의 발행 후에는, 어느 한 네트워크 인터페이스에 대해 적어도 하나의 에코 리턴을 수신하였는지를 판정한다(단계 208). 단계 208에서의 질의에 대한 응답이 "예"인 경우에는 그 네트워크 인터페이스에 따른 네트워크 경로가 제대로 기능을 하고 있다는 것을 나타낸다(단계 210). 그 후, 네트워크 인터페이스들에 대해 설정된 타겟 노드로부터의 에코 응답들을 비교하여, 클러스터 내 에서 어느 한쪽의 네트워크 인터페이스에 따른 최상의 접속성의 경로를 판정한다(단계 212). 다음에, 다른 네트워크 경로의 접속성이 개선되었는지를 판정한다(단계 214). 단계 214에서의 질의에 대한 응답이 "아니오"인 경우에는 단계 202로 되돌아간다. 그러나, 단계 214에서의 질의에 대한 응답이 "예"인 경우에는 네트워크 경로 장애가 극복된다(단계 216). 따라서, 적어도 하나의 에코 리턴이 생기면, 네트워크 접속성 문제가 위치 검출되어 해결된다.

그러나, 단계 208에서의 질의에 대한 응답이 "아니오"인 경우에는 그 네트워크 경로에는 장애가 존재하지 않는다는 것을 나타낸다. 그러므로, 동일한 피어 노드로부터 린던던트 에코가 리턴되었는지를 판정한다(단계 218). 단계 218에서의 질의에 대한 응답이 "아니오"인 경우에는 피어 노드의 노드 하드웨어 및/또는 운영 체계 장애에 관한 피어 노드 장애임을 나타낸다(단계 220). 그 후에는, 노드 장애를 극복하거나 클러스터를 재구성한다(단계 222). ICMP 에코 응답에 의해 노드 손실도 네트워크 손실도 아닌 것으로 확인되면, 애플리케이션 레벨의 핑을 발행한다.(단계 224). 그 핑 발행 후에는, 그 핑에 대한 응답이 있는지를 판정한다(단계 226). 핑 응답이 있으면 일시적인 에러 상태임을 나타내고(단계 228), 소정의 시간 내에 핑 응답이 없으면 애플리케이션 소프트웨어 장애임을 나타낸다(단계 230). 네트워크 접속성에 장애가 없으면, 이어서 노드 장애, 일시적인 에러 상태, 또는 애플리케이션 소프트웨어 장애로 존재할 수 있는 다른 장애를 판정하여 위치 검출한다. 따라서 장애의 위치 검출은 자동 복구 활동 및/또는 관리 수리 활동의 최상의 과정을 판정하는 데에 도움이 된다.

종래 기술에 비한 이점

양쪽의 네트워크 인터페이스 및 관련 메시지에 대한 라우팅 테이블을 갖는 게이트웨이는 물리적인 컴퓨터 시스템 및 애플리케이션 소프트웨어 내에 구성된다. 라우팅 테이블은 각 네트워크에 따른 효율적인 메시지 및 에코 전송을 가능하게 한다. 또한, 각 네트워크 인터페이스에 대한 게이트웨이를 갖는 컴퓨터 시스템의 구성은 ICMP 에코의 특정 네트워크에의 발행 제어를 가능하게 한다. 마지막으로, 네트워크 구성 내에 게이트웨이를 배치하는 것은 의심스러운 장애가 네트워크에 존재하는지 아니면 네트워크 내의 노드에 존재하는지를 판정하는 데에 도움이 된다. 특히, 그것은 일반적으로 2개의 노드 클러스터 및 네트워크 분할에서 장애를 해결하는 데에 도움이 된다. 따라서, 컴퓨터 시스템 내에 게이트웨이를 배치하는 것은 상기 시스템에서 장애를 위치 검출하여 해결함에 있어서 향상된 효율성 및 확실성을 제공한다.

다른 실시예

전술한 본 발명의 특정 실시예는 예시적인 것이며, 본 발명의 범위 내에서 다양하게 변형 가능하다. 특히, 본 발명은 도 2에 도시한 시스템의 구조적 레이아웃으로 한정되어서는 안된다. 각 네트워크는 다수의 게이트웨이를 포함할 수 있고, 노드와 게이트웨이의 접속 설계를 변경할 수 있다. 또한, 네트워크 토폴로지는 단일 서브넷이거나 이중 서브넷, 또는 리던던트 물리적 네트워크일 수 있다. 따라서, 본 발명의 보호 범위는 다음의 청구 범위와 그 균등물에 의해서만 한정된다.

본 발명에 의하면, 장애를 검출 및 분리시켜 장애의 기점을 판정함으로써 적절한 장애 극복 및 수리 활동이 가능하다.

Claims

(a) 네트워크 인터페이스에 대한 게이트웨이를 갖는 클러스터를 구성하는 단계와;

(b) 하트비트 손실 검출에 응답하여 운영 체계 인터넷 컨트롤 메시지 프로토콜(ICMP) 에코를 상기 네트워크 인터페이스를 통해 상기 클러스터의 모든 피어 노드와 상기 게이트웨이에 발행하는 단계와;

(c) 상기 클러스터에서의 장애의 위치를 판정하기 위해서 상기 에코로부터의 응답을 분석하는 단계를 포함하며,

상기 에코로부터의 응답을 분석하는 단계 (c)는 상기 응답을 수신하여 상기 에코의 의도된 수신처를 판정하는 단계를 포함하는 것인 컴퓨터 시스템에서의 장애 해결 방법.
삭제
제 1항에 있어서,

소정의 시간 내에 상기 네트워크 인터페이스에 대해 상기 피어 노드들로부터 상기 에코의 리턴을 수신하면, 이것은 상기 네트워크 인터페이스가 제대로 기능을 하고 있다는 것을 나타내는 것인 컴퓨터 시스템에서의 장애 해결 방법.
제 1항에 있어서,

소정의 시간 내에 상기 네트워크 인터페이스에 대해 상기 게이트웨이로부터 상기 에코의 리턴을 수신하면, 이것은 상기 네트워크 인터페이스가 제대로 기능을 하고 있다는 것을 나타내는 것인 컴퓨터 시스템에서의 장애 해결 방법.
제 1항에 있어서,

소정의 시간 내에 상기 네트워크 인터페이스에 대해 상기 피어 노드들로부터 상기 에코의 리턴을 수신하지 못하면, 이것은 피어 노드 장애, 그 피어 노드와 관련된 네트워크 장애 및 이들 장애의 조합으로 이루어진 그룹으로부터 선택된 장애를 나타내는 것인 컴퓨터 시스템에서의 장애 해결 방법.
제 1항에 있어서,

소정의 시간 내에 상기 에코 응답을 수신하는 것과 상기 하트비트 손실 검출 모두에 응답하여 애플리케이션 레벨의 핑을 피어 노드에 발행하는 단계를 더 포함하는 컴퓨터 시스템에서의 장애 해결 방법.
제 1항에 있어서,

각 네트워크 인터페이스에 대해 설정된 타겟 노드로부터의 에코 응답을 비교하는 단계를 더 포함하는 컴퓨터 시스템에서의 장애 해결 방법.
제 7항에 있어서,

상기 각 네트워크 인터페이스에 대해 설정된 타겟 노드로부터의 에코 응답을 비교하는 단계는 상기 네트워크에서의 최대 노드 유효성, 상기 네트워크에서의 상기 게이트웨이의 유효성 및 이들 유효성의 조합으로 이루어진 그룹으로부터 선택된 기준을 포함하는 것인 컴퓨터 시스템에서의 장애 해결 방법.
네트워크 인터페이스에 대한 게이트웨이를 갖는 클러스터와;

하트비트 손실 검출에 응답하여 상기 네트워크 인터페이스를 통해 상기 클러스터의 모든 피어 노드와 상기 게이트웨이에 발행되는 운영 체계 ICMP 에코와;

상기 클러스터에서의 장애의 위치를 판정하기 위해서 분석되는 상기 에코로부터의 응답을 포함하며,

상기 에코로부터의 응답을 분석하는 것은 상기 에코의 의도된 수신처를 판정하는 것을 포함하는 것인 멀티프로세서 컴퓨터 시스템.
삭제
제 9항에 있어서,

소정의 시간 내에 상기 네트워크 인터페이스에 대해 상기 피어 노드들로부터 상기 에코의 리턴을 수신하면, 이것은 상기 네트워크 인터페이스가 제대로 기능을 하고 있다는 것을 나타내는 것인 멀티프로세서 컴퓨터 시스템.
제 9항에 있어서,

소정의 시간 내에 상기 네트워크 인터페이스에 대해 상기 게이트웨이로부터 상기 에코의 리턴을 수신하면, 이것은 상기 네트워크 인터페이스가 제대로 기능을 하고 있다는 것을 나타내는 것인 멀티프로세서 컴퓨터 시스템.
제 11항에 있어서,

소정의 시간 내에 상기 네트워크 인터페이스에 대해 상기 피어 노드들로부터 상기 에코의 리턴을 수신하지 못하면, 이것은 피어 노드 장애, 그 피어 노드와 관련된 네트워크 장애 및 이들 장애의 조합으로 이루어진 그룹으로부터 선택된 장애를 나타내는 것인 멀티프로세서 컴퓨터 시스템.
제 9항에 있어서,

소정의 시간 내에 상기 에코를 수신하는 것과 상기 하트비트 손실 검출 모두에 응답하여 피어 노드에 발행하는 애플리케이션 레벨의 핑을 더 포함하는 멀티프로세서 컴퓨터 시스템.
제 9항에 있어서,

각 네트워크 인터페이스에 대해 타겟 노드로부터의 에코 응답을 비교하는 비교 툴을 더 포함하는 멀티프로세서 컴퓨터 시스템.
제 15항에 있어서,

상기 비교 툴은 상기 네트워크에서의 최대 노드 유효성, 상기 네트워크에서의 상기 게이트웨이의 유효성 및 이들 유효성의 조합으로 이루어진 그룹으로부터 선택된 기준에 기초하여 네트워크 인터페이스 경로를 판정하는 멀티프로세서 컴퓨터 시스템.
하트비트 손실 검출에 응답하여 운영 체계 ICMP 에코를 네트워크 인터페이스를 통해 클러스터의 피어 노드와 클러스터의 게이트웨이에 발행하게 하는 명령어와;

상기 클러스터에서의 장애의 위치를 판정하기 위해서 상기 에코로부터의 응답을 분석하게 하는 명령어를 포함하며,

상기 에코로부터의 응답 메시지를 분석하게 하는 명령어는 상기 응답을 수신하여 상기 에코의 의도된 수신처를 판정하는 것을 포함하는 것인 컴퓨터로 판독 가능한 기록 매체.
삭제
삭제
제 17항에 있어서,

소정의 시간 내에 에코 응답을 수신하는 것과 하트비트 손실 검출 모두에 응답하여 애플리케이션 레벨의 핑을 피어 노드에 발행하게 하는 명령어를 더 포함하는 것인 컴퓨터로 판독 가능한 기록 매체.
제 17항에 있어서,

각 네트워크 인터페이스에 대해 설정된 타겟 노드로부터의 에코 응답을 비교하게 하는 명령어를 더 포함하는 것인 컴퓨터로 판독 가능한 기록 매체.
제 21항에 있어서,

각 네트워크 인터페이스에 대해 설정된 타겟 노드로부터의 에코 응답을 비교하게 하는 명령어는 상기 네트워크에서의 최대 노드 유효성, 상기 네트워크에서의 상기 게이트웨이의 유효성 및 이들 유효성의 조합으로 이루어진 그룹으로부터 선택된 기준을 포함하는 것인 컴퓨터로 판독 가능한 기록 매체.