KR101385910B1 - 노드들 간의 장치 동기 에러 정보 - Google Patents

노드들 간의 장치 동기 에러 정보 Download PDF

Info

Publication number
KR101385910B1
KR101385910B1 KR1020107027344A KR20107027344A KR101385910B1 KR 101385910 B1 KR101385910 B1 KR 101385910B1 KR 1020107027344 A KR1020107027344 A KR 1020107027344A KR 20107027344 A KR20107027344 A KR 20107027344A KR 101385910 B1 KR101385910 B1 KR 101385910B1
Authority
KR
South Korea
Prior art keywords
node
error counter
error
action
message
Prior art date
Application number
KR1020107027344A
Other languages
English (en)
Other versions
KR20110022587A (ko
Inventor
제임스 라마 후드
브라이언 앤토니 리날디
미카 로비슨
토드 찰스 소렌슨
Original Assignee
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 인터내셔널 비지네스 머신즈 코포레이션
Publication of KR20110022587A publication Critical patent/KR20110022587A/ko
Application granted granted Critical
Publication of KR101385910B1 publication Critical patent/KR101385910B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Abstract

노드들 간의 장치 에러 정보를 동기화하는 방법, 시스템 및 컴퓨터 프로그램이 제공된다. 제 1 노드는 제 1 노드와 제 2 노드와 통신하는 장치에 대한 제 1 노드 에러 카운터에 대해 액션을 수행한다. 제 1 노드는 장치와 그 장치에 대한 제 1 노드 에러 카운터에 대해 수행된 액션을 표시하는 제 2 노드에 메시지를 송신한다. 제 2 노드는 메시지에 표시된 장치에 대한 제 2 노드 에러 카운터에 대해 메시지에 표시된 액션을 수행하고, 제 2 노드 에러 카운터는 장치에 대한 제 1 노드 에러 카운터에 대응한다.

Description

노드들 간의 장치 동기 에러 정보{SYNCHRONIZING DEVICE ERROR INFORMATION AMONG NODES}
본 발명은 노드들 간의 장치 에러 정보를 동기화하는 방법, 시스템 및 컴퓨터 프로그램에 관한 것이다.
저장 네트워크 내의 호스트 시스템은 다수의 경로를 통해 저장 제어기와 통신할 수 있다. 저장 제어기는 개별적인 저장 클러스터 또는 노드로 구성될 수 있으며, 각각의 저장 클러스터는 저장 장치를 액세스하고 저장 장치를 액세스하기 위한 리더던시(redundancy)를 제공할 수 있다. 호스트는 다른 클러스터를 통해 부착된 저장 장치를 액세스할 수 있다. 저장 장치 클러스터가 고장이면, 호스트는 저장 장치를 액세스하도록 다른 저장 장치 클러스터를 사용하는 것을 페일오버(failover)할 수 있다.
리던던트 저장 장치 제어기 환경에서, 각각의 저장 노드 또는 클러스터가 네트워크 및 입/출력 장치 어댑터와 같은 특정의 외부 리소스의 소유권을 수립하는 것이 일반적이다. 시스템 내의 노드가 고장이면, 시스템 내의 다른 노드는 고장 노드에 의해 소유된 리소스의 소유권을 인수할 수 있다. 시스템 내의 외부 리소스가 에러를 보고하기 시작하면, 소유 노드는 이들 에러를 임계화하기 시작하고 검출된 에러의 수에 근거하여 적절한 시스템 복구 액션을 취할 것이다. 이 프로세스 동안, 소유 노드가 고장나면(fails), 다른 이용 가능한 노드는 외부 리소스의 소유권을 인수하지만 고장 노드에 의해 기록된 이전의 에러에 관해 알지 못할 수 있다. 이것은 새로운 소유 노드가 외부 리소스 상에서 다음 에러를 마치 첫 번째 에러인 것처럼 처리하도록 한다.
외부 리소스에 의해 보고된 다수의 에러가 이전의 소유 노드를 고장나게 하면, 새로운 소유 노드는 이전의 노드와 동일한 액션을 통해 진행할 것이고, 이는 동일한 방식으로 새로운 소유 노드의 고장을 초래할 수 있다. 시스템 내의 다른 노드가 리소스의 소유권을 계속해서 인수하면, 이것은 모든 노드가 고장나도록 하여, 고객이 데이터에 액세스하는 것을 실패하게 한다. 제로 에러 카운트로부터 복구 동작을 재개하면 호스트 시스템이 종료하고 고객이 데이터에 액세스하는 것을 실패하도록 (이전의 소유 노드 및 새로운 소유 노드에 의해 취해진) 전체 시스템 복구가 충분히 오래 걸리게 될 수 있다.
당 분야에서는 다수의 노드에 의해 액세스된 공유 장치에 대해 에러 정보를 유지하는 향상된 기법에 대판 필요성이 종재한다.
노드들 간의 장치 에러 정보를 동기화하는 방법, 시스템 및 컴퓨터 프로그램이 제공된다. 제 1 노드는 제 1 노드와 제 2 노드와 통신하는 장치에 대한 제 1 노드 에러 카운터에 대해 액션을 수행한다. 제 1 노드는 장치와 그 장치에 대한 제 1 노드 에러 카운터에 대해 수행된 액션을 표시하는 제 2 노드에 메시지를 송신한다. 제 2 노드는 메시지에 표시된 장치에 대한 제 2 노드 에러 카운터에 대해 메시지에 표시된 액션을 수행하고, 제 2 노드 에러 카운터는 장치에 대한 제 1 노드 에러 카운터에 대응한다.
다른 실시예에서, 메시지에 표시된 액션은 오픈 액션을 포함한다. 제 2 노드는 메시지에 응답하여 장치에 대한 제 2 노드 에러 카운터를 생성함으로써 오픈 액션을 수행한다.
다른 실시예에서, 메시지에 표시된 액션은 만료 액션을 포함한다. 제 2 노드는 메시지에 응답하여 장치에 대한 제 2 노드 에러 카운터를 만료시킴으로써 만료 액션을 수행한다.
다른 실시예에서, 제 1 노드는 장치에서 에어를 검출한다. 제 1 노드는 에러를 검출하는 것에 응답하여 장치에 대한 제 2 노드 에러 카운터를 증분시킴으로써 액션을 수행한다. 메시지에 표시된 액션은 증분 액션을 포함한다. 제 2 노드는 제 2 노드에서 장치에 대한 제 2 노드 에러 카운터를 증분시킴으로써 증분 액션을 수행한다.
다른 실시예에서, 제 1 노드는 에러 임계치에 도달하는 에러 카운터 값에 응답하여 에러 복구 동작을 개시한다.
다른 실시예에서, 제 1 노드는 장치에 대해 에러 처리를 수행하는 장치의 소유자로서 동작한다. 제 2 노드는 장치의 소유권을 인수하고, 장치에서 에러를 검출하는 제 2 노드에 응답하여 제 1 노드에 의해 검출된 장치에서의 에러를 표시하는 제 2 노드 에러 카운터를 증분시킨다.
다른 실시예에서, 제 2 노드는 제 1 노드의 고장에 응답하여 장치의 소유권을 인수한다.
다른 실시예에서, 장치는 제 1 장치를 포함하고, 제 1 노드 에러 카운터는 제 1 노드 제 1 장치 에러 카운터를 포함하고, 제 2 노드 에러 카운터는 제 2 에러 제 1 장치 카운터 복사본을 포함한다. 제 2 노드는 제 1 노드와 제 2 노드와 통신하는 제 2 장치에서의 에러 수를 표시하는 제 2 노드 제 2 장치 에러 카운터를 유지한다. 제 1 노드는 제 2 노드에 의해 검출된 에러를 포함하는 제 2 장치에서의 에러의 수를 표시하는 제 1 노드 제 2 장치 에러 카운터를 유지한다.
다른 실시예에서, 제 1 노드 및 제 2 노드는 서버 내의 제 1 인터페이스를 통해 통신하는 서버 내의 제 1 및 제 2 프로세싱 클러스터를 포함하며, 제 1 및 제 2 장치는 제 1 및 제 2 네트워크 인터페이스를 포함하고, 제 1 및 제 2 프로세싱 클러스터는 제 2 인터페이스를 통해 제 1 및 제 2 어댑터와 통신한다.
다른 실시예에서, 제 2 노드는 제 2 장치로부터 에러 메시지를 수신한다. 제 2 노드는 제 2 노드 제 2 장치 에러 카운터를 증분시킨다. 제 2 노드는 제 2 장치에 대한 제 1 노드에 증분 메시지를 송신한다. 제 1 노드는 증분 메시제 응답하여 제 1 및 제 2 장치 에러 카운터를 제 2 에러 카운터 값에 증분시킨다.
다른 실시예에서, 제 1 노드는 제 1 장치에 대해 에러 처리를 수행하는 제 1 장치의 소유자로서 동작하고, 제 2 노드는 제 2 장치에 대해 에러 처리를 수행하는 제 2 장치의 소유자로서 동작한다. 제 2 노드는 제 1 장치의 소유권을 인수하고 제 1 장치에 대한 에러 관리를 수행하도록 제 2 노드 제 1 장치 에러 카운터를 사용한다. 제 1 노드는 제 2 장치의 소유권을 인수하고 제 2 장치에 대한 에러 관리를 수행하도록 제 1 노드 제 2 장치 에러 카운터를 사용한다.
다른 실시예에서, 동기화 동작은 제 1 및 제 2 노드에서 개시된다. 제 1 노드는 동기화 동작에 응답하여 제 2 노드에 대해 제 1 노드 제 1 장치 에러 카운터의 값을 표시하는 제 2 노드에 동기화 메시지를 전송한다. 제 2 노드는 동기화 동작에 응답하여 제 1 노드에 대해 제 2 노드 제 2 장치 에러 카운터의 값을 표시하는 제 1 노드에 동기화 메시지를 전송한다.
다른 실시예에서, 제 1 노드는 동기화 메시지에 표시된 갑이 제 1 노드 제 2 장치 에러 카운터보다 크다고 제 1 노드가 결정하는 것에 응답하여 제 1 노드에 전송된 동기화 메시지에 표시된 제 2 노드 제 2 장치 에러 카운터의 값으로 제 1 노드 제 2 장치 에러 카운터를 업데이트한다. 제 2 노드는 동기화 메시지에 표시된 갑이 제 2 노드 제 1 장치 에러 카운터보다 크다고 제 2 노드가 결정하는 것에 응답하여 제 2 노드에 전송된 동기화 메시지에 표시된 제 1 노드 제 1 장치 에러 카운터의 값으로 제 2 노드 제 1 장치 에러 카운터를 업데이트한다.
다른 실시예에서, 제 1 노드가 제 2 장치에 대한 제 1 노드 제 2 장치 에러 카운터를 포함하지 않는다는 결정에 응답하여 제 1 노드는 제 1 노드 제 2 장치 에러 카운터를 생성한다. 제 1 노드는 제 1 노드 제 2 장치 에러 카운터를 제 1 노드에 전송된 동기화 메시지에 표시된 값으로 설정한다. 제 2 노드가 제 1 장치에 대한 제 2 노드 제 1 장치 에러 카운터를 포함하지 않는다는 결정에 응답하여 제 2 노드는 제 2 노드 제 1 장치 에러 카운터를 생성한다. 제 2 노드는 제 2 노드 제 1 장치 에러 카운터를 제 1 노드에 전송된 동기화 메시지에 표시된 값으로 설정한다.
다른 실시예에서, 제 2 노드는 재개 동작을 개시한다. 제 2 노드는 재개 동작의 일부분으로서 제 1 노드의 결합 메시지를 전송한다. 제 1 노드는 결합 메시지에 응답하여 장치에 대한 제 1 노드 에러 카운터의 값을 표시하는 제 2 노드에 메시지를 전송한다. 제 2 노드는 결합 메시지에 응답하여 전송된 메시지에 표시된 값으로 제 2 노드 에러 카운터를 업데이트한다.
본 발명의 실시예는 봄 명세서에서 첨부 도면을 참조하여 단지 예시로서 기술될 것이며, 도면에서
도 1은 컴퓨팅 환경의 실시예를 도시하고,
도 2는 노드 구성요소의 실시예를 도시하며
도 3은 장치 에러 정보의 실시예를 도시하고,
도 4는 액션 메시지의 실시예를 도시하며
도 5는 동기화 메시지의 실시예를 도시하고
도 6은 장치에 대한 에러 카운터에 대해 수행된 액션에 대한 메시지를 송신하는 노드 동작의 실시예를 도시하며,
도 7은 에러 카운터에 대해 수행된 액션에 관한 메시지를 프로세스하는 노드 동작의 실시예를 도시하고,
도 8은 공유 장치의 소유권을 인수하는 노드 동작의 실시예를 도시하며,
도 9는 동기화 동작을 수행하는 노드 동작의 실시예를 도시하고,
도 10은 수신된 동기화 메시지를 프로세스하는 노드 동작의 실시예를 도시하며,
도 11은 시스템에 재결합하는 노드 동작의 실시예를 도시하고,
도 12는 저장 서버 컴퓨팅 환경의 실시예를 도시한다.
도 1은 컴퓨팅 환경의 실시예를 도시한다. 복수의 연산 노드(2a, 2b...2m)는 제 1 인터페이스(4)를 통해 서로 통신하고 노드(2a, 2b...2m)는 제 2 인터페이스(8)를 통해 공유 장치(6a, 6b...6n)와 서로 통신한다. 노드(2a, 2b...2m)는 입/출력(I/O) 요청을 프로세스하거나 다른 동작을 수행하고 공유 장치(6a, 6b...6n)와 통신하는 연산 장치를 포함할 수 있다. 노드(2a, 2b...2m)는 별도의 시스템 내에 수용되거나 동일한 컴퓨터 박스 또는 하우징에 수용될 수 있다. 공유 장치(6a, 6b...6n)는 저장 장치, 연산 리소스, 예를 들어, 데이터베이스, 컨텐츠 라이브러리, 프린터, 원거리 통신 장치 등을 포함할 수 있다. 제 1 및 제 2 인터페이스(4 및 8)는 각각 버스, 네트워크, 루프 등을 포함할 수 있다. 일 실시예에서, 제 1 및 제 2 인터페이스(4 및 8)는 접속되지 않을 수도 있다. 다른 실시예에서, 제 1 및 제 2 인터페이스(4 및 8)는 동일한 버스, 네트워크 등에 의해 상호 접속되거나, 또는 스위치, 허브, 브리지 등을 통해 접속될 수 있다. 제 2 인터페이스(8)는 버스, 네트워크, 루프 등을 포함할 수 있다.
도 2는 노드(2a, 2b...2m)를 포함할 수 있는 노드(2)의 구성요소의 실시예를 도시한다. 노드(2)는 공유 장치(6a, 6b...6n)에 대해 관리 동작을 수행하도록 프로세서(20)와 장치 관리자(22)를 포함한다. 장치 관리자(22)는 노드(2)에 의해 소유된 장치와 다른 노드(2a, 2b...2m)에 의해 소유된 장치를 포함하는 공유 장치(6a, 6b...6n)의 각각에 대해 장치 에러 정보(24)를 유지한다. 노드 리스트(26)는 공유 장치(6a, 6b...6n)를 액세스하고 공유 장치(6a, 6b...6n)의 소유자에게 할당되는 노드(2a, 2b...2m) 상에서 네트워크 어드레스 및 정보를 포함한다. 공유 장치의 소유자는 다른 장치가 소유 노드에 대한 공유 장치(6a, 6b...6n)를 액세스하거나 사용하기 위한 요청을 제출하도록 해당 공유 장치(6a, 6b...6n)에 대한 액세스를 관리한다.
도 3은 하나의 공유 장치(6a, 6b...6n)에 대해 에러 정보를 제공하는 장치 에러 정보(24)의 인스턴스 또는 엔트리를 포함할 수 있는 장치 에러 정보 엔트리(50)의 실시예를 도시한다. 장치 에러 정보 엔트리(50)는 정보가 제공되는 공유 장치 식별자(ID)(52), 공유 장치 식별자(52)를 소유하는 노드(2a, 2b...2m)를 표시하는 노드 소유자 ID(54), 정보가 유지될 수 있는 노드 또는 다른 노드(2a, 2b...2m)일 수 있는 노드 소유자(54)에 의해 장치(52)에 대해 소유된 에러 수를 표시하는 에러 카운터(56), 및 카운터 개시 시간 및 종료 시간과 같은 추가적인 에러 정보(58)를 포함한다.
도 4는 공유 장치(6a, 6b...6n)에 대한 에러 카운터(56)에 대해 액션을 수행할 때 소유 노드(2a, 2b...2m)에 의해 다른 소유하지 않는 노드(2a, 2b...2m)에 전송된 액션 메시지(70)의 실시예를 도시한다. 액션은 에러 카운터(56)를 개방하고, 만료하거나, 증분시키는 것을 포함할 수 있다.
도 5는 소유된 노드에 대한 에러 정보(94a...94b)를 다른 소유하지 않는 노드(2a, 2b...2m)에 전송할 때 소유 노드(2a, 2b...2m)에 의해 전송된 동기화 메시지(90)의 실시예를 도시한다. 메시지(90)는 전송 노드(92)를 식별하고 전송 노드(92)에 의해 소유된 각각의 공유 장치(6a, 6b...6n)에 대한 장치 에러 정보(50)와 같은 장치 에러 정보(94a...94n)를 포함한다. 다른 실시예에서, 소유 노드(2a, 2b...2m) 이외의 노드는 장치 에러 정보 상에서 정보를 전송할 수 있다.
도 6은 에러 카운터(56)에 대해 액션을 수행하도록 소유 노드(2a, 2b...2m)에서 실행하는 장치 관리자(22)에 의해 수행된 동작의 실시예를 도시한다. 블록(100)에서, 소유 노드(2a, 2b...2m)는 공유 장치(52)의 에러 수를 모니터링하도록 에러 카운터(56)를 생성하고, 에러 카운터를 만료하거나 증분시키는 것과 같이, 노드(2a, 2b...2m)가 소유하는 공유 장치(6a, 6b...6n)에 대한 에러 카운터(56)에 대해 액션을 수행한다. 이에 응답하여, 소유 노드(2a, 2b...2m)는 (블록 (102)에서) 에러 카운터(56) 및 공유 장치(6a, 6b...6n)에 대해 수행된 액션을 표시하는 다른 노드(2a, 2b...2m)에 액션 메시지(70)를 전송한다. 액션 메시지(70)는 노드 리스트(26)에 표시된 노드(2a, 2b...2m)에 전송될 수 있다. (블록 (104)에서) 에러 카운터(56)가 공유 장치에 대한 에러 임계치를 초과하면, 소유 노드(2a, 2b...2m)는 (블록 (106)에서) 공유 장치(6a, 6b...6n)에 대해 에러 복구 동작을 개시한다. 그렇지 않으면, 제어는 종료한다. 장치(52)에 대해 에러 카운터(56)를 생성하도록 장치 에러 정보 엔트리(50)를 생성할 때, 소유 노드(2a, 2b...2m)는 카운터가 생성된 개시 시간, 현재의 타임스탬프, 액션이 에러 카운터를 만료한 경우의 종료 시간 등과 같은 추가적인 에러 카운터 정보를 표시할 수 있다.
도 7은 액션 메시지(70)를 수신할 때 노드(2a, 2b...2m)에서 실행하는 장치 관리자(22)에 의해 수행된 동작의 실시예를 도시한다. (블록 (130)에서) 비소유 노드(2a, 2b...2m)가 표시된 장치(78)에 대해 수행된 에러 카운터 액션(76)을 표시하는 소유 노드로부터 액션 메시지(70)를 수신할 때, 수신 노드(2a, 2b...2m)는 표시된 장치에 대한 에러 카운터에 대해 표시된 액션(76)을 수행한다. (블록 (134)에서) 액션(76)이 표시된 장치(78)에 대한 에러 카운터(56)를 생성하기 위한 것이면, 장치 관리자(22)는 장치 ID(52), 0으로 설정된 카운터 값, 오픈 메시지를 전송하는 소유 노드(54), 에러 카운터의 개시 시간과 같은 추가적인 정보(58)를 표시하는 장치 에러 카운터(56)를 생성한다. (블록 (136)에서) 액션(76)이 공유 장치(6a, 6b...6n)에 대해 에러 카운터(56)를 증분시키기 위한 것이면, 장치 관리자(22)는 수신 노드(2a, 2b...2m)가 유지하는 에러 카운터(56)를 증분시킨다. (블록 (138)에서) 액션(76)이 공유 장치(6a, 6b...6n)에 대해 에러 카운터(56)를 만료하기 위한 것이면, 장치 관리자(22)는 종료 시간을 장치 에러 정보에 표시한다.
도 8은 공유 장치(6a, 6b...6n)의 소유권을 인수하는 노드(2a, 2b...2m)에서 실행하는 장치 관리자(22)에 의해 수행된 동작의 실시예를 도시한다. (블록 (150)에서) 노드(2a, 2b...2m)가 이전에 소유하지 않은 공유 장치(6a, 6b...6n)의 소유권을 인수하는 것에 응답하여, (블록 (152)에서) 새로운 소유 노드(2a, 2b...2m)는 노드(2a, 2b...2m)가 공유 장치(6a, 6b...6n)를 소유하고 이전의 소유 노드(2a, 2b...2m)에 의해 표시된 에러 카운터(56)에 대한 업데이트 시에 정보를 포함하는 에러 카운터(56)를 사용하는 것을 표시하도록 공유 장치(6a, 6b...6n)에 대해 장치 에러 정보 엔트리(50)를 업데이트한다. 이러한 방식으로, 새로운 소유 노드(2a, 2b...2m)는 이전의 소유 노드(2a, 2b...2m)에 의해 소유된 이전의 에러를 고려하여 이전의 소유 노드의 에러 관리 동작을 인수한다.
도 9는 동기화 동작을 수행하도록 노드(2a, 2b...2m)에서 실행하는 장치 관리자(22)에 의해 수행된 동작의 실시예를 도시한다. 블록(170)에서, 노드(2a, 2b...2m)는 동기화 동작을 수행한다. 동기화 동작은 주기적으로, 또는 노드 시스템에 재결합하도록 리부팅하고 요청하는 노드(2a, 2b...2m)의 일부 또는 전부와 같이, 이벤트에 응답하여 수행될 수 있다. 노드(2a, 2b...2m)가 소유하는 각각의 공유 장치(6a, 6b...6n)에 대해, (블록(172)에서) 노드(2a, 2b...2m)는 장치 카운터(56)를 포함하는 소유된 공유 장치(6a, 6b...6n)에 대해 전송 노드(92)와 장치 에러 정보(50)를 표시하는 모든 다른 노드(2a, 2b...2m)에 동기화 메시지(90)를 브로드캐스팅한다. 각각의 소유된 공유 장치(6a, 6b...6n)에 대한 장치 에러 정보(50)는 동기화 메시지(90)의 개별적인 에러 정보 액션(94a...94n)에 포함된다. 동기화 메시지(90)는 노드 리스트(26) 내의 노드(2a, 2b...2m)에 전송될 수 있다.
도 10은 하나 이상의 다른 노드(2a, 2b...2m)로부터 동기화 메시지(90)를 프로세스하도록 노드(2a, 2b...2m)에서 실행하는 장치 관리자(22)에 의해 수행된 동작의 실시예를 도시한다. (블록(200)에서) 동기화 메시지(90)를 수신할 때, 수신 노드(2a, 2b...2m)는 동기화 메시지(90)에서 에러 정보(94a...94n)에 표시된 각각의 공유 장치(6a, 6b...6n)에 대해 블록(204) 내지 블록(214)에서 동작을 수행한다. (블록(204)에서) 노드(2a, 2b...2m)가 고려되는 공유 장치(6a, 6b...6n)에 대해 장치 에러 정보 엔트리(50)를 갖지 않으면, (블록(204)에서) 장치 관리자(22)는 로컬 장치 에러 정보(24)를 유지하도록 에러 카운터(56)를 포함하는 공유 장치(6a, 6b...6n)에 대해 장치 에러 정보 엔트리(50)를 생성한다(블록(206)). 생성된 장치 에러 정보 엔트리(50) 필드(52, 54, 56 및 58)는 공유 장치(6a, 6b...6n)에 대해 동기화 메시지(90)에 표시된 값으로 설정된다.
(블록(204)에서) 공유 장치(6a, 6b...6n)에 대해 로컬 장치 에러 정보 엔트리(50)가 존재하고, (블록(210)에서) 로컬 장치 에러 정보 엔트리(50) 내의 에러 카운터(56)가 공유 장치(6a, 6b...6n)에 대해 동기화 메시지(90)에 표시된 카운터 값보다 적으면, 로컬 장치 에러 정보 엔트리(50) 내의 에러 카운터(56)는 동기화 메시지(90)에 표시된 에러 카운터 값으로 설정된다. 한편, (블록(210)에서) 로컬 장치 에러 정보 엔트리(50)가 동기화 메시지(90)에 표시된 에러 카운터에 대한 값보다 크면, (블록(214)에서) 장치 에러 정보 엔트리(50)는 동기화 메시지(90)에 표시된 에러 카운터 값 이외의 정보로 업데이트된다.
도 10의 동작에 의해, 동기화되는 장치 에러 정보 엔트리(50)의 로컬 복사본은 로컬 장치 에러 정보 엔트리(50) 및 동기화 메시지(90)에서 현재 유지된 값들 사이에서 최대 에러 카운터 값(56)을 유지한다.
도 11은 에러 복구나 고장을 위해, 코드 업그레이드 및 다른 목적을 위해 노드(2a, 2b...2m)가 오프라인으로 취해지는 경우와 같이, 리부팅 이후에 시스템을 재결합하도록 노드(2a, 2b...2m)에서 실행하는 장치 관리자(22)에 의해 수행된 동작의 실시예를 도시한다. (블록(250)에서) 노드(2a, 2b...2m)가 시스템을 재결합할 때, (블록(252)에서) 장치 관리자(22)는 노드 리스트(26)에 표시된 다른 노드(2a, 2b...2m)에 재결합 메시지를 전송하고 재결합 노드(2a, 2b...2m)가 현재의 장치 에러 정보(50)를 획득하도록 동기화 정보를 요청한다. (블록(254)에서) 동기화 메시지(90)를 수신할 때, (블록(256)에서) 장치 관리자(22)는 수신된 동기화 메시지(90)로부터 로컬 장치 에러 정보(24)를 업데이트하도록 도 10의 동작을 수행한다.
도 12는 노드가 서버(300) 내의 클러스터(304a, 304b)로서 구현되는 저장 서버(300)의 실시예를 도시한다. 클러스터(304a, 304b)는 상기 기술된 장치 관리자(22)의 동작을 수행할 수 있는 프로세서 복합기(306a, 306b) 및 장치 관리자(308a, 308b)를 각각 포함한다. 클러스터(304a, 304b)는 버스(310)를 통해 통신한다. 시스템(300)은 저장 장치(316a, 316b)를 향해 지시된 네트워크(314)를 통해 호스트 시스템(312a, 312b)으로부터 입/출력(I/O) 요청을 수신하며, 각각은 하나 이상의 볼륨(318a, 318b)(예를 들어, Logical Unit Numbers, Logical Devices 등)을 갖도록 구성된다. 클러스터(304a, 304b)는 호스트(312a, 312b...312n)로부터 I/O 요청을 수신하고 요청을 버퍼링하며 캐시(도시되지 않음) 내의 데이터를 저장 장치(316a, 316b)에 기록할 수 있다. 클러스터(304a, 304b)는 상이한 전력 경계를 가질 수 있다. 각각의 저장 클러스터(304a, 304b)는 부착된 저장 장치(316a, 316b)에 액세스를 제공한다.
도 12의 실시예에서, 2 세트의 공유 장치, 장치 어댑터(320a, 320b,,,320n) 및 네트워크 어댑터(322a, 322b,,,322n)가 존재한다. 클러스터(304a, 304b)는 인터페이스(324)를 통해 장치 어댑터(320a, 320b,,,320n)와 통신하고 인터페이스(326)를 통해 네트워크 어댑터(322a, 322b,,,322n)와 통신한다. 장치 어댑터(320a, 320b,,,320n)는 인터페이스(328)를 통해 저장 장치(316a, 316b)와 통신한다. 인터페이스(324, 326, 328)는 PCI(Peripheral Interconnect Bus) 또는 당 분야에서 알려진 다른 적절한 인터페이스와 같은 버스를 포함할 수 있다.
도 12의 실시예에서, 클러스터(304a, 304b)는 상기 기술된 장치 관리자(308a, 308b)로서 동작하고 장치 관리자(22)와 도 6-도 11에 대해 상기 기술된 동작을 수행할 수 있다. 장치 어댑터(320a, 320b,,,320n) 및 네트워크 어댑터(322a, 322b,,,322n)는 공유 장치(306a, 306b...306n)로서 동작할 수 있으며, 클러스터(304a, 304b)는 어댑터(320a, 320b,,,320n 및 322a, 322b,,,322n)의 특정의 소유자로서 설계될 수 있다.
시스템(302)은 저장 제어기 또는 서버를 포함할 수 있다. 다른 실시예에서, 시스템(302)은 접속된 장치의 개시 및 구성 동작을 수행하는 상이한 유형의 컴퓨터 장치를 포함할 수 있다. 호스트(314a, 314b...314n)는 서버, 메인프레임, 워크스테이션, 퍼스널 컴퓨터, 휴대용 컴퓨터, 랩탑, 전화 장치, 네트워크 기기 등과 같이, 당 분야에서 알려진 컴퓨팅 장치를 포함할 수 있다. 네트워크(314)는 SAN(Storage Area Network), LAN(Local Area Network), 인트라넷, 인터넷, WAN(Wide Area Network) 등을 포함할 수 있다. 저장 장치(8a, 8b)는 JBOD(Just a Batch of Disks), DASD(Direct Access Storage Device), RAID(Redundant Array of Independent disks) 어레이, 가상화 장치, 테이프 저장 장치, 플래시 메모리 등과 같은 저장 장치의 어레이를 포함할 수 있다.
기술된 실시예는 공유 장치(6a, 6b...6n)로부터 에러 메시지를 수신할 때 에러 카운터(56)를 업데이트하는 것과 같이, 이들의 장치 에러 정보(50)에 대해 소유 노드가 액션을 수행할 때 업데이트되는 다른 노드에 의해 소유된 공유 장치에 대해, 에러 카운터를 포함하는 장치 에러 정보의 로컬 복사본을 노드가 유지하는 기법을 제공한다. 장치 에러 정보는 노드가 공유 장치(6a, 6b...6n)를 포기하는 노드에 의해 사용된 현재의 에러 정보를 인수하도록 다른 노드의 소유권을 인수하는 노드에 의해 사용된다. 이러한 방식으로, 새로운 소유 노드는 이전의 소유 노드에의해 유지된 바와 같이 공유 장치(6a, 6b...6n)에서 현재의 에러 상태로부터의 에러 관리 동작을 인수할 수 있다.
기술된 동작은 소프트웨어, 펌웨어, 마이크로코드, 하드웨어 및/또는 임의의 그 결합을 생성하도록 표준 프로그래밍 및/또는 엔지니어링 기법을 이용하여 방법, 장치 또는 제조 물품으로서 구현될 수 있다. 기술된 동작은 "컴퓨터 판독 가능한 매체"에 유지된 코드로서 구현될 수 있으며, 여기서 프로세서는 컴퓨터 판독 가능한 매체로부터 코드를 판독하고 실행할 수 있다. 컴퓨터 판독 가능한 저장 매체는 자기 저장 매체(예를 들어, 하드 디스크 드라이브, 플로피 디스크, 테이프 등), 광학 저장 장치(CD--ROM, DVD, 광학 디스크 등), 휘발성 및 비휘발성 메모리 장치(예를 들어, EEPROM, ROM, PROM, RAM, DRAM, SRAM, 플래시 메모리, 펌웨어, 프로그래밍 가능한 로직 등)와 같은 저장 매체를 포함할 수 있다. 기술된 동작을 구현하는 코드는 하드웨어 장치로 구현된 하드웨어 로직(예를 들어, 집적 회로 칩, PGA(Programmable Gate Array), ASIC(Application Specific Integrated Circuits) 등)으로 또한 구현될 수 있다. 또한, 기술된 동작을 구현하는 코드는 "전송 신호"로 구현될 수 있으며, 여기서 전송 신호는 공간을 통해 또는 광 섬유, 구리 와이어 등과 같은 전송 매체를 통해 전파할 수 있다. 코드 또는 로직이 인코딩되는 전송 신호는 무선 신호, 위성 전송, 무선파, 적외선 신호, 블루투스 등을 더 포함할 수 있다. "제조 물품"은 코드 또는 로직이 인코딩되는 저농 신호를 송신하고 수신하는 송신국 및/또는 수신국을 포함할 수 있으며, 여기서 전송 신호에 인코딩된 코드 또는 로직은 수신국과 송신국 또는 장치에서 하드웨어 또는 컴퓨터 판독 가능한 매체로 디코딩되고 저장될 수 있다. "제조 물품"은 코드 또는 로직이 구현될 수 있는 컴퓨터 판독 가능한 저장 매체, 하드웨어 장치, 및/또는 송신기 또는 수신기를 포함할 수 있다. 당 분야에서 통상의 지식을 가진 자라면 실시예의 범위로부터 벗어나지 않고 다수의 변경이 행해질 수 있고 제조 물품은 당 분야에서 알려진 매체를 임의의 정보를 갖는 매체를 포함할 수 있음을 인지할 것이다.
"특정의 실시예", "실시예", "실시예들", "본 실시예", "본 실시예들", "하나 이상의 실시예", "몇몇 실시예" 및 "일 실시예"란 용어는 특별히 달리 지정되지 않는 한 하나 이상의 실시예(반드시 모든 실시예는 아님)를 의미한다.
"구비하는", "포함하는", "갖는"이란 용어 및 그 변형은 특별히 달리 지정되지 않는 한, "포함하되 제한되지 않음"을 의미한다.
항목의 열거되는 리스트는 특별히 달리 지정되지 않는 한, 임의의 또는 모든 항목이 상호 배타적임을 암시하지는 않는다.
"a", "an" 및 "the"란 용어는 특별히 달리 지정되지 않는 한, "하나 이상"을 의미한다.
항목의 인스턴스의 수를 표시하기 위한 "n" 또는 "m"과 같은 참조 변수의 사용은 상이한 변수가 동일한 수 또는 상이한 수를 포함하는 경우, 임의의 정수의 항목의 인스턴스를 지칭한다. 또한, 상이한 요소와 함께 사용된 동일한 참조 변수는 이들 요소의 동일하거나 상이한 수의 인스턴스를 표시할 수 있다.
서로 간에 결합하는 장치는 특별히 달리 지정되지 않는 한, 서로 간에 연속적으로 통신될 필요는 없다. 또한, 서로 간에 결합하는 장치는 하나 이상의 매개물을 통해 직접 또는 간접으로 통신할 수 있다.
서로 간에 결합하는 몇몇 구성요소를 갖는 실시예의 설명은 이러한 모든 구성요소가 요구되는 것을 암시하지는 않는다. 오히려 각종 광학 구성요소는 광범위한 가능한 실시예를 예시하도록 기술되어 있다.
또한, 프로세스의 단계, 방법의 단계, 알고리즘 등이 순차적인 순서로 기술되어 있으나, 이러한 프로세스, 방법 및 알고리즘은 대안적인 순서로 동작하도록 구성될 수 있다. 즉, 디코딩될 수 있는 단계의 임의의 시퀀스 또는 순서는 단계들이 해당 순서로 수행될 수 있는 요건을 반드시 포함하는 것은 아니다. 본 명세서에서 기술된 프로세스의 단계는 임의의 실행 순서로 수행될 수 있다. 또한, 몇몇 단계는 동시에, 병렬로, 또는 함께 수행될 수 있다.
본 명세서에서 단일의 장치 또는 물품이 기술될 때, 2 이상의 장치가 (이들이 장치 또는 물품을 포함하든 혹은 포함하지 않든) 단일의 장치 또는 물품 대신에 사용될 수 있음이 명백할 것이다. 마찬가지로, 본 명세서에서 2 이상의 장치가 (이들이 장치 또는 물품을 포함하든 혹은 포함하지 않든) 기술되는 경우, 2 이상의 장치 또는 물품 대신에 단일의 장치 또는 물품이 사용될 수 있음이 명백할 것이다. 장치의 기능 및/또는 특징은 이러한 기능/특징을 갖는 것으로서 명시적으로 기술되지 않는 하나 이상의 다른 장치에 의해 대안적으로 구현될 수 있다. 따라서, 다른 실시예가 장치 자체를 포함할 필요는 없다.
도 6, 7, 8, 9, 10 및 11의 도시된 동작은 특정의 순서로 발생하는 특정의 이벤트를 도시한다. 다른 실시예에서, 특정의 동작은 상이한 순서로 수행되거나, 변경되거나 제거될 수 있다. 또한, 상기 기술된 로직에 단계가 추가될 수 있고 또한 기술된 실시예에 부합할 수 있다. 또한, 본 명세서에서 기술된 동작은 순차적으로 발생할 수 있거나 또는 특정이 동작이 병렬적으로 프로세스될 수 있다. 또한, 동작은 단일이 프로세싱 유닛에 의해 또는 분배된 프로세싱 유닛에 의해 수행될 수 있다.
본 발명의 각종 실시예의 상술한 설명은 예시 및 도시를 위해 제시되었다. 본 발명을 개시된 정확한 형태로 배타적으로 하거나 제한하도록 의도되지 않는다. 상기 기새 내용의 관점에서 다수의 변경 및 변형이 가능하다. 본 발명의 범위는 이 상세한 설명에 의해 제한되지 않고, 대신에 본 명세서에 첨부된 특허 청구 범위에 의해 제한되도록 의도된다. 상기 명세서의 예 및 데이터는 본 발명의 제조물 및 구성요소 사용의 완전한 설명을 제공한다. 본 발명의 다수의 실시예가 본 발명의 범위로부터 벗어나지 않고 행해질 수 있으므로, 본 발명은 본 명세서에 첨부된 특허 청구 범위에 존재한다.

Claims (10)

  1. 제1 노드 및 제2 노드와 통신하는 디바이스에 대한 제 1 노드 에러 카운터에 관한 액션(action)을, 상기 제 1 노드에 의해, 수행하는 단계 - 상기 제1 노드는 상기 디바이스에 대한 에러 처리를 수행하는 상기 디바이스의 소유자로서 동작함 -;
    상기 제 1 노드에 의해, 상기 디바이스에 대한 상기 제1 노드 에러 카운터에 관하여 수행된 상기 액션 및 상기 디바이스를 표시하는 메시지를 상기 제 2 노드로 송신하는 단계;
    상기 제 2 노드에 의해, 상기 메시지에 표시된 상기 디바이스에 대한 제2 노드 에러 카운터에 관하여 상기 메시지에 표시된 상기 액션을 수행하는 단계 - 상기 제2 노드 에러 카운트는 상기 디바이스에 대한 상기 제1 노드 에러 카운트에 대응함 -;
    상기 제2 노드에 의해, 상기 디바이스의 소유권을 인수하는 단계; 및
    상기 제2 노드가 상기 디바이스에서 에러를 검출하는 것에 응답하여, 상기 제2 노드에 의해 상기 제2 노드 에러 카운터를 증분시키는 단계 -상기 제2 노드 에러 카운터는 상기 제1 노드에 의해 검출된 상기 디바이스에서의 에러들을 표시함 -;를 포함하는
    방법.
  2. 제1 노드 및 제2 노드와 통신하는 디바이스에 대한 제1 노드 에러 카운터에 관한 오픈 액션을, 상기 제1 노드에 의해, 수행하는 단계;
    상기 제1 노드에 의해, 상기 제1 노드가 상기 디바이스에 대한 상기 제1 노드 에러 카운터에 관하여 수행한 오픈 액션 및 상기 디바이스를 표시하는 메시지를 상기 제2 노드에 송신하는 단계; 및
    상기 제 2 노드에 의해, 상기 메시지에 응답하여 상기 디바이스에 대한 제2 노드 에러 카운터를 생성함으로써, 상기 메시지에 표시된 상기 오픈 액션을 수행하는 단계 -상기 제2 노드 에러 카운터는 상기 디바이스에 대한 상기 제1 노드 에러 카운터에 대응함-;를 포함하는
    방법.
  3. 제1 노드 및 제2 노드와 통신하는 디바이스에 대한 제1 노드 에러 카운터에 관한 만료 액션을, 상기 제1 노드에 의해, 수행하는 단계;
    상기 제1 노드에 의해, 상기 디바이스에 대한 상기 제1 노드 에러 카운터에 관하여 수행한 만료 액션 및 상기 디바이스를 표시하는 메시지를 상기 제2 노드에 송신하는 단계;
    상기 제 2 노드에 의해, 상기 메시지에 응답하여 상기 디바이스에 대한 제2 노드 에러 카운터를 만료함으로써, 상기 메시지에 표시된 상기 만료 액션을 수행하는 단계 - 상기 제 2 노드 에러 카운터는 상기 디바이스에 대한 상기 제1 노드 에러 카운터에 대응함 -;를 포함하는
    방법.
  4. 제 1 항에 있어서,
    상기 제 1 노드에 의해, 에러 임계치에 도달하는 에러 카운터 값에 응답하여 에러 복구 동작을 개시하는 단계를 더 포함하는
    방법.
  5. 제1항에 있어서,
    상기 제1 노드에 의해, 상기 디바이스에서의 에러를 검출하는 단계;를 더 포함하고,
    상기 제1 노드에 의해 수행되는 상기 액션은, 상기 에러를 검출하는 것에 응답하여 상기 디바이스에 대한 상기 제1 노드 에러 카운터를 증분시키는 단계를 포함하고,
    상기 메시지에 표시된 상기 액션은 증분 액션을 포함하고, 상기 증분 액션은 상기 제2 노드에 의해 수행되고, 상기 디바이스에 대한 상기 제2 노드 에러 카운터를 증분시키는 단계를 포함하는
    방법.
  6. 제1항에 있어서,
    상기 제2 노드는 상기 제1 노드의 고장에 응답하여 상기 디바이스의 소유권을 인수하는
    방법.
  7. 제1 노드 및 제2 노드와 통신하는 제1 디바이스에 대한 제1 노드의 제1 디바이스 에러 카운터에 관한 액션을, 상기 제1 노드에 의해, 수행하는 단계;
    상기 제1 노드에 의해, 상기 제1 디바이스에 대한 상기 제1 노드의 제1 디바이스 에러 카운터에 관하여 수행된 상기 액션 및 상기 제1 디바이스를 표시하는 메시지를 상기 제2 노드에 송신하는 단계;
    상기 제2 노드에 의해, 상기 제1 디바이스에 대한 제2 노드의 제1 디바이스 에러 카운터에 관하여 상기 메시지에 표시된 액션을 수행하는 단계 - 상기 제2 노드의 제1 디바이스 에러 카운터는 상기 제1 디바이스에 대한 상기 제1 노드의 제1 디바이스 에러 카운터에 대응함 -;
    상기 제2 노드에 의해, 상기 제1 노드 및 상기 제2 노드와 통신하는 제2 디바이스에서의 에러 수를 표시하는 제2 노드의 제2 디바이스 에러 카운터를 유지하는 단계; 및
    상기 제1 노드에 의해, 상기 제2 노드에 의해 검출된 에러를 포함하는 상기 제2 디바이스에서의 에러 수를 표시하는 제1 노드의 제2 디바이스 에러 카운터를 유지하는 단계;를 포함하는
    방법.
  8. 제1 노드 및 제2 노드와 통신하는 디바이스에 대한 제1 노드 에러 카운터에 관한 액션을, 상기 제1 노드에 의해, 수행하는 단계;
    상기 제1 노드에 의해, 상기 디바이스에 대한 상기 제1 노드 에러 카운터에 관하여 수행된 상기 액션 및 상기 디바이스를 표시하는 메시지를 상기 제2 노드로 송신하는 단계;
    상기 제2 노드에 의해, 상기 디바이스에 대한 제2 노드 에러 카운터에 관하여 상기 메시지에 표시된 상기 액션을 수행하는 단계 -상기 제2 노드 에러 카운터는 상기 디바이스에 대한 상기 제1 노드 에러 카운터에 대응함 -;
    상기 제2 노드에 의해, 재개(reinitialization) 동작을 개시하는 단계와,
    상기 제2 노드에 의해, 상기 재개 동작의 일부로서 상기 제1 노드에 결합 메시지(join message)를 전송하는 단계;
    상기 제1 노드에 의해, 상기 결합 메시지에 응답하여 상기 디바이스에 대한 상기 제1 노드 에러 카운터의 값을 표시하는 메시지를 상기 제2 노드에 전송하는 단계;
    상기 제2 노드에 의해, 상기 결합 메시지에 응답하여 전송된 상기 메시지에 표시된 값으로 상기 제 2 노드 에러 카운터를 업데이트하는 단계;를 포함하는
    방법.
  9. 디바이스와 통신하는 제1 노드와 제2 노드를 포함하는 시스템으로서,
    상기 제1 노드 및 상기 제2 노드는 청구항 제1항 내지 제8항 중 어느 한 항에 기재된 모든 단계를 수행하기 위한 프로그램 코드를 실행하도록 구성된,
    시스템.
  10. 컴퓨터 판독가능 매체로서,
    제1 노드와 제2 노드에 의해 실행되는 코드를 포함하고,
    디바이스가 상기 제1 노드와 상기 제2 노드와 통신하고, 상기 코드는 청구항 제1항 내지 제8항 중 어느 한 항에 정의된 모든 단계를 수행하도록 실행되는
    컴퓨터 판독가능 매체.
KR1020107027344A 2008-06-03 2009-05-28 노드들 간의 장치 동기 에러 정보 KR101385910B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/132,550 2008-06-03
US12/132,550 US7904752B2 (en) 2008-06-03 2008-06-03 Synchronizing device error information among nodes
PCT/EP2009/056557 WO2009147066A1 (en) 2008-06-03 2009-05-28 Synchronizing device error information among nodes

Publications (2)

Publication Number Publication Date
KR20110022587A KR20110022587A (ko) 2011-03-07
KR101385910B1 true KR101385910B1 (ko) 2014-04-15

Family

ID=41110621

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107027344A KR101385910B1 (ko) 2008-06-03 2009-05-28 노드들 간의 장치 동기 에러 정보

Country Status (6)

Country Link
US (1) US7904752B2 (ko)
EP (1) EP2283612B1 (ko)
JP (1) JP5255697B2 (ko)
KR (1) KR101385910B1 (ko)
CA (1) CA2708976C (ko)
WO (1) WO2009147066A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8381026B2 (en) * 2009-06-22 2013-02-19 Citrix Systems, Inc. Systems and method for transaction stall detection and propagating the result in a multi-core architecture
US8635318B1 (en) * 2009-09-15 2014-01-21 Symantec Corporation Message broadcast protocol which handles configuration changes in a cluster of virtual servers
JP5785455B2 (ja) * 2011-07-29 2015-09-30 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation リムーバブルメディアに関する処理を行う装置及び方法
US10289466B2 (en) 2017-02-01 2019-05-14 International Business Machines Corporation Error data collection improvements in storage network components
JP7338354B2 (ja) * 2019-09-20 2023-09-05 富士通株式会社 情報処理装置,情報処理システム及び通信管理プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7092768B1 (en) * 2004-03-09 2006-08-15 Liquid Sky Studios, Inc. Distributed control system

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1271326B (it) 1994-12-23 1997-05-27 Sits Soc It Telecom Siemens Procedimento per il riallineamento automatico nel riporto di evento in un sistema di gestione e relativo sistema
JPH0955735A (ja) * 1995-08-10 1997-02-25 Nippon Telegr & Teleph Corp <Ntt> 通信網故障診断システムおよび通信網故障診断方法
JPH09259050A (ja) * 1996-03-19 1997-10-03 Hitachi Ltd コンピュータ周辺機器制御装置のエラー報告方法および周辺機器制御装置
US6098179A (en) 1998-01-22 2000-08-01 Digital Equipment Corporation Method and apparatus for performing error detection
US6728216B1 (en) 1998-02-27 2004-04-27 Advanced Micro Devices, Inc. Arrangement in a network repeater for monitoring link integrity and selectively down shifting link speed based on local configuration signals
JPH11296311A (ja) * 1998-04-08 1999-10-29 Hitachi Ltd 記憶装置の耐故障制御方式
US6510393B1 (en) * 1998-12-21 2003-01-21 Siemens Atkiengesellschaft Method for detecting faults in a switching device
US6725281B1 (en) 1999-06-11 2004-04-20 Microsoft Corporation Synchronization of controlled device state using state table and eventing in data-driven remote device control model
US6701449B1 (en) * 2000-04-20 2004-03-02 Ciprico, Inc. Method and apparatus for monitoring and analyzing network appliance status information
US7209447B1 (en) 2000-07-13 2007-04-24 Tellabs Operations, Inc. Method and apparatus for measuring packet connection quality of service
JP4185661B2 (ja) * 2000-11-17 2008-11-26 キヤノン株式会社 機器管理装置、機器管理プログラム、機器管理プログラムが格納された記録媒体、及び機器管理方法
US6865689B1 (en) * 2001-06-29 2005-03-08 Sun Microsystems, Inc. Method and apparatus for fault isolation on network loops using low level error counters
JP2003069614A (ja) 2001-08-28 2003-03-07 Nec Miyagi Ltd データ伝送装置
JP2003345679A (ja) * 2002-05-28 2003-12-05 Nippon Telegr & Teleph Corp <Ntt> サーバシステム、仲介装置、及び、クライアントサーバ型システムにおける誤り隠蔽方法
US7287193B2 (en) * 2003-05-15 2007-10-23 International Business Machines Corporation Methods, systems, and media to correlate errors associated with a cluster
US7539932B2 (en) 2004-06-17 2009-05-26 International Business Machines Corporation Method and system for debugging Ethernet
US7624305B2 (en) * 2004-11-18 2009-11-24 International Business Machines Corporation Failure isolation in a communication system
US7254768B2 (en) 2005-02-18 2007-08-07 Broadcom Corporation Memory command unit throttle and error recovery
US7523359B2 (en) * 2005-03-31 2009-04-21 International Business Machines Corporation Apparatus, system, and method for facilitating monitoring and responding to error events
JP2006164304A (ja) * 2006-01-20 2006-06-22 Hitachi Ltd ドライブの2重障害を防止するアレイ型ディスク装置、プログラム、及び方法
JP2008083896A (ja) * 2006-09-27 2008-04-10 Fujitsu Ltd 異常の発生源の特定方法、システム運用方法、基地局制御システム運営方法、および処理システム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7092768B1 (en) * 2004-03-09 2006-08-15 Liquid Sky Studios, Inc. Distributed control system

Also Published As

Publication number Publication date
US7904752B2 (en) 2011-03-08
JP2011524563A (ja) 2011-09-01
EP2283612B1 (en) 2013-04-03
WO2009147066A1 (en) 2009-12-10
CA2708976C (en) 2015-04-21
WO2009147066A4 (en) 2010-02-11
KR20110022587A (ko) 2011-03-07
EP2283612A1 (en) 2011-02-16
CA2708976A1 (en) 2009-12-10
JP5255697B2 (ja) 2013-08-07
US20090300436A1 (en) 2009-12-03

Similar Documents

Publication Publication Date Title
US8055865B2 (en) Managing write requests to data sets in a primary volume subject to being copied to a secondary volume
US9507678B2 (en) Non-disruptive controller replacement in a cross-cluster redundancy configuration
JP5714571B2 (ja) キャッシュクラスタを構成可能モードで用いるキャッシュデータ処理
US7676616B2 (en) Method, apparatus and program storage device for providing asynchronous status messaging in a data storage system
JP4718288B2 (ja) ディスクレス計算機の運用管理システム
US10489230B1 (en) Chaining log operations in data replication groups
US7822892B2 (en) Managing the copying of writes from primary storages to secondary storages across different networks
WO2017042890A1 (ja) データベースシステム、サーバ装置、プログラムおよび情報処理方法
JP5493452B2 (ja) 復旧サーバ、復旧処理プログラム及び計算機システム
CA2868247A1 (en) Data sending method, data receiving method, and storage device
US9740537B2 (en) Contention and selection of controlling work coordinator in a distributed computing environment
US20140059315A1 (en) Computer system, data management method and data management program
KR101385910B1 (ko) 노드들 간의 장치 동기 에러 정보
US10409999B2 (en) Communication between key manager and storage subsystem kernel via management console
US7904682B2 (en) Copying writes from primary storages to secondary storages across different networks
US8359601B2 (en) Data processing method, cluster system, and data processing program
US10567499B1 (en) Unsupervised round robin catch up algorithm
CN117643015A (zh) 基于日志记录的客户端密钥修改的快照跨一系列节点管理密钥
US7783931B2 (en) Alternate communication path between ESSNI server and CEC

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180329

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190327

Year of fee payment: 6