KR100622620B1 - 운영-대기(Active-Standby) 모드로이중화된 IP 통신 시스템에서 발생하는 장애 상황을감지하기 위한 시스템 및 그 방법 - Google Patents
운영-대기(Active-Standby) 모드로이중화된 IP 통신 시스템에서 발생하는 장애 상황을감지하기 위한 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR100622620B1 KR100622620B1 KR1020040080612A KR20040080612A KR100622620B1 KR 100622620 B1 KR100622620 B1 KR 100622620B1 KR 1020040080612 A KR1020040080612 A KR 1020040080612A KR 20040080612 A KR20040080612 A KR 20040080612A KR 100622620 B1 KR100622620 B1 KR 100622620B1
- Authority
- KR
- South Korea
- Prior art keywords
- management module
- redundancy
- state
- failure situation
- state management
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0695—Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/16—Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Cardiology (AREA)
- General Health & Medical Sciences (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
본 발명은 운영-대기(Active-Standby) 모드로 이중화된 IP 통신 시스템에서 발생하는 장애 상황을 감지하기 위한 시스템 및 그 방법에 관한 것으로, 더욱 상세하게는 IP 통신 시스템의 다양한 부분을 복합적으로 모니터링할 수 있는 이중화 상태 관리 모듈을 이용하여 시스템 내부에서 발생한 장애 상황 뿐만 아니라 상대 시스템의 장애 상황도 신속하게 감지하여 장애 발생 시 초래될 수 있는 서비스 중단 시간을 최소화할 수 있는 장애 상황 감지 시스템 및 그 방법에 관한 것이다.
본 발명에 따른 장애 상황 감지 시스템은 상대 시스템과 주기적으로 TCP/IP 프로토콜을 이용한 하트비트 메시지(Heartbeat massage)를 송수신하고, 상기 송수신 결과에 따라 상기 상대 시스템의 이중화 장애 상황을 감지하는 이중화 상태 관리 모듈, 상기 시스템 내 소정의 관리 대상 프로세스의 상태를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 프로세스와 연관된 프로세스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 프로세스 상태 관리 모듈 및 상기 시스템 내 소정의 관리 대상 리소스의 상태 정보를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 리소스와 연관된 리소스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 리소스 상태 관리 모듈을 포함하고, 상기 이중화 상태 관리 모듈은 상기 프로세스 장애 상황 또는 상기 리소스 장애 상황을 통보받는 경우, 상기 시스템에 이중화 장애 상황이 발생한 것으로 판단하는 것을 특징으로 한다.
IP 통신 시스템, 이중화, Active-Standby, 장애 상황 감지, 이중화 상태 관리 모듈
Description
도 1은 본 발명의 일실시예에 있어서, 운영-대기(Active-Standby) 모드로 이중화된 IP 통신 시스템에서 주 시스템과 부 시스템의 연결 관계를 개략적으로 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 장애 상황 감지 시스템의 구성을 도시한 블록도이다.
도 3은 본 발명의 일실시예에 있어서, 이중화 상태 관리 모듈의 동작을 도시한 흐름도이다.
도 4는 본 발명에 따른 장애 상황 감지 방법을 수행하는 데 채용될 수 있는 범용 컴퓨터 장치의 내부 블록도이다.
<도면의 주요 부분에 대한 부호의 설명>
201 : 이중화 상태 관리 모듈 202 : 프로세스 상태 관리 모듈
203 : 리소스 상태 관리 모듈 210 : 주 시스템
220 : 부 시스템
본 발명은 운영-대기(Active-Standby) 모드로 이중화된 IP 통신 시스템에서 발생하는 장애 상황을 감지하기 위한 시스템 및 그 방법에 관한 것으로, 더욱 상세하게는 IP 통신 시스템의 다양한 부분을 복합적으로 모니터링할 수 있는 이중화 상태 관리 모듈을 이용하여 시스템 내부에서 발생한 장애 상황 뿐만 아니라 상대 시스템의 장애 상황도 신속하게 감지하여 장애 발생 시 초래될 수 있는 서비스 중단 시간을 최소화할 수 있는 장애 상황 감지 시스템 및 그 방법에 관한 것이다.
종래의 교환 시스템은 이중화 장애를 감지함에 있어서, IP 통신 시스템과는 그 장애 감지 분야가 상이하다. 즉, IP 통신 시스템에서는 종래의 교환 시스템에서는 감지하지 않았던 TCP/IP LAN Card 및 Network에 대한 장애, IP 통신 시스템에서 주로 사용되는 상용 서버에 대한 내부 리소스 장애 등을 감지해야 할 필요가 있는 반면, 종래의 교환 시스템에 있었던 통신전용 하드웨어에 대한 장애 등은 감지할 필요가 없는 등, IP 통신 시스템에서의 장애 감지 분야는 종래 교환 시스템에서의 장애 감지 분야와는 차이가 있다.
또한, 종래의 교환 시스템은 하드웨어의 장애를 감지함에 있어서 하드웨어 고유의 인터럽트(Interrupt) 신호를 수신하는 방식을 채택함으로 인해 만일 하드웨어의 종류가 변경되면 하드웨어를 제어할 수 있는 또 다른 프로세스를 추가로 개발해야만 하는 부담이 있고, 시스템간 및 내부 프로세스간의 통신 방법에 있어서도 TCP/IP 프로토콜을 이용하지 않아 IP 망에는 적합하지 않은 점이 존재한다.
따라서, 이중화 장애 감지기능에 대한 IP 통신 시스템의 최적화를 위해서 IP 통신 시스템에 적합한 새로운 장애 감지 방식이 필요하게 되었다.
본 발명은 상술한 바와 같은 종래기술의 문제점을 해결하기 위해 안출된 것으로서, IP 통신 시스템에 최적화될 수 있는 새로운 방식의 장애 상황 감지 시스템 및 방법을 제공하는 것을 그 목적으로 한다.
또한, 본 발명에 따른 장애 상황 감지 시스템 및 그 방법은 IP 통신 시스템의 다양한 부문을 복합적으로 모니터링 하여 IP 통신 시스템에서 발생할 수 있는 각종 장애 상황에 대한 감지 능력을 향상시키는 것을 그 목적으로 한다.
또한, 본 발명에 따른 장애 상황 감지 시스템 및 그 방법은 IP 통신 시스템의 장애 상황을 최단 시간 내에 효율적으로 감지함으로써, IP 통신 시스템의 장애 발생 시 서비스 중단 시간을 최소화할 수 있도록 하는 것을 그 목적으로 한다.
상기의 목적을 달성하고, 상술한 종래기술의 문제점을 해결하기 위하여, 본 발명의 일실시예에 따른 장애 상황 감지 시스템은 상대 시스템과 주기적으로 TCP/IP 프로토콜을 이용한 하트비트 메시지(Heartbeat massage)를 송수신하고, 상기 송수신 결과에 따라 상기 상대 시스템의 이중화 장애 상황을 감지하는 이중화 상태 관리 모듈, 상기 시스템 내 소정의 관리 대상 프로세스의 상태를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 프로세스와 연관된 프로 세스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 프로세스 상태 관리 모듈 및 상기 시스템 내 소정의 관리 대상 리소스의 상태 정보를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 리소스와 연관된 리소스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 리소스 상태 관리 모듈을 포함하고, 상기 이중화 상태 관리 모듈은 상기 프로세스 장애 상황 또는 상기 리소스 장애 상황을 통보받는 경우, 상기 시스템에 이중화 장애 상황이 발생한 것으로 판단하는 것을 특징으로 한다.
본 발명의 일측에 따르면, 상기 이중화 상태 관리 모듈은 주기적으로 상기 하트비트 메시지의 수신 여부를 조회하고, 상기 조회 결과 소정의 시간 간격 동안 상기 하트비트 메시지가 하나 이상 수신되지 않는 경우 상기 상대 시스템에 이중화 장애 상황이 발생한 것을 감지하는 것을 특징으로 하는 장애 상황 감지 시스템이 제공된다.
본 발명의 또 다른 측면에 따르면, 상기 하트비트 메시지는 상기 시스템의 제1 이중화 상태 정보 또는 상기 상대 시스템의 제2 이중화 상태 정보를 포함하고, 상기 이중화 상태 관리 모듈은 상기 제1 이중화 상태 정보와 상기 제2 이중화 상태 정보를 비교하고, 상기 비교 결과가 소정의 기준에 부합하지 않는 경우 상기 상대 시스템에 이중화 장애 상황이 발생한 것으로 감지하는 것을 특징으로 하는 장애 상황 감지 시스템이 제공된다.
한편, 본 발명의 일실시예에 따른 장애 상황 감지 방법은 소정의 이중화 상태 관리 모듈이 상대 시스템과 주기적으로 TCP/IP 프로토콜을 이용한 하트비트 메 시지(Heartbeat massage)를 송수신하고, 상기 송수신 결과에 따라 상기 상대 시스템의 이중화 장애 상황을 감지하는 단계, 소정의 시스템 내 관리 대상 프로세스의 상태를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 프로세스와 연관된 프로세스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 단계, 상기 시스템 내 관리 대상 리소스의 상태 정보를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 리소스와 연관된 리소스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 단계 및 상기 이중화 상태 관리 모듈이 상기 프로세스 장애 상황 또는 상기 리소스 장애 상황을 통보받는 경우, 상기 시스템에 이중화 장애 상황이 발생한 것으로 판단하는 단계를 포함하는 것을 특징으로 한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 장애 상황 감지 시스템 및 그 방법에 대하여 상세히 설명하도록 한다.
도 1은 본 발명의 일실시예에 있어서, 운영-대기(Active-Standby) 모드로 이중화된 IP 통신 시스템에서 주 시스템과 부 시스템의 연결 관계를 개략적으로 도시한 도면이다.
본 발명에 따른 장애 상황 감지 시스템에서 주 시스템(110)과 부 시스템(120)은 주기적으로 하트비트 메시지(Heartbeat message)를 송수신하고, 상기 송수신 결과에 따라 상대 시스템의 이중화 장애 상황을 감지할 수 있다.
일례로, 부 시스템(120)은 주기적으로 주 시스템(110)으로부터의 하트비트 메시지 수신 여부를 조회하고, 상기 조회 결과 소정의 시간 간격 동안 상기 하트비 트 메시지가 하나 이상 수신되지 않은 경우 주 시스템(110)에 이중화 장애 상황이 발생한 것으로 감지할 수 있다. 주 시스템(110)도 부 시스템(120)에 이중화 장애 상황이 발생했는지 여부를 상기와 동일한 방식에 따라 감지할 수 있다.
다른 예로, 부 시스템(120)은 수신된 하트비트 메시지에 포함된 주 시스템(110)의 이중화 상태 정보와 자신의 이중화 상태 정보를 비교하고, 상기 비교 결과가 소정의 기준에 부합하지 않는 경우 주 시스템(110)에 이중화 장애 상황이 발생한 것으로 감지할 수 있다. 주 시스템(110)도 부 시스템(120)에 이중화 장애 상황이 발생했는지 여부를 상기와 동일한 방식에 따라 감지할 수 있다.
도 2는 본 발명의 일실시예에 따른 장애 상황 감지 시스템의 구성을 도시한 블록도이다. 본 실시예에 따른 장애 상황 감지 시스템은 이중화 상태 관리 모듈(201), 프로세스 상태 관리 모듈(202), 리소스 상태 관리 모듈(203)을 포함하는 주 시스템(210)과, 같은 구성 요소를 포함하는 부 시스템(220)을 포함하여 구성될 수 있다.
우선 이중화 상태 관리 모듈(201)이 상대 시스템의 장애 상황을 감지하는 실시예에 대하여 설명한다. 도 3은 이중화 상태 관리 모듈(201)의 동작을 도시한 흐름도이다.
이중화 상태 관리 모듈(201)은 상대 시스템과 주기적으로 TCP/IP 프로토콜을 이용한 하트비트 메시지(Heartbeat massage)를 송수신하고(S301), 주기적으로 상기 하트비트 메시지의 수신 여부를 조회한다(S302).
이중화 상태 관리 모듈(201)은 상기 조회 결과에 따라 상기 하트비트 메시지 가 정상적으로 수신되는지 여부를 판단하고(S303), 만일 소정의 시간 간격 동안 상기 하트비트 메시지가 하나 이상 수신되지 않는 경우에는 상대 시스템에 이중화 장애 상황이 발생한 것으로 감지할 수 있다(S304).
또한, 이중화 상태 관리 모듈(201)은 수신된 하트비트 메시지에 포함된 상대 시스템의 이중화 상태 정보를 통해 상대 시스템의 장애를 감지할 수도 있다. 이를 위해, 이중화 상태 관리 모듈(201)은 상대 시스템으로부터 수신된 하트비트 메시지에 포함된 이중화 상태 정보와 자신이 위치한 시스템의 이중화 상태 정보를 비교할 수 있다(S305).
이중화 상태 관리 모듈(201)은 상기 비교 결과가 미리 설정된 소정의 기준에 부합하는지 여부를 판단하고(S306), 상기 판단 결과 상기 기준에 부합되는 경우에는 상대 시스템이 정상적으로 동작하고 있는 것으로 판단하지만(S307), 상기 기준에 부합되지 않는 경우에는 상대 시스템에 이중화 장애 상황이 발생한 것으로 감지할 수 있다(S304).
예를 들어, 이중화 상태 관리 모듈(201)은 (1) 자신이 위치한 시스템의 이중화 상태 정보가 “Standby(부 시스템으로 정상 동작하고 있음을 의미)”일 때 상대 시스템의 이중화 상태 정보가 “Active(주 시스템으로 정상 동작하고 있음을 의미)”인 경우, (2) 자신이 위치한 시스템의 이중화 상태 정보가 “Active”일 때 상대 시스템의 이중화 상태 정보가 “Standby”인 경우, (3) 자신이 위치한 시스템의 이중화 상태 정보가 “Active Alone(주 시스템으로 정상 동작하고 있고 상대 시스템이 정상적으로 감지되고 있지 않음을 의미)”일 때 상대 시스템의 이중화 상태 정 보가 “Unknown(시스템 초기화 등이 진행중임을 의미)”경우를 상기 소정의 기준으로 설정하고, 상기 기준에 부합되지 않는 경우 상대 시스템에 장애 상황이 발생한 것으로 감지할 수 있다.
상기 예를 표로 구성하면 아래와 같다.
다음으로 프로세스 상태 관리 모듈(202)이 시스템 내부 프로세스의 장애 상황을 감지하는 실시예에 대하여 설명한다.
프로세스 상태 관리 모듈(202)은 자신이 위치한 시스템 내 소정의 관리 대상 프로세스의 상태를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 프로세스와 연관된 프로세스 장애 상황을 감지하여 이중화 상태 관리 모듈(201)에 통보하는 역할을 수행한다.
이중화 상태 관리 모듈(201)은 상기와 같이 프로세스 장애 상황을 통보받는 경우에는 시스템 내부에 이중화 장애 상황이 발생한 것으로 판단하고 소정의 복구 절차가 진행되도록 제어할 수 있다. 이와 같이, 본 발명에 따르면 IP 통신 시스템의 다양한 부분을 복합적으로 모니터링할 수 있는 이중화 상태 관리 모듈(201)을 통해 상대 시스템의 장애 상황 뿐만 아니라 시스템 내부에서 발생한 프로세스 장애 상황도 신속하게 감지하여 장애 발생 시 초래될 수 있는 서비스 중단 시간을 최소화할 수 있게 된다.
한편, 프로세스 상태 관리 모듈(202)은 장애 상황이 발생한 프로세스의 등급을 판단하고, 상기 판단된 등급에 따라 이중화 상태 관리 모듈(201)에의 통보 여부를 결정할 수 있다.
예를 들어, 프로세스 상태 관리 모듈(202)은 상기 판단된 등급이 제1 등급인 경우 상기 관리 대상 프로세스를 재시동하고 상기 프로세스 장애 상황을 이중화 상태 관리 모듈(201)에 통보하고, 상기 판단된 등급이 제2 등급인 경우 상기 관리 대상 프로세스를 재시동한 후 연속으로 소정의 횟수 이상의 상기 프로세스 장애 상황이 감지되면 상기 프로세스 장애 상황을 이중화 상태 관리 모듈(201)에 통보하며, 상기 판단된 등급이 제3 등급인 경우 상기 관리 대상 프로세스를 재시동하고 상기 프로세스 장애 상황을 이중화 상태 관리 모듈(201)에 통보하지 않을 수 있다.
상기 예를 표로 구성하면 아래와 같다.
위의 표에 따른 예로, IP 교환기 시스템에 있어서 호 처리를 담당하는 프로세스의 경우 장애 상황이 발생하면 사용자의 전화 이용이 불가능해지며, 이 경우 프로세스 상태 관리 모듈(202)은 호 처리를 담당하는 프로세스를 제1 등급으로 설정하고, 장애 상황 발생시 바로 이중화 상태 관리 모듈(201)에 통보할 수 있다.
반대로 시스템 이력관리를 담당하는 프로세스의 경우 장애가 발생하더라도 사용자의 전화 이용이 불가능해지는 것은 아니므로, 이 경우 프로세스 상태 관리 모듈(202)은 시스템 이력관리를 담당하는 프로세스를 제2 등급으로 설정하고, 장애 상황이 발생하더라도 바로 이중화 상태 관리 모듈(201)에 통보하지 않도록 동작할 수 있다.
다음으로 리소스 상태 관리 모듈(203)이 시스템 내부 리소스의 장애 상황을 감지하는 실시 예에 대하여 설명한다.
리소스 상태 관리 모듈(203)은 자신이 위치한 시스템 내 소정의 관리 대상 리소스의 상태 정보를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 리소스와 연관된 리소스 장애 상황을 감지하여 이중화 상태 관리 모듈 (201)에 통보하는 역할을 수행한다.
이중화 상태 관리 모듈(201)은 상기와 같이 리소스 장애 상황을 통보받는 경우에는 시스템 내부에 이중화 장애 상황이 발생한 것으로 판단하고 소정의 복구 절차가 진행되도록 제어할 수 있다. 이와 같이, 본 발명에 따르면 IP 통신 시스템의 다양한 부분을 복합적으로 모니터링할 수 있는 이중화 상태 관리 모듈(201)을 통해 상대 시스템의 장애 상황, 시스템 내부에서 발생한 프로세스 장애 상황 뿐만 아니라 시스템 내부에서 발생한 리소스 장애 상황도 신속하게 감지하여 장애 발생 시 초래될 수 있는 서비스 중단 시간을 최소화할 수 있게 된다.
상기 관리 대상 리소스의 상태 정보는 CPU 점유 상태, 프로세스 별 CPU 점유 상태, 하드 디스크 사용률, 하드 디스크 사용가능 크기, 네트워크 상태, 메모리 사용률, 프로세스 별 메모리 사용률, 메모리 사용가능 크기 및 파일 시스템 상태 등을 포함할 수 있다.
한편, 리소스 상태 관리 모듈(203)은 상기 관리 대상 리소스의 상태 정보가 소정의 임계치 값에 도달한 경우 상기 리소스가 장애상황 인 것으로 판단하고, 소정의 기준에 따라 상기 감지된 리소스 장애 상황의 등급을 판단하며, 상기 판단된 등급에 따라 이중화 상태 관리 모듈(201)에의 통보 여부를 결정할 수 있다. 상기 임계치 값과 상기 등급이 IP 통신 시스템상에서 다양하게 설정될 수 있음은 본 발명이 속하는 기술분야의 당업자에게 있어 자명하다.
본 발명에 따른 장애 상황 감지 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.
상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
도 4는 본 발명에 따른 장애 상황 감지 방법을 수행하는 데 채용될 수 있는 범용 컴퓨터 장치의 내부 블록도이다.
컴퓨터 장치(400)는 램(RAM: Random Access Memory)(420)과 롬(ROM: Read Only Memory)(430)을 포함하는 주기억장치와 연결되는 하나 이상의 프로세서(410)를 포함한다. 프로세서(410)는 중앙처리장치(CPU)로 불리기도 한다. 본 기술분야 에서 널리 알려져 있는 바와 같이, 롬(430)은 데이터(data)와 명령(instruction)을 단방향성으로 CPU에 전송하는 역할을 하며, 램(420)은 통상적으로 데이터와 명령을 양방향성으로 전송하는 데 사용된다. 램(420) 및 롬(430)은 컴퓨터 판독 가능 매체의 어떠한 적절한 형태를 포함할 수 있다. 대용량 기억장치(Mass Storage)(440)는 양방향성으로 프로세서(410)와 연결되어 추가적인 데이터 저장 능력을 제공하며, 상기된 컴퓨터 판독 가능 기록 매체 중 어떠한 것일 수 있다. 대용량 기억장치(440)는 프로그램, 데이터 등을 저장하는데 사용되며, 통상적으로 주기억장치보다 속도가 느린 하드 디스크와 같은 보조기억장치이다. CD 롬(460)과 같은 특정 대용량 기억장치가 사용될 수도 있다. 프로세서(410)는 비디오 모니터, 트랙볼, 마우스, 키보드, 마이크로폰, 터치스크린 형 디스플레이, 카드 판독기, 자기 또는 종이 테이프 판독기, 음성 또는 필기 인식기, 조이스틱, 또는 기타 공지된 컴퓨터 입출력장치와 같은 하나 이상의 입출력 인터페이스(450)와 연결된다. 마지막으로, 프로세서(410)는 네트워크 인터페이스(470)를 통하여 유선 또는 무선 통신 네트워크에 연결될 수 있다. 이러한 네트워크 연결을 통하여 상기된 방법의 절차를 수행할 수 있다. 상기된 장치 및 도구는 컴퓨터 하드웨어 및 소프트웨어 기술 분야의 당업자에게 잘 알려져 있다. 한편, 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
본 발명에 의하면, IP 통신 시스템에 최적화될 수 있는 새로운 방식의 장애 상황 감지 시스템 및 방법이 제공된다.
본 발명에 따른 장애 상황 감지 시스템 및 그 방법에 의하면, IP 통신 시스템의 다양한 부문을 복합적으로 모니터링 하여 IP 통신 시스템에서 발생할 수 있는 각종 장애 상황에 대한 감지 능력을 향상시키는 효과를 얻을 수 있다.
본 발명에 따른 장애 상황 감지 시스템 및 그 방법에 의하면, IP 통신 시스템의 장애 상황을 최단 시간 내에 효율적으로 감지함으로써, IP 통신 시스템의 장애 발생 시 서비스 중단 시간을 최소화할 수 있는 효과를 얻을 수 있다.
Claims (11)
- 운영-대기(Active-Standby) 모드로 이중화된 IP 통신 시스템에서 발생하는 장애 상황을 감지하기 위한 시스템에 있어서,상대 시스템의 제2 이중화 상태 정보를 포함하는 하트비트 메시지(Heartbeat massage)를 TCP/IP 프로토콜을 이용하여 상기 상대 시스템으로부터 수신하고, 상기 제2 이중화 상태 정보와 자신이 위치한 시스템의 제1 이중화 상태 정보를 비교하며, 상기 비교 결과가 소정의 기준에 부합하지 않는 경우 상기 상대 시스템에 이중화 장애 상황이 발생한 것으로 감지하는 이중화 상태 관리 모듈;상기 시스템 내 소정의 관리 대상 프로세스의 상태를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 프로세스와 연관된 프로세스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 프로세스 상태 관리 모듈; 및상기 시스템 내 소정의 관리 대상 리소스의 상태 정보를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 리소스와 연관된 리소스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 리소스 상태 관리 모듈을 포함하고,상기 이중화 상태 관리 모듈은 상기 프로세스 장애 상황 또는 상기 리소스 장애 상황을 통보받는 경우, 상기 시스템에 이중화 장애 상황이 발생한 것으로 판단하며,상기 이중화 상태 관리 모듈은, 상기 기준으로 (1) 상기 제1 이중화 상태 정보가 'Standby'이고 상기 제2 이중화 상태 정보가 'Active'일 경우, (2) 상기 제1 이중화 상태 정보가 'Active'이고, 상기 제2 이중화 상태 정보가 'Standby'일 경우, (3) 상기 제1 이중화 상태 정보가 'Active Alone(상기 상대 시스템이 정상적으로 감지되지 않는 상태)'이고, 상기 제2 이중화 상태 정보가 'Unknown(시스템 초기화 진행 상태)'일 경우 중 어느 하나를 설정하는 것을 특징으로 하는 장애 상황 감지 시스템.
- 제1항에 있어서,상기 이중화 상태 관리 모듈은 주기적으로 상기 하트비트 메시지의 수신 여부를 조회하고, 상기 조회 결과 소정의 시간 간격 동안 상기 하트비트 메시지가 하나 이상 수신되지 않는 경우 상기 상대 시스템에 이중화 장애 상황이 발생한 것을 감지하는 것을 특징으로 하는 장애 상황 감지 시스템.
- 삭제
- 제1항에 있어서,상기 프로세스 상태 관리 모듈은 상기 장애 상황이 발생한 프로세스의 등급을 판단하고, 상기 판단된 등급에 따라 상기 이중화 상태 관리 모듈에의 통보 여부를 결정하는 것을 특징으로 하는 장애 상황 감지 시스템.
- 제4항에 있어서,상기 프로세스 상태 관리 모듈은 상기 판단된 등급이 제1 등급인 경우 상기 관리 대상 프로세스를 재시동하고 상기 프로세스 장애 상황을 상기 이중화 상태 관리 모듈에 통보하고, 상기 판단된 등급이 제2 등급인 경우 상기 관리 대상 프로세스를 재시동한 후 연속으로 소정의 횟수 이상의 상기 프로세스 장애 상황이 감지되면 상기 프로세스 장애 상황을 상기 이중화 상태 관리 모듈에 통보하며, 상기 판단된 등급이 제3 등급인 경우 상기 관리 대상 프로세스를 재시동하고 상기 프로세스 장애 상황을 상기 이중화 상태 관리 모듈에 통보하지 않는 것을 특징으로 하는 장애 상황 감지 시스템.
- 제1항에 있어서,상기 관리 대상 리소스의 상기 상태 정보는 CPU 점유 상태, 프로세스 별 CPU 점유 상태, 하드 디스크 사용률, 하드 디스크 사용가능 크기, 네트워크 상태, 메모리 사용률, 프로세스 별 메모리 사용률, 메모리 사용가능 크기 및 파일 시스템 상태 중 어느 하나 이상을 포함하는 것을 특징으로 하는 장애 상황 감지 시스템.
- 제1항에 있어서,상기 리소스 상태 관리 모듈은 상기 리소스 장애 상황의 발생을 감지하고, 상기 감지된 리소스 장애 상황의 등급을 판단하며, 상기 판단된 등급에 따라 상기 이중화 상태 관리 모듈에의 통보 여부를 결정하는 것을 특징으로 하는 장애 상황 감지 시스템.
- 운영-대기(Active-Standby) 모드로 이중화된 IP 통신 시스템에서 발생하는 장애 상황을 감지하기 위한 방법에 있어서,소정의 이중화 상태 관리 모듈이, 상대 시스템의 제2 이중화 상태 정보를 포함하는 하트비트 메시지(Heartbeat massage)를 TCP/IP 프로토콜을 이용하여 상기 상대 시스템으로부터 수신하고, 상기 제2 이중화 상태 정보와 자신이 위치한 시스템의 제1 이중화 상태 정보를 비교하며, 상기 비교 결과가 소정의 기준에 부합하지 않는 경우 상기 상대 시스템에 이중화 장애 상황이 발생한 것으로 감지하는 단계;상기 시스템 내 관리 대상 프로세스의 상태를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 프로세스와 연관된 프로세스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 단계;상기 시스템 내 관리 대상 리소스의 상태 정보를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 리소스와 연관된 리소스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 단계; 및상기 이중화 상태 관리 모듈이 상기 프로세스 장애 상황 또는 상기 리소스 장애 상황을 통보받는 경우, 상기 시스템에 이중화 장애 상황이 발생한 것으로 판단하는 단계를 포함하고,상기 이중화 상태 관리 모듈은, 상기 기준으로 (1) 상기 제1 이중화 상태 정보가 'Standby'이고 상기 제2 이중화 상태 정보가 'Active'일 경우, (2) 상기 제1 이중화 상태 정보가 'Active'이고, 상기 제2 이중화 상태 정보가 'Standby'일 경우, (3) 상기 제1 이중화 상태 정보가 'Active Alone(상기 상대 시스템이 정상적으로 감지되지 않는 상태)'이고, 상기 제2 이중화 상태 정보가 'Unknown(시스템 초기화 진행 상태)'일 경우 중 어느 하나를 설정하는 것을 특징으로 하는 장애 상황 감지 방법.
- 제8항에 있어서,상대 시스템에 이중화 장애 상황이 발생한 것으로 감지하는 상기 단계는,상기 이중화 상태 관리 모듈이 주기적으로 상기 하트비트 메시지의 수신 여부를 조회하는 단계; 및상기 조회 결과 소정의 시간 간격 동안 상기 하트비트 메시지가 하나 이상 수신되지 않는 경우 상기 상대 시스템에 이중화 장애 상황이 발생한 것을 감지하는 단계를 포함하는 것을 특징으로 하는 장애 상황 감지 방법.
- 삭제
- 제8항 또는 제9항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040080612A KR100622620B1 (ko) | 2004-10-08 | 2004-10-08 | 운영-대기(Active-Standby) 모드로이중화된 IP 통신 시스템에서 발생하는 장애 상황을감지하기 위한 시스템 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040080612A KR100622620B1 (ko) | 2004-10-08 | 2004-10-08 | 운영-대기(Active-Standby) 모드로이중화된 IP 통신 시스템에서 발생하는 장애 상황을감지하기 위한 시스템 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060031538A KR20060031538A (ko) | 2006-04-12 |
KR100622620B1 true KR100622620B1 (ko) | 2006-09-19 |
Family
ID=37141277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040080612A KR100622620B1 (ko) | 2004-10-08 | 2004-10-08 | 운영-대기(Active-Standby) 모드로이중화된 IP 통신 시스템에서 발생하는 장애 상황을감지하기 위한 시스템 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100622620B1 (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5523468B2 (ja) * | 2008-11-13 | 2014-06-18 | エルエスアイ コーポレーション | 直接接続ストレージ・システムのためのアクティブ−アクティブ・フェイルオーバー |
KR101883251B1 (ko) * | 2015-10-07 | 2018-07-31 | 주식회사 엘지유플러스 | 가상 시스템에서 장애 조치를 판단하는 장치 및 그 방법 |
KR102220389B1 (ko) * | 2019-11-28 | 2021-02-24 | 주식회사 한화 | Fpga를 이용하여 실시간 동기화를 수행하는 장치 및 그 방법 |
-
2004
- 2004-10-08 KR KR1020040080612A patent/KR100622620B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR20060031538A (ko) | 2006-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11330071B2 (en) | Inter-process communication fault detection and recovery system | |
KR100557399B1 (ko) | 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법 | |
US6983324B1 (en) | Dynamic modification of cluster communication parameters in clustered computer system | |
US7783794B2 (en) | Remote USB access method | |
US7979744B2 (en) | Fault model and rule based fault management apparatus in home network and method thereof | |
JP2006260355A (ja) | ストレージシステム及び記憶制御方法 | |
WO2016202051A1 (zh) | 一种通信系统中管理主备节点的方法和装置及高可用集群 | |
US20150339200A1 (en) | Intelligent disaster recovery | |
US20080288812A1 (en) | Cluster system and an error recovery method thereof | |
EP2637102A1 (en) | Cluster system with network node failover | |
JP6183931B2 (ja) | クラスタシステム、サーバ装置、クラスタシステムの管理方法、及びプログラム。 | |
US8880552B2 (en) | Database system and database control method | |
JP2008172592A (ja) | クラスタシステム、コンピュータおよびその異常検出方法 | |
KR100622620B1 (ko) | 운영-대기(Active-Standby) 모드로이중화된 IP 통신 시스템에서 발생하는 장애 상황을감지하기 위한 시스템 및 그 방법 | |
KR100943213B1 (ko) | 홈네트워크에서의 오류 모델과 규칙 기반의 오류 관리 장치및 그 방법 | |
KR101326451B1 (ko) | 복합 장애 조건을 이용하여 시스템 장애를 판단하는 시스템 장애 모니터링 방법 및 서버 | |
US11487623B2 (en) | Information processing system | |
JP4572138B2 (ja) | サーバ装置、サーバシステム、及びサーバシステムでの系切り換え方法 | |
US11954509B2 (en) | Service continuation system and service continuation method between active and standby virtual servers | |
JP4863984B2 (ja) | 監視処理プログラム、方法及び装置 | |
KR101883251B1 (ko) | 가상 시스템에서 장애 조치를 판단하는 장치 및 그 방법 | |
JP2000148525A (ja) | サービスプロセッサ二重化システムの現用系負荷軽減方法 | |
CN111712801A (zh) | 具有联网功能的设备 | |
JP6368842B2 (ja) | プロセス監視プログラム及びプロセス監視システム | |
KR100596002B1 (ko) | 운영-대기(Active-Standby) 모드로이중화된 IP교환기 시스템에서 호 정보를 동기화하기위한 시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20110714 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20120801 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |