KR100622620B1 - 운영-대기(Active-Standby) 모드로이중화된 IP 통신 시스템에서 발생하는 장애 상황을감지하기 위한 시스템 및 그 방법 - Google Patents

운영-대기(Active-Standby) 모드로이중화된 IP 통신 시스템에서 발생하는 장애 상황을감지하기 위한 시스템 및 그 방법 Download PDF

Info

Publication number
KR100622620B1
KR100622620B1 KR1020040080612A KR20040080612A KR100622620B1 KR 100622620 B1 KR100622620 B1 KR 100622620B1 KR 1020040080612 A KR1020040080612 A KR 1020040080612A KR 20040080612 A KR20040080612 A KR 20040080612A KR 100622620 B1 KR100622620 B1 KR 100622620B1
Authority
KR
South Korea
Prior art keywords
management module
redundancy
state
failure situation
state management
Prior art date
Application number
KR1020040080612A
Other languages
English (en)
Other versions
KR20060031538A (ko
Inventor
송요성
김종주
Original Assignee
(주)제너시스템즈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)제너시스템즈 filed Critical (주)제너시스템즈
Priority to KR1020040080612A priority Critical patent/KR100622620B1/ko
Publication of KR20060031538A publication Critical patent/KR20060031538A/ko
Application granted granted Critical
Publication of KR100622620B1 publication Critical patent/KR100622620B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0695Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/16Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

본 발명은 운영-대기(Active-Standby) 모드로 이중화된 IP 통신 시스템에서 발생하는 장애 상황을 감지하기 위한 시스템 및 그 방법에 관한 것으로, 더욱 상세하게는 IP 통신 시스템의 다양한 부분을 복합적으로 모니터링할 수 있는 이중화 상태 관리 모듈을 이용하여 시스템 내부에서 발생한 장애 상황 뿐만 아니라 상대 시스템의 장애 상황도 신속하게 감지하여 장애 발생 시 초래될 수 있는 서비스 중단 시간을 최소화할 수 있는 장애 상황 감지 시스템 및 그 방법에 관한 것이다.
본 발명에 따른 장애 상황 감지 시스템은 상대 시스템과 주기적으로 TCP/IP 프로토콜을 이용한 하트비트 메시지(Heartbeat massage)를 송수신하고, 상기 송수신 결과에 따라 상기 상대 시스템의 이중화 장애 상황을 감지하는 이중화 상태 관리 모듈, 상기 시스템 내 소정의 관리 대상 프로세스의 상태를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 프로세스와 연관된 프로세스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 프로세스 상태 관리 모듈 및 상기 시스템 내 소정의 관리 대상 리소스의 상태 정보를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 리소스와 연관된 리소스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 리소스 상태 관리 모듈을 포함하고, 상기 이중화 상태 관리 모듈은 상기 프로세스 장애 상황 또는 상기 리소스 장애 상황을 통보받는 경우, 상기 시스템에 이중화 장애 상황이 발생한 것으로 판단하는 것을 특징으로 한다.
IP 통신 시스템, 이중화, Active-Standby, 장애 상황 감지, 이중화 상태 관리 모듈

Description

운영-대기(Active-Standby) 모드로 이중화된 IP 통신 시스템에서 발생하는 장애 상황을 감지하기 위한 시스템 및 그 방법{SYSTEM AND METHOD FOR DETECTING ERROR STATE WHICH OCCURS IN INTERNET PROTOCOL COMMUNICATION SYSTEM REPLICATED IN ACTIVE-STANDBY MODE}
도 1은 본 발명의 일실시예에 있어서, 운영-대기(Active-Standby) 모드로 이중화된 IP 통신 시스템에서 주 시스템과 부 시스템의 연결 관계를 개략적으로 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 장애 상황 감지 시스템의 구성을 도시한 블록도이다.
도 3은 본 발명의 일실시예에 있어서, 이중화 상태 관리 모듈의 동작을 도시한 흐름도이다.
도 4는 본 발명에 따른 장애 상황 감지 방법을 수행하는 데 채용될 수 있는 범용 컴퓨터 장치의 내부 블록도이다.
<도면의 주요 부분에 대한 부호의 설명>
201 : 이중화 상태 관리 모듈 202 : 프로세스 상태 관리 모듈
203 : 리소스 상태 관리 모듈 210 : 주 시스템
220 : 부 시스템
본 발명은 운영-대기(Active-Standby) 모드로 이중화된 IP 통신 시스템에서 발생하는 장애 상황을 감지하기 위한 시스템 및 그 방법에 관한 것으로, 더욱 상세하게는 IP 통신 시스템의 다양한 부분을 복합적으로 모니터링할 수 있는 이중화 상태 관리 모듈을 이용하여 시스템 내부에서 발생한 장애 상황 뿐만 아니라 상대 시스템의 장애 상황도 신속하게 감지하여 장애 발생 시 초래될 수 있는 서비스 중단 시간을 최소화할 수 있는 장애 상황 감지 시스템 및 그 방법에 관한 것이다.
종래의 교환 시스템은 이중화 장애를 감지함에 있어서, IP 통신 시스템과는 그 장애 감지 분야가 상이하다. 즉, IP 통신 시스템에서는 종래의 교환 시스템에서는 감지하지 않았던 TCP/IP LAN Card 및 Network에 대한 장애, IP 통신 시스템에서 주로 사용되는 상용 서버에 대한 내부 리소스 장애 등을 감지해야 할 필요가 있는 반면, 종래의 교환 시스템에 있었던 통신전용 하드웨어에 대한 장애 등은 감지할 필요가 없는 등, IP 통신 시스템에서의 장애 감지 분야는 종래 교환 시스템에서의 장애 감지 분야와는 차이가 있다.
또한, 종래의 교환 시스템은 하드웨어의 장애를 감지함에 있어서 하드웨어 고유의 인터럽트(Interrupt) 신호를 수신하는 방식을 채택함으로 인해 만일 하드웨어의 종류가 변경되면 하드웨어를 제어할 수 있는 또 다른 프로세스를 추가로 개발해야만 하는 부담이 있고, 시스템간 및 내부 프로세스간의 통신 방법에 있어서도 TCP/IP 프로토콜을 이용하지 않아 IP 망에는 적합하지 않은 점이 존재한다.
따라서, 이중화 장애 감지기능에 대한 IP 통신 시스템의 최적화를 위해서 IP 통신 시스템에 적합한 새로운 장애 감지 방식이 필요하게 되었다.
본 발명은 상술한 바와 같은 종래기술의 문제점을 해결하기 위해 안출된 것으로서, IP 통신 시스템에 최적화될 수 있는 새로운 방식의 장애 상황 감지 시스템 및 방법을 제공하는 것을 그 목적으로 한다.
또한, 본 발명에 따른 장애 상황 감지 시스템 및 그 방법은 IP 통신 시스템의 다양한 부문을 복합적으로 모니터링 하여 IP 통신 시스템에서 발생할 수 있는 각종 장애 상황에 대한 감지 능력을 향상시키는 것을 그 목적으로 한다.
또한, 본 발명에 따른 장애 상황 감지 시스템 및 그 방법은 IP 통신 시스템의 장애 상황을 최단 시간 내에 효율적으로 감지함으로써, IP 통신 시스템의 장애 발생 시 서비스 중단 시간을 최소화할 수 있도록 하는 것을 그 목적으로 한다.
상기의 목적을 달성하고, 상술한 종래기술의 문제점을 해결하기 위하여, 본 발명의 일실시예에 따른 장애 상황 감지 시스템은 상대 시스템과 주기적으로 TCP/IP 프로토콜을 이용한 하트비트 메시지(Heartbeat massage)를 송수신하고, 상기 송수신 결과에 따라 상기 상대 시스템의 이중화 장애 상황을 감지하는 이중화 상태 관리 모듈, 상기 시스템 내 소정의 관리 대상 프로세스의 상태를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 프로세스와 연관된 프로 세스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 프로세스 상태 관리 모듈 및 상기 시스템 내 소정의 관리 대상 리소스의 상태 정보를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 리소스와 연관된 리소스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 리소스 상태 관리 모듈을 포함하고, 상기 이중화 상태 관리 모듈은 상기 프로세스 장애 상황 또는 상기 리소스 장애 상황을 통보받는 경우, 상기 시스템에 이중화 장애 상황이 발생한 것으로 판단하는 것을 특징으로 한다.
본 발명의 일측에 따르면, 상기 이중화 상태 관리 모듈은 주기적으로 상기 하트비트 메시지의 수신 여부를 조회하고, 상기 조회 결과 소정의 시간 간격 동안 상기 하트비트 메시지가 하나 이상 수신되지 않는 경우 상기 상대 시스템에 이중화 장애 상황이 발생한 것을 감지하는 것을 특징으로 하는 장애 상황 감지 시스템이 제공된다.
본 발명의 또 다른 측면에 따르면, 상기 하트비트 메시지는 상기 시스템의 제1 이중화 상태 정보 또는 상기 상대 시스템의 제2 이중화 상태 정보를 포함하고, 상기 이중화 상태 관리 모듈은 상기 제1 이중화 상태 정보와 상기 제2 이중화 상태 정보를 비교하고, 상기 비교 결과가 소정의 기준에 부합하지 않는 경우 상기 상대 시스템에 이중화 장애 상황이 발생한 것으로 감지하는 것을 특징으로 하는 장애 상황 감지 시스템이 제공된다.
한편, 본 발명의 일실시예에 따른 장애 상황 감지 방법은 소정의 이중화 상태 관리 모듈이 상대 시스템과 주기적으로 TCP/IP 프로토콜을 이용한 하트비트 메 시지(Heartbeat massage)를 송수신하고, 상기 송수신 결과에 따라 상기 상대 시스템의 이중화 장애 상황을 감지하는 단계, 소정의 시스템 내 관리 대상 프로세스의 상태를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 프로세스와 연관된 프로세스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 단계, 상기 시스템 내 관리 대상 리소스의 상태 정보를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 리소스와 연관된 리소스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 단계 및 상기 이중화 상태 관리 모듈이 상기 프로세스 장애 상황 또는 상기 리소스 장애 상황을 통보받는 경우, 상기 시스템에 이중화 장애 상황이 발생한 것으로 판단하는 단계를 포함하는 것을 특징으로 한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 장애 상황 감지 시스템 및 그 방법에 대하여 상세히 설명하도록 한다.
도 1은 본 발명의 일실시예에 있어서, 운영-대기(Active-Standby) 모드로 이중화된 IP 통신 시스템에서 주 시스템과 부 시스템의 연결 관계를 개략적으로 도시한 도면이다.
본 발명에 따른 장애 상황 감지 시스템에서 주 시스템(110)과 부 시스템(120)은 주기적으로 하트비트 메시지(Heartbeat message)를 송수신하고, 상기 송수신 결과에 따라 상대 시스템의 이중화 장애 상황을 감지할 수 있다.
일례로, 부 시스템(120)은 주기적으로 주 시스템(110)으로부터의 하트비트 메시지 수신 여부를 조회하고, 상기 조회 결과 소정의 시간 간격 동안 상기 하트비 트 메시지가 하나 이상 수신되지 않은 경우 주 시스템(110)에 이중화 장애 상황이 발생한 것으로 감지할 수 있다. 주 시스템(110)도 부 시스템(120)에 이중화 장애 상황이 발생했는지 여부를 상기와 동일한 방식에 따라 감지할 수 있다.
다른 예로, 부 시스템(120)은 수신된 하트비트 메시지에 포함된 주 시스템(110)의 이중화 상태 정보와 자신의 이중화 상태 정보를 비교하고, 상기 비교 결과가 소정의 기준에 부합하지 않는 경우 주 시스템(110)에 이중화 장애 상황이 발생한 것으로 감지할 수 있다. 주 시스템(110)도 부 시스템(120)에 이중화 장애 상황이 발생했는지 여부를 상기와 동일한 방식에 따라 감지할 수 있다.
도 2는 본 발명의 일실시예에 따른 장애 상황 감지 시스템의 구성을 도시한 블록도이다. 본 실시예에 따른 장애 상황 감지 시스템은 이중화 상태 관리 모듈(201), 프로세스 상태 관리 모듈(202), 리소스 상태 관리 모듈(203)을 포함하는 주 시스템(210)과, 같은 구성 요소를 포함하는 부 시스템(220)을 포함하여 구성될 수 있다.
우선 이중화 상태 관리 모듈(201)이 상대 시스템의 장애 상황을 감지하는 실시예에 대하여 설명한다. 도 3은 이중화 상태 관리 모듈(201)의 동작을 도시한 흐름도이다.
이중화 상태 관리 모듈(201)은 상대 시스템과 주기적으로 TCP/IP 프로토콜을 이용한 하트비트 메시지(Heartbeat massage)를 송수신하고(S301), 주기적으로 상기 하트비트 메시지의 수신 여부를 조회한다(S302).
이중화 상태 관리 모듈(201)은 상기 조회 결과에 따라 상기 하트비트 메시지 가 정상적으로 수신되는지 여부를 판단하고(S303), 만일 소정의 시간 간격 동안 상기 하트비트 메시지가 하나 이상 수신되지 않는 경우에는 상대 시스템에 이중화 장애 상황이 발생한 것으로 감지할 수 있다(S304).
또한, 이중화 상태 관리 모듈(201)은 수신된 하트비트 메시지에 포함된 상대 시스템의 이중화 상태 정보를 통해 상대 시스템의 장애를 감지할 수도 있다. 이를 위해, 이중화 상태 관리 모듈(201)은 상대 시스템으로부터 수신된 하트비트 메시지에 포함된 이중화 상태 정보와 자신이 위치한 시스템의 이중화 상태 정보를 비교할 수 있다(S305).
이중화 상태 관리 모듈(201)은 상기 비교 결과가 미리 설정된 소정의 기준에 부합하는지 여부를 판단하고(S306), 상기 판단 결과 상기 기준에 부합되는 경우에는 상대 시스템이 정상적으로 동작하고 있는 것으로 판단하지만(S307), 상기 기준에 부합되지 않는 경우에는 상대 시스템에 이중화 장애 상황이 발생한 것으로 감지할 수 있다(S304).
예를 들어, 이중화 상태 관리 모듈(201)은 (1) 자신이 위치한 시스템의 이중화 상태 정보가 “Standby(부 시스템으로 정상 동작하고 있음을 의미)”일 때 상대 시스템의 이중화 상태 정보가 “Active(주 시스템으로 정상 동작하고 있음을 의미)”인 경우, (2) 자신이 위치한 시스템의 이중화 상태 정보가 “Active”일 때 상대 시스템의 이중화 상태 정보가 “Standby”인 경우, (3) 자신이 위치한 시스템의 이중화 상태 정보가 “Active Alone(주 시스템으로 정상 동작하고 있고 상대 시스템이 정상적으로 감지되고 있지 않음을 의미)”일 때 상대 시스템의 이중화 상태 정 보가 “Unknown(시스템 초기화 등이 진행중임을 의미)”경우를 상기 소정의 기준으로 설정하고, 상기 기준에 부합되지 않는 경우 상대 시스템에 장애 상황이 발생한 것으로 감지할 수 있다.
상기 예를 표로 구성하면 아래와 같다.
Figure 112004045864140-pat00001
다음으로 프로세스 상태 관리 모듈(202)이 시스템 내부 프로세스의 장애 상황을 감지하는 실시예에 대하여 설명한다.
프로세스 상태 관리 모듈(202)은 자신이 위치한 시스템 내 소정의 관리 대상 프로세스의 상태를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 프로세스와 연관된 프로세스 장애 상황을 감지하여 이중화 상태 관리 모듈(201)에 통보하는 역할을 수행한다.
이중화 상태 관리 모듈(201)은 상기와 같이 프로세스 장애 상황을 통보받는 경우에는 시스템 내부에 이중화 장애 상황이 발생한 것으로 판단하고 소정의 복구 절차가 진행되도록 제어할 수 있다. 이와 같이, 본 발명에 따르면 IP 통신 시스템의 다양한 부분을 복합적으로 모니터링할 수 있는 이중화 상태 관리 모듈(201)을 통해 상대 시스템의 장애 상황 뿐만 아니라 시스템 내부에서 발생한 프로세스 장애 상황도 신속하게 감지하여 장애 발생 시 초래될 수 있는 서비스 중단 시간을 최소화할 수 있게 된다.
한편, 프로세스 상태 관리 모듈(202)은 장애 상황이 발생한 프로세스의 등급을 판단하고, 상기 판단된 등급에 따라 이중화 상태 관리 모듈(201)에의 통보 여부를 결정할 수 있다.
예를 들어, 프로세스 상태 관리 모듈(202)은 상기 판단된 등급이 제1 등급인 경우 상기 관리 대상 프로세스를 재시동하고 상기 프로세스 장애 상황을 이중화 상태 관리 모듈(201)에 통보하고, 상기 판단된 등급이 제2 등급인 경우 상기 관리 대상 프로세스를 재시동한 후 연속으로 소정의 횟수 이상의 상기 프로세스 장애 상황이 감지되면 상기 프로세스 장애 상황을 이중화 상태 관리 모듈(201)에 통보하며, 상기 판단된 등급이 제3 등급인 경우 상기 관리 대상 프로세스를 재시동하고 상기 프로세스 장애 상황을 이중화 상태 관리 모듈(201)에 통보하지 않을 수 있다.
상기 예를 표로 구성하면 아래와 같다.
Figure 112004045864140-pat00002
위의 표에 따른 예로, IP 교환기 시스템에 있어서 호 처리를 담당하는 프로세스의 경우 장애 상황이 발생하면 사용자의 전화 이용이 불가능해지며, 이 경우 프로세스 상태 관리 모듈(202)은 호 처리를 담당하는 프로세스를 제1 등급으로 설정하고, 장애 상황 발생시 바로 이중화 상태 관리 모듈(201)에 통보할 수 있다.
반대로 시스템 이력관리를 담당하는 프로세스의 경우 장애가 발생하더라도 사용자의 전화 이용이 불가능해지는 것은 아니므로, 이 경우 프로세스 상태 관리 모듈(202)은 시스템 이력관리를 담당하는 프로세스를 제2 등급으로 설정하고, 장애 상황이 발생하더라도 바로 이중화 상태 관리 모듈(201)에 통보하지 않도록 동작할 수 있다.
다음으로 리소스 상태 관리 모듈(203)이 시스템 내부 리소스의 장애 상황을 감지하는 실시 예에 대하여 설명한다.
리소스 상태 관리 모듈(203)은 자신이 위치한 시스템 내 소정의 관리 대상 리소스의 상태 정보를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 리소스와 연관된 리소스 장애 상황을 감지하여 이중화 상태 관리 모듈 (201)에 통보하는 역할을 수행한다.
이중화 상태 관리 모듈(201)은 상기와 같이 리소스 장애 상황을 통보받는 경우에는 시스템 내부에 이중화 장애 상황이 발생한 것으로 판단하고 소정의 복구 절차가 진행되도록 제어할 수 있다. 이와 같이, 본 발명에 따르면 IP 통신 시스템의 다양한 부분을 복합적으로 모니터링할 수 있는 이중화 상태 관리 모듈(201)을 통해 상대 시스템의 장애 상황, 시스템 내부에서 발생한 프로세스 장애 상황 뿐만 아니라 시스템 내부에서 발생한 리소스 장애 상황도 신속하게 감지하여 장애 발생 시 초래될 수 있는 서비스 중단 시간을 최소화할 수 있게 된다.
상기 관리 대상 리소스의 상태 정보는 CPU 점유 상태, 프로세스 별 CPU 점유 상태, 하드 디스크 사용률, 하드 디스크 사용가능 크기, 네트워크 상태, 메모리 사용률, 프로세스 별 메모리 사용률, 메모리 사용가능 크기 및 파일 시스템 상태 등을 포함할 수 있다.
한편, 리소스 상태 관리 모듈(203)은 상기 관리 대상 리소스의 상태 정보가 소정의 임계치 값에 도달한 경우 상기 리소스가 장애상황 인 것으로 판단하고, 소정의 기준에 따라 상기 감지된 리소스 장애 상황의 등급을 판단하며, 상기 판단된 등급에 따라 이중화 상태 관리 모듈(201)에의 통보 여부를 결정할 수 있다. 상기 임계치 값과 상기 등급이 IP 통신 시스템상에서 다양하게 설정될 수 있음은 본 발명이 속하는 기술분야의 당업자에게 있어 자명하다.
본 발명에 따른 장애 상황 감지 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.
상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
도 4는 본 발명에 따른 장애 상황 감지 방법을 수행하는 데 채용될 수 있는 범용 컴퓨터 장치의 내부 블록도이다.
컴퓨터 장치(400)는 램(RAM: Random Access Memory)(420)과 롬(ROM: Read Only Memory)(430)을 포함하는 주기억장치와 연결되는 하나 이상의 프로세서(410)를 포함한다. 프로세서(410)는 중앙처리장치(CPU)로 불리기도 한다. 본 기술분야 에서 널리 알려져 있는 바와 같이, 롬(430)은 데이터(data)와 명령(instruction)을 단방향성으로 CPU에 전송하는 역할을 하며, 램(420)은 통상적으로 데이터와 명령을 양방향성으로 전송하는 데 사용된다. 램(420) 및 롬(430)은 컴퓨터 판독 가능 매체의 어떠한 적절한 형태를 포함할 수 있다. 대용량 기억장치(Mass Storage)(440)는 양방향성으로 프로세서(410)와 연결되어 추가적인 데이터 저장 능력을 제공하며, 상기된 컴퓨터 판독 가능 기록 매체 중 어떠한 것일 수 있다. 대용량 기억장치(440)는 프로그램, 데이터 등을 저장하는데 사용되며, 통상적으로 주기억장치보다 속도가 느린 하드 디스크와 같은 보조기억장치이다. CD 롬(460)과 같은 특정 대용량 기억장치가 사용될 수도 있다. 프로세서(410)는 비디오 모니터, 트랙볼, 마우스, 키보드, 마이크로폰, 터치스크린 형 디스플레이, 카드 판독기, 자기 또는 종이 테이프 판독기, 음성 또는 필기 인식기, 조이스틱, 또는 기타 공지된 컴퓨터 입출력장치와 같은 하나 이상의 입출력 인터페이스(450)와 연결된다. 마지막으로, 프로세서(410)는 네트워크 인터페이스(470)를 통하여 유선 또는 무선 통신 네트워크에 연결될 수 있다. 이러한 네트워크 연결을 통하여 상기된 방법의 절차를 수행할 수 있다. 상기된 장치 및 도구는 컴퓨터 하드웨어 및 소프트웨어 기술 분야의 당업자에게 잘 알려져 있다. 한편, 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
본 발명에 의하면, IP 통신 시스템에 최적화될 수 있는 새로운 방식의 장애 상황 감지 시스템 및 방법이 제공된다.
본 발명에 따른 장애 상황 감지 시스템 및 그 방법에 의하면, IP 통신 시스템의 다양한 부문을 복합적으로 모니터링 하여 IP 통신 시스템에서 발생할 수 있는 각종 장애 상황에 대한 감지 능력을 향상시키는 효과를 얻을 수 있다.
본 발명에 따른 장애 상황 감지 시스템 및 그 방법에 의하면, IP 통신 시스템의 장애 상황을 최단 시간 내에 효율적으로 감지함으로써, IP 통신 시스템의 장애 발생 시 서비스 중단 시간을 최소화할 수 있는 효과를 얻을 수 있다.

Claims (11)

  1. 운영-대기(Active-Standby) 모드로 이중화된 IP 통신 시스템에서 발생하는 장애 상황을 감지하기 위한 시스템에 있어서,
    상대 시스템의 제2 이중화 상태 정보를 포함하는 하트비트 메시지(Heartbeat massage)를 TCP/IP 프로토콜을 이용하여 상기 상대 시스템으로부터 수신하고, 상기 제2 이중화 상태 정보와 자신이 위치한 시스템의 제1 이중화 상태 정보를 비교하며, 상기 비교 결과가 소정의 기준에 부합하지 않는 경우 상기 상대 시스템에 이중화 장애 상황이 발생한 것으로 감지하는 이중화 상태 관리 모듈;
    상기 시스템 내 소정의 관리 대상 프로세스의 상태를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 프로세스와 연관된 프로세스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 프로세스 상태 관리 모듈; 및
    상기 시스템 내 소정의 관리 대상 리소스의 상태 정보를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 리소스와 연관된 리소스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 리소스 상태 관리 모듈을 포함하고,
    상기 이중화 상태 관리 모듈은 상기 프로세스 장애 상황 또는 상기 리소스 장애 상황을 통보받는 경우, 상기 시스템에 이중화 장애 상황이 발생한 것으로 판단하며,
    상기 이중화 상태 관리 모듈은, 상기 기준으로 (1) 상기 제1 이중화 상태 정보가 'Standby'이고 상기 제2 이중화 상태 정보가 'Active'일 경우, (2) 상기 제1 이중화 상태 정보가 'Active'이고, 상기 제2 이중화 상태 정보가 'Standby'일 경우, (3) 상기 제1 이중화 상태 정보가 'Active Alone(상기 상대 시스템이 정상적으로 감지되지 않는 상태)'이고, 상기 제2 이중화 상태 정보가 'Unknown(시스템 초기화 진행 상태)'일 경우 중 어느 하나를 설정하는 것을 특징으로 하는 장애 상황 감지 시스템.
  2. 제1항에 있어서,
    상기 이중화 상태 관리 모듈은 주기적으로 상기 하트비트 메시지의 수신 여부를 조회하고, 상기 조회 결과 소정의 시간 간격 동안 상기 하트비트 메시지가 하나 이상 수신되지 않는 경우 상기 상대 시스템에 이중화 장애 상황이 발생한 것을 감지하는 것을 특징으로 하는 장애 상황 감지 시스템.
  3. 삭제
  4. 제1항에 있어서,
    상기 프로세스 상태 관리 모듈은 상기 장애 상황이 발생한 프로세스의 등급을 판단하고, 상기 판단된 등급에 따라 상기 이중화 상태 관리 모듈에의 통보 여부를 결정하는 것을 특징으로 하는 장애 상황 감지 시스템.
  5. 제4항에 있어서,
    상기 프로세스 상태 관리 모듈은 상기 판단된 등급이 제1 등급인 경우 상기 관리 대상 프로세스를 재시동하고 상기 프로세스 장애 상황을 상기 이중화 상태 관리 모듈에 통보하고, 상기 판단된 등급이 제2 등급인 경우 상기 관리 대상 프로세스를 재시동한 후 연속으로 소정의 횟수 이상의 상기 프로세스 장애 상황이 감지되면 상기 프로세스 장애 상황을 상기 이중화 상태 관리 모듈에 통보하며, 상기 판단된 등급이 제3 등급인 경우 상기 관리 대상 프로세스를 재시동하고 상기 프로세스 장애 상황을 상기 이중화 상태 관리 모듈에 통보하지 않는 것을 특징으로 하는 장애 상황 감지 시스템.
  6. 제1항에 있어서,
    상기 관리 대상 리소스의 상기 상태 정보는 CPU 점유 상태, 프로세스 별 CPU 점유 상태, 하드 디스크 사용률, 하드 디스크 사용가능 크기, 네트워크 상태, 메모리 사용률, 프로세스 별 메모리 사용률, 메모리 사용가능 크기 및 파일 시스템 상태 중 어느 하나 이상을 포함하는 것을 특징으로 하는 장애 상황 감지 시스템.
  7. 제1항에 있어서,
    상기 리소스 상태 관리 모듈은 상기 리소스 장애 상황의 발생을 감지하고, 상기 감지된 리소스 장애 상황의 등급을 판단하며, 상기 판단된 등급에 따라 상기 이중화 상태 관리 모듈에의 통보 여부를 결정하는 것을 특징으로 하는 장애 상황 감지 시스템.
  8. 운영-대기(Active-Standby) 모드로 이중화된 IP 통신 시스템에서 발생하는 장애 상황을 감지하기 위한 방법에 있어서,
    소정의 이중화 상태 관리 모듈이, 상대 시스템의 제2 이중화 상태 정보를 포함하는 하트비트 메시지(Heartbeat massage)를 TCP/IP 프로토콜을 이용하여 상기 상대 시스템으로부터 수신하고, 상기 제2 이중화 상태 정보와 자신이 위치한 시스템의 제1 이중화 상태 정보를 비교하며, 상기 비교 결과가 소정의 기준에 부합하지 않는 경우 상기 상대 시스템에 이중화 장애 상황이 발생한 것으로 감지하는 단계;
    상기 시스템 내 관리 대상 프로세스의 상태를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 프로세스와 연관된 프로세스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 단계;
    상기 시스템 내 관리 대상 리소스의 상태 정보를 주기적으로 모니터링하고, 상기 모니터링 결과에 따라 상기 관리 대상 리소스와 연관된 리소스 장애 상황을 감지하여 상기 이중화 상태 관리 모듈에 통보하는 단계; 및
    상기 이중화 상태 관리 모듈이 상기 프로세스 장애 상황 또는 상기 리소스 장애 상황을 통보받는 경우, 상기 시스템에 이중화 장애 상황이 발생한 것으로 판단하는 단계를 포함하고,
    상기 이중화 상태 관리 모듈은, 상기 기준으로 (1) 상기 제1 이중화 상태 정보가 'Standby'이고 상기 제2 이중화 상태 정보가 'Active'일 경우, (2) 상기 제1 이중화 상태 정보가 'Active'이고, 상기 제2 이중화 상태 정보가 'Standby'일 경우, (3) 상기 제1 이중화 상태 정보가 'Active Alone(상기 상대 시스템이 정상적으로 감지되지 않는 상태)'이고, 상기 제2 이중화 상태 정보가 'Unknown(시스템 초기화 진행 상태)'일 경우 중 어느 하나를 설정하는 것을 특징으로 하는 장애 상황 감지 방법.
  9. 제8항에 있어서,
    상대 시스템에 이중화 장애 상황이 발생한 것으로 감지하는 상기 단계는,
    상기 이중화 상태 관리 모듈이 주기적으로 상기 하트비트 메시지의 수신 여부를 조회하는 단계; 및
    상기 조회 결과 소정의 시간 간격 동안 상기 하트비트 메시지가 하나 이상 수신되지 않는 경우 상기 상대 시스템에 이중화 장애 상황이 발생한 것을 감지하는 단계
    를 포함하는 것을 특징으로 하는 장애 상황 감지 방법.
  10. 삭제
  11. 제8항 또는 제9항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.
KR1020040080612A 2004-10-08 2004-10-08 운영-대기(Active-Standby) 모드로이중화된 IP 통신 시스템에서 발생하는 장애 상황을감지하기 위한 시스템 및 그 방법 KR100622620B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040080612A KR100622620B1 (ko) 2004-10-08 2004-10-08 운영-대기(Active-Standby) 모드로이중화된 IP 통신 시스템에서 발생하는 장애 상황을감지하기 위한 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040080612A KR100622620B1 (ko) 2004-10-08 2004-10-08 운영-대기(Active-Standby) 모드로이중화된 IP 통신 시스템에서 발생하는 장애 상황을감지하기 위한 시스템 및 그 방법

Publications (2)

Publication Number Publication Date
KR20060031538A KR20060031538A (ko) 2006-04-12
KR100622620B1 true KR100622620B1 (ko) 2006-09-19

Family

ID=37141277

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040080612A KR100622620B1 (ko) 2004-10-08 2004-10-08 운영-대기(Active-Standby) 모드로이중화된 IP 통신 시스템에서 발생하는 장애 상황을감지하기 위한 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR100622620B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5523468B2 (ja) * 2008-11-13 2014-06-18 エルエスアイ コーポレーション 直接接続ストレージ・システムのためのアクティブ−アクティブ・フェイルオーバー
KR101883251B1 (ko) * 2015-10-07 2018-07-31 주식회사 엘지유플러스 가상 시스템에서 장애 조치를 판단하는 장치 및 그 방법
KR102220389B1 (ko) * 2019-11-28 2021-02-24 주식회사 한화 Fpga를 이용하여 실시간 동기화를 수행하는 장치 및 그 방법

Also Published As

Publication number Publication date
KR20060031538A (ko) 2006-04-12

Similar Documents

Publication Publication Date Title
US11330071B2 (en) Inter-process communication fault detection and recovery system
KR100557399B1 (ko) 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법
US6983324B1 (en) Dynamic modification of cluster communication parameters in clustered computer system
US7783794B2 (en) Remote USB access method
US7979744B2 (en) Fault model and rule based fault management apparatus in home network and method thereof
JP2006260355A (ja) ストレージシステム及び記憶制御方法
WO2016202051A1 (zh) 一种通信系统中管理主备节点的方法和装置及高可用集群
US20150339200A1 (en) Intelligent disaster recovery
US20080288812A1 (en) Cluster system and an error recovery method thereof
EP2637102A1 (en) Cluster system with network node failover
JP6183931B2 (ja) クラスタシステム、サーバ装置、クラスタシステムの管理方法、及びプログラム。
US8880552B2 (en) Database system and database control method
JP2008172592A (ja) クラスタシステム、コンピュータおよびその異常検出方法
KR100622620B1 (ko) 운영-대기(Active-Standby) 모드로이중화된 IP 통신 시스템에서 발생하는 장애 상황을감지하기 위한 시스템 및 그 방법
KR100943213B1 (ko) 홈네트워크에서의 오류 모델과 규칙 기반의 오류 관리 장치및 그 방법
KR101326451B1 (ko) 복합 장애 조건을 이용하여 시스템 장애를 판단하는 시스템 장애 모니터링 방법 및 서버
US11487623B2 (en) Information processing system
JP4572138B2 (ja) サーバ装置、サーバシステム、及びサーバシステムでの系切り換え方法
US11954509B2 (en) Service continuation system and service continuation method between active and standby virtual servers
JP4863984B2 (ja) 監視処理プログラム、方法及び装置
KR101883251B1 (ko) 가상 시스템에서 장애 조치를 판단하는 장치 및 그 방법
JP2000148525A (ja) サービスプロセッサ二重化システムの現用系負荷軽減方法
CN111712801A (zh) 具有联网功能的设备
JP6368842B2 (ja) プロセス監視プログラム及びプロセス監視システム
KR100596002B1 (ko) 운영-대기(Active-Standby) 모드로이중화된 IP교환기 시스템에서 호 정보를 동기화하기위한 시스템 및 그 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110714

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20120801

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee