KR101447024B1 - 서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법 - Google Patents

서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법 Download PDF

Info

Publication number
KR101447024B1
KR101447024B1 KR1020130029959A KR20130029959A KR101447024B1 KR 101447024 B1 KR101447024 B1 KR 101447024B1 KR 1020130029959 A KR1020130029959 A KR 1020130029959A KR 20130029959 A KR20130029959 A KR 20130029959A KR 101447024 B1 KR101447024 B1 KR 101447024B1
Authority
KR
South Korea
Prior art keywords
service
state information
node
distributed
weapon system
Prior art date
Application number
KR1020130029959A
Other languages
English (en)
Other versions
KR20140115186A (ko
Inventor
장혜민
추증호
박원익
김도종
Original Assignee
국방과학연구소
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국방과학연구소 filed Critical 국방과학연구소
Priority to KR1020130029959A priority Critical patent/KR101447024B1/ko
Publication of KR20140115186A publication Critical patent/KR20140115186A/ko
Application granted granted Critical
Publication of KR101447024B1 publication Critical patent/KR101447024B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

서비스 단위 기반의 무기체계용 분산식 다계층 시스템의 고장 복구방법이 개시된다. 본 발명에 따른 실시예들에 의하면, 각 로컬 노드의 상태 정보들을 주기적으로 수신하고, 수신된 상태 정보가 변경되면 해당 노드에 대한 서비스의 고장 여부를 판단하고, 서비스 고장시 대체할 서비스를 결정하여 설정 상태 정보를 생성함으로써, 시스템 고장의 판단 및 복구가 서비스 단위로 수행되도록 하여 시스템의 신뢰성을 향상시키고 활용성을 높일 수 있다. 또한, 고장 감지된 서비스를 대체할 서비스가 없는 경우에는, 가용 노드 중 실행 우선순위가 가장 빠른 노드를 선택하여 대체할 서비스의 실행 정보를 생성하거나 고장 감지된 서비스에 대한 축소 운용을 수행함으로써, 시스템의 고장률을 감소시키는 효과를 제공한다.

Description

서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법{ERROR RESTORATION METHOD OF DISTRIBUTED MULTI-LAYER SYSTEM FOR WEAPON BASED ON SERVICE-SCALE}
본 발명은 서비스 단위 기반의 무기체계용 분산식 다계층 시스템의 고장 복구방법에 관한 것이다.
최근, 전장환경이 정밀타격 및 네트워크 중심전으로 변화함에 따라서, 무기체계는 더욱 첨단화되고 정밀화 되어가고 있다. 또한, 무기체계는 환경변화에 따른 최적화된 운용을 위하여 점차 단순한 임무 수행에서 복합한 임무 수행의 개념으로 변화하고 있다. 이러한 요구를 충족시키기 위해, 무기체계의 중심이 하드웨어 위주에서 점차 소프트웨어 위주로 이동하고 있다.
한편, 무기체계 내장형 소프트웨어는 일반 소프트웨어와는 다르게 특정 하드웨어의 특성에 따라 각각의 제어목적을 갖기 때문에 하드웨어 종속성이 높은 특성을 갖는다. 또한, 무기체계 내장형 소프트웨어는 전장상황 및 이기종 시스템의 상태 변화에 대응하여 실시간 처리를 지원할 수 있어야하므로 실시간성이 높아야하고, 소프트웨어의 오동작이나 불시의 작동 중지로 인한 치명적인 결과를 방지하기 위하여 고신뢰성이 요구된다. 또한, 최근 체계 기능의 복잡도 증가에 따른 소프트웨어의 고도화 역시 무기체계 내장형 소프트웨어의 복잡성을 더욱 증대시키고 있다.
따라서, 무기체계 내장형 소프트웨어는 하드웨어 종속성, 실시간성, 고신뢰성, 및 복잡성을 모두 충족시키기 위하여 점차 독립적이고 재사용이 가능한 단위로 세분화되는 추세이다. 그에 따라, 무기체계 내장형 소프트웨어는 소프트웨어의 복잡성은 낮추고 유연성은 높이면서 전체 시스템의 신뢰성을 보다 향상시킬 수 있는 방향으로 발전해가고 있다.
한편, 일반적인 무기체계 내장형 소프트웨어의 구조는 크게 시스템 소프트웨어, 미들웨어, 응용 소프트웨어의 세 계층으로 이루어진다. 시스템 소프트웨어 계층은 운영체제와 네트워크, 그래픽, 장치 드라이버 등을 포함한다. 또한, 미들웨어 계층은 공통 미들웨어와 특정 응용분야를 지원하는 미들웨어 그리고 라이브러리로 구성된다. 무기체계 내장형 소프트웨어는 앞에서 언급한 계층을 모두 포함하는 복잡한 구조로 이루어질 수도 있고, 계층 중 일부만을 포함하여 구성될 수도 있다.
상기 미들웨어 계층의 가용성을 증대시키는 것은 전체 시스템의 신뢰성 증대를 위해 필수적이다. 따라서, 무기체계 내장형 소프트웨어의 미들웨어 계층에서 지속적인 서비스 제공을 위한 고가용성이 요구된다.
한편, 무기체계용 분산식 다계층 시스템의 고장시, 인력에 의하여 직접 고장모듈을 교체하는 것은 실시간 처리를 요하는 군용 시스템의 특성에는 부적합하다. 이를 극복하기 위해, 일반적으로 고장 상황에 대비하여 동일 모듈을 중복으로 운용하는 이중화 방식이 사용되고 있다.
이와 같은 이중화 방식으로 예를 들어, 동기식 이중화 방식과 비동기식 이중화 방식이 있다.
동기식 이중화 방식은 모든 모듈이 동시에 운용되는 방식이다. 동기식 이중화 방식은 실제 시스템을 운용하기 위한 모듈이 충분하더라도 중복 운용이 적용된다. 동기식 이중화 방식에 의하면 고장복구를 위한 지연시간이 없거나 짧다는 장점이 있다. 그러나, 상기 동기식 이중화 방식은 중복 운용이 적용되므로 모듈의 자원 소모량 많다는 단점이 있다.
비동기식 이중화 방식은 고장이 발생한 모듈에 대해 대체 운용이 가능하도록 대기상태(Standby)로 운용하는 방식이다. 이와 같이 비동기식 이중화 방식은 대기상태(Standby)로 운용중인 모듈은 서비스를 Active 모듈과 동일하게 전적으로(Fully) 가동하지 않아도 되기 때문에, 일반적으로 동기식 이중화 방식보다 자원소모량이 적고 고장률이 낮다는 장점이 있다. 그러나, 상기 비동기식 이중화 방식은 고장감지를 위한 부가적인 시스템이 요구되며, 고장 복구시 동일한 모듈을 재개시하거나 전환해야하는 어려움이 있다. 또, 비동기식 이중화 방식은 고장복구를 위한 모듈 절체 중 야기될 수 있는 고장에 대한 대비가 필요하다는 단점이 있다.
이에, 본 발명의 실시예들은, 시스템의 범용성을 고려하여 동기식 이중화 방식과 비동기식 이중화 방식이 모두 적용될 수 있도록 구현한 서비스 단위 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법을 제공하는데 그 목적이 있다.
또한, 본 발명의 실시예들은 고장상황 인지를 고장복구의 단위가 서비스 단위로 절체 운용되도록 구현한 서비스 단위 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법을 제공하는데 다른 목적이 있다.
또한, 본 발명의 실시예들은 고장 복구시, 고장 감지된 서비스를 대체할 서비스가 없는 경우 서비스 추가 구동을 위한 절차를 수행하도록 구현한 서비스 단위 기반의 무기체계용 분산식 다계층 시스템의의 고장 복구 방법을 제공하는데 다른 목적이 있다.
본 발명의 실시예에 따른 서비스 단위 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법은, 무기체계용 분산식 다계층 시스템에서 각 로컬 노드에 대한 가용 상태 정보 및 서비스 상태 정보를 주기적으로 수신하는 단계와, 상기 수신된 상태 정보들을 일정 시간 간격으로 취합하고, 상기 상태 정보가 변경되면 변경된 상태 정보를 현재 설정 상태 정보와 비교하여 해당 로컬 노드에 대한 서비스의 고장 여부를 판단하는 단계와, 고장 이벤트 발생시, 고장 감지된 제1 서비스를 대체할 제2 서비스를 결정하는 단계와, 상기 제2 서비스에 대한 설정 상태 정보를 생성하고, 생성된 설정 상태 정보를 해당 로컬 노드에 제공하는 단계를 포함하여 이루어진다.
일 실시예에서, 상기 제2 서비스를 결정하는 단계는, 대체가능한 서비스들 중 실행 우선순위가 가장 빠른 서비스를 상기 제2 서비스로 결정하는 단계인 것을 특징으로 한다.
일 실시예에서, 상기 제2 서비스를 결정하는 단계는, 상기 제1 서비스를 대체할 서비스가 없으면, 가용 노드 중에서 서비스 실행 우선순위가 가장 빠른 노드를 선택하는 단계와, 상기 선택된 노드에서 실행될 상기 제2 서비스의 실행 정보를 생성하는 단계를 포함하는 것을 특징으로 한다.
일 실시예에서, 상기 제1 서비스를 대체할 서비스와 상기 가용 노드가 없으면, 상기 고장 감지된 제1 서비스에 대한 축소 운용을 수행하는 단계를 포함하는 것을 특징으로 한다.
일 실시예에서, 상기 시스템의 고장 여부를 판단하는 단계는, 상기 각 로컬 노드에 대한 가용 자원의 현재 운용 점유율을 확인하고, 확인된 현재 운용 점유율을 기준 가용률과 비교하고, 비교 결과에 따라 상기 상태 정보의 변경 여부를 결정하는 단계를 포함하는 것을 특징으로 한다.
일 실시예에서, 상기 서비스 상태 정보가 기 설정된 시간내에 수신되지 않으면, 해당 로컬 노드의 서비스 가용 상태를 비가용 상태로 전환하는 단계를 포함하는 것을 특징으로 한다.
일 실시예에서, 상기 시스템의 고장 여부를 판단하는 단계는, 상기 비교 결과, 변경된 상태 정보가 현재 설정 상태 정보와 불일치하면 해당 노드에 대한 서비스의 고장으로 판단하는 것을 특징으로 한다.
본 발명의 실시예에 따른 서비스 단위 기반의 무기체계용 분산식 다계층 시스템의 운용 방법에 의하면, 각 로컬 노드의 상태 정보들을 주기적으로 수신하고, 수신된 상태 정보가 변경되면 해당 노드에 대한 서비스의 고장 여부를 판단하고, 서비스 고장시 대체할 서비스를 결정하여 설정 상태 정보를 생성함으로써, 시스템 고장의 판단 및 복구를 서비스 단위로 수행되도록 하여 시스템의 신뢰성이 향상되는 효과를 제공한다.
또한, 본 발명의 실시예에 따른 서비스 단위 기반의 무기체계용 분산식 다계층 시스템의 운용 방법에 의하면, 서비스시스템의 범용성을 고려하여 동기식 이중화 방식과 비동기식 이중화 방식이 모두 적용될 수 있고, 고장상황 인지 및 고장복구의 단위가 서비스 단위로 절체 운용되도록 구현함으로써 시스템의 활용성을 높이는 효과가 있다.
나아가, 본 발명의 실시예에 따른 서비스 단위 기반의 무기체계용 분산식 다계층 시스템의 운용 방법에 의하면, 고장 감지된 서비스를 대체할 서비스가 없는 경우 서비스 추가를 위한 절차에 있어서, 가용 노드 중 실행 우선순위가 가장 빠른 노드를 선택하여서 대체할 서비스의 실행 정보를 생성하거나 고장 감지된 서비스에 대한 축소 운용을 수행함으로써, 시스템의 고장률을 감소시키는 효과를 제공한다.
도 1은 본 발명의 실시예에 따라, 서비스의 고장 감지 및 복구 방법의 예시 흐름도이다.
도 2는 본 발명의 실시예에 따른 무기체계용 분산식 다계층 시스템의 고장 감지 및 복구 흐름의 개념도이다.
도 3은 본 발명의 실시예에 따라, 고장 감지시 서비스단위로 자동 절체를 수행하기 위한 예시 흐름도이다.
도 4는 본 발명의 실시예에 따라, 고장 감지시 자동 절체할 서비스가 없는 경우 서비스 추가를 수행하기 위한 예시 흐름도이다.
이하에서는, 첨부된 도면들을 참조하여 본 발명의 실시예에 따른 서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법에 대해 보다 상세하게 설명하기로 한다. 본 발명을 설명하는데 있어서 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략하는 것으로 한다.
본 발명은 서비스 단위 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법으로서, 시스템의 고장판단 및 고장복구를 서비스별로 수행하기 위해 로컬 노드의 상태를 주기적으로 감시하고, 고장판단시 실행 우선순위가 가장 빠른 서비스나 노드를 선택하여 설정 상태 정보를 생성하고, 생성된 설정 상태 정보를 해당 노드에 제공함으로써 서비스단위로 고장 복구가 이루어지게 자동 제어할 수 있다.
본 발명에 따른 무기체계용 분산식 다계층 시스템은, 로컬 노드의 가용 상태 및 운용 상태를 감시하는 로컬 상태감시 서비스와, 전체 시스템의 상태 감시 정보를 취합하여 관리하고 상태 변경시 이벤트를 발생시키는 상태감시 정보관리 서비스와, 상태 변경시 변경된 상태 정보와 현재 설정 상태를 비교하여 고장상황을 인지하는 고장상황 인지 서비스와, 고장발생에 대응하여 고장상황을 복구하기 위한 제어명령을 생성하는 고장상황 복구 서비스와, 서비스 상태 제어 명령 정보를 각 로컬 노드에 대한 상태 제어 명령으로 변환시켜 제공하는 상태제어 정보관리 서비스와, 실제 각 로컬 노드의 상태를 제어하는 로컬 상태제어 서비스를 포함하여 이루어진다.
여기에서, 로컬 상태감시 서비스와 로컬 상태제어 서비스는 무기체계용 분산식 다계층 시스템의 로컬 서비스 계층에 위치하고, 상태감시 정보관리 서비스와 상태제어 정보관리 서비스는 상기 시스템의 분산 서비스 계층에 포함되고, 고장상황 인지 서비스와 고장상황 복구 서비스는 상기 시스템의 통합 서비스 계층에 속한다.
이러한 다계층 시스템 구조에 의하여, 실시간성, 복잡성, 고신뢰성의 요구에 부합하는 개방형 구조를 취할 수 있고, 세부단위의 모듈화를 통해 재사용성을 높일 수 있고, 서비스단위로 운용함으로써 각 단위모듈에 대한 유연성을 높일 수 있다.
이와 같은 다계층의 서비스들 간에는 메시지를 서로 송수신하는 방식으로 필요한 정보를 주고받도록 운영함으로써, 서비스 상호 간에 결합도와 의존도를 최소화하였다. 각 로컬 노드는 자신이 원하는 데이터를 발간(publish) 또는 구독(subscribe)하는 방식으로 데이터 교환을 수행할 수 있다.
노드 단위의 이중화에서는 하드웨어 고장시 노드 단위로 절체가 수행된다. 고장의 원인이 대부분 하드웨어인 경우에는 노드 단위의 절체가 바람직할 수 있다. 한편, 컴포넌트 단위의 이중화에서는 고장 발생시 소프트웨어 컴포넌트 단위로 절체가 수행된다. 고장 원인이 하드웨어 고장이 아닌 자원의 가용률 부족과 같은 원인으로 운용불가 상태인 경우에는, 소프트웨어 컴포넌트의 다른 노드의 운용을 유도함으로써 극복이 가능하다. 이와 같이, 이중화 방식 운용시 고장 복구의 단위를 결정하는 것은 중요하다.
구체적으로, 고장복구의 단위가 크면 클수록 절체시 고장위험이 높아지고, 중복운용시 자원의 부담이 가중된다. 반면, 고장복구의 단위가 작으면 작을수록 고장 부분을 제외한 부분의 정상동작이 가능하고, 중복운용시 자원의 부담이 작다는 장점이 있다. 그러나 고장복구의 단위가 작은 경우, 고장판단을 위해 각각의 단위에 대한 상태감시가 필수적으로 요구되므로 이에 따른 관리 부하가 커질 수 있다.
이에, 본 발명의 실시예들에서는 서비스 단위로 절체 운용이 이루어지도록 구현함으로써, 고장상황 판단이 작은 단위로 이루어질 수 있고 일부에 고장이 발생하더라도 전체 시스템의 가동률은 높게 유지될 수 있도록 하였다.
이하, 도 1 및 도 2를 참조하여, 본 발명의 실시예에 따른 서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구방법의 과정을 보다 상세하게 기술하면 다음과 같다.
먼저, 무기체계용 분산식 다계층 시스템에서 각 로컬 노드에 대한 가용 상태 정보 및 서비스 상태 정보를 주기적으로 수신한다(S10). 예를 들어, 로컬 상태 감시 서비스에서는 시스템 소프트웨어 계층을 통해 하부의 구성장치와 자원에 접근하고, 이에 의하여 로컬 노드상의 서비스와 자원의 상태를 감시하고 정보를 수집한다.
서비스 상태 감시와 관련하여, 상기 로컬 상태 감시 서비스는 기 설정된 시간이내에 상기 서비스 상태 정보가 수신되지 않으면, 해당 로컬 노드의 서비스 가용 상태를 비가용 상태로 전환시킬 수 있다. 여기에서, 기 설정된 시간은 사용자 입력을 통해서 또는 설계 초기에 미리 설정될 수 있으며, 예를 들어 수초~수분내로 설정될 수 있다.
자원 상태 감시와 관련하여, 상기 로컬 상태 감시 서비스는 로컬 노드 내의 가용 자원 중 현재 운용 점유율을 확인한다. 그런 다음 기정의된 시스템 자원 가용률 허용치와 비교하여 해당 노드의 가용 상태가, 가용인지, 기능저하인지, 비가용인지를 판단할 수 있다.
이와 같이 수집된 가용 상태 정보 및 서비스 상태 정보는 미리 정해진 주기마다 상기 기술한 분산계층에 제공된다.
수신된 상태 정보들, 즉 상기 가용 상태 정보 및 서비스 상태 정보는 일정 시간 간격으로 취합되어, 상태 정보가 변경되면 변경된 상태 정보를 현재 설정 상태 정보와 비교하여 해당 로컬 노드에 대한 서비스의 고장 여부를 판단한다(S20).
예를 들어, 분산계층의 상태감시 정보관리 서비스는 상기 로컬 상태감시 서비스에서 발생되는 각 로컬 노드의 상태 감시 정보를 모두 수신하여 취합하고 관리한다. 또한, 상태감시 정보관리 서비스는 취합된 상태 감시 정보들을 제공하여 다른 서비스가 전체 노드의 가용상태 정보와 운용상태 정보를 이용할 수 있게 한다.
상태감시 정보관리 서비스는, 서비스의 고장 여부를 판단하기 위해, 상기 각 로컬 노드에 대한 가용 자원의 현재 운용 점유율을 확인하고, 확인된 현재 운용 점유율을 기준 가용률과 비교하고, 비교 결과에 따라 상기 상태 정보의 변경 여부를 결정할 수 있다.
상태감시 정보관리 서비스는, 현재 운용 점유율과 기준 가용률을 비교한 결과, 변경된 상태 정보가 현재 설정 상태 정보와 불일치하면 해당 노드에 대한 서비스의 고장으로 판단할 수 있다. 예를 들어, 노드 n에서 실행되고 있는 서비스 An의 상태가 가용 상태에서 비가용 상태로 변경된 경우, 서비스 An의 설정 상태 정보를 참조하였을때 가용 상태여야 하는데도 현재 상태가 비가용이면 고장으로 판단할 수 있다. 고장이 발생하면, 고장상황 복구 서비스에서 고장 이벤트를 수신한다.
고장 이벤트가 발생하면(S30), 고장 감지된 제1 서비스를 대체할 제2 서비스를 결정한다(S40).
도 3 및 도 4를 참조하여, 대체할 제2 서비스를 결정하는 과정을 보다 구체적으로 기술하면 다음과 같다.
도 3에 도시된 바와 같이, 판단(S41) 결과 대체할 제2 서비스가 있는 경우, 대체가능한 서비스들 중 실행 우선순위가 가장 빠른 서비스를 상기 제2 서비스로 결정한다(S42).
예를 들어, 실행 우선순위의 값이 pi인 고장 감지된 서비스 Api의 대체 서비스로 Apj를 선택한다. 여기에서, 대체될 서비스 Apj의 실행 우선순위는 고장 감지된 서비스 Api의 실행 우선순위보다는 낮으면서 다른 것들(An) 중 가장 높은 실행 우선순위를 갖는 서비스이다. 여기에서, 서비스의 실행 우선순위는 예를 들어, CPU, 메모리, 저장장치의 현재 운용 상태 등의 정보에 근거하여 가용률이 높은 순서대로 설정될 수 있다. 대체될 서비스 Apj에 대한 대체가 필요하면(S43), 단계(S41)로 복귀하여 대응되는 대체 서비스를 결정하는 과정을 반복한다.
도 3에서, 판단(S41) 결과 대체할 제2 서비스가 없는 경우, 이하에 기술되는 바와 같이, 도 4에 도시된 서비스 추가 절차를 실행한다(S50).
도 4에 도시된 바와 같이, 고장 감지된 제1 서비스를 대체할 서비스가 없으면, 가용 노드가 있으면(S52) 가용 노드 중 서비스 실행 우선순위가 가장 빠른 노드를 선택한다(S53). 예를 들어, 고장 감지된 서비스 An이 Active 서비스이면 Standby 서비스 중 대체 운용을 선택하고, 고장 감지된 서비스 An이 Standby 서비스이면 그보다 하위수준에서 대체 운용을 선택하거나, 나머지 노드들 중에서 자원 가용률이 가장 높은 노드를 선택한다. 그런 다음, 상기 선택된 노드에서 실행될 상기 제2 서비스의 실행 정보를 생성한다(S54).
한편, 도 3에서의 판단(S41) 결과 대체할 제2 서비스가 없고, 도 4에서의 판단(S52) 결과 가용 노드도 없으면(S52), 고장 감지된 제1 서비스에 대한 축소 운용을 수행한다(S55).
다시 도 1을 참조하면, 이와 같이 결정된 제2 서비스에 대하여 설정 상태 정보를 생성하고, 생성된 설정 상태 정보를 해당 로컬 노드에 제공하여(S60). 고장 감지된 서비스의 복구를 실행한다.
예를 들어, 중복운용되는 노드 수가 n개이고 고장 감지된 서비스 수가 1개이면, n-1번의 연속적인 제2 서비스에 대한 설정 상태 정보의 생성이 있고, 한 번의 서비스 추가 절차의 실행이 수행될 수 있다.
고장 감지된 서비스가 복구되면, 로컬 서비스 계층의 로컬 상태제어 서비스는 상기 생성된 설정 상태 정보를 수신하고, 시스템 제어를 통해서 서비스의 실제 운용 상태를 제어할 수 있다.
이상에서와 같이, 본 발명의 상세한 설명에서는 서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구방법의 실시 예들에 관하여 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 아니되며 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 범위에 의해 정해져야 한다.
이상, 본 발명의 실시예에 따른 서비스 단위 기반의 무기체계용 분산식 다계층 시스템의 고장 복구방법에 의하면, 각 로컬 노드의 상태 정보들을 주기적으로 수신하고, 수신된 상태 정보가 변경되면 해당 노드에 대한 서비스의 고장 여부를 판단하고, 서비스 고장시 대체할 서비스를 결정하여 설정 상태 정보를 생성함으로써, 시스템 고장의 판단 및 복구를 서비스 단위로 수행되도록 하여 시스템의 신뢰성이 향상시킬 수 있다. 또한, 서비스시스템의 범용성을 고려하여 동기식 이중화 방식과 비동기식 이중화 방식이 모두 적용될 수 있고, 고장상황 인지 및 고장복구의 단위가 서비스 단위로 절체 운용되도록 구현함으로써 시스템의 활용성을 높일 수 있다. 나아가, 고장 감지된 서비스를 대체할 서비스가 없는 경우, 가용 노드 중 실행 우선순위가 가장 빠른 노드를 선택하여서 대체할 서비스의 실행 정보를 생성하거나 고장 감지된 서비스에 대한 축소 운용을 수행함으로써, 시스템의 고장률을 감소시키는 효과를 제공한다.

Claims (7)

  1. 무기체계용 분산식 다계층 시스템에서 각 로컬 노드에 대한 가용 상태 정보 및 서비스 상태 정보를 주기적으로 수신하는 단계;
    상기 무기체계용 분산식 다계층 시스템에 의하여, 상기 수신된 상태 정보들을 일정 시간 간격으로 취합하고, 상기 상태 정보가 변경되면 변경된 상태 정보를 현재 설정 상태 정보와 비교하여 해당 로컬 노드에 대한 서비스의 고장 여부를 판단하는 단계;
    고장 이벤트 발생시, 상기 무기체계용 분산식 다계층 시스템에 의하여, 고장 감지된 제1 서비스를 대체할 제2 서비스를 결정하는 단계; 및
    상기 무기체계용 분산식 다계층 시스템에 의하여, 상기 제2 서비스에 대한 설정 상태 정보를 생성하고, 생성된 설정 상태 정보를 해당 로컬 노드에 제공하는 단계를 포함하고,
    상기 제2 서비스를 결정하는 단계는,
    상기 고장 감지된 제1서비스가 Active 서비스이면 Standby 서비스 중에서 대체 운용을 선택하고, 상기 고장 감지된 제1서비스가 Standby 서비스이면 그 보다 하위 레벨의 서비스 중에서 대체 운용을 선택하는 과정과, 그리고,
    상기 제2 서비스에 대한 대체가 필요한 경우 상기 제2 서비스를 대체할 제3서비스를 결정하는 과정을 더 포함하는 것을 특징으로 하는
    서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법.
  2. 제1항에 있어서,
    상기 제2 서비스를 결정하는 단계는,
    대체가능한 서비스들 중 실행 우선순위가 가장 빠른 서비스를 상기 제2 서비스로 결정하는 단계인 것을 특징으로 하는
    서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법.
  3. 제1항에 있어서,
    상기 제2 서비스를 결정하는 단계는,
    상기 제1 서비스를 대체할 서비스가 없으면, 가용 노드 중에서 서비스 실행 우선순위가 가장 빠른 노드를 선택하는 단계; 및
    상기 선택된 노드에서 실행될 상기 제2 서비스의 실행 정보를 생성하는 단계를 포함하는 것을 특징으로 하는
    서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법.
  4. 제3항에 있어서,
    상기 제1 서비스를 대체할 서비스와 상기 가용 노드가 없으면, 상기 무기체계용 분산식 다계층 시스템에 의하여, 상기 고장 감지된 제1 서비스에 대한 축소 운용을 수행하는 단계를 포함하는
    서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법.
  5. 제1항에 있어서,
    상기 시스템의 고장 여부를 판단하는 단계는
    상기 각 로컬 노드에 대한 가용 자원의 현재 운용 점유율을 확인하고, 확인된 현재 운용 점유율을 기준 가용률과 비교하고, 비교 결과에 따라 상기 상태 정보의 변경 여부를 결정하는 단계를 포함하는 것을 특징으로 하는
    서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법.
  6. 제1항에 있어서,
    상기 무기체계용 분산식 다계층 시스템에 의하여, 상기 서비스 상태 정보가 기 설정된 시간내에 수신되지 않으면, 해당 로컬 노드의 서비스 가용 상태를 비가용 상태로 전환하는 단계를 포함하는 것을 특징으로 하는
    서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법.
  7. 제1항에 있어서,
    상기 시스템의 고장 여부를 판단하는 단계는
    상기 무기체계용 분산식 다계층 시스템에 의하여, 상기 비교 결과, 변경된 상태 정보가 현재 설정 상태 정보와 불일치하면 해당 노드에 대한 서비스의 고장으로 판단하는 것을 특징으로 하는
    서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법.
KR1020130029959A 2013-03-20 2013-03-20 서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법 KR101447024B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130029959A KR101447024B1 (ko) 2013-03-20 2013-03-20 서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130029959A KR101447024B1 (ko) 2013-03-20 2013-03-20 서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법

Publications (2)

Publication Number Publication Date
KR20140115186A KR20140115186A (ko) 2014-09-30
KR101447024B1 true KR101447024B1 (ko) 2014-10-07

Family

ID=51758597

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130029959A KR101447024B1 (ko) 2013-03-20 2013-03-20 서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법

Country Status (1)

Country Link
KR (1) KR101447024B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101609228B1 (ko) * 2015-02-26 2016-04-05 (주) 피플아이 실시간 이상감지 및 대처 소프트웨어가 탑재된 분산디바이스 구조 지능형 시스템

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102497857B1 (ko) * 2017-12-11 2023-02-07 대우조선해양 주식회사 이중화 신호처리 방식을 이용한 음향측심기
KR102517831B1 (ko) * 2022-11-30 2023-04-04 한화시스템 주식회사 미션 크리티컬 시스템 환경에서의 소프트웨어 관리방법 및 그 시스템

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040076385A (ko) * 2003-02-25 2004-09-01 엘지엔시스(주) 고가용성 시스템의 파일시스템 미러링장치 및 미러링방법
KR20060008891A (ko) * 2003-05-15 2006-01-27 인터내셔널 비지네스 머신즈 코포레이션 분산 웹 서비스 컨텍스트에서 자발적인 장애 극복
KR20060068873A (ko) * 2004-12-17 2006-06-21 엘지엔시스(주) 장애 발생에 대한 복구 수행률 향상 방법 및 이를지원하는 클러스터 시스템
KR100832543B1 (ko) * 2006-12-08 2008-05-27 한국전자통신연구원 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040076385A (ko) * 2003-02-25 2004-09-01 엘지엔시스(주) 고가용성 시스템의 파일시스템 미러링장치 및 미러링방법
KR20060008891A (ko) * 2003-05-15 2006-01-27 인터내셔널 비지네스 머신즈 코포레이션 분산 웹 서비스 컨텍스트에서 자발적인 장애 극복
KR20060068873A (ko) * 2004-12-17 2006-06-21 엘지엔시스(주) 장애 발생에 대한 복구 수행률 향상 방법 및 이를지원하는 클러스터 시스템
KR100832543B1 (ko) * 2006-12-08 2008-05-27 한국전자통신연구원 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101609228B1 (ko) * 2015-02-26 2016-04-05 (주) 피플아이 실시간 이상감지 및 대처 소프트웨어가 탑재된 분산디바이스 구조 지능형 시스템

Also Published As

Publication number Publication date
KR20140115186A (ko) 2014-09-30

Similar Documents

Publication Publication Date Title
US8719624B2 (en) Redundant configuration management system and method
US20200257593A1 (en) Storage cluster configuration change method, storage cluster, and computer system
US11307943B2 (en) Disaster recovery deployment method, apparatus, and system
CN103580902B (zh) 一种计算机信息系统及其动态容灾方法
CN104133734B (zh) 分布式综合模块化航空电子系统混合式动态重构系统与方法
US20020152425A1 (en) Distributed restart in a multiple processor system
JP2005209201A (ja) 高可用性クラスタにおけるノード管理
KR20030034411A (ko) 클러스터 컴퓨터 시스템의 소프트웨어 가용도 개선 방법및 그 장치
EP2224341B1 (en) Node system, server switching method, server device, and data transfer method
JP4491482B2 (ja) 障害回復方法、計算機、クラスタシステム、管理計算機及び障害回復プログラム
KR101447024B1 (ko) 서비스 기반의 무기체계용 분산식 다계층 시스템의 고장 복구 방법
CN101689114A (zh) 用于集群软件实体的动态cli映射
WO2006005251A1 (fr) Procede et systeme de realisation de la fonction de commutation dans un systeme de communication
CN1862499A (zh) 多处理器设备单元主备保护方法
CN105959145B (zh) 一种适用高可用性集群的并行管理服务器的方法及系统
US20050234919A1 (en) Cluster system and an error recovery method thereof
JP5285044B2 (ja) クラスタシステム復旧方法及びサーバ及びプログラム
EP2157805A2 (en) Multiple-protection system and control method in a communication device
JP2009003537A (ja) 計算機
KR20140045538A (ko) 여분의 컴포넌트들에게 급전하기 위한 시스템 및 방법
JP2014048933A (ja) プラント監視システム、プラント監視方法およびプラント監視プログラム
CN113220509B (zh) 一种双组合交替倒班系统及方法
Devi et al. Multi level fault tolerance in cloud environment
KR20140140719A (ko) 가상 머신 동기화 장치 및 시스템과 이를 이용한 장애 처리 방법
KR100832543B1 (ko) 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant