KR101592332B1 - Partition based system and high-speed partition re-driving method thereof - Google Patents

Partition based system and high-speed partition re-driving method thereof Download PDF

Info

Publication number
KR101592332B1
KR101592332B1 KR1020140086956A KR20140086956A KR101592332B1 KR 101592332 B1 KR101592332 B1 KR 101592332B1 KR 1020140086956 A KR1020140086956 A KR 1020140086956A KR 20140086956 A KR20140086956 A KR 20140086956A KR 101592332 B1 KR101592332 B1 KR 101592332B1
Authority
KR
South Korea
Prior art keywords
partition
primary
shadow
state
primary partition
Prior art date
Application number
KR1020140086956A
Other languages
Korean (ko)
Other versions
KR20160007041A (en
Inventor
김용현
안미림
진현욱
강세준
조현철
이상헌
Original Assignee
국방과학연구소
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국방과학연구소 filed Critical 국방과학연구소
Priority to KR1020140086956A priority Critical patent/KR101592332B1/en
Publication of KR20160007041A publication Critical patent/KR20160007041A/en
Application granted granted Critical
Publication of KR101592332B1 publication Critical patent/KR101592332B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/301Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is a virtual computing platform, e.g. logically partitioned systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

본 발명은 프라이머리 파티션에 고장이 발생한 경우 쉐도우 파티션으로 임무 핸드오버를 수행하여 파티션의 재구동 시간 지연을 해소할 수 있는 파티션 기반 시스템의 및 그의 파티션 재구동 방법에 관한 것으로, 기본 파티션인 프라이머리 파티션; 확장 파티션인 쉐도우 파티션; 및 내부 통신을 통해 파악된 파티션의 상태에 따라 각 파티션으로 상태 천이 명령을 전송하여 시스템 임무를 수행하도록 제어하는 헬스 모니터;로 구성되어, 상기 헬스 모니터는 프라이머리 파티션이 고장에 의해 비정상적으로 종료된 상태이고 쉐도우 파티션이 대기상태인 경우 프라이머리 파티션과 쉐도우 파티션간 파티션 임무 핸드오버를 수행하여 시스템 임무의 연속성을 보장한다. The present invention relates to a partition-based system and its partition re-driving method capable of solving a delay time of re-driving a partition by performing a mission handover to a shadow partition when a failure occurs in a primary partition, partition; An extended partition, a shadow partition; And a health monitor for transmitting a state transition command to each partition according to a state of a partition determined through internal communication to control a system task to be performed, wherein the health monitor monitors the state of the primary partition abnormally And a shadow partition is idle, performs partition task handover between the primary partition and the shadow partition to ensure continuity of system mission.

Description

파티션 기반 시스템 및 그의 파티션 고속 재구동 방법{PARTITION BASED SYSTEM AND HIGH-SPEED PARTITION RE-DRIVING METHOD THEREOF}[0001] PARTITION BASED SYSTEM AND HARD-SPEED PARTITION RE-DRIVING METHOD THEREOF [0002]

본 발명은 파티션 기반 시스템에서 파티션의 헬스 모니터를 통해 파티션의 고속 재구동을 수행할 수 있는 파티션 기반 시스템 및 그의 파티션 재구동 방법에 관한 것이다. BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a partition-based system capable of performing high-speed restart of a partition through a health monitor of a partition in a partition-based system, and a method of re-partitioning the partition.

일반적으로 하드디스크에는 시스템의 여러 운영 체제가 설치될 수 있다. 이에 따라 하나의 물리적 디스크를 여러 개의 논리적 디스크로 분할하는 기술이 필요하게 되었는데 이것이 바로 파티션이다. 이러한 파티션의 종류로는 프라이머리 파티션, 확장 파티션 및 논리 파티션 등이 있다.Typically, the hard disk can have multiple operating systems installed on the system. As a result, a technique for partitioning one physical disk into a plurality of logical disks becomes necessary, which is a partition. These types of partitions include primary partitions, extended partitions, and logical partitions.

상기 프라이머리 파티션 (Primary Partition)은 시스템의 임무를 수행하는 임무 프로세스를 포함하는 기본 파티션이고, 확장 파티션 (Extended Partition) 및 논리 파티션 (Logical Partition)은 기본 파티션 이외의 파티션을 포함한다. The primary partition is a primary partition including a mission process for performing a task of the system, and an extended partition and a logical partition include partitions other than the primary partition.

파티션 기반 시스템은 상기와 같은 적어도 하나 이상의 파티션을 포함하여 시스템의 임무를 수행하는 것으로, 무인 무기, 항공 같은 지속적으로 운영되어야 하는 군사 시스템에 적용될 수 있다. The partition-based system includes at least one or more partitions as described above to perform the task of the system, and can be applied to a military system that must be continuously operated, such as an unmanned weapon or aviation.

그런데, 종래의 파티션 기반 시스템은 프라이머리 파티션을 통해 시스템 임무를 수행할 때 고장이 발생되면 프라이머리 파티션의 고장 상태를 파악하여 다시 구동해야하기 때문에 파티션의 재구동 시간이 오래 지연되는 문제가 있다. 이러한 파티션의 재구동 시간 지연은 무인 무기, 항공 같은 지속적으로 운영되어야 하는 군사 시스템의 경우에는 임무를 수행하지 못하게 되는 결과를 초래할 수 있다. However, in the conventional partition-based system, if a failure occurs in performing a system mission through the primary partition, the failure state of the primary partition must be detected and then re-driven. The delay in re-driving of these partitions can result in the failure of the military system to operate continuously, such as unmanned weapons and aviation.

본 발명의 목적은 파티션 기반의 시스템에서 헬스 모니터를 통해 파티션의 상태 확인 및 고속 재구동을 가능하게 하여 시스템의 지속적 운영을 보장할 수 있는 파티션 기반 시스템의 및 그의 파티션 재구동 방법을 제공하는데 있다. SUMMARY OF THE INVENTION It is an object of the present invention to provide a partition-based system and a method for re-partitioning a partition-based system capable of confirming the state of partitions through a health monitor and fast restarting the system,

본 발명의 다른 목적은 프라이머리 파티션에 고장이 발생한 경우 쉐도우 파티션으로 파티션 임무 핸드오버를 수행하여 파티션의 재구동 시간 지연을 해소할 수 있는 파티션 기반 시스템의 및 그의 파티션 재구동 방법을 제공하는데 있다. Another object of the present invention is to provide a partition-based system and a method for re-partitioning a partition-based system that can perform a partition task handover to a shadow partition when a failure occurs in a primary partition,

상기와 같은 목적을 달성하기 위하여 본 발명의 실시예에 따른 파티션 기반 시스템은, 기본 파티션인 프라이머리 파티션; 확장 파티션인 쉐도우 파티션; 및 내부 통신을 통해 파악된 파티션의 상태에 따라 각 파티션으로 상태 천이 명령을 전송하여 시스템 임무를 수행하도록 제어하는 헬스 모니터;로 구성되어, 상기 헬스 모니터는 프라이머리 파티션이 동작상태가 아니고 쉐도우 파티션이 대기상태인 경우, 프라이머리 파티션과 쉐도우 파티션간 파티션 임무 핸드오버를 수행한다.In order to achieve the above object, a partition-based system according to an embodiment of the present invention includes a primary partition, which is a primary partition; An extended partition, a shadow partition; And a health monitor for transmitting a state transition command to each partition according to a state of a partition determined through internal communication to control a system task to be performed, wherein the health monitor includes a primary partition and a shadow partition, In the standby state, a partition task handover between the primary partition and the shadow partition is performed.

상기 헬스 모니터는 프라이머리 파티션 및 쉐도우 파티션과 내부통신을 수행하여 각 파티션의 상태정보를 수신하는 내부통신 프로세서; 및 내부통신을 통해 수신한 상태정보를 근거로 파티션의 상태를 감지하여, 프라이머리 파티션의 비정상 종료가 감지될 때 상기 프라이머리 파티션과 쉐도우 파티션간 파티션 임무 핸드오버를 수행하는 핸드 오버 프로세스;를 포함할 수 있다. An internal communication processor for performing internal communication with the primary partition and the shadow partition to receive status information of each partition; And a handover process of detecting a state of the partition based on the state information received through the internal communication and performing a partition task handover between the primary partition and the shadow partition when abnormal termination of the primary partition is detected can do.

상기와 같은 목적을 달성하기 위하여 본 발명의 실시예에 따른 파티션 기반 시스템의 파티션 고속 재구동 방법은, 프라이머리 파티션에서 임무 프로세스를 실행하는 단계; 임무 프로세스를 실행중에 내부 통신을 통해 프라이머리 파티션과 쉐도우 파티션으로 상태정보를 요청하는 단계; 프라이머리 파티션과 쉐도우 파티션으로부터 수신된 상태정보를 근거로 각 파티션의 상태를 확인하는 단계; 상기 프라이머리 파티션에 고장이 감지되면 프라이머리 파티션과 쉐도우 파티션간 파티션 임무 핸드오버를 수행하는 단계;를 포함한다.According to an aspect of the present invention, there is provided a method of re-partitioning a partition based system, the method comprising: executing a mission process in a primary partition; Requesting status information from a primary partition and a shadow partition through internal communication during execution of a mission process; Checking status of each partition based on status information received from a primary partition and a shadow partition; And performing partition task handover between the primary partition and the shadow partition when a failure is detected in the primary partition.

상기 파티션 임무 핸드오버를 수행하는 단계는, 쉐도우 파티션으로 프로세스 실행 명령을 전달하는 단계; 프라이머리 파티션으로 재시작 명령을 전달하여 상기 프라이머리 파티션을 대기 상태로 천이시키는 단계; 및 상기 쉐도우 파티션은 프라이머리 파티션으로 변경시키고 프라이머리 파티션은 쉐도우 파티션으로 변경시키는 단계;를 포함할 수 있다. Wherein performing the partition task handover comprises: passing a process execution command to a shadow partition; Transitioning the primary partition to a standby state by passing a restart command to the primary partition; And changing the shadow partition to a primary partition and the primary partition to a shadow partition.

본 발명은 파티션 기반의 시스템에서 헬스 모니터를 통해 각 파티션의 상태 확인 및 파티션간 파티션 임무 핸드오버를 수행함으로써 프라이머리 파티션에서 고장이 발생되더라도 파트션의 고속 재구동을 가능하게 되어 시스템의 지속적 운영을 보장할 수 있는 효과가 있다. 이와같은 본 발명은 무인 무기, 항공 같은 지속적으로 운영되어야 하는 시스템에 적용할 경우에는 고장이 발생하여도 고속 재구동이 가능하기 때문에 효과적으로 임무를 수행할 수 있으며, 공장 생산 라인 등에 적용할 경우에는 고장이 발생해도 라인이 멈추지 않아 생산량 감소를 줄일 수 있으며, 기술개발 측면에서는 파티션 기반 시스템에서 다양한 고장 감지 및 핸드 오버 기술과 함께 사용할 수 있는 효과가 있다. In the present invention, the status of each partition is checked through the health monitor in the partition-based system and the partition task handover is performed between the partitions, so that even if a failure occurs in the primary partition, There is an effect that can be guaranteed. When the present invention is applied to a system that is to be continuously operated, such as an unmanned weapon or aviation, it is possible to perform the task efficiently because the high-speed restart can be performed even if a failure occurs. In case of applying to a factory production line, The line can not be stopped to reduce the production decrease, and in terms of technology development, it can be used with various fault detection and handover technology in partition-based system.

도 1은 본 명세서의 실시예에 따른 파티션 기반 시스템의 블럭도.
도 2는 본 발명에 따른 파티션 기반 시스템에서 파티션이 변화할 수 있는 상태를 나타낸 상태 천이도.
도 3은 본 명세서의 실시예에 따른 파티션 기반 시스템에서 파티션들의 상태에 따른 헬스 모니터의 동작을 나타낸 흐름도.
도 4는 본 발명의 실시예에 따른 파티션 기반 시스템에서 고장 발생시 핸드 오버를 수행하는 동작을 나타낸 신호 흐름도.
1 is a block diagram of a partition-based system according to an embodiment of the present disclosure;
FIG. 2 is a state transition diagram illustrating a state in which a partition can be changed in a partition-based system according to the present invention; FIG.
FIG. 3 is a flowchart illustrating an operation of a health monitor according to the status of partitions in a partition-based system according to an embodiment of the present invention; FIG.
4 is a signal flow diagram illustrating an operation for performing a handover in the event of a failure in a partition-based system according to an embodiment of the present invention.

호스트 운영체제의 구동이 가능한 컴퓨터 또는 임베디드(Embedded) 보드, 하이퍼바이저, 프라이머리 파티션 및 쉐도우 파티션, 헬스모니터를 포함하여 구성될 수 있다. A computer capable of running the host operating system or an embedded board, a hypervisor, a primary partition and a shadow partition, and a health monitor.

도 1은 본 발명의 실시예에 따른 파티션 기반 시스템의 구조이다.FIG. 1 illustrates a structure of a partition-based system according to an embodiment of the present invention.

도 1에 도시된 바와같이, 본 발명에 따른 파티션 기반 시스템은 프라이머리 파티션(100), 쉐도우 파티션(200), 헬스 모니터(300) 및 하이퍼바이저(400)를 포함하여 구성된다. 또한, 호스트 운영체제의 구동이 가능한 하드웨어(컴퓨터 또는 임베디드 보드를 포함한다. 1, a partition-based system according to the present invention includes a primary partition 100, a shadow partition 200, a health monitor 300, and a hypervisor 400. [ Also, hardware (including a computer or an embedded board) capable of running the host operating system.

프라이머리 파티션(100)은 기본 파티션으로, 프라이머리 내부 통신 데몬(101)과 임무 프로세스(102)를 포함한다. 프라이머리 파티션(100)은 임무 프로세스(102)를 통해 시스템의 임무를 수행하는 파티션이다. The primary partition 100 is a primary partition, which includes a primary internal communication daemon 101 and a mission process 102. The primary partition 100 is a partition that performs the task of the system through the mission process 102.

쉐도우 파티션(200)은 확장 파티션으로 쉐도우 내부 통신 데몬(201)을 포함한다. 상기 쉐도우 파티션(200)은 프라이머리 파티션(100)에 고장이 발생한 경우 프라이머리 파티션의 임무를 대신 수행하는 파티션이다. The shadow partition 200 includes the shadow internal communication daemon 201 as an extended partition. The shadow partition 200 is a partition that performs a task of a primary partition instead of a primary partition when a failure occurs in the primary partition 100.

헬스 모니터(300)는 핸드오버 프로세스(301)와 내부 통신 프로세스(302)를 포함한다. 헬스 모니터(300)는 내부 통신을 통해 각 파티션(100, 200)으로부터 상태 정보를 입력받아, 각 파티션(100, 200)의 상태에 따른 상태 천이 명령을 전달하는 역할을 수행한다. 각 파티션(100, 200)과 헬스 모니터(300)의 내부 통신은 내부 통신 데몬(101, 201)과 내부 통신 프로세스(301)사이에서 이루어진다. The health monitor 300 includes a handover process 301 and an internal communication process 302. The health monitor 300 receives status information from each of the partitions 100 and 200 via internal communication and transmits a status transition command according to the status of the partitions 100 and 200. Internal communication between the partitions 100 and 200 and the health monitor 300 takes place between the internal communication daemons 101 and 201 and the internal communication process 301.

상기 하이퍼바이저(400)는 프로세서나 메모리와 같은 컴퓨터 자원에 서로 다른 각종 운영 체계(OS)의 접근 방법을 통제하는 소프트웨어이다. The hypervisor 400 is software that controls access methods of various operating systems (OS) to computer resources such as a processor and a memory.

도 2는 본 발명에 따른 파티션 기반 시스템에서 파티션이 변화할 수 있는 상태를 나타낸 상태 천이도이다. FIG. 2 is a state transition diagram illustrating a state in which a partition may change in a partition-based system according to the present invention.

도 2를 참조하면, 프라이머리 파티션(100)과 쉐도우 파티션(200)은 총 5가지의 상태(동작, 대기, 비정상종료, 정상종료 및 재시작)를 가지는데, 대기 상태를 제외한 모든 상태의 천이는 헬스 모니터(300)의 핸드 오버 프로세스(301)가 담당한다.Referring to FIG. 2, the primary partition 100 and the shadow partition 200 have a total of five states (operation, standby, abnormal termination, normal termination and restart) Handover process 301 of the health monitor 300 takes charge of.

동작 상태(s201)는 파티션에서 임무 프로세스(102)가 작동중인 상태를 말한다. 본 발명에 따른 파티션 기반 시스템에서 프라이머리 파티션(100)만 동작 상태로 존재할 수 있다. 헬스 모니터(300)의 핸드 오버 프로세스(301)는 내부통신 프로세스(302)를 통해 각 파티션(100, 200)의 상태 정보를 입력받아 각 파티션(100, 200)의 상태를 감지하고, 그에 따른 상태 천이 명령을 전달한다. 즉, 동작상태(s201)에서 파티션의 고장이 감지되면 파티션을 비정상 종료(s203)로 천이시키며, 임무 프로세스(102)가 정상적으로 임무를 마친 경우에는 정상종료 상태(s204)로 천이시킨다.The operating state s201 refers to the state in which the mission process 102 is operating in the partition. In the partition-based system according to the present invention, only the primary partition 100 can be in an operating state. The handover process 301 of the health monitor 300 receives the status information of each partition 100 and 200 through the internal communication process 302 and detects the status of each partition 100 and 200, Transition command is transmitted. That is, if a failure of the partition is detected in the operation state s201, the partition is transitioned to the abnormal end (s203), and if the mission process 102 is normally completed, the transition is made to the normal end state (s204).

대기 상태(s202)는 파티션은 작동중이지만 임무 프로세스(102)는 작동하지 않는 상태를 말한다. 핸드 오버 프로세스(301)는 초기 시스템 구동 시, 대기 상태의 파티션들 중 하나의 파티션(예: 프라이머리 파티션)을 동작 상태(s201)로 천이시킨다. 또한 동작 상태(s201)인 프라이머리 파티션(100)에 고장이 발생했을 경우 핸드 오버 프로세스(301)는 쉐도우 파티션(200)을 대기 상태(s202)에서 동작 상태(s201)로 상태 천이시킨다.The standby state s202 refers to a state in which the partition is in operation but the mission process 102 is inoperative. The handover process 301 transitions one partition (e.g., primary partition) of the standby partitions to the operating state s201 during the initial system operation. Also, when a failure occurs in the primary partition 100, which is the operation state s201, the handover process 301 transitions the state of the shadow partition 200 from the standby state s202 to the operation state s201.

비정상종료 상태(s203)는 파티션에 고장이 발생하여 비정상 종료된 상태를 말한다. 비정상종료 상태는 동작 상태(s201) 또는 대기 상태(s202)에서 파티션에 고장이 발생한 경우로, 핸드 오버 프로세스(301)가 상태천이를 담당하며 프라이머리 파티션과 쉐도우 파티션 모두 상태변경이 일어날 수 있다.The abnormal termination state (s203) refers to a state in which a failure has occurred in the partition and abnormally terminated. The abnormal termination state is a case where a failure occurs in the partition in the operation state s201 or the standby state s202. The handover process 301 is responsible for the state transition, and both the primary partition and the shadow partition can change state.

정상종료 상태(s204)는 프라이머리 파티션(100)에서 동작하는 임무 프로세스(102)의 작업이 모두 정상종료된 상태를 의미한다. 이 경우 핸드 오버 프로세스(301)는 동작 상태(s201)의 프라이머리 파티션(100)을 정상종료 상태(s204)로 상태 천이시키며, 대기 상태(s202)인 쉐도우 파티션(200) 또한 대기 상태(s202)로 상태 천이시킨다.The normal termination state (s204) means a state in which all tasks of the mission process 102 operating in the primary partition 100 are normally terminated. In this case, the handover process 301 transitions the primary partition 100 in the active state s201 to the normal end state s204, and the shadow partition 200 in the standby state s202 is also in the standby state s202. .

재시작 상태(s205)는 파티션이 정상 또는 비정상 종료되어 파티션이 재구동 중인 상태를 의미한다. 재시작 상태는 정상종료 상태(s203)와 비정상종료 상태 (s204)에서 헬스 모니터(300)에 의해 천이 가능하다. 재구동이 완료된 파티션은 자동적으로 대기상태(s202)로 천이된다. The restart state (s205) means a state in which the partition is normally or abnormally terminated and the partition is being restarted. The restart state is transitionable by the health monitor 300 in the normal end state (s203) and the abnormal end state (s204). The partition where the re-drive is completed is automatically changed to the standby state (S202).

도 3은 본 명세서의 실시예에 따른 파티션 기반 시스템에서 파티션들의 상태에 따른 헬스 모니터의 동작을 나타낸 흐름도이다. 3 is a flowchart illustrating an operation of a health monitor according to the status of partitions in a partition-based system according to an embodiment of the present invention.

도 3은 파티션들(100, 200)의 다양한 상태에 따른 헬스 모니터(300)의 동작을 나타낸다, 본 발명에서 프라이머리 파티션(100)과 쉐도우 파티션(200)은 크게 4가지 상태 조합을 갖는다. FIG. 3 shows the operation of the health monitor 300 according to various states of the partitions 100 and 200. In the present invention, the primary partition 100 and the shadow partition 200 have four states combinations.

첫 번째 상태 조합은, 프라이머리 파티션은 동작 상태이고(f310, 예), 쉐도우 파티션은 대기 상태인 경우(f331, 예)이다. 이 경우 시스템이 문제없이 작동하며 프라이머리 파티션의 고장 발생시 후술하는 조 4의 파티션 역할 핸드 오버(h100)가 정상적으로 작동할 수 있다. The first state combination is when the primary partition is in an operational state (f310, eg), and the shadow partition is in a standby state (f331, eg). In this case, the system will operate without problems, and in the event of a primary partition failure, the partitioning role handover (h100) described below can operate normally.

두 번째 상태 조합은, 프라이머리 파티션은 동작 상태이고(s201), 쉐도우 파티션은 대기 상태(s202)가 아닌 경우이다(f331, 아니오). 이 경우 시스템은 문제없이 작동 하나 프라이머리 파티션의 고장 발생 시 핸드오버를 수행할 수 없다. 따라서 쉐도우 파티션이 대기상태가 아니면 추가로 재시작 상태인지 확인하여(f342, f352), 재시작 상태가 아닌 경우(f352, 아니오) 핸드 오버 프로세스(301)가 쉐도우 파티션에게 재시작 명령을 전달해 쉐도우 파티션을 대기 상태(s202)로 천이시킨다(f362)The second state combination is that the primary partition is in an operational state (s201), and the shadow partition is not in a standby state (s202) (f331, no). In this case, the system works fine but can not perform handover in the event of a primary partition failure. Therefore, if the shadow partition is not in the standby state, it is confirmed that the additional partition is in the restart state (f342, f352). If the shadow partition is not in the standby state (f342, f352), the handover process 301 transfers the restart command to the shadow partition (s202) (f362)

세 번째 상태 조합은, 프라이머리 파티션은 동작 상태(s201)가 아니고(f310, 아니오), 쉐도우 파티션은 대기 상태(s202)인 경우(f330, 예)로, 시스템의 지속적 운영을 위해 핸드 오버 프로세스(301)가 핸드 오버를 수행한다. The third state combination is a handover process (for example, for the continuous operation of the system) in which the primary partition is not the operating state s201 (f310, No) and the shadow partition is the standby state s202 301 perform handover.

핸드 오버 과정은 먼저 헬스 모니터가 쉐도우 파티션에게 프로세스 실행 명령을 전송하고(f341) 프라이머리 파티션에게 재시작 명령을 전달하여(f351) 프라이머리 파티션을 대기 상태(s202)로 천이시킨다. 이어서 헬스 모니터는 쉐도우 파티션은 프라이머리 파티션(100)으로 변경시키고(f361) 프라이머리 파티션은 쉐도우 파티션(200)으로 변경시킨다(f371). 이전 프라이머리 파티션(현 쉐도우 파티션)은 동작 상태(s201)가 아니기 때문에 상태이므로 헬스 모니터는 현 쉐도우 파티션이 재시작 상태(s205)인지 판단한 후(f342) 재시작 상태(s205)가 아니면(f352, 아니오), 현 쉐도우 파티션에게 재시작 명령을 전달하여(f362) 현 쉐도우 파티션을 대기 상태(s202)로 천이시킨다. In the handover process, first, the health monitor sends a process execution command to the shadow partition (f 341), transfers a restart command to the primary partition (f 351), and transitions the primary partition to the standby state (s 202). The health monitor then changes the shadow partition to the primary partition 100 (f361) and changes the primary partition to the shadow partition 200 (f371). Since the previous primary partition (current shadow partition) is not in operation state s201, the health monitor determines whether the current shadow partition is in the restart state s205 (f342), and if it is not the restart state (s205) (f352, , And the current shadow partition is transferred to the standby state (s202) by transmitting a restart command to the current shadow partition (f362).

네 번째 상태 조합은, 프라이머리 파티션은 동작 상태(s201)가 아니고, 쉐도우 파티션도 대기 상태(s202)가 아닌 경우(f330, 아니오)로, 헬스 모니터는 시스템의 지속적 운영을 위하여 프라이머리 파티션이 재시작 상태(s205)인지 확인한다 (f340). 확인결과, 프라이머리 파티션이 재시작 상태(s205)가 아닌 경우(f350, 아니오), 헬스 모니터는 프라이머리 파티션으로 재시작 명령을 전송한다(f360).The fourth state combination is that when the primary partition is not in operation state (s201) and the shadow partition is not in the standby state (s202) (f330, no), the health monitor will restart the primary partition It is confirmed whether the state is s205 (f340). If it is determined that the primary partition is not in the restart state (s205) (f350, NO), the health monitor transmits a restart command to the primary partition (f360).

이후 헬스 모니터는 프라이머리 파티션의 상태를 확인하여(f370) 프라이머리 파티션이 대기 상태(s202)인지 판단하는데(f380), 만약 대기 상태(s202)가 아닌 경우(f380, 아니오)에는 다시 핸드 오버 프로세스(301)가 프라이머리 파티션에게 재시작 명령을 전달해 프라이머리 파티션을 대기 상태(s202)로 천이시킨다. 반면에 프라이머리 파티션이 대기 상태(s202)로 천이된 것이 확인되면, 헬스 모니터는 프라이머리 파티션으로 임무 프로세스(102)의 작동 명령을 전송하여(f381), 프라이머리 파티션을 동작 상태(s201)로 천이시킨다. 마지막으로 헬스 모니터는 쉐도우 파티션이 재시작 상태인지 판단한 후(f342) 재시작 상태가 아닌 경우(f352, 아니오) 쉐도우 파티션에게 재시작 명령을 전달해(f362) 쉐도우 파티션을 대기 상태로 천이시킨다.Thereafter, the health monitor checks the status of the primary partition (f370) and determines whether the primary partition is in a standby state (S202) (f380). If it is not in the standby state (S203) (301) transfers a restart command to the primary partition to transition the primary partition to the standby state (s202). On the other hand, if it is confirmed that the primary partition has been shifted to the standby state (s202), the health monitor transmits an operation command of the mission process 102 to the primary partition (f381) and sets the primary partition to the operation state s201 Transit. Finally, the health monitor determines if the shadow partition is in the restart state (f342) and if it is not in the restarted state (f352, no), it passes the restart command to the shadow partition (f362) and transitions the shadow partition to the standby state.

도 4는 본 발명의 실시예에 따른 파티션 기반 시스템에서 고장이 감지된 경우 파티션 핸드 오버(h100)를 수행하는 동작을 나타낸 신호 흐름도이다. FIG. 4 is a signal flow diagram illustrating an operation for performing a partition handover (h 100) when a failure is detected in a partition-based system according to an embodiment of the present invention.

도 4에 도시된 바와같이, 헬스 모니터(300)는 각 파티션(100, 200)에게 상태 정보를 요청하여 각 파티션으로부터 상태 정보를 수신한다(h200).As shown in FIG. 4, the health monitor 300 requests status information from each partition 100 and 200 and receives status information from each partition (h200).

상태 정보가 수신되면 헬스 모니터(300)는 수신한 상태정보를 근거로 각 파티션(100, 200)의 고장을 감지한다(h201). 일 예로 프라이머리 파티션(100)의 고장리 감지된 경우 헬스 모니터(300)는 다음과 같은 순서에 따라 파티션 임무 핸드 오버를 수행한다.Upon receiving the status information, the health monitor 300 detects a failure of each of the partitions 100 and 200 based on the received status information (h201). For example, when a failure of the primary partition 100 is detected, the health monitor 300 performs a partition task handover according to the following procedure.

쉐도우 파티션(200)이 고장이 발생되어 비정상 종료되면 헬스 모니터(300)는 시스템의 지속적 운영이 가능하도록 하기 위하여, 프라이머리 파티션(100)이 수행하던 임무 프로세스를 실행하라는 명령을 쉐도우 파티션(200)으로 전송하고(h202), 프라이머리 파티션(100)에게는 재시작 명령을 전송한다(h203). 이는 차후 프라이머리 파티션(100)에서 고장이 발생했을 경우 핸드 오버를 하기 위한 쉐도우 파티션 (200)을 만드는 과정이다.When the shadow partition 200 abnormally terminates due to a failure, the health monitor 300 sends a command to the shadow partition 200 to execute the mission process performed by the primary partition 100, (H202), and transmits a restart command to the primary partition 100 (h203). This is a process of creating a shadow partition 200 for handover when a failure occurs in the primary partition 100 in the future.

상기와 같은 동작을 통해 헬스 모니터(300)는 쉐도우 파티션(200)을 프라이머리 파티션(100)으로, 프라이머리 파티션(100)을 쉐도우 파티션(200)으로 변경한다(h204). 이를 통해 파티션 핸드 오버가 종료된다. Through the above operation, the health monitor 300 changes the shadow partition 200 to the primary partition 100 and the primary partition 100 to the shadow partition 200 (h204). This completes the partition handover.

상술한 바와같이 본 발명은 파티션 기반의 시스템에서 헬스 모니터를 통해 각 파티션의 상태 확인 및 파티션간 파티션 임무 핸드오버를 수행함으로써 파트션의 고속 재구동을 가능하게 되어 시스템의 지속적 운영을 보장할 수 있는 장점이 있다. 따라서, 본 발명은 군사적인 측면에서는 무인 무기, 항공 같은 지속적으로 운영되어야 하는 시스템에 적용할 경우 고장 발생 시 고속 재구동이 가능하기 때문에 효과적으로 임무를 수행할 수 있다. 또한, 본 발명은 공장 생산 라인 등에 적용할 경우 고장이 발생해도 라인이 멈추지 않아 생산량 감소를 줄일 수 있는 경제적인 효과가 있으며, 기술개발 측면에서는 파티션 기반 시스템에서 다양한 고장 감지 및 핸드 오버 기술과 함께 사용할 수 있는 장점이 있다. As described above, according to the present invention, it is possible to confirm the status of each partition and carry out partition mission handover between partitions through a health monitor in a partition-based system, thereby enabling fast re-driving of partitions, There are advantages. Accordingly, when applied to a system that is to be continuously operated, such as an unmanned weapon, aviation, etc., the present invention can perform a mission effectively because a high-speed restart is possible in the event of a failure. In addition, the present invention has an economical effect of reducing the production amount due to the fact that the line does not stop even if a failure occurs in a factory production line, and in the technology development aspect, it can be used with various fault detection and handover techniques in a partition- There are advantages to be able to.

상기 설명된 실시예들의 구성과 방법은 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 상술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. It will be appreciated that the configurations and methods of the embodiments described above are not to be limited and that the embodiments may be embodied in other specific forms without departing from the spirit or essential characteristics thereof. Therefore, it should be understood that the above-described embodiments are to be considered in all respects as illustrative and not restrictive.

100 : 프라이머리 파티션 101, 201 : 내부 통신 데몬
102 : 임무 프로세스 200 : 쉐도우 파티션
300 : 핼스 모니터 301 : 핸드오버 프로세스
302 : 내부 통신 프로세스 400 : 하이퍼 바이저
100: primary partition 101, 201: internal communication daemon
102: Mission Process 200: Shadow Partition
300: health monitor 301: handover process
302: internal communication process 400: hypervisor

Claims (9)

기본 파티션인 프라이머리 파티션;
확장 파티션인 쉐도우 파티션; 및
내부 통신을 통해 파악된 파티션의 상태에 따라 각 파티션으로 상태 천이 명령을 전송하여 시스템 임무를 수행하도록 제어하는 헬스 모니터;로 구성되어,
상기 헬스 모니터는 프라이머리 파티션이 동작상태가 아니고 쉐도우 파티션이 대기상태인 경우, 프라이머리 파티션과 쉐도우 파티션간 파티션 임무 핸드오버를 수행하며,
상기 프라이머리 파티션이 동작 상태가 아니고 쉐도우 파티션이 대기 상태가 아닌 경우,
(i) 프라이머리 파티션이 재시작 상태인지 확인하여 상기 프라이머리 파티션이 재시작 상태가 아닌 경우 프라이머리 파티션으로 재시작 명령을 전송하고,
(ii) 상기 프라이머리 파티션의 상태를 재확인하여 상기 프라이머리 파티션이 대기 상태가 아닌 경우에는 다시 프라이머리 파티션에게 재시작 명령을 전송하여 프라이머리 파티션을 대기 상태로 천이시키고,
(iii) 상기 프라이머리 파티션이 대기 상태로 천이된 것이 확인되면, 상기 프라이머리 파티션으로 임무 프로세스의 작동 명령을 전송하여 동작 상태로 천이시키는 것을 특징으로 하는 파티션 기반 시스템.
The primary partition, the primary partition;
An extended partition, a shadow partition; And
And a health monitor for transmitting a state transition command to each of the partitions according to the state of the partition determined through the internal communication to control the system task to be performed,
The health monitor performs partition task handover between the primary partition and the shadow partition when the primary partition is not in operation and the shadow partition is in a standby state,
If the primary partition is not in an operational state and the shadow partition is not in a standby state,
(i) checking whether the primary partition is in a restart state and sending a restart command to the primary partition when the primary partition is not in the restarted state,
(ii) reconfirms the state of the primary partition, and if the primary partition is not in a standby state, it sends a restart command to the primary partition again to transition the primary partition to a standby state,
(iii) if the primary partition is found to have been transitioned to the standby state, transmitting an operation command of the mission process to the primary partition and transitioning to an operation state.
제1항에 있어서, 상기 헬스 모니터는
프라이머리 파티션 및 쉐도우 파티션과 내부통신을 수행하여 각 파티션의 상태정보를 수신하는 내부통신 프로세서; 및
상기 내부통신을 통해 수신한 상태정보를 근거로 파티션의 상태를 감지하여, 프라이머리 파티션의 비정상 종료가 감지될 때 상기 프라이머리 파티션과 쉐도우 파티션간 파티션 임무 핸드오버를 수행하는 핸드 오버 프로세스;를 포함하는 것을 특징으로 하는 파티션 기반 시스템.
The system of claim 1, wherein the health monitor
An internal communication processor for performing internal communication with a primary partition and a shadow partition to receive status information of each partition; And
And a handover process of detecting partition status based on the status information received through the internal communication and performing a partition task handover between the primary partition and the shadow partition when abnormal termination of the primary partition is detected Wherein the partitioning system is a partition-based system.
제1항에 있어서, 상기 헬스 모니터는
프라이머리 파티션이 동작상태이고 쉐도우 파티션이 대기상태가 아닌 경우, 쉐도우 파티션으로 재시작 명령을 전송하여 쉐도우 파티션을 대기상태로 천이시키는 것을 특징으로 하는 파티션 기반 시스템.
The system of claim 1, wherein the health monitor
Wherein when the primary partition is in an operational state and the shadow partition is not in a standby state, a restart command is sent to the shadow partition to transition the shadow partition into a standby state.
제1항에 있어서, 상기 헬스 모니터는
프라이머리 파티션이 동작상태가 아니고 쉐도우 파티션이 대기상태가 아닌 경우, 프라이머리 파티션으로 재시작 명령을 전송하여 프라이머리 파티션을 대기상태로 천이시킨 후 프라이머리 파티션을 동작상태로 천이시키고, 상기 쉐도우 파티션은 대기상태로 천이시키는 것을 특징으로 하는 파티션 기반 시스템.
The system of claim 1, wherein the health monitor
If the primary partition is not in operation and the shadow partition is not in a standby state, a reset command is sent to the primary partition to transition the primary partition to the standby state, and then to transition the primary partition to the operating state. To a standby state.
제1항에 있어서, 상기 프라이머리 파티션이 동작상태가 아닌 상태는
고장이 발생되어 프라이머리 파티션이 임무 프로세서를 비정상적으로 종료한 상태인 것을 특징으로 하는 파티션 기반 시스템.
2. The method of claim 1, wherein the primary partition is not in an operational state
Wherein the primary partition is in a state in which a failure has occurred and the primary partition has abnormally terminated the mission processor.
제1항에 있어서, 상기 헬스 모니터는
(a) 쉐도우 파티션으로 프로세스 실행 명령을 전달하고,
(b) 프라이머리 파티션으로 재시작 명령을 전달하여 프라이머리 파티션을 대기 상태로 천이시키고,
(c) 쉐도우 파티션은 프라이머리 파티션으로 변경시키고 상기 프라이머리 파티션은 쉐도우 파티션으로 변경시켜, 파티션 임무 핸드오버를 수행하는 것을 특징으로 하는 파티션 기반 시스템.
The system of claim 1, wherein the health monitor
(a) passes the process execution command to the shadow partition,
(b) transitions the primary partition to a wait state by passing a restart command to the primary partition,
(c) changing the shadow partition to a primary partition and the primary partition to a shadow partition to perform a partition task handover.
제1항에 있어서, 상기 프라이머리 파티션과 쉐도우 파티션은
파티션의 상태 정보를 헬스 모니터의 내부 통신 프로세스로 전송하는 내부 통신 데몬;을 포함하는 것을 특징으로 하는 파티션 기반 시스템.
The method of claim 1, wherein the primary partition and the shadow partition
And an internal communication daemon for transmitting the partition status information to the internal communication process of the health monitor.
프라이머리 파티션에서 임무 프로세스를 실행하는 단계;
임무 프로세스를 실행중에 내부 통신을 통해 프라이머리 파티션과 쉐도우 파티션으로 상태정보를 요청하는 단계;
프라이머리 파티션과 쉐도우 파티션으로부터 수신된 상태정보를 근거로 각 파티션의 상태를 확인하는 단계;
상기 프라이머리 파티션에 고장이 감지되면 프라이머리 파티션과 쉐도우 파티션간 파티션 임무 핸드오버를 수행하는 단계;를 포함하며,
상기 파티션 임무 핸드오버를 수행하는 단계는
(i) 상기 프라이머리 파티션이 동작 상태가 아니고 쉐도우 파티션이 대기 상태가 아닌 경우 프라이머리 파티션이 재시작 상태인지 확인하는 단계;
(ii) 상기 프라이머리 파티션이 재시작 상태가 아닌 경우 프라이머리 파티션으로 재시작 명령을 전송하는 단계;
(iii) 상기 프라이머리 파티션의 상태를 재확인하여 상기 프라이머리 파티션이 대기 상태가 아닌 경우에는 다시 프라이머리 파티션에게 재시작 명령을 전송하여 프라이머리 파티션을 대기 상태로 천이시키는 단계 및
(iv) 상기 프라이머리 파티션이 대기 상태로 천이된 것이 확인되면, 상기 프라이머리 파티션으로 임무 프로세스의 작동 명령을 전송하여 동작 상태로 천이시키는 단계를 포함하는 것을 특징으로 하는 파티션 기반 시스템의 파티션 고속 재구동 방법.
Executing a mission process in a primary partition;
Requesting status information from a primary partition and a shadow partition through internal communication during execution of a mission process;
Checking status of each partition based on status information received from a primary partition and a shadow partition;
Performing a partition task handover between the primary partition and the shadow partition when a failure is detected in the primary partition,
The step of performing the partition task handover
(i) if the primary partition is not in an operational state and the shadow partition is not in a standby state, checking if the primary partition is in a restart state;
(ii) sending a restart command to the primary partition if the primary partition is not in a restarted state;
(iii) reconfirming the state of the primary partition and, if the primary partition is not in a standby state, transmitting a restart command to the primary partition again to transition the primary partition to a standby state; and
(iv) if it is determined that the primary partition has transitioned to the standby state, transmitting an operation command of the mission process to the primary partition and transitioning to an operation state. Driving method.
제8항에 있어서, 상기 파티션 임무 핸드오버를 수행하는 단계는
쉐도우 파티션으로 프로세스 실행 명령을 전달하는 단계;
프라이머리 파티션으로 재시작 명령을 전달하여 상기 프라이머리 파티션을 대기 상태로 천이시키는 단계; 및
상기 쉐도우 파티션은 프라이머리 파티션으로 변경시키고 프라이머리 파티션은 쉐도우 파티션으로 변경시키는 단계;를 포함하는 것을 특징으로 하는 파티션 기반 시스템의 파티션 고속 재구동 방법.
9. The method of claim 8, wherein performing partitioning task handover comprises:
Transferring a process execution command to a shadow partition;
Transitioning the primary partition to a standby state by passing a restart command to the primary partition; And
And changing the shadow partition to a primary partition and the primary partition to a shadow partition.
KR1020140086956A 2014-07-10 2014-07-10 Partition based system and high-speed partition re-driving method thereof KR101592332B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140086956A KR101592332B1 (en) 2014-07-10 2014-07-10 Partition based system and high-speed partition re-driving method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140086956A KR101592332B1 (en) 2014-07-10 2014-07-10 Partition based system and high-speed partition re-driving method thereof

Publications (2)

Publication Number Publication Date
KR20160007041A KR20160007041A (en) 2016-01-20
KR101592332B1 true KR101592332B1 (en) 2016-02-05

Family

ID=55307779

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140086956A KR101592332B1 (en) 2014-07-10 2014-07-10 Partition based system and high-speed partition re-driving method thereof

Country Status (1)

Country Link
KR (1) KR101592332B1 (en)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
‘시스템 지속 운영을 위한 가상화 기반의 파티션 재구동 지연 감내 기법’, 한국정보과학회 2014 한국컴퓨터종합학술대회 논문집, pp.137-139(2014.06.)*

Also Published As

Publication number Publication date
KR20160007041A (en) 2016-01-20

Similar Documents

Publication Publication Date Title
US9235484B2 (en) Cluster system
US8893122B2 (en) Virtual computer system and a method of controlling a virtual computer system on movement of a virtual computer
US9442792B2 (en) Using stretched storage to optimize disaster recovery
US9489273B2 (en) Using stretched storage to optimize disaster recovery
US8713362B2 (en) Obviation of recovery of data store consistency for application I/O errors
EP2598993B1 (en) Providing application high availability in highly-available virtual machine environments
US8495412B2 (en) Autonomous propagation of virtual input/output (VIO) operation(s) to second VIO server (VIOS) due to a detected error condition at a first VIOS
US20160266946A1 (en) Executing a kernel device driver as a user space process
WO2015169199A1 (en) Anomaly recovery method for virtual machine in distributed environment
WO2010122709A1 (en) Rejuvenation processing device, rejuvenation processing system, computer program, and data processing method
US8782464B2 (en) Method and system for using a standby server to improve redundancy in a dual-node data storage system
CN104239548B (en) Database disaster tolerance system and data storage capacity disaster method
US20140258659A1 (en) Protection of former primary volumes in a synchronous replication relationship
JP2006285810A (en) Cluster configuration computer system and system reset method therefor
US10445295B1 (en) Task-based framework for synchronization of event handling between nodes in an active/active data storage system
US11119673B2 (en) Optimizing synchronous I/O for zHyperLink
US20160077934A1 (en) Managing vios failover in a single storage adapter environment
KR20150111608A (en) Method for duplication of virtualization server and Virtualization control apparatus thereof
KR102053849B1 (en) Airplane system and control method thereof
KR101592332B1 (en) Partition based system and high-speed partition re-driving method thereof
CN104572198A (en) Service restoration method and device
JP2023129318A (en) Electronic device and operation method thereof for on-demand accelerator checkpointing
KR102023164B1 (en) Method for monitoring os task of twin micom in rtos
US9400605B2 (en) Efficient management of a virtual tape library cluster
US10877804B2 (en) Computing apparatus, electronic device, and information processing method

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190201

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20200204

Year of fee payment: 5