KR20180105102A - Remote fault recovery system - Google Patents
Remote fault recovery system Download PDFInfo
- Publication number
- KR20180105102A KR20180105102A KR1020180105569A KR20180105569A KR20180105102A KR 20180105102 A KR20180105102 A KR 20180105102A KR 1020180105569 A KR1020180105569 A KR 1020180105569A KR 20180105569 A KR20180105569 A KR 20180105569A KR 20180105102 A KR20180105102 A KR 20180105102A
- Authority
- KR
- South Korea
- Prior art keywords
- computer system
- management unit
- ethernet port
- failure
- unit
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0748—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
Abstract
Description
본 발명의 실시예는 원격 장애 복구 시스템에 관한 것으로, 좀 더 구체적으로는, ATM(Automated Teller Machine), KIOSK, DID(Digital Information Display), 스마트 팩토리 등의 무인컴퓨터단말시스템에서 블루스크린(응답불능 전산장애)의 발생 시 중앙관리시스템을 통한 신속한 원격장애복구를 위해 표준 IoT 프로토콜을 지원하고 단말에서의 하드웨어 원격제어 및 신속복구기능을 수행하는 경제성을 확보한 저가의 원격 장애 복구 시스템에 관한 것이다. More particularly, the present invention relates to a remote fault recovery system, and more particularly, to a remote fault recovery system capable of preventing blue screen (unresponsiveness) in an unmanned computer terminal system such as an ATM (Automated Teller Machine), a KIOSK, a DID The present invention relates to a low-cost remote fault recovery system that supports a standard IoT protocol for rapid remote fault recovery through a central management system in case of occurrence of a fault, and achieves cost-effective hardware remote control and quick recovery function in a terminal.
현재 Industry3.0 기반 IT 장비의 시스템 장애(블루스크린, 시스템 오류, 프로그램 오류)는 하드웨어 및 소프트웨어의 오류로 인해 필연적으로 발생하고 있으며, 현재의 장애복구 솔루션으로 사용되는 원격장애복구시스템은 해당 시스템이 응답불능상태(단말시스템이 응답이 없는 상태)에 빠진 경우에는 무용지물이 되며 직접 현장으로 출동해서 단말시스템을 복구함으로써 시간적, 경제적 손실의 큰 문제점이 있다.System failure (blue screen, system error, program error) of IT equipment based on Industry3.0 is inevitably caused by hardware and software error. Remote disaster recovery system, which is used as current disaster recovery solution, In the case where the terminal is in an unresponsive state (a state in which the terminal system is not responding), it becomes useless, and the terminal system is directly returned to the field to recover the terminal system.
본 발명의 실시예는, 표준 IoT 프로토콜(MQTT: Message Queing Telemetry Transport)을 지원하며 중앙의 장애복구관리제어기와 통신할 수 있는 하드웨어 솔루션을 구현하고 실시간으로 단말시스템의 상태를 감지하고 사전 장애 예측 및 제어를 수행함으로써 제로 장애상태시간(zero downtime)의 IoT 환경을 통해 장애 복구 시 획기적 시간 단축 및 비용절감을 구현한다.The embodiment of the present invention implements a hardware solution that supports a standard IoT protocol (MQTT: Message Queuing Telemetry Transport) and can communicate with a central fault recovery management controller, detects the state of the terminal system in real time, Control is implemented to realize breakthrough time reduction and cost reduction in failover through zero dead-time IoT environment.
본 발명의 일 실시예에 따른 원격 장애 복구 시스템은, 전원관리부와 함께 무인컴퓨터단말시스템에 내장되어 상기 무인컴퓨터단말시스템의 컴퓨터시스템의 상태를 감지하는 장애상태탐지부; 응답불능상태인 상기 컴퓨터시스템에 대한 원격장애복구실행을 위한 제어명령을 제공하는 원격장애복구관리부; 및 상기 컴퓨터시스템의 정상동작 시 상기 원격장애복구관리부와 연결되는 제1 이더넷 포트와, 상기 컴퓨터시스템과 연결되는 제2 이더넷 포트를 통해 상기 컴퓨터시스템과 상기 원격장애복구관리부 간을 연결하고, 상기 장애상태탐지부를 통해 상기 컴퓨터시스템이 응답불능상태로 판단되면 상기 제1 이더넷 포트를 통해 상기 제어명령을 수신하여 상기 장애상태탐지부 및 상기 전원관리부 각각과의 연결 경로를 통해 상기 컴퓨터시스템에 대한 장애복구를 실행하며, 상기 전원관리부를 제어하는 장애복구실행부를 포함한다.The remote fault recovery system according to an embodiment of the present invention includes a fault state detection unit built in an unmanned computer terminal system together with a power management unit to detect a state of a computer system of the unmanned computer terminal system; A remote disaster recovery management unit for providing a control command for executing a remote disaster recovery to the computer system in an unresponsive state; And a first Ethernet port connected to the remote fault recovery management unit in normal operation of the computer system and a second Ethernet port connected to the computer system to connect the computer system and the remote fault recovery management unit, And a control unit for receiving the control command through the first Ethernet port when the computer system is determined to be in a non-responsive state through the status detection unit, And a failure recovery execution unit for controlling the power management unit.
또한, 상기 장애복구실행부는, 상기 원격장애복구관리부와 연결된 상기 제1 이더넷 포트; 상기 컴퓨터시스템과 연결된 상기 제2 이더넷 포트; 및 상기 제1 이더넷 포트, 상기 제2 이더넷 포트, 상기 장애상태탐지부 및 상기 전원관리부와 각각 연결되는 장애복구실행제어부를 포함하고, 상기 제1 이더넷 포트와 상기 제2 이더넷 포트 간의 제1 패스; 상기 제1 이더넷 포트와 상기 장애복구실행제어부 간의 제2 패스; 및 상기 제2 이더넷 포트와 상기 장애복구실행제어부 간의 제3 패스를 형성하고, 상기 장애복구실행제어부는, 상기 장애상태탐지부와 SP 인터페이스(Serial Port Interface)를 통해 연결되며, 상기 전원관리부와 GPIO 인터페이스(General Purpose I/O Interface)를 통해 연결되고, 상기 장애상태탐지부는, 제4 패스를 통해 상기 컴퓨터시스템과 연결될 수 있다.In addition, the failure recovery execution unit may include: the first Ethernet port connected to the remote failure recovery management unit; The second Ethernet port coupled to the computer system; And a failure recovery execution control unit connected to the first Ethernet port, the second Ethernet port, the failure state detection unit, and the power management unit, respectively, the first path between the first Ethernet port and the second Ethernet port; A second path between the first Ethernet port and the failback execution control section; And a third path between the second Ethernet port and the failure recovery execution control unit, wherein the failure recovery execution control unit is connected to the failure state detection unit through an SP interface (Serial Port Interface) Interface (General Purpose I / O Interface), and the failure state detection unit may be connected to the computer system via a fourth path.
또한, 상기 컴퓨터시스템의 정상동작 시, 상기 원격장애복구관리부와 상기 컴퓨터시스템 간은 상기 제1 패스를 통해 연결되어 통신하고, 상기 장애복구실행제어부는, 상기 제2 패스와 상기 제3 패스를 통해 상기 원격장애복구관리부와 상기 컴퓨터시스템 간에 각각 연결되어 통신하고, 상기 SP 인터페이스를 통해 상기 장애상태탐지부로부터 상기 컴퓨터시스템의 상태를 주기적으로 수신하고, 상기 컴퓨터시스템의 응답불능상태 시 상기 컴퓨터시스템에 대한 인터넷 엑세스가 가능한 경우, 상기 원격장애복구관리부는 상기 제1 패스를 통해 상기 컴퓨터시스템에 대한 장애복구를 직접 실행하고, 상기 컴퓨터시스템의 응답불능상태 시 상기 컴퓨터시스템에 대한 인터넷 엑세스가 불가능한 경우, 상기 장애복구실행제어부는, 상기 제2 패스를 통해 상기 원격장애복구관리부로 장애상태를 전송한 후 상기 원격장애복구관리부로부터 상기 제어명령을 수신하여 상기 GPIO 인터페이스를 통해 상기 전원관리부의 전원을 제어하고, 상기 SP 인터페이스를 통해 상기 컴퓨터시스템에 대한 장애복구를 실행한 후 상기 SP 인터페이스를 통해 상기 컴퓨터시스템의 부팅 시 부팅절차를 제어할 수 있다.In addition, in normal operation of the computer system, the remote fault recovery management unit and the computer system are connected and communicated through the first path, and the failure recovery execution control unit controls the second path and the third path Wherein the computer system is connected to and communicates with the remote fault recovery management unit and the computer system, and periodically receives the status of the computer system from the fault status detection unit via the SP interface, When the Internet access to the computer system is possible, the remote disaster recovery management unit directly executes the disaster recovery for the computer system through the first path, and when the computer system is not able to access the computer system in an unresponsive state, Wherein the failure recovery execution control unit is operable to, through the second path, And a controller for receiving the control command from the remote fault recovery management unit to control power of the power management unit through the GPIO interface and performing a fault recovery for the computer system through the SP interface after transmitting the fault status to the fault recovery management unit And then control the boot-time booting procedure of the computer system via the SP interface.
또한, 상기 컴퓨터시스템의 응답불능상태 시 상기 컴퓨터시스템에 대한 인터넷 엑세스가 불가능한 경우, 상기 장애복구실행제어부는, 상기 SP 인터페이스를 통해 상기 컴퓨터시스템의 제어권을 임시적으로 가져오고, 장애복구의 수행완료 시 해당 제어권을 상기 컴퓨터시스템으로 되돌려줄 수 있다.In addition, when the computer system is unable to access the computer system in an unresponsive state, the failure recovery execution control unit temporarily takes control of the computer system through the SP interface, and upon completion of the failure recovery And return that control to the computer system.
본 발명의 다른 실시예에 따른 원격 장애 복구 시스템은, 전원관리부가 내장 또는 외장 설치된 무인컴퓨터단말시스템의 장애를 원격에서 복구하기 위한 시스템에 관한 것으로, 응답불능상태인 상기 무인컴퓨터단말시스템의 컴퓨터시스템에 대한 원격장애복구실행을 위한 제어명령을 제공하는 원격장애복구관리부; 및 상기 컴퓨터시스템의 정상동작 시 상기 원격장애복구관리부와 연결되는 제1 이더넷 포트와, 상기 컴퓨터시스템과 연결되는 제2 이더넷 포트를 통해 상기 컴퓨터시스템과 상기 원격장애복구관리부 간을 연결하고, 상기 제2 이더넷 포트를 통해 상기 컴퓨터시스템의 상태를 감지하여 응답불능상태로 판단되면 상기 제1 이더넷 포트를 통해 상기 제어명령을 수신하여 상기 컴퓨터시스템과 직접 연결되는 SP 인터페이스(Serial Port Interface)를 통해 상기 컴퓨터시스템에 대한 장애복구를 실행하며, 상기 전원관리부와 연결되는 GPIO 인터페이스(General Purpose I/O Interface)를 통해 상기 전원관리부를 제어하는 장애복구실행부를 포함한다.A remote fault recovery system according to another embodiment of the present invention is a system for remotely repairing a fault in an unmanned computer terminal system in which a power management unit is built in or externally installed, A remote disaster recovery management unit for providing a control command for executing a remote disaster recovery; And a first Ethernet port connected to the remote fault recovery management unit during normal operation of the computer system and a second Ethernet port connected to the computer system to connect the computer system and the remote fault recovery management unit, 2 Ethernet port through the SP interface (Serial Port Interface) which is directly connected to the computer system by receiving the control command through the first Ethernet port when it is determined that the computer system is in a non-responsive state by sensing the status of the computer system through the Ethernet port, And a failure recovery executing unit for executing failure recovery for the system and controlling the power management unit through a GPIO interface (general purpose I / O interface) connected to the power management unit.
또한, 상기 장애복구실행부는, 상기 원격장애복구관리부와 연결된 상기 제1 이더넷 포트; 상기 컴퓨터시스템과 연결된 상기 제2 이더넷 포트; 상기 제2 이더넷 포트와 상기 장애복구실행제어부 간에 연결되어 상기 컴퓨터시스템의 상태를 감지하는 장애상태탐지부; 및 상기 제1 이더넷 포트, 상기 제2 이더넷 포트, 상기 장애상태탐지부, 상기 컴퓨터시스템 및 상기 전원관리부와 각각 연결되고, 상기 장애상태탐지부로부터 상기 컴퓨터시스템의 상태를 전달 받는 장애복구실행제어부를 포함하고, 상기 제1 이더넷 포트와 상기 제2 이더넷 포트 간의 제1 패스; 상기 제1 이더넷 포트와 상기 장애복구실행제어부 간의 제2 패스; 상기 제2 이더넷 포트와 상기 장애복구실행제어부 간의 제3 패스; 및 상기 제2 이더넷 포트와 상기 장애상태탐지부 간의 제4 패스를 형성하고, 상기 장애복구실행제어부는, 상기 SP 인터페이스를 통해 상기 컴퓨터시스템과 연결되며, 상기 GPIO 인터페이스를 통해 상기 전원관리부와 연결될 수 있다.In addition, the failure recovery execution unit may include: the first Ethernet port connected to the remote failure recovery management unit; The second Ethernet port coupled to the computer system; A failure state detection unit coupled between the second Ethernet port and the failure recovery execution control unit to detect a state of the computer system; And a failure recovery execution control unit connected to the first Ethernet port, the second Ethernet port, the failure state detection unit, the computer system, and the power management unit, respectively, for receiving the state of the computer system from the failure state detection unit A first path between the first Ethernet port and the second Ethernet port; A second path between the first Ethernet port and the failback execution control section; A third path between the second Ethernet port and the failback execution control section; And a fourth path between the second Ethernet port and the fault state detection unit, wherein the failure recovery execution control unit is connected to the computer system via the SP interface and is capable of being connected to the power management unit via the GPIO interface have.
또한, 상기 컴퓨터시스템의 정상동작 시, 상기 원격장애복구관리부와 상기 컴퓨터시스템 간은 상기 제1 패스를 통해 연결되어 통신하고, 상기 장애복구실행제어부는, 상기 제2 패스와 상기 제3 패스를 통해 상기 원격장애복구관리부와 상기 컴퓨터시스템에 각각 연결되어 통신하고, 상기 제4 패스를 통해 상기 장애상태탐지부로부터 상기 컴퓨터시스템의 상태를 주기적으로 수신하고, 상기 컴퓨터시스템의 응답불능상태 시 상기 컴퓨터시스템에 대한 인터넷 엑세스가 가능한 경우, 상기 원격장애복구관리부는 상기 제1 패스를 통해 상기 컴퓨터시스템에 대한 장애복구를 직접 실행하고, 상기 컴퓨터시스템의 응답불능상태 시 상기 컴퓨터시스템에 대한 인터넷 엑세스가 불가능한 경우, 상기 장애복구실행제어부는, 상기 제2 패스를 통해 상기 원격장애복구관리부로 장애상태를 전송한 후 상기 원격장애복구관리부로부터 상기 제어명령을 수신하여 상기 GPIO 인터페이스를 통해 상기 전원관리부의 전원을 제어하고, 상기 SP 인터페이스를 통해 상기 컴퓨터시스템에 대한 장애복구를 실행한 후 상기 SP 인터페이스를 통해 상기 컴퓨터시스템의 부팅 시 부팅절차를 제어할 수 있다.In addition, in normal operation of the computer system, the remote fault recovery management unit and the computer system are connected and communicated through the first path, and the failure recovery execution control unit controls the second path and the third path Wherein the computer system is connected to the remote fault recovery management unit and the computer system, respectively, and periodically receives the state of the computer system from the fault state detection unit via the fourth path, If the Internet access to the computer system is possible, the remote disaster recovery management unit directly executes the disaster recovery for the computer system via the first path, and if the computer system is not able to access the internet , And the failure recovery execution control unit is configured to, through the second path, After receiving the control command from the remote fault recovery management unit to control the power of the power management unit through the GPIO interface after the failure state is transmitted to the old management unit and performing the failure recovery of the computer system through the SP interface And then control the boot-time boot procedure of the computer system via the SP interface.
또한, 상기 컴퓨터시스템의 응답불능상태 시 상기 컴퓨터시스템에 대한 인터넷 엑세스가 불가능한 경우, 상기 장애복구실행제어부는, 상기 SP 인터페이스를 통해 상기 컴퓨터시스템의 제어권을 임시적으로 가져오고, 장애복구의 수행완료 시 해당 제어권을 상기 컴퓨터시스템으로 되돌려줄 수 있다.In addition, when the computer system is unable to access the computer system in an unresponsive state, the failure recovery execution control unit temporarily takes control of the computer system through the SP interface, and upon completion of the failure recovery And return that control to the computer system.
본 발명에 따르면, 표준 IoT 프로토콜(MQTT: Message Queing Telemetry Transport)을 지원하며 중앙의 장애복구관리제어기와 통신할 수 있는 하드웨어 솔루션을 구현하고 실시간으로 단말시스템의 상태를 감지하고 사전 장애 예측 및 제어를 수행함으로써 제로 장애상태시간(zero downtime)의 IoT 환경을 통해 장애 복구 시 획기적 시간 단축 및 비용절감을 구현할 수 있다. According to the present invention, a hardware solution capable of supporting a standard IoT protocol (MQTT: Message Queuing Telemetry Transport) and communicating with a central fault recovery management controller is implemented, the state of the terminal system is detected in real time, It can realize breakthrough time reduction and cost reduction in failover through IoT environment of zero downtime.
도 1은 본 발명의 실시예에 따른 원격 장애 복구 시스템의 개요도이다.
도 2는 본 발명의 일 실시예에 따른 원격 장애 복구 시스템의 구성도이다.
도 3 및 도 4는 본 발명의 다른 실시예에 따른 원격 장애 복구 시스템의 구성도이다.
도 5는 본 발명의 실시예에 따른 장애복구실행부의 구성도이다.
도 6은 본 발명의 실시예에 따른 장애복구실행부에서 수행되는 펌웨어(Firmware)의 기본 동작을 나타낸 순서도이다.1 is a schematic diagram of a remote fault recovery system according to an embodiment of the present invention.
2 is a block diagram of a remote fault recovery system according to an embodiment of the present invention.
3 and 4 are block diagrams of a remote fault recovery system according to another embodiment of the present invention.
5 is a configuration diagram of a failure recovery execution unit according to an embodiment of the present invention.
FIG. 6 is a flowchart illustrating a basic operation of a firmware executed in the failure recovery execution unit according to the embodiment of the present invention.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.The terms used in this specification will be briefly described and the present invention will be described in detail.
본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.While the present invention has been described in connection with what is presently considered to be the most practical and preferred embodiment, it is to be understood that the invention is not limited to the disclosed embodiments. Also, in certain cases, there may be a term selected arbitrarily by the applicant, in which case the meaning thereof will be described in detail in the description of the corresponding invention. Therefore, the term used in the present invention should be defined based on the meaning of the term, not on the name of a simple term, but on the entire contents of the present invention.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.When an element is referred to as "including" an element throughout the specification, it is to be understood that the element may include other elements as well, without departing from the spirit or scope of the present invention. Also, the terms "part," " module, "and the like described in the specification mean units for processing at least one function or operation, which may be implemented in hardware or software or a combination of hardware and software .
아래에서는 첨부한 도면을 참고하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다. Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily carry out the present invention. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In order to clearly illustrate the present invention, parts not related to the description are omitted, and similar parts are denoted by like reference characters throughout the specification.
도 1은 본 발명의 실시예에 따른 원격 장애 복구 시스템의 개요도이고, 도 2는 본 발명의 일 실시예에 따른 원격 장애 복구 시스템의 구성도이다.FIG. 1 is a schematic diagram of a remote fault recovery system according to an embodiment of the present invention, and FIG. 2 is a configuration diagram of a remote fault recovery system according to an embodiment of the present invention.
도 1 및 도 2를 참조하면, 본 발명의 일 실시예에 따른 원격 장애 복구 시스템(100)은 장애상태탐지부(110), 원격장애복구관리부(120) 및 장애복구실행부(130)를 포함한다.1 and 2, a remote
상기 장애상태탐지부(110)는 전원관리부(12)와 함께 무인컴퓨터단말시스템(10)에 내장되어 무인컴퓨터단말시스템(10)에 설치된 컴퓨터시스템(11)의 상태를 감지할 수 있다. 이러한 장애상태탐지부(110)는 무인컴퓨터단말시스템(10)의 컴퓨터시스템(11)에 대한 상태를 주기적으로 감지하고, 감지정보를 적절한 시점에 SP(Serial Port) 인터페이스를 통해 장애복구실행부(130)로 전송할 수 있다. The failure state detection unit 110 may be installed in the unmanned
본 발명의 일 실시예의 무인컴퓨터단말시스템(10)은 ATM(Automated Teller Machine), DID(Digital Information Display), KIOSK 등을 포함하며, 이들의 전반적인 시스템 제어 관리를 위한 컴퓨터시스템(11)과 더불어 전원관리부(12)가 내장된 형태로 구현될 수 있다. The unmanned
상기 원격장애복구관리부(120)는, 서버 형태로 구현되어 컴퓨터시스템(11)이 응답불능상태인 경우 해당 컴퓨터시스템(11)에 대한 원격장애복구실행을 위한 제어명령을 장애복구실행부(130)를 통해 무인컴퓨터단말시스템(10)으로 제공할 수 있다. The remote fault
상기 장애복구실행부(130)는 장애상태탐지부(110)로부터 컴퓨터시스템(11)에 대한 상태감지정보를 SP(Serial Port) 인터페이스를 통해 주기적으로 수신하고, 이와 관련된 통신을 주고 받음으로써 컴퓨터시스템(11)이 응답불능상태인지를 판단할 수 있다. 좀 더 구체적으로, 장애복구실행부(130)는, 컴퓨터시스템(11)의 정상동작 시 원격장애복구관리부(120)와 연결되는 제1 이더넷 포트(131)와 컴퓨터시스템(11)과 연결되는 제2 이더넷 포트(132)를 통해 컴퓨터시스템(11)과 원격장애복구관리부(120) 간을 연결하고, 장애상태탐지부(110)를 통해 컴퓨터시스템(11)이 응답불능상태로 판단되면 제1 이더넷 포트(131)를 통해 제어명령을 수신하여 장애상태탐지부(110) 및 전원관리부(12) 각각과의 연결 경로를 통해 컴퓨터시스템(11)에 대한 장애복구를 실행하며, 컴퓨터시스템(11)의 부팅 시 전원관리부(12)의 온/오프를 제어할 수 있다.The failure
이를 위해 원격장애복구관리부(120)는 제1 이더넷 포트(131), 제2 이더넷 포트(132), 장애복구실행제어부(MCU)(133), SP 인터페이스 및 GPIO(General Purpose I/O) 인터페이스를 포함할 수 있다.The remote fault
상기 제1 이더넷 포트(131)는 원격장애복구관리부(120)와 WAN을 통해 연결될 수 있고, 상기 제2 이더넷 포트(132)는 무인컴퓨터단말시스템(10)의 컴퓨터시스템(11)과 LAN을 통해 연결될 수 있으며, 제1 이더넷 포트(131)와 제2 이더넷 포트(132) 간에는 제1 패스(Path 1)가 형성될 수 있다.The first Ethernet
상기 장애복구실행제어부(MCU)(133)는 제1 이더넷 포트(131), 제2 이더넷 포트(132), 장애상태탐지부(110) 및 전원관리부(12)와 각각 연결될 수 있다. 좀 더 구체적으로, 장애복구실행제어부(MCU)(133)는 제1 이더넷 포트(131) 간의 제2 패스(Path 2)를 갖고, 제2 이더넷 포트(132) 간의 제3 패스(Path 3)을 갖고, SP 인터페이스를 통해 장애상태탐지부(110)와 연결되며, GPIO 인터페이스를 통해 전원관리부(12)와 연결될 수 있다. The failure recovery execution control unit (MCU) 133 may be connected to the first Ethernet
한편, 장애상태탐지부(110)는 컴퓨터시스템(11)과 제4 패스(Path 4)를 통해 연결될 수 있다.Meanwhile, the failure state detection unit 110 may be connected to the computer system 11 through a fourth path (Path 4).
이와 같이 구성된 원격 장애 복구 시스템(100)의 동작에 대하여 설명하면 다음과 같다.The operation of the remote
우선, 컴퓨터시스템(11)의 정상동작 시 원격장애복구관리부(120)와 컴퓨터시스템(11) 간은 제1 패스(Path 1)를 통해 연결되어 통신할 수 있다. 좀 더 구체적으로, 컴퓨터시스템(11)의 정상동작상태에서, 제1 이더넷 포트(131), 제1 패스(Path 1) 및 제2 이더넷 포트(132)를 통해 원격장애복구관리부(120)와 컴퓨터시스템(11) 간이 연결되어 통신할 수 있다. 또한, 장애복구실행제어부(133)는 제2 패스(Path 2)와 제3 패스(Path 3)를 통해 원격장애복구관리부(120)와 컴퓨터시스템(11) 간에 각각 연결되어 통신할 수 있다.First, during normal operation of the computer system 11, the remote fault
또한, 장애복구실행제어부(133)는 SP 인터페이스를 통해 장애상태탐지부(110)로부터 컴퓨터시스템(11)의 상태를 주기적으로 수신할 수 있다.In addition, the failure recovery execution control unit 133 may periodically receive the state of the computer system 11 from the failure state detection unit 110 through the SP interface.
상기 컴퓨터시스템(11)의 응답불능상태로 판단되면서 컴퓨터시스템(11)에 대한 인터넷 엑세스가 가능한 경우, 원격장애복구관리부(120)는 제1 패스(Path 1)를 통해 컴퓨터시스템(11)에 대한 장애복구를 직접 실행할 수 있다. 즉, 원격장애복구관리부(120)는 제1 이더넷 포트(131), 제1 패스(Path 1) 및 제2 이더넷 포트(132)를 통해 컴퓨터시스템(11)에 대한 복구작업을 직접 수행할 수 있다. If it is determined that the computer system 11 is in an unresponsive state and the Internet access to the computer system 11 is possible, the remote disaster
한편, 컴퓨터시스템(11)의 응답불능상태 시 대부분 컴퓨터시스템(11)에 대한 인터넷 엑세스가 불가능하므로, 이러한 경우, 장애복구실행제어부(133)는, 제2 패스(Path 2)를 통해 원격장애복구관리부(120)로 컴퓨터시스템(11)의 장애상태를 전송한 후 장애복구방법에 대한 제어를 기다린다. Since the Internet access to the computer system 11 can not be performed most of the time when the computer system 11 is in a non-responsive state, in this case, the failure recovery execution control unit 133 performs a remote failure recovery After the failure state of the computer system 11 is transmitted to the
이후, 장애복구실행제어부(133)는, 원격장애복구관리부(120)로부터 컴퓨터시스템(11)의 장애상태에 따른 제어명령을 수신하여 GPIO 인터페이스를 통해 전원관리부(12)의 전원을 제어하고, SP 인터페이스를 통해 컴퓨터시스템(11)에 대한 장애복구를 실행한 후 SP 인터페이스를 통해 컴퓨터시스템(11)의 부팅 시 부팅절차를 제어할 수 있다.The failure recovery execution control unit 133 receives a control command according to the failure status of the computer system 11 from the remote failure
일례로, 컴퓨터시스템(11)의 응답불능상태 시 컴퓨터시스템(11)에 대한 인터넷 엑세스가 불가능한 경우, 장애복구실행제어부(133)는, SP 인터페이스를 통해 컴퓨터시스템(11)의 제어권을 임시적으로 가져오고, 장애복구의 수행완료 시 해당 제어권을 컴퓨터시스템(11)으로 되돌려줄 수 있다. 좀 더 구체적으로, 컴퓨터시스템(11)의 응답불능상태 시 GPIO 인터페이스를 통해 전원관리부(12)의 전원을 오프시키고 컴퓨터시스템(11)의 부팅 시 SP 인터페이스를 통해 부팅 절차를 제어하는 제어신호를 보내 부팅절차를 진행하고, 일련의 복구작업을 수행한 후 정상적인 부팅절차를 다시 수행할 수 있다.For example, when the computer system 11 can not access the computer system 11 in an unresponsive state, the failure recovery execution control 133 temporarily takes control of the computer system 11 via the SP interface And returns the control to the computer system 11 upon completion of the failure recovery. More specifically, when the computer system 11 is in an unresponsive state, the power management unit 12 is powered off via the GPIO interface and a control signal is sent to the computer system 11 via the SP interface at boot time to control the booting procedure You can proceed with the boot process, perform a series of recovery operations, and then perform the normal boot procedure again.
도 3 및 도 4는 본 발명의 다른 실시예에 따른 원격 장애 복구 시스템의 구성도이다. 좀 더 구체적으로, 도 3은 무인컴퓨터단말시스템(20)에 전원관리부(22)가 내장된 형태이고, 도 4는 무인컴퓨터단말시스템(30)의 외부에 전원관리부(20)가 설치된 형태의 예를 나타낸 도면이다. 3 and 4 are block diagrams of a remote fault recovery system according to another embodiment of the present invention. More specifically, FIG. 3 shows a form in which the power management unit 22 is incorporated in the unmanned
우선, 도 3에 도시된 원격 장애 복구 시스템(200)에 대하여 설명하면, 해당 시스템(200)은 원격장애복구관리부(210) 및 장애복구실행부(220)를 포함한다.Referring to FIG. 3, the remote
상기 원격장애복구관리부(210)는 무인컴퓨터단말시스템(20)의 컴퓨터시스템(21)이 응답불능상태인 경우 컴퓨터시스템(21)의 원격장애복구실행을 위한 제어명령을 제공할 수 있다. The remote disaster
상기 장애복구실행부(220)는, 컴퓨터시스템(21)의 정상동작 시 원격장애복구관리부(210)와 연결되는 제1 이더넷 포트(221)와, 컴퓨터시스템(21)과 연결되는 제2 이더넷 포트(222)를 통해 컴퓨터시스템(21)과 원격장애복구관리부(210) 간을 연결하고, 제2 이더넷 포트(222)를 통해 컴퓨터시스템(21)의 상태를 감지하여 응답불능상태로 판단되면 제1 이더넷 포트(221)를 통해 원격장애복구관리부(210)로부터 제어명령을 수신하여 컴퓨터시스템(21)과 연결되는 SP 인터페이스(Serial Port Interface)를 통해 컴퓨터시스템(21)에 대한 장애복구를 실행하며, 전원관리부(22)와 연결된 GPIO 인터페이스(General Purpose I/O Interface)를 통해 전원관리부(22)를 제어할 수 있다.The failure
이를 위해, 장애복구실행부(220)는 제1 이더넷 포트(221), 제2 이더넷 포트(222), 장애상태탐지부(223), 장애복구실행제어부(224), SP 인터페이스 및 GPIO 인터페이스를 포함할 수 있다.To this end, the failure
상기 제1 이더넷 포트(221)는 원격장애복구관리부(210)와 WAN을 통해 연결되며, 제2 이더넷 포트(222)은 컴퓨터시스템(21)과 LAN을 통해 연결될 수 있다.The first Ethernet
상기 장애상태탐지부(223)는 제2 이더넷 포트(222)와 장애복구실행제어부(224) 간에 연결되어 컴퓨터시스템(223)의 상태를 감지할 수 있다. 이와 같이, 장애상태탐지부(223)는 장애복구실행부(220)에 내장될 수 있다.The failure
상기 장애복구실행제어부(224)는, 제1 이더넷 포트(221), 제2 이더넷 포트(222), 장애상태탐지부(223), 컴퓨터시스템(21) 및 전원관리부(22)와 각각 연결되고, 장애상태탐지부(223)로부터 컴퓨터시스템(21)의 상태를 전달 받을 수 있다. 또한, 제1 이더넷 포트(221)와 제2 이더넷 포트(222) 간의 제1 패스(Path 1), 제1 이더넷 포트(221)와 장애복구실행제어부(224) 간의 제2 패스(Path 2), 및 제2 이더넷 포트(222)와 장애복구실행제어부(224) 간의 제3 패스(Path 4)가 각각 형성될 수 있다. 또한, 장애복구실행제어부(224)는, SP 인터페이스를 통해 컴퓨터시스템(21)과 연결되며, GPIO 인터페이스를 통해 전원관리부(22)와 연결될 수 있다.The failure recovery execution control unit 224 is connected to the
이러한 도 3에 도시된 원격 장애 복구 시스템(200)의 동작에 대하여 설명하면 다음과 같다. The operation of the remote
우선, 컴퓨터시스템(21)의 정상동작 시 원격장애복구관리부(210)와 컴퓨터시스템(21) 간은 제1 패스(Path 1)를 통해 연결되어 통신하고, 장애복구실행제어부(224)는, 제2 패스(Path 2)와 제3 패스(Path 3)를 통해 원격장애복구관리부(210)와 컴퓨터시스템(21)에 각각 연결되어 통신하고, 제4 패스(Path 4)를 통해 장애상태탐지부(223)로부터 컴퓨터시스템(21)의 상태를 주기적으로 수신할 수 있다.First, during normal operation of the computer system 21, the remote fault
한편, 컴퓨터시스템(21)의 응답불능상태 시 컴퓨터시스템(21)에 대한 인터넷 엑세스가 가능한 경우, 원격장애복구관리부(210)는 제1 이더넷 포트(221), 제1 패스(Path 1) 및 제2 이더넷 포트(222)를 통해 컴퓨터시스템(21)에 대한 장애복구를 직접 실행할 수 있다.If the computer system 21 can not access the computer system 21 when the computer system 21 is in an unresponsive state, the remote fault
또한, 컴퓨터시스템(21)의 응답불능상태 시 컴퓨터시스템(21)에 대한 인터넷 엑세스가 불가능하므로, 이러한 경우, 장애복구실행제어부(224)는, 제2 패스(Path 2)를 통해 원격장애복구관리부(210)로 장애상태를 전송한 후 원격장애복구관리부(210)로부터 제어명령을 수신하여 GPIO 인터페이스를 통해 전원관리부(22)의 전원을 제어하고, SP 인터페이스를 통해 컴퓨터시스템(21)에 대한 장애복구를 실행한 후 SP 인터페이스를 통해 컴퓨터시스템(21)의 부팅 시 부팅절차를 제어할 수 있다. In addition, since the Internet access to the computer system 21 is not possible when the computer system 21 is in an unresponsive state, in this case, the failure recovery execution control unit 224 controls the remote fail- The
좀 더 구체적으로, 컴퓨터시스템(21)의 응답불능상태 시 상기 컴퓨터시스템에 대한 인터넷 엑세스가 불가능한 경우, 장애복구실행제어부(224)는, SP 인터페이스를 통해 컴퓨터시스템(21)의 제어권을 임시적으로 가져오고, 장애복구의 수행완료 시 해당 제어권을 컴퓨터시스템(21)으로 되돌려줄 수 있다.More specifically, when the computer system 21 is unable to access the computer system in an unresponsive state, the failure recovery execution control unit 224 temporarily takes control of the computer system 21 via the SP interface And returns the control to the computer system 21 upon completion of the failure recovery.
이러한 도 3에 도시된 원격 장애 복구 시스템(200)은 장애상태탐지부(223)가 일 실시예와 달리 장애복구실행부(220)에 내장되어 있어, 제4 패스(Path 4)와 제2 이더넷 포트(222)의 LAN을 통해 컴퓨터 시스템(21)에 대한 장애상태를 주기적으로 감지할 수 있을 뿐만 아니라, 장애복구실행제어부(224)가 SP 인터페이스와 제5 패스(Path 5)를 통해 컴퓨터시스템(21)과의 통신을 통한 장애상태탐지와 장애복구실행도 가능하다.The remote
한편, 도 4에 도시된 원격 장애 복구 시스템(200)은, 무인컴퓨터단말시스템(30)의 전원관리부(40)가 외부에 설치된 경우로서, 컴퓨터시스템(31)이 응답불능의 상태에서 전원관리부(40)에 내부에 있는 도 3에 도시된 장애복구실행부(220)의 전원관리시스템도 동작을 하지 않을 경우도 있으므로, 전원관리부(40)를 외부에 두고 컴퓨터시스템(31)의 장애복구를 수행할 수 있다.The remote
도 5는 본 발명의 실시예에 따른 장애복구실행부의 구성도이다.5 is a configuration diagram of a failure recovery execution unit according to an embodiment of the present invention.
도 5를 참조하면, SE(Security Engine)은 외부의 원격장애복구관리부(120, 210)와의 통신 보안을 위해 보안기능을 담당한다. EMC(External Memory Controller)은 외부 실행프로그램을 가져오거나 IDS(Intrusion Prevention System) 등 장애복구실행부(130, 220)에서 장애복구 관련 기능 수행 시 필요한 관리테이블을 가져오는 역할을 수행한다. IDS(Intrusion Prevention System)는 외부 해킹 등의 악성 침입자의 공격을 탐지하고 방지하는 역할을 수행한다. 외부로부터 장애복구실행부의 장애복구기능을 보호하기 위해 SE(Security Engine)와 IDS(Intrusion Prevention System)는 상호 보완적인 역할을 수행한다. 전원관리부(12, 22, 40)의 제어를 위한 GPIO 인터페이스를 포함하고 있고 무인컴퓨터단말시스템(10, 20, 30)의 부팅 시의 제어권을 가져오기 위해 키보드 에뮬레이션(Keyboard Emulation) 기능을 구현하고 USB 인터페이스를 통해 키보드 제어 신호(Keyboard Control Signal)를 무인컴퓨터단말시스템(10, 20, 30)으로 전송한다.Referring to FIG. 5, the Security Engine (SE) takes charge of security functions for securing communication with the external remote fault
또한, 장애복구실행부(130, 220)는 제1 내지 제5 패스(Path1, Path2, Path3, Path4, Path5)를 통한 데이터 및 제어신호의 전송을 위해 내부적으로 2포트의 이더넷 인터페이스를 가지고 있으면 이러한 전송 패스의 연결을 위해 이더넷 스위치 패브릭(Ethernet Switch Fabric)을 구현할 수 있다.In addition, if the failure
도 6은 본 발명의 실시예에 따른 장애복구실행부에서 수행되는 펌웨어(Firmware)의 기본 동작을 나타낸 순서도이다.FIG. 6 is a flowchart illustrating a basic operation of a firmware executed in the failure recovery execution unit according to the embodiment of the present invention.
TCP/IP stack, SSL stack등 통신에 필요한 기본적인 모듈이 존재하며 무인컴퓨터단말시스템(10, 20, 30)과의 통신을 통해 무인컴퓨터단말시스템(10, 20, 30)에 대한 장애를 판단한다. 장애상황에서도 통신을 지원하기 위한 Network Switch Fabric Control과 부팅 시 부팅 제어권을 확보하기 위한 USB HID 및 BIOS 제어 기능을 포함한다. UEFI Control Module과 USB Storage Module은 시스템 백업/복구를 위한 것이며, 무인컴퓨터단말시스템(10, 20, 30)의 Sensing Module을 이용해 무인컴퓨터단말시스템(10, 20, 30)에 대한 추가적인 데이터를 수집한다.A basic module for communication such as a TCP / IP stack and an SSL stack exists and communicates with the unmanned
본 발명의 실시예에 따르면, 무인컴퓨터단말시스템의 시리얼통신을 통해 복구와 이더넷포트를 통한 복구도 가능하다.According to the embodiment of the present invention, it is also possible to recover through the serial communication of the unmanned computer terminal system and to recover through the Ethernet port.
또한, 시리얼통신으로 USB HID를 사용함으로써 전원관리 후 부팅 시 부팅 및 복구 제어권을 가질 수 있는 구조(단순 RS232로는 불가능)를 갖는다.In addition, it has a structure (simple RS232 is not possible) which can have boot and recovery control right after power management by using USB HID as serial communication.
또한, 기존운영체제에 문제가 발생했을 경우 기존운영체제의 컴퓨터시스템은 응답불능의 상태에 빠지나, 본 실시예의 경우, 별도의 하드웨어를 이용하여 원격으로 운영체제의 복구이미지를 제공함으로써 새로운 운영체제를 복구하는 기능도 가능하다. 이에 따라, 별도의 복구이미지 저장을 위한 저장장치가 불필요하다. 이때 전원의 온/오프만으로도 복구가 가능하면 원격으로 새로운 운영체제의 복구이미지를 제공할 필요가 없게 된다.When a problem occurs in the existing operating system, the computer system of the existing operating system falls into a state of being unresponsive. In this embodiment, however, the function of recovering the new operating system by providing the recovery image of the operating system remotely using the separate hardware It is possible. Accordingly, a storage device for storing a separate recovery image is unnecessary. At this time, if the power can be restored only by turning the power on and off, there is no need to remotely provide a recovery image of the new operating system.
이상에서 설명한 것은 본 발명에 의한 원격 장애 복구 시스템을 실시하기 위한 하나의 실시예에 불과한 것으로서, 본 발명은 상기 실시예에 한정되지 않고, 이하의 특허청구범위에서 청구하는 바와 같이 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변경 실시가 가능한 범위까지 본 발명의 기술적 정신이 있다고 할 것이다.As described above, the remote fault recovery system according to the present invention is only one embodiment, and the present invention is not limited to the above embodiments, It will be understood by those of ordinary skill in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention.
100: 원격 장애 복구 시스템
110: 장애상태탐지부
120: 원격장애복구관리부
130: 장애복구실행부
131: 제1 이더넷 포트
132: 제2 이더넷 포트
133: 장애복구실행제어부
Path 1: 제1 패스
Path 2: 제2 패스
Path 3: 제3 패스
Path 4: 제4 패스
SP(Serial Port): SP 인터페이스
GPIO(General Purpose Input/Output): GPIO 인터페이스
10: 무인컴퓨터단말시스템
11: 컴퓨터시스템
12: 전원관리부
200: 원격 장애 복구 시스템
210: 원격장애복구관리부
220: 장애복구실행부
221: 제1 이더넷 포트
222: 제2 이더넷 포트
223: 장애상태탐지부
224: 장애복구실행제어부
Path 1: 제1 패스
Path 2: 제2 패스
Path 3: 제3 패스
Path 4: 제4 패스
SP(Serial Port): SP 인터페이스
GPIO(General Purpose Input/Output): GPIO 인터페이스
20, 30: 무인컴퓨터단말시스템
21, 31: 컴퓨터시스템
22, 40: 전원관리부100: Remote Disaster Recovery System
110: Fault state detection unit
120: remote failure recovery management unit
130: Failback execution unit
131: First Ethernet port
132: Second Ethernet port
133: Failback execution control unit
Path 1: First pass
Path 2: Second pass
Path 3: Third pass
Path 4:
SP (Serial Port): SP interface
GPIO (General Purpose Input / Output): GPIO interface
10: Unmanned computer terminal system
11: Computer system
12: Power management unit
200: Remote disaster recovery system
210: remote disaster recovery management unit
220: Failback Execution Unit
221: First Ethernet port
222: Second Ethernet port
223: Failure state detection unit
224: Failback execution control unit
Path 1: First pass
Path 2: Second pass
Path 3: Third pass
Path 4:
SP (Serial Port): SP interface
GPIO (General Purpose Input / Output): GPIO interface
20, 30: Unmanned computer terminal system
21, 31: Computer system
22, 40: Power management unit
Claims (8)
응답불능상태인 상기 컴퓨터시스템에 대한 원격장애복구실행을 위한 제어명령을 제공하는 원격장애복구관리부; 및
상기 컴퓨터시스템의 정상동작 시 상기 원격장애복구관리부와 연결되는 제1 이더넷 포트와, 상기 컴퓨터시스템과 연결되는 제2 이더넷 포트를 통해 상기 컴퓨터시스템과 상기 원격장애복구관리부 간을 연결하고, 상기 장애상태탐지부를 통해 상기 컴퓨터시스템이 응답불능상태로 판단되면 상기 제1 이더넷 포트를 통해 상기 제어명령을 수신하여 상기 장애상태탐지부 및 상기 전원관리부 각각과의 연결 경로를 통해 상기 컴퓨터시스템에 대한 장애복구를 실행하며, 상기 전원관리부를 제어하는 장애복구실행부를 포함하는 것을 특징으로 하는 원격 장애 복구 시스템.
A failure state detection unit built in the unmanned computer terminal system together with the power management unit to detect the state of the computer system of the unmanned computer terminal system;
A remote disaster recovery management unit for providing a control command for executing a remote disaster recovery to the computer system in an unresponsive state; And
A first Ethernet port connected to the remote fault recovery management unit during normal operation of the computer system and a second Ethernet port connected to the computer system to connect the computer system and the remote fault recovery management unit, When the computer system determines that the computer system is not able to respond through the detection unit, receives the control command through the first Ethernet port and performs failover to the computer system through the connection path between the failure state detection unit and the power management unit And a failure recovery execution unit for controlling the power management unit.
상기 장애복구실행부는,
상기 원격장애복구관리부와 연결된 상기 제1 이더넷 포트;
상기 컴퓨터시스템과 연결된 상기 제2 이더넷 포트; 및
상기 제1 이더넷 포트, 상기 제2 이더넷 포트, 상기 장애상태탐지부 및 상기 전원관리부와 각각 연결되는 장애복구실행제어부를 포함하고,
상기 제1 이더넷 포트와 상기 제2 이더넷 포트 간의 제1 패스;
상기 제1 이더넷 포트와 상기 장애복구실행제어부 간의 제2 패스; 및
상기 제2 이더넷 포트와 상기 장애복구실행제어부 간의 제3 패스를 형성하고,
상기 장애복구실행제어부는, 상기 장애상태탐지부와 SP 인터페이스(Serial Port Interface)를 통해 연결되며, 상기 전원관리부와 GPIO 인터페이스(General Purpose I/O Interface)를 통해 연결되고,
상기 장애상태탐지부는, 제4 패스를 통해 상기 컴퓨터시스템과 연결된 것을 특징으로 하는 원격 장애 복구 시스템.
The method according to claim 1,
The failure recovery execution unit,
The first Ethernet port connected to the remote fault recovery management unit;
The second Ethernet port coupled to the computer system; And
And a failure recovery execution control unit connected to the first Ethernet port, the second Ethernet port, the failure state detection unit, and the power management unit,
A first path between the first Ethernet port and the second Ethernet port;
A second path between the first Ethernet port and the failback execution control section; And
Forming a third path between the second Ethernet port and the failure recovery execution control unit,
The failure recovery execution control unit is connected to the failure state detection unit through an SP interface (Serial Port Interface), connected to the power management unit through a GPIO interface (general purpose I / O interface)
Wherein the failure state detection unit is connected to the computer system via a fourth pass.
상기 컴퓨터시스템의 정상동작 시,
상기 원격장애복구관리부와 상기 컴퓨터시스템 간은 상기 제1 패스를 통해 연결되어 통신하고,
상기 장애복구실행제어부는, 상기 제2 패스와 상기 제3 패스를 통해 상기 원격장애복구관리부와 상기 컴퓨터시스템 간에 각각 연결되어 통신하고, 상기 SP 인터페이스를 통해 상기 장애상태탐지부로부터 상기 컴퓨터시스템의 상태를 주기적으로 수신하고,
상기 컴퓨터시스템의 응답불능상태 시 상기 컴퓨터시스템에 대한 인터넷 엑세스가 가능한 경우,
상기 원격장애복구관리부는 상기 제1 패스를 통해 상기 컴퓨터시스템에 대한 장애복구를 직접 실행하고,
상기 컴퓨터시스템의 응답불능상태 시 상기 컴퓨터시스템에 대한 인터넷 엑세스가 불가능한 경우,
상기 장애복구실행제어부는, 상기 제2 패스를 통해 상기 원격장애복구관리부로 장애상태를 전송한 후 상기 원격장애복구관리부로부터 상기 제어명령을 수신하여 상기 GPIO 인터페이스를 통해 상기 전원관리부의 전원을 제어하고, 상기 SP 인터페이스를 통해 상기 컴퓨터시스템에 대한 장애복구를 실행한 후 상기 SP 인터페이스를 통해 상기 컴퓨터시스템의 부팅 시 부팅절차를 제어하는 것을 특징으로 하는 원격 장애 복구 시스템.
3. The method of claim 2,
Upon normal operation of the computer system,
Wherein the remote fault recovery management unit and the computer system are connected and communicating via the first path,
Wherein the failure recovery execution control unit communicates and communicates with the remote fault recovery management unit and the computer system through the second path and the third path, respectively, and transmits the state of the computer system from the failure state detection unit via the SP interface Lt; / RTI > periodically,
Wherein when the computer system is in an unresponsive state, Internet access to the computer system is enabled,
Wherein the remote failure recovery management unit directly executes failure recovery for the computer system via the first path,
If the computer system is unable to access the computer system in an unresponsive state,
The failure recovery execution control unit transmits a failure status to the remote failure recovery management unit through the second path, receives the control command from the remote failure recovery management unit, and controls power of the power management unit through the GPIO interface And a boot-up booting procedure of the computer system via the SP interface after performing a failover to the computer system via the SP interface.
상기 컴퓨터시스템의 응답불능상태 시 상기 컴퓨터시스템에 대한 인터넷 엑세스가 불가능한 경우,
상기 장애복구실행제어부는, 상기 SP 인터페이스를 통해 상기 컴퓨터시스템의 제어권을 임시적으로 가져오고, 장애복구의 수행완료 시 해당 제어권을 상기 컴퓨터시스템으로 되돌려주는 것을 특징으로 하는 원격 장애 복구 시스템.
The method of claim 3,
If the computer system is unable to access the computer system in an unresponsive state,
Wherein the failure recovery execution control unit temporarily takes control of the computer system through the SP interface and returns the control right to the computer system upon completion of the failure recovery.
응답불능상태인 상기 무인컴퓨터단말시스템의 컴퓨터시스템에 대한 원격장애복구실행을 위한 제어명령을 제공하는 원격장애복구관리부; 및
상기 컴퓨터시스템의 정상동작 시 상기 원격장애복구관리부와 연결되는 제1 이더넷 포트와, 상기 컴퓨터시스템과 연결되는 제2 이더넷 포트를 통해 상기 컴퓨터시스템과 상기 원격장애복구관리부 간을 연결하고, 상기 제2 이더넷 포트를 통해 상기 컴퓨터시스템의 상태를 감지하여 응답불능상태로 판단되면 상기 제1 이더넷 포트를 통해 상기 제어명령을 수신하여 상기 컴퓨터시스템과 직접 연결되는 SP 인터페이스(Serial Port Interface)를 통해 상기 컴퓨터시스템에 대한 장애복구를 실행하며, 상기 전원관리부와 연결되는 GPIO 인터페이스(General Purpose I/O Interface)를 통해 상기 전원관리부를 제어하는 장애복구실행부를 포함하는 것을 특징으로 하는 원격 장애 복구 시스템.
The present invention relates to a system for remotely recovering a failure of an unmanned computer terminal system having a built-in or external power management unit,
A remote fault recovery management unit for providing a control command for executing a remote fault recovery to a computer system of the unmanned computer terminal system in an unresponsive state; And
A first Ethernet port connected to the remote fault recovery management unit during normal operation of the computer system and a second Ethernet port connected to the computer system to connect the computer system and the remote fault recovery management unit, And a control unit for receiving the control command through the first Ethernet port and detecting the status of the computer system through an Ethernet port, And a failure recovery execution unit for performing failure recovery for the power management unit and controlling the power management unit through a GPIO interface (general purpose I / O interface) connected to the power management unit.
상기 장애복구실행부는,
상기 원격장애복구관리부와 연결된 상기 제1 이더넷 포트;
상기 컴퓨터시스템과 연결된 상기 제2 이더넷 포트;
상기 제2 이더넷 포트와 상기 장애복구실행제어부 간에 연결되어 상기 컴퓨터시스템의 상태를 감지하는 장애상태탐지부; 및
상기 제1 이더넷 포트, 상기 제2 이더넷 포트, 상기 장애상태탐지부, 상기 컴퓨터시스템 및 상기 전원관리부와 각각 연결되고, 상기 장애상태탐지부로부터 상기 컴퓨터시스템의 상태를 전달 받는 장애복구실행제어부를 포함하고,
상기 제1 이더넷 포트와 상기 제2 이더넷 포트 간의 제1 패스;
상기 제1 이더넷 포트와 상기 장애복구실행제어부 간의 제2 패스;
상기 제2 이더넷 포트와 상기 장애복구실행제어부 간의 제3 패스; 및
상기 제2 이더넷 포트와 상기 장애상태탐지부 간의 제4 패스를 형성하고,
상기 장애복구실행제어부는, 상기 SP 인터페이스를 통해 상기 컴퓨터시스템과 연결되며, 상기 GPIO 인터페이스를 통해 상기 전원관리부와 연결된 것을 특징으로 하는 원격 장애 복구 시스템.
6. The method of claim 5,
The failure recovery execution unit,
The first Ethernet port connected to the remote fault recovery management unit;
The second Ethernet port coupled to the computer system;
A failure state detection unit coupled between the second Ethernet port and the failure recovery execution control unit to detect a state of the computer system; And
And a failure recovery execution control unit connected to the first Ethernet port, the second Ethernet port, the failure state detection unit, the computer system, and the power management unit, and receiving a state of the computer system from the failure state detection unit and,
A first path between the first Ethernet port and the second Ethernet port;
A second path between the first Ethernet port and the failback execution control section;
A third path between the second Ethernet port and the failback execution control section; And
Forming a fourth path between the second Ethernet port and the fault state detection unit,
Wherein the failure recovery execution control unit is connected to the computer system through the SP interface and is connected to the power management unit through the GPIO interface.
상기 컴퓨터시스템의 정상동작 시,
상기 원격장애복구관리부와 상기 컴퓨터시스템 간은 상기 제1 패스를 통해 연결되어 통신하고,
상기 장애복구실행제어부는, 상기 제2 패스와 상기 제3 패스를 통해 상기 원격장애복구관리부와 상기 컴퓨터시스템에 각각 연결되어 통신하고, 상기 제4 패스를 통해 상기 장애상태탐지부로부터 상기 컴퓨터시스템의 상태를 주기적으로 수신하고,
상기 컴퓨터시스템의 응답불능상태 시 상기 컴퓨터시스템에 대한 인터넷 엑세스가 가능한 경우,
상기 원격장애복구관리부는 상기 제1 패스를 통해 상기 컴퓨터시스템에 대한 장애복구를 직접 실행하고,
상기 컴퓨터시스템의 응답불능상태 시 상기 컴퓨터시스템에 대한 인터넷 엑세스가 불가능한 경우,
상기 장애복구실행제어부는, 상기 제2 패스를 통해 상기 원격장애복구관리부로 장애상태를 전송한 후 상기 원격장애복구관리부로부터 상기 제어명령을 수신하여 상기 GPIO 인터페이스를 통해 상기 전원관리부의 전원을 제어하고, 상기 SP 인터페이스를 통해 상기 컴퓨터시스템에 대한 장애복구를 실행한 후 상기 SP 인터페이스를 통해 상기 컴퓨터시스템의 부팅 시 부팅절차를 제어하는 것을 특징으로 하는 원격 장애 복구 시스템.
The method according to claim 6,
Upon normal operation of the computer system,
Wherein the remote fault recovery management unit and the computer system are connected and communicating via the first path,
Wherein the failure recovery execution control unit is connected to and communicates with the remote failure recovery management unit and the computer system via the second path and the third path, Periodically receives the status,
Wherein when the computer system is in an unresponsive state, Internet access to the computer system is enabled,
Wherein the remote failure recovery management unit directly executes failure recovery for the computer system via the first path,
If the computer system is unable to access the computer system in an unresponsive state,
The failure recovery execution control unit transmits a failure status to the remote failure recovery management unit through the second path, receives the control command from the remote failure recovery management unit, and controls power of the power management unit through the GPIO interface And a boot-up booting procedure of the computer system via the SP interface after performing a failover to the computer system via the SP interface.
상기 컴퓨터시스템의 응답불능상태 시 상기 컴퓨터시스템에 대한 인터넷 엑세스가 불가능한 경우,
상기 장애복구실행제어부는, 상기 SP 인터페이스를 통해 상기 컴퓨터시스템의 제어권을 임시적으로 가져오고, 장애복구의 수행완료 시 해당 제어권을 상기 컴퓨터시스템으로 되돌려주는 것을 특징으로 하는 원격 장애 복구 시스템.8. The method of claim 7,
If the computer system is unable to access the computer system in an unresponsive state,
Wherein the failure recovery execution control unit temporarily takes control of the computer system through the SP interface and returns the control right to the computer system upon completion of the failure recovery.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180105569A KR101977953B1 (en) | 2018-09-04 | 2018-09-04 | Remote fault recovery system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180105569A KR101977953B1 (en) | 2018-09-04 | 2018-09-04 | Remote fault recovery system |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180105102A true KR20180105102A (en) | 2018-09-27 |
KR101977953B1 KR101977953B1 (en) | 2019-05-13 |
Family
ID=63719301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180105569A KR101977953B1 (en) | 2018-09-04 | 2018-09-04 | Remote fault recovery system |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101977953B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200044266A (en) * | 2018-10-18 | 2020-04-29 | (주)모비그램 | Method for unmanned remote control and apparatus using the same |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003242579A (en) * | 2002-02-20 | 2003-08-29 | Nippon Reliance Kk | Remote fault diagnosis system |
KR20030084473A (en) * | 2002-04-27 | 2003-11-01 | (주)소프트위드솔루션 | GUI based integrated remote management system for controlling power on-off and picture of the remote computer system and generating alarm signal |
KR20060128366A (en) * | 2005-06-10 | 2006-12-14 | 노틸러스효성 주식회사 | Modem control system and method of atm |
JP2009048646A (en) * | 2008-09-22 | 2009-03-05 | Victor Co Of Japan Ltd | Remote failure diagnostic method for household electrical appliance |
KR100972228B1 (en) | 2010-04-28 | 2010-07-26 | 주식회사 유네트 | Recovery method of remote terminal unit error |
KR20110080583A (en) | 2010-01-06 | 2011-07-13 | 삼성전자주식회사 | Computer system to be able to remotely restore operation system and method for restoration thereof |
-
2018
- 2018-09-04 KR KR1020180105569A patent/KR101977953B1/en active IP Right Grant
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003242579A (en) * | 2002-02-20 | 2003-08-29 | Nippon Reliance Kk | Remote fault diagnosis system |
KR20030084473A (en) * | 2002-04-27 | 2003-11-01 | (주)소프트위드솔루션 | GUI based integrated remote management system for controlling power on-off and picture of the remote computer system and generating alarm signal |
KR20060128366A (en) * | 2005-06-10 | 2006-12-14 | 노틸러스효성 주식회사 | Modem control system and method of atm |
JP2009048646A (en) * | 2008-09-22 | 2009-03-05 | Victor Co Of Japan Ltd | Remote failure diagnostic method for household electrical appliance |
KR20110080583A (en) | 2010-01-06 | 2011-07-13 | 삼성전자주식회사 | Computer system to be able to remotely restore operation system and method for restoration thereof |
KR100972228B1 (en) | 2010-04-28 | 2010-07-26 | 주식회사 유네트 | Recovery method of remote terminal unit error |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200044266A (en) * | 2018-10-18 | 2020-04-29 | (주)모비그램 | Method for unmanned remote control and apparatus using the same |
Also Published As
Publication number | Publication date |
---|---|
KR101977953B1 (en) | 2019-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8001221B2 (en) | Method of building system and management server | |
EP1602935A1 (en) | Electronic device diagnostic methods and systems | |
US10250325B2 (en) | Network switching system | |
US20080313319A1 (en) | System and method for providing multi-protocol access to remote computers | |
CN105242980A (en) | Complementary watchdog system and complementary watchdog monitoring method | |
CN111510398A (en) | Control device and method for redundant connections in a control plane network | |
US11258666B2 (en) | Method, device, and system for implementing MUX machine | |
KR101977953B1 (en) | Remote fault recovery system | |
CN109194744A (en) | A kind of data transmission method, device, storage medium and monitoring device | |
CN104734904A (en) | Automatic detection method and system of by-pass equipment | |
CN106407081B (en) | Case management system and server | |
JP2006285384A (en) | Processor trouble processing method, management processor, and processor trouble processing method | |
US6694201B1 (en) | Supervisory parallel switching device for computer integrated manufacturing system with secs-compliant serial communication links | |
JP6187508B2 (en) | Control device, bus circuit, method, and program | |
JP5651004B2 (en) | Computer switching system, computer switching program, and computer switching method | |
JP2016206898A (en) | Information processing device, fault detection method, and computer program | |
CN113687869B (en) | Method and device for being compatible with TXT function and ASD function | |
US9787532B2 (en) | Module, system and method of switching modules | |
KR20120138488A (en) | Optical line termination for managing reset database and the method | |
KR101969393B1 (en) | A cctv recorder watchdog system with 2-step control | |
JP2000057017A (en) | Remote control module and computer with remote control function using the module | |
JP5433219B2 (en) | Cluster system | |
JP2002300176A (en) | Data communication unit, data communication method, program for the data communication method, and recording medium with recorded program for the data communication method | |
KR101245014B1 (en) | ATM and method for connecting to Branch Processor using the same | |
JP2002209127A (en) | Camera system incorporating automatic returning function |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |