KR102322121B1 - Automatic Disaster Recovery System And Recovery Method Thereof - Google Patents

Automatic Disaster Recovery System And Recovery Method Thereof Download PDF

Info

Publication number
KR102322121B1
KR102322121B1 KR1020150079343A KR20150079343A KR102322121B1 KR 102322121 B1 KR102322121 B1 KR 102322121B1 KR 1020150079343 A KR1020150079343 A KR 1020150079343A KR 20150079343 A KR20150079343 A KR 20150079343A KR 102322121 B1 KR102322121 B1 KR 102322121B1
Authority
KR
South Korea
Prior art keywords
backup
center
servers
response
group
Prior art date
Application number
KR1020150079343A
Other languages
Korean (ko)
Other versions
KR20150115690A (en
Inventor
김정호
Original Assignee
주식회사 메이엔
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 메이엔 filed Critical 주식회사 메이엔
Priority to KR1020150079343A priority Critical patent/KR102322121B1/en
Publication of KR20150115690A publication Critical patent/KR20150115690A/en
Application granted granted Critical
Publication of KR102322121B1 publication Critical patent/KR102322121B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0695Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

본 발명은 운영센터를 구성하는 복수의 서버의 응답 반응시간을 파악하여 상기 응답 반응시간에 따라 상기 운영센터의 재해 발생 여부를 판단함으로써 보다 정확한 재해 발생 여부 판단이 가능하며, 상기 운영센터의 재해 발생 판단 시, 상기 운영센터와 동기화된 백업센터를 구성하는 복수의 서버를 분류된 서버 별로 병렬적으로 자동 기동함으로써 서버들 간의 상호 충돌을 방지하면서, 보다 신속한 백업센터의 기동 또한 가능한 재해복구 자동화 시스템 및 방법에 관한 것이다.According to the present invention, by determining the response time of a plurality of servers constituting the operation center and determining whether a disaster has occurred in the operation center according to the response time, it is possible to more accurately determine whether a disaster has occurred, and the disaster occurrence of the operation center At the time of judgment, a disaster recovery automation system that enables faster startup of the backup center while preventing mutual conflicts between servers by automatically starting a plurality of servers constituting the backup center synchronized with the operation center in parallel for each classified server, and it's about how

Figure R1020150079343
Figure R1020150079343

Description

재해복구 자동화 시스템 및 방법{Automatic Disaster Recovery System And Recovery Method Thereof}Automatic Disaster Recovery System And Recovery Method Thereof

본 발명의 일시예는 재해복구 자동화 시스템 및 방법에 관한 것이다. One embodiment of the present invention relates to a disaster recovery automation system and method.

일반적으로 재해복구 시스템은 시스템에 침입할 수 있는 바이러스와 같은 경로에 의한 시스템의 손상이나, 화재 및 지진과 같은 천재지변과 같은 갑작스러운 사고로 인한 재해적 고장 또는 일정 기간에 걸쳐 발생되는 데이터 손실을 대비하기 위하여 존재한다.In general, the disaster recovery system protects against damage to the system by a path such as a virus that can invade the system, a catastrophic failure due to sudden accidents such as natural disasters such as fire and earthquake, or data loss that occurs over a period of time. exist to prepare.

기존의 재해복구 시스템은 재해가 없는 일반적인 경우에는 운영센터를 구성하는 복수의 장치를 통해 전산 업무 서비스를 제공하는 등의 시스템 역할을 수행하나, 상기 운영센터에서 시스템 장애 등의 재해가 발생하는 경우 상기 운영센터로부터 동기화되어 백업되는 백업센터에서 상기 운영센터의 역할을 대신 수행한다. 따라서, 상기 운영센터에 재해가 발생하는 경우, 상기 운영센터는 상기 백업센터로 신속하게 전환되어야 한다.The existing disaster recovery system performs a system role such as providing computerized service through a plurality of devices constituting the operation center in the general case where there is no disaster, but when a disaster such as a system failure occurs in the operation center, the In the backup center that is synchronized and backed up from the operation center, it performs the role of the operation center instead. Therefore, when a disaster occurs in the operation center, the operation center must be quickly switched to the backup center.

그러나, 종래의 재해복구 시스템은 재해 발생 이후, 재해 인식 및 재해 선포까지의 시간과, 재해 선포 이후 백업센터의 시스템을 기동하는 절차에 있어서, 모든 절차를 운영자의 수작업에 의존하여, 시스템 가동, 네트워크 전환, 네트워크 장비, 서버 환경설정, 데이터 검증 및 어플리케이션 구동 등의 각 단계를 운영자가 수동으로 일일이 기동하고 있다.However, the conventional disaster recovery system depends on the manual operation of the operator for all procedures in the time from the occurrence of a disaster, until the recognition of the disaster and the declaration of the disaster, and the procedure of starting the system of the backup center after the declaration of the disaster. Each step such as conversion, network equipment, server environment setting, data verification and application operation is started one by one manually by the operator.

이러한, 운영자의 수작업에 의존한 재해복구 시스템의 기동은 백업센터로의 전환 단계에서 운영자의 승인 과정을 거쳐 각각의 단계가 기동되기 때문에 신속함이 절대적으로 요구되는 재해복구 과정의 신속한 수행이 불가능하며, 운영자의 각 단계별 개입에 의해 운영자에게 있어서 매우 번거로운 작업이 될 수 있다.The operation of the disaster recovery system, which relied on the operator's manual operation, is initiated through the operator's approval process in the conversion stage to the backup center. , it can be a very cumbersome operation for the operator by the intervention of each step by the operator.

따라서, 최근에는 보다 신속한 재해복구 과정을 실현할 수 있는 한 방법으로서 운영센터의 재해 인식을 함에 있어서, 운영센터를 구성하는 각각의 장치들이 클라이언트의 요청을 전송 받는 요청 량인 트래픽(traffic) 흐름을 자동으로 감지하여 상기 트래픽 흐름이 중단되거나 비정상적인 흐름 패턴이 감지될 시 상기 운영센터에 재해가 발생된 것으로 판단하여 재해 복구 과정을 수행하는 시스템이 개발되었다.Therefore, in recent years, in recognizing the disaster of the operation center as a way to realize a more rapid disaster recovery process, each device constituting the operation center automatically controls the traffic flow, which is the amount of requests that the clients receive. A system has been developed that detects and performs a disaster recovery process by determining that a disaster has occurred in the operation center when the traffic flow is stopped or an abnormal flow pattern is detected.

그러나, 상기와 같이 트래픽 흐름의 기초를 둔 재해 인식방법을 포함하는 재해복구 시스템은, 운영센터에 재해가 발생되지 않은 상황에서도 상기 트래픽의 급증, 급감, 또는 불안정적인 트래픽 흐름이 일시적으로 감지되는 경우에도 상기 운영센터에 재해가 발생된 것으로 판단될 수 있으므로 신속함과 더불어 재해 발생 진단의 정확성 또한 요구되는 재해복구 시스템에 있어서 이상적인 모델이라고 할 수 없다.However, in the disaster recovery system including the method for recognizing a traffic flow based on the traffic flow as described above, even when a disaster does not occur in the operation center, a sudden increase, a sharp drop, or an unstable traffic flow is temporarily detected. Since it can be determined that a disaster has occurred in the operation center even in the early days of the year, it cannot be said to be an ideal model for a disaster recovery system that requires both speed and accuracy in diagnosing the occurrence of a disaster.

이에 따라 보다 정확한 재해 발생 감지 능력을 갖춤과 동시에, 보다 신속한 재해복구 과정이 수행될 수 있는 재해복구 자동화 시스템 및 방법의 제공이 요구되고 있다.Accordingly, there is a need to provide a disaster recovery automation system and method capable of performing a more accurate disaster detection capability and faster disaster recovery process.

본 발명의 주된 목적은, 재해복구 시스템을 기동함에 있어서, 운영센터의 재해 발생여부 판단 시, 상기 운영센터를 구성하는 복수의 서버의 응답 반응시간을 감지하여 판단함으로써, 보다 정확한 재해 발생 여부 판단을 제공할 수 있는 재해복구 자동화 시스템 및 방법을 제공하는 것이다.The main object of the present invention is to detect and determine the response time of a plurality of servers constituting the operation center when judging whether a disaster has occurred in the operation center in activating the disaster recovery system, so that a more accurate determination of whether a disaster occurs It is to provide a disaster recovery automation system and method that can be provided.

또한, 운영센터에 재해 발생 시, 운영센터 대신에 클라이언트의 요청을 처리할 수 있는 백업센터를 자동적인 절차에 따라 기동시킴으로써, 보다 신속한 백업센터의 기동이 가능한 재해복구 자동화 시스템 및 방법을 제공하는 것이다.In addition, in the event of a disaster in the operation center, the backup center that can handle the client's request instead of the operation center is started according to an automatic procedure, thereby providing a disaster recovery automation system and method that enables faster operation of the backup center. .

또한, 운영센터에 재해가 발생되어 상기 백업센터를 기동함에 있어서, 상기 백업센터를 구성하는 복수의 서버를 기능별로 분류하고, 분류된 기능별로 병렬적으로 기동함으로써, 기동되는 복수의 서버간 상호 충돌을 방지할 수 있는 재해복구 자동화 시스템 및 방법을 제공하는 것이다.In addition, when a disaster occurs in the operation center and the backup center is started, a plurality of servers constituting the backup center are classified by function, and mutual collision between a plurality of servers that are activated by activating in parallel according to the classified functions To provide a disaster recovery automation system and method that can prevent

본 발명의 일 실시 예에 따른 재해복구 자동화 시스템은, 클라이언트의 요청을 수행하는 운영센터에 재해가 발생한 경우, 상기 요청의 처리 주체를 상기 운영센터에서 백업센터로 전환하는 재해복구 자동화 시스템에 있어서, 상기 운영센터의 기동상태를 점검하는 제1 재해복구 자동화 장치 및 상기 제1 재해복구 자동화 장치에 의해 상기 운영센터의 기동상태에 이상이 감지될 경우, 상기 백업센터를 기동시키는 제2 재해복구 자동화 장치를 포함하고, 상기 제1 재해복구 자동화 장치가 상기 운영센터를 구성하는 복수의 운영서버의 기동상태를 점검하여 상기 복수의 운영서버의 기동상태에 이상을 감지할 경우, 상기 제2 재해복구 자동화 장치는 상기 백업센터에 포함되는 복수의 백업서버를 기능별로 복수 개 그룹으로 분류하고, 그룹들에 순서를 정하여 상기 순서에 따라 상기 그룹들을 순차적으로 기동할 수 있다.In the disaster recovery automation system according to an embodiment of the present invention, when a disaster occurs in an operation center that performs a client's request, a disaster recovery automation system for converting a processing subject of the request from the operation center to a backup center, A first automatic disaster recovery device for checking the operation state of the operation center and a second automatic disaster recovery apparatus for starting the backup center when an abnormality is detected in the operation state of the operation center by the first automatic disaster recovery apparatus Including, when the first automatic disaster recovery device checks the startup status of a plurality of operation servers constituting the operation center and detects an abnormality in the startup state of the plurality of operation servers, the second automatic disaster recovery device classifies a plurality of backup servers included in the backup center into a plurality of groups by function, sets an order for the groups, and sequentially activates the groups according to the order.

본 발명에 있어서, 상기 제1 재해복구 자동화 장치는, 상기 복수의 운영서버의 변경사항을 검출하는 운영센터 에이전트 및 상기 운영센터 에이전트로부터 상기 변경사항을 수집하는 변경정보 수집부를 포함하며, 상기 제2 재해복구 자동화 장치는, 상기 변경사항을 상기 백업서버에 적용하는 백업센터 에이전트 및 상기 제1 재해복구 자동화 장치로부터 전송된 상기 변경사항을 수신하고, 상기 변경사항에 따라 상기 백업서버가 적용될 수 있도록 상기 변경사항을 상기 백업센터 에이전트에 전송하는 변경정보 처리부를 포함할 수 있다.In the present invention, the first automated disaster recovery device includes an operation center agent that detects changes in the plurality of operation servers and a change information collection unit that collects the changes from the operation center agent, wherein the second The disaster recovery automation device receives the changes transmitted from the backup center agent and the first disaster recovery automation device that apply the changes to the backup server, so that the backup server can be applied according to the changes It may include a change information processing unit for transmitting the change to the backup center agent.

본 발명에 있어서, 상기 제1 재해복구 자동화 장치는, 상기 복수의 운영서버가 상기 클라이언트의 상기 요청에 응답하는 시간인 응답 반응시간을 검출하고, 상기 응답 반응시간을 상기 복수의 운영서버가 정상적으로 기동하였을 시의 응답 반응시간의 범위인 기준 반응시간 범위와 비교하며, 비교된 결과에 따라 상기 운영센터의 기동상태의 이상 발생 유무를 감지하는 사전 감지부 및 상기 사전 감지부에 의해 상기 운영센터의 기동상태에 이상이 있는 것으로 감지된 경우, 상기 운영센터와 상기 백업센터간의 동기화 진행상태를 점검하는 사전 점검부를 포함할 수 있다.In the present invention, the first disaster recovery automation device detects a response response time that is a time when the plurality of operation servers respond to the request of the client, and the plurality of operation servers normally start the response response time The operation center is started by a pre-sensing unit and the pre-sensing unit that compares it with a reference reaction time range, which is a range of a response reaction time when the operation is performed, and detects whether an abnormality occurs in the operation center's starting state according to the comparison result. When it is detected that there is an abnormality in the state, it may include a pre-inspection unit for checking the synchronization progress state between the operation center and the backup center.

본 발명에 있어서, 상기 사전 감지부는 미리 정해진 시간 동안 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지할 수 있다.In the present invention, when the response reaction time is not within the reference reaction time range for a predetermined time, the pre-sensing unit may detect that an abnormality has occurred in the operating state of the operation center.

본 발명에 있어서, 상기 사전 감지부는, 상기 복수의 운영서버로부터 상기 응답 반응시간의 정보를 수신하는 응답 반응시간 정보 수신부, 상기 응답 반응시간 중 가장 긴 최대 응답 반응시간과 상기 응답 반응시간 중 가장 짧은 최소 응답 반응시간을 검출하고, 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위를 상기 기준 반응시간 범위로 결정하는 기준 반응시간 범위 결정부, 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있는지 분석하는 응답 반응시간 분석부 및 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지하는 기동상태 감지부를 포함할 수 있다.In the present invention, the pre-sensing unit, a response response time information receiving unit for receiving the information of the response response time from the plurality of operation servers, the longest of the maximum response response time of the response response time and the shortest of the response response time A reference reaction time range determining unit that detects a minimum response time and determines a range of the maximum response time to the minimum response time as the reference reaction time range, and analyzes whether the response reaction time is within the reference reaction time range When the response reaction time analysis unit and the response reaction time is not within the reference reaction time range, it may include a starting state detection unit for detecting that an abnormality has occurred in the starting state of the operation center.

본 발명에 있어서, 상기 기준 반응시간 범위는 상기 클라이언트의 상기 요청을 정상적으로 처리할 수 있는 상기 복수의 운영서버가 상기 클라이언트의 상기 요청에 응답하는 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위일 수 있다.In the present invention, the reference response time range is the range of the maximum response response time to the minimum response response time in which the plurality of operation servers capable of normally processing the request of the client respond to the request of the client. can

본 발명에 있어서, 상기 제2 재해복구 자동화 장치는 상기 운영센터 및 상기 백업센터간의 동기화가 완료된 후, 상기 복수의 백업서버를 기동할 수 있다.In the present invention, the second automated disaster recovery device may start the plurality of backup servers after synchronization between the operation center and the backup center is completed.

본 발명에 있어서, 상기 사전 점검부는 상기 운영센터가 상기 클라이언트의 상기 요청을 수행하는 서비스 중 상기 백업센터에서 수행될 상기 서비스의 범위를 결정하는 서비스 범위 결정부를 더 포함할 수 있다.In the present invention, the pre-checking unit may further include a service range determining unit for determining the range of the service to be performed by the backup center among the services for which the operation center performs the request of the client.

본 발명에 있어서, 상기 복수의 운영서버의 기동상태에 이상이 감지된 경우, 상기 제1 재해복구 자동화 장치는 상기 운영센터 또는 상기 백업센터의 운영자에게 운영센터 이상 감지 신호를 전송하고, 상기 제2 재해복구 자동화 장치는 상기 운영센터 또는 상기 백업센터의 운영자의 재해 발생 결정에 따라 상기 복수의 백업서버를 기동시킬 수 있다.In the present invention, when an abnormality is detected in the operation state of the plurality of operation servers, the first automated disaster recovery device transmits an operation center abnormality detection signal to the operator of the operation center or the backup center, and the second The disaster recovery automation device may start the plurality of backup servers according to the disaster occurrence determination of the operation center or the operator of the backup center.

본 발명에 있어서, 상기 복수의 백업서버가 기동될 시, 상기 제1 재해복구 자동화 장치는 상기 복수의 운영서버의 기동을 정지시키고, 상기 운영센터 및 상기 백업센터 동기화의 경로를 차단할 수 있다.In the present invention, when the plurality of backup servers are activated, the first automated disaster recovery device may stop the operation of the plurality of operation servers and block a path of synchronization between the operation center and the backup center.

본 발명에 있어서, 상기 제2 재해복구 자동화 장치는, 상기 복수의 백업서버를 기능별로 그룹화하는 그룹화부, 그룹화된 상기 복수의 백업서버의 그룹별 기동순서를 결정하는 기동순서 결정부, 상기 그룹별 기동시간을 산출하는 기동시간 산출부, 상기 그룹별 기동이 상호 겹치지 않도록 상기 그룹별 기동 간격을 조율하는 기동 간격 조율부 및 상기 복수의 백업서버를 상기 그룹별 기동 간격에 따라 상기 그룹별로 순차적으로 기동하는 그룹별 기동부를 포함할 수 있다.In the present invention, the second automatic disaster recovery device includes a grouping unit for grouping the plurality of backup servers by function, a startup sequence determining unit for determining the startup sequence for each group of the grouped plurality of backup servers, and each group A start-up time calculator for calculating the start-up time, a start-up interval tuner for adjusting the start-up intervals for each group so that the start-ups for each group do not overlap with each other, and the plurality of backup servers are sequentially started for each group according to the start-up intervals for each group It may include a group-specific starting unit.

본 발명에 있어서, 상기 그룹별 기동시간은 상기 그룹별 기동시간이 복수 회 미리 측정된 값들의 평균값 이거나, 복수 회 미리 측정된 값들 중 최대값일 수 있다.In the present invention, the starting time for each group may be an average value of values in which the starting time for each group is pre-measured a plurality of times, or may be a maximum value among values pre-measured a plurality of times.

본 발명에 있어서, 상기 기동 간격 조율부는 상기 그룹별 기동 간격이 상기 그룹별 기동시간 이상이 되도록 상기 그룹별 기동 간격을 조율할 수 있다.In the present invention, the starting interval tuning unit may adjust the starting interval for each group so that the starting interval for each group is equal to or longer than the starting time for each group.

또한, 본 발명에 있어서, 클라이언트의 요청을 수행하는 운영센터에 재해가 발생한 경우, 상기 요청의 처리 주체를 상기 운영센터에서 백업센터로 전환하는 재해복구 자동화 방법에 있어서, 상기 운영센터를 구성하는 복수의 운영서버가 클라이언트의 요청에 응답하는 시간인 응답 반응시간을 검출하고, 상기 응답 반응시간을 상기 복수의 운영서버가 정상적으로 기동하였을 시의 응답 반응시간의 범위인 기준 반응시간 범위 내에 있는지 여부를 확인하여 상기 운영센터의 기동상태의 이상 발생 유무를 감지하는 사전 감지단계, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지된 경우, 상기 운영센터와 상기 백업센터간의 동기화 진행상태를 점검하는 사전 점검단계 및 상기 백업센터를 구성하는 복수의 백업서버를 병렬적으로 기동하는 병렬적 기동단계를 포함하고, 상기 병렬적 기동단계는 상기 복수의 백업서버를 기능별로 복수 개의 그룹으로 분류하고, 상기 그룹들에 순서를 정하여 상기 순서에 따라 상기 그룹들을 순차적으로 기동할 수 있다.In addition, in the present invention, when a disaster occurs in the operation center that performs the client's request, in the disaster recovery automation method for switching the processing subject of the request from the operation center to the backup center, a plurality of components constituting the operation center Detects the response response time, which is the time the operation server responds to the client's request, and checks whether the response response time is within the reference reaction time range, which is the range of the response response time when the plurality of operation servers are normally started a pre-sensing step of detecting whether an abnormality has occurred in the operation center's starting state, and when it is detected that an abnormality has occurred in the operation center's operation center, a preliminary check of checking the synchronization progress state between the operation center and the backup center and a parallel starting step of starting a plurality of backup servers constituting the backup center in parallel, wherein the parallel starting step classifies the plurality of backup servers into a plurality of groups by function, and the groups By setting an order to , the groups may be sequentially activated according to the order.

본 발명에 있어서, 상기 사전 감지단계는, 상기 복수의 운영서버로부터 상기 응답 반응시간에 대한 정보를 수신하는 응답 반응시간 정보 수신단계, 상기 응답 반응시간 중 가장 긴 최대 응답 반응시간과 상기 응답 반응시간 중 가장 짧은 최소 응답 반응시간을 검출하고, 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위를 상기 기준 반응시간 범위로 결정하는 기준 반응시간 범위 결정단계, 상기 응답 반응시간의 정보로부터 도출된 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있는지 분석하는 응답 반응시간 분석단계 및 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지하는 기동상태 감지단계를 포함할 수 있다.In the present invention, the pre-sensing step includes a response response time information receiving step of receiving information on the response response time from the plurality of operation servers, the longest maximum response response time and the response response time among the response response times A reference reaction time range determining step of detecting the shortest minimum response time among the minimum response time and determining the range of the maximum response time to the minimum response time as the reference reaction time range, the information derived from the response reaction time information A response reaction time analysis step of analyzing whether the response reaction time is within the reference reaction time range, and when the response reaction time is not within the reference reaction time range, a startup state of detecting that an abnormality has occurred in the startup state of the operation center It may include a detection step.

본 발명에 있어서, 상기 기준 반응시간 범위는 상기 클라이언트의 상기 요청을 정상적으로 처리할 수 있는 상기 복수의 운영서버가 상기 클라이언트의 상기 요청에 응답하는 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위일 수 있다.In the present invention, the reference response time range is the range of the maximum response response time to the minimum response response time in which the plurality of operation servers capable of normally processing the request of the client respond to the request of the client. can

본 발명에 있어서, 상기 사전 감지단계는 미리 정해진 시간 동안 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지할 수 있다.In the present invention, in the pre-sensing step, when the response reaction time is not within the reference reaction time range for a predetermined time, it may be detected that an abnormality has occurred in the operating state of the operation center.

본 발명에 있어서, 상기 병렬적 기동단계는 상기 운영센터 및 상기 백업센터간의 동기화가 완료된 후, 상기 복수의 백업서버를 기동할 수 있다.In the present invention, in the parallel starting step, after synchronization between the operation center and the backup center is completed, the plurality of backup servers may be started.

본 발명에 있어서, 상기 사전 점검단계는 상기 운영센터가 클라이언트의 요청을 수행하는 서비스 중 상기 백업센터에서 수행될 상기 서비스의 범위를 결정하는 서비스 범위 결정단계를 더 포함할 수 있다.In the present invention, the pre-checking step may further include a service range determining step in which the operation center determines the range of the service to be performed by the backup center among the services for which the client's request is performed.

본 발명에 있어서, 상기 복수의 백업서버가 기동될 시, 상기 복수의 운영서버는 기동이 정지되고, 상기 운영센터 및 상기 백업센터 동기화의 경로는 차단될 수 있다.In the present invention, when the plurality of backup servers are activated, the operation of the plurality of operation servers is stopped, and the path of synchronization between the operation center and the backup center may be blocked.

본 발명에 있어서, 상기 병렬적 기동단계는, 상기 복수의 백업서버를 기능별로 그룹화하는 그룹화 단계, 그룹화된 상기 복수의 백업서버의 그룹별 기동순서를 결정하는 기동순서 결정단계, 상기 그룹별 기동시간을 산출하는 기동시간 산출단계, 상기 그룹별 기동이 상호 겹치지 않도록 상기 그룹별 기동 간격을 조율하는 기동 간격 조율단계 및 상기 복수의 백업서버를 상기 그룹별 기동 간격에 따라 상기 그룹별로 순차적으로 기동하는 그룹별 기동단계를 포함할 수 있다.In the present invention, the parallel startup step includes a grouping step of grouping the plurality of backup servers by function, a startup sequence determining step of determining the startup sequence for each group of the grouped plurality of backup servers, and the startup time for each group A startup time calculation step of calculating It may include a star startup phase.

본 발명에 있어서, 상기 그룹별 기동시간은 상기 그룹별 기동시간이 복수 회 미리 측정된 값의 평균값 이거나, 복수 회 미리 측정된 값 중 최대값일 수 있다.In the present invention, the starting time for each group may be an average value of values pre-measured a plurality of times for the startup time for each group, or may be a maximum value among values pre-measured a plurality of times.

본 발명에 있어서, 상기 기동 간격 조율단계는 상기 그룹별 기동 간격이 상기 그룹별 기동시간 이상이 되도록 상기 그룹별 기동 간격을 조율할 수 있다.In the present invention, in the step of tuning the starting interval, the starting interval for each group may be adjusted so that the starting interval for each group is equal to or longer than the starting time for each group.

본 발명의 일 실시 예에 따르면, 재해복구 시스템을 기동함에 있어서, 운영센터를 구성하는 복수의 서버의 응답 반응시간을 감지하여, 상기 운영센터의 재해 발생 여부를 판단함으로써, 보다 정확한 재해 발생 여부 판단에 따라 기동할 수 있는 재해복구 자동화 시스템 및 방법을 제공할 수 있다.According to an embodiment of the present invention, in activating the disaster recovery system, by detecting the response time of a plurality of servers constituting the operation center, and determining whether a disaster has occurred in the operation center, more accurate determination of whether a disaster has occurred It is possible to provide a disaster recovery automation system and method that can be activated according to

또한, 재해 발생 여부 판단에 따라 자동적인 절차에 따라 기동 가능한 백업센터를 기동함으로써, 운영센터에서 백업센터로의 보다 신속한 업무 전환이 가능한 재해복구 자동화 시스템 및 방법을 제공할 수 있다.In addition, it is possible to provide a disaster recovery automation system and method capable of faster business conversion from an operation center to a backup center by starting a backup center that can be started according to an automatic procedure according to whether a disaster has occurred.

또한, 운영센터에 재해가 발생되어 백업센터가 기동됨에 있어서, 상기 백업센터를 구성하는 복수의 서버가 분류된 기능별로 병렬적으로 기동함으로써, 복수의 서버간의 상호 충돌이 방지되어 기동되는 백업센터의 안정적인 기동이 가능한 재해복구 자동화 시스템 및 방법을 제공할 수 있다.In addition, when a disaster occurs in the operation center and the backup center is started, a plurality of servers constituting the backup center are started in parallel for each classified function, thereby preventing mutual conflict between the plurality of servers and starting the backup center. It is possible to provide a disaster recovery automation system and method capable of stable operation.

도 1은 본 발명의 일 실시 예에 따른 운영서버, 백업서버 및 이들에 구비된 재해복구 자동화 장치간의 시스템 구성도를 도시한다.
도 2는 본 발명의 일 실시 예에 따른 운영서버 및 백업서버와 작용하는 재해복구 자동화 시스템을 도시한다.
도 3은 본 발명의 일 실시 예에 따른 운영서버의 평상시의 응답 반응시간과 재해 발생시의 응답 반응시간을 도시한다.
도 4는 본 발명의 일 실시 예에 따른 백업센터의 기동을 도시한다.
도 5는 본 발명의 일 실시 예에 따른 재해복구 자동화 방법의 순서도이다.
1 is a diagram illustrating a system configuration between an operation server, a backup server, and an automated disaster recovery device provided therein according to an embodiment of the present invention.
Figure 2 shows a disaster recovery automation system that works with the operation server and the backup server according to an embodiment of the present invention.
3 shows the normal response response time of the operation server and the response response time when a disaster occurs according to an embodiment of the present invention.
Figure 4 shows the start-up of the backup center according to an embodiment of the present invention.
5 is a flowchart of a disaster recovery automation method according to an embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러가지 실시 예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 이를 상세한 설명을 통해 상세히 설명하고자 한다. 그러나, 이는 본 발명의 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함할 수 있다.Since the present invention can have various changes and can have various embodiments, specific embodiments are illustrated in the drawings and will be described in detail through the detailed description. However, this is not intended to limit the specific embodiments of the present invention, and may include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention.

본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우, 그 자세한 설명을 생략할 수 있다.In describing the present invention, if it is determined that a detailed description of a related known technology may unnecessarily obscure the gist of the present invention, the detailed description thereof may be omitted.

또한, 본 명세서에서, 일 구성요소가 다른 구성요소와 “연결된다” 거나 “접속된다”등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다.In addition, in this specification, when a component is referred to as “connected” or “connected” with another component, the component may be directly connected or directly connected to the other component, but in particular Unless there is an opposing description, it may be connected or connected through another element in the middle.

본 발명의 일 실시 예에 따른 재해복구 자동화 시스템은 클라이언트의 요청을 수행하는 운영센터가 바이러스의 침입, 또는 화재, 지진과 같은 천재지변에 의해 손상되어 클라이언트의 요청을 정상적으로 수령하지 못하거나 처리하지 못할 시, 상기 운영센터와 동기화 되며 상기 운영센터와 동일한 구성요소를 포함하여 구성되는 백업센터가 상기 운영센터의 업무를 대신 할 수 있도록 구성된 시스템일 수 있다.In the disaster recovery automation system according to an embodiment of the present invention, the operation center that performs the client's request is damaged by the intrusion of a virus or natural disasters such as fire or earthquake, so that it cannot normally receive or process the client's request. At the same time, it may be a system configured so that a backup center synchronized with the operation center and configured to include the same components as the operation center can take over the operation of the operation center.

따라서, 상기 운영센터에 재해가 발생 시, 상기 운영센터를 이용하여 업무를 처리하는 클라이언트에 대한 피해를 최소화 하기 위하여, 상기 운영센터에서 상기 백업센터로의 업무전환은 신속해야 할 필요성이 있다. 즉, 상기 운영센터에 재해에 따라 불가피하게 일어나는 클라이언트에 대한 피해를 최소화하기 위해, 상기 운영센터의 정상적인 기동에 근접하는 상기 백업센터의 기동을 클라이언트에게 신속하게 제공해야 할 필요성이 있다.Therefore, when a disaster occurs in the operation center, in order to minimize damage to clients who process business using the operation center, there is a need for rapid business conversion from the operation center to the backup center. That is, in order to minimize damage to the client that inevitably occurs according to a disaster in the operation center, there is a need to quickly provide the client with the startup of the backup center close to the normal operation of the operation center.

또한, 상기 운영센터에 재해가 발생 시, 상기 백업센터로의 신속한 전환과 함께, 상기 운영센터의 재해 발생 여부를 판단하는 기술 또한, 상기 재해발생 자동화 시스템에 있어서 매우 중요한 요소일 수 있다. 만약, 상기 운영센터에 재해가 발생하지 않은 경우에도 일시적으로 나타날 수 있는 단순 이상 징후가 상기 운영센터의 재해 발생 요소로 판단된다면 상기 운영센터 및 상기 운영센터를 이용하는 클라이언트들에게도 큰 혼란을 야기 시킬 수 있다.In addition, when a disaster occurs in the operation center, the technology for quickly switching to the backup center and determining whether a disaster occurs in the operation center may also be a very important factor in the disaster occurrence automation system. If a simple abnormal symptom that may appear temporarily even when a disaster does not occur in the operation center is determined to be a disaster occurrence factor in the operation center, it may cause great confusion to the operation center and clients using the operation center. have.

따라서, 이하에서는 보다 정확한 진단으로 상기 운영센터의 재해 발생 여부를 판단할 수 있으며, 재해 발생 시, 상기 운영센터에서 상기 백업센터로의 신속한 전환이 가능한 자동화된 재해복구 시스템에 대해 살펴보고자 한다.Therefore, in the following, it is possible to determine whether a disaster has occurred in the operation center through a more accurate diagnosis, and in the event of a disaster, an automated disaster recovery system capable of rapidly switching from the operation center to the backup center will be examined.

도 1은 본 발명의 일 실시 예에 따른 운영서버, 백업서버 및 이들에 구비된 재해복구 자동화 장치간의 시스템 구성도를 도시한다.1 is a diagram illustrating a system configuration between an operation server, a backup server, and an automated disaster recovery device provided therein according to an embodiment of the present invention.

우선, 본 발명의 일 실시 예에 따른 재해복구 자동화 시스템을 설명하기에 앞서, 상기 재해복구 자동화 시스템이 적용될 수 있는 상기 운영센터(100) 및 상기 백업센터(200)에 대해 간략하게 살펴볼 수 있다.First, before describing the disaster recovery automation system according to an embodiment of the present invention, the operation center 100 and the backup center 200 to which the disaster recovery automation system can be applied may be briefly reviewed.

클라이언트의 요청을 수행하는 상기 운영센터(100)는 복수의 운영서버(111)를 구비하며, 상기 복수의 운영서버(111)를 통하여 클라이언트의 요청을 단위 업무별로 분할하여 수행할 수 있다.The operation center 100 for performing the client's request includes a plurality of operation servers 111, and through the plurality of operation servers 111, the client's request can be divided and performed for each unit task.

상기 복수의 운영서버(111)는 상기 운영센터(100)가 클라이언트에 제공하는 서비스의 종류에 따라 상이하게 구성될 수 있으며, 일 예로서, 웹서버, 연계서버, 어플리케이션서버, 응용서버, 데이터베이스서버 등을 포함하여 구성될 수 있다.The plurality of operation servers 111 may be configured differently depending on the type of service that the operation center 100 provides to clients, for example, a web server, a linked server, an application server, an application server, a database server. and the like.

상기 백업센터(200) 또한, 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)와 대응되는 복수의 백업서버(211)로 구성될 수 있다. 이는 상기 운영센터(100) 에 재해가 발생한 경우 백업센터(200)가 운영센터(100)를 대신하여 클라이언트에 대한 서비스를 수행할 수 있도록 하기 위함일 수 있다.The backup center 200 may also include a plurality of backup servers 211 corresponding to the plurality of operation servers 111 constituting the operation center 100 . This may be to enable the backup center 200 to perform a service for a client on behalf of the operation center 100 when a disaster occurs in the operation center 100 .

여기서, 상기 복수의 백업서버(211)는 상기 복수의 운영서버(111)와 동일한 구성 대등한 장치 또는 시스템으로서 구비될 수 있으나, 상기 복수의 운영서버(111)보다 간소화되어 구비될 수 도 있는데, 재해복구 시스템에 있어서는 상기 백업센터(200)가 상기 운영센터(100)의 필수적인 구성을 포함한 간소화된 구성으로 상기 운영센터(100)의 재해에 대비하도록 구성된 것이 일반적이다.Here, the plurality of backup servers 211 may be provided as a device or system equivalent to the same configuration as the plurality of operation servers 111, but may be provided more simplified than the plurality of operation servers 111, In a disaster recovery system, the backup center 200 is generally configured to prepare for a disaster in the operation center 100 with a simplified configuration including the essential configuration of the operation center 100 .

만약, 상기 복수의 백업서버(211)가 상기 복수의 운영서버(111)와 동일한 구성으로 구성되게 된다면 재해가 발생하지 않은 상황, 즉 평상시에 주로 사용되는 상기 운영센터(100)와 함께 상기 운영센터(100)의 재해 발생시에만 임시적으로 사용되는 상기 백업센터(200)도 상기 운영센터(100)와 똑같은 유지 및 관리 작업을 해야 하기 때문에, 상기 백업센터(200)를 유지 및 관리하기 위해 필요한 비용뿐만 아니라 관리자의 수 또한 증가되는바, 효율적인 재해 대책수단으로서 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)는 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)보다 간소화 하여 구성하되, 상기 복수의 운영서버(111) 중 필수적인 구성은 포함하도록 구성될 수 있다.If the plurality of backup servers 211 are configured to have the same configuration as the plurality of operation servers 111 , the operation center together with the operation center 100 mainly used in normal times, that is, a situation in which a disaster does not occur. Since the backup center 200, which is temporarily used only in the event of a disaster of 100, also needs to perform the same maintenance and management work as the operation center 100, the cost required to maintain and manage the backup center 200 as well as In addition, the number of administrators is also increased, and as an effective disaster countermeasure means, the plurality of backup servers 211 constituting the backup center 200 are greater than the plurality of operation servers 111 constituting the operation center 100 . The configuration is simplified, but essential components among the plurality of operation servers 111 may be included.

상술한 상기 운영센터(100) 및 상기 백업센터(200)는 본 발명의 이해를 돕기 위해 본 발명이 적용될 수 있는 일 실시 예에 불과하며, 이하에서 설명될 본 발명의 내용이 적용되어 사용될 수 있는 구성이라면 어떠한 것이라도 가능하다.The above-described operation center 100 and the backup center 200 are merely an embodiment to which the present invention can be applied to help understand the present invention, and the contents of the present invention to be described below can be applied and used. Any configuration is possible.

이하에서는, 상술한 구성의 운영센터(100) 및 백업센터(200)에 적용되는 상기 재해복구 자동화 시스템을 살펴봄으로써, 본 발명의 일 실시 예에 따른 재해복구 자동화 시스템을 설명하기로 한다.Hereinafter, a disaster recovery automation system according to an embodiment of the present invention will be described by looking at the disaster recovery automation system applied to the operation center 100 and the backup center 200 having the above configuration.

도 2는 본 발명의 일 실시 예에 따른 운영서버(111) 및 백업서버(211)와 작용하는 재해복구 자동화 시스템을 도시한다.Figure 2 shows a disaster recovery automation system that works with the operation server 111 and the backup server 211 according to an embodiment of the present invention.

도 1과 도 2를 참조하면, 본 발명의 일 실시 예에 따른 재해복구 자동화 시스템은, 상기 운영센터(100)와 연결되어 상기 운영센터(100)의 기동상태를 점검하는 제1 재해복구 자동화 장치(1000) 및 상기 운영센터(100)와 동기화 되는 상기 백업센터(200)와 연결되어, 상기 제1 재해복구 자동화 장치(1000)에 의해 상기 운영센터(100)의 기동상태에 이상이 감지될 시, 상기 백업센터(200)를 기동시키는 제2 재해복구 자동화 장치(2000)를 포함할 수 있다.1 and 2 , the disaster recovery automation system according to an embodiment of the present invention is connected to the operation center 100 and a first disaster recovery automation device for checking the operating state of the operation center 100 . When an abnormality is detected in the operation state of the operation center 100 by the first automated disaster recovery device 1000, connected to the backup center 200 synchronized with the 1000 and the operation center 100 , a second automatic disaster recovery device 2000 for starting the backup center 200 may be included.

상기 백업센터(200)는 상기 운영센터(100)의 업무를 대비하여 준비될 필요가 있으며, 재해 발생 시 상기 운영센터(100)의 정상적인 서비스와 동일 유사한 서비스를 구현하기 위해 상기 운영센터(100)와 동기화 될 수 있다.The backup center 200 needs to be prepared in preparation for the operation of the operation center 100, and in case of a disaster, the operation center 100 to implement the same and similar service as the normal service of the operation center 100 can be synchronized with

구체적으로, 상기 운영센터(100)와 상기 백업센터(200)는 주기적 또는 실시간으로 동기화 될 수 있다. 상기 백업센터(200)가 상기 운영센터(100)의 정상적인 기동에 근접하기 위해서는 상기 운영센터(100)의 변경사항, 즉 새로운 프로그램의 설치나 제거와 같은 변경사항이 주기적 또는 실시간으로 동기화 되는 것이 바람직하다.Specifically, the operation center 100 and the backup center 200 may be synchronized periodically or in real time. In order for the backup center 200 to approach the normal operation of the operation center 100, it is preferable that changes in the operation center 100, ie, changes such as installation or removal of new programs, are synchronized periodically or in real time. do.

상기 제1 재해복구 자동화 장치(1000)는, 상기 복수의 운영서버(111)의 변경사항을 검출하는 운영센터 에이전트(1250) 및 상기 운영센터 에이전트(1250)로부터 상기 변경사항을 수집하는 변경정보 수집부(1200) 를 포함할 수 있으며, 상기 제2 재해복구 자동화 장치(2000)는, 상기 변경사항을 상기 백업서버(211)에 적용하는 백업센터 에이전트(2250) 및 상기 제1 재해복구 자동화 장치(1000)로부터 전송된 상기 변경사항을 수신하고, 상기 변경사항에 따라 상기 백업서버(211)가 적용될 수 있도록 상기 변경사항을 상기 백업센터 에이전트(211)에 전송하는 변경정보 처리부(2200) 를 포함할 수 있다.The first disaster recovery automation device 1000 collects change information for collecting the changes from the operation center agent 1250 for detecting changes in the plurality of operation servers 111 and the operation center agent 1250 may include a unit 1200, wherein the second automated disaster recovery device 2000 includes a backup center agent 2250 that applies the changes to the backup server 211 and the first automated disaster recovery device ( 1000), and a change information processing unit 2200 for receiving the change transmitted from and transmitting the change to the backup center agent 211 so that the backup server 211 can be applied according to the change. can

도 1을 참조하면, 상기 운영센터 에이전트(1250)는 상기 복수개의 운영서버(111)와 연결됨으로써, 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)의 변경사항을 실시간 또는 주기적으로 수집할 수 있으며, 상기 변경사항의 수집 주체는 상기 변경정보 수집부(1200)가 될 수 있다. 즉, 상기 변경정보 수집부(1200)는 상기 운영센터 에이전트(1250)를 매개로 상기 복수의 운영서버(111)의 변경사항을 수집할 수 있으며, 상기 복수의 운영서버(111)의 변경사항을 상기 제2 재해복구 자동화 장치(2000)에 설치된 상기 변경정보 처리부(2200)에 전송할 수 있다.Referring to FIG. 1 , the operation center agent 1250 is connected to the plurality of operation servers 111 , so that changes of the plurality of operation servers 111 constituting the operation center 100 are monitored in real time or periodically. may be collected, and the subject of collecting the changes may be the change information collecting unit 1200 . That is, the change information collection unit 1200 may collect the changes of the plurality of operation servers 111 through the operation center agent 1250, and collect the changes of the plurality of operation servers 111 through the operation center agent 1250. It can be transmitted to the change information processing unit 2200 installed in the second automatic disaster recovery device 2000 .

상기 복수의 운영서버(111)의 변경사항을 전송받은 상기 변경정보 처리부(2200)는 상기 변경사항을 상기 복수의 백업서버(211)와 연결된 상기 백업센터 에이전트(2250)를 매개로 상기 복수의 백업서버(211)에 상기 변경사항이 적용함으로써 운영서버와 백업서버를 동기화 시킬 수 있다.The change information processing unit 2200 that has received the changes of the plurality of operation servers 111 transmits the changes to the plurality of backups via the backup center agent 2250 connected to the plurality of backup servers 211 . By applying the above changes to the server 211, it is possible to synchronize the operation server and the backup server.

상술한 바와 같이 상기 변경정보 수집부(1200) 및 상기 변경정보 처리부(2200)는 상기 운영센터(100)와 상기 백업센터(200)의 동기화 경로를 제공할 수 있으며, 따라서, 상기 백업센터(200)는 상기 운영센터(100)의 변경사항을 반영하여 동기화 됨으로써, 상기 운영센터(100)의 재해에 대비하여 상기 운영센터(100)의 서비스와 동일 유사한 서비스를 클라이언트에 제공할 준비를 할 수 있다.As described above, the change information collection unit 1200 and the change information processing unit 2200 may provide a synchronization path between the operation center 100 and the backup center 200, and thus, the backup center 200 ) is synchronized by reflecting the changes of the operation center 100, in preparation for a disaster of the operation center 100, it is possible to prepare to provide the same and similar service as the service of the operation center 100 to the client. .

상기 백업센터(200)와 연결된 상기 제1 재해복구 자동화 장치(1000)는 상기 운영센터(100)의 재해 발생 여부를 감지함으로써, 상기 운영센터(100)와 동기화된 상기 백업센터(200)의 활용 구실을 제공한다.The first disaster recovery automation device 1000 connected to the backup center 200 detects whether a disaster has occurred in the operation center 100 , and thus utilizes the backup center 200 synchronized with the operation center 100 . provide an excuse

상기 제1 재해복구 자동화 장치(1000)는 도 1과 도2에 도시된 바와 같이 상기 변경정보 수집부(1200), 상기 운영센터 에이전트(1250) 및 상기 제1 재해복구 자동화 서버(1100)로 구성될 수 있다. As shown in FIGS. 1 and 2 , the first automated disaster recovery device 1000 includes the change information collection unit 1200 , the operation center agent 1250 and the first automated disaster recovery server 1100 . can be

상기 변경정보 수집부(1200) 및 상기 운영센터 에이전트(1250)는 상술한 바와 같이, 상기 백업서버(211)와 상기 운영서버(111)의 동기화를 주된 목적으로 구비되며, 상기 제1 재해복구 자동화 서버(1100)는 상기 운영센터(100)의 재해 발생 여부를 감지하기 위해 구비될 수 있다.As described above, the change information collection unit 1200 and the operation center agent 1250 are provided for the main purpose of synchronizing the backup server 211 and the operation server 111, and automate the first disaster recovery. The server 1100 may be provided to detect whether a disaster has occurred in the operation center 100 .

상기 제1 재해복구 자동화 서버(1100)는 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)의 기동상태를 감지하여 상기 운영센터(100)의 이상 발생여부를 감지할 수 있으며, 상기 제1 재해복구 자동화 서버(1100)가 상기 복수의 운영서버(111)의 기동상태의 이상을 감지하는 경우, 상기 제2 재해복구 자동화 장치(2000)가 상기 복수의 백업서버(211)를 기동시켜 클라이언트의 요청 처리 주체를 상기 백업센터(200)로 전환시킬 수 있다.The first automated disaster recovery server 1100 may detect whether an abnormality has occurred in the operation center 100 by detecting the activation state of the plurality of operation servers 111 constituting the operation center 100, When the first automated disaster recovery server 1100 detects an abnormality in the activation state of the plurality of operation servers 111 , the second automated disaster recovery device 2000 starts the plurality of backup servers 211 . to convert the client's request processing subject to the backup center 200 .

여기서, 상기 제1 재해복구 자동화 서버(1100)가 상기 복수의 운영서버(111)의 기동상태의 이상을 감지할 경우, 상기 제1 재해복구 자동화 서버(1100)는 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자에게 운영센터(100) 이상 감지 신호를 전송할 수 있는데, 이는 상기 제1 재해복구 자동화 서버(1100)가 감지한 상기 복수의 운영서버(111)의 기동상태의 이상을 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자가 확인함으로써, 상기 운영센터(100)의 재해 발생 여부를 더욱 정확히 판단하기 위함이다.Here, when the first automated disaster recovery server 1100 detects an abnormality in the operation state of the plurality of operation servers 111 , the first automated disaster recovery server 1100 is the operation center 100 or the It is possible to transmit an abnormality detection signal to the operation center 100 to the operator of the backup center 200, which indicates the abnormality of the operation state of the plurality of operation servers 111 detected by the first automated disaster recovery server 1100. By checking the operation center 100 or the operator of the backup center 200 , it is for more accurately determining whether a disaster has occurred in the operation center 100 .

만약, 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자가 상기 운영센터(100) 이상 감지 신호를 검토하여 상기 제1 재해복구 자동화 서버(1100)가 감지한 상기 복수의 운영서버(111)의 기동상태의 이상이 상기 운영센터(100)의 재해 발생으로 판단될 시, 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자는 상기 운영센터(100)에 재해가 발생된 것으로 결정 내릴 수 있으며, 이에 따라 상기 복수의 백업서버(211)는 기동할 수 있다.If the operator of the operation center 100 or the backup center 200 examines the operation center 100 abnormal detection signal, the plurality of operation servers 111 detected by the first automated disaster recovery server 1100 ), when it is determined that a disaster has occurred in the operation center 100, the operator of the operation center 100 or the backup center 200 determines that a disaster has occurred in the operation center 100 It can be down, and accordingly, the plurality of backup servers 211 can be activated.

즉, 상기 제2 재해복구 자동화 서버(2100)는 상기 제1 재해복구 자동화 서버(1100)로부터 전송된 상기 운영센터(100) 이상 감지 신호를 토대로 결정된 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자의 재해 발생 결정에 따라 상기 복수의 백업서버(211)를 기동할 수 있다. 상기 복수의 백업서버(211)의 기동에 관한 내용은 후술한다.That is, the second automated disaster recovery server 2100 is the operation center 100 or the backup center 200 determined based on the detection signal of an abnormality in the operation center 100 transmitted from the first automated disaster recovery server 1100 . ), the plurality of backup servers 211 may be activated according to the disaster occurrence decision of the operator. The contents regarding the activation of the plurality of backup servers 211 will be described later.

상기 제1 재해복구 자동화 장치(1000) 중 상기 운영서버(111)의 기동상태를 감지하는 역할을 하는 상기 제1 재해복구 자동화 서버(1100)에 대해 더욱 자세히 살펴보면, 상기 제1 재해복구 자동화 서버(1100)는 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답하는 시간인 응답 반응시간을 검출하고, 상기 응답 반응시간을 상기 복수의 운영서버(111)가 정상적으로 기동하였을 시의 응답 반응시간의 범위인 기준 반응시간 범위와 비교하여, 비교된 결과에 따라 상기 운영센터(100)의 기동상태의 이상 발생 유무를 감지하는 사전 감지부(1110)를 포함할 수 있으며, 상기 사전 감지부(1110)가 상기 운영센터(100)와 동기화되는 상기 백업센터(200)간의 동기화 진행상태를 점검하는 사전 점검부(1120)를 포함할 수 있다.Looking more closely at the first automated disaster recovery server 1100, which serves to detect the operating state of the operation server 111 among the first automated disaster recovery device 1000, the first automated disaster recovery server ( 1100) detects a response reaction time, which is a time when the plurality of operation servers 111 respond to a client's request, and determines the response reaction time as the response reaction time when the plurality of operation servers 111 are normally started. It may include a pre-sensing unit 1110 for detecting whether an abnormality occurs in the operation state of the operation center 100 according to the comparison result compared with the reference reaction time range, which is the range, and the pre-sensing unit 1110 may include a pre-inspection unit 1120 for checking a synchronization progress state between the operation center 100 and the backup center 200 synchronized with the operation center 100 .

상기 운영센터(100)를 구성하는 복수의 운영서버(111)는 클라이언트의 요청에 의해 각각 단위 업무별로 기능을 수행하도록 반응하므로, 상기 복수의 운영서버(111)가 클라이언트의 요청에 의해 반응하는 시간이 상기 응답 반응시간일 수 있다.Since the plurality of operation servers 111 constituting the operation center 100 respond to perform functions for each unit task according to the request of the client, the time that the plurality of operation servers 111 respond to the request of the client This may be the response reaction time.

상기 응답 반응시간은 상기 운영센터(100)의 재해 발생 여부를 판단하는 척도로 사용될 수 있다. 즉, 상기 운영센터(100)에 재해가 발생되어 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)가 제 구실을 제대로 하지 못할 시, 상기 응답 반응시간은 느려질 수 있다. 또한, 상기 복수의 운영서버(111)가 바이러스에 감염되거나 오류에 의한 오작동을 할 경우, 상기 응답 반응시간은 속도가 비정상적으로 빨라질 수 있으므로 상기 응답 반응시간은 상기 복수의 운영센터(100)의 재해 발생 여부를 진단하기에 매우 적합한 수단일 수 있다.The response reaction time may be used as a measure for determining whether a disaster has occurred in the operation center 100 . That is, when a disaster occurs in the operation center 100 and the plurality of operation servers 111 constituting the operation center 100 do not function properly, the response response time may be slow. In addition, when the plurality of operation servers 111 are infected with a virus or malfunction due to an error, the response response time may increase abnormally in speed, so the response response time is a disaster of the plurality of operation centers 100 . It may be a very suitable means for diagnosing whether or not it has occurred.

종래의 재해복구 자동화 시스템은 상기 복수의 운영서버(111)에 대한 클라이언트의 요청 기록인 클라이언트의 트래픽(traffic)수를 기준으로 상기 운영센터(100)의 재해 발생여부를 판단하는 기술을 개시하였으나, 이 경우에는 상기 트래픽수가 매 시간대별 또는 계절과 같은 다양한 환경적인 요소에 있어서도 매우 상이하다는 점에서 상기 운영센터(100)에 재해가 발생하지 않은 경우에도 상기 트래픽수가 일시적으로 증가하거나 감소한 경우에 해당 트래픽수로 인하여 상기 운영센터(100)의 재해가 선포될 수 있는바 그 판단의 정확성이 매우 떨어질 수 있다.The conventional disaster recovery automation system disclosed a technique for determining whether a disaster occurred in the operation center 100 based on the number of client traffic, which is a record of the client's request to the plurality of operation servers 111, In this case, since the number of traffic is very different for each time period or various environmental factors such as seasons, even if a disaster does not occur in the operation center 100, when the number of traffic temporarily increases or decreases, the corresponding traffic Due to the number, a disaster of the operation center 100 may be declared, and the accuracy of the determination may be very low.

반면, 본 발명에 따른 재해복구 자동화 시스템은 상기 트래픽수가 아닌 주기적 또는 실시간으로 감지되는 상기 복수의 운영서버(111)의 상기 응답 반응시간을 통해 상기 운영센터(100)의 재해 발생 여부를 결정하므로 상기 운영센터(100)의 재해 발생 여부를 판단하는데 매우 높은 정확성을 제공할 수 있다.On the other hand, the disaster recovery automation system according to the present invention determines whether a disaster has occurred in the operation center 100 through the response time of the plurality of operation servers 111 detected periodically or in real time, rather than the number of traffic. It is possible to provide very high accuracy in determining whether a disaster has occurred in the operation center 100 .

여기서, 상기 응답 반응시간은 상기 복수의 운영서버(111)의 작동상태에 이상이 발생되었는지 판단하는 척도로 사용되므로 상기 응답 반응시간이 정상적인 수치 내에 위치하는지 판단할 수 있는 상기 응답 반응시간의 비교군으로써 상기 기준 반응시간 범위가 제시될 수 있다.Here, since the response response time is used as a measure to determine whether an abnormality has occurred in the operating state of the plurality of operation servers 111, a comparison group of the response response time that can determine whether the response response time is located within a normal value Thus, the reference reaction time range can be suggested.

도 3은 본 발명의 일 실시 예에 따른 운영서버(111)의 평상시의 응답 반응시간과 재해 발생시의 응답 반응시간을 도시한다.3 shows the normal response response time of the operation server 111 and the response response time when a disaster occurs according to an embodiment of the present invention.

상기 기준 반응시간 범위는 재해가 발생되지 않은 평상시의 상기 복수의 운영서버(111), 즉 클라이언트의 요청을 정상적으로 처리할 수 있는 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답하는 시간 중 상기 최대 응답 반응시간 및 상기 최소 응답 반응시간을 산출하여 각각 최대값과 최소값으로 설정한 범위일 수 있다.The reference reaction time range is the time during which the plurality of operation servers 111 in normal times where no disaster occurs, that is, the plurality of operation servers 111 that can normally process the client's request respond to the client's request. The maximum response time and the minimum response time may be calculated and may be a range set as a maximum value and a minimum value, respectively.

상기 기준 반응시간은 정상적인 상기 복수의 운영서버(111)를 통해 복수 회 미리 측정되어 저장된 값일 수 있으며, 보다 정확한 범위 제공을 위하여 일정 시간 동안 측정된 값으로 그 범위가 제공될 수 있다.The reference reaction time may be a value previously measured and stored a plurality of times through the plurality of normal operation servers 111 , and the range may be provided as a value measured for a certain time in order to provide a more accurate range.

즉, 도 3에서 도시하는 바와 같이, 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위(y축)로 제공되는 상기 기준 반응시간 범위가 일정 시간 동안의 범위로 제공된 값(x축)으로 제공됨으로써, 상기 복수의 운영서버(111)에 대한 클라이언트에 요청에 따른 응답 반응시간의 최대 내지 최소값의 범위가 더욱 정상적인 상기 복수의 운영서버(111)의 응답 반응시간의 범위 값과 유사하게 제공될 수 있다. That is, as shown in FIG. 3 , the reference reaction time range provided as a range (y-axis) of the maximum response time to the minimum response time is provided as a value (x-axis) provided as a range for a certain time. By being, the range of the maximum to the minimum value of the response response time according to the request to the client for the plurality of operation servers 111 is more normal and similar to the range value of the response response time of the plurality of operation servers 111 can be provided. have.

이하에서는, 상기 응답 반응시간 및 상기 기준 반응시간 범위을 통한 상기 운영센터(100)의 기동상태의 감지에 대해 자세히 살펴볼 수 있다.Hereinafter, the detection of the activation state of the operation center 100 through the response reaction time and the reference reaction time range can be viewed in detail.

상기 사전 감지부(1110)는 상술한 상기 응답 반응시간 및 상기 기준 반응시간 범위를 통하여 상기 운영센터(100)의 재해 발생 여부를 사전에 감지하는 역할을 수행할 수 있다.The pre-sensing unit 1110 may serve to detect in advance whether a disaster has occurred in the operation center 100 through the above-described response reaction time and the reference reaction time range.

구체적으로, 상기 사전 감지부(1110)는 상기 복수의 운영서버(111)로부터 상기 응답 반응시간의 정보를 수신하는 응답 반응시간 정보 수신부(1111), 최대 응답 반응시간 내지 최소 응답 반응시간의 범위를 산출하여 상기 기준 반응시간 범위를 결정하는 기준 반응시간 범위 결정부(1112), 상기 응답 반응시간의 정보로부터 도출된 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있는지 분석하는 응답 반응시간 분석부(1113), 및 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시 상기 운영센터(100)의 기동상태에 이상이 발생된 것으로 감지하는 기동상태 감지부(1114)를 포함할 수 있다.Specifically, the pre-sensing unit 1110 is a response response time information receiving unit 1111 for receiving the information of the response response time from the plurality of operation servers 111, the range of the maximum response time to the minimum response time. A reference reaction time range determining unit 1112 for calculating and determining the reference reaction time range, and a response reaction time analyzing unit 1113 for analyzing whether the response reaction time derived from the information on the response reaction time is within the reference reaction time range ), and when the response reaction time is not within the range of the reference reaction time, it may include a start state detection unit 1114 for detecting that an abnormality has occurred in the start state of the operation center 100 .

상기 응답 반응시간 정보 수신부(1111)는 상기 복수의 운영서버(111)로부터 상기 응답 반응시간의 정보를 수신할 수 있다.The response response time information receiving unit 1111 may receive information on the response response time from the plurality of operation servers 111 .

상기 응답 반응시간의 정보는 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답함과 동시에 상기 복수의 운영서버(111) 각각에 기록된 정보일 수 있으며, 상기 복수의 운영서버(111)와 연결되는 상기 운영센터 에이전트(1250)가 상기 복수의 운영서버(111)로 상기 응답 반응시간의 정보를 요청함으로써, 상기 응답 반응시간 정보 수신부(1111)로 수신된 값일 수 있다.The information of the response response time may be information recorded in each of the plurality of operation servers 111 while the plurality of operation servers 111 respond to the client's request, and the plurality of operation servers 111 and When the connected operation center agent 1250 requests information on the response response time from the plurality of operation servers 111 , it may be a value received by the response response time information receiving unit 1111 .

그러나, 상기 응답 반응시간의 정보는 상기한 경로를 통해 상기 응답 반응시간 정보 수신부(1111)로 수신되는 것에 한정되지 않으며, 상기 응답 반응시간 정보 수신부(1111)가 상기 응답 반응시간의 정보를 수신할 수 있는 경로라면 어떠한 형태라도 가능하며, 상기 응답 반응시간 정보 수신부(1111)가 상기 복수의 운영서버(111)와 유선 또는 네트워크 형식으로 연결됨으로서, 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답함과 동시에 상기 응답 반응시간의 정보가 상기 응답 반응시간 정보 수신부(1111)로 자동적으로 수신되는 경로로써 구성될 수 도 있다.However, the response response time information is not limited to being received by the response response time information receiving unit 1111 through the above path, and the response response time information receiving unit 1111 may receive the response response time information. Any possible path is possible, and as the response response time information receiving unit 1111 is connected to the plurality of operation servers 111 in a wired or network form, the plurality of operation servers 111 respond to the client's request. It may be configured as a path in which the response response time information is automatically received by the response response time information receiving unit 1111 at the same time as responding.

이어서, 상기 기준 반응시간 범위 결정부(1112)는 상기 응답 반응시간 중 가장 긴 최대 응답 반응시간과 상기 응답 반응시간 중 가장 짧은 최소 응답 반응시간을 검출하고, 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위를 상기 기준 반응시간 범위로 결정할 수 있다.Subsequently, the reference reaction time range determining unit 1112 detects the longest maximum response time among the response time and the shortest minimum response time among the response time, and the maximum response time to the minimum response time. The time range may be determined as the reference reaction time range.

상기 기준 반응시간 범위 결정부(1112)는 상술한 바와 같이, 미리 측정된 값을 통해 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위가 산출되어 결정될 수 있으나, 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자가 정한 수치에 따라 결정되는 것도 가능하다.As described above, the reference reaction time range determining unit 1112 may be determined by calculating the range of the maximum response time to the minimum response time through a previously measured value, but the operation center 100 or the It is also possible to be determined according to the numerical value set by the operator of the backup center 200 .

상기 응답 반응시간 수신부를 통해 수신된 상기 응답 반응시간은 상기 응답 반응시간 분석부(1113)에서 상기 기준 반응시간 범위 내에 있는지 분석될 수 있다. 상기 기준 반응시간 범위는 상술한 바와 같이 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위가 일정 시간 동안 이어진 형태로 제공되므로 상기 응답 반응시간 분석부(1113)는 상기 응답 반응시간이 미리 정해진 시간 동안 상기 기준 반응시간 범위 내에 있는지 분석할 수 있다.The response response time received through the response response time receiver may be analyzed by the response response time analyzer 1113 whether it is within the reference response time range. Since the reference reaction time range is provided in a form in which the range of the maximum response time to the minimum response time is continued for a predetermined time as described above, the response reaction time analyzer 1113 determines that the response reaction time is a predetermined time. It can be analyzed whether it is within the reference reaction time range.

상기 응답 반응시간 분석부(1113)의 분석 결과, 상기 응답 반응시간이 미리 정해진 시간 동안 상기 기준 반응시간 범위 내에 있지 않을 경우 상기 기동상태 감지부(1114)는 상기 운영센터(100)의 기동상태에 이상이 발생된 것으로 감지할 수 있다.As a result of the analysis of the response reaction time analysis unit 1113 , when the response reaction time is not within the reference reaction time range for a predetermined time, the starting state detection unit 1114 is the operation center 100 in the starting state. It can be detected that an abnormality has occurred.

시간대별로 측정되는 상기 응답 반응시간은 일시적으로 상기 기준 반응시간 범위를 벗어날 수도 있다. 이러한 이상 상황은 상기 복수의 운영서버(111)의 기동상태에 이상이 발생된 것으로 판단될 수도 있으나, 일반적으로 일시적인 이상상황은 상기 복수의 운영서버(111)가 네트워크나 사용되는 장치의 영향을 받거나, 심지어는 날씨와 같은 환경적인 요건에 영향을 받아 일시적으로 이상 상황을 보이는 경우가 있을 수 있다.The response reaction time measured for each time period may temporarily deviate from the reference reaction time range. In this abnormal situation, it may be determined that an abnormality has occurred in the activation state of the plurality of operation servers 111 , but in general, the temporary abnormal situation is affected by the network or the device used by the plurality of operation servers 111 , or , and even may exhibit temporary abnormalities under the influence of environmental requirements such as weather.

따라서, 상기 응답 반응시간이 상기 기준 반응시간 범위를 벗어난다고 하여 이상 상황으로 바로 결정을 내리는 것은 정확한 재해 발생 판단이 아닐 수 있으며, 미리 정해진 시간 동안 상기 응답 반응시간의 시간대별 값을 관찰하는 것이 바람직하다.Therefore, even if the response time is out of the range of the reference reaction time, it may not be an accurate determination of the occurrence of a disaster to immediately make a decision in an abnormal situation, and it is preferable to observe the time zone value of the response time for a predetermined time. do.

상기와 같은 이유를 근거로 본 발명에 따른 상기 사전 감지부(1110)는 미리 정해진 시간 동안 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터(100)의 기동상태에 이상이 발생된 것으로 감지할 수 있다.Based on the above reasons, the pre-sensing unit 1110 according to the present invention has an abnormality in the starting state of the operation center 100 when the response reaction time is not within the reference reaction time range for a predetermined time. can be detected as occurring.

재해가 발생되지 않은 평상시의 상기 복수의 운영서버(111)로부터 검출된 시간대별 상기 응답 반응시간은 도 3의 (a)를 통해 확인할 수 있으며, 도 3의 (a)를 참조하면, 미리 결정된 시간 동안 측정되는 상기 응답 반응시간 중 일부 측정된 상기 응답 반응시간이 상기 기준 반응시간 범위를 벗어난 것으로 감지되었으나, 곧 다시 정상적인 범위, 즉 상기 기준 반응시간 범위 내에서 측정되는 것을 확인할 수 있다.The response response time for each time period detected from the plurality of operation servers 111 in normal times when a disaster does not occur can be confirmed through (a) of FIG. 3 , and referring to FIG. Although it was detected that some of the measured response response times of the response response times were out of the reference response time range, it can be confirmed that they are measured again within a normal range, that is, within the reference response time range.

반면, 도 3의 (b)에서 도시하듯이, 기동상태의 이상이 발생된 상기 복수의 운영서버(111)로부터 검출된 측정 시간대별 상기 응답 반응시간은 상기 기준 반응시간 범위를 일정 시간 동안 벗어나는 것을 확인할 수 있다.On the other hand, as shown in (b) of FIG. 3, the response response time for each measurement time period detected from the plurality of operation servers 111 in which the abnormality of the activation state occurred is out of the reference reaction time range for a predetermined time. can be checked

이 경우 상기 응답 반응시간이 미리 결정된 시간 이상 비정상적인 거동으로 상기 기준 반응시간 범위를 벗어나므로, 상기 기동상태 감지부(1114)는 상기 복수의 운영서버(111)의 기동상태에 이상이 발생된 것으로 감지할 수 있으며, 이에 따른 대처가 신속하게 후속되어야 할 필요가 있다.In this case, since the response reaction time is out of the reference reaction time range due to an abnormal behavior for more than a predetermined time, the startup state detection unit 1114 detects that an abnormality has occurred in the startup state of the plurality of operation servers 111 . It can be done, and it is necessary to promptly follow the response accordingly.

상기와 같이 상기 운영센터(100), 다시 말해, 상기 운영센터(100)를 구성하는 복수의 운영서버(111)의 기동상태에 이상이 발생된 것으로 감지될 시, 상기 제2 재해복구 자동화 서버(2100)는 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)를 기동할 수 있으며, 그 전에 상기 사전 점검부(1120)를 통해 상기 운영센터(100) 및 상기 운영센터(100)와 동기화되는 상기 백업센터(200)간의 동기화 진행상태가 점검될 수 있다.As described above, when it is detected that an abnormality has occurred in the operation state of the operation center 100, that is, a plurality of operation servers 111 constituting the operation center 100, the second automatic disaster recovery server ( 2100) may start the plurality of backup servers 211 constituting the backup center 200, and before that, the operation center 100 and the operation center 100 through the pre-inspection unit 1120 A synchronization progress state between the backup center 200 synchronized with the .

상술한 바와 같이 상기 운영센터(100) 및 상기 백업센터(200)는 주기적 또는 실시간으로 동기화 될 수 있으며, 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111) 및 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)는 동기화가 진행 중에 상기 복수의 운영서버(111)의 기동상태의 이상이 발생될 수 도 있다.As described above, the operation center 100 and the backup center 200 may be synchronized periodically or in real time, and the plurality of operation servers 111 and the backup center 200 constituting the operation center 100 may be synchronized. ) of the plurality of backup servers 211 constituting the synchronization in progress, an abnormality in the activation state of the plurality of operation servers 111 may occur.

여기서, 상기 복수의 백업서버(211)가 상기 복수의 운영서버(111)와 동기화 중에 기동된다면 클라이언트의 요청 수행 주체가 상기 운영센터(100)에서 상기 백업센터(200)로 전환되기 위해 상기 복수의 운영서버(111)는 기동이 중단되어야 하고, 이에 따라 상기 복수의 운영서버(111) 및 상기 복수의 백업서버(211)간의 동기화는 중단되게 된다.Here, if the plurality of backup servers 211 are activated during synchronization with the plurality of operation servers 111 , the subject of the client's request is switched from the operation center 100 to the backup center 200 . The operation server 111 should be stopped from starting, and accordingly, synchronization between the plurality of operation servers 111 and the plurality of backup servers 211 is stopped.

그러나, 상기와 같은 경우, 상기 복수의 운영서버(111) 및 상기 복수의 백업서버(211)간의 동기화가 미완료 된 상태에서 중단될 경우, 상기 복수의 백업서버(211)는 다 진행되지 않은 동기화로 인해 상기 복수의 운영서버(111)의 근접하는 기동상태를 구현할 수 없으며, 또한 반 강제적인 동기화 종료로 인한 오류가 발생될 수 도 있다.However, in the above case, when the synchronization between the plurality of operation servers 111 and the plurality of backup servers 211 is stopped in an incomplete state, the plurality of backup servers 211 are synchronized to an incomplete synchronization. Due to this, it is not possible to implement a close operation state of the plurality of operation servers 111, and an error may occur due to semi-forced synchronization termination.

따라서, 상기 사전 점검부(1120)에 의해 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화가 진행중인 것으로 점검될 시, 상기 제2 재해복구 자동화 서버(2100)는 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화가 완료된 후 상기 복수의 백업서버(211)를 기동시킬 수 있다.Therefore, when the synchronization between the operation center 100 and the backup center 200 is checked by the pre-inspection unit 1120 as being in progress, the second automated disaster recovery server 2100 is the operation center 100 . And after synchronization between the backup centers 200 is completed, the plurality of backup servers 211 may be started.

물론 상기 사전 점검부(1120)에 의해 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화가 진행 중이지 않은 것으로 점검될 시, 상기 제2 재해복구 자동화 서버(2100)는 상기 복수의 백업서버(211)를 바로 기동시킬 수 도 있다.Of course, when it is checked by the pre-inspection unit 1120 that synchronization between the operation center 100 and the backup center 200 is not in progress, the second automated disaster recovery server 2100 performs the plurality of backups. The server 211 may be started immediately.

상기 사전 점검부(1120)는 상기 운영센터(100)가 상기 클라이언트의 요청을 수행하는 업무 중 상기 백업센터(200)에서 수행될 상기 업무의 범위를 결정하는 서비스 범위 결정부(1122)를 더 포함할 수 있다.The pre-inspection unit 1120 further includes a service range determination unit 1122 for determining the scope of the task to be performed in the backup center 200 among the tasks in which the operation center 100 performs the client's request. can do.

상술한 바와 같이 상기 백업센터(200)는 상기 운영센터(100)에서 갑작스럽게 발생될 수 있는 재해에 대비하여 구비되므로 상기 백업센터(200)를 구성하는 복수의 상기 백업서버(211)는 상기 운영센터(100)를 구성하는 복수의 상기 운영서버(111)에 비해 간소화되게 구비될 수 있다.As described above, the backup center 200 is provided in preparation for a disaster that may suddenly occur in the operation center 100 , so the plurality of the backup servers 211 constituting the backup center 200 are operated in the operation center 100 . Compared to the plurality of operation servers 111 constituting the center 100, it may be provided to be simplified.

따라서 상기 운영센터(100)에 재해가 발생하여 클라이언트의 요청의 처리 주체가 상기 백업센터(200)로 전환되면서 상기 운영센터(100)가 상기 클라이언트의 요청을 수행하는 모든 업무가 상기 백업센터(200)로 전환되지 않을 수 있다. 이에 따라 상기 서비스 범위 결정부(1122)는 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)가 기동되기 전 상기 운영센터(100)의 상기 업무로부터 전환될 상기 업무의 범위를 결정할 수 있다.Therefore, when a disaster occurs in the operation center 100 and the subject of processing the client's request is switched to the backup center 200, all tasks in which the operation center 100 performs the client's request are performed by the backup center 200 ) may not be converted to Accordingly, the service range determining unit 1122 determines the scope of the task to be switched from the task of the operation center 100 before the plurality of backup servers 211 constituting the backup center 200 are started. can

상기 서비스 범위 결정부(1122)는 상기 복수의 운영서버(111)에 대한 상기 복수의 백업서버(211)의 구성 규모에 따라 변경될 수 있으나, 상기 복수의 백업서버(211)는 상기 복수의 운영서버(111) 중 필수적인 구성은 모두 포함되도록 구성되므로 클라이언트의 요청의 처리 주체로 전환되어 사용되는 데에 문제가 없다.The service range determining unit 1122 may be changed according to the configuration scale of the plurality of backup servers 211 for the plurality of operation servers 111 , but the plurality of backup servers 211 may be configured for the operation of the plurality of operation servers 111 . Since all essential components of the server 111 are configured to be included, there is no problem in being converted and used as the processing subject of the client's request.

그러나 상기 백업센터(200)는 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)와 동일한 구성으로 상기 복수의 백업서버(211)를 포함함으로써 상기 운영센터(100)와 동등한 구성으로 구성될 수도 있으므로 이 경우 상기 서비스 범위 결정부(1122)는 상기 백업센터(200)의 업무 범위를 상기 운영센터(100)의 범위와 동등하게 또는 다르게 결정할 수 도 있다.However, the backup center 200 includes the plurality of backup servers 211 in the same configuration as the plurality of operation servers 111 constituting the operation center 100, so that the operation center 100 has the same configuration. Since it may be configured, in this case, the service range determination unit 1122 may determine the work range of the backup center 200 to be equal to or different from the range of the operation center 100 .

이어서, 상기 복수의 백업서버(211)가 기동될 시, 상기 제1 재해복구 자동화 장치(1000)는 상기 복수의 운영서버(111)의 기동을 정지시키고, 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화 경로를 차단시킬 수 있다.Subsequently, when the plurality of backup servers 211 are started, the first automated disaster recovery apparatus 1000 stops the operation of the plurality of operation servers 111 , and the operation center 100 and the backup center It is possible to block the synchronization path between (200).

상기 복수의 백업서버(211)가 기동되는 것은 상기 복수의 백업서버(211)가 클라이언트의 요청 처리의 주체로서 전환되기 위한 과정이며, 따라서 상기 복수의 백업서버(211)가 기동 중에도 상기 복수의 운영서버(111)가 기동하게 된다면, 클라이언트의 요청을 수신하게 되는 경로가 혼란되게 되어 상기 운영센터(100)에 발생된 재해상황이 더욱 악화될 수 있다.The actuation of the plurality of backup servers 211 is a process for the plurality of backup servers 211 to be converted as subjects of client request processing, and thus the plurality of backup servers 211 are operated while the plurality of backup servers 211 are running. If the server 111 is started, the path through which the client's request is received is confused, and the disaster situation occurring in the operation center 100 may be further aggravated.

무엇보다 상기 복수의 백업서버(211)의 기동은 상기 운영센터(100)에 재해가 발생될 경우 진행되므로, 재해에 따른 오류에 대한 영향을 완전히 배척시킨 상태에서 상기 백업센터(200)가 기동되는 것이 바람직하다.Above all, since the start-up of the plurality of backup servers 211 proceeds when a disaster occurs in the operation center 100, the backup center 200 is started in a state that completely excludes the effect of an error caused by the disaster. it is preferable

따라서 상기 복수의 백업서버(211)가 기동될 시, 상기 복수의 운영서버(111)의 기동은 정지되어야 하며, 이를 통해 상기 운영센터(100) 및 상기 백업센터(200)간 동기화의 경로도 원천적으로 차단될 수 있다.Therefore, when the plurality of backup servers 211 are activated, the operation of the plurality of operation servers 111 must be stopped, and through this, the synchronization path between the operation center 100 and the backup center 200 is also fundamental. can be blocked with

이어서, 상기 제2 재해복구 자동화 서버(2100)는 상기 복수의 백업서버(211)를 기동시킬 수 있다.Subsequently, the second automated disaster recovery server 2100 may start the plurality of backup servers 211 .

상술한 바와 같이 상기 백업센터(200)는 상기 제1 재해복구 자동화 장치(1000)로부터 전송 받은 운영센터(100) 이상 감지 신호를 토대로 상기 운영센터(100) 및 상기 백업센터(200)의 운영자의 재해 발생 결정에 따라 기동되므로 더욱 정확한 재해 발생 판단을 통해 기동될 수 있다.As described above, the backup center 200 is the operation center 100 and the operator of the backup center 200 based on the detection signal of the operation center 100 abnormality received from the first disaster recovery automation device 1000. Since it is activated according to the decision on the occurrence of a disaster, it can be activated through a more accurate judgment of the occurrence of a disaster.

또한 상기 제2 재해복구 자동화 서버(2100)는 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자의 상기 재해 발생 결정에 따라 상기 복수의 백업서버(211)를 자동적으로 기동하므로, 종래의 기동단계를 구성하는 각각의 단위 단계마다 운영자의 승인을 통해 기동되었던 방식에 비해 더욱 빠른 상기 백업서버(211)의 기동이 가능할 수 있다.In addition, since the second automated disaster recovery server 2100 automatically starts the plurality of backup servers 211 according to the disaster occurrence decision of the operator of the operation center 100 or the backup center 200, the conventional It may be possible to start the backup server 211 faster than the method in which it was started through the approval of the operator for each unit step constituting the start-up step.

구체적으로 상기 제2 재해복구 자동화 서버(2100)는 상기 복수의 백업서버(211)를 기능별로 그룹화하는 그룹화부(2111), 그룹화된 상기 복수의 백업서버(211)의 그룹별 기동순서를 결정하는 기동순서 결정부(2112), 상기 그룹별 기동시간을 산출하는 기동시간 산출부(2113), 상기 그룹별 기동이 상호 겹치지 않도록 상기 그룹별 기동 간격을 조율하는 기동 간격 조율부(2114) 및 상기 복수의 백업서버(211)를 상기 그룹별로 기동하는 그룹별 기동부(2115)를 포함할 수 있다.Specifically, the second automatic disaster recovery server 2100 is a grouping unit 2111 for grouping the plurality of backup servers 211 by function, and determining the startup sequence for each group of the grouped plurality of backup servers 211 A start-up sequence determining unit 2112, a start-up time calculator 2113 for calculating the start-up times for each group, a start-up interval arbiter 2114 for adjusting the start intervals for each group so that the group-by-group starts do not overlap with each other, and the plurality of It may include a group activation unit 2115 for starting the backup server 211 for each group.

도 4는 본 발명의 일 실시 예에 따른 백업센터(200)의 기동을 도시한다.Figure 4 shows the start-up of the backup center 200 according to an embodiment of the present invention.

상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)가 기동 중, 상호 충돌되지 않으려면, 유사한 업무를 수행하거나 동일한 서버 별로 구분, 즉, 기능별로 그룹화하여 그룹별로 기동되는 것이 바람직하다. 따라서, 상기 그룹화부(2111)는 상기 복수의 백업서버(211)가 기능별로 순차적으로 기동함으로써 시스템 내에서 상호 충돌이 발생하는 것을 방지하도록 상기 복수의 백업서버(211)를 기능별로 그룹화 할 수 있다.In order that the plurality of backup servers 211 constituting the backup center 200 do not collide with each other during operation, it is preferable to perform a similar task or to perform a similar task or divide by the same server, that is, group by function and start by group. . Accordingly, the grouping unit 2111 may group the plurality of backup servers 211 by function to prevent mutual conflicts in the system by sequentially starting the plurality of backup servers 211 by function. .

여기서 상기 복수의 백업서버(211)는 동일한 기능끼리 그룹화 될 수 있으나, 동시에 기동하였을 시에도 상호 충돌을 일으키지 않는다면 다른 기능을 갖는 서버끼리라도 같은 그룹으로 분류되어 그룹화 될 수 있다.Here, the plurality of backup servers 211 may be grouped with the same function, but even servers having different functions may be classified into the same group and grouped as long as they do not conflict with each other even when they are started at the same time.

도 4를 참조하여 일 실시 예를 살펴보면, 상기 복수의 백업서버(211)가 기능별로 분류(제1 그룹 내지 제4 그룹)된 것을 확인할 수 있다. 여기서 기능별로 분류된 상기 제1 그룹 내지 제4 그룹은 각각 동일한 서버들끼리 구성되거나 서로 다른 서버지만 동시 기동 시 상호 충돌을 일으키지 않는 서버들로 구성된 것일 수 있다.Referring to an exemplary embodiment with reference to FIG. 4 , it can be seen that the plurality of backup servers 211 are classified by function (first group to fourth group). Here, the first to fourth groups classified by function may be configured with the same servers or servers that are different from each other but do not conflict with each other during simultaneous startup.

상기 그룹화부(2111)는 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)를 기능별로 분류함으로써, 상기 백업센터(200) 기동 시, 상기 복수의 백업서버(211)가 개별적으로 기동되지 않고 기능별로 분류된 그룹끼리 일괄적으로 기동되므로 그룹간 상호 충돌이 방지되면서도 기동의 속도가 매우 향상될 수 있다The grouping unit 2111 classifies the plurality of backup servers 211 constituting the backup center 200 by function, so that when the backup center 200 is started, the plurality of backup servers 211 are individually Since the groups classified by function are not activated, but are activated collectively, the speed of maneuvering can be greatly improved while preventing mutual conflicts between groups.

이어서, 상기 기동순서 결정부(2112)는 그룹화된 상기 복수의 백업서버(211)의 그룹별 기동순서를 결정할 수 있다.Subsequently, the start-up order determining unit 2112 may determine the group-by-group start-up order of the grouped plurality of backup servers 211 .

상기 복수의 백업서버(211)가 그룹별로 기동될 시, 상기 그룹별 기동 순서를 고려하지 않는다면, 상기 복수의 백업서버(211)로부터 분류된 각각의 그룹들은 기동시 전후에 기동되는 다른 그룹을 통해 간섭을 받아 오류를 일으킬 수 있다. 다시 말해, 상기 복수의 백업서버(211)는 그룹별로 순차적으로 기동됨으로써, 전체적인 시스템을 구축할 수 있는데, 상기 복수의 백업서버(211)가 체계화된 기동순서로 기동되지 않는다면 상기 전제척인 시스템의 구축에 오류가 발생될 수 있다.When the plurality of backup servers 211 are activated for each group, if the startup order for each group is not taken into account, each group classified from the plurality of backup servers 211 is activated through another group activated before and after startup. Interference may cause errors. In other words, the plurality of backup servers 211 are sequentially activated for each group, so that the entire system can be built. There may be errors in the build.

일 예로, 데이터 검증 및 어플리케이션 구동을 담당하는 서버로 구성된 하나의 그룹이 시스템을 가동하는 다른 그룹보다 먼저 기동될 시, 기동되지 않은 시스템 상에서 데이터 검증 및 어플리케이션의 구동이 진행되도록 작용할 수 있으므로 상기 백업센터(200)에서 오류가 발생될 수 있다.As an example, when one group consisting of a server in charge of data verification and application driving is started up before another group running the system, data verification and application running on the system that are not started can act so that the backup center An error may occur in (200).

따라서, 상기 복수의 백업서버(211)로부터 분류된 복수의 그룹은 순차적으로 기동시 전후 관계에 따른 오류가 발생되지 않도록 고려되어 기동순서가 결정되는 것이 바람직하며, 이를 위해 상기 기동순서 결정부(2112)는 사전에 정상적으로 기동된 상기 복수의 백업서버(211)의 기동 결과를 통한 자료를 근거로 상기 그룹별 기동순서를 결정할 수 있다.Therefore, it is preferable that the startup sequence is determined by considering that the plurality of groups classified from the plurality of backup servers 211 do not cause errors according to context when starting sequentially, and for this, the startup sequence determining unit 2112 ) may determine the startup sequence for each group based on data through the startup results of the plurality of backup servers 211 that have been normally activated in advance.

상기 제2 재해복구 자동화 서버(2100)는 상기 복수의 백업서버(211)가 기동함에 있어서, 상호 충돌을 일으키지 않고 정상적으로 기동할 수 있도록 분류된 상기 그룹별로 기동순서가 결정되어 기동될 수 있도록 한다.When the plurality of backup servers 211 are started, the second automated disaster recovery server 2100 determines the start-up order for each group classified so that they can start normally without causing a mutual collision so that they can be started.

그러나, 상기 복수의 백업서버(211)로부터 기능별로 분류된 복수의 그룹 각각이 기동함에 있어서, 기동시간의 중복이 일어난다면 이 또한 상기 백업센터(200)의 기동전 오류를 초래할 수 있다.However, when the plurality of groups classified by function from the plurality of backup servers 211 start up, if the start-up time overlaps, this may also cause an error before the start-up of the backup center 200 .

따라서, 상기 기동시간 산출부(2113)는 상기 상기 복수의 그룹이 각각 기동되는데 소요되는 시간을 산출할 수 있으며, 이를 근거로 후술할 상기 기동 간격 조율부(2114)가 상기 그룹 각각의 기동간격을 조절할 수 있다.Accordingly, the start-up time calculator 2113 can calculate the time required for each of the plurality of groups to be started, and based on this, the start-up interval tuner 2114 to be described later determines the start-up intervals of each of the groups. can be adjusted

상기 기동시간 산출부(2113)는 미리 측정된 상기 그룹별 기동시간을 통하여 상기 그룹별 기동시간을 산출할 수 있다. 구체적으로, 상기 그룹별 기동시간을 복수 회 미리 측정된 값일 수 있으며, 상기 기동시간 산출부(2113)는 상기 미리 측정된 값을 상기 그룹별 기동시간으로 결정할 수 있다.The start-up time calculator 2113 may calculate the start-up time for each group based on the previously-measured start-up time for each group. Specifically, the start time for each group may be a value pre-measured a plurality of times, and the start time calculator 2113 may determine the pre-measured value as the start time for each group.

여기서, 상기 그룹별 기동시간은 기동시의 장치의 상황이나 네트워크 연결상태 등에 따라 그 기동이 상이할 수 있으므로 보다 확실한 오류 방지를 위해, 복수 회 미리 측정된 값들의 평균값 이상의 값이 상기 그룹별 기동시간으로 결정될 수 있으며, 보다 바람직하게는 복수 회 미리 측정된 값들 중 최대 값을 상기 그룹별 기동시간으로 결정될 수 있다.Here, the startup time for each group may be different depending on the condition of the device at startup or the network connection state, etc., so for more reliable error prevention, a value greater than or equal to the average value of the values measured a plurality of times in advance is the startup time for each group. may be determined, and more preferably, a maximum value among values previously measured a plurality of times may be determined as the startup time for each group.

이어서, 상기 기동 간격 조율부(2114)는 상기 그룹별 기동이 상호 겹치지 않도록 상기 그룹별 기동 간격을 조율할 수 있다.Subsequently, the starting interval tuning unit 2114 may adjust the group-by-group starting interval so that the group-by-group maneuvers do not overlap each other.

구체적으로, 상기 기동 간격 조율부(2114)는 상기 복수의 백업서버(211)로부터 분류된 복수의 그룹 각각이 상기 기동순서 결정부(2112)를 통해 결정된 기동순서에 따라 기동함에 있어서, 상기 기동순서에 따라 전후에 기동되는 다른 그룹들과 중복되는 시간에 기동이 일어나지 않도록 상기 기동시간 산출부(2113)를 통해 산출된 상기 그룹별 기동시간을 토대로 기동 간격을 조율할 수 있다.Specifically, in the startup interval arranging unit 2114, each of the plurality of groups classified from the plurality of backup servers 211 is activated according to the startup sequence determined through the startup sequence determining unit 2112, the startup sequence Accordingly, the starting interval may be adjusted based on the starting time for each group calculated through the starting time calculation unit 2113 so that starting does not occur at a time overlapping with other groups activated before and after.

상기 복수의 그룹 각각이 기동되는 시간은 상기 기동시간 산출부(2113)를 통해서 산출될 수 있으므로 각각의 기동이 완료되는 시간 이상으로 상기 복수의 그룹간의 간격을 정하는 것이 바람직하다.Since the time at which each of the plurality of groups is started can be calculated through the start time calculation unit 2113, it is preferable to set an interval between the plurality of groups to be longer than the time at which each start is completed.

따라서, 상기 기동 간격 조율부(2114)는 상기 그룹별 기동 간격이 상기 그룹별 기동시간 이상이 되도록 상기 그룹별 기동 간격을 조율할 수 있으며, 이를 통해 상기 그룹별 기동 간격은 상기 복수의 백업서버(211)를 구성하는 하나의 그룹의 기동이 완료되기 전까지 다른 그룹과의 기동의 중복이 방지될 수 있으므로 그룹별 상호 충돌이 방지될 수 있다.Accordingly, the startup interval tuning unit 2114 may adjust the startup interval for each group so that the startup interval for each group is greater than or equal to the startup time for each group. 211) until the start of one group constituting the group is completed, the duplication of maneuvers with other groups can be prevented, so that mutual conflicts for each group can be prevented.

이어서, 상기 그룹별 기동부(2115)는 상기 복수의 백업서버(211)를 상기 그룹별 기동 간격에 따라 상기 그룹별로 순차적으로 기동 시킬 수 있다. Subsequently, the group start unit 2115 may sequentially start the plurality of backup servers 211 for each group according to the group start interval.

상기 제1 재해복구 자동화 장치(1000)는 상기 운영서버(111)를 구성하는 복수의 운영서버(111)의 응답 반응시간을 실시간 또는 주기적으로 검출하여 상기 복수의 운영서버(111)의 기동상태 이상을 감지할 수 있으므로 보다 정확한 방법으로 상기 운영센터(100)의 기동상태의 이상 발생 유무를 감지할 수 있다.The first disaster recovery automation device 1000 detects the response response time of the plurality of operation servers 111 constituting the operation server 111 in real time or periodically to detect abnormalities in the operation state of the plurality of operation servers 111 . can be detected, so it is possible to detect whether an abnormality has occurred in the operating state of the operation center 100 in a more accurate way.

또한, 상기 제2 재해복구 자동화 장치(2000)는 상기 제1 재해복구 자동화 장치(1000)로부터 제공된 상기 운영센터(100) 이상 감지 신호를 토대로 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자의 재해 발생 결정에 따라 상기 백업센터(200)를 자동적으로 기동시킬 수 있으며, 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)를 기동 시, 상기 복수의 백업서버(211)를 기능별로 복수 개 그룹으로 분류하고, 그룹들에 순서를 정하여 상기 순서에 따라 상기 그룹들을 순차적으로 기동할 수 있으므로 상기 복수의 백업서버(211)간 상호 충돌이 방지되어 기동 안정성이 향상되고, 더욱 신속한 백업센터(200)의 기동이 가능한 재해복구 자동화 시스템을 제공할 수 있게 한다.In addition, the second automated disaster recovery device 2000 is based on the operation center 100 abnormality detection signal provided from the first automated disaster recovery device 1000 of the operation center 100 or the backup center 200 . The backup center 200 can be automatically started according to the operator's decision on the occurrence of a disaster, and when the plurality of backup servers 211 constituting the backup center 200 are started, the plurality of backup servers 211 can be classified into a plurality of groups by function, and the groups can be sequentially started according to the order by setting an order to the groups. It makes it possible to provide a disaster recovery automation system capable of promptly starting the backup center 200 .

이하에서는, 본 발명의 일 실시 예에 따른 재해복구 자동화 방법에 대해 살펴볼 수 있다.Hereinafter, a disaster recovery automation method according to an embodiment of the present invention can be looked at.

상기 재해복구 자동화 방법은 이하에 설명될 방법이 적용될 수 있는 재해복구 관련 장치 또는 시스템이라면 특별히 제한되지 않고 다양한 형태의 재해복구 수단에 적용될 수 있으나, 이하에서는 앞서 설명하였던 상기 재해복구 자동화 시스템에 적용된 상기 재해복구 자동화 방법을 일 예로 살펴봄으로써 본 발명에 따른 재해복구 자동화 방법을 이해할 수 있다.The disaster recovery automation method is not particularly limited as long as it is a disaster recovery-related device or system to which the method to be described below can be applied, and may be applied to various types of disaster recovery means. By looking at the disaster recovery automation method as an example, the disaster recovery automation method according to the present invention can be understood.

따라서, 상기 재해복구 자동화 방법을 설명함에 있어서, 상술된 재해복구 자동화 시스템 및 이를 구성하는 모든 구성요소들은 이하에서도 공유될 수 있다.Accordingly, in describing the disaster recovery automation method, the aforementioned disaster recovery automation system and all components constituting the same may be shared below.

도 5는 본 발명의 일 실시 예에 따른 재해복구 자동화 방법의 순서도이다. 이하에서는, 도 1 내지 도 5를 참조하여 상기 재해복구 자동화 방법을 살펴볼 수 있다.5 is a flowchart of a disaster recovery automation method according to an embodiment of the present invention. Hereinafter, the disaster recovery automation method can be viewed with reference to FIGS. 1 to 5 .

본 발명의 일 실시 예에 따른 재해복구 자동화 방법은 클라이언트의 요청을 수행하는 운영센터(100)에 재해가 발생한 경우, 상기 요청의 처리 주체를 상기 운영센터(100)에서 백업센터(200)로 전환하는 재해복구 자동화 방법으로서, 상기 운영센터(100)를 구성하는 복수의 운영서버(111)가 클라이언트의 요청에 응답하는 시간인 응답 반응시간을 검출하고, 상기 응답 반응시간을 상기 복수의 운영서버(111)가 정상적으로 기동하였을 시의 응답 반응시간의 범위인 기준 반응시간 범위 내에 있는지 여부를 확인하여 상기 운영센터(100)의 기동상태의 이상 발생 유무를 감지하는 사전 감지단계(S100), 상기 운영센터(100)의 기동상태에 이상이 발생된 것으로 감지된 경우, 상기 운영센터(100)와 백업센터(200)간의 동기화 진행상태를 점검하는 사전 점검단계(S200), 및 상기 백업센터(200)를 구성하는 복수의 백업서버(211)를 병렬적으로 기동하는 병렬적 기동단계(S300)를 포함할 수 있다.In the disaster recovery automation method according to an embodiment of the present invention, when a disaster occurs in the operation center 100 that performs the client's request, the processing subject of the request is switched from the operation center 100 to the backup center 200 As a disaster recovery automation method, the plurality of operation servers 111 constituting the operation center 100 detects a response response time, which is a time to respond to a client's request, and sets the response response time to the plurality of operation servers ( 111) is a pre-detection step (S100) of detecting whether an abnormality occurs in the starting state of the operation center 100 by checking whether it is within the reference reaction time range, which is the range of the response reaction time when the operation center is normally started (S100), the operation center When it is detected that an abnormality has occurred in the startup state of (100), a pre-check step (S200) of checking the synchronization progress state between the operation center 100 and the backup center 200, and the backup center 200 It may include a parallel starting step (S300) of starting the plurality of backup servers 211 in parallel to configure.

상기 운영센터(100)를 구성하는 복수의 운영서버(111)는 클라이언트의 요청에 의해 각각 단위 업무별로 기능을 수행하도록 반응하므로, 상기 복수의 운영서버(111)가 클라이언트의 요청에 의해 반응하는 시간이 상기 응답 반응시간일 수 있다.Since the plurality of operation servers 111 constituting the operation center 100 respond to perform functions for each unit task according to the request of the client, the time that the plurality of operation servers 111 respond to the request of the client This may be the response reaction time.

상기 응답 반응시간은 상기 운영센터(100)의 재해 발생 여부를 판단하는 척도로 사용될 수 있다. 즉, 상기 운영센터(100)에 재해가 발생되어 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)가 제 구실을 제대로 하지 못할 시, 상기 응답 반응시간은 느려질 수 있으며, 또한, 상기 복수의 운영서버(111)가 바이러스에 감염되거나 오류에 의한 오작동을 할 경우, 상기 응답 반응시간은 속도가 비정상적으로 빨라질 수 있으므로, 상기 응답 반응시간은 상기 복수의 재해 발생 여부를 진단하기에 매우 적합한 수단일 수 있다.The response reaction time may be used as a measure for determining whether a disaster has occurred in the operation center 100 . That is, when a disaster occurs in the operation center 100 and the plurality of operation servers 111 constituting the operation center 100 do not function properly, the response response time may be slow, and When the plurality of operation servers 111 are infected with a virus or malfunction due to an error, the response response time may be abnormally fast, so the response response time is very difficult to diagnose whether the plurality of disasters have occurred. It may be a suitable means.

여기서, 상기 응답 반응시간은 상기 복수의 운영서버(111)의 작동상태에 이상이 발생되었는지 판단하는 척도로 사용되므로, 상기 응답 반응시간이 정상적인 수지 내에 위치하는지 판단할 수 있는 상기 응답 반응시간의 비교군으로써, 상기 기준 반응시간 범위가 제시될 수 있다.Here, since the response response time is used as a measure to determine whether an abnormality has occurred in the operation state of the plurality of operation servers 111, a comparison of the response response time that can determine whether the response response time is located within a normal balance As a group, the reference reaction time range may be presented.

상기 기준 반응시간 범위는 재해가 발생되지 않은 평상시의 상기 복수의 운영서버(111), 즉, 클라이언트의 요청을 정상적으로 처리할 수 있는 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답하는 시간 중 상기 최대 응답 반응시간 및 상기 최소 응답 반응시간을 산출하여 각각 최대값과 최소값으로 설정한 범위일 수 있다.The reference reaction time range is the time during which the plurality of operation servers 111 in normal times in which a disaster does not occur, that is, the plurality of operation servers 111 that can normally process the client's request respond to the client's request. The maximum response time and the minimum response time may be calculated and set to a maximum value and a minimum value, respectively.

상기 기준 반응시간은 정상적인 상기 복수의 운영서버(111)를 통해 복수 회 미리 측정되어 저장된 값일 수 있는데, 보다 정확한 범위 제공을 위하여 일정 시간 동안 측정된 값으로 그 범위가 제공될 수 있다.The reference reaction time may be a value previously measured and stored a plurality of times through the plurality of normal operation servers 111 . In order to provide a more accurate range, the range may be provided as a value measured for a certain period of time.

이하에서는, 상기 응답 반응시간 및 상기 기준 반응시간 범위를 통한 상기 운영센터(100)의 기동상태의 감지에 대해 자세히 살펴볼 수 있다.Hereinafter, the detection of the activation state of the operation center 100 through the response reaction time and the reference reaction time range can be viewed in detail.

상기 사전 감지단계(S100)는 상술한 상기 응답 반응시간 및 상기 기준 반응시간 범위를 통하여 상기 운영센터(100)의 재해 발생 여부를 사전에 감지하는 역할을 수행할 수 있다.The pre-sensing step (S100) may serve to detect in advance whether a disaster has occurred in the operation center 100 through the above-described response reaction time and the reference reaction time range.

구체적으로, 상기 사전 감지단계(S100)는, 상기 복수의 운영서버(111)로부터 상기 응답 반응시간의 정보를 수신하는 응답 반응시간 정보 수신단계(S110), 최대 응답 반응시간 내지 최소 응답 반응시간의 범위를 산출하여 상기 기준 반응시간 범위를 결정하는 기준 반응시간 범위 결정단계(S120), 상기 응답 반응시간의 정보로부터 도출된 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있는지 분석하는 응답 반응시간 분석단계(S130) 및 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터(100)의 기동상태에 이상이 발생된 것으로 감지하는 기동상태 감지단계(S140)를 포함할 수 있다.Specifically, the pre-sensing step (S100) is a response response time information receiving step (S110) of receiving the information of the response response time from the plurality of operation servers 111, the maximum response time to the minimum response time A reference reaction time range determining step (S120) of determining the reference reaction time range by calculating a range, a response reaction time analysis step of analyzing whether the response reaction time derived from the information on the response reaction time is within the reference reaction time range (S130) and when the response reaction time is not within the reference reaction time range, it may include a starting state detection step (S140) of detecting that an abnormality has occurred in the starting state of the operation center 100.

상기 응답 반응시간 정보 수신단계(S110)에서 상기 응답 반응시간 정보 수신부(1111)는 상기 복수의 운영서버(111)로부터 상기 응답 반응시간에 대한 정보를 수신할 수 있다.In the response response time information receiving step ( S110 ), the response response time information receiving unit 1111 may receive information on the response response time from the plurality of operation servers 111 .

상기 응답 반응시간의 정보는 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답함과 동시에 상기 복수의 운영서버(111) 각각에 기록된 정보일 수 있으며, 상기 복수의 운영서버(111)와 연결되는 상기 운영센터 에이전트(1250)가 상기 복수의 운영서버(111)로 상기 응답 반응시간의 정보를 요청함으로써, 상기 응답 반응시간 정보 수신부(1111)로 수신된 값일 수 있다.The information of the response response time may be information recorded in each of the plurality of operation servers 111 while the plurality of operation servers 111 respond to the client's request, and the plurality of operation servers 111 and When the connected operation center agent 1250 requests information on the response response time from the plurality of operation servers 111 , it may be a value received by the response response time information receiving unit 1111 .

그러나, 상기 응답 반응시간의 정보는 상기한 경로를 통해 상기 응답 반응시간 정보 수신부(1111)로 수신되는 것에 한정되지 않으며, 상기 응답 반응시간 정보 수신부(1111)가 상기 응답 반응시간의 정보를 수신할 수 있는 경로라면 어떠한 형태라도 가능하며, 상기 응답 반응시간 정보 수신부(1111)가 상기 복수의 운영서버(111)와 유선 또는 네트워크 형식으로 연결됨으로서, 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답함과 동시에 상기 응답 반응시간의 정보가 상기 응답 반응시간 정보 수신부(1111)로 자동적으로 수신되는 경로로써 구성될 수 도 있다.However, the response response time information is not limited to being received by the response response time information receiving unit 1111 through the above path, and the response response time information receiving unit 1111 may receive the response response time information. Any possible path is possible, and as the response response time information receiving unit 1111 is connected to the plurality of operation servers 111 in a wired or network form, the plurality of operation servers 111 respond to the client's request. It may be configured as a path in which the response response time information is automatically received by the response response time information receiving unit 1111 at the same time as responding.

이어서, 상기 기준 반응시간 범위 결정단계(S120)에서 상기 기준 반응시간 범위 결정부(1112)는 상기 응답 반응시간의 비교군으로서 상기 기준 반응시간 범위를 결정할 수 있다.Subsequently, in the step of determining the reference reaction time range ( S120 ), the reference reaction time range determiner 1112 may determine the reference reaction time range as a comparison group of the response reaction times.

상기 기준 반응시간 범위 결정단계(S120)는 상술한 바와 같이, 미리 측정된 값을 통해 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위가 산출되어 결정될 수 있으나, 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자가 정한 수치에 따라 결정되는 것도 가능하다.In the reference reaction time range determining step (S120), as described above, the range of the maximum response time to the minimum response time may be calculated and determined based on a previously measured value, but the operation center 100 or the It is also possible to be determined according to the numerical value set by the operator of the backup center 200 .

상기 응답 반응시간 정보 수신단계(S110)를 통해 상기 응답 반응시간 수신부로 수신된 상기 응답 반응시간은 상기 응답 반응시간 분석단계(S130)에서 상기 응답 반응시간 분석부(1113)을 통해 상기 기준 반응시간 범위 내에 있는지 분석될 수 있다. 상기 기준 반응시간 범위는 상술한 바와 같이 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위가 일정 시간 동안 이어진 형태로 제공되므로, 상기 분석단계(S130)에서 상기 응답 반응시간은 상기 응답 반응시간이 미리 정해진 시간 동안 상기 기준 반응시간 범위 내에 있는지 분석될 수 있다.The response reaction time received by the response reaction time receiving unit through the response reaction time information receiving step (S110) is the reference reaction time through the response reaction time analysis unit 1113 in the response reaction time analysis step (S130). It can be analyzed whether it is within the range. Since the reference reaction time range is provided in a form in which the range of the maximum response time to the minimum response time is continued for a certain time as described above, the response reaction time in the analysis step S130 is the response time It can be analyzed whether it is within the reference reaction time range for a predetermined time.

상기 응답 반응시간 분석단계(S130)에서의 분석 결과, 상기 응답 반응시간이 미리 정해진 시간 동안 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 기동상태 감지단계(S140)에서 상기 기동상태 감지부(1114)는 상기 운영센터(100)의 기동상태에 이상이 발생된 것으로 감지할 수 있다.As a result of the analysis in the response reaction time analysis step (S130), when the response reaction time is not within the reference reaction time range for a predetermined time, the starting state detecting unit 1114 in the starting state detecting step (S140) may detect that an abnormality has occurred in the operating state of the operation center 100 .

시간대별로 측정되는 상기 응답 반응시간은 일시적으로 상기 기준 반응시간 범위를 벗어날 수도 있다. 이러한 이상 상황은 상기 복수의 운영서버(111)의 기동상태에 이상이 발생된 것으로 판단될 수 도 있으나, 일반적으로 일시적인 이상 상황은 상기 복수의 운영서버(111)가 네트워크나 사용되는 장치의 영향을 받거나, 심지어는 날씨와 같은 환경적인 요건에 영향을 받아 일시적으로 이상 상황을 보이는 경우가 많다.The response reaction time measured for each time period may temporarily deviate from the reference reaction time range. In this abnormal situation, it may be determined that an abnormality has occurred in the activation state of the plurality of operation servers 111 , but in general, a temporary abnormal situation is the influence of the network or the device used by the plurality of operation servers 111 . It is often affected by environmental factors, such as weather, or even temporarily anomalies.

따라서, 상기 응답 반응시간이 상기 기준 반응시간 범위를 벗어난다고 해도, 이상 상황으로 바로 결정을 내리는 것은 정확한 진단이 아니며, 미리 정해진 시간 동안 상기 응답 반응시간의 시간대별 값을 관찰하는 것이 바람직하다.Therefore, even if the response response time is out of the range of the reference response time, it is not an accurate diagnosis to immediately make a decision in an abnormal situation, and it is preferable to observe the time value of the response response time for a predetermined time.

상기와 같은 이유를 근거로 본 발명에 따른 상기 사전 감지단계(S100)에서 미리 정해진 시간 동안 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터(100)의 기동상태에 이상이 발생한 것으로 감지될 수 있다.When the response reaction time is not within the reference reaction time range for a predetermined time in the pre-sensing step (S100) according to the present invention based on the above reasons, the operation center 100 has an abnormality in the starting state. can be detected as occurring.

상기와 같이 상기 사전 감지를 통해 상기 운영센터(100), 다시 말해, 상기 운영센터(100)를 구성하는 복수의 운영서버(111)의 기동상태에 이상이 발생된 것으로 감지될 시, 상기 사전 점검단계(S200)는 상기 사전 점검부(1120)을 통해 상기 운영센터(100) 및 상기 운영센터(100)와 동기화되는 상기 백업센터(200)간의 동기화 진행상태를 점검할 수 있다.As described above, when it is detected that an abnormality has occurred in the operation state of the operation center 100 , that is, a plurality of operation servers 111 constituting the operation center 100 through the pre-detection, the pre-inspection In step S200, a synchronization progress state between the operation center 100 and the backup center 200 synchronized with the operation center 100 may be checked through the pre-inspection unit 1120 .

상기 운영센터(100) 및 상기 백업센터(200)는 주기적 또는 실시간으로 동기화 될 수 있으며, 따라서, 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111) 및 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)는 동기화가 진행 중에 상기 복수의 운영서버(111)의 기동상태의 이상이 발생될 수 도 있다.The operation center 100 and the backup center 200 may be synchronized periodically or in real time, and thus the plurality of operation servers 111 and the backup center 200 constituting the operation center 100 may be synchronized. In the plurality of backup servers 211 constituting the synchronization, an abnormality in the activation state of the plurality of operation servers 111 may occur.

여기서, 상기 복수의 백업서버(211)가 상기 복수의 운영서버(111)와 동기화 중에 기동된다면, 클라이언트의 요청 수행 주체가 상기 운영서버(111)에서 상기 백업서버(211)로 전환되기 위해, 상기 복수의 운영서버(111)는 기동이 중단되어야 하고 이에 따라 상기 복수의 운영서버(111) 및 상기 복수의 백업서버(211)간의 동기화는 중단되게 된다.Here, if the plurality of backup servers 211 are activated during synchronization with the plurality of operation servers 111 , the subject of the client's request is switched from the operation server 111 to the backup server 211 , the The operation of the plurality of operation servers 111 should be stopped, and accordingly, synchronization between the plurality of operation servers 111 and the plurality of backup servers 211 is stopped.

그러나, 상기와 같은 경이, 상기 복수의 운영서버(111) 및 상기 복수의 백업서버(211)간의 동기화가 미완료 된 상태에서 중단될 경우, 상기 복수의 백업서버(211)는 다 진행되지 않은 동기화로 인해 상기 복수의 운영서버(111)의 근접하는 기동상태를 구현할 수 없으며, 또한 반 강제적인 동기화 종료로 인한 오류가 발생될 수 도 있다.However, when the synchronization between the plurality of operation servers 111 and the plurality of backup servers 211 is stopped in an incomplete state, the plurality of backup servers 211 are synchronized with the uncompleted synchronization as described above. Due to this, it is not possible to implement a close operation state of the plurality of operation servers 111, and an error may occur due to semi-forced synchronization termination.

따라서, 상기 사전 점검단계(S200)에 의해 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화가 진행중인 것으로 점검될 시, 상기 병렬적 기동단계(S300)는 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화가 완료된 후, 상기 복수의 백업서버(211)를 기동하는 것이 바람직하다.Therefore, when it is checked that the synchronization between the operation center 100 and the backup center 200 is in progress by the pre-checking step (S200), the parallel starting step (S300) is the operation center 100 and the After synchronization between the backup centers 200 is completed, it is preferable to start up the plurality of backup servers 211 .

물론, 상기 사전 점검단계(S200)에 의해 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화가 진행 중이지 않은 것으로 점검될 시, 상기 병렬적 기동단계(S300)에서 상기 복수의 백업서버(211)는 바로 기동시킬 수 도 있다.Of course, when it is checked that the synchronization between the operation center 100 and the backup center 200 is not in progress by the pre-checking step (S200), the plurality of backup servers in the parallel starting step (S300) (211) can also be started immediately.

상기 사전 점검단계(S200)는 상기 운영센터(100)가 상기 클라이언트의 요청을 수행하는 업무 중 상기 백업센터(200)에서 수행될 상기 업무의 범위를 결정하는 서비스 범위 결정단계(S220)를 더 포함할 수 있다.The pre-checking step (S200) further includes a service range determining step (S220) of determining the scope of the task to be performed in the backup center 200 among the tasks in which the operation center 100 performs the client's request. can do.

앞서 언급하였듯이, 상기 백업센터(200)는 상기 운영센터(100)에서 갑작스럽게 발생될 수 있는 재해에 대비하여 구비되므로 상기 백업센터(200)를 구성하는 복수의 상기 백업서버(211)는 상기 운영센터(100)를 구성하는 복수의 상기 운영서버(111)에 비해 간소화되게 구비될 수 있다.As mentioned above, since the backup center 200 is provided in preparation for a disaster that may occur suddenly in the operation center 100 , a plurality of the backup servers 211 constituting the backup center 200 are operated in the operation center 100 . Compared to the plurality of operation servers 111 constituting the center 100, it may be provided to be simplified.

따라서, 상기 운영센터(100)에 재해가 발생하여 클라이언트의 요청의 처리 주체가 상기 백업센터(200)로 전환되면서 상기 운영센터(100)가 상기 클라이언트의 요청을 수행하는 모든 업무가 상기 백업센터(200)로 전환될 수 없다. 이에 따라 상기 서비스 범위 결정단계(S220)에서 상기 서비스 범위 결정부(1122)는 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)가 기동되기 전 상기 운영센터(100)의 상기 업무로부터 전환될 상기 업무의 범위를 결정할 수 있다.Therefore, when a disaster occurs in the operation center 100 and the subject of processing the client's request is switched to the backup center 200, all tasks in which the operation center 100 performs the client's request are performed by the backup center ( 200) cannot be converted. Accordingly, in the service range determining step (S220), the service range determining unit 1122 performs the operation of the operation center 100 before the plurality of backup servers 211 constituting the backup center 200 are started. may determine the scope of the work to be transferred from.

상기 서비스 범위 결정단계(S220)서 결정되는 상기 업무의 범위는 상기 복수의 운영서버(111)에 대한 상기 복수의 백업서버(211)의 구성 규모에 따라 변경될 수 있으나, 상기 복수의 백업서버(211)는 상기 복수의 운영서버(111) 중 필수적인 구성은 모두 포함되도록 구성되므로 클라이언트의 요청의 처리 주체로 전환되어 사용되는 데에 문제가 없다.The scope of the task determined in the service range determining step (S220) may be changed according to the configuration scale of the plurality of backup servers 211 for the plurality of operation servers 111, but the plurality of backup servers ( 211) is configured to include all essential components among the plurality of operation servers 111, so there is no problem in being converted and used as the processing subject of the client's request.

그러나, 상기 백업센터(200)는 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)와 동일한 구성으로 상기 복수의 백업서버(211)를 포함함으로써, 상기 운영센터(100)와 동등한 구성으로 구성될 수도 있으므로, 이 경우 상기 서비스 범위 결정단계(S220)에서 상기 백업센터(200)의 업무 범위는 상기 운영센터(100)의 범위와 동등하게 또는 다르게 결정될 수 도 있다.However, the backup center 200 includes the plurality of backup servers 211 in the same configuration as the plurality of operation servers 111 constituting the operation center 100, so that the operation center 100 is equivalent to Since it may be configured as a configuration, in this case, the work range of the backup center 200 in the service range determination step (S220) may be determined to be equal to or different from the range of the operation center 100.

이어서, 상기 병렬적 기동단계(S300)에서 상기 복수의 백업서버(211)가 기동될 시, 상기 복수의 운영서버(111)는 기동이 정지되고, 상기 운영센터(100) 및 상기 백업센터(200) 동기화의 경로는 차단될 수 있다.Then, when the plurality of backup servers 211 are started in the parallel startup step (S300), the operation of the plurality of operation servers 111 is stopped, and the operation center 100 and the backup center 200 ) the path of synchronization may be blocked.

상기 복수의 백업서버(211)가 기동되는 것은 상기 복수의 백업서버(211)가 클라이언트의 요청 처리의 주체로서 전환되기 위한 과정이며, 따라서 상기 복수의 백업서버(211)가 기동 중에도 상기 복수의 운영서버(111)가 기동하게 된다면, 클라이언트의 요청을 수신하게 되는 경로가 혼란되게 되어 상기 운영센터(100)에 발생된 재해상황이 더욱 악화될 수 있다.The actuation of the plurality of backup servers 211 is a process for the plurality of backup servers 211 to be converted as subjects of client request processing, and thus the plurality of backup servers 211 are operated while the plurality of backup servers 211 are running. If the server 111 is started, the path through which the client's request is received is confused, and the disaster situation occurring in the operation center 100 may be further aggravated.

무엇보다 상기 복수의 백업서버(211)의 기동은 상기 운영센터(100)에 재해가 발생될 경우 진행되므로 재해에 따른 오류에 대한 영향을 완전히 배척시킨 상태에서 상기 백업센터(200)가 기동되는 것이 바람직하다.Above all, since the start-up of the plurality of backup servers 211 proceeds when a disaster occurs in the operation center 100, it is important that the backup center 200 is started in a state that completely excludes the effect of an error caused by the disaster. desirable.

따라서 상기 복수의 백업서버(211)가 기동될 시, 상기 복수의 운영서버(111)의 기동은 정지될 수 있으며, 이를 통해 상기 운영센터(100) 및 상기 백업센터(200)간 동기화의 경로도 원천적으로 차단될 수 있다.Therefore, when the plurality of backup servers 211 are started, the start of the plurality of operation servers 111 may be stopped, and through this, the synchronization path between the operation center 100 and the backup center 200 is also shown. can be blocked in the first place.

이어서, 상기 병렬적 기동단계(S300)에서 상기 복수의 백업서버(211)는 기동될 수 있다.Subsequently, in the parallel starting step (S300), the plurality of backup servers 211 may be activated.

상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)가 기동 중, 상호 충돌되지 않으려면, 유사한 업무를 수행하거나 동일한 서버 별로 구분, 즉, 기능별로 그룹화하여 그룹별로 기동되는 것이 바람직하다. 따라서, 상기 그룹화 단계(S310)는 상기 복수의 백업서버(211)가 기능별로 순차적으로 기동함으로써 시스템 내에서 상호 충돌이 발생하는 것을 방지하도록 상기 복수의 백업서버(211)를 기능별로 그룹화 할 수 있다.In order that the plurality of backup servers 211 constituting the backup center 200 do not collide with each other during operation, it is preferable to perform a similar task or to perform a similar task or divide by the same server, that is, group by function and start by group. . Therefore, in the grouping step (S310), the plurality of backup servers 211 can be grouped by function to prevent mutual conflicts in the system by sequentially starting each function by function. .

여기서, 상기 복수의 백업서버(211)는 동일한 기능끼리 그룹화 될 수 있으나, 동시에 기동하였을 시에도 상호 충돌을 일으키지 않는다면 다른 기능을 갖는 서버끼리라도 같은 그룹으로 분류되어 그룹화 될 수 있다.Here, the plurality of backup servers 211 may be grouped with the same function, but even servers having different functions may be classified into the same group and grouped as long as they do not conflict with each other even when they are started at the same time.

상기 그룹화 단계(S310)에서 상기 그룹화부(2111)는 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)를 기능별로 분류함으로써, 상기 백업센터(200) 기동 시, 상기 복수의 백업서버(211)가 개별적으로 기동되지 않고 기능별로 분류된 그룹끼리 일괄적으로 기동되므로 그룹간 상호 충돌이 방지하면서도 기동의 속도를 크게 향상시킬 수 있다In the grouping step (S310), the grouping unit 2111 classifies the plurality of backup servers 211 constituting the backup center 200 by function, so that when the backup center 200 is started, the plurality of backup Since the server 211 is not started individually, but is started collectively among groups classified by function, it is possible to greatly improve the speed of the start while preventing mutual conflict between groups.

이어서, 상기 기동순서 결정단계(S320)에서 상기 기동순서 결정부(3112)는 그룹화된 상기 복수의 백업서버(211)의 그룹별 기동순서를 결정할 수 있다.Subsequently, in the starting sequence determining step (S320), the startup sequence determining unit 3112 may determine the group startup sequence of the grouped plurality of backup servers 211 .

상기 복수의 백업서버(211)가 그룹별로 기동될 시, 상기 그룹별 기동 순서를 고려하지 않는다면, 상기 복수의 백업서버(211)로부터 분류된 각각의 그룹들은 기동시 전후에 기동되는 다른 그룹을 통해 간섭을 받아 오류를 일으킬 수 있다. 다시 말해, 상기 복수의 백업서버(211)는 그룹별로 순차적으로 기동됨으로써, 전체적인 시스템을 구축할 수 있는데, 상기 복수의 백업서버(211)가 체계화된 기동순서로 기동되지 않는다면 상기 전제적인 시스템의 구축에 오류가 발생될 수 있다.When the plurality of backup servers 211 are activated for each group, if the startup order for each group is not taken into account, each group classified from the plurality of backup servers 211 is activated through another group activated before and after startup. Interference may cause errors. In other words, the plurality of backup servers 211 are sequentially started for each group, so that the entire system can be built. may cause an error.

상기 병렬적 기동단계(S300)는 상기 복수의 백업서버(211)가 기동함에 있어서, 상호 충돌을 일으키지 않고 정상적으로 기동할 수 있도록 분류된 상기 그룹별로 기동순서가 결정되어 기동될 수 있도록 한다.In the parallel start-up step (S300), when the plurality of backup servers 211 are started, the start-up order is determined for each group classified so that they can be started normally without causing a mutual collision so that they can be started.

그러나, 상기 복수의 백업서버(211)로부터 기능별로 분류된 복수의 그룹 각각이 기동함에 있어서, 기동시간의 중복이 일어난다면, 이 또한, 상기 백업센터(200)의 기동전 오류를 초래할 수 있다.However, when the plurality of groups classified by function from the plurality of backup servers 211 start up, if the start-up time overlaps, this may also lead to an error before the start-up of the backup center 200 .

따라서, 상기 기동시간 산출단계(S330)에서 상기 상기 복수의 그룹이 각각 기동되는데 소요되는 시간이 산출될 수 있으며, 이를 근거로 후술할 상기 기동 간격 조율단계(S340)에서 상기 그룹 각각의 기동간격이 조율할 수 있다.Accordingly, in the starting time calculation step (S330), the time required for each of the plurality of groups to be activated can be calculated, and based on this, the starting interval of each group is determined in the starting interval tuning step (S340), which will be described later. can be coordinated

상기 기동시간 산출단계(S330)에서 상기 기동시간 산출부(2113)는 미리 측정된 상기 그룹별 기동시간을 통하여 상기 그룹별 기동시간을 산출할 수 있다. 구체적으로, 상기 그룹별 기동시간은 복수 회 미리 측정된 값일 수 있으며, 상기 기동시간 산출부(2113)는 상기 미리 측정된 값을 상기 그룹별 기동시간으로 결정할 수 있다.In the starting time calculation step ( S330 ), the starting time calculator 2113 may calculate the starting time for each group based on the previously measured starting time for each group. Specifically, the start-up time for each group may be a value pre-measured a plurality of times, and the start-up time calculator 2113 may determine the pre-measured value as the start time for each group.

여기서, 상기 그룹별 기동시간은 기동시의 장치의 상황이나 네트워크 연결상태 등에 따라 그 기동이 상이할 수 있으므로 보다 확실한 오류 방지를 위해, 복수 회 미리 측정된 값의 평균값 이상의 값이 상기 그룹별 기동시간으로 결정될 수 있으며, 보다 바람직하게는 복수 회 미리 측정된 값 중 최대 값을 상기 그룹별 기동시간으로 결정할 수 있다.Here, the startup time for each group may be different depending on the condition of the device at startup or the network connection state, etc., so in order to more reliably prevent errors, a value greater than or equal to the average value of the values measured in advance a plurality of times is the startup time for each group. may be determined, and more preferably, a maximum value among values previously measured a plurality of times may be determined as the startup time for each group.

이어서, 상기 기동 간격 조율단계(S340)에서 상기 그룹별 기동이 상호 겹치지 않도록 상기 그룹별 기동 간격은 조율될 수 있다.Subsequently, in the maneuvering interval tuning step ( S340 ), the group-by-group start-up interval may be adjusted so that the group-by-group maneuvers do not overlap each other.

구체적으로 상기 기동 간격 조율단계(S340)에서 상기 기동 간격 조율부(2114)는 상기 복수의 백업서버(211)로부터 분류된 복수의 그룹 각각이 상기 기동순서 결정부(2112)를 통해 결정된 기동순서에 따라 기동함에 있어서, 상기 기동순서에 따라 전후에 기동되는 다른 그룹들과 중복되는 시간에 기동이 일어나지 않도록 상기 기동시간 산출단계(S330)를 통해 산출된 상기 그룹별 기동시간을 토대로 기동 간격을 조율할 수 있다.Specifically, in the starting interval tuning step (S340), the starting interval tuning unit 2114 includes each of the plurality of groups classified from the plurality of backup servers 211 in the starting order determined through the starting sequence determining unit 2112. In starting according to the starting order, the starting interval is adjusted based on the starting time for each group calculated through the starting time calculation step (S330) so that the startup does not occur at a time overlapping with other groups that are activated before and after according to the starting order. can

상기 복수의 그룹 각각이 기동되는 시간은 상기 기동시간 산출단계(S330)를 통해서 산출될 수 있으므로, 각각의 기동이 완료되는 시간 이상으로 상기 복수의 그룹간의 간격을 정하는 것이 바람직하다.Since the time at which each of the plurality of groups is activated can be calculated through the step of calculating the starting time ( S330 ), it is preferable to set an interval between the plurality of groups longer than the time at which each startup is completed.

따라서, 상기 기동 간격 조율단계(S340)를 통해 상기 그룹별 기동 간격이 상기 그룹별 기동시간 이상이 되도록 상기 그룹별 기동 간격이 조율될 수 있으며, 이를 통해, 상기 복수의 백업서버(211)를 구성하는 하나의 그룹의 기동이 완료되기 전까지 다른 그룹과의 기동의 중복이 방지될 수 있으므로, 그룹별 상호 충돌이 방지될 수 있다.Therefore, the starting interval for each group may be adjusted so that the starting interval for each group is equal to or greater than the starting time for each group through the starting interval tuning step (S340), and through this, the plurality of backup servers 211 are configured Since the overlapping of the maneuvers with other groups can be prevented until the start of one group is completed, the mutual collision for each group can be prevented.

이어서, 상기 그룹별 기동단계(S350)에서 상기 복수의 백업서버(211)는 상기 그룹별 기동부(2115)를 통해 상기 그룹별 기동 간격에 따라 상기 그룹별로 순차적으로 기동될 수 있다.Subsequently, in the group-by-group startup step ( S350 ), the plurality of backup servers 211 may be sequentially started for each group according to the group-by-group startup interval through the group-by-group startup unit 2115 .

상술한 재해복구 자동화 방법에 있어서, 상기 사전 감지단계(S100)에서 상기 운영서버(111)를 구성하는 복수의 운영서버(111)의 응답 반응시간이 실시간 또는 주기적으로 검출되어, 상기 복수의 운영서버(111)의 기동상태 이상이 감지됨으로써 보다 정확한 재해 발생 판단의 근거가 제공될 수 있으며, 상기 사전 점검단계(S200)에서 상기 운영센터(100) 및 상기 백업센터(200)의 동기화 진행상태가 점검됨으로써, 상기 백업센터(200)를 구성하는 복수의 백업서버(211)를 기동시키기 위한 준비가 진행될 수 있다.In the disaster recovery automation method described above, the response response time of the plurality of operation servers 111 constituting the operation server 111 is detected in real time or periodically in the pre-detection step (S100), and the plurality of operation servers By detecting an abnormality in the operation state of (111), a more accurate basis for determining the occurrence of a disaster can be provided, and the synchronization progress state of the operation center 100 and the backup center 200 is checked in the preliminary inspection step (S200). By doing so, preparations for activating the plurality of backup servers 211 constituting the backup center 200 may proceed.

또한, 상기 병렬적 기동단계(S300)에서는, 상기 제1 재해복구 자동화 장치(1000)로부터 제공된 상기 운영센터(100) 이상 감지 신호를 토대로 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자의 재해 발생 결정에 따라, 상기 복수의 백업서버(211)가 기능별로 복수 개 그룹으로 분류되고, 그룹들에 순서가 정해져서 상기 순서에 따라 상기 그룹들이 순차적으로 기동될 수 있으므로, 상기 복수의 백업서버(211)간 상호 충돌이 방지되어 기동 안정성이 향상되고, 더욱 신속한 백업센터(200)의 기동이 가능한 재해복구 자동화 방법이 제공될 수 있다.In addition, in the parallel starting step ( S300 ), the operator of the operation center 100 or the backup center 200 based on the detection signal of the operation center 100 abnormality provided from the first disaster recovery automation device 1000 . In accordance with the disaster occurrence determination of A mutual collision between the 211 is prevented, so that the start-up stability is improved, and a disaster recovery automation method capable of more rapid start-up of the backup center 200 may be provided.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다.The above description is merely illustrative of the technical spirit of the present invention, and various modifications and variations will be possible without departing from the essential characteristics of the present invention by those skilled in the art to which the present invention pertains.

따라서, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다.Accordingly, the embodiments disclosed in the present invention are not intended to limit the technical spirit of the present invention, but to explain, and the scope of the technical spirit of the present invention is not limited by these embodiments.

본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The protection scope of the present invention should be construed by the following claims, and all technical ideas within the equivalent range should be construed as being included in the scope of the present invention.

100 : 운영센터 111 : 운영서버
200 : 백업센터 211 : 백업서버
1000 : 제1 재해복구 자동화 장치 1100 : 제1 재해복구 자동화 서버
1200 : 변경정보 수집부 1250 : 운영서버 에이전트
2000 : 제2 재해복구 자동화 장치 2100 : 제2 재해복구 자동화 서버
2200 : 변경정보 처리부 2250 : 백업서버 에이전트
100: operation center 111: operation server
200: backup center 211: backup server
1000: first automated disaster recovery device 1100: first automated disaster recovery server
1200: change information collection unit 1250: operation server agent
2000: second automatic disaster recovery device 2100: second automatic disaster recovery server
2200: change information processing unit 2250: backup server agent

Claims (23)

클라이언트의 요청을 수행하는 운영센터에 재해가 발생한 경우, 상기 요청의 처리 주체를 상기 운영센터에서 백업센터로 전환하는 재해복구 자동화 시스템에 있어서,
상기 운영센터의 기동상태를 점검하는 제1 재해복구 자동화 장치; 및
상기 제1 재해복구 자동화 장치에 의해 상기 운영센터의 기동상태에 이상이 감지될 경우, 상기 백업센터를 기동시키는 제2 재해복구 자동화 장치;를 포함하고,
상기 제1 재해복구 자동화 장치가 상기 운영센터를 구성하는 복수의 운영서버의 기동상태를 점검하여 상기 복수의 운영서버의 기동상태에 이상을 감지할 경우, 상기 제2 재해복구 자동화 장치는 상기 백업센터에 포함되는 복수의 백업서버를 기능별로 복수 개 그룹으로 분류하고, 그룹들에 순서를 정하여 상기 순서에 따라 상기 그룹들을 순차적으로 기동하며,
상기 제1 재해복구 자동화 장치는,
상기 복수의 운영서버가 상기 클라이언트의 상기 요청에 응답하는 시간인 응답 반응시간을 검출하고, 상기 응답 반응시간을 상기 복수의 운영서버가 정상적으로 기동하였을 시의 응답 반응시간의 범위인 기준 반응시간 범위와 비교하며, 비교된 결과에 따라 상기 운영센터의 기동상태의 이상 발생 유무를 감지하는 사전 감지부; 및
상기 사전 감지부에 의해 상기 운영센터의 기동상태에 이상이 있는 것으로 감지된 경우, 상기 운영센터와 상기 백업센터간의 동기화 진행상태를 점검하는 사전 점검부;를 포함하고,
상기 사전 감지부는,
상기 복수의 운영서버로부터 상기 응답 반응시간의 정보를 수신하는 응답 반응시간 정보 수신부;
상기 응답 반응시간 중 가장 긴 최대 응답 반응시간과 상기 응답 반응시간 중 가장 짧은 최소 응답 반응시간을 검출하고, 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위를 상기 기준 반응시간 범위로 결정하는 기준 반응시간 범위 결정부;
상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있는지 분석하는 응답 반응시간 분석부; 및
상기 응답 반응시간이 상기 기준 반응시간 범위를 일정시간 동안 벗어나는 경우, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지하는 기동상태 감지부;를 포함하는 것을 특징으로 하는 재해복구 자동화 시스템.
In the case of a disaster in the operation center that performs the client's request, in the disaster recovery automation system for converting the processing subject of the request from the operation center to the backup center,
a first automatic disaster recovery device for checking the operating state of the operation center; and
and a second automated disaster recovery device that starts the backup center when an abnormality is detected in the operating state of the operation center by the first automated disaster recovery device;
When the first automated disaster recovery device checks the startup status of a plurality of operation servers constituting the operation center and detects an abnormality in the startup status of the plurality of operation servers, the second automatic disaster recovery device is configured to operate the backup center Classifies a plurality of backup servers included in a plurality of groups by function, sets an order for the groups, and sequentially starts the groups according to the order,
The first disaster recovery automation device,
The plurality of operation servers detects a response reaction time that is a time for responding to the request of the client, and sets the response reaction time to a reference reaction time range that is a range of response reaction times when the plurality of operation servers are normally started; a pre-sensing unit that compares and detects whether or not an abnormality occurs in the operating state of the operation center according to the comparison result; and
and a pre-checking unit for checking the synchronization progress state between the operation center and the backup center when it is detected that there is an abnormality in the operating state of the operation center by the prior detection unit; and
The pre-sensing unit,
a response response time information receiving unit for receiving information on the response response time from the plurality of operation servers;
Criteria for detecting the longest maximum response time of the response time and the shortest minimum response time among the response time, and determining the range of the maximum response time to the minimum response time as the reference reaction time range Reaction time range determining unit;
a response reaction time analyzer analyzing whether the response reaction time is within the reference reaction time range; and
Disaster recovery automation system comprising a; when the response reaction time deviates from the reference reaction time range for a predetermined period of time, a startup state detection unit that detects that an abnormality has occurred in the operation center's startup state.
제1항에 있어서,
상기 제1 재해복구 자동화 장치는,
상기 복수의 운영서버의 변경사항을 검출하는 운영센터 에이전트; 및
상기 운영센터 에이전트로부터 상기 변경사항을 수집하는 변경정보 수집부; 를 포함하며,
상기 제2 재해복구 자동화 장치는,
상기 변경사항을 상기 백업서버에 적용하는 백업센터 에이전트; 및
상기 제1 재해복구 자동화 장치로부터 전송된 상기 변경사항을 수신하고, 상기 변경사항에 따라 상기 백업서버가 적용될 수 있도록 상기 변경사항을 상기 백업센터 에이전트에 전송하는 변경정보 처리부; 를 포함하는 것을 특징으로 하는 재해복구 자동화 시스템.
According to claim 1,
The first disaster recovery automation device,
an operation center agent for detecting changes in the plurality of operation servers; and
a change information collection unit for collecting the changes from the operation center agent; includes,
The second automatic disaster recovery device,
a backup center agent for applying the changes to the backup server; and
a change information processing unit that receives the change transmitted from the first automated disaster recovery device and transmits the change to the backup center agent so that the backup server can be applied according to the change; Disaster recovery automation system comprising a.
삭제delete 제1항에 있어서,
상기 사전 감지부는 미리 정해진 시간 동안 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지하는 것을 특징으로 하는 재해복구 자동화 시스템.
According to claim 1,
The automatic disaster recovery system, characterized in that the pre-sensing unit detects that an abnormality has occurred in the operating state of the operation center when the response reaction time is not within the reference reaction time range for a predetermined time.
삭제delete 제1항에 있어서,
상기 기준 반응시간 범위는 상기 클라이언트의 상기 요청을 정상적으로 처리할 수 있는 상기 복수의 운영서버가 상기 클라이언트의 상기 요청에 응답하는 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위인 것을 특징으로 하는 재해복구 자동화 시스템.
According to claim 1,
The reference reaction time range is a disaster, characterized in that the range of the maximum response time to the minimum response time in which the plurality of operation servers that can normally process the request of the client respond to the request of the client recovery automation system.
제1항에 있어서,
상기 제2 재해복구 자동화 장치는 상기 운영센터 및 상기 백업센터간의 동기화가 완료된 후, 상기 복수의 백업서버를 기동하는 것을 특징으로 하는 재해복구 자동화 시스템.
According to claim 1,
The disaster recovery automation system, characterized in that the second automatic disaster recovery device starts the plurality of backup servers after synchronization between the operation center and the backup center is completed.
제1항에 있어서,
상기 사전 점검부는 상기 운영센터가 상기 클라이언트의 상기 요청을 수행하는 서비스 중 상기 백업센터에서 수행될 상기 서비스의 범위를 결정하는 서비스 범위 결정부를 더 포함하는 것을 특징으로 하는 재해복구 자동화 시스템.
According to claim 1,
The pre-inspection unit further comprises a service range determining unit for determining the range of the service to be performed by the backup center among the services for which the operation center performs the request of the client.
제1항에 있어서,
상기 복수의 운영서버의 기동상태에 이상이 감지된 경우, 상기 제1 재해복구 자동화 장치는 상기 운영센터 또는 상기 백업센터의 운영자에게 운영센터 이상 감지 신호를 전송하고,
상기 제2 재해복구 자동화 장치는 상기 운영센터 또는 상기 백업센터의 운영자의 재해 발생 결정에 따라 상기 복수의 백업서버를 기동시키는 것을 특징으로 하는 재해복구 자동화 시스템.
According to claim 1,
When an abnormality is detected in the operation state of the plurality of operation servers, the first automatic disaster recovery device transmits an operation center abnormality detection signal to the operator of the operation center or the backup center,
The second automated disaster recovery device is a disaster recovery automation system, characterized in that the activation of the plurality of backup servers according to the disaster occurrence determination of the operator of the operation center or the backup center.
제1항에 있어서,
상기 복수의 백업서버가 기동될 시, 상기 제1 재해복구 자동화 장치는 상기 복수의 운영서버의 기동을 정지시키고, 상기 운영센터 및 상기 백업센터간의 동기화의 경로를 차단하는 것을 특징으로 하는 재해복구 자동화 시스템.
According to claim 1,
Disaster recovery automation, characterized in that when the plurality of backup servers are started, the first automated disaster recovery device stops the operation of the plurality of operation servers and blocks a synchronization path between the operation center and the backup center system.
제1항에 있어서,
상기 제2 재해복구 자동화 장치는,
상기 복수의 백업서버를 기능별로 그룹화하는 그룹화부;
그룹화된 상기 복수의 백업서버의 그룹별 기동순서를 결정하는 기동순서 결정부;
상기 복수의 백업 서버의 그룹별 기동시간을 산출하는 기동시간 산출부;
상기 복수의 백업 서버의 그룹별 기동이 상호 겹치지 않도록 상기 복수의 백업 서버의 그룹별 기동 간격을 조율하는 기동 간격 조율부; 및
상기 복수의 백업서버를 상기 복수의 백업 서버의 그룹별 기동 간격에 따라 상기 그룹별로 순차적으로 기동하는 그룹별 기동부;를 포함하는 것을 특징으로 하는 재해복구 자동화 시스템.
According to claim 1,
The second automatic disaster recovery device,
a grouping unit for grouping the plurality of backup servers by function;
a start-up order determining unit for determining a start-up order for each group of the grouped plurality of backup servers;
a start-up time calculation unit for calculating start-up times for each group of the plurality of backup servers;
a start-up interval arranging unit for adjusting the group-by-group start-up intervals of the plurality of backup servers so that the group-by-group start-ups of the plurality of backup servers do not overlap with each other; and
Disaster recovery automation system comprising a; group-by-group activation unit for sequentially starting the plurality of backup servers for each group according to the group-by-group activation interval of the plurality of backup servers.
제11항에 있어서,
상기 복수의 백업 서버의 그룹별 기동시간은 상기 복수의 백업 서버의 그룹별 기동시간이 복수 회 미리 측정된 값들의 평균값 이거나, 복수 회 미리 측정된 값들 중 최대값인 것을 특징으로 하는 재해복구 자동화 시스템.
12. The method of claim 11,
The start-up time for each group of the plurality of backup servers is an average value of values pre-measured a plurality of times for the start-up times for each group of the plurality of backup servers, or a maximum value among values pre-measured a plurality of times. .
제11항에 있어서,
상기 기동 간격 조율부는 상기 복수의 백업 서버의 그룹별 기동 간격이 상기 복수의 백업 서버의 그룹별 기동시간 이상이 되도록 상기 복수의 백업 서버의 그룹별 기동 간격을 조율하는 것을 특징으로 하는 재해복구 자동화 시스템.
12. The method of claim 11,
Disaster recovery automation system, characterized in that the start-up interval arranging unit adjusts the group-by-group start-up intervals of the plurality of backup servers so that the group-by-group start-up intervals of the plurality of backup servers are equal to or greater than the group-by-group start-up times of the plurality of backup servers. .
클라이언트의 요청을 수행하는 운영센터에 재해가 발생한 경우, 상기 요청의 처리 주체를 상기 운영센터에서 백업센터로 전환하는 재해복구 자동화 방법에 있어서,
상기 운영센터를 구성하는 복수의 운영서버가 클라이언트의 요청에 응답하는 시간인 응답 반응시간을 검출하고, 상기 응답 반응시간을 상기 복수의 운영서버가 정상적으로 기동하였을 시의 응답 반응시간의 범위인 기준 반응시간 범위 내에 있는지 여부를 확인하여 상기 운영센터의 기동상태의 이상 발생 유무를 감지하는 사전 감지단계;
상기 운영센터의 기동상태에 이상이 발생된 것으로 감지된 경우, 상기 운영센터와 상기 백업센터간의 동기화 진행상태를 점검하는 사전 점검단계; 및
상기 백업센터를 구성하는 복수의 백업서버를 병렬적으로 기동하는 병렬적 기동단계;를 포함하고,
상기 병렬적 기동단계는 상기 복수의 백업서버를 기능별로 복수 개의 그룹으로 분류하고, 상기 그룹들에 순서를 정하여 상기 순서에 따라 상기 그룹들을 순차적으로 기동하며,
상기 사전 감지단계는,
상기 복수의 운영서버로부터 상기 응답 반응시간에 대한 정보를 수신하는 응답 반응시간 정보 수신단계;
상기 응답 반응시간 중 가장 긴 최대 응답 반응시간과 상기 응답 반응시간 중 가장 짧은 최소 응답 반응시간을 검출하고, 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위를 상기 기준 반응시간 범위로 결정하는 기준 반응시간 범위 결정단계;
상기 응답 반응시간의 정보로부터 도출된 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있는지 분석하는 응답 반응시간 분석단계; 및
상기 응답 반응시간이 상기 기준 반응시간 범위를 일정시간 동안 벗어나는 경우, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지하는 기동상태 감지단계;를 포함하는 것을 특징으로 하는 재해복구 자동화 방법.
In the case of a disaster in the operation center that performs the client's request, in the disaster recovery automation method for switching the processing subject of the request from the operation center to the backup center,
A reference reaction that detects a response reaction time, which is a time when a plurality of operation servers constituting the operation center responds to a client's request, and sets the response reaction time to a range of response reaction times when the plurality of operation servers are normally started A pre-sensing step of detecting whether an abnormality occurs in the operating state of the operation center by checking whether it is within a time range;
a pre-checking step of checking a synchronization progress state between the operation center and the backup center when it is detected that an abnormality has occurred in the operating state of the operation center; and
A parallel startup step of starting a plurality of backup servers constituting the backup center in parallel;
The parallel starting step classifies the plurality of backup servers into a plurality of groups by function, sets an order for the groups, and sequentially starts the groups according to the order,
The pre-detection step is
a response response time information receiving step of receiving information on the response response time from the plurality of operation servers;
Criteria for detecting the longest maximum response time of the response time and the shortest minimum response time among the response time, and determining the range of the maximum response time to the minimum response time as the reference reaction time range determining the reaction time range;
a response reaction time analysis step of analyzing whether the response reaction time derived from the information on the response reaction time is within the reference reaction time range; and
and an operation state detection step of detecting that an abnormality has occurred in the operation state of the operation center when the response reaction time deviates from the reference reaction time range for a predetermined period of time.
삭제delete 제14항에 있어서,
상기 기준 반응시간 범위는 상기 클라이언트의 상기 요청을 정상적으로 처리할 수 있는 상기 복수의 운영서버가 상기 클라이언트의 상기 요청에 응답하는 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위인 것을 특징으로 하는 재해복구 자동화 방법.
15. The method of claim 14,
The reference reaction time range is a disaster, characterized in that the range of the maximum response time to the minimum response time in which the plurality of operation servers that can normally process the request of the client respond to the request of the client How to automate recovery.
제14항에 있어서,
상기 사전 감지단계는 미리 정해진 시간 동안 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지하는 것을 특징으로 하는 재해복구 자동화 방법.
15. The method of claim 14,
In the pre-sensing step, when the response response time is not within the reference response time range for a predetermined time, the disaster recovery automation method characterized in that it detects that an abnormality has occurred in the operating state of the operation center.
제14항에 있어서,
상기 병렬적 기동단계는 상기 운영센터 및 상기 백업센터간의 동기화가 완료된 후, 상기 복수의 백업서버를 기동하는 것을 특징으로 하는 재해복구 자동화 방법.
15. The method of claim 14,
In the parallel starting step, after synchronization between the operation center and the backup center is completed, the disaster recovery automation method, characterized in that the plurality of backup servers are started.
제14항에 있어서,
상기 사전 점검단계는 상기 운영센터가 클라이언트의 요청을 수행하는 서비스 중 상기 백업센터에서 수행될 상기 서비스의 범위를 결정하는 서비스 범위 결정단계를 더 포함하는 것을 특징으로 하는 재해복구 자동화 방법.
15. The method of claim 14,
The pre-checking step further comprises a service range determination step of determining the range of the service to be performed by the backup center from among the services for which the operation center performs a request from a client.
제14항에 있어서,
상기 복수의 백업서버가 기동될 시, 상기 복수의 운영서버는 기동이 정지되고, 상기 운영센터 및 상기 백업센터간의 동기화의 경로는 차단되는 것을 특징으로 하는 재해복구 자동화 방법.
15. The method of claim 14,
When the plurality of backup servers are activated, the operation of the plurality of operation servers is stopped, and the synchronization path between the operation center and the backup center is blocked.
제14항에 있어서,
상기 병렬적 기동단계는,
상기 복수의 백업서버를 기능별로 그룹화하는 그룹화 단계;
그룹화된 상기 복수의 백업서버의 그룹별 기동순서를 결정하는 기동순서 결정단계;
상기 복수의 백업 서버의 그룹별 기동시간을 산출하는 기동시간 산출단계;
상기 복수의 백업 서버의 그룹별 기동이 상호 겹치지 않도록 상기 복수의 백업 서버의 그룹별 기동 간격을 조율하는 기동 간격 조율단계; 및
상기 복수의 백업서버를 상기 복수의 백업 서버의 그룹별 기동 간격에 따라 상기 그룹별로 순차적으로 기동하는 그룹별 기동단계;를 포함하는 것을 특징으로 하는 재해복구 자동화 방법.
15. The method of claim 14,
The parallel starting step is
a grouping step of grouping the plurality of backup servers by function;
a start-up order determining step of determining the start-up order for each group of the grouped plurality of backup servers;
a start-up time calculation step of calculating the start-up time for each group of the plurality of backup servers;
a start-up interval tuning step of adjusting the group-by-group start-up intervals of the plurality of backup servers so that the group-by-group start-ups of the plurality of backup servers do not overlap each other; and
Disaster recovery automation method comprising: a group-by-group starting step of sequentially starting the plurality of backup servers for each group according to the group-by-group startup interval of the plurality of backup servers.
제21항에 있어서,
상기 복수의 백업 서버의 그룹별 기동시간은 상기 복수의 백업 서버의 그룹별 기동시간이 복수 회 미리 측정된 값의 평균값 이거나, 복수 회 미리 측정된 값 중 최대값인 것을 특징으로 하는 재해복구 자동화 방법.
22. The method of claim 21,
The startup time for each group of the plurality of backup servers is an average value of values pre-measured a plurality of times for the startup times for each group of the plurality of backup servers, or a maximum value among values pre-measured a plurality of times. .
제21항에 있어서,
상기 기동 간격 조율단계는 상기 복수의 백업 서버의 그룹별 기동 간격이 상기 복수의 백업 서버의 그룹별 기동시간 이상이 되도록 상기 복수의 백업 서버의 그룹별 기동 간격을 조율하는 것을 특징으로 하는 재해복구 자동화 방법.
22. The method of claim 21,
Disaster recovery automation, characterized in that in the step of tuning the startup interval, the startup interval for each group of the plurality of backup servers is adjusted so that the startup interval for each group of the plurality of backup servers is equal to or greater than the startup time for each group of the plurality of backup servers. Way.
KR1020150079343A 2015-06-04 2015-06-04 Automatic Disaster Recovery System And Recovery Method Thereof KR102322121B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150079343A KR102322121B1 (en) 2015-06-04 2015-06-04 Automatic Disaster Recovery System And Recovery Method Thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150079343A KR102322121B1 (en) 2015-06-04 2015-06-04 Automatic Disaster Recovery System And Recovery Method Thereof

Publications (2)

Publication Number Publication Date
KR20150115690A KR20150115690A (en) 2015-10-14
KR102322121B1 true KR102322121B1 (en) 2021-11-05

Family

ID=54357739

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150079343A KR102322121B1 (en) 2015-06-04 2015-06-04 Automatic Disaster Recovery System And Recovery Method Thereof

Country Status (1)

Country Link
KR (1) KR102322121B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001195314A (en) * 2000-01-07 2001-07-19 Canon Inc Backup storage controller, backup storage control method and storage medium
KR100566610B1 (en) * 2004-01-05 2006-03-31 주식회사 엘지씨엔에스 automatic disaster recovery system and recovery method thereof

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100608394B1 (en) * 2004-08-27 2006-08-09 한국정보통신주식회사 Device and method for database synchronization interface

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001195314A (en) * 2000-01-07 2001-07-19 Canon Inc Backup storage controller, backup storage control method and storage medium
KR100566610B1 (en) * 2004-01-05 2006-03-31 주식회사 엘지씨엔에스 automatic disaster recovery system and recovery method thereof

Also Published As

Publication number Publication date
KR20150115690A (en) 2015-10-14

Similar Documents

Publication Publication Date Title
KR101856543B1 (en) Failure prediction system based on artificial intelligence
US10491671B2 (en) Method and apparatus for switching between servers in server cluster
RU2388661C2 (en) Method to control aircraft engine
CN101201786B (en) Method and device for monitoring fault log
JP2019505888A (en) Method for monitoring at least two redundant sensors
CN113438110B (en) Cluster performance evaluation method, device, equipment and storage medium
CN112069070A (en) Page detection method, device, server and computer readable storage medium
CN111988170A (en) Terminal fault positioning method and device
CN115118621A (en) Micro-service performance diagnosis method and system based on dependency graph
CN110874311A (en) Database detection method and device, computer equipment and storage medium
KR102322121B1 (en) Automatic Disaster Recovery System And Recovery Method Thereof
US10574559B2 (en) System for defining and implementing performance monitoring requirements for applications and hosted computing environment infrastructure
KR20190002280A (en) Apparatus and method for managing trouble using big data of 5G distributed cloud system
CN104378246B (en) A kind of network equipment failure alignment system, method and device
WO2016159039A1 (en) Relay device and program
JP2009151456A (en) Monitoring system, network monitoring apparatus and service execution environment monitoring method
CN108156019B (en) SDN-based network derived alarm filtering system and method
CN111813872B (en) Method, device and equipment for generating fault troubleshooting model
CN114884803A (en) Method, device, equipment and medium for processing multiple redundant states
CN113678107B (en) Method and computing device for detecting and locating faults in acquisition systems
JP7322958B2 (en) Abnormal location estimation device, method and program
CN112860509A (en) Dial testing alarm method and device
US9372746B2 (en) Methods for identifying silent failures in an application and devices thereof
CN105677515A (en) Online backup method and system for database
CN114143164B (en) Data alarm linkage platform

Legal Events

Date Code Title Description
G15R Request for early opening
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right