KR102322121B1 - Automatic Disaster Recovery System And Recovery Method Thereof - Google Patents
Automatic Disaster Recovery System And Recovery Method Thereof Download PDFInfo
- Publication number
- KR102322121B1 KR102322121B1 KR1020150079343A KR20150079343A KR102322121B1 KR 102322121 B1 KR102322121 B1 KR 102322121B1 KR 1020150079343 A KR1020150079343 A KR 1020150079343A KR 20150079343 A KR20150079343 A KR 20150079343A KR 102322121 B1 KR102322121 B1 KR 102322121B1
- Authority
- KR
- South Korea
- Prior art keywords
- backup
- center
- servers
- response
- group
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0695—Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
Abstract
본 발명은 운영센터를 구성하는 복수의 서버의 응답 반응시간을 파악하여 상기 응답 반응시간에 따라 상기 운영센터의 재해 발생 여부를 판단함으로써 보다 정확한 재해 발생 여부 판단이 가능하며, 상기 운영센터의 재해 발생 판단 시, 상기 운영센터와 동기화된 백업센터를 구성하는 복수의 서버를 분류된 서버 별로 병렬적으로 자동 기동함으로써 서버들 간의 상호 충돌을 방지하면서, 보다 신속한 백업센터의 기동 또한 가능한 재해복구 자동화 시스템 및 방법에 관한 것이다.According to the present invention, by determining the response time of a plurality of servers constituting the operation center and determining whether a disaster has occurred in the operation center according to the response time, it is possible to more accurately determine whether a disaster has occurred, and the disaster occurrence of the operation center At the time of judgment, a disaster recovery automation system that enables faster startup of the backup center while preventing mutual conflicts between servers by automatically starting a plurality of servers constituting the backup center synchronized with the operation center in parallel for each classified server, and it's about how
Description
본 발명의 일시예는 재해복구 자동화 시스템 및 방법에 관한 것이다. One embodiment of the present invention relates to a disaster recovery automation system and method.
일반적으로 재해복구 시스템은 시스템에 침입할 수 있는 바이러스와 같은 경로에 의한 시스템의 손상이나, 화재 및 지진과 같은 천재지변과 같은 갑작스러운 사고로 인한 재해적 고장 또는 일정 기간에 걸쳐 발생되는 데이터 손실을 대비하기 위하여 존재한다.In general, the disaster recovery system protects against damage to the system by a path such as a virus that can invade the system, a catastrophic failure due to sudden accidents such as natural disasters such as fire and earthquake, or data loss that occurs over a period of time. exist to prepare.
기존의 재해복구 시스템은 재해가 없는 일반적인 경우에는 운영센터를 구성하는 복수의 장치를 통해 전산 업무 서비스를 제공하는 등의 시스템 역할을 수행하나, 상기 운영센터에서 시스템 장애 등의 재해가 발생하는 경우 상기 운영센터로부터 동기화되어 백업되는 백업센터에서 상기 운영센터의 역할을 대신 수행한다. 따라서, 상기 운영센터에 재해가 발생하는 경우, 상기 운영센터는 상기 백업센터로 신속하게 전환되어야 한다.The existing disaster recovery system performs a system role such as providing computerized service through a plurality of devices constituting the operation center in the general case where there is no disaster, but when a disaster such as a system failure occurs in the operation center, the In the backup center that is synchronized and backed up from the operation center, it performs the role of the operation center instead. Therefore, when a disaster occurs in the operation center, the operation center must be quickly switched to the backup center.
그러나, 종래의 재해복구 시스템은 재해 발생 이후, 재해 인식 및 재해 선포까지의 시간과, 재해 선포 이후 백업센터의 시스템을 기동하는 절차에 있어서, 모든 절차를 운영자의 수작업에 의존하여, 시스템 가동, 네트워크 전환, 네트워크 장비, 서버 환경설정, 데이터 검증 및 어플리케이션 구동 등의 각 단계를 운영자가 수동으로 일일이 기동하고 있다.However, the conventional disaster recovery system depends on the manual operation of the operator for all procedures in the time from the occurrence of a disaster, until the recognition of the disaster and the declaration of the disaster, and the procedure of starting the system of the backup center after the declaration of the disaster. Each step such as conversion, network equipment, server environment setting, data verification and application operation is started one by one manually by the operator.
이러한, 운영자의 수작업에 의존한 재해복구 시스템의 기동은 백업센터로의 전환 단계에서 운영자의 승인 과정을 거쳐 각각의 단계가 기동되기 때문에 신속함이 절대적으로 요구되는 재해복구 과정의 신속한 수행이 불가능하며, 운영자의 각 단계별 개입에 의해 운영자에게 있어서 매우 번거로운 작업이 될 수 있다.The operation of the disaster recovery system, which relied on the operator's manual operation, is initiated through the operator's approval process in the conversion stage to the backup center. , it can be a very cumbersome operation for the operator by the intervention of each step by the operator.
따라서, 최근에는 보다 신속한 재해복구 과정을 실현할 수 있는 한 방법으로서 운영센터의 재해 인식을 함에 있어서, 운영센터를 구성하는 각각의 장치들이 클라이언트의 요청을 전송 받는 요청 량인 트래픽(traffic) 흐름을 자동으로 감지하여 상기 트래픽 흐름이 중단되거나 비정상적인 흐름 패턴이 감지될 시 상기 운영센터에 재해가 발생된 것으로 판단하여 재해 복구 과정을 수행하는 시스템이 개발되었다.Therefore, in recent years, in recognizing the disaster of the operation center as a way to realize a more rapid disaster recovery process, each device constituting the operation center automatically controls the traffic flow, which is the amount of requests that the clients receive. A system has been developed that detects and performs a disaster recovery process by determining that a disaster has occurred in the operation center when the traffic flow is stopped or an abnormal flow pattern is detected.
그러나, 상기와 같이 트래픽 흐름의 기초를 둔 재해 인식방법을 포함하는 재해복구 시스템은, 운영센터에 재해가 발생되지 않은 상황에서도 상기 트래픽의 급증, 급감, 또는 불안정적인 트래픽 흐름이 일시적으로 감지되는 경우에도 상기 운영센터에 재해가 발생된 것으로 판단될 수 있으므로 신속함과 더불어 재해 발생 진단의 정확성 또한 요구되는 재해복구 시스템에 있어서 이상적인 모델이라고 할 수 없다.However, in the disaster recovery system including the method for recognizing a traffic flow based on the traffic flow as described above, even when a disaster does not occur in the operation center, a sudden increase, a sharp drop, or an unstable traffic flow is temporarily detected. Since it can be determined that a disaster has occurred in the operation center even in the early days of the year, it cannot be said to be an ideal model for a disaster recovery system that requires both speed and accuracy in diagnosing the occurrence of a disaster.
이에 따라 보다 정확한 재해 발생 감지 능력을 갖춤과 동시에, 보다 신속한 재해복구 과정이 수행될 수 있는 재해복구 자동화 시스템 및 방법의 제공이 요구되고 있다.Accordingly, there is a need to provide a disaster recovery automation system and method capable of performing a more accurate disaster detection capability and faster disaster recovery process.
본 발명의 주된 목적은, 재해복구 시스템을 기동함에 있어서, 운영센터의 재해 발생여부 판단 시, 상기 운영센터를 구성하는 복수의 서버의 응답 반응시간을 감지하여 판단함으로써, 보다 정확한 재해 발생 여부 판단을 제공할 수 있는 재해복구 자동화 시스템 및 방법을 제공하는 것이다.The main object of the present invention is to detect and determine the response time of a plurality of servers constituting the operation center when judging whether a disaster has occurred in the operation center in activating the disaster recovery system, so that a more accurate determination of whether a disaster occurs It is to provide a disaster recovery automation system and method that can be provided.
또한, 운영센터에 재해 발생 시, 운영센터 대신에 클라이언트의 요청을 처리할 수 있는 백업센터를 자동적인 절차에 따라 기동시킴으로써, 보다 신속한 백업센터의 기동이 가능한 재해복구 자동화 시스템 및 방법을 제공하는 것이다.In addition, in the event of a disaster in the operation center, the backup center that can handle the client's request instead of the operation center is started according to an automatic procedure, thereby providing a disaster recovery automation system and method that enables faster operation of the backup center. .
또한, 운영센터에 재해가 발생되어 상기 백업센터를 기동함에 있어서, 상기 백업센터를 구성하는 복수의 서버를 기능별로 분류하고, 분류된 기능별로 병렬적으로 기동함으로써, 기동되는 복수의 서버간 상호 충돌을 방지할 수 있는 재해복구 자동화 시스템 및 방법을 제공하는 것이다.In addition, when a disaster occurs in the operation center and the backup center is started, a plurality of servers constituting the backup center are classified by function, and mutual collision between a plurality of servers that are activated by activating in parallel according to the classified functions To provide a disaster recovery automation system and method that can prevent
본 발명의 일 실시 예에 따른 재해복구 자동화 시스템은, 클라이언트의 요청을 수행하는 운영센터에 재해가 발생한 경우, 상기 요청의 처리 주체를 상기 운영센터에서 백업센터로 전환하는 재해복구 자동화 시스템에 있어서, 상기 운영센터의 기동상태를 점검하는 제1 재해복구 자동화 장치 및 상기 제1 재해복구 자동화 장치에 의해 상기 운영센터의 기동상태에 이상이 감지될 경우, 상기 백업센터를 기동시키는 제2 재해복구 자동화 장치를 포함하고, 상기 제1 재해복구 자동화 장치가 상기 운영센터를 구성하는 복수의 운영서버의 기동상태를 점검하여 상기 복수의 운영서버의 기동상태에 이상을 감지할 경우, 상기 제2 재해복구 자동화 장치는 상기 백업센터에 포함되는 복수의 백업서버를 기능별로 복수 개 그룹으로 분류하고, 그룹들에 순서를 정하여 상기 순서에 따라 상기 그룹들을 순차적으로 기동할 수 있다.In the disaster recovery automation system according to an embodiment of the present invention, when a disaster occurs in an operation center that performs a client's request, a disaster recovery automation system for converting a processing subject of the request from the operation center to a backup center, A first automatic disaster recovery device for checking the operation state of the operation center and a second automatic disaster recovery apparatus for starting the backup center when an abnormality is detected in the operation state of the operation center by the first automatic disaster recovery apparatus Including, when the first automatic disaster recovery device checks the startup status of a plurality of operation servers constituting the operation center and detects an abnormality in the startup state of the plurality of operation servers, the second automatic disaster recovery device classifies a plurality of backup servers included in the backup center into a plurality of groups by function, sets an order for the groups, and sequentially activates the groups according to the order.
본 발명에 있어서, 상기 제1 재해복구 자동화 장치는, 상기 복수의 운영서버의 변경사항을 검출하는 운영센터 에이전트 및 상기 운영센터 에이전트로부터 상기 변경사항을 수집하는 변경정보 수집부를 포함하며, 상기 제2 재해복구 자동화 장치는, 상기 변경사항을 상기 백업서버에 적용하는 백업센터 에이전트 및 상기 제1 재해복구 자동화 장치로부터 전송된 상기 변경사항을 수신하고, 상기 변경사항에 따라 상기 백업서버가 적용될 수 있도록 상기 변경사항을 상기 백업센터 에이전트에 전송하는 변경정보 처리부를 포함할 수 있다.In the present invention, the first automated disaster recovery device includes an operation center agent that detects changes in the plurality of operation servers and a change information collection unit that collects the changes from the operation center agent, wherein the second The disaster recovery automation device receives the changes transmitted from the backup center agent and the first disaster recovery automation device that apply the changes to the backup server, so that the backup server can be applied according to the changes It may include a change information processing unit for transmitting the change to the backup center agent.
본 발명에 있어서, 상기 제1 재해복구 자동화 장치는, 상기 복수의 운영서버가 상기 클라이언트의 상기 요청에 응답하는 시간인 응답 반응시간을 검출하고, 상기 응답 반응시간을 상기 복수의 운영서버가 정상적으로 기동하였을 시의 응답 반응시간의 범위인 기준 반응시간 범위와 비교하며, 비교된 결과에 따라 상기 운영센터의 기동상태의 이상 발생 유무를 감지하는 사전 감지부 및 상기 사전 감지부에 의해 상기 운영센터의 기동상태에 이상이 있는 것으로 감지된 경우, 상기 운영센터와 상기 백업센터간의 동기화 진행상태를 점검하는 사전 점검부를 포함할 수 있다.In the present invention, the first disaster recovery automation device detects a response response time that is a time when the plurality of operation servers respond to the request of the client, and the plurality of operation servers normally start the response response time The operation center is started by a pre-sensing unit and the pre-sensing unit that compares it with a reference reaction time range, which is a range of a response reaction time when the operation is performed, and detects whether an abnormality occurs in the operation center's starting state according to the comparison result. When it is detected that there is an abnormality in the state, it may include a pre-inspection unit for checking the synchronization progress state between the operation center and the backup center.
본 발명에 있어서, 상기 사전 감지부는 미리 정해진 시간 동안 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지할 수 있다.In the present invention, when the response reaction time is not within the reference reaction time range for a predetermined time, the pre-sensing unit may detect that an abnormality has occurred in the operating state of the operation center.
본 발명에 있어서, 상기 사전 감지부는, 상기 복수의 운영서버로부터 상기 응답 반응시간의 정보를 수신하는 응답 반응시간 정보 수신부, 상기 응답 반응시간 중 가장 긴 최대 응답 반응시간과 상기 응답 반응시간 중 가장 짧은 최소 응답 반응시간을 검출하고, 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위를 상기 기준 반응시간 범위로 결정하는 기준 반응시간 범위 결정부, 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있는지 분석하는 응답 반응시간 분석부 및 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지하는 기동상태 감지부를 포함할 수 있다.In the present invention, the pre-sensing unit, a response response time information receiving unit for receiving the information of the response response time from the plurality of operation servers, the longest of the maximum response response time of the response response time and the shortest of the response response time A reference reaction time range determining unit that detects a minimum response time and determines a range of the maximum response time to the minimum response time as the reference reaction time range, and analyzes whether the response reaction time is within the reference reaction time range When the response reaction time analysis unit and the response reaction time is not within the reference reaction time range, it may include a starting state detection unit for detecting that an abnormality has occurred in the starting state of the operation center.
본 발명에 있어서, 상기 기준 반응시간 범위는 상기 클라이언트의 상기 요청을 정상적으로 처리할 수 있는 상기 복수의 운영서버가 상기 클라이언트의 상기 요청에 응답하는 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위일 수 있다.In the present invention, the reference response time range is the range of the maximum response response time to the minimum response response time in which the plurality of operation servers capable of normally processing the request of the client respond to the request of the client. can
본 발명에 있어서, 상기 제2 재해복구 자동화 장치는 상기 운영센터 및 상기 백업센터간의 동기화가 완료된 후, 상기 복수의 백업서버를 기동할 수 있다.In the present invention, the second automated disaster recovery device may start the plurality of backup servers after synchronization between the operation center and the backup center is completed.
본 발명에 있어서, 상기 사전 점검부는 상기 운영센터가 상기 클라이언트의 상기 요청을 수행하는 서비스 중 상기 백업센터에서 수행될 상기 서비스의 범위를 결정하는 서비스 범위 결정부를 더 포함할 수 있다.In the present invention, the pre-checking unit may further include a service range determining unit for determining the range of the service to be performed by the backup center among the services for which the operation center performs the request of the client.
본 발명에 있어서, 상기 복수의 운영서버의 기동상태에 이상이 감지된 경우, 상기 제1 재해복구 자동화 장치는 상기 운영센터 또는 상기 백업센터의 운영자에게 운영센터 이상 감지 신호를 전송하고, 상기 제2 재해복구 자동화 장치는 상기 운영센터 또는 상기 백업센터의 운영자의 재해 발생 결정에 따라 상기 복수의 백업서버를 기동시킬 수 있다.In the present invention, when an abnormality is detected in the operation state of the plurality of operation servers, the first automated disaster recovery device transmits an operation center abnormality detection signal to the operator of the operation center or the backup center, and the second The disaster recovery automation device may start the plurality of backup servers according to the disaster occurrence determination of the operation center or the operator of the backup center.
본 발명에 있어서, 상기 복수의 백업서버가 기동될 시, 상기 제1 재해복구 자동화 장치는 상기 복수의 운영서버의 기동을 정지시키고, 상기 운영센터 및 상기 백업센터 동기화의 경로를 차단할 수 있다.In the present invention, when the plurality of backup servers are activated, the first automated disaster recovery device may stop the operation of the plurality of operation servers and block a path of synchronization between the operation center and the backup center.
본 발명에 있어서, 상기 제2 재해복구 자동화 장치는, 상기 복수의 백업서버를 기능별로 그룹화하는 그룹화부, 그룹화된 상기 복수의 백업서버의 그룹별 기동순서를 결정하는 기동순서 결정부, 상기 그룹별 기동시간을 산출하는 기동시간 산출부, 상기 그룹별 기동이 상호 겹치지 않도록 상기 그룹별 기동 간격을 조율하는 기동 간격 조율부 및 상기 복수의 백업서버를 상기 그룹별 기동 간격에 따라 상기 그룹별로 순차적으로 기동하는 그룹별 기동부를 포함할 수 있다.In the present invention, the second automatic disaster recovery device includes a grouping unit for grouping the plurality of backup servers by function, a startup sequence determining unit for determining the startup sequence for each group of the grouped plurality of backup servers, and each group A start-up time calculator for calculating the start-up time, a start-up interval tuner for adjusting the start-up intervals for each group so that the start-ups for each group do not overlap with each other, and the plurality of backup servers are sequentially started for each group according to the start-up intervals for each group It may include a group-specific starting unit.
본 발명에 있어서, 상기 그룹별 기동시간은 상기 그룹별 기동시간이 복수 회 미리 측정된 값들의 평균값 이거나, 복수 회 미리 측정된 값들 중 최대값일 수 있다.In the present invention, the starting time for each group may be an average value of values in which the starting time for each group is pre-measured a plurality of times, or may be a maximum value among values pre-measured a plurality of times.
본 발명에 있어서, 상기 기동 간격 조율부는 상기 그룹별 기동 간격이 상기 그룹별 기동시간 이상이 되도록 상기 그룹별 기동 간격을 조율할 수 있다.In the present invention, the starting interval tuning unit may adjust the starting interval for each group so that the starting interval for each group is equal to or longer than the starting time for each group.
또한, 본 발명에 있어서, 클라이언트의 요청을 수행하는 운영센터에 재해가 발생한 경우, 상기 요청의 처리 주체를 상기 운영센터에서 백업센터로 전환하는 재해복구 자동화 방법에 있어서, 상기 운영센터를 구성하는 복수의 운영서버가 클라이언트의 요청에 응답하는 시간인 응답 반응시간을 검출하고, 상기 응답 반응시간을 상기 복수의 운영서버가 정상적으로 기동하였을 시의 응답 반응시간의 범위인 기준 반응시간 범위 내에 있는지 여부를 확인하여 상기 운영센터의 기동상태의 이상 발생 유무를 감지하는 사전 감지단계, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지된 경우, 상기 운영센터와 상기 백업센터간의 동기화 진행상태를 점검하는 사전 점검단계 및 상기 백업센터를 구성하는 복수의 백업서버를 병렬적으로 기동하는 병렬적 기동단계를 포함하고, 상기 병렬적 기동단계는 상기 복수의 백업서버를 기능별로 복수 개의 그룹으로 분류하고, 상기 그룹들에 순서를 정하여 상기 순서에 따라 상기 그룹들을 순차적으로 기동할 수 있다.In addition, in the present invention, when a disaster occurs in the operation center that performs the client's request, in the disaster recovery automation method for switching the processing subject of the request from the operation center to the backup center, a plurality of components constituting the operation center Detects the response response time, which is the time the operation server responds to the client's request, and checks whether the response response time is within the reference reaction time range, which is the range of the response response time when the plurality of operation servers are normally started a pre-sensing step of detecting whether an abnormality has occurred in the operation center's starting state, and when it is detected that an abnormality has occurred in the operation center's operation center, a preliminary check of checking the synchronization progress state between the operation center and the backup center and a parallel starting step of starting a plurality of backup servers constituting the backup center in parallel, wherein the parallel starting step classifies the plurality of backup servers into a plurality of groups by function, and the groups By setting an order to , the groups may be sequentially activated according to the order.
본 발명에 있어서, 상기 사전 감지단계는, 상기 복수의 운영서버로부터 상기 응답 반응시간에 대한 정보를 수신하는 응답 반응시간 정보 수신단계, 상기 응답 반응시간 중 가장 긴 최대 응답 반응시간과 상기 응답 반응시간 중 가장 짧은 최소 응답 반응시간을 검출하고, 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위를 상기 기준 반응시간 범위로 결정하는 기준 반응시간 범위 결정단계, 상기 응답 반응시간의 정보로부터 도출된 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있는지 분석하는 응답 반응시간 분석단계 및 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지하는 기동상태 감지단계를 포함할 수 있다.In the present invention, the pre-sensing step includes a response response time information receiving step of receiving information on the response response time from the plurality of operation servers, the longest maximum response response time and the response response time among the response response times A reference reaction time range determining step of detecting the shortest minimum response time among the minimum response time and determining the range of the maximum response time to the minimum response time as the reference reaction time range, the information derived from the response reaction time information A response reaction time analysis step of analyzing whether the response reaction time is within the reference reaction time range, and when the response reaction time is not within the reference reaction time range, a startup state of detecting that an abnormality has occurred in the startup state of the operation center It may include a detection step.
본 발명에 있어서, 상기 기준 반응시간 범위는 상기 클라이언트의 상기 요청을 정상적으로 처리할 수 있는 상기 복수의 운영서버가 상기 클라이언트의 상기 요청에 응답하는 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위일 수 있다.In the present invention, the reference response time range is the range of the maximum response response time to the minimum response response time in which the plurality of operation servers capable of normally processing the request of the client respond to the request of the client. can
본 발명에 있어서, 상기 사전 감지단계는 미리 정해진 시간 동안 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지할 수 있다.In the present invention, in the pre-sensing step, when the response reaction time is not within the reference reaction time range for a predetermined time, it may be detected that an abnormality has occurred in the operating state of the operation center.
본 발명에 있어서, 상기 병렬적 기동단계는 상기 운영센터 및 상기 백업센터간의 동기화가 완료된 후, 상기 복수의 백업서버를 기동할 수 있다.In the present invention, in the parallel starting step, after synchronization between the operation center and the backup center is completed, the plurality of backup servers may be started.
본 발명에 있어서, 상기 사전 점검단계는 상기 운영센터가 클라이언트의 요청을 수행하는 서비스 중 상기 백업센터에서 수행될 상기 서비스의 범위를 결정하는 서비스 범위 결정단계를 더 포함할 수 있다.In the present invention, the pre-checking step may further include a service range determining step in which the operation center determines the range of the service to be performed by the backup center among the services for which the client's request is performed.
본 발명에 있어서, 상기 복수의 백업서버가 기동될 시, 상기 복수의 운영서버는 기동이 정지되고, 상기 운영센터 및 상기 백업센터 동기화의 경로는 차단될 수 있다.In the present invention, when the plurality of backup servers are activated, the operation of the plurality of operation servers is stopped, and the path of synchronization between the operation center and the backup center may be blocked.
본 발명에 있어서, 상기 병렬적 기동단계는, 상기 복수의 백업서버를 기능별로 그룹화하는 그룹화 단계, 그룹화된 상기 복수의 백업서버의 그룹별 기동순서를 결정하는 기동순서 결정단계, 상기 그룹별 기동시간을 산출하는 기동시간 산출단계, 상기 그룹별 기동이 상호 겹치지 않도록 상기 그룹별 기동 간격을 조율하는 기동 간격 조율단계 및 상기 복수의 백업서버를 상기 그룹별 기동 간격에 따라 상기 그룹별로 순차적으로 기동하는 그룹별 기동단계를 포함할 수 있다.In the present invention, the parallel startup step includes a grouping step of grouping the plurality of backup servers by function, a startup sequence determining step of determining the startup sequence for each group of the grouped plurality of backup servers, and the startup time for each group A startup time calculation step of calculating It may include a star startup phase.
본 발명에 있어서, 상기 그룹별 기동시간은 상기 그룹별 기동시간이 복수 회 미리 측정된 값의 평균값 이거나, 복수 회 미리 측정된 값 중 최대값일 수 있다.In the present invention, the starting time for each group may be an average value of values pre-measured a plurality of times for the startup time for each group, or may be a maximum value among values pre-measured a plurality of times.
본 발명에 있어서, 상기 기동 간격 조율단계는 상기 그룹별 기동 간격이 상기 그룹별 기동시간 이상이 되도록 상기 그룹별 기동 간격을 조율할 수 있다.In the present invention, in the step of tuning the starting interval, the starting interval for each group may be adjusted so that the starting interval for each group is equal to or longer than the starting time for each group.
본 발명의 일 실시 예에 따르면, 재해복구 시스템을 기동함에 있어서, 운영센터를 구성하는 복수의 서버의 응답 반응시간을 감지하여, 상기 운영센터의 재해 발생 여부를 판단함으로써, 보다 정확한 재해 발생 여부 판단에 따라 기동할 수 있는 재해복구 자동화 시스템 및 방법을 제공할 수 있다.According to an embodiment of the present invention, in activating the disaster recovery system, by detecting the response time of a plurality of servers constituting the operation center, and determining whether a disaster has occurred in the operation center, more accurate determination of whether a disaster has occurred It is possible to provide a disaster recovery automation system and method that can be activated according to
또한, 재해 발생 여부 판단에 따라 자동적인 절차에 따라 기동 가능한 백업센터를 기동함으로써, 운영센터에서 백업센터로의 보다 신속한 업무 전환이 가능한 재해복구 자동화 시스템 및 방법을 제공할 수 있다.In addition, it is possible to provide a disaster recovery automation system and method capable of faster business conversion from an operation center to a backup center by starting a backup center that can be started according to an automatic procedure according to whether a disaster has occurred.
또한, 운영센터에 재해가 발생되어 백업센터가 기동됨에 있어서, 상기 백업센터를 구성하는 복수의 서버가 분류된 기능별로 병렬적으로 기동함으로써, 복수의 서버간의 상호 충돌이 방지되어 기동되는 백업센터의 안정적인 기동이 가능한 재해복구 자동화 시스템 및 방법을 제공할 수 있다.In addition, when a disaster occurs in the operation center and the backup center is started, a plurality of servers constituting the backup center are started in parallel for each classified function, thereby preventing mutual conflict between the plurality of servers and starting the backup center. It is possible to provide a disaster recovery automation system and method capable of stable operation.
도 1은 본 발명의 일 실시 예에 따른 운영서버, 백업서버 및 이들에 구비된 재해복구 자동화 장치간의 시스템 구성도를 도시한다.
도 2는 본 발명의 일 실시 예에 따른 운영서버 및 백업서버와 작용하는 재해복구 자동화 시스템을 도시한다.
도 3은 본 발명의 일 실시 예에 따른 운영서버의 평상시의 응답 반응시간과 재해 발생시의 응답 반응시간을 도시한다.
도 4는 본 발명의 일 실시 예에 따른 백업센터의 기동을 도시한다.
도 5는 본 발명의 일 실시 예에 따른 재해복구 자동화 방법의 순서도이다.1 is a diagram illustrating a system configuration between an operation server, a backup server, and an automated disaster recovery device provided therein according to an embodiment of the present invention.
Figure 2 shows a disaster recovery automation system that works with the operation server and the backup server according to an embodiment of the present invention.
3 shows the normal response response time of the operation server and the response response time when a disaster occurs according to an embodiment of the present invention.
Figure 4 shows the start-up of the backup center according to an embodiment of the present invention.
5 is a flowchart of a disaster recovery automation method according to an embodiment of the present invention.
본 발명은 다양한 변경을 가할 수 있고 여러가지 실시 예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 이를 상세한 설명을 통해 상세히 설명하고자 한다. 그러나, 이는 본 발명의 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함할 수 있다.Since the present invention can have various changes and can have various embodiments, specific embodiments are illustrated in the drawings and will be described in detail through the detailed description. However, this is not intended to limit the specific embodiments of the present invention, and may include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention.
본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우, 그 자세한 설명을 생략할 수 있다.In describing the present invention, if it is determined that a detailed description of a related known technology may unnecessarily obscure the gist of the present invention, the detailed description thereof may be omitted.
또한, 본 명세서에서, 일 구성요소가 다른 구성요소와 “연결된다” 거나 “접속된다”등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다.In addition, in this specification, when a component is referred to as “connected” or “connected” with another component, the component may be directly connected or directly connected to the other component, but in particular Unless there is an opposing description, it may be connected or connected through another element in the middle.
본 발명의 일 실시 예에 따른 재해복구 자동화 시스템은 클라이언트의 요청을 수행하는 운영센터가 바이러스의 침입, 또는 화재, 지진과 같은 천재지변에 의해 손상되어 클라이언트의 요청을 정상적으로 수령하지 못하거나 처리하지 못할 시, 상기 운영센터와 동기화 되며 상기 운영센터와 동일한 구성요소를 포함하여 구성되는 백업센터가 상기 운영센터의 업무를 대신 할 수 있도록 구성된 시스템일 수 있다.In the disaster recovery automation system according to an embodiment of the present invention, the operation center that performs the client's request is damaged by the intrusion of a virus or natural disasters such as fire or earthquake, so that it cannot normally receive or process the client's request. At the same time, it may be a system configured so that a backup center synchronized with the operation center and configured to include the same components as the operation center can take over the operation of the operation center.
따라서, 상기 운영센터에 재해가 발생 시, 상기 운영센터를 이용하여 업무를 처리하는 클라이언트에 대한 피해를 최소화 하기 위하여, 상기 운영센터에서 상기 백업센터로의 업무전환은 신속해야 할 필요성이 있다. 즉, 상기 운영센터에 재해에 따라 불가피하게 일어나는 클라이언트에 대한 피해를 최소화하기 위해, 상기 운영센터의 정상적인 기동에 근접하는 상기 백업센터의 기동을 클라이언트에게 신속하게 제공해야 할 필요성이 있다.Therefore, when a disaster occurs in the operation center, in order to minimize damage to clients who process business using the operation center, there is a need for rapid business conversion from the operation center to the backup center. That is, in order to minimize damage to the client that inevitably occurs according to a disaster in the operation center, there is a need to quickly provide the client with the startup of the backup center close to the normal operation of the operation center.
또한, 상기 운영센터에 재해가 발생 시, 상기 백업센터로의 신속한 전환과 함께, 상기 운영센터의 재해 발생 여부를 판단하는 기술 또한, 상기 재해발생 자동화 시스템에 있어서 매우 중요한 요소일 수 있다. 만약, 상기 운영센터에 재해가 발생하지 않은 경우에도 일시적으로 나타날 수 있는 단순 이상 징후가 상기 운영센터의 재해 발생 요소로 판단된다면 상기 운영센터 및 상기 운영센터를 이용하는 클라이언트들에게도 큰 혼란을 야기 시킬 수 있다.In addition, when a disaster occurs in the operation center, the technology for quickly switching to the backup center and determining whether a disaster occurs in the operation center may also be a very important factor in the disaster occurrence automation system. If a simple abnormal symptom that may appear temporarily even when a disaster does not occur in the operation center is determined to be a disaster occurrence factor in the operation center, it may cause great confusion to the operation center and clients using the operation center. have.
따라서, 이하에서는 보다 정확한 진단으로 상기 운영센터의 재해 발생 여부를 판단할 수 있으며, 재해 발생 시, 상기 운영센터에서 상기 백업센터로의 신속한 전환이 가능한 자동화된 재해복구 시스템에 대해 살펴보고자 한다.Therefore, in the following, it is possible to determine whether a disaster has occurred in the operation center through a more accurate diagnosis, and in the event of a disaster, an automated disaster recovery system capable of rapidly switching from the operation center to the backup center will be examined.
도 1은 본 발명의 일 실시 예에 따른 운영서버, 백업서버 및 이들에 구비된 재해복구 자동화 장치간의 시스템 구성도를 도시한다.1 is a diagram illustrating a system configuration between an operation server, a backup server, and an automated disaster recovery device provided therein according to an embodiment of the present invention.
우선, 본 발명의 일 실시 예에 따른 재해복구 자동화 시스템을 설명하기에 앞서, 상기 재해복구 자동화 시스템이 적용될 수 있는 상기 운영센터(100) 및 상기 백업센터(200)에 대해 간략하게 살펴볼 수 있다.First, before describing the disaster recovery automation system according to an embodiment of the present invention, the
클라이언트의 요청을 수행하는 상기 운영센터(100)는 복수의 운영서버(111)를 구비하며, 상기 복수의 운영서버(111)를 통하여 클라이언트의 요청을 단위 업무별로 분할하여 수행할 수 있다.The
상기 복수의 운영서버(111)는 상기 운영센터(100)가 클라이언트에 제공하는 서비스의 종류에 따라 상이하게 구성될 수 있으며, 일 예로서, 웹서버, 연계서버, 어플리케이션서버, 응용서버, 데이터베이스서버 등을 포함하여 구성될 수 있다.The plurality of
상기 백업센터(200) 또한, 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)와 대응되는 복수의 백업서버(211)로 구성될 수 있다. 이는 상기 운영센터(100) 에 재해가 발생한 경우 백업센터(200)가 운영센터(100)를 대신하여 클라이언트에 대한 서비스를 수행할 수 있도록 하기 위함일 수 있다.The
여기서, 상기 복수의 백업서버(211)는 상기 복수의 운영서버(111)와 동일한 구성 대등한 장치 또는 시스템으로서 구비될 수 있으나, 상기 복수의 운영서버(111)보다 간소화되어 구비될 수 도 있는데, 재해복구 시스템에 있어서는 상기 백업센터(200)가 상기 운영센터(100)의 필수적인 구성을 포함한 간소화된 구성으로 상기 운영센터(100)의 재해에 대비하도록 구성된 것이 일반적이다.Here, the plurality of
만약, 상기 복수의 백업서버(211)가 상기 복수의 운영서버(111)와 동일한 구성으로 구성되게 된다면 재해가 발생하지 않은 상황, 즉 평상시에 주로 사용되는 상기 운영센터(100)와 함께 상기 운영센터(100)의 재해 발생시에만 임시적으로 사용되는 상기 백업센터(200)도 상기 운영센터(100)와 똑같은 유지 및 관리 작업을 해야 하기 때문에, 상기 백업센터(200)를 유지 및 관리하기 위해 필요한 비용뿐만 아니라 관리자의 수 또한 증가되는바, 효율적인 재해 대책수단으로서 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)는 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)보다 간소화 하여 구성하되, 상기 복수의 운영서버(111) 중 필수적인 구성은 포함하도록 구성될 수 있다.If the plurality of
상술한 상기 운영센터(100) 및 상기 백업센터(200)는 본 발명의 이해를 돕기 위해 본 발명이 적용될 수 있는 일 실시 예에 불과하며, 이하에서 설명될 본 발명의 내용이 적용되어 사용될 수 있는 구성이라면 어떠한 것이라도 가능하다.The above-described
이하에서는, 상술한 구성의 운영센터(100) 및 백업센터(200)에 적용되는 상기 재해복구 자동화 시스템을 살펴봄으로써, 본 발명의 일 실시 예에 따른 재해복구 자동화 시스템을 설명하기로 한다.Hereinafter, a disaster recovery automation system according to an embodiment of the present invention will be described by looking at the disaster recovery automation system applied to the
도 2는 본 발명의 일 실시 예에 따른 운영서버(111) 및 백업서버(211)와 작용하는 재해복구 자동화 시스템을 도시한다.Figure 2 shows a disaster recovery automation system that works with the
도 1과 도 2를 참조하면, 본 발명의 일 실시 예에 따른 재해복구 자동화 시스템은, 상기 운영센터(100)와 연결되어 상기 운영센터(100)의 기동상태를 점검하는 제1 재해복구 자동화 장치(1000) 및 상기 운영센터(100)와 동기화 되는 상기 백업센터(200)와 연결되어, 상기 제1 재해복구 자동화 장치(1000)에 의해 상기 운영센터(100)의 기동상태에 이상이 감지될 시, 상기 백업센터(200)를 기동시키는 제2 재해복구 자동화 장치(2000)를 포함할 수 있다.1 and 2 , the disaster recovery automation system according to an embodiment of the present invention is connected to the
상기 백업센터(200)는 상기 운영센터(100)의 업무를 대비하여 준비될 필요가 있으며, 재해 발생 시 상기 운영센터(100)의 정상적인 서비스와 동일 유사한 서비스를 구현하기 위해 상기 운영센터(100)와 동기화 될 수 있다.The
구체적으로, 상기 운영센터(100)와 상기 백업센터(200)는 주기적 또는 실시간으로 동기화 될 수 있다. 상기 백업센터(200)가 상기 운영센터(100)의 정상적인 기동에 근접하기 위해서는 상기 운영센터(100)의 변경사항, 즉 새로운 프로그램의 설치나 제거와 같은 변경사항이 주기적 또는 실시간으로 동기화 되는 것이 바람직하다.Specifically, the
상기 제1 재해복구 자동화 장치(1000)는, 상기 복수의 운영서버(111)의 변경사항을 검출하는 운영센터 에이전트(1250) 및 상기 운영센터 에이전트(1250)로부터 상기 변경사항을 수집하는 변경정보 수집부(1200) 를 포함할 수 있으며, 상기 제2 재해복구 자동화 장치(2000)는, 상기 변경사항을 상기 백업서버(211)에 적용하는 백업센터 에이전트(2250) 및 상기 제1 재해복구 자동화 장치(1000)로부터 전송된 상기 변경사항을 수신하고, 상기 변경사항에 따라 상기 백업서버(211)가 적용될 수 있도록 상기 변경사항을 상기 백업센터 에이전트(211)에 전송하는 변경정보 처리부(2200) 를 포함할 수 있다.The first disaster
도 1을 참조하면, 상기 운영센터 에이전트(1250)는 상기 복수개의 운영서버(111)와 연결됨으로써, 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)의 변경사항을 실시간 또는 주기적으로 수집할 수 있으며, 상기 변경사항의 수집 주체는 상기 변경정보 수집부(1200)가 될 수 있다. 즉, 상기 변경정보 수집부(1200)는 상기 운영센터 에이전트(1250)를 매개로 상기 복수의 운영서버(111)의 변경사항을 수집할 수 있으며, 상기 복수의 운영서버(111)의 변경사항을 상기 제2 재해복구 자동화 장치(2000)에 설치된 상기 변경정보 처리부(2200)에 전송할 수 있다.Referring to FIG. 1 , the
상기 복수의 운영서버(111)의 변경사항을 전송받은 상기 변경정보 처리부(2200)는 상기 변경사항을 상기 복수의 백업서버(211)와 연결된 상기 백업센터 에이전트(2250)를 매개로 상기 복수의 백업서버(211)에 상기 변경사항이 적용함으로써 운영서버와 백업서버를 동기화 시킬 수 있다.The change
상술한 바와 같이 상기 변경정보 수집부(1200) 및 상기 변경정보 처리부(2200)는 상기 운영센터(100)와 상기 백업센터(200)의 동기화 경로를 제공할 수 있으며, 따라서, 상기 백업센터(200)는 상기 운영센터(100)의 변경사항을 반영하여 동기화 됨으로써, 상기 운영센터(100)의 재해에 대비하여 상기 운영센터(100)의 서비스와 동일 유사한 서비스를 클라이언트에 제공할 준비를 할 수 있다.As described above, the change
상기 백업센터(200)와 연결된 상기 제1 재해복구 자동화 장치(1000)는 상기 운영센터(100)의 재해 발생 여부를 감지함으로써, 상기 운영센터(100)와 동기화된 상기 백업센터(200)의 활용 구실을 제공한다.The first disaster
상기 제1 재해복구 자동화 장치(1000)는 도 1과 도2에 도시된 바와 같이 상기 변경정보 수집부(1200), 상기 운영센터 에이전트(1250) 및 상기 제1 재해복구 자동화 서버(1100)로 구성될 수 있다. As shown in FIGS. 1 and 2 , the first automated
상기 변경정보 수집부(1200) 및 상기 운영센터 에이전트(1250)는 상술한 바와 같이, 상기 백업서버(211)와 상기 운영서버(111)의 동기화를 주된 목적으로 구비되며, 상기 제1 재해복구 자동화 서버(1100)는 상기 운영센터(100)의 재해 발생 여부를 감지하기 위해 구비될 수 있다.As described above, the change
상기 제1 재해복구 자동화 서버(1100)는 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)의 기동상태를 감지하여 상기 운영센터(100)의 이상 발생여부를 감지할 수 있으며, 상기 제1 재해복구 자동화 서버(1100)가 상기 복수의 운영서버(111)의 기동상태의 이상을 감지하는 경우, 상기 제2 재해복구 자동화 장치(2000)가 상기 복수의 백업서버(211)를 기동시켜 클라이언트의 요청 처리 주체를 상기 백업센터(200)로 전환시킬 수 있다.The first automated
여기서, 상기 제1 재해복구 자동화 서버(1100)가 상기 복수의 운영서버(111)의 기동상태의 이상을 감지할 경우, 상기 제1 재해복구 자동화 서버(1100)는 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자에게 운영센터(100) 이상 감지 신호를 전송할 수 있는데, 이는 상기 제1 재해복구 자동화 서버(1100)가 감지한 상기 복수의 운영서버(111)의 기동상태의 이상을 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자가 확인함으로써, 상기 운영센터(100)의 재해 발생 여부를 더욱 정확히 판단하기 위함이다.Here, when the first automated
만약, 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자가 상기 운영센터(100) 이상 감지 신호를 검토하여 상기 제1 재해복구 자동화 서버(1100)가 감지한 상기 복수의 운영서버(111)의 기동상태의 이상이 상기 운영센터(100)의 재해 발생으로 판단될 시, 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자는 상기 운영센터(100)에 재해가 발생된 것으로 결정 내릴 수 있으며, 이에 따라 상기 복수의 백업서버(211)는 기동할 수 있다.If the operator of the
즉, 상기 제2 재해복구 자동화 서버(2100)는 상기 제1 재해복구 자동화 서버(1100)로부터 전송된 상기 운영센터(100) 이상 감지 신호를 토대로 결정된 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자의 재해 발생 결정에 따라 상기 복수의 백업서버(211)를 기동할 수 있다. 상기 복수의 백업서버(211)의 기동에 관한 내용은 후술한다.That is, the second automated
상기 제1 재해복구 자동화 장치(1000) 중 상기 운영서버(111)의 기동상태를 감지하는 역할을 하는 상기 제1 재해복구 자동화 서버(1100)에 대해 더욱 자세히 살펴보면, 상기 제1 재해복구 자동화 서버(1100)는 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답하는 시간인 응답 반응시간을 검출하고, 상기 응답 반응시간을 상기 복수의 운영서버(111)가 정상적으로 기동하였을 시의 응답 반응시간의 범위인 기준 반응시간 범위와 비교하여, 비교된 결과에 따라 상기 운영센터(100)의 기동상태의 이상 발생 유무를 감지하는 사전 감지부(1110)를 포함할 수 있으며, 상기 사전 감지부(1110)가 상기 운영센터(100)와 동기화되는 상기 백업센터(200)간의 동기화 진행상태를 점검하는 사전 점검부(1120)를 포함할 수 있다.Looking more closely at the first automated
상기 운영센터(100)를 구성하는 복수의 운영서버(111)는 클라이언트의 요청에 의해 각각 단위 업무별로 기능을 수행하도록 반응하므로, 상기 복수의 운영서버(111)가 클라이언트의 요청에 의해 반응하는 시간이 상기 응답 반응시간일 수 있다.Since the plurality of
상기 응답 반응시간은 상기 운영센터(100)의 재해 발생 여부를 판단하는 척도로 사용될 수 있다. 즉, 상기 운영센터(100)에 재해가 발생되어 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)가 제 구실을 제대로 하지 못할 시, 상기 응답 반응시간은 느려질 수 있다. 또한, 상기 복수의 운영서버(111)가 바이러스에 감염되거나 오류에 의한 오작동을 할 경우, 상기 응답 반응시간은 속도가 비정상적으로 빨라질 수 있으므로 상기 응답 반응시간은 상기 복수의 운영센터(100)의 재해 발생 여부를 진단하기에 매우 적합한 수단일 수 있다.The response reaction time may be used as a measure for determining whether a disaster has occurred in the
종래의 재해복구 자동화 시스템은 상기 복수의 운영서버(111)에 대한 클라이언트의 요청 기록인 클라이언트의 트래픽(traffic)수를 기준으로 상기 운영센터(100)의 재해 발생여부를 판단하는 기술을 개시하였으나, 이 경우에는 상기 트래픽수가 매 시간대별 또는 계절과 같은 다양한 환경적인 요소에 있어서도 매우 상이하다는 점에서 상기 운영센터(100)에 재해가 발생하지 않은 경우에도 상기 트래픽수가 일시적으로 증가하거나 감소한 경우에 해당 트래픽수로 인하여 상기 운영센터(100)의 재해가 선포될 수 있는바 그 판단의 정확성이 매우 떨어질 수 있다.The conventional disaster recovery automation system disclosed a technique for determining whether a disaster occurred in the
반면, 본 발명에 따른 재해복구 자동화 시스템은 상기 트래픽수가 아닌 주기적 또는 실시간으로 감지되는 상기 복수의 운영서버(111)의 상기 응답 반응시간을 통해 상기 운영센터(100)의 재해 발생 여부를 결정하므로 상기 운영센터(100)의 재해 발생 여부를 판단하는데 매우 높은 정확성을 제공할 수 있다.On the other hand, the disaster recovery automation system according to the present invention determines whether a disaster has occurred in the
여기서, 상기 응답 반응시간은 상기 복수의 운영서버(111)의 작동상태에 이상이 발생되었는지 판단하는 척도로 사용되므로 상기 응답 반응시간이 정상적인 수치 내에 위치하는지 판단할 수 있는 상기 응답 반응시간의 비교군으로써 상기 기준 반응시간 범위가 제시될 수 있다.Here, since the response response time is used as a measure to determine whether an abnormality has occurred in the operating state of the plurality of
도 3은 본 발명의 일 실시 예에 따른 운영서버(111)의 평상시의 응답 반응시간과 재해 발생시의 응답 반응시간을 도시한다.3 shows the normal response response time of the
상기 기준 반응시간 범위는 재해가 발생되지 않은 평상시의 상기 복수의 운영서버(111), 즉 클라이언트의 요청을 정상적으로 처리할 수 있는 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답하는 시간 중 상기 최대 응답 반응시간 및 상기 최소 응답 반응시간을 산출하여 각각 최대값과 최소값으로 설정한 범위일 수 있다.The reference reaction time range is the time during which the plurality of
상기 기준 반응시간은 정상적인 상기 복수의 운영서버(111)를 통해 복수 회 미리 측정되어 저장된 값일 수 있으며, 보다 정확한 범위 제공을 위하여 일정 시간 동안 측정된 값으로 그 범위가 제공될 수 있다.The reference reaction time may be a value previously measured and stored a plurality of times through the plurality of
즉, 도 3에서 도시하는 바와 같이, 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위(y축)로 제공되는 상기 기준 반응시간 범위가 일정 시간 동안의 범위로 제공된 값(x축)으로 제공됨으로써, 상기 복수의 운영서버(111)에 대한 클라이언트에 요청에 따른 응답 반응시간의 최대 내지 최소값의 범위가 더욱 정상적인 상기 복수의 운영서버(111)의 응답 반응시간의 범위 값과 유사하게 제공될 수 있다. That is, as shown in FIG. 3 , the reference reaction time range provided as a range (y-axis) of the maximum response time to the minimum response time is provided as a value (x-axis) provided as a range for a certain time. By being, the range of the maximum to the minimum value of the response response time according to the request to the client for the plurality of
이하에서는, 상기 응답 반응시간 및 상기 기준 반응시간 범위을 통한 상기 운영센터(100)의 기동상태의 감지에 대해 자세히 살펴볼 수 있다.Hereinafter, the detection of the activation state of the
상기 사전 감지부(1110)는 상술한 상기 응답 반응시간 및 상기 기준 반응시간 범위를 통하여 상기 운영센터(100)의 재해 발생 여부를 사전에 감지하는 역할을 수행할 수 있다.The
구체적으로, 상기 사전 감지부(1110)는 상기 복수의 운영서버(111)로부터 상기 응답 반응시간의 정보를 수신하는 응답 반응시간 정보 수신부(1111), 최대 응답 반응시간 내지 최소 응답 반응시간의 범위를 산출하여 상기 기준 반응시간 범위를 결정하는 기준 반응시간 범위 결정부(1112), 상기 응답 반응시간의 정보로부터 도출된 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있는지 분석하는 응답 반응시간 분석부(1113), 및 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시 상기 운영센터(100)의 기동상태에 이상이 발생된 것으로 감지하는 기동상태 감지부(1114)를 포함할 수 있다.Specifically, the
상기 응답 반응시간 정보 수신부(1111)는 상기 복수의 운영서버(111)로부터 상기 응답 반응시간의 정보를 수신할 수 있다.The response response time
상기 응답 반응시간의 정보는 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답함과 동시에 상기 복수의 운영서버(111) 각각에 기록된 정보일 수 있으며, 상기 복수의 운영서버(111)와 연결되는 상기 운영센터 에이전트(1250)가 상기 복수의 운영서버(111)로 상기 응답 반응시간의 정보를 요청함으로써, 상기 응답 반응시간 정보 수신부(1111)로 수신된 값일 수 있다.The information of the response response time may be information recorded in each of the plurality of
그러나, 상기 응답 반응시간의 정보는 상기한 경로를 통해 상기 응답 반응시간 정보 수신부(1111)로 수신되는 것에 한정되지 않으며, 상기 응답 반응시간 정보 수신부(1111)가 상기 응답 반응시간의 정보를 수신할 수 있는 경로라면 어떠한 형태라도 가능하며, 상기 응답 반응시간 정보 수신부(1111)가 상기 복수의 운영서버(111)와 유선 또는 네트워크 형식으로 연결됨으로서, 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답함과 동시에 상기 응답 반응시간의 정보가 상기 응답 반응시간 정보 수신부(1111)로 자동적으로 수신되는 경로로써 구성될 수 도 있다.However, the response response time information is not limited to being received by the response response time
이어서, 상기 기준 반응시간 범위 결정부(1112)는 상기 응답 반응시간 중 가장 긴 최대 응답 반응시간과 상기 응답 반응시간 중 가장 짧은 최소 응답 반응시간을 검출하고, 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위를 상기 기준 반응시간 범위로 결정할 수 있다.Subsequently, the reference reaction time
상기 기준 반응시간 범위 결정부(1112)는 상술한 바와 같이, 미리 측정된 값을 통해 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위가 산출되어 결정될 수 있으나, 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자가 정한 수치에 따라 결정되는 것도 가능하다.As described above, the reference reaction time
상기 응답 반응시간 수신부를 통해 수신된 상기 응답 반응시간은 상기 응답 반응시간 분석부(1113)에서 상기 기준 반응시간 범위 내에 있는지 분석될 수 있다. 상기 기준 반응시간 범위는 상술한 바와 같이 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위가 일정 시간 동안 이어진 형태로 제공되므로 상기 응답 반응시간 분석부(1113)는 상기 응답 반응시간이 미리 정해진 시간 동안 상기 기준 반응시간 범위 내에 있는지 분석할 수 있다.The response response time received through the response response time receiver may be analyzed by the response
상기 응답 반응시간 분석부(1113)의 분석 결과, 상기 응답 반응시간이 미리 정해진 시간 동안 상기 기준 반응시간 범위 내에 있지 않을 경우 상기 기동상태 감지부(1114)는 상기 운영센터(100)의 기동상태에 이상이 발생된 것으로 감지할 수 있다.As a result of the analysis of the response reaction
시간대별로 측정되는 상기 응답 반응시간은 일시적으로 상기 기준 반응시간 범위를 벗어날 수도 있다. 이러한 이상 상황은 상기 복수의 운영서버(111)의 기동상태에 이상이 발생된 것으로 판단될 수도 있으나, 일반적으로 일시적인 이상상황은 상기 복수의 운영서버(111)가 네트워크나 사용되는 장치의 영향을 받거나, 심지어는 날씨와 같은 환경적인 요건에 영향을 받아 일시적으로 이상 상황을 보이는 경우가 있을 수 있다.The response reaction time measured for each time period may temporarily deviate from the reference reaction time range. In this abnormal situation, it may be determined that an abnormality has occurred in the activation state of the plurality of
따라서, 상기 응답 반응시간이 상기 기준 반응시간 범위를 벗어난다고 하여 이상 상황으로 바로 결정을 내리는 것은 정확한 재해 발생 판단이 아닐 수 있으며, 미리 정해진 시간 동안 상기 응답 반응시간의 시간대별 값을 관찰하는 것이 바람직하다.Therefore, even if the response time is out of the range of the reference reaction time, it may not be an accurate determination of the occurrence of a disaster to immediately make a decision in an abnormal situation, and it is preferable to observe the time zone value of the response time for a predetermined time. do.
상기와 같은 이유를 근거로 본 발명에 따른 상기 사전 감지부(1110)는 미리 정해진 시간 동안 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터(100)의 기동상태에 이상이 발생된 것으로 감지할 수 있다.Based on the above reasons, the
재해가 발생되지 않은 평상시의 상기 복수의 운영서버(111)로부터 검출된 시간대별 상기 응답 반응시간은 도 3의 (a)를 통해 확인할 수 있으며, 도 3의 (a)를 참조하면, 미리 결정된 시간 동안 측정되는 상기 응답 반응시간 중 일부 측정된 상기 응답 반응시간이 상기 기준 반응시간 범위를 벗어난 것으로 감지되었으나, 곧 다시 정상적인 범위, 즉 상기 기준 반응시간 범위 내에서 측정되는 것을 확인할 수 있다.The response response time for each time period detected from the plurality of
반면, 도 3의 (b)에서 도시하듯이, 기동상태의 이상이 발생된 상기 복수의 운영서버(111)로부터 검출된 측정 시간대별 상기 응답 반응시간은 상기 기준 반응시간 범위를 일정 시간 동안 벗어나는 것을 확인할 수 있다.On the other hand, as shown in (b) of FIG. 3, the response response time for each measurement time period detected from the plurality of
이 경우 상기 응답 반응시간이 미리 결정된 시간 이상 비정상적인 거동으로 상기 기준 반응시간 범위를 벗어나므로, 상기 기동상태 감지부(1114)는 상기 복수의 운영서버(111)의 기동상태에 이상이 발생된 것으로 감지할 수 있으며, 이에 따른 대처가 신속하게 후속되어야 할 필요가 있다.In this case, since the response reaction time is out of the reference reaction time range due to an abnormal behavior for more than a predetermined time, the startup
상기와 같이 상기 운영센터(100), 다시 말해, 상기 운영센터(100)를 구성하는 복수의 운영서버(111)의 기동상태에 이상이 발생된 것으로 감지될 시, 상기 제2 재해복구 자동화 서버(2100)는 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)를 기동할 수 있으며, 그 전에 상기 사전 점검부(1120)를 통해 상기 운영센터(100) 및 상기 운영센터(100)와 동기화되는 상기 백업센터(200)간의 동기화 진행상태가 점검될 수 있다.As described above, when it is detected that an abnormality has occurred in the operation state of the
상술한 바와 같이 상기 운영센터(100) 및 상기 백업센터(200)는 주기적 또는 실시간으로 동기화 될 수 있으며, 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111) 및 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)는 동기화가 진행 중에 상기 복수의 운영서버(111)의 기동상태의 이상이 발생될 수 도 있다.As described above, the
여기서, 상기 복수의 백업서버(211)가 상기 복수의 운영서버(111)와 동기화 중에 기동된다면 클라이언트의 요청 수행 주체가 상기 운영센터(100)에서 상기 백업센터(200)로 전환되기 위해 상기 복수의 운영서버(111)는 기동이 중단되어야 하고, 이에 따라 상기 복수의 운영서버(111) 및 상기 복수의 백업서버(211)간의 동기화는 중단되게 된다.Here, if the plurality of
그러나, 상기와 같은 경우, 상기 복수의 운영서버(111) 및 상기 복수의 백업서버(211)간의 동기화가 미완료 된 상태에서 중단될 경우, 상기 복수의 백업서버(211)는 다 진행되지 않은 동기화로 인해 상기 복수의 운영서버(111)의 근접하는 기동상태를 구현할 수 없으며, 또한 반 강제적인 동기화 종료로 인한 오류가 발생될 수 도 있다.However, in the above case, when the synchronization between the plurality of
따라서, 상기 사전 점검부(1120)에 의해 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화가 진행중인 것으로 점검될 시, 상기 제2 재해복구 자동화 서버(2100)는 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화가 완료된 후 상기 복수의 백업서버(211)를 기동시킬 수 있다.Therefore, when the synchronization between the
물론 상기 사전 점검부(1120)에 의해 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화가 진행 중이지 않은 것으로 점검될 시, 상기 제2 재해복구 자동화 서버(2100)는 상기 복수의 백업서버(211)를 바로 기동시킬 수 도 있다.Of course, when it is checked by the
상기 사전 점검부(1120)는 상기 운영센터(100)가 상기 클라이언트의 요청을 수행하는 업무 중 상기 백업센터(200)에서 수행될 상기 업무의 범위를 결정하는 서비스 범위 결정부(1122)를 더 포함할 수 있다.The
상술한 바와 같이 상기 백업센터(200)는 상기 운영센터(100)에서 갑작스럽게 발생될 수 있는 재해에 대비하여 구비되므로 상기 백업센터(200)를 구성하는 복수의 상기 백업서버(211)는 상기 운영센터(100)를 구성하는 복수의 상기 운영서버(111)에 비해 간소화되게 구비될 수 있다.As described above, the
따라서 상기 운영센터(100)에 재해가 발생하여 클라이언트의 요청의 처리 주체가 상기 백업센터(200)로 전환되면서 상기 운영센터(100)가 상기 클라이언트의 요청을 수행하는 모든 업무가 상기 백업센터(200)로 전환되지 않을 수 있다. 이에 따라 상기 서비스 범위 결정부(1122)는 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)가 기동되기 전 상기 운영센터(100)의 상기 업무로부터 전환될 상기 업무의 범위를 결정할 수 있다.Therefore, when a disaster occurs in the
상기 서비스 범위 결정부(1122)는 상기 복수의 운영서버(111)에 대한 상기 복수의 백업서버(211)의 구성 규모에 따라 변경될 수 있으나, 상기 복수의 백업서버(211)는 상기 복수의 운영서버(111) 중 필수적인 구성은 모두 포함되도록 구성되므로 클라이언트의 요청의 처리 주체로 전환되어 사용되는 데에 문제가 없다.The service
그러나 상기 백업센터(200)는 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)와 동일한 구성으로 상기 복수의 백업서버(211)를 포함함으로써 상기 운영센터(100)와 동등한 구성으로 구성될 수도 있으므로 이 경우 상기 서비스 범위 결정부(1122)는 상기 백업센터(200)의 업무 범위를 상기 운영센터(100)의 범위와 동등하게 또는 다르게 결정할 수 도 있다.However, the
이어서, 상기 복수의 백업서버(211)가 기동될 시, 상기 제1 재해복구 자동화 장치(1000)는 상기 복수의 운영서버(111)의 기동을 정지시키고, 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화 경로를 차단시킬 수 있다.Subsequently, when the plurality of
상기 복수의 백업서버(211)가 기동되는 것은 상기 복수의 백업서버(211)가 클라이언트의 요청 처리의 주체로서 전환되기 위한 과정이며, 따라서 상기 복수의 백업서버(211)가 기동 중에도 상기 복수의 운영서버(111)가 기동하게 된다면, 클라이언트의 요청을 수신하게 되는 경로가 혼란되게 되어 상기 운영센터(100)에 발생된 재해상황이 더욱 악화될 수 있다.The actuation of the plurality of
무엇보다 상기 복수의 백업서버(211)의 기동은 상기 운영센터(100)에 재해가 발생될 경우 진행되므로, 재해에 따른 오류에 대한 영향을 완전히 배척시킨 상태에서 상기 백업센터(200)가 기동되는 것이 바람직하다.Above all, since the start-up of the plurality of
따라서 상기 복수의 백업서버(211)가 기동될 시, 상기 복수의 운영서버(111)의 기동은 정지되어야 하며, 이를 통해 상기 운영센터(100) 및 상기 백업센터(200)간 동기화의 경로도 원천적으로 차단될 수 있다.Therefore, when the plurality of
이어서, 상기 제2 재해복구 자동화 서버(2100)는 상기 복수의 백업서버(211)를 기동시킬 수 있다.Subsequently, the second automated
상술한 바와 같이 상기 백업센터(200)는 상기 제1 재해복구 자동화 장치(1000)로부터 전송 받은 운영센터(100) 이상 감지 신호를 토대로 상기 운영센터(100) 및 상기 백업센터(200)의 운영자의 재해 발생 결정에 따라 기동되므로 더욱 정확한 재해 발생 판단을 통해 기동될 수 있다.As described above, the
또한 상기 제2 재해복구 자동화 서버(2100)는 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자의 상기 재해 발생 결정에 따라 상기 복수의 백업서버(211)를 자동적으로 기동하므로, 종래의 기동단계를 구성하는 각각의 단위 단계마다 운영자의 승인을 통해 기동되었던 방식에 비해 더욱 빠른 상기 백업서버(211)의 기동이 가능할 수 있다.In addition, since the second automated
구체적으로 상기 제2 재해복구 자동화 서버(2100)는 상기 복수의 백업서버(211)를 기능별로 그룹화하는 그룹화부(2111), 그룹화된 상기 복수의 백업서버(211)의 그룹별 기동순서를 결정하는 기동순서 결정부(2112), 상기 그룹별 기동시간을 산출하는 기동시간 산출부(2113), 상기 그룹별 기동이 상호 겹치지 않도록 상기 그룹별 기동 간격을 조율하는 기동 간격 조율부(2114) 및 상기 복수의 백업서버(211)를 상기 그룹별로 기동하는 그룹별 기동부(2115)를 포함할 수 있다.Specifically, the second automatic
도 4는 본 발명의 일 실시 예에 따른 백업센터(200)의 기동을 도시한다.Figure 4 shows the start-up of the
상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)가 기동 중, 상호 충돌되지 않으려면, 유사한 업무를 수행하거나 동일한 서버 별로 구분, 즉, 기능별로 그룹화하여 그룹별로 기동되는 것이 바람직하다. 따라서, 상기 그룹화부(2111)는 상기 복수의 백업서버(211)가 기능별로 순차적으로 기동함으로써 시스템 내에서 상호 충돌이 발생하는 것을 방지하도록 상기 복수의 백업서버(211)를 기능별로 그룹화 할 수 있다.In order that the plurality of
여기서 상기 복수의 백업서버(211)는 동일한 기능끼리 그룹화 될 수 있으나, 동시에 기동하였을 시에도 상호 충돌을 일으키지 않는다면 다른 기능을 갖는 서버끼리라도 같은 그룹으로 분류되어 그룹화 될 수 있다.Here, the plurality of
도 4를 참조하여 일 실시 예를 살펴보면, 상기 복수의 백업서버(211)가 기능별로 분류(제1 그룹 내지 제4 그룹)된 것을 확인할 수 있다. 여기서 기능별로 분류된 상기 제1 그룹 내지 제4 그룹은 각각 동일한 서버들끼리 구성되거나 서로 다른 서버지만 동시 기동 시 상호 충돌을 일으키지 않는 서버들로 구성된 것일 수 있다.Referring to an exemplary embodiment with reference to FIG. 4 , it can be seen that the plurality of
상기 그룹화부(2111)는 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)를 기능별로 분류함으로써, 상기 백업센터(200) 기동 시, 상기 복수의 백업서버(211)가 개별적으로 기동되지 않고 기능별로 분류된 그룹끼리 일괄적으로 기동되므로 그룹간 상호 충돌이 방지되면서도 기동의 속도가 매우 향상될 수 있다The
이어서, 상기 기동순서 결정부(2112)는 그룹화된 상기 복수의 백업서버(211)의 그룹별 기동순서를 결정할 수 있다.Subsequently, the start-up
상기 복수의 백업서버(211)가 그룹별로 기동될 시, 상기 그룹별 기동 순서를 고려하지 않는다면, 상기 복수의 백업서버(211)로부터 분류된 각각의 그룹들은 기동시 전후에 기동되는 다른 그룹을 통해 간섭을 받아 오류를 일으킬 수 있다. 다시 말해, 상기 복수의 백업서버(211)는 그룹별로 순차적으로 기동됨으로써, 전체적인 시스템을 구축할 수 있는데, 상기 복수의 백업서버(211)가 체계화된 기동순서로 기동되지 않는다면 상기 전제척인 시스템의 구축에 오류가 발생될 수 있다.When the plurality of
일 예로, 데이터 검증 및 어플리케이션 구동을 담당하는 서버로 구성된 하나의 그룹이 시스템을 가동하는 다른 그룹보다 먼저 기동될 시, 기동되지 않은 시스템 상에서 데이터 검증 및 어플리케이션의 구동이 진행되도록 작용할 수 있으므로 상기 백업센터(200)에서 오류가 발생될 수 있다.As an example, when one group consisting of a server in charge of data verification and application driving is started up before another group running the system, data verification and application running on the system that are not started can act so that the backup center An error may occur in (200).
따라서, 상기 복수의 백업서버(211)로부터 분류된 복수의 그룹은 순차적으로 기동시 전후 관계에 따른 오류가 발생되지 않도록 고려되어 기동순서가 결정되는 것이 바람직하며, 이를 위해 상기 기동순서 결정부(2112)는 사전에 정상적으로 기동된 상기 복수의 백업서버(211)의 기동 결과를 통한 자료를 근거로 상기 그룹별 기동순서를 결정할 수 있다.Therefore, it is preferable that the startup sequence is determined by considering that the plurality of groups classified from the plurality of
상기 제2 재해복구 자동화 서버(2100)는 상기 복수의 백업서버(211)가 기동함에 있어서, 상호 충돌을 일으키지 않고 정상적으로 기동할 수 있도록 분류된 상기 그룹별로 기동순서가 결정되어 기동될 수 있도록 한다.When the plurality of
그러나, 상기 복수의 백업서버(211)로부터 기능별로 분류된 복수의 그룹 각각이 기동함에 있어서, 기동시간의 중복이 일어난다면 이 또한 상기 백업센터(200)의 기동전 오류를 초래할 수 있다.However, when the plurality of groups classified by function from the plurality of
따라서, 상기 기동시간 산출부(2113)는 상기 상기 복수의 그룹이 각각 기동되는데 소요되는 시간을 산출할 수 있으며, 이를 근거로 후술할 상기 기동 간격 조율부(2114)가 상기 그룹 각각의 기동간격을 조절할 수 있다.Accordingly, the start-up
상기 기동시간 산출부(2113)는 미리 측정된 상기 그룹별 기동시간을 통하여 상기 그룹별 기동시간을 산출할 수 있다. 구체적으로, 상기 그룹별 기동시간을 복수 회 미리 측정된 값일 수 있으며, 상기 기동시간 산출부(2113)는 상기 미리 측정된 값을 상기 그룹별 기동시간으로 결정할 수 있다.The start-up
여기서, 상기 그룹별 기동시간은 기동시의 장치의 상황이나 네트워크 연결상태 등에 따라 그 기동이 상이할 수 있으므로 보다 확실한 오류 방지를 위해, 복수 회 미리 측정된 값들의 평균값 이상의 값이 상기 그룹별 기동시간으로 결정될 수 있으며, 보다 바람직하게는 복수 회 미리 측정된 값들 중 최대 값을 상기 그룹별 기동시간으로 결정될 수 있다.Here, the startup time for each group may be different depending on the condition of the device at startup or the network connection state, etc., so for more reliable error prevention, a value greater than or equal to the average value of the values measured a plurality of times in advance is the startup time for each group. may be determined, and more preferably, a maximum value among values previously measured a plurality of times may be determined as the startup time for each group.
이어서, 상기 기동 간격 조율부(2114)는 상기 그룹별 기동이 상호 겹치지 않도록 상기 그룹별 기동 간격을 조율할 수 있다.Subsequently, the starting
구체적으로, 상기 기동 간격 조율부(2114)는 상기 복수의 백업서버(211)로부터 분류된 복수의 그룹 각각이 상기 기동순서 결정부(2112)를 통해 결정된 기동순서에 따라 기동함에 있어서, 상기 기동순서에 따라 전후에 기동되는 다른 그룹들과 중복되는 시간에 기동이 일어나지 않도록 상기 기동시간 산출부(2113)를 통해 산출된 상기 그룹별 기동시간을 토대로 기동 간격을 조율할 수 있다.Specifically, in the startup
상기 복수의 그룹 각각이 기동되는 시간은 상기 기동시간 산출부(2113)를 통해서 산출될 수 있으므로 각각의 기동이 완료되는 시간 이상으로 상기 복수의 그룹간의 간격을 정하는 것이 바람직하다.Since the time at which each of the plurality of groups is started can be calculated through the start
따라서, 상기 기동 간격 조율부(2114)는 상기 그룹별 기동 간격이 상기 그룹별 기동시간 이상이 되도록 상기 그룹별 기동 간격을 조율할 수 있으며, 이를 통해 상기 그룹별 기동 간격은 상기 복수의 백업서버(211)를 구성하는 하나의 그룹의 기동이 완료되기 전까지 다른 그룹과의 기동의 중복이 방지될 수 있으므로 그룹별 상호 충돌이 방지될 수 있다.Accordingly, the startup
이어서, 상기 그룹별 기동부(2115)는 상기 복수의 백업서버(211)를 상기 그룹별 기동 간격에 따라 상기 그룹별로 순차적으로 기동 시킬 수 있다. Subsequently, the
상기 제1 재해복구 자동화 장치(1000)는 상기 운영서버(111)를 구성하는 복수의 운영서버(111)의 응답 반응시간을 실시간 또는 주기적으로 검출하여 상기 복수의 운영서버(111)의 기동상태 이상을 감지할 수 있으므로 보다 정확한 방법으로 상기 운영센터(100)의 기동상태의 이상 발생 유무를 감지할 수 있다.The first disaster
또한, 상기 제2 재해복구 자동화 장치(2000)는 상기 제1 재해복구 자동화 장치(1000)로부터 제공된 상기 운영센터(100) 이상 감지 신호를 토대로 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자의 재해 발생 결정에 따라 상기 백업센터(200)를 자동적으로 기동시킬 수 있으며, 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)를 기동 시, 상기 복수의 백업서버(211)를 기능별로 복수 개 그룹으로 분류하고, 그룹들에 순서를 정하여 상기 순서에 따라 상기 그룹들을 순차적으로 기동할 수 있으므로 상기 복수의 백업서버(211)간 상호 충돌이 방지되어 기동 안정성이 향상되고, 더욱 신속한 백업센터(200)의 기동이 가능한 재해복구 자동화 시스템을 제공할 수 있게 한다.In addition, the second automated
이하에서는, 본 발명의 일 실시 예에 따른 재해복구 자동화 방법에 대해 살펴볼 수 있다.Hereinafter, a disaster recovery automation method according to an embodiment of the present invention can be looked at.
상기 재해복구 자동화 방법은 이하에 설명될 방법이 적용될 수 있는 재해복구 관련 장치 또는 시스템이라면 특별히 제한되지 않고 다양한 형태의 재해복구 수단에 적용될 수 있으나, 이하에서는 앞서 설명하였던 상기 재해복구 자동화 시스템에 적용된 상기 재해복구 자동화 방법을 일 예로 살펴봄으로써 본 발명에 따른 재해복구 자동화 방법을 이해할 수 있다.The disaster recovery automation method is not particularly limited as long as it is a disaster recovery-related device or system to which the method to be described below can be applied, and may be applied to various types of disaster recovery means. By looking at the disaster recovery automation method as an example, the disaster recovery automation method according to the present invention can be understood.
따라서, 상기 재해복구 자동화 방법을 설명함에 있어서, 상술된 재해복구 자동화 시스템 및 이를 구성하는 모든 구성요소들은 이하에서도 공유될 수 있다.Accordingly, in describing the disaster recovery automation method, the aforementioned disaster recovery automation system and all components constituting the same may be shared below.
도 5는 본 발명의 일 실시 예에 따른 재해복구 자동화 방법의 순서도이다. 이하에서는, 도 1 내지 도 5를 참조하여 상기 재해복구 자동화 방법을 살펴볼 수 있다.5 is a flowchart of a disaster recovery automation method according to an embodiment of the present invention. Hereinafter, the disaster recovery automation method can be viewed with reference to FIGS. 1 to 5 .
본 발명의 일 실시 예에 따른 재해복구 자동화 방법은 클라이언트의 요청을 수행하는 운영센터(100)에 재해가 발생한 경우, 상기 요청의 처리 주체를 상기 운영센터(100)에서 백업센터(200)로 전환하는 재해복구 자동화 방법으로서, 상기 운영센터(100)를 구성하는 복수의 운영서버(111)가 클라이언트의 요청에 응답하는 시간인 응답 반응시간을 검출하고, 상기 응답 반응시간을 상기 복수의 운영서버(111)가 정상적으로 기동하였을 시의 응답 반응시간의 범위인 기준 반응시간 범위 내에 있는지 여부를 확인하여 상기 운영센터(100)의 기동상태의 이상 발생 유무를 감지하는 사전 감지단계(S100), 상기 운영센터(100)의 기동상태에 이상이 발생된 것으로 감지된 경우, 상기 운영센터(100)와 백업센터(200)간의 동기화 진행상태를 점검하는 사전 점검단계(S200), 및 상기 백업센터(200)를 구성하는 복수의 백업서버(211)를 병렬적으로 기동하는 병렬적 기동단계(S300)를 포함할 수 있다.In the disaster recovery automation method according to an embodiment of the present invention, when a disaster occurs in the
상기 운영센터(100)를 구성하는 복수의 운영서버(111)는 클라이언트의 요청에 의해 각각 단위 업무별로 기능을 수행하도록 반응하므로, 상기 복수의 운영서버(111)가 클라이언트의 요청에 의해 반응하는 시간이 상기 응답 반응시간일 수 있다.Since the plurality of
상기 응답 반응시간은 상기 운영센터(100)의 재해 발생 여부를 판단하는 척도로 사용될 수 있다. 즉, 상기 운영센터(100)에 재해가 발생되어 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)가 제 구실을 제대로 하지 못할 시, 상기 응답 반응시간은 느려질 수 있으며, 또한, 상기 복수의 운영서버(111)가 바이러스에 감염되거나 오류에 의한 오작동을 할 경우, 상기 응답 반응시간은 속도가 비정상적으로 빨라질 수 있으므로, 상기 응답 반응시간은 상기 복수의 재해 발생 여부를 진단하기에 매우 적합한 수단일 수 있다.The response reaction time may be used as a measure for determining whether a disaster has occurred in the
여기서, 상기 응답 반응시간은 상기 복수의 운영서버(111)의 작동상태에 이상이 발생되었는지 판단하는 척도로 사용되므로, 상기 응답 반응시간이 정상적인 수지 내에 위치하는지 판단할 수 있는 상기 응답 반응시간의 비교군으로써, 상기 기준 반응시간 범위가 제시될 수 있다.Here, since the response response time is used as a measure to determine whether an abnormality has occurred in the operation state of the plurality of
상기 기준 반응시간 범위는 재해가 발생되지 않은 평상시의 상기 복수의 운영서버(111), 즉, 클라이언트의 요청을 정상적으로 처리할 수 있는 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답하는 시간 중 상기 최대 응답 반응시간 및 상기 최소 응답 반응시간을 산출하여 각각 최대값과 최소값으로 설정한 범위일 수 있다.The reference reaction time range is the time during which the plurality of
상기 기준 반응시간은 정상적인 상기 복수의 운영서버(111)를 통해 복수 회 미리 측정되어 저장된 값일 수 있는데, 보다 정확한 범위 제공을 위하여 일정 시간 동안 측정된 값으로 그 범위가 제공될 수 있다.The reference reaction time may be a value previously measured and stored a plurality of times through the plurality of
이하에서는, 상기 응답 반응시간 및 상기 기준 반응시간 범위를 통한 상기 운영센터(100)의 기동상태의 감지에 대해 자세히 살펴볼 수 있다.Hereinafter, the detection of the activation state of the
상기 사전 감지단계(S100)는 상술한 상기 응답 반응시간 및 상기 기준 반응시간 범위를 통하여 상기 운영센터(100)의 재해 발생 여부를 사전에 감지하는 역할을 수행할 수 있다.The pre-sensing step (S100) may serve to detect in advance whether a disaster has occurred in the
구체적으로, 상기 사전 감지단계(S100)는, 상기 복수의 운영서버(111)로부터 상기 응답 반응시간의 정보를 수신하는 응답 반응시간 정보 수신단계(S110), 최대 응답 반응시간 내지 최소 응답 반응시간의 범위를 산출하여 상기 기준 반응시간 범위를 결정하는 기준 반응시간 범위 결정단계(S120), 상기 응답 반응시간의 정보로부터 도출된 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있는지 분석하는 응답 반응시간 분석단계(S130) 및 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터(100)의 기동상태에 이상이 발생된 것으로 감지하는 기동상태 감지단계(S140)를 포함할 수 있다.Specifically, the pre-sensing step (S100) is a response response time information receiving step (S110) of receiving the information of the response response time from the plurality of
상기 응답 반응시간 정보 수신단계(S110)에서 상기 응답 반응시간 정보 수신부(1111)는 상기 복수의 운영서버(111)로부터 상기 응답 반응시간에 대한 정보를 수신할 수 있다.In the response response time information receiving step ( S110 ), the response response time
상기 응답 반응시간의 정보는 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답함과 동시에 상기 복수의 운영서버(111) 각각에 기록된 정보일 수 있으며, 상기 복수의 운영서버(111)와 연결되는 상기 운영센터 에이전트(1250)가 상기 복수의 운영서버(111)로 상기 응답 반응시간의 정보를 요청함으로써, 상기 응답 반응시간 정보 수신부(1111)로 수신된 값일 수 있다.The information of the response response time may be information recorded in each of the plurality of
그러나, 상기 응답 반응시간의 정보는 상기한 경로를 통해 상기 응답 반응시간 정보 수신부(1111)로 수신되는 것에 한정되지 않으며, 상기 응답 반응시간 정보 수신부(1111)가 상기 응답 반응시간의 정보를 수신할 수 있는 경로라면 어떠한 형태라도 가능하며, 상기 응답 반응시간 정보 수신부(1111)가 상기 복수의 운영서버(111)와 유선 또는 네트워크 형식으로 연결됨으로서, 상기 복수의 운영서버(111)가 클라이언트의 요청에 응답함과 동시에 상기 응답 반응시간의 정보가 상기 응답 반응시간 정보 수신부(1111)로 자동적으로 수신되는 경로로써 구성될 수 도 있다.However, the response response time information is not limited to being received by the response response time
이어서, 상기 기준 반응시간 범위 결정단계(S120)에서 상기 기준 반응시간 범위 결정부(1112)는 상기 응답 반응시간의 비교군으로서 상기 기준 반응시간 범위를 결정할 수 있다.Subsequently, in the step of determining the reference reaction time range ( S120 ), the reference reaction
상기 기준 반응시간 범위 결정단계(S120)는 상술한 바와 같이, 미리 측정된 값을 통해 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위가 산출되어 결정될 수 있으나, 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자가 정한 수치에 따라 결정되는 것도 가능하다.In the reference reaction time range determining step (S120), as described above, the range of the maximum response time to the minimum response time may be calculated and determined based on a previously measured value, but the
상기 응답 반응시간 정보 수신단계(S110)를 통해 상기 응답 반응시간 수신부로 수신된 상기 응답 반응시간은 상기 응답 반응시간 분석단계(S130)에서 상기 응답 반응시간 분석부(1113)을 통해 상기 기준 반응시간 범위 내에 있는지 분석될 수 있다. 상기 기준 반응시간 범위는 상술한 바와 같이 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위가 일정 시간 동안 이어진 형태로 제공되므로, 상기 분석단계(S130)에서 상기 응답 반응시간은 상기 응답 반응시간이 미리 정해진 시간 동안 상기 기준 반응시간 범위 내에 있는지 분석될 수 있다.The response reaction time received by the response reaction time receiving unit through the response reaction time information receiving step (S110) is the reference reaction time through the response reaction
상기 응답 반응시간 분석단계(S130)에서의 분석 결과, 상기 응답 반응시간이 미리 정해진 시간 동안 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 기동상태 감지단계(S140)에서 상기 기동상태 감지부(1114)는 상기 운영센터(100)의 기동상태에 이상이 발생된 것으로 감지할 수 있다.As a result of the analysis in the response reaction time analysis step (S130), when the response reaction time is not within the reference reaction time range for a predetermined time, the starting
시간대별로 측정되는 상기 응답 반응시간은 일시적으로 상기 기준 반응시간 범위를 벗어날 수도 있다. 이러한 이상 상황은 상기 복수의 운영서버(111)의 기동상태에 이상이 발생된 것으로 판단될 수 도 있으나, 일반적으로 일시적인 이상 상황은 상기 복수의 운영서버(111)가 네트워크나 사용되는 장치의 영향을 받거나, 심지어는 날씨와 같은 환경적인 요건에 영향을 받아 일시적으로 이상 상황을 보이는 경우가 많다.The response reaction time measured for each time period may temporarily deviate from the reference reaction time range. In this abnormal situation, it may be determined that an abnormality has occurred in the activation state of the plurality of
따라서, 상기 응답 반응시간이 상기 기준 반응시간 범위를 벗어난다고 해도, 이상 상황으로 바로 결정을 내리는 것은 정확한 진단이 아니며, 미리 정해진 시간 동안 상기 응답 반응시간의 시간대별 값을 관찰하는 것이 바람직하다.Therefore, even if the response response time is out of the range of the reference response time, it is not an accurate diagnosis to immediately make a decision in an abnormal situation, and it is preferable to observe the time value of the response response time for a predetermined time.
상기와 같은 이유를 근거로 본 발명에 따른 상기 사전 감지단계(S100)에서 미리 정해진 시간 동안 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터(100)의 기동상태에 이상이 발생한 것으로 감지될 수 있다.When the response reaction time is not within the reference reaction time range for a predetermined time in the pre-sensing step (S100) according to the present invention based on the above reasons, the
상기와 같이 상기 사전 감지를 통해 상기 운영센터(100), 다시 말해, 상기 운영센터(100)를 구성하는 복수의 운영서버(111)의 기동상태에 이상이 발생된 것으로 감지될 시, 상기 사전 점검단계(S200)는 상기 사전 점검부(1120)을 통해 상기 운영센터(100) 및 상기 운영센터(100)와 동기화되는 상기 백업센터(200)간의 동기화 진행상태를 점검할 수 있다.As described above, when it is detected that an abnormality has occurred in the operation state of the
상기 운영센터(100) 및 상기 백업센터(200)는 주기적 또는 실시간으로 동기화 될 수 있으며, 따라서, 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111) 및 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)는 동기화가 진행 중에 상기 복수의 운영서버(111)의 기동상태의 이상이 발생될 수 도 있다.The
여기서, 상기 복수의 백업서버(211)가 상기 복수의 운영서버(111)와 동기화 중에 기동된다면, 클라이언트의 요청 수행 주체가 상기 운영서버(111)에서 상기 백업서버(211)로 전환되기 위해, 상기 복수의 운영서버(111)는 기동이 중단되어야 하고 이에 따라 상기 복수의 운영서버(111) 및 상기 복수의 백업서버(211)간의 동기화는 중단되게 된다.Here, if the plurality of
그러나, 상기와 같은 경이, 상기 복수의 운영서버(111) 및 상기 복수의 백업서버(211)간의 동기화가 미완료 된 상태에서 중단될 경우, 상기 복수의 백업서버(211)는 다 진행되지 않은 동기화로 인해 상기 복수의 운영서버(111)의 근접하는 기동상태를 구현할 수 없으며, 또한 반 강제적인 동기화 종료로 인한 오류가 발생될 수 도 있다.However, when the synchronization between the plurality of
따라서, 상기 사전 점검단계(S200)에 의해 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화가 진행중인 것으로 점검될 시, 상기 병렬적 기동단계(S300)는 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화가 완료된 후, 상기 복수의 백업서버(211)를 기동하는 것이 바람직하다.Therefore, when it is checked that the synchronization between the
물론, 상기 사전 점검단계(S200)에 의해 상기 운영센터(100) 및 상기 백업센터(200)간의 동기화가 진행 중이지 않은 것으로 점검될 시, 상기 병렬적 기동단계(S300)에서 상기 복수의 백업서버(211)는 바로 기동시킬 수 도 있다.Of course, when it is checked that the synchronization between the
상기 사전 점검단계(S200)는 상기 운영센터(100)가 상기 클라이언트의 요청을 수행하는 업무 중 상기 백업센터(200)에서 수행될 상기 업무의 범위를 결정하는 서비스 범위 결정단계(S220)를 더 포함할 수 있다.The pre-checking step (S200) further includes a service range determining step (S220) of determining the scope of the task to be performed in the
앞서 언급하였듯이, 상기 백업센터(200)는 상기 운영센터(100)에서 갑작스럽게 발생될 수 있는 재해에 대비하여 구비되므로 상기 백업센터(200)를 구성하는 복수의 상기 백업서버(211)는 상기 운영센터(100)를 구성하는 복수의 상기 운영서버(111)에 비해 간소화되게 구비될 수 있다.As mentioned above, since the
따라서, 상기 운영센터(100)에 재해가 발생하여 클라이언트의 요청의 처리 주체가 상기 백업센터(200)로 전환되면서 상기 운영센터(100)가 상기 클라이언트의 요청을 수행하는 모든 업무가 상기 백업센터(200)로 전환될 수 없다. 이에 따라 상기 서비스 범위 결정단계(S220)에서 상기 서비스 범위 결정부(1122)는 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)가 기동되기 전 상기 운영센터(100)의 상기 업무로부터 전환될 상기 업무의 범위를 결정할 수 있다.Therefore, when a disaster occurs in the
상기 서비스 범위 결정단계(S220)서 결정되는 상기 업무의 범위는 상기 복수의 운영서버(111)에 대한 상기 복수의 백업서버(211)의 구성 규모에 따라 변경될 수 있으나, 상기 복수의 백업서버(211)는 상기 복수의 운영서버(111) 중 필수적인 구성은 모두 포함되도록 구성되므로 클라이언트의 요청의 처리 주체로 전환되어 사용되는 데에 문제가 없다.The scope of the task determined in the service range determining step (S220) may be changed according to the configuration scale of the plurality of
그러나, 상기 백업센터(200)는 상기 운영센터(100)를 구성하는 상기 복수의 운영서버(111)와 동일한 구성으로 상기 복수의 백업서버(211)를 포함함으로써, 상기 운영센터(100)와 동등한 구성으로 구성될 수도 있으므로, 이 경우 상기 서비스 범위 결정단계(S220)에서 상기 백업센터(200)의 업무 범위는 상기 운영센터(100)의 범위와 동등하게 또는 다르게 결정될 수 도 있다.However, the
이어서, 상기 병렬적 기동단계(S300)에서 상기 복수의 백업서버(211)가 기동될 시, 상기 복수의 운영서버(111)는 기동이 정지되고, 상기 운영센터(100) 및 상기 백업센터(200) 동기화의 경로는 차단될 수 있다.Then, when the plurality of
상기 복수의 백업서버(211)가 기동되는 것은 상기 복수의 백업서버(211)가 클라이언트의 요청 처리의 주체로서 전환되기 위한 과정이며, 따라서 상기 복수의 백업서버(211)가 기동 중에도 상기 복수의 운영서버(111)가 기동하게 된다면, 클라이언트의 요청을 수신하게 되는 경로가 혼란되게 되어 상기 운영센터(100)에 발생된 재해상황이 더욱 악화될 수 있다.The actuation of the plurality of
무엇보다 상기 복수의 백업서버(211)의 기동은 상기 운영센터(100)에 재해가 발생될 경우 진행되므로 재해에 따른 오류에 대한 영향을 완전히 배척시킨 상태에서 상기 백업센터(200)가 기동되는 것이 바람직하다.Above all, since the start-up of the plurality of
따라서 상기 복수의 백업서버(211)가 기동될 시, 상기 복수의 운영서버(111)의 기동은 정지될 수 있으며, 이를 통해 상기 운영센터(100) 및 상기 백업센터(200)간 동기화의 경로도 원천적으로 차단될 수 있다.Therefore, when the plurality of
이어서, 상기 병렬적 기동단계(S300)에서 상기 복수의 백업서버(211)는 기동될 수 있다.Subsequently, in the parallel starting step (S300), the plurality of
상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)가 기동 중, 상호 충돌되지 않으려면, 유사한 업무를 수행하거나 동일한 서버 별로 구분, 즉, 기능별로 그룹화하여 그룹별로 기동되는 것이 바람직하다. 따라서, 상기 그룹화 단계(S310)는 상기 복수의 백업서버(211)가 기능별로 순차적으로 기동함으로써 시스템 내에서 상호 충돌이 발생하는 것을 방지하도록 상기 복수의 백업서버(211)를 기능별로 그룹화 할 수 있다.In order that the plurality of
여기서, 상기 복수의 백업서버(211)는 동일한 기능끼리 그룹화 될 수 있으나, 동시에 기동하였을 시에도 상호 충돌을 일으키지 않는다면 다른 기능을 갖는 서버끼리라도 같은 그룹으로 분류되어 그룹화 될 수 있다.Here, the plurality of
상기 그룹화 단계(S310)에서 상기 그룹화부(2111)는 상기 백업센터(200)를 구성하는 상기 복수의 백업서버(211)를 기능별로 분류함으로써, 상기 백업센터(200) 기동 시, 상기 복수의 백업서버(211)가 개별적으로 기동되지 않고 기능별로 분류된 그룹끼리 일괄적으로 기동되므로 그룹간 상호 충돌이 방지하면서도 기동의 속도를 크게 향상시킬 수 있다In the grouping step (S310), the
이어서, 상기 기동순서 결정단계(S320)에서 상기 기동순서 결정부(3112)는 그룹화된 상기 복수의 백업서버(211)의 그룹별 기동순서를 결정할 수 있다.Subsequently, in the starting sequence determining step (S320), the startup sequence determining unit 3112 may determine the group startup sequence of the grouped plurality of
상기 복수의 백업서버(211)가 그룹별로 기동될 시, 상기 그룹별 기동 순서를 고려하지 않는다면, 상기 복수의 백업서버(211)로부터 분류된 각각의 그룹들은 기동시 전후에 기동되는 다른 그룹을 통해 간섭을 받아 오류를 일으킬 수 있다. 다시 말해, 상기 복수의 백업서버(211)는 그룹별로 순차적으로 기동됨으로써, 전체적인 시스템을 구축할 수 있는데, 상기 복수의 백업서버(211)가 체계화된 기동순서로 기동되지 않는다면 상기 전제적인 시스템의 구축에 오류가 발생될 수 있다.When the plurality of
상기 병렬적 기동단계(S300)는 상기 복수의 백업서버(211)가 기동함에 있어서, 상호 충돌을 일으키지 않고 정상적으로 기동할 수 있도록 분류된 상기 그룹별로 기동순서가 결정되어 기동될 수 있도록 한다.In the parallel start-up step (S300), when the plurality of
그러나, 상기 복수의 백업서버(211)로부터 기능별로 분류된 복수의 그룹 각각이 기동함에 있어서, 기동시간의 중복이 일어난다면, 이 또한, 상기 백업센터(200)의 기동전 오류를 초래할 수 있다.However, when the plurality of groups classified by function from the plurality of
따라서, 상기 기동시간 산출단계(S330)에서 상기 상기 복수의 그룹이 각각 기동되는데 소요되는 시간이 산출될 수 있으며, 이를 근거로 후술할 상기 기동 간격 조율단계(S340)에서 상기 그룹 각각의 기동간격이 조율할 수 있다.Accordingly, in the starting time calculation step (S330), the time required for each of the plurality of groups to be activated can be calculated, and based on this, the starting interval of each group is determined in the starting interval tuning step (S340), which will be described later. can be coordinated
상기 기동시간 산출단계(S330)에서 상기 기동시간 산출부(2113)는 미리 측정된 상기 그룹별 기동시간을 통하여 상기 그룹별 기동시간을 산출할 수 있다. 구체적으로, 상기 그룹별 기동시간은 복수 회 미리 측정된 값일 수 있으며, 상기 기동시간 산출부(2113)는 상기 미리 측정된 값을 상기 그룹별 기동시간으로 결정할 수 있다.In the starting time calculation step ( S330 ), the starting
여기서, 상기 그룹별 기동시간은 기동시의 장치의 상황이나 네트워크 연결상태 등에 따라 그 기동이 상이할 수 있으므로 보다 확실한 오류 방지를 위해, 복수 회 미리 측정된 값의 평균값 이상의 값이 상기 그룹별 기동시간으로 결정될 수 있으며, 보다 바람직하게는 복수 회 미리 측정된 값 중 최대 값을 상기 그룹별 기동시간으로 결정할 수 있다.Here, the startup time for each group may be different depending on the condition of the device at startup or the network connection state, etc., so in order to more reliably prevent errors, a value greater than or equal to the average value of the values measured in advance a plurality of times is the startup time for each group. may be determined, and more preferably, a maximum value among values previously measured a plurality of times may be determined as the startup time for each group.
이어서, 상기 기동 간격 조율단계(S340)에서 상기 그룹별 기동이 상호 겹치지 않도록 상기 그룹별 기동 간격은 조율될 수 있다.Subsequently, in the maneuvering interval tuning step ( S340 ), the group-by-group start-up interval may be adjusted so that the group-by-group maneuvers do not overlap each other.
구체적으로 상기 기동 간격 조율단계(S340)에서 상기 기동 간격 조율부(2114)는 상기 복수의 백업서버(211)로부터 분류된 복수의 그룹 각각이 상기 기동순서 결정부(2112)를 통해 결정된 기동순서에 따라 기동함에 있어서, 상기 기동순서에 따라 전후에 기동되는 다른 그룹들과 중복되는 시간에 기동이 일어나지 않도록 상기 기동시간 산출단계(S330)를 통해 산출된 상기 그룹별 기동시간을 토대로 기동 간격을 조율할 수 있다.Specifically, in the starting interval tuning step (S340), the starting
상기 복수의 그룹 각각이 기동되는 시간은 상기 기동시간 산출단계(S330)를 통해서 산출될 수 있으므로, 각각의 기동이 완료되는 시간 이상으로 상기 복수의 그룹간의 간격을 정하는 것이 바람직하다.Since the time at which each of the plurality of groups is activated can be calculated through the step of calculating the starting time ( S330 ), it is preferable to set an interval between the plurality of groups longer than the time at which each startup is completed.
따라서, 상기 기동 간격 조율단계(S340)를 통해 상기 그룹별 기동 간격이 상기 그룹별 기동시간 이상이 되도록 상기 그룹별 기동 간격이 조율될 수 있으며, 이를 통해, 상기 복수의 백업서버(211)를 구성하는 하나의 그룹의 기동이 완료되기 전까지 다른 그룹과의 기동의 중복이 방지될 수 있으므로, 그룹별 상호 충돌이 방지될 수 있다.Therefore, the starting interval for each group may be adjusted so that the starting interval for each group is equal to or greater than the starting time for each group through the starting interval tuning step (S340), and through this, the plurality of
이어서, 상기 그룹별 기동단계(S350)에서 상기 복수의 백업서버(211)는 상기 그룹별 기동부(2115)를 통해 상기 그룹별 기동 간격에 따라 상기 그룹별로 순차적으로 기동될 수 있다.Subsequently, in the group-by-group startup step ( S350 ), the plurality of
상술한 재해복구 자동화 방법에 있어서, 상기 사전 감지단계(S100)에서 상기 운영서버(111)를 구성하는 복수의 운영서버(111)의 응답 반응시간이 실시간 또는 주기적으로 검출되어, 상기 복수의 운영서버(111)의 기동상태 이상이 감지됨으로써 보다 정확한 재해 발생 판단의 근거가 제공될 수 있으며, 상기 사전 점검단계(S200)에서 상기 운영센터(100) 및 상기 백업센터(200)의 동기화 진행상태가 점검됨으로써, 상기 백업센터(200)를 구성하는 복수의 백업서버(211)를 기동시키기 위한 준비가 진행될 수 있다.In the disaster recovery automation method described above, the response response time of the plurality of
또한, 상기 병렬적 기동단계(S300)에서는, 상기 제1 재해복구 자동화 장치(1000)로부터 제공된 상기 운영센터(100) 이상 감지 신호를 토대로 상기 운영센터(100) 또는 상기 백업센터(200)의 운영자의 재해 발생 결정에 따라, 상기 복수의 백업서버(211)가 기능별로 복수 개 그룹으로 분류되고, 그룹들에 순서가 정해져서 상기 순서에 따라 상기 그룹들이 순차적으로 기동될 수 있으므로, 상기 복수의 백업서버(211)간 상호 충돌이 방지되어 기동 안정성이 향상되고, 더욱 신속한 백업센터(200)의 기동이 가능한 재해복구 자동화 방법이 제공될 수 있다.In addition, in the parallel starting step ( S300 ), the operator of the
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다.The above description is merely illustrative of the technical spirit of the present invention, and various modifications and variations will be possible without departing from the essential characteristics of the present invention by those skilled in the art to which the present invention pertains.
따라서, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다.Accordingly, the embodiments disclosed in the present invention are not intended to limit the technical spirit of the present invention, but to explain, and the scope of the technical spirit of the present invention is not limited by these embodiments.
본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The protection scope of the present invention should be construed by the following claims, and all technical ideas within the equivalent range should be construed as being included in the scope of the present invention.
100 : 운영센터 111 : 운영서버
200 : 백업센터 211 : 백업서버
1000 : 제1 재해복구 자동화 장치 1100 : 제1 재해복구 자동화 서버
1200 : 변경정보 수집부 1250 : 운영서버 에이전트
2000 : 제2 재해복구 자동화 장치 2100 : 제2 재해복구 자동화 서버
2200 : 변경정보 처리부 2250 : 백업서버 에이전트100: operation center 111: operation server
200: backup center 211: backup server
1000: first automated disaster recovery device 1100: first automated disaster recovery server
1200: change information collection unit 1250: operation server agent
2000: second automatic disaster recovery device 2100: second automatic disaster recovery server
2200: change information processing unit 2250: backup server agent
Claims (23)
상기 운영센터의 기동상태를 점검하는 제1 재해복구 자동화 장치; 및
상기 제1 재해복구 자동화 장치에 의해 상기 운영센터의 기동상태에 이상이 감지될 경우, 상기 백업센터를 기동시키는 제2 재해복구 자동화 장치;를 포함하고,
상기 제1 재해복구 자동화 장치가 상기 운영센터를 구성하는 복수의 운영서버의 기동상태를 점검하여 상기 복수의 운영서버의 기동상태에 이상을 감지할 경우, 상기 제2 재해복구 자동화 장치는 상기 백업센터에 포함되는 복수의 백업서버를 기능별로 복수 개 그룹으로 분류하고, 그룹들에 순서를 정하여 상기 순서에 따라 상기 그룹들을 순차적으로 기동하며,
상기 제1 재해복구 자동화 장치는,
상기 복수의 운영서버가 상기 클라이언트의 상기 요청에 응답하는 시간인 응답 반응시간을 검출하고, 상기 응답 반응시간을 상기 복수의 운영서버가 정상적으로 기동하였을 시의 응답 반응시간의 범위인 기준 반응시간 범위와 비교하며, 비교된 결과에 따라 상기 운영센터의 기동상태의 이상 발생 유무를 감지하는 사전 감지부; 및
상기 사전 감지부에 의해 상기 운영센터의 기동상태에 이상이 있는 것으로 감지된 경우, 상기 운영센터와 상기 백업센터간의 동기화 진행상태를 점검하는 사전 점검부;를 포함하고,
상기 사전 감지부는,
상기 복수의 운영서버로부터 상기 응답 반응시간의 정보를 수신하는 응답 반응시간 정보 수신부;
상기 응답 반응시간 중 가장 긴 최대 응답 반응시간과 상기 응답 반응시간 중 가장 짧은 최소 응답 반응시간을 검출하고, 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위를 상기 기준 반응시간 범위로 결정하는 기준 반응시간 범위 결정부;
상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있는지 분석하는 응답 반응시간 분석부; 및
상기 응답 반응시간이 상기 기준 반응시간 범위를 일정시간 동안 벗어나는 경우, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지하는 기동상태 감지부;를 포함하는 것을 특징으로 하는 재해복구 자동화 시스템.In the case of a disaster in the operation center that performs the client's request, in the disaster recovery automation system for converting the processing subject of the request from the operation center to the backup center,
a first automatic disaster recovery device for checking the operating state of the operation center; and
and a second automated disaster recovery device that starts the backup center when an abnormality is detected in the operating state of the operation center by the first automated disaster recovery device;
When the first automated disaster recovery device checks the startup status of a plurality of operation servers constituting the operation center and detects an abnormality in the startup status of the plurality of operation servers, the second automatic disaster recovery device is configured to operate the backup center Classifies a plurality of backup servers included in a plurality of groups by function, sets an order for the groups, and sequentially starts the groups according to the order,
The first disaster recovery automation device,
The plurality of operation servers detects a response reaction time that is a time for responding to the request of the client, and sets the response reaction time to a reference reaction time range that is a range of response reaction times when the plurality of operation servers are normally started; a pre-sensing unit that compares and detects whether or not an abnormality occurs in the operating state of the operation center according to the comparison result; and
and a pre-checking unit for checking the synchronization progress state between the operation center and the backup center when it is detected that there is an abnormality in the operating state of the operation center by the prior detection unit; and
The pre-sensing unit,
a response response time information receiving unit for receiving information on the response response time from the plurality of operation servers;
Criteria for detecting the longest maximum response time of the response time and the shortest minimum response time among the response time, and determining the range of the maximum response time to the minimum response time as the reference reaction time range Reaction time range determining unit;
a response reaction time analyzer analyzing whether the response reaction time is within the reference reaction time range; and
Disaster recovery automation system comprising a; when the response reaction time deviates from the reference reaction time range for a predetermined period of time, a startup state detection unit that detects that an abnormality has occurred in the operation center's startup state.
상기 제1 재해복구 자동화 장치는,
상기 복수의 운영서버의 변경사항을 검출하는 운영센터 에이전트; 및
상기 운영센터 에이전트로부터 상기 변경사항을 수집하는 변경정보 수집부; 를 포함하며,
상기 제2 재해복구 자동화 장치는,
상기 변경사항을 상기 백업서버에 적용하는 백업센터 에이전트; 및
상기 제1 재해복구 자동화 장치로부터 전송된 상기 변경사항을 수신하고, 상기 변경사항에 따라 상기 백업서버가 적용될 수 있도록 상기 변경사항을 상기 백업센터 에이전트에 전송하는 변경정보 처리부; 를 포함하는 것을 특징으로 하는 재해복구 자동화 시스템.According to claim 1,
The first disaster recovery automation device,
an operation center agent for detecting changes in the plurality of operation servers; and
a change information collection unit for collecting the changes from the operation center agent; includes,
The second automatic disaster recovery device,
a backup center agent for applying the changes to the backup server; and
a change information processing unit that receives the change transmitted from the first automated disaster recovery device and transmits the change to the backup center agent so that the backup server can be applied according to the change; Disaster recovery automation system comprising a.
상기 사전 감지부는 미리 정해진 시간 동안 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지하는 것을 특징으로 하는 재해복구 자동화 시스템.According to claim 1,
The automatic disaster recovery system, characterized in that the pre-sensing unit detects that an abnormality has occurred in the operating state of the operation center when the response reaction time is not within the reference reaction time range for a predetermined time.
상기 기준 반응시간 범위는 상기 클라이언트의 상기 요청을 정상적으로 처리할 수 있는 상기 복수의 운영서버가 상기 클라이언트의 상기 요청에 응답하는 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위인 것을 특징으로 하는 재해복구 자동화 시스템.According to claim 1,
The reference reaction time range is a disaster, characterized in that the range of the maximum response time to the minimum response time in which the plurality of operation servers that can normally process the request of the client respond to the request of the client recovery automation system.
상기 제2 재해복구 자동화 장치는 상기 운영센터 및 상기 백업센터간의 동기화가 완료된 후, 상기 복수의 백업서버를 기동하는 것을 특징으로 하는 재해복구 자동화 시스템.According to claim 1,
The disaster recovery automation system, characterized in that the second automatic disaster recovery device starts the plurality of backup servers after synchronization between the operation center and the backup center is completed.
상기 사전 점검부는 상기 운영센터가 상기 클라이언트의 상기 요청을 수행하는 서비스 중 상기 백업센터에서 수행될 상기 서비스의 범위를 결정하는 서비스 범위 결정부를 더 포함하는 것을 특징으로 하는 재해복구 자동화 시스템.According to claim 1,
The pre-inspection unit further comprises a service range determining unit for determining the range of the service to be performed by the backup center among the services for which the operation center performs the request of the client.
상기 복수의 운영서버의 기동상태에 이상이 감지된 경우, 상기 제1 재해복구 자동화 장치는 상기 운영센터 또는 상기 백업센터의 운영자에게 운영센터 이상 감지 신호를 전송하고,
상기 제2 재해복구 자동화 장치는 상기 운영센터 또는 상기 백업센터의 운영자의 재해 발생 결정에 따라 상기 복수의 백업서버를 기동시키는 것을 특징으로 하는 재해복구 자동화 시스템.According to claim 1,
When an abnormality is detected in the operation state of the plurality of operation servers, the first automatic disaster recovery device transmits an operation center abnormality detection signal to the operator of the operation center or the backup center,
The second automated disaster recovery device is a disaster recovery automation system, characterized in that the activation of the plurality of backup servers according to the disaster occurrence determination of the operator of the operation center or the backup center.
상기 복수의 백업서버가 기동될 시, 상기 제1 재해복구 자동화 장치는 상기 복수의 운영서버의 기동을 정지시키고, 상기 운영센터 및 상기 백업센터간의 동기화의 경로를 차단하는 것을 특징으로 하는 재해복구 자동화 시스템.According to claim 1,
Disaster recovery automation, characterized in that when the plurality of backup servers are started, the first automated disaster recovery device stops the operation of the plurality of operation servers and blocks a synchronization path between the operation center and the backup center system.
상기 제2 재해복구 자동화 장치는,
상기 복수의 백업서버를 기능별로 그룹화하는 그룹화부;
그룹화된 상기 복수의 백업서버의 그룹별 기동순서를 결정하는 기동순서 결정부;
상기 복수의 백업 서버의 그룹별 기동시간을 산출하는 기동시간 산출부;
상기 복수의 백업 서버의 그룹별 기동이 상호 겹치지 않도록 상기 복수의 백업 서버의 그룹별 기동 간격을 조율하는 기동 간격 조율부; 및
상기 복수의 백업서버를 상기 복수의 백업 서버의 그룹별 기동 간격에 따라 상기 그룹별로 순차적으로 기동하는 그룹별 기동부;를 포함하는 것을 특징으로 하는 재해복구 자동화 시스템.According to claim 1,
The second automatic disaster recovery device,
a grouping unit for grouping the plurality of backup servers by function;
a start-up order determining unit for determining a start-up order for each group of the grouped plurality of backup servers;
a start-up time calculation unit for calculating start-up times for each group of the plurality of backup servers;
a start-up interval arranging unit for adjusting the group-by-group start-up intervals of the plurality of backup servers so that the group-by-group start-ups of the plurality of backup servers do not overlap with each other; and
Disaster recovery automation system comprising a; group-by-group activation unit for sequentially starting the plurality of backup servers for each group according to the group-by-group activation interval of the plurality of backup servers.
상기 복수의 백업 서버의 그룹별 기동시간은 상기 복수의 백업 서버의 그룹별 기동시간이 복수 회 미리 측정된 값들의 평균값 이거나, 복수 회 미리 측정된 값들 중 최대값인 것을 특징으로 하는 재해복구 자동화 시스템.12. The method of claim 11,
The start-up time for each group of the plurality of backup servers is an average value of values pre-measured a plurality of times for the start-up times for each group of the plurality of backup servers, or a maximum value among values pre-measured a plurality of times. .
상기 기동 간격 조율부는 상기 복수의 백업 서버의 그룹별 기동 간격이 상기 복수의 백업 서버의 그룹별 기동시간 이상이 되도록 상기 복수의 백업 서버의 그룹별 기동 간격을 조율하는 것을 특징으로 하는 재해복구 자동화 시스템.12. The method of claim 11,
Disaster recovery automation system, characterized in that the start-up interval arranging unit adjusts the group-by-group start-up intervals of the plurality of backup servers so that the group-by-group start-up intervals of the plurality of backup servers are equal to or greater than the group-by-group start-up times of the plurality of backup servers. .
상기 운영센터를 구성하는 복수의 운영서버가 클라이언트의 요청에 응답하는 시간인 응답 반응시간을 검출하고, 상기 응답 반응시간을 상기 복수의 운영서버가 정상적으로 기동하였을 시의 응답 반응시간의 범위인 기준 반응시간 범위 내에 있는지 여부를 확인하여 상기 운영센터의 기동상태의 이상 발생 유무를 감지하는 사전 감지단계;
상기 운영센터의 기동상태에 이상이 발생된 것으로 감지된 경우, 상기 운영센터와 상기 백업센터간의 동기화 진행상태를 점검하는 사전 점검단계; 및
상기 백업센터를 구성하는 복수의 백업서버를 병렬적으로 기동하는 병렬적 기동단계;를 포함하고,
상기 병렬적 기동단계는 상기 복수의 백업서버를 기능별로 복수 개의 그룹으로 분류하고, 상기 그룹들에 순서를 정하여 상기 순서에 따라 상기 그룹들을 순차적으로 기동하며,
상기 사전 감지단계는,
상기 복수의 운영서버로부터 상기 응답 반응시간에 대한 정보를 수신하는 응답 반응시간 정보 수신단계;
상기 응답 반응시간 중 가장 긴 최대 응답 반응시간과 상기 응답 반응시간 중 가장 짧은 최소 응답 반응시간을 검출하고, 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위를 상기 기준 반응시간 범위로 결정하는 기준 반응시간 범위 결정단계;
상기 응답 반응시간의 정보로부터 도출된 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있는지 분석하는 응답 반응시간 분석단계; 및
상기 응답 반응시간이 상기 기준 반응시간 범위를 일정시간 동안 벗어나는 경우, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지하는 기동상태 감지단계;를 포함하는 것을 특징으로 하는 재해복구 자동화 방법.In the case of a disaster in the operation center that performs the client's request, in the disaster recovery automation method for switching the processing subject of the request from the operation center to the backup center,
A reference reaction that detects a response reaction time, which is a time when a plurality of operation servers constituting the operation center responds to a client's request, and sets the response reaction time to a range of response reaction times when the plurality of operation servers are normally started A pre-sensing step of detecting whether an abnormality occurs in the operating state of the operation center by checking whether it is within a time range;
a pre-checking step of checking a synchronization progress state between the operation center and the backup center when it is detected that an abnormality has occurred in the operating state of the operation center; and
A parallel startup step of starting a plurality of backup servers constituting the backup center in parallel;
The parallel starting step classifies the plurality of backup servers into a plurality of groups by function, sets an order for the groups, and sequentially starts the groups according to the order,
The pre-detection step is
a response response time information receiving step of receiving information on the response response time from the plurality of operation servers;
Criteria for detecting the longest maximum response time of the response time and the shortest minimum response time among the response time, and determining the range of the maximum response time to the minimum response time as the reference reaction time range determining the reaction time range;
a response reaction time analysis step of analyzing whether the response reaction time derived from the information on the response reaction time is within the reference reaction time range; and
and an operation state detection step of detecting that an abnormality has occurred in the operation state of the operation center when the response reaction time deviates from the reference reaction time range for a predetermined period of time.
상기 기준 반응시간 범위는 상기 클라이언트의 상기 요청을 정상적으로 처리할 수 있는 상기 복수의 운영서버가 상기 클라이언트의 상기 요청에 응답하는 상기 최대 응답 반응시간 내지 상기 최소 응답 반응시간의 범위인 것을 특징으로 하는 재해복구 자동화 방법.15. The method of claim 14,
The reference reaction time range is a disaster, characterized in that the range of the maximum response time to the minimum response time in which the plurality of operation servers that can normally process the request of the client respond to the request of the client How to automate recovery.
상기 사전 감지단계는 미리 정해진 시간 동안 상기 응답 반응시간이 상기 기준 반응시간 범위 내에 있지 않을 시, 상기 운영센터의 기동상태에 이상이 발생된 것으로 감지하는 것을 특징으로 하는 재해복구 자동화 방법.15. The method of claim 14,
In the pre-sensing step, when the response response time is not within the reference response time range for a predetermined time, the disaster recovery automation method characterized in that it detects that an abnormality has occurred in the operating state of the operation center.
상기 병렬적 기동단계는 상기 운영센터 및 상기 백업센터간의 동기화가 완료된 후, 상기 복수의 백업서버를 기동하는 것을 특징으로 하는 재해복구 자동화 방법.15. The method of claim 14,
In the parallel starting step, after synchronization between the operation center and the backup center is completed, the disaster recovery automation method, characterized in that the plurality of backup servers are started.
상기 사전 점검단계는 상기 운영센터가 클라이언트의 요청을 수행하는 서비스 중 상기 백업센터에서 수행될 상기 서비스의 범위를 결정하는 서비스 범위 결정단계를 더 포함하는 것을 특징으로 하는 재해복구 자동화 방법.15. The method of claim 14,
The pre-checking step further comprises a service range determination step of determining the range of the service to be performed by the backup center from among the services for which the operation center performs a request from a client.
상기 복수의 백업서버가 기동될 시, 상기 복수의 운영서버는 기동이 정지되고, 상기 운영센터 및 상기 백업센터간의 동기화의 경로는 차단되는 것을 특징으로 하는 재해복구 자동화 방법.15. The method of claim 14,
When the plurality of backup servers are activated, the operation of the plurality of operation servers is stopped, and the synchronization path between the operation center and the backup center is blocked.
상기 병렬적 기동단계는,
상기 복수의 백업서버를 기능별로 그룹화하는 그룹화 단계;
그룹화된 상기 복수의 백업서버의 그룹별 기동순서를 결정하는 기동순서 결정단계;
상기 복수의 백업 서버의 그룹별 기동시간을 산출하는 기동시간 산출단계;
상기 복수의 백업 서버의 그룹별 기동이 상호 겹치지 않도록 상기 복수의 백업 서버의 그룹별 기동 간격을 조율하는 기동 간격 조율단계; 및
상기 복수의 백업서버를 상기 복수의 백업 서버의 그룹별 기동 간격에 따라 상기 그룹별로 순차적으로 기동하는 그룹별 기동단계;를 포함하는 것을 특징으로 하는 재해복구 자동화 방법.15. The method of claim 14,
The parallel starting step is
a grouping step of grouping the plurality of backup servers by function;
a start-up order determining step of determining the start-up order for each group of the grouped plurality of backup servers;
a start-up time calculation step of calculating the start-up time for each group of the plurality of backup servers;
a start-up interval tuning step of adjusting the group-by-group start-up intervals of the plurality of backup servers so that the group-by-group start-ups of the plurality of backup servers do not overlap each other; and
Disaster recovery automation method comprising: a group-by-group starting step of sequentially starting the plurality of backup servers for each group according to the group-by-group startup interval of the plurality of backup servers.
상기 복수의 백업 서버의 그룹별 기동시간은 상기 복수의 백업 서버의 그룹별 기동시간이 복수 회 미리 측정된 값의 평균값 이거나, 복수 회 미리 측정된 값 중 최대값인 것을 특징으로 하는 재해복구 자동화 방법.22. The method of claim 21,
The startup time for each group of the plurality of backup servers is an average value of values pre-measured a plurality of times for the startup times for each group of the plurality of backup servers, or a maximum value among values pre-measured a plurality of times. .
상기 기동 간격 조율단계는 상기 복수의 백업 서버의 그룹별 기동 간격이 상기 복수의 백업 서버의 그룹별 기동시간 이상이 되도록 상기 복수의 백업 서버의 그룹별 기동 간격을 조율하는 것을 특징으로 하는 재해복구 자동화 방법.22. The method of claim 21,
Disaster recovery automation, characterized in that in the step of tuning the startup interval, the startup interval for each group of the plurality of backup servers is adjusted so that the startup interval for each group of the plurality of backup servers is equal to or greater than the startup time for each group of the plurality of backup servers. Way.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150079343A KR102322121B1 (en) | 2015-06-04 | 2015-06-04 | Automatic Disaster Recovery System And Recovery Method Thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150079343A KR102322121B1 (en) | 2015-06-04 | 2015-06-04 | Automatic Disaster Recovery System And Recovery Method Thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150115690A KR20150115690A (en) | 2015-10-14 |
KR102322121B1 true KR102322121B1 (en) | 2021-11-05 |
Family
ID=54357739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150079343A KR102322121B1 (en) | 2015-06-04 | 2015-06-04 | Automatic Disaster Recovery System And Recovery Method Thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102322121B1 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001195314A (en) * | 2000-01-07 | 2001-07-19 | Canon Inc | Backup storage controller, backup storage control method and storage medium |
KR100566610B1 (en) * | 2004-01-05 | 2006-03-31 | 주식회사 엘지씨엔에스 | automatic disaster recovery system and recovery method thereof |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100608394B1 (en) * | 2004-08-27 | 2006-08-09 | 한국정보통신주식회사 | Device and method for database synchronization interface |
-
2015
- 2015-06-04 KR KR1020150079343A patent/KR102322121B1/en active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001195314A (en) * | 2000-01-07 | 2001-07-19 | Canon Inc | Backup storage controller, backup storage control method and storage medium |
KR100566610B1 (en) * | 2004-01-05 | 2006-03-31 | 주식회사 엘지씨엔에스 | automatic disaster recovery system and recovery method thereof |
Also Published As
Publication number | Publication date |
---|---|
KR20150115690A (en) | 2015-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101856543B1 (en) | Failure prediction system based on artificial intelligence | |
US10491671B2 (en) | Method and apparatus for switching between servers in server cluster | |
RU2388661C2 (en) | Method to control aircraft engine | |
CN101201786B (en) | Method and device for monitoring fault log | |
JP2019505888A (en) | Method for monitoring at least two redundant sensors | |
CN113438110B (en) | Cluster performance evaluation method, device, equipment and storage medium | |
CN112069070A (en) | Page detection method, device, server and computer readable storage medium | |
CN111988170A (en) | Terminal fault positioning method and device | |
CN115118621A (en) | Micro-service performance diagnosis method and system based on dependency graph | |
CN110874311A (en) | Database detection method and device, computer equipment and storage medium | |
KR102322121B1 (en) | Automatic Disaster Recovery System And Recovery Method Thereof | |
US10574559B2 (en) | System for defining and implementing performance monitoring requirements for applications and hosted computing environment infrastructure | |
KR20190002280A (en) | Apparatus and method for managing trouble using big data of 5G distributed cloud system | |
CN104378246B (en) | A kind of network equipment failure alignment system, method and device | |
WO2016159039A1 (en) | Relay device and program | |
JP2009151456A (en) | Monitoring system, network monitoring apparatus and service execution environment monitoring method | |
CN108156019B (en) | SDN-based network derived alarm filtering system and method | |
CN111813872B (en) | Method, device and equipment for generating fault troubleshooting model | |
CN114884803A (en) | Method, device, equipment and medium for processing multiple redundant states | |
CN113678107B (en) | Method and computing device for detecting and locating faults in acquisition systems | |
JP7322958B2 (en) | Abnormal location estimation device, method and program | |
CN112860509A (en) | Dial testing alarm method and device | |
US9372746B2 (en) | Methods for identifying silent failures in an application and devices thereof | |
CN105677515A (en) | Online backup method and system for database | |
CN114143164B (en) | Data alarm linkage platform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
G15R | Request for early opening | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |