KR101586354B1 - Communication failure recover method of parallel-connecte server system - Google Patents
Communication failure recover method of parallel-connecte server system Download PDFInfo
- Publication number
- KR101586354B1 KR101586354B1 KR1020140051377A KR20140051377A KR101586354B1 KR 101586354 B1 KR101586354 B1 KR 101586354B1 KR 1020140051377 A KR1020140051377 A KR 1020140051377A KR 20140051377 A KR20140051377 A KR 20140051377A KR 101586354 B1 KR101586354 B1 KR 101586354B1
- Authority
- KR
- South Korea
- Prior art keywords
- server
- master server
- data traffic
- failure
- temporary
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000004891 communication Methods 0.000 title claims abstract description 51
- 238000011084 recovery Methods 0.000 claims abstract description 49
- 238000001514 detection method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 12
- 238000012544 monitoring process Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0663—Performing the actions predefined by failover planning, e.g. switching to standby network elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/40—Bus networks
- H04L12/40169—Flexible bus arrangements
- H04L12/40176—Flexible bus arrangements involving redundancy
- H04L12/40202—Flexible bus arrangements involving redundancy by using a plurality of master stations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/12—Avoiding congestion; Recovering from congestion
- H04L47/125—Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Hardware Redundancy (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
본 발명은 병렬 연결식 서버시스템의 통신 장애 복구방법에 관한 것으로써, 활성(Active)서버로 마련되는 마스터서버 및 다수개의 슬레이브서버가 병렬로 연결되는 서버시스템의 통신 장애를 복구하는 병렬 연결식 서버시스템의 통신 장애 복구방법에 있어서, 마스터서버에 통신 장애가 발생되는지를 판단하는 마스터서버 장애판단단계; 상기 장애판단단계에 의해서, 상기 마스터서버에 장애가 발생되었다고 판단되는 경우, 상기 다수개의 슬레이브서버 중 어느 하나를 임시마스터서버로 지정하는 임시마스터서버 지정단계; 상기 임시마스터서버에 상기 마스터서버의 데이터 트래픽을 할당하는 데이터 트래픽 할당단계; 상기 마스터서버의 장애를 복구하는 마스터서버 복구단계; 상기 마스터서버 복구단계에 의해서 상기 마스터서버의 장애가 복구되었는지를 판단하는 마스터서버 복구판단단계; 상기 마스터서버 복구판단단계에 의해서, 상기 마스터서버가 복구되었다고 판단되는 경우, 상기 임시마스터서버의 데이터 트래픽을 상기 마스터서버로 다시 할당하는 데이터 트래픽 재할당단계; 상기 데이터 트래픽 재할당단계 이후, 상기 임시마스터서버를 상기 슬레이브서버로 지정하는 슬레이브서버 지정단계;를 포함하는 것을 특징으로 한다.
이에 의해서, 서버 장애시에 별도의 물리적 절체과정없이 효율적이고 용이하게 마스터서버의 통신 장애를 복구할 수 있는 병렬 연결식 서버시스템의 통신 장애 복구 방법이 제공된다.The present invention relates to a method for restoring a communication failure of a parallel connected server system, and more particularly, to a parallel connected server system for restoring a communication failure of a master server provided as an active server and a server system having a plurality of slave servers connected in parallel A communication fault recovery method comprising: a master server failure judgment step of judging whether a communication fault occurs in a master server; Designating a temporary master server to designate any one of the plurality of slave servers as a temporary master server when it is determined by the failure determination step that a failure has occurred in the master server; A data traffic allocation step of allocating data traffic of the master server to the provisional master server; A master server restoring step of restoring the failure of the master server; Determining whether a failure of the master server has been recovered by the master server recovery step; A data traffic reallocation step of reallocating data traffic of the temporary master server to the master server when it is determined that the master server has been restored by the master server recovery determination step; And a slave server designation step of designating the temporary master server as the slave server after the data traffic reallocation step.
Thereby, a communication failure recovery method of a parallel connection type server system capable of efficiently and easily restoring a communication failure of the master server without a separate physical transfer process in case of a server failure is provided.
Description
본 발명은 병렬 연결식 서버시스템의 통신 장애 복구방법에 관한 것으로써, 보다 상세하게는, 활성(Active)서버로 마련되는 마스터서버와 슬레이브서버를 병렬로 연결하고, 마스터서버에 통신 장애가 발생하는 경우, 마스터서버와 병렬로 연결되는 정상 작동하는 슬레이브 서버에 마스터서버의 데이터 트래픽을 할당하는 것을 이용함으로써, 서버장애시에 별도의 물리적 절체과정없이 효율적이고 용이하게 마스터서버의 통신 장애를 복구할 수 있는 병렬 연결식 서버시스템의 통신 장애 복구 방법에 관한 것이다.The present invention relates to a method of restoring a communication failure in a parallel connection type server system. More particularly, the present invention relates to a method and apparatus for connecting a master server and a slave server provided in an active server in parallel, By allocating the data traffic of the master server to a slave server that is normally connected in parallel with the master server, it is possible to efficiently and easily recover the communication failure of the master server without a separate physical switching process To a method of recovering communication failure of a connected server system.
HA(High Availability)란, 서버시스템에 있어서의 하드웨어 및 소프트웨어의 장애를 방지하기 위한 대책을 의미하는 용어이다. HA를 구축하는 데에는 최소 두 대의 시스템이 필요하며, 가장 기본적인 구성은 활성(Active)-대기(Standby) 구조, 활성(Active)-활성(Active) 구조이다.HA (High Availability) is a term that means measures to prevent hardware and software trouble in the server system. At least two systems are required to build an HA. The most basic configuration is an Active-Standby structure and an Active-Active structure.
활성(Active)-대기(Standby) 구조는 한 서버가 활성 상태로 서비스하고 있을 때, 대기 서버는 전원은 켜 있고 OS까지만 올라와 있는 상태에서, 활성 서버에 하드웨어 장애나 네트워크 장애, 혹은 프로세스 장애 등이 발생해 서비스를 못하게 되면, 대기 서버에 있는 HA가 운영 서버의 장애 발생을 감지하고, HA가 자동으로 대기 서버에 모든 서비스를 올려준다. 즉, 단방향 페일오버를 구현함으로써, 서버의 장애를 복구하는 기술이다.Active - Standby architecture means that when one server is servicing in an active state, the standby server is powered up and only up to the OS, and the active server is experiencing hardware failures, network failures, If the service fails, the HA on the standby server detects the failure of the operating server, and the HA automatically puts all the services on the standby server. That is, by implementing unidirectional failover, it is a technique to repair a server failure.
활성(Active)-대기(Standby) 구조의 가장 큰 장점은 단순함이라 할 수 있다. 구성하기도 쉽고, 관리자 입장에서도 운영하기 쉽다. 그래서 지금도 많은 기업의 시스템들이 이러한 구성으로 구현되고 있다.The biggest advantage of the active-standby structure is the simplicity. It is easy to configure and easy to manage from the manager's point of view. So many companies' systems are still being implemented with this configuration.
활성(Active)-활성(Active) 구성 구조는 한 서버가 DB 서비스를 하고, 다른 서버는 웹 서비스를 제공하게 된다. 두 대의 서버가 각기 다른 서비스를 제공하는 것이다. 그러다가 DB 서버에 장애가 발생할 경우, HA는 웹 서버에서 DB 서비스를 할 수 있도록 구현된다. 즉, 웹 서버는 원래 자신이 하던 웹 서비스뿐만 아니라 DB 서비스까지 두 가지 일을 수행하게 된다. 반대로 웹 서비스에 장애가 발생했을 경우, DB 서버에서 DB 서비스뿐만 아니라 웹 서비스까지 같이 수행하게 된다. 즉, 상호 대기 서버가 되는 구성이다.Active - Active configuration is one server that provides DB services and the other server provides Web services. Two servers provide different services. Then, if the DB server fails, the HA is implemented so that the DB service can be performed on the web server. In other words, the web server performs two tasks, not only the web service itself but also the DB service. Conversely, if a web service fails, the DB server performs the DB service as well as the web service. That is, the configuration is a mutual standby server.
그러나, 상술한 종래의 일반적인 HA구조에 따르면, 장애 복구시에, 장애 서버에서 보조 서버의 절체과정이 필수적이다. 따라서, 장애 서버에서 보조 서버로 절체가 물리적으로 수행되는 과정에서, 기존 활성 서버에 접속했던 클라이언트의 접속이 일정시간 동안 끊어지는 문제가 발생하며, 또한, 물리적으로 절체를 수행하는데 많은 시간 및 비용이 드는 문제가 발생한다.However, according to the conventional general HA structure described above, in the failure recovery, the switching process of the auxiliary server in the failed server is essential. Therefore, in the process of physically performing the switching from the failed server to the auxiliary server, there occurs a problem that the connection of the client connected to the existing active server is disconnected for a certain period of time. In addition, The problem arises.
따라서, 본 발명은 이와 같은 종래의 문제점을 개선하기 위한 것으로서, 활성(Active)서버로 마련되는 마스터서버와 슬레이브서버를 병렬로 연결하고, 마스터서버에 통신 장애가 발생하는 경우, 마스터서버와 병렬로 연결되는 정상 작동하는 슬레이브서버에 마스터서버의 데이터 트래픽을 할당하는 것을 이용함으로써, 서버장애시에 별도의 물리적 절체과정없이 효율적이고 용이하게 마스터서버의 통신 장애를 복구할 수 있는 병렬 연결식 서버시스템의 통신 장애 복구 방법에 관한 것이다.SUMMARY OF THE INVENTION Accordingly, the present invention has been made to solve the above-mentioned problems occurring in the prior art, and it is an object of the present invention to provide a method of connecting a master server and a slave server provided in an active server in parallel, The communication failure of the master server can be recovered efficiently and easily without a separate physical transfer process in case of a server failure by using the allocation of the data traffic of the master server to the normally operating slave server Recovery method.
상기 목적은, 본 발명에 따라, 활성(Active)서버로 마련되는 마스터서버 및 다수개의 슬레이브서버가 병렬로 연결되는 서버시스템의 통신 장애를 복구하는 병렬 연결식 서버시스템의 통신 장애 복구방법에 있어서, 마스터서버에 통신 장애가 발생되는지를 판단하는 마스터서버 장애판단단계; 상기 장애판단단계에 의해서, 상기 마스터서버에 장애가 발생되었다고 판단되는 경우, 상기 다수개의 슬레이브서버 중 어느 하나를 임시마스터서버로 지정하는 임시마스터서버 지정단계; 상기 임시마스터서버에 상기 마스터서버의 데이터 트래픽을 할당하는 데이터 트래픽 할당단계; 상기 마스터서버의 장애를 복구하는 마스터서버 복구단계; 상기 마스터서버 복구단계에 의해서 상기 마스터서버의 장애가 복구되었는지를 판단하는 마스터서버 복구판단단계; 상기 마스터서버 복구판단단계에 의해서, 상기 마스터서버가 복구되었다고 판단되는 경우, 상기 임시마스터서버의 데이터 트래픽을 상기 마스터서버로 다시 할당하는 데이터 트래픽 재할당단계; 상기 데이터 트래픽 재할당단계 이후, 상기 임시마스터서버를 상기 슬레이브서버로 지정하는 슬레이브서버 지정단계;를 포함하는 것을 특징으로 하는 병렬 연결식 서버시스템의 통신 장애 복구방법에 의해 달성된다.According to another aspect of the present invention, there is provided a communication fault recovery method of a parallel connected server system for recovering from a communication failure of a master server provided in an active server and a server system in which a plurality of slave servers are connected in parallel, A master server failure determination step of determining whether a communication failure occurs in the server; Designating a temporary master server to designate any one of the plurality of slave servers as a temporary master server when it is determined by the failure determination step that a failure has occurred in the master server; A data traffic allocation step of allocating data traffic of the master server to the provisional master server; A master server restoring step of restoring the failure of the master server; Determining whether a failure of the master server has been recovered by the master server recovery step; A data traffic reallocation step of reallocating data traffic of the temporary master server to the master server when it is determined that the master server has been restored by the master server recovery determination step; And a slave server designation step of designating the temporary master server as the slave server after the data traffic reallocation step.
또한, 상기 임시마스터서버 지정단계는 기 설정된 우선순위정보에 따라 상기 다수개의 슬레이브서버 중 어느 하나가 임시마스터서버로 지정될 수 있다.Also, in the temporary master server designation step, any one of the plurality of slave servers may be designated as a temporary master server according to preset priority information.
또한, 본 발명의 병렬 연결식 서버시스템의 통신 장애 복구방법은 상기 임시마스터서버에서의 데이터 트래픽 과부하를 방지하도록, 상기 데이터 트래픽 할당단계 이후, 상기 임시마스터서버의 데이터 트래픽을 상기 다수개의 슬레이브서버로 분산하는 데이터 트래픽 분산단계;를 더 포함 할 수 있다.The communication failure recovery method of the parallel connection type server system of the present invention further includes a step of distributing data traffic of the temporary master server to the plurality of slave servers after the data traffic allocation step to prevent overloading of data traffic in the temporary master server And a data traffic distribution step of distributing the data traffic.
본 발명에 따르면, 병렬 연결식 서버시스템의 마스터서버에 통신 장애가 발생하는 경우에 별도의 물리적인 절체방법을 이용하지 않아도 되므로, 장애복구 시간이 단축되며, 장애 복구 비용이 대폭적으로 절감되는 효과가 있다.According to the present invention, when a communication failure occurs in the master server of the parallel-connected server system, since a separate physical switching method is not used, the failure recovery time is shortened and the failure recovery cost is greatly reduced.
또한, 임시마스터서버에 할당되는 데이터 트래픽이 타 슬레이브서버들로 분산됨으로써, 임시마스터서버에서의 데이터 트래픽 과부하가 효과적으로 방지된다.In addition, since the data traffic allocated to the temporary master server is distributed to other slave servers, data traffic overload in the temporary master server is effectively prevented.
도 1은 본 발명의 일실시예에 따른 병렬 연결식 서버시스템의 통신 장애 복구방법을 구현하기 위한 병렬 연결식 서버시스템을 개략적으로 도시한 것이고,
도 2는 도 1의 병렬 연결식 서버시스템의 서버를 개략적으로 도시한 것이고,
도 3은 본 발명의 일실시예에 따른 병렬 연결식 서버시스템의 통신 장애 복구방법의 순서도 이고,
도 4는 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 마스터서버 장애판단단계의 과정을 개략적으로 도시한 것이고,
도 5는 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 임시마스터서버 지정단계의 과정을 개략적으로 도시한 것이고,
도 6은 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 데이터 트래픽 할당단계의 과정을 개략적으로 도시한 것이고,
도 7은 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 데이터 트래픽 분산단계의 과정을 개략적으로 도시한 것이고,
도 8은 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 마스터서버 복구단계의 과정을 개략적으로 도시한 것이고,
도 9는 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 마스터서버 복구판단단계의 과정을 개략적으로 도시한 것이고,
도 10은 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 데이터 트래픽 재할당단계의 과정을 개략적으로 도시한 것이고,
도 11은 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 슬레이브서버 지정단계의 과정을 개략적으로 도시한 것이다.FIG. 1 is a schematic diagram of a parallel connection type server system for implementing a communication failure recovery method of a parallel connection type server system according to an embodiment of the present invention,
2 schematically shows a server of the parallel connected server system of FIG. 1,
3 is a flowchart of a communication fault recovery method of a parallel connected server system according to an embodiment of the present invention,
FIG. 4 schematically illustrates a process of determining a failure of a master server in a method of recovering a communication failure of the parallel-connected server system of FIG. 3,
FIG. 5 is a schematic diagram illustrating a procedure of a temporary master server designation step of a communication failure recovery method of the parallel connected server system of FIG. 3,
FIG. 6 is a diagram schematically illustrating a process of a data traffic allocating step of a communication fault recovery method of the parallel connected server system of FIG. 3,
FIG. 7 is a diagram schematically illustrating a process of a data traffic distribution step of a method of recovering a communication failure of the parallel connected server system of FIG. 3,
FIG. 8 schematically shows a process of a master server recovery step of a communication failure recovery method of the parallel connected server system of FIG. 3,
FIG. 9 is a diagram schematically illustrating a process of a master server recovery determination step of a communication failure recovery method of the parallel connected server system of FIG. 3,
FIG. 10 is a diagram schematically illustrating a process of a data traffic reassignment step of the communication failure recovery method of the parallel connected server system of FIG. 3,
FIG. 11 is a schematic diagram illustrating a process of designating a slave server in the method of recovering a communication failure of the parallel connected server system of FIG.
이하, 첨부한 도면을 참조하여, 본 발명의 일실시예에 따른 병렬 연결식 서버시스템의 통신 장애 복구방법의 구현을 위한 병렬 연결식 서버시스템에 대해서 상세히 설명한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, a parallel connection type server system for implementing a communication failure recovery method of a parallel connection type server system according to an embodiment of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명의 일실시예에 따른 병렬 연결식 서버시스템의 통신 장애 복구방법을 구현하기 위한 병렬 연결식 서버시스템을 개략적으로 도시한 것이다.FIG. 1 is a block diagram of a parallel-connected server system for implementing a method for recovering a communication failure of a parallel-connected server system according to an embodiment of the present invention. Referring to FIG.
도 1에 도시된 바와 같이, 본 발명의 일실시예에 따른 병렬 연결식 서버시스템의 통신 장애 복구방법(S100)을 구현하기 위한 병렬 연결식 서버시스템(100)은 다수개의 서버(110), 클라이언트(120)를 포함한다.1, a parallel connected server system 100 for implementing a communication failure recovery method (S100) of a parallel connected server system according to an embodiment of the present invention includes a plurality of
도 2는 도 1의 병렬 연결식 서버시스템의 서버를 개략적으로 도시한 것이다.2 schematically illustrates a server of the parallel connected server system of FIG.
도 2에 도시된 바와 같이, 다수개로 구비되는 서버(110)는 클라이언트(120)의 요청이 있는 경우, 클라이언트(120)에게 서비스를 제공하는 활성(Active)서버로써, 본체부(111), 설정부(112), 감지부(113)를 포함한다.2, the plurality of
한편, 상술한 다수개의 서버(110)는 내부적으로 네트워크로 연결되며, 별도로 구비되며 외부와 연결되는 L4 스위치와 연결됨으로써, 외부, 즉, 클라이언트(120)와 접속된다. Meanwhile, the plurality of
L4 스위치란 다수개의 4 레이어(4 Layer)의 프로토콜인 TCP/UDP 에서 스위칭을 수행하는 네트워크 장치로, L4 스위치는 TCP와 UDP 등의 헤더를 기초로 FTP, HTTP, SMTP 중 어떤 것에 해당하는 지를 판단하여 스위칭함으로써, 서버(110)간에 로드 벨런싱(Load Balancing)을 가능하게 한다.The L4 switch is a network device that performs switching in a number of four-layer protocols (TCP / UDP), and the L4 switch determines whether it corresponds to FTP, HTTP, or SMTP based on headers such as TCP and UDP So that load balancing between the
이러한 L4 스위치에 의해서, 다수개의 서버(110) 모두 활성(Active) 상태가 되며, 이후, 이러한 활성화된 다수개의 서버(110) 중 어느 하나가 후술하는 과정에 의해서 마스터의 기능을 수행할 수 있다.With the L4 switch, all of the plurality of
본체부(111)는 클라이언트(120)의 요청에 의해, 데이터베이스의 읽기, 쓰기 등 모든 서비스를 제공하는 것으로써, 클라이언트(120)와 연결된다.The
설정부(112)는 사용자의 조작에 의해, 본체부를 마스터 또는 슬레이브로 작동시키는 우선순위정보가 입력되는 것이다. The
즉, 사용자가 설정부(112)에 제1순위의 우선순위정보를 입력하는 경우, 이에 해당되는 본체부(111)가 마스터기능을 하는 서버, 즉, 마스터서버(110a)로써 작동하게 된다. 또한, 사용자가 설정부(112)에 제1순위의 우선순위정보를 제외한 제2순위, 제3순위 등의 우선순위정보를 입력하는 경우, 이에 해당되는 본체부(111)가 슬레이브 기능을 하는 서버, 즉, 슬레이브서버(110b, 110c, 110d...)로써 작동하게 된다.That is, when the user inputs the priority information of the first rank to the
감지부(113)는 자신의 제외한 타 서버의 상태를 감지하는 것이다. 예를 들어, 마스터서버(110a)의 감지부(113)는 타 서버, 즉, 슬레이브서버(110b, 110c, 110d...)의 장애 혹은 기타 상태를 감지한다. 이에 의해서, 마스터서버(110a)는 전체 서버시스템의 데이터 트래픽의 할당량을 재조정할 수 있다.The
또한, 예를 들어, 슬레이브서버(110b, 110c, 110d...)의 감지부(113)는 마스터서버(110a)에서 장애가 발생하는 경우, 이를 감지한다. 이에 의해서, 마스터서버(110a)에서 장애가 발생할 때, 제2순위 우선순위정보가 입력된 슬레이브서버가 임시마스터서버(110b)로 지정되며, 이후, 마스터서버(110a)의 데이터 트래픽이 임시마스터서버(110b)로 재할당됨으로써, 임시마스터서버(110b)가 마스터서버(110a)의 기능을 대신할 수 있다.In addition, for example, the
또한, 임시마스터서버(110b)의 감지부(113)는 장애가 발생한 마스터서버(110a) 및 타 슬레이브서버(110b, 110c, 110d...)의 상태를 감지한다. 이에 의해서, 장애가 발생한 마스터서버(110a)의 장애가 복구되는 경우, 임시마스터서버(110b)는 다시 슬레이브서버로 지정된다. 또한, 임시마스터서버(110b)의 감지부(113)는 타 슬레이브서버(110b, 110c, 110d...)의 상태를 감지함으로써, 전체 데이터 트래픽의 할당량을 재조정할 수 있다.The
따라서, 상술한 본체부(111), 설정부(112), 감지부(113)를 포함하는 서버(110)에 의해서, 각 서버(110)가 마스터서버(110a) 또는 슬레이브서버(110b, 110c, 110d...)로 용이하게 지정될 수 있으며, 또한, 마스터서버(110a)에서의 장애발생 시, 마스터서버(110a)의 데이터 트래픽이 슬레이브서버(110b, 110c, 110d...)에서 할당되어 처리될 수 있으므로, 별도의 물리적인 서버간의 절체방법 없이 효율적이며 용이하게 마스터서버(110a)의 데이터 트래픽 장애를 복구할 수 있다. The
클라이언트(120)는 정보를 열람하거나 특정의 프로그램을 사용하는 컴퓨터 또는 소프트웨어를 의미하는 것으로써, 일반적으로 사용자를 뜻한다. 이러한 클라이언트(120)는 서버(110)에 연결되어, 서버(110)로 필요한 여러 데이터를 요청한다.The
따라서, 상술한 본 발명의 일실시예에 따른 병렬 연결식 서버시스템의 통신 장애 복구방법(S100)을 구현하기 위한 병렬 연결식 서버시스템(100)에 의하면, 마스터서버(110a)에 통신 장애가 발생하는 경우에 별도의 물리적인 절체방법을 이용하지 않아도 되므로, 장애복구 시간이 단축되며, 장애 복구 비용이 대폭적으로 절감된다.
Therefore, according to the parallel connected server system 100 for implementing the communication failure recovery method (S100) of the parallel connected server system according to an embodiment of the present invention, when a communication failure occurs in the
지금부터는 첨부한 도면을 참조하여, 본 발명의 일실시예에 따른 병렬 연결식 서버시스템의 통신 장애 복구방법(S100)에 대해서 상세하게 설명한다.Hereinafter, a communication failure recovery method (S100) of a parallel connected server system according to an embodiment of the present invention will be described in detail with reference to the accompanying drawings.
도 3은 본 발명의 일실시예에 따른 병렬 연결식 서버시스템의 통신 장애 복구방법(S100)의 순서도 이다.3 is a flowchart of a communication failure recovery method (S100) of a parallel connected server system according to an embodiment of the present invention.
도 3에 도시된 바와 같이, 본 발명의 일실시예에 따른 병렬 연결식 서버시스템의 통신 장애 복구방법(S100)은 마스터서버 장애판단단계(S110), 임시마스터서버 지정단계(S120), 데이터 트래픽 할당단계(S130), 데이터 트래픽 분산단계(S130), 마스터서버 복구단계(S150), 마스터서버 복구판단단계(S160), 데이터 트래픽 재할당단계(S170), 슬레이브서버 지정단계(S180)를 포함한다.3, a communication failure recovery method S100 of a parallel connected server system according to an embodiment of the present invention includes a master server failure determination step S110, a temporary master server designation step S120, A data traffic distribution step S130, a master server recovery step S150, a master server recovery determination step S160, a data traffic reallocation step S170, and a slave server designation step S180.
도 4은 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 마스터서버 장애판단단계의 과정을 개략적으로 도시한 것이다.FIG. 4 schematically shows a process of determining a failure of a master server in a method of recovering a communication failure of the parallel connected server system of FIG.
도 4에 도시된 바와 같이, 마스터서버 장애판단단계(S110)는 마스터서버(110a)에 통신 장애가 발생되는지를 판단하는 단계이다. As shown in FIG. 4, the master server failure determination step S110 is a step of determining whether a communication failure occurs in the
이러한 마스터서버 장애판단단계(S110)는 마스터서버(110a)에 연결되는 슬레이브서버(110b, 110c, 110d...)의 각 감지부(112)에서 마스터서버(110a)의 데이터 트래픽을 실시간으로 모니터링함으로써 구현된다.This master server failure judgment step S110 monitors the data traffic of the
도 5는 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 임시마스터서버 지정단계의 과정을 개략적으로 도시한 것이다.FIG. 5 schematically shows a procedure of a temporary master server designation step of a communication failure recovery method of the parallel connected server system of FIG.
도 5에 도시된 바와 같이, 임시마스터서버 지정단계(S120)는 상술한 마스터서버 장애판단단계(S110)에 의해서, 마스터서버(110a)에 장애가 발생되었다고 판단되는 경우, 다수개의 슬레이브서버(110b, 110c, 110d...) 중 어느 하나를 임시마스터서버로 지정하는 단계이다. 5, in the step of designating a temporary master server (S120), when it is determined that a failure has occurred in the
이러한 임시마스터서버 지정단계(S120)는 다수개의 슬레이브서버(110b, 110c, 110d...)의 각 감지부(112)에서 마스터서버(110a)의 장애를 감지하면, 다수개의 슬레이브서버(110b, 110c, 110d...)의 설정부(112)에 설정된 우선순위에 따라 다수개의 슬레이브서버(110b, 110c, 110d...) 중 어느 하나가 임시마스터서버(110b)로 지정됨으로써 구현된다. When the temporary master server designation step S120 detects a failure of the
즉, 첫번째 슬레이브서버의 설정부(112)에 제2우선순위정보가 입력되어 있는 경우, 첫번째 슬레이브서버가 임시마스터서버(110b)로 지정된다.That is, when the second priority information is input to the
나아가, 제2우선순위정보가 입력되어 있는 첫번째 슬레이브서버(110b)에도 장애 등이 발생하여 임시마스터서버로 지정되기에 부적합한 경우에는 제3우선순위정보가 입력되어 있는 두번째 슬레이브서버(110c)가 임시마스터서버로 지정된다.If the
따라서, 이러한 임시마스터서버 지정단계(S120)에 의해서 효율적으로 임시마스터서버(110b)가 지정될 수 있다.Therefore, the provisional master server designation step (S120) can efficiently designate the
도 6은 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 데이터 트래픽 할당단계의 과정을 개략적으로 도시한 것이다.FIG. 6 is a schematic diagram illustrating a process of allocating data traffic in the method of recovering a communication failure of the parallel connected server system of FIG.
도 6에 도시된 바와 같이, 데이터 트래픽 할당단계(S130)는 상술한 임시마스터서버 지정단계(S120)에 의해 지정된 임시마스터서버(110b)에 장애가 발생된 마스터서버(110a)의 데이터 트래픽을 할당하는 단계이다. As shown in FIG. 6, the data traffic allocation step S130 allocates the data traffic of the
이때, 임시마스터서버 지정단계(S120)에 의해 지정된 임시마스터서버(110b)는 장애가 발생된 마스터서버(110a)와 병렬로 연결되어 있는바, 물리적인 서버간 절체과정없이, 마스터서버(110a)에서 처리되어야 할 데이터 트래픽이 마스터서버(110a)에서 임시마스터서버(110b)로 곧바로 할당될 수 있다.At this time, the
도 7은 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 데이터 트래픽 분산단계의 과정을 개략적으로 도시한 것이다.FIG. 7 schematically shows a process of distributing data traffic in the method of recovering a communication failure of the parallel-connected server system of FIG.
도 7에 도시된 바와 같이, 데이터 트래픽 분산단계(S130)는 상술한 데이터 트래픽 할당단계(S130) 이후, 임시마스터서버(110b)의 데이터 트래픽을 타 슬레이브서버(110c, 110d...)로 분산하는 단계이다.7, the data traffic distribution step S130 distributes the data traffic of the
이러한 데이터 트래픽 분산단계(S130)에 의하면, 임시마스터서버(110b)에 할당되는 데이터 트래픽이 타 슬레이브서버(110c, 110d...)로 분산됨으로써, 임시마스터서버(110b)에서의 데이터 트래픽 과부하가 효과적으로 방지된다.According to this data traffic distribution step S130, the data traffic allocated to the
도 8은 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 마스터서버 복구단계의 과정을 개략적으로 도시한 것이다.FIG. 8 is a diagram schematically illustrating a process of a master server recovery step of the communication failure recovery method of the parallel connected server system of FIG.
도 8에 도시된 바와 같이, 마스터서버 복구단계(S150)는 마스터서버(110a)의 장애를 복구하는 단계이다. 이러한 마스터서버 복구단계(S150)는 외부의 인력에 의해서 장애가 발생된 마스터서버(110a)가 복구됨으로써 구현된다.As shown in FIG. 8, the master server recovery step (S150) is a step of restoring the failure of the
도 9는 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 마스터서버 복구판단단계의 과정을 개략적으로 도시한 것이다.FIG. 9 is a diagram schematically illustrating a procedure of a master server recovery determination step of a communication failure recovery method of the parallel connected server system of FIG.
도 9에 도시된 바와 같이, 마스터서버 복구판단단계(S160)는 마스터서버 복구단계(S150)에 의해서 마스터서버(110a)의 장애가 복구되었는지를 판단하는 단계이다. 이러한 마스터서버 복구판단단계(S160)는 다수개의 슬레이브서버(110b, 110c, 110d...)의 각 감지부(112)에서 마스터서버(110a)의 상태를 실시간으로 모니터링 함으로써 구현된다.As shown in FIG. 9, the master server recovery determination step S160 is a step of determining whether the failure of the
도 10은 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 데이터 트래픽 재할당단계의 과정을 개략적으로 도시한 것이다.FIG. 10 schematically shows a process of a data traffic reallocation step of the method for recovering a communication failure of the parallel connected server system of FIG.
도 10에 도시된 바와 같이, 데이터 트래픽 재할당단계(S170)는 상술한 마스터서버 복구판단단계(S160)에 의해서, 마스터서버(110a)가 복구되었다고 판단되는 경우, 임시마스터서버(110b)의 데이터 트래픽을 마스터서버(110a)로 다시 할당하는 단계이다. 10, in the data traffic reallocation step S170, when it is determined that the
이러한 데이터 트래픽 재할당단계(S170)는 임시마스터서버(110b)의 감지부(112)에서 마스터서버(110a)가 복구되었다고 판단되면, 임시마스터서버(110b)가 할당받았던 데이터 트래픽을 다시 복구된 마스터서버(110a)로 재할당함으로써 구현된다.If it is determined that the
도 11은 도 3의 병렬 연결식 서버시스템의 통신 장애 복구방법의 슬레이브서버 지정단계의 과정을 개략적으로 도시한 것이다.FIG. 11 is a schematic diagram illustrating a process of designating a slave server in the method of recovering a communication failure of the parallel connected server system of FIG.
도 11에 도시된 바와 같이, 슬레이브서버 지정단계(S180)는 데이터 트래픽 재할당단계(S170) 이후, 임시마스터서버(110b)를 슬레이브서버로 지정하는 단계이다. 이러한 슬레이브서버 지정단계(S180)는 마스터서버(110a)로 데이터 트레픽의 재할당이 완료된 후에, 임시적으로 마스터 기능을 수행하던 임시마스터서버(110b)를 다시 슬레이브 기능을 수행하도록 임시마스터서버(110b)의 설정부(112)의 설정 정보값이 변환됨으로써 구현된다.As shown in FIG. 11, the slave server designation step S180 is a step of designating the
따라서, 상술한 바와 같은, 본 발명의 일실시예에 따른 병렬 연결식 서버시스템의 통신 장애 복구 방법에 의하면, 마스터서버(110a)에 통신 장애가 발생하는 경우, 정상 작동하며, 우선순위정보값이 가장 상위에 있는 슬레이브서버를 임시마스터서버(110b)로 지정한 다음, 이러한 임시마스터서버(110b)에 마스터서버(110a)의 데이터 트래픽을 할당하고, 이후, 마스터서버(110a)의 장애가 복구되는 경우, 다시 데이터 트래픽을 마스터서버(110a)로 재할당하는 것을 이용함으로써, 마스터서버(110a) 장애시에 별도의 물리적 절체과정 없이 효율적이고 용이하게 마스터서버(110a)의 통신 장애를 복구할 수 있다.
Therefore, according to the communication failure recovery method of the parallel connected server system according to the embodiment of the present invention, when a communication failure occurs in the
본 발명의 권리범위는 상술한 실시예에 한정되는 것이 아니라 첨부된 특허청구범위 내에서 다양한 형태의 실시예로 구현될 수 있다. 특허청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 변형 가능한 다양한 범위까지 본 발명의 청구범위 기재의 범위 내에 있는 것으로 본다.The scope of the present invention is not limited to the above-described embodiments, but may be embodied in various forms of embodiments within the scope of the appended claims. It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the present invention as defined by the appended claims.
100 : 본 발명의 일실시예에 따른 병렬 연결식 서버시스템의 통신 장애 복구방법을 구현하기 위한 병렬 연결식 서버시스템
110 : 서버 111 : 본체부
112: 설정부 113 : 감지부
110a : 마스터서버 110b : 임시마스터서버(슬레이브서버)
110c, 110d : 슬레이브서버 120 : 클라이언트
S100 : 본 발명의 일실시예에 따른 병렬 연결식 서버시스템의 통신 장애 복구방법
S110 : 마스터서버 장애판단단계 S120 : 임시마스터서버 지정단계
S130 : 데이터 트래픽 할당단계 S140 : 데이터 트래픽 분산단계
S150 : 마스터서버 복구단계 S160 : 마스터서버 복구판단단계
S170 : 데이터 트래픽 재할당단계 S180 : 슬레이브서버 지정단계100: A parallel connection type server system for implementing a communication failure recovery method of a parallel connection type server system according to an embodiment of the present invention
110: server 111:
112: Setting unit 113:
110a:
110c and 110d: a slave server 120: a client
S100: a method for recovering a communication failure of a parallel-connected server system according to an embodiment of the present invention
S110: Master server failure determination step S120: Temporary master server designation step
S130: Data traffic allocation step S140: Data traffic distribution step
S150: Master Server Recovery Step S160: Master Server Recovery Judgment Step
S170: Data traffic reallocation step S180: Slave server designation step
Claims (3)
상기 마스터서버에 통신 장애가 발생되는지를 판단하는 마스터서버 장애판단단계;
상기 장애판단단계에 의해서, 상기 마스터서버에 장애가 발생되었다고 판단되는 경우, 상기 다수개의 슬레이브서버 중 어느 하나를 임시마스터서버로 지정하는 임시마스터서버 지정단계;
상기 임시마스터서버에 상기 마스터서버의 데이터 트래픽을 할당하는 데이터 트래픽 할당단계;
상기 마스터서버의 장애를 복구하는 마스터서버 복구단계;
상기 마스터서버 복구단계에 의해서 상기 마스터서버의 장애가 복구되었는지를 판단하는 마스터서버 복구판단단계;
상기 마스터서버 복구판단단계에 의해서, 상기 마스터서버가 복구되었다고 판단되는 경우, 상기 임시마스터서버의 데이터 트래픽을 상기 마스터서버로 다시 할당하는 데이터 트래픽 재할당단계;
상기 데이터 트래픽 재할당단계 이후, 상기 임시마스터서버를 상기 슬레이브서버로 지정하는 슬레이브서버 지정단계;를 포함하고,
상기 데이터 트래픽 할당단계는,
상기 임시마스터서버 및 상기 장애가 발생된 마스터서버가 병렬로 연결되어 별도의 물리적인 서버 간 절체과정을 요하지 않고 이루어지며,
상기 임시마스터서버 지정단계는,
기설정된 우선순위정보에 따라 상기 다수개의 슬레이브서버 중 어느 하나가 임시마스터서버로 지정되고,
상기 임시마스터서버에서의 데이터 트래픽 과부하를 방지하도록, 상기 데이터 트래픽 할당단계 이후, 상기 임시마스터서버의 데이터 트래픽을 상기 다수개의 슬레이브서버로 분산하는 데이터 트래픽 분산단계;를 더 포함하며,
상기 마스터서버 및 상기 다수개의 슬레이브서버는,
자신의 제외한 타 서버의 상태를 감지하는 감지부;를 각각 개별적으로 포함하고,
상기 데이터 트래픽 분산단계는,
상기 임시마스터서버의 상기 감지부가 상기 다수개의 슬레이브서버의 상태를 감지함으로써, 상기 임시마스터서버의 데이터 트래픽을 상기 다수개의 슬레이브서버로 분산하며,
상기 활성 서버는,
다수개의 서버가 상호 간에 내부 네트워크로 연결되고, 상기 내부 네트워크와는 별도로 마련되는 외부 네트워크로 클라이언트의 단말과 L4 스위치가 연결되는 경우에, 상기 L4 스위치와 연결되어 상기 L4 스위치에 의해 활성화된 서버를 의미하고,
상기 활성 서버의 감지부는,
상기 활성 서버가 다수개인 경우, 상기 다수개의 활성 서버 중 어느 하나의 활성 서버의 우선순위정보가 제1순위로 설정되면, 상기 제1순위로 설정된 활성 서버가 상기 마스터서버로 지정되도록 하고, 상기 마스터서버로 지정된 상기 활성 서버를 제외한 상기 다수개의 활성 서버 중 어느 하나의 활성 서버의 상기 우선순위정보가 제2순위로 설정되면, 상기 제2순위로 설정된 활성 서버가 상기 임시마스터서버로 지정되도록 하여 상기 다수개의 활성 서버의 상기 데이터 트래픽 과부하를 방지하도록 상기 다수개의 활성 서버의 역할을 조정하는 것을 특징으로 하는 병렬 연결식 서버시스템의 통신 장애 복구방법.A communication failure recovery method of a parallel connected server system for restoring a communication failure of a master server provided as an active server and a server system having a plurality of slave servers connected in parallel,
A master server failure determination step of determining whether a communication failure occurs in the master server;
Designating a temporary master server to designate any one of the plurality of slave servers as a temporary master server when it is determined by the failure determination step that a failure has occurred in the master server;
A data traffic allocation step of allocating data traffic of the master server to the provisional master server;
A master server restoring step of restoring the failure of the master server;
Determining whether a failure of the master server has been recovered by the master server recovery step;
A data traffic reallocation step of reallocating data traffic of the temporary master server to the master server when it is determined that the master server has been restored by the master server recovery determination step;
And a slave server designation step of designating the temporary master server as the slave server after the data traffic reallocation step,
Wherein the data traffic allocation step comprises:
The temporary master server and the failed master server are connected in parallel without requiring a separate physical server switching process,
Wherein the temporary master server designation step comprises:
One of the plurality of slave servers is designated as a temporary master server according to preset priority information,
Further comprising distributing data traffic of the temporary master server to the plurality of slave servers after the data traffic allocation step to prevent overloading of the data traffic in the temporary master server,
The master server and the plurality of slave servers,
And a detection unit for detecting the status of other servers except for the server,
Wherein the data traffic distribution step comprises:
Wherein the sensing unit of the temporary master server senses the states of the plurality of slave servers to distribute the data traffic of the temporary master server to the plurality of slave servers,
The active server comprises:
A plurality of servers are connected to each other through an internal network and an L4 switch is connected to an external network provided separately from the internal network, Meaning,
Wherein the detecting unit of the active server comprises:
Wherein when the priority information of one of the plurality of active servers is set to a first rank, the active server set to the first rank is designated as the master server, When the priority information of one of the plurality of active servers except for the active server designated as the server is set to the second rank, the active server set in the second rank is designated as the temporary master server, And adjusting the roles of the plurality of active servers to prevent the data traffic overload of the plurality of active servers.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140051377A KR101586354B1 (en) | 2014-04-29 | 2014-04-29 | Communication failure recover method of parallel-connecte server system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140051377A KR101586354B1 (en) | 2014-04-29 | 2014-04-29 | Communication failure recover method of parallel-connecte server system |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150124642A KR20150124642A (en) | 2015-11-06 |
KR101586354B1 true KR101586354B1 (en) | 2016-01-18 |
Family
ID=54600947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140051377A KR101586354B1 (en) | 2014-04-29 | 2014-04-29 | Communication failure recover method of parallel-connecte server system |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101586354B1 (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102188987B1 (en) | 2019-12-18 | 2020-12-09 | (주)비앤에스컴 | Operation method of cloud computing system for zero client device using cloud server having device for managing server and local server |
KR20220110628A (en) | 2021-01-31 | 2022-08-09 | 동명대학교산학협력단 | Server and Cloud computing system for smart farm |
US11575741B2 (en) | 2021-04-29 | 2023-02-07 | Zoom Video Communications, Inc. | System and method for active-active standby in phone system management |
US11785077B2 (en) | 2021-04-29 | 2023-10-10 | Zoom Video Communications, Inc. | Active-active standby for real-time telephony traffic |
KR20230073469A (en) | 2021-11-19 | 2023-05-26 | 주식회사 지니에이아이 | Server management system capable of responding to failure |
KR102526368B1 (en) | 2022-09-29 | 2023-05-02 | 주식회사 지니에이아이 | Server management system supporting multi-vendor |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100363523B1 (en) * | 1999-12-23 | 2002-12-05 | 주식회사 아라기술 | Method for controlling distributed processing in cluster severs |
KR20030048503A (en) * | 2001-12-12 | 2003-06-25 | 주식회사 엘지이아이 | Communication system and method for data synchronization of duplexing server |
KR100499364B1 (en) * | 2002-09-24 | 2005-07-04 | 에스케이 텔레콤주식회사 | Backup & switching method of master BSM package information |
KR101107321B1 (en) * | 2008-12-08 | 2012-01-20 | 한국전자통신연구원 | Method and apparatus for equal opportunity protection switching in transport network |
-
2014
- 2014-04-29 KR KR1020140051377A patent/KR101586354B1/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR20150124642A (en) | 2015-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101586354B1 (en) | Communication failure recover method of parallel-connecte server system | |
CN104158693B (en) | The disaster-tolerant backup method and system of data service | |
WO2017067484A1 (en) | Virtualization data center scheduling system and method | |
US11461199B2 (en) | Redundancy method, device, and system | |
JP4920248B2 (en) | Server failure recovery method and database system | |
CN104221004A (en) | Cluster wide consistent detection of interconnect failures | |
CN108633311A (en) | A kind of method, apparatus and control node of the con current control based on call chain | |
CN105337780B (en) | A kind of server node configuration method and physical node | |
CN111045602B (en) | Cluster system control method and cluster system | |
US9448615B2 (en) | Managing power savings in a high availability system at a redundant component level of granularity | |
WO2019148716A1 (en) | Data transmission method, server, and storage medium | |
US10331472B2 (en) | Virtual machine service availability | |
JP2008107896A (en) | Physical resource control management system, physical resource control management method and physical resource control management program | |
CN104917827A (en) | Method for realizing oracle load balancing cluster | |
JP5647561B2 (en) | Power system supervisory control system | |
JP7206981B2 (en) | Cluster system, its control method, server, and program | |
CN106525030A (en) | Navigation system dual-redundancy control and display method | |
US8370897B1 (en) | Configurable redundant security device failover | |
CN103902401A (en) | Virtual machine fault tolerance method and device based on monitoring | |
CN103793296A (en) | Method for assisting in backing-up and copying computer system in cluster | |
US10264060B1 (en) | Automated load balancing for private clouds | |
US20160034548A1 (en) | System and Method for Obtaining Automated Scaling of a Virtual Desktop Environment | |
CN111367711A (en) | Safety disaster recovery method based on super fusion data | |
JP2016009413A (en) | Network monitoring system and network monitoring method | |
CN112564968A (en) | Fault processing method, device and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |