KR102109536B1 - Method for diagnosing and handling obstacle of server based on obstacle type - Google Patents
Method for diagnosing and handling obstacle of server based on obstacle type Download PDFInfo
- Publication number
- KR102109536B1 KR102109536B1 KR1020180131810A KR20180131810A KR102109536B1 KR 102109536 B1 KR102109536 B1 KR 102109536B1 KR 1020180131810 A KR1020180131810 A KR 1020180131810A KR 20180131810 A KR20180131810 A KR 20180131810A KR 102109536 B1 KR102109536 B1 KR 102109536B1
- Authority
- KR
- South Korea
- Prior art keywords
- failure
- diagnosis
- response
- web server
- server
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/02—Standardisation; Integration
- H04L41/0246—Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols
- H04L41/0253—Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols using browsers or web-pages for accessing management information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
본 발명의 일 실시예에 따르면, 통합 관리 서버가, 장애 유형을 기반으로 하여 서버 장애를 진단하고 대응하는 방법에 있어서, (a) 웹서버로부터 수신되는 실시간 상태 정보를 기초로 웹서버에 대한 모니터링을 수행하여, 장애가 감지되면, 감지된 장애의 유형을 진단하는 단계; (b) 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 상기 진단된 장애 유형에 대응되는 제어 명령을 상기 웹서버로 전송함으로써 상기 감지된 장애에 대한 대응을 실시하는 단계; 및 (c) 장애 진단 및 대응에 대한 결과 정보를 생성하여 저장하고, 생성한 결과 정보를 상기 관리자 단말기로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법이 제공된다.According to an embodiment of the present invention, in a method for an integrated management server to diagnose and respond to a server failure based on a type of failure, (a) monitoring for the web server based on real-time status information received from the web server Performing, if a failure is detected, diagnosing the type of the detected failure; (b) performing a response to the detected failure by transmitting a control command corresponding to the diagnosed failure type to the web server on the basis of a rule for diagnosis and response to the failure; And (c) generating and storing the result information on the diagnosis and response to the failure, and transmitting the generated result information to the manager terminal.
Description
본 발명은 장애 유형 기반의 서버 장애 진단 및 대응 방법에 관한 것으로, 더욱 상세하게는, 서버에서 발생되는 복합 장애가 유형에 따라 진단되고, 진단된 장애에 대하여 미리 설정되어 있는 규칙 기반으로 대응 제어가 자동 실시되도록 함으로써, 진단 장애에 대한 자동적 선대응 또는 즉시대응이 가능하도록 하여 장애 예방 및 방지가 가능함에 따라, 웹서버로 하여금 효율적으로 장애 상황을 극복할 수 있도록 하는 방법에 관한 것이다.The present invention relates to a method for diagnosing and responding to a server failure based on a failure type, and more specifically, a complex failure occurring in a server is diagnosed according to a type, and response control is automatically performed based on a preset rule for the diagnosed failure. By implementing it, it is possible to automatically pre- respond or immediately respond to a diagnosis failure, thereby preventing and preventing the failure, and thus to a method of enabling the web server to effectively overcome the failure situation.
일반적으로, 웹서버 또는 웹 애플리케이션 서버는 서버 이용자가 급증하는 등의 경우에도 장애 없이 웹서비스를 제공할 수 있어야 한다.In general, a web server or a web application server should be able to provide web services without failure even in the case of a rapid increase in server users.
하지만, 서버 운용 중 장애가 발생하지 않는 것은 불가능하며, 이에 따라 서버를 실시간으로 모니터링 하여 발생되는 장애를 감지하고 이에 대한 신속한 대응을 실시함으로써, 장애 발생으로 인한 서버 운용의 문제가 최소화될 수 있도록 하는 기술 개발의 노력이 지속되고 있다.However, it is impossible to prevent a failure during server operation. Accordingly, by monitoring the server in real time, it detects a failure that occurs and promptly responds to it, thereby minimizing the problem of server operation due to failure. Development efforts are continuing.
웹서버 또는 웹 애플리케이션 서버의 경우, 서버에서 발생한 단순한 장애라고 할지라도 이 장애들이 복합적으로 연결되면 서버 전체가 웹 서비스를 제공할 수 없는 서비스 불능이라는 심각한 문제가 발생할 수도 있다.In the case of a web server or a web application server, even if it is a simple failure occurring in the server, if these failures are connected in a complex manner, a serious problem may arise that the entire server cannot provide a web service.
하지만, 기존의 서버 장애 감지 및 해결 프로세스의 경우, 소수 장애 유형만을 진단하며, 진단에 따른 대응에 대해서도, 장애 발생 알람 제공, 서버 재시작 등의 기본적인 대응 기능만을 제공한다.However, in the case of the existing server failure detection and resolution process, only a small number of failure types are diagnosed, and only the basic response functions such as providing a failure alarm and restarting the server are provided for the response according to the diagnosis.
다시 말해, 기존의 서버 장애 진단 및 대응 프로세스는 알람 제공 등의 이미 발생한 장애에 대한 기본적인 대응 처리만을 실시하기 때문에 다양한 서버 장애 유형에 대한 대응이 어려우며, 선제적으로 서버에 대한 문제를 진단하고 그에 대한 대응을 미리 하여 서버 장애 발생을 예방하는 방식이 아니기 때문에, 서버 전체의 서비스 불능과 같은 심각한 서버 장애에 대해서는 근본적인 대응이 불가능하다는 단점이 있다.In other words, the existing server failure diagnosis and response process only handles basic response to an already occurring failure such as providing an alarm, making it difficult to respond to various server failure types, and proactively diagnosing and resolving problems with the server. Since it is not a method to prevent the occurrence of a server failure by responding in advance, there is a disadvantage in that it is impossible to fundamentally respond to a serious server failure such as inability to service the entire server.
따라서, 서버에서 발생할 수 있는 다양한 주요 유형별 장애에 대한 즉각적 대응이 가능하며, 더 크고 복잡한 장애상황으로 장애가 전파되기 이전에 자동적으로 장애 진단 및 선대응 또한 가능하도록 하여, 웹서버의 장애가 효율적으로 극복되도록 하며, 사용자에게는 장애가 최소화된 웹서비스를 제공할 수 있도록 하는 기술 개발에 대한 요구가 점차 증대되고 있으며, 상술한 문제점을 해결하기 위한 방안이 시급한 실정이다.Therefore, it is possible to immediately respond to various major types of failures that can occur in the server, and to automatically diagnose and respond to failures before they are propagated to larger and more complex failure situations, so that the failure of the web server can be effectively overcome. In addition, there is an increasing demand for technology development to provide a web service with minimal obstacles to users, and an urgent need is to solve the above-mentioned problems.
본 발명은 전술한 종래기술의 문제점을 해결하기 위한 것으로, 서버에 대한 일부 장애 현상 처리가 아닌 다양한 장애 유형 기반으로 복합 장애 진단 및 대응 제어를 실시함으로써 다양하게 발생되는 서버 장애에 대한 예방 및 방지가 가능하도록 하는 것을 그 목적으로 한다.The present invention is to solve the above-mentioned problems of the prior art, and prevents and prevents various server failures caused by various failure diagnosis and response control based on various failure types rather than processing some failures on the server. Its purpose is to make it possible.
본 발명은 단순한 유형의 장애들이 복합적으로 연결되어 더 크고 복잡한 장애 상황으로 전파됨으로서, 서버 전체가 서비스 불능에 빠지는 것을 예방할 수 있도록 장애를 진단하고 선대응하는 것을 그 목적으로 한다.The present invention aims at diagnosing and responding to a failure so that the entire server can be prevented from becoming out of service by simply connecting the types of failures and spreading them to a larger and more complicated failure situation.
본 발명의 목적들은 이상에서 언급한 목적들로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.The objects of the present invention are not limited to the objects mentioned above, and other objects not mentioned will be clearly understood from the following description.
상술한 목적을 달성하기 위한 본 발명의 일 실시예에 따르면, 통합 관리 서버가, 장애 유형을 기반으로 하여 서버 장애를 진단하고 대응하는 방법에 있어서, (a) 웹서버로부터 수신되는 실시간 상태 정보를 기초로 웹서버에 대한 모니터링을 수행하여, 장애가 감지되면, 감지된 장애의 유형을 진단하는 단계; (b) 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 상기 진단된 장애 유형에 대응되는 제어 명령을 상기 웹서버로 전송함으로써 상기 감지된 장애에 대한 대응을 실시하는 단계; 및 (c) 장애 진단 및 대응에 대한 결과 정보를 생성하여 저장하고, 생성한 결과 정보를 상기 관리자 단말기로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법이 제공된다.According to an embodiment of the present invention for achieving the above object, the integrated management server, in the method of diagnosing and responding to a server failure based on the type of failure, (a) real-time status information received from the web server Performing monitoring on the web server as a basis, and if a failure is detected, diagnosing the type of the detected failure; (b) performing a response to the detected failure by transmitting a control command corresponding to the diagnosed failure type to the web server on the basis of a rule for diagnosis and response to the failure; And (c) generating and storing the result information on the diagnosis and response to the failure, and transmitting the generated result information to the manager terminal.
상기 실시간 상태 정보는, 상기 웹서버에 대한 서버 리소스 정보 및 노드 리소스 정보를 포함할 수 있다.The real-time status information may include server resource information and node resource information for the web server.
상기 (a) 단계는, 상기 실시간 상태 정보와 상기 통합 관리 서버 내 미리 저장되어 있는 장애 진단 및 대응 규칙을 기반으로 분석을 실시하여 상기 감지된 장애의 유형을 진단하는 단계를 포함할 수 있다.The step (a) may include diagnosing the type of the detected failure by performing an analysis based on the real-time status information and a failure diagnosis and response rule stored in advance in the integrated management server.
상기 (a) 단계는, 상기 실시간 상태 정보와 상기 통합 관리 서버 내 장애 진단 및 대응에 대한 결과 정보가 누적 저장되어 있는 이력 정보를 기반으로 분석을 실시하여 상기 감지된 장애의 유형을 진단하는 단계를 포함할 수 있다.The step (a) is to diagnose the type of the detected failure by performing an analysis based on the history information in which the real-time status information and the result information on the diagnosis and response to the failure in the integrated management server are accumulated and stored. It can contain.
상기 (b) 단계는, 상기 진단된 장애 유형에 대한 알람 정보를 상기 관리자 단말기로 전송함으로써 상기 감지된 장애에 대한 대응을 실시하는 단계를 포함할 수 있다.The step (b) may include performing a response to the detected failure by sending alarm information for the diagnosed failure type to the manager terminal.
상기 (a) 단계는, 상기 감지된 장애의 유형을, 요청 초과 장애, 대용량 데이터 베이스 데이터 조회 장애, 데이터베이스 연결 요청 초과 장애, 서비스 지연 장애, 메모리 부족 장애, 특정 서비스의 요청 초과 장애 및 정지 장애 중 어느 하나로 진단하는 단계를 포함할 수 있다.In step (a), the type of the detected failure is a request exceeding failure, a large database data inquiry failure, a database connection request exceeding failure, a service delay failure, an insufficient memory failure, a request exceeding failure and a stopping failure of a specific service. And diagnosing with any one.
상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 상기 웹서버의 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되면, 요청 초과 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키는 제어 명령을 상기 웹서버로 전송하는 단계를 포함할 수 있다.In the steps (a) and (b), when it is determined through the monitoring that the available thread usage of the web server exceeds a threshold, the request is diagnosed as a failure, and the diagnosis and response are set in advance. On the basis of the rules for, it may include transmitting a control command to bypass the user request to a temporary page to the web server.
상기 사용자 요청을 임시 페이지로 우회시키는 제어는, 상기 웹서버 내에서 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되어, 요청 초과 장애가 진단되면, 상기 웹서버 자체적으로 요청 초과 장애 진단 즉시 자동 수행 가능한 것을 특징으로 할 수 있다.Control to bypass the user request to a temporary page, if it is determined that the available thread usage in the web server has exceeded the threshold, and the request exceeded fault is diagnosed, the web server itself automatically performs the request exceeded fault diagnosis It can be characterized as possible.
상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되면, 대용량 데이터베이스 데이터 조회 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어 명령을 상기 웹서버로 전송하는 단계를 포함할 수 있다.In the steps (a) and (b), when it is determined that a large database data query for a service is requested from the user through the monitoring, the large database data query is diagnosed as a failure, and a preset failure diagnosis and response is determined. Based on the rule, it may include the step of forcibly terminating the corresponding service requested from the user or transmitting a control command to limit the service by a predetermined condition to the web server.
상기 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어는, 상기 웹서버 내에서 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되어, 대용량 데이터베이스 데이터 조회 장애가 진단되면, 상기 웹서버 자체적으로 대용량 데이터베이스 데이터 조회 장애 진단 즉시 자동 수행 가능한 것을 특징으로 할 수 있다.The control for forcibly terminating the corresponding service requested from the user or restricting the service by a predetermined condition is determined as a request for a large database data query for the service from the user in the web server, so that the large database data search is performed. When a failure is diagnosed, the web server itself can automatically perform a large database data inquiry failure diagnosis immediately.
상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 상기 웹서버 내 데이터베이스 연결 그룹(Pool)이 임계치를 초과하여 특정 데이터소스(Datasource)의 데이터베이스 연결이 과도하게 사용되고 있는 것으로 판단되면, 데이터베이스 연결 요청 초과 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 상기 웹서버로 전송하는 단계를 포함할 수 있다.In the steps (a) and (b), if it is determined through the monitoring that the database connection group (Pool) in the web server exceeds a threshold, database connection of a specific data source is excessively used, database connection Diagnose as a request exceeded failure, and send a control command to bypass the user request to a temporary page or forcibly reduce the waiting time for acquiring the corresponding database connection to the web server, based on the rules for diagnosing and responding to the failure. It may include the steps.
상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 사용자로부터 요청된 서비스의 응답이 지연되거나 사용자로부터 소정의 시간이 지연된 후에 제공되는 서비스에 대한 요청이 수신된 것으로 판단되면, 서비스 지연 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 장애가 진단된 서비스에 대한 스레드 사용률을 제한하는 제어 명령을 상기 웹서버로 전송하는 단계를 포함할 수 있다.Steps (a) and (b) may cause a service delay failure if it is determined that a response to a service requested from the user is delayed through the monitoring or a request for a service provided after a predetermined time is delayed from the user. Diagnosing, and based on a predetermined rule for diagnosis and response to the failure, may include transmitting a control command to the web server to limit the thread usage rate for the service diagnosed with the failure.
상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 서비스 로직(Logic)의 오류 또는 시스템의 과도한 메모리 사용에 의해 메모리 부족 문제(Out Of Memory, OOM)가 발생하거나 메모리 자동 수거 현상(Full Garbage Collection, Full GC) 발생 빈도가 증가하거나 메모리 해제 불가의 상황이 지속적으로 발생하는 것으로 판단되면, 메모리 부족 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 덤프 생성 명령 및 서버 재기동 명령을 상기 웹서버로 전송하고, 알람 정보를 상기 관리자 단말기로 전송하는 단계를 포함할 수 있다.In the above steps (a) and (b), out of memory (OOM) occurs due to an error in service logic or excessive use of the system through the monitoring, or an automatic memory collection phenomenon (Full Garbage) Collection, Full GC) If the frequency of occurrence increases or it is determined that a situation in which the memory cannot be released is continuously generated, it is diagnosed as an out-of-memory failure, and a dump generation command is based on the rules for diagnosing and responding to the failure. And transmitting a server restart command to the web server and transmitting alarm information to the manager terminal.
상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 상기 웹서버로 수신된 특정 서비스에 대한 사용자의 요청이 상기 웹서버에서 처리 가능한 한계를 초과하는 것으로 판단되면, 특정 서비스의 요청 초과 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 복수의 사용자에 대한 서비스 진입이 순차적으로 이뤄지도록 하는 요청 제어 명령을 상기 웹서버로 전송하고, 해당 장애 진단에 대한 알람 정보를 상기 관리자 단말기로 전송하는 단계를 포함할 수 있다.In the steps (a) and (b), if it is determined that a user request for a specific service received through the monitoring to the web server exceeds a limit that can be processed by the web server, a request exceeding failure of the specific service may result. Diagnosis, and transmits a request control command to the web server to sequentially enter the service for a plurality of users based on the rules for diagnosis and response to a preset failure, and alarm information for the diagnosis of the failure. It may include the step of transmitting to the administrator terminal.
상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 상기 웹서버가 기동 중인 상태임에도 아무 기능도 수행하지 못하는 정지(Hang) 상태인 것으로 판단되면, 정지 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 상기 웹서버로 덤프 생성 명령 및 서버 재기동 명령을 전송하고, 상기 관리자 단말기로 해당 진단 장애에 대한 알람 정보를 전송하는 단계를 포함할 수 있다.In the steps (a) and (b), if it is determined through the monitoring that the web server is in a running state that does not perform any function even though it is in a running state, it is diagnosed as a stopping fault, and a preset fault The method may include transmitting a dump generation command and a server restart command to the web server based on the rules for diagnosis and response, and transmitting alarm information for the corresponding diagnosis failure to the manager terminal.
상기 (c) 단계는, 상기 장애 진단 및 대응에 대한 결과 정보를 시계열로 나열된 통계 정보 형태로 생성하여 상기 관리자 단말기로 전송하는 단계를 포함할 수 있다.The step (c) may include generating the result information on the diagnosis and response to the failure in the form of statistical information arranged in a time series and transmitting the result information to the manager terminal.
상기 (c) 단계는, 상기 관리자 단말기로부터 수신되는 관리자의 요청 또는 미리 설정되어 있는 소정의 주기에 의해 상기 장애 진단 및 대응에 대한 결과 정보를 생성하는 단계를 포함할 수 있다.The step (c) may include generating result information on the diagnosis and response to the failure at a predetermined period set in advance or at the request of the administrator received from the administrator terminal.
상기 (c) 단계는, 상기 관리자 단말기로부터 소정의 검색 조건이 포함된 정보 조회 요청이 수신되면, 수신된 소정의 검색 조건에 상응하는 장애 진단 및 대응에 대한 결과 정보를 생성하여 상기 관리자 단말기로 전송하는 단계를 포함할 수 있다.In step (c), when an information inquiry request including a predetermined search condition is received from the administrator terminal, the result of the diagnosis and response to the failure corresponding to the received predetermined search condition is generated and transmitted to the administrator terminal. It may include the steps.
한편, 본 발명의 다른 실시예에 따르면, 웹서버로부터 수신되는 실시간 상태 정보를 기초로 웹서버에 대한 모니터링을 수행하여, 장애가 감지되면, 감지된 장애의 유형을 진단하는 장애 진단부; 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 상기 진단된 장애 유형에 대응되는 제어 명령을 상기 웹서버로 전송함으로써 상기 감지된 장애에 대한 대응을 실시하는 장애 처리부; 장애 진단 및 대응에 대한 결과 정보를 생성하여 상기 관리자 단말기로 전송하는 결과 제공부; 및 상기 생성한 장애 진단 및 대응에 대한 결과 정보를 저장하는 저장부를 포함하는, 통합 관리 서버가 제공된다.On the other hand, according to another embodiment of the present invention, by performing a monitoring for the web server based on the real-time status information received from the web server, if a failure is detected, a failure diagnosis unit for diagnosing the type of the detected failure; A failure processing unit that performs a response to the detected failure by transmitting a control command corresponding to the diagnosed failure type to the web server based on a preset rule for failure diagnosis and response; A result providing unit generating and transmitting result information on the diagnosis and response to the manager terminal; And a storage unit for storing result information on the generated fault diagnosis and response.
상기 실시간 상태 정보는, 상기 웹서버에 대한 서버 리소스 정보 및 노드 리소스 정보를 포함할 수 있다.The real-time status information may include server resource information and node resource information for the web server.
상기 장애 진단부는, 상기 실시간 상태 정보와 상기 통합 관리 서버 내 미리 저장되어 있는 장애 진단 및 대응 규칙을 기반으로 분석을 실시하여 상기 감지된 장애의 유형을 진단할 수 있다.The failure diagnosis unit may diagnose the type of the detected failure by performing analysis based on the real-time status information and a failure diagnosis and response rule stored in advance in the integrated management server.
상기 장애 진단부는, 상기 실시간 상태 정보와 상기 통합 관리 서버 내 장애 진단 및 대응에 대한 결과 정보가 누적 저장되어 있는 이력 정보를 기반으로 분석을 실시하여 상기 감지된 장애의 유형을 진단할 수 있다.The failure diagnosis unit may diagnose the type of the detected failure by performing an analysis based on the real-time status information and history information in which result information for diagnosis and response of the failure in the integrated management server is accumulated and stored.
상기 장애 처리부는, 상기 진단된 장애 유형에 대한 알람 정보를 상기 관리자 단말기로 전송함으로써 상기 감지된 장애에 대한 대응을 실시할 수 있다.The failure processing unit may respond to the detected failure by transmitting alarm information for the diagnosed failure type to the manager terminal.
상기 장애 진단부는, 상기 감지된 장애의 유형을, 요청 초과 장애, 대용량 데이터베이스 데이터 조회 장애, 데이터베이스 연결 요청 초과 장애, 서비스 지연 장애, 메모리 부족 장애, 특정 서비스의 요청 초과 장애 및 정지 장애 중 어느 하나로 진단할 수 있다.The failure diagnosis unit diagnoses the type of the detected failure as one of a request exceeded failure, a large database data inquiry failure, a database connection request exceeded failure, a service delay failure, an insufficient memory failure, a request exceeded failure and a stop failure of a specific service. can do.
상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버의 가용 스레드(Thead) 사용량이 임계치를 초과한 것으로 판단되면, 요청 초과 장애로 진단하고, 상기 장애 처리부는, 상기 요청 초과 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키는 제어 명령을 상기 웹서버로 전송할 수 있다.If it is determined through the monitoring that the available thread (Thead) usage of the web server has exceeded the threshold value, the failure diagnosis unit diagnoses a request exceeded failure, and the failure processing unit detects the request exceeded failure in advance. Based on the established fault diagnosis and response rules, a control command for bypassing a user request to a temporary page may be transmitted to the web server.
상기 사용자 요청을 임시 페이지로 우회시키는 제어는, 상기 웹서버 내에서 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되어, 요청 초과 장애가 진단되면, 상기 웹서버 자체적으로 요청 초과 장애 진단 즉시 자동 수행 가능한 것을 특징으로 할 수 있다.Control to bypass the user request to a temporary page, if it is determined that the available thread usage in the web server has exceeded the threshold, and the request exceeded fault is diagnosed, the web server itself automatically performs the request exceeded fault diagnosis It can be characterized as possible.
상기 장애 진단부는, 상기 모니터링을 통해 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되면, 대용량 데이터베이스 데이터 조회 장애로 진단하고, 상기 장애 처리부는, 상기 대용량 데이터베이스 데이터 조회 장애로 판단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어 명령을 상기 웹서버로 전송할 수 있다.When the failure diagnosis unit determines that a large database data query for a service is requested from the user through the monitoring, the failure diagnosis unit diagnoses a large database data query failure, and the failure processing unit determines that the large database data query failure occurs, Based on a preset rule for diagnosis and response to a failure, a control command for forcibly terminating the corresponding service requested by the user or restricting the service by a predetermined condition may be transmitted to the web server.
상기 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어는, 상기 웹서버 내에서 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되어, 대용량 데이터베이스 데이터 조회 장애가 진단되면, 상기 웹서버 자체적으로 대용량 데이터베이스 데이터 조회 장애 진단 즉시 자동 수행 가능한 것을 특징으로 할 수 있다.The control for forcibly terminating the corresponding service requested from the user or restricting the service by a predetermined condition is determined as a request for a large database data query for the service from the user in the web server, so that the large database data search is performed. When a failure is diagnosed, the web server itself can automatically perform a large database data inquiry failure diagnosis immediately.
상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버 내 데이터베이스 연결 그룹(Pool)이 임계치를 초과하여 특정 데이터소스(Datasource)의 데이터베이스 연결이 과도하게 사용되고 있는 것으로 판단되면, 데이터베이스 연결 요청 초과 장애로 진단하고, 상기 장애 처리부는, 상기 데이터베이스 연결 요청 초과 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 상기 웹서버로 전송할 수 있다.If it is determined through the monitoring that the database connection group (Pool) in the web server exceeds a threshold and database connection of a specific data source (Datasource) is excessively used, diagnoses a database connection request excess failure. , When the failure processing unit is diagnosed as a failure exceeding the database connection request, the user request is bypassed to a temporary page or the waiting time for obtaining the corresponding database connection is enforced based on a preset rule for diagnosis and response to the failure. The control command reduced to can be transmitted to the web server.
상기 장애 진단부는, 상기 모니터링을 통해 사용자로부터 요청된 서비스의 응답이 지연되거나 사용자로부터 소정의 시간이 지연된 후에 제공되는 서비스에 대한 요청이 수신된 것으로 판단되면, 서비스 지연 장애로 진단하고, 상기 장애 처리부는, 상기 서비스 지연 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 장애가 진단된 서비스에 대한 스레드 사용률을 제한하는 제어 명령을 상기 웹서버로 전송할 수 있다.The failure diagnosis unit diagnoses a service delay failure when it is determined that a response to a service requested from a user is delayed through the monitoring or a request for a service provided after a predetermined time is delayed from the user, and the failure processing unit In the case of being diagnosed as the service delay failure, a control command for limiting the thread utilization rate for a service diagnosed with a failure may be transmitted to the web server based on a rule for diagnosis and response to a failure.
상기 장애 진단부는, 상기 모니터링을 통해 서비스 로직(Logic)의 오류 또는 시스템의 과도한 메모리 사용에 의해 메모리 부족 문제(Out Of Memory, OOM)가 발생하거나 메모리 자동 수거 현상(Full Garbage Collection, Full GC) 발생 빈도가 증가하거나 메모리 해제 불가 등의 상황이 지속적으로 발생하는 것으로 판단되면, 메모리 부족 장애로 진단하고, 상기 장애 처리부는, 상기 메모리 부족 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 덤프 생성 명령 및 서버 재기동 명령을 상기 웹서버로 전송하고 알람 정보를 상기 관리자 단말기로 전송할 수 있다.The fault diagnosis unit may cause an out of memory (OOM) or an automatic memory collection phenomenon (Full Garbage Collection, Full GC) due to an error in service logic or excessive memory use in the system through the monitoring. When it is determined that the frequency is increased or a situation such as the inability to release the memory is continuously generated, the diagnosis is made of an insufficient memory failure, and when the failure processing unit is diagnosed as the insufficient memory failure, preset failure diagnosis and response Based on the rules, a dump generation command and a server restart command may be transmitted to the web server and alarm information may be transmitted to the manager terminal.
상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버로 수신된 특정 서비스에 대한 사용자의 요청이 상기 웹서버에서 처리 가능한 한계를 초과하는 것으로 판단되면, 특정 서비스의 요청 초과 장애로 진단하고, 상기 장애 처리부는, 상기 특정 서비스의 요청 초과 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 복수의 사용자에 대한 서비스 진입이 순차적으로 이뤄지도록 하는 요청 제어 명령을 상기 웹서버로 전송하고 해당 장애 진단에 대한 알람 정보를 상기 관리자 단말기로 전송할 수 있다.When the user's request for a specific service received by the web server exceeds the limit that can be processed by the web server through the monitoring, the failure diagnosis unit diagnoses a request exceeding failure of the specific service, and the failure processing unit In the case of being diagnosed as a failure exceeding the request of the specific service, the web server issues a request control command to sequentially enter a service for a plurality of users based on a preset rule for diagnosis and response of the failure. And transmit the alarm information for the diagnosis of the failure to the manager terminal.
상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버가 기동 중인 상태임에도 아무 기능도 수행하지 못하는 정지(Hang) 상태인 것으로 판단되면, 정지 장애로 진단하고, 상기 장애 처리부는, 상기 정지 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 상기 웹서버로 덤프 생성 명령 및 서버 재기동 명령을 전송하고 상기 관리자 단말기로 해당 진단 장애에 대한 알람 정보를 전송할 수 있다.If it is determined through the monitoring that the web server is in a stopped state (Hang) that does not perform any function even though the web server is in a running state, the fault diagnosis unit diagnoses a stop fault, and the fault processing unit diagnoses the stop fault In this case, based on a preset rule for diagnosis and response to a failure, a dump generation command and a server restart command may be transmitted to the web server, and alarm information for the diagnosis failure may be transmitted to the manager terminal.
상기 결과 제공부는, 상기 장애 진단 및 대응에 대한 결과 정보를 시계열로 나열된 통계 정보 형태로 생성하여 상기 관리자 단말기로 전송할 수 있다.The result providing unit may generate result information on the diagnosis and response to the failure in the form of statistical information arranged in a time series and transmit the result information to the manager terminal.
상기 결과 제공부는, 상기 관리자 단말기로부터 수신되는 관리자의 요청 또는 미리 설정되어 있는 소정의 주기에 의해 상기 장애 진단 및 대응에 대한 결과 정보를 생성할 수 있다.The result providing unit may generate result information on the diagnosis and response to the failure by a request of an administrator received from the administrator terminal or a predetermined period.
상기 결과 제공부는, 상기 관리자 단말기로부터 소정의 검색 조건이 포함된 정보 조회 요청이 수신되면, 수신된 소정의 검색 조건에 상응하는 장애 진단 및 대응에 대한 결과 정보를 생성하여 상기 관리자 단말기로 전송할 수 있다.When the information inquiry request including the predetermined search condition is received from the administrator terminal, the result providing unit may generate result information on the diagnosis and response to the failure corresponding to the received predetermined search condition and transmit the result information to the administrator terminal. .
본 발명의 일 실시예에 따르면, 일부 장애 현상에 대한 처리가 아닌, 다양한 장애 유형을 기반으로 복합 서버 장애 진단 및 대응을 실시함으로써, 서버에서 발생 가능한 다양한 장애에 대한 예방 및 방지가 가능한 바, 서버 운용에 있어서 신뢰성 및 안정성이 확보될 수 있다.According to an embodiment of the present invention, it is possible to prevent and prevent various failures that may occur in a server by performing a complex server failure diagnosis and response based on various failure types, rather than processing for some failure phenomenon. In operation, reliability and stability can be ensured.
본 발명의 다른 실시예에 따르면, 미리 설정되어 있는 규칙 기반의 장애 진단 및 대응을 실시함으로써, 서버 장애 발생 시, 미리 설정되어 있는 규칙을 기반으로 하여 자동적으로 장애에 대한 대응이 실시되는 바, 서버 장애가 발생 즉시 극복될 수 있다.According to another embodiment of the present invention, by performing a rule-based failure diagnosis and response based on a preset rule, when a server failure occurs, a response to a failure is automatically performed based on a preset rule, the server The obstacle can be overcome immediately.
본 발명의 또 다른 실시예에 따르면, 웹서버의 리소스 정보를 기초로 서버에 대한 통합 관리 및 실시간 제어를 수행하는 바, 서버 무중단 제어가 가능하다는 장점이 있다.According to another embodiment of the present invention, the server performs integrated management and real-time control of the server based on the resource information of the web server, and thus has an advantage that server uninterrupted control is possible.
본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.It should be understood that the effects of the present invention are not limited to the above-described effects, and include all effects that can be deduced from the configuration of the invention described in the detailed description or claims of the present invention.
도 1은 본 발명의 일 실시예에 따른 장애 유형 기반의 서버 장애 진단 및 대응 시스템의 구성을 개략적으로 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 통합 관리 서버의 구성을 도시한 블록도이다.
도 3은 본 발명의 일 실시예에 따라 웹서버의 장애가 유형에 따라 진단되고, 그에 따른 대응으로 장애가 처리되는 과정을 도시한 흐름도이다.
도 4는 본 발명의 일 실시예에 따라 실시간 모니터링 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 5는 본 발명의 일 실시예에 따라 장애 진단 및 대응에 대한 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 6은 본 발명의 일 실시예에 따라 요청 초과 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 7은 본 발명의 일 실시예에 따라 대용량 데이터베이스 데이터 조회 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 8은 본 발명의 일 실시예에 따라 데이터베이스 연결 요청 초과 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 9는 본 발명의 일 실시예에 따라 서비스 지연 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 10은 본 발명의 일 실시예에 따라 메모리 부족 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 11은 본 발명의 일 실시예에 따라 특정 서비스의 요청 초과 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 12는 본 발명의 일 실시예에 따라 정지 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 13은 본 발명의 일 실시예에 따라 시계열로 나열된 통계 형태의 장애 진단 및 대응에 대한 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 14는 본 발명의 일 실시예에 따라 진단 이력 검색 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.1 is a diagram schematically showing a configuration of a system for diagnosing and responding to server failure based on a type of failure according to an embodiment of the present invention.
2 is a block diagram showing the configuration of an integrated management server according to an embodiment of the present invention.
3 is a flowchart illustrating a process in which a failure of a web server is diagnosed according to a type according to an embodiment of the present invention, and a failure is handled accordingly.
4 is a diagram illustrating a screen displayed on a manager terminal when providing real-time monitoring information according to an embodiment of the present invention.
FIG. 5 is a diagram illustrating a screen displayed on a manager terminal when providing result information on diagnosis and response to a failure according to an embodiment of the present invention.
6 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to a request exceeded fault diagnosis according to an embodiment of the present invention.
7 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to diagnosis of a large database data inquiry failure according to an embodiment of the present invention.
8 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to a diagnosis of a failure exceeding a database connection request according to an embodiment of the present invention.
9 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to a service delay failure diagnosis according to an embodiment of the present invention.
10 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to a diagnosis of a memory shortage failure according to an embodiment of the present invention.
11 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to diagnosis of a request exceeded failure of a specific service according to an embodiment of the present invention.
12 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to diagnosis of a stop disorder according to an embodiment of the present invention.
13 is a diagram illustrating a screen displayed on a manager terminal when providing result information on diagnosis and response to a failure in the form of statistics arranged in a time series according to an embodiment of the present invention.
14 is a diagram illustrating a screen displayed on a manager terminal when providing diagnosis history search result information according to an embodiment of the present invention.
이하에서는 첨부한 도면을 참조하여 본 발명을 설명하기로 한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 따라서 여기에서 설명하는 실시예로 한정되는 것은 아니다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, the present invention will be described with reference to the accompanying drawings. However, the present invention may be implemented in various different forms, and thus is not limited to the embodiments described herein. In addition, in order to clearly describe the present invention in the drawings, parts irrelevant to the description are omitted, and like reference numerals are assigned to similar parts throughout the specification.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 부재를 사이에 두고 "간접적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 구비할 수 있다는 것을 의미한다.Throughout the specification, when a part is "connected" to another part, this includes not only "directly connected" but also "indirectly connected" with another member in between. . Also, when a part “includes” a certain component, this means that other components may be further provided instead of excluding other components, unless otherwise stated.
본 명세서에서, 웹서버는, 웹서버(Web server) 또는 웹 애플리케이션 서버(Web Application Server, WAS)일 수 있으며, 단일의 서버 형태로 설명을 기재하였으나, 복수의 서버 형태로 구성될 수 있음은 물론이다. 이에 따라, 본 명세서에서, 통합 관리 서버는, 복수의 웹서버에 대한 동시 모니터링이 가능하다.In this specification, the web server may be a web server (Web server) or a web application server (Web Application Server, WAS), and has been described in the form of a single server, but may be configured as a plurality of server types. to be. Accordingly, in the present specification, the integrated management server can simultaneously monitor a plurality of web servers.
이하 첨부된 도면을 참고하여 본 발명의 실시예를 상세히 설명하기로 한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명의 일 실시예에 따른 장애 유형 기반의 서버 장애 진단 및 대응 시스템의 구성을 개략적으로 도시한 도면이다.1 is a diagram schematically showing a configuration of a system for diagnosing and responding to server failure based on a type of failure according to an embodiment of the present invention.
도 1을 참조하면, 본 발명의 일 실시예에 따른 장애 유형 기반의 서버 장애 진단 및 대응 시스템은, 사용자 단말기(100), 웹서버(200), 통합 관리 서버(300) 및 관리자 단말기(400)로 구성될 수 있다.Referring to Figure 1, the failure type based server failure diagnosis and response system according to an embodiment of the present invention, the
사용자 단말기(100), 웹서버(200), 통합 관리 서버(300) 및 관리자 단말기(400) 각각은 통신망을 통해 연결되어 있을 수 있다. 여기서, 통신망은 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 근거리 통신망(LAN: Local Area Network), 도시권 통신망(MAN: Metropolitan Area Network), 광역 통신망(WAN: Wide Area Network) 등 다양한 통신망으로 구성될 수 있다.Each of the
사용자 단말기(100) 및 관리자 단말기(400)는 휴대폰, 스마트폰, PDA(Personal Digital Assistant), PMP(Portable Multimedia Player), 태블릿 PC 등과 같이 터치 스크린 패널이 구비된 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있으며, 이 외에도 데스크탑 PC, 태블릿 PC, 랩탑 PC, 셋탑 박스를 포함하는 IPTV와 같이, 애플리케이션을 설치하고 실행할 수 있는 기반이 마련된 장치도 포함할 수 있다.The
관리자 단말기(400)는 서버 통합 관리 서비스를 제공하는 애플리케이션을 설치하여 메모리에 저장할 수 있다. 예를 들어, 관리자 단말기(400)는 각종 애플리케이션이 업로드 되어 있는 앱 스토어 서버(미도시)에 접속한 후, 모니터링 정보 조회, 장애 이력 정보 제공 등 다양한 서비스를 제공하는 서버 통합 관리 서비스 제공 애플리케이션을 다운로드 하여 설치할 수 있다.The
본 발명의 일 실시예에 따르면, 관리자 단말기(400)는 서버 통합 관리 서비스가 제공되는 웹페이지에 접속하는 사용자 단말기(100)와 동일한 장치일 수 있다.According to an embodiment of the present invention, the
사용자 단말기(100)에는 웹서버(200)로부터 제공되는 웹 서비스에 대한 인터페이스 및 화면이 제공될 수 있으며, 이를 통해 사용자로 하여금 이용하고자 하는 서비스를 선택하도록 할 수 있다.The
상기 제공한 인터페이스를 통해 사용자로부터 웹 서비스 중 어느 하나가 선택되면, 사용자 단말기(100)는 웹서버(200)로 해당 서비스 요청 신호를 전송할 수 있으며, 웹서버(200)는 이에 해당하는 웹서비스 화면 또는 인터페이스를 사용자 단말기(100)로 전송하여 사용자에게 제공할 수 있다.When any one of the web services is selected from the user through the provided interface, the
웹서버(200)는 통합 관리 서버(300)로 리소스 정보를 전송할 수 있다. 이 때, 리소스 정보는, 서버 리소스 정보 및 노드 리소스 정보를 포함하며, 리소스 정보를 통해 통합 관리 서버(300)에서는 웹서버(200)에 대한 실시간 모니터링을 실시할 수 있다. 상기 노드는, 웹서버가 설치되어 있는 물리적 장비나 컨테이너 등의 시스템을 의미할 수 있다.The
본 발명의 일 실시예에 따르면, 웹서버(200)는 사용자 단말기(100)로부터 서비스 제공 요청 신호가 수신되는 경우에 통합 관리 서버(300)로 리소스 정보를 전송하거나, 또는, 별도의 요청 신호가 수신되지 않아도 소정의 주기마다 자동으로 리소스 정보를 전송하여 실시간 모니터링이 이뤄지도록 할 수 있다.According to an embodiment of the present invention, the
통합 관리 서버(300)는 웹서버(200)로부터 수신된 리소스 정보를 기초로 실시간 모니터링을 수행할 수 있으며, 분석을 통해 장애를 진단할 수 있다.The
통합 관리 서버(300)는 미리 설정되어 있는 규칙을 기반으로 하여 웹서버(200)의 장애를 진단할 수 있으며, 진단된 장애에 대한 대응 제어를 실시할 수 있다.The
이 때, 미리 설정되어 있는 규칙은, 발생 장애에 대한 진단 유형별 대응 방법에 대한 것이며, 장애 유형 별로 대응 방법이 미리 매칭되어 있을 수 있다.At this time, the preset rule is for a diagnosis type response method for an occurrence disorder, and a response method for each type of failure may be matched in advance.
진단 유형에는, 요청 초과 진단, 대용량 데이터베이스 데이터 조회 진단, 데이터베이스 연결 요청 초과 진단, 서비스 지연 진단, 메모리 부족 진단, 특정 서비스의 요청 초과 진단 및 정지 진단이 있으며, 이에 대하여 매칭되어 있는 대응 제어 방법에는, 우회 페이지로 이동, 서비스 강제 종료, 서비스 제한 제어, 서비스 접속 제한, 알람 제공, 덤프 생성 및 서비스 재시작 제어가 포함될 수 있다.The types of diagnosis include request over-diagnosis, large database data inquiry diagnosis, database connection request over-diagnosis, service delay diagnosis, memory shortage diagnosis, request over-diagnosis and stop diagnosis of a specific service. This may include moving to the bypass page, forcibly shutting down the service, controlling service restrictions, restricting service access, providing alarms, generating dumps, and restarting services.
통합 관리 서버(300)는 진단된 장애 유형에 매칭되어 있는 대응 제어 명령을 웹서버(200)로 전송함으로써, 웹서버(200)가 장애 극복되도록 할 수 있다.The
본 발명의 일 실시예에 따르면, 요청 초과 장애 또는 대용량 데이터베이스 조회 장애의 경우, 웹서버(200) 내에서 가용 스레드(Thread) 사용량의 임계치 초과 여부를 판단하거나 사용자로부터의 서비스에 대한 대용량 데이터베이스 조회 요청 여부를 판단 가능함에 따라, 통합 관리 서버(300)의 개입 없이도, 웹서버(200) 자체적으로 상기 해당 장애가 발생한 것으로 판단되는 즉시 대응 제어를 수행할 수 있다. 이에 따라, 통합 관리 서버(300)에서 장애를 진단하고 해당 대응 제어 명령을 전송함에 따라 소요되는 시간으로 인해 장애를 대응할 수 있는 적정 시기를 놓치는 문제가 발생하지 않을 수 있다.According to an embodiment of the present invention, in the case of a request exceeding failure or a large database inquiry failure, it is determined whether the threshold of the available thread usage in the
웹서버(200)의 장애가 진단되고, 이에 대응되는 대응 제어가 실시된 경우, 통합 관리 서버(300)는 이러한 진단된 장애 유형 정보 및 그에 따라 대응한 대응 정보를 매칭하여 저장할 수 있다.When the failure of the
또한, 통합 관리 서버(300)는 실시간 모니터링 정보를 관리자 단말기(400)로 전송함으로써 관리자 단말기(400)를 통해 서버 모니터링 정보가 제공될 수 있도록 하며, 장애가 진단된 경우, 장애 진단 알림 및 장애 발생에 따른 대응 이력을 관리자 단말기(400)로 전송함으로써 관리자에게 제공할 수 있다.In addition, the
또한, 웹서버(200)가 복수인 경우, 통합 관리 서버(300)는 복수의 웹서버(200)에 대하여 선택적으로 관리자 단말기(400)에 각 서버에 대한 실시간 모니터링 정보를 제공할 수 있다.In addition, when there are
통합 관리 서버(300)는 장애 진단 및 대응 결과에 대한 보고서를 생성하여 관리자 단말기(400)로 전송할 수 있다. 이 때, 통합 관리 서버(300)는 장애 진단 및 대응 결과에 대하여 시계열로 나열된 통계 정보를 제공함으로써, 관리자로 하여금 시간 기반 장애 패턴 파악이 가능하도록 할 수 있다.The
관리자 단말기(400)는 통합 관리 서버(300)로부터 수신되는 실시간 모니터링 정보, 장애 진단 알림 정보, 장애 발생에 따른 대응 이력 정보 및 장애 진단 및 대응 결과에 대한 보고서를 디스플레이 하여 관리자에게 제공할 수 있다.The
또한, 관리자 단말기(400)는 통합 관리 서버(300)로부터 제공되는 통합 관리 서비스 제공 관련 인터페이스를 통해 사용자로부터 소정의 장애 진단 및 대응에 대한 정보 조회 요청이 입력되면, 해당 요청 정보를 통합 관리 서버(300)로 전송하여, 대응되는 정보를 제공받을 수 있다.In addition, the
도 2는 본 발명의 일 실시예에 따른 통합 관리 서버(300)의 구성을 도시한 블록도이다.2 is a block diagram showing the configuration of the
도 2를 참조하면, 본 발명의 일 실시예에 따른 통합 관리 서버(300)는 장애 진단부(310), 장애 처리부(320), 결과 제공부(330) 및 저장부(340)를 포함할 수 있다.Referring to FIG. 2, the
장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 웹서버(200)에 대한 실시간 모니터링을 수행할 수 있다.The
구체적으로, 장애 진단부(310)는 수신된 리소스 정보와 장애 진단 및 대응 결과에 대한 이력 정보 데이터를 기반으로 분석을 실시함으로써 실시간 모니터링을 수행할 수 있다.Specifically, the
장애 진단부(310)는 상기 모니터링을 통해 장애가 감지되면, 미리 설정되어 있는 소정의 장애 유형에 따라 장애를 진단할 수 있다. 이 때, 진단 가능한 소정의 장애 유형에는, 요청 초과 진단, 대용량 데이터베이스 데이터 조회 진단, 데이터베이스 연결 요청 초과 진단, 서비스 지연 진단, 메모리 부족 진단, 특정 서비스의 요청 초과 진단 및 정지 진단이 포함될 수 있다.When a failure is detected through the monitoring, the
본 발명의 일 실시예에 따르면, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 과도하게 발생한 사용자 서비스 요청으로 웹서버(200)의 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되면, 웹서버(200)에 대하여 요청 초과 장애를 진단할 수 있다.According to an embodiment of the present invention, the
본 발명의 다른 실시예에 따르면, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되면, 웹서버(200)에 대하여 대용량 데이터베이스 데이터 조회 장애를 진단할 수 있다.According to another embodiment of the present invention, the
본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 웹서버(200) 내 데이터베이스의 처리 시간 지연, 데이터베이스 잠금 상태 등에 의해 데이터베이스 연결이 과도하게 점유된 것으로 판단되면, 즉, 데이터베이스 연결 그룹(Pool)이 임계치를 초과하여 특정 데이터소스(Datasource)의 데이터베이스 연결이 과도하게 사용되고 있는 것으로 판단되면, 웹서버(200)에 대하여 데이터베이스 연결 요청 초과 장애를 진단할 수 있다.According to another embodiment of the present invention, the
본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 일시적인 네트워크, 연계시스템 문제 등으로 사용자로부터 요청된 서비스의 응답이 지연되거나, 사용자로부터 소정의 시간이 지연된 후에 제공되는 서비스에 대한 요청이 수신된 것으로 판단되면, 웹서버(200)에 대하여 서비스 지연 장애를 진단할 수 있다.According to another embodiment of the present invention, the
본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 서비스 로직(Logic)의 오류 또는 시스템의 과도한 메모리 사용에 의해 메모리 부족 문제(Out Of Memory, OOM)가 발생한 것으로 판단되면, 웹서버(200)에 대하여 메모리 부족 장애를 진단할 수 있다.According to another embodiment of the present invention, the
또한, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 메모리 자동 수거 현상(Full Garbage Collection, Full GC) 발생 빈도가 증가하거나 메모리 해제 불가 등의 상황이 지속적으로 발생하는 것으로 판단되면, 웹서버(200)에 대하여 메모리 부족 장애가 발생할 것으로 미리 진단할 수 있다.In addition, the
본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 웹서버(200)로 수신된 특정 서비스에 대한 사용자의 요청이 웹서버(200)에서 처리 가능한 한계를 초과하는 것으로 판단되면, 웹서버(200)에 대하여 특정 서비스의 요청 초과 장애를 진단할 수 있다.According to another embodiment of the present invention, the
본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)는 웹서버(200)가 기동 중인 상태임에도 아무 기능도 수행하지 못하는 정지(Hang) 상태인 것으로 판단되면, 웹서버(200)에 대하여 정지 장애를 진단할 수 있다.According to another embodiment of the present invention, if it is determined that the
장애 처리부(320)는 장애 진단부(310)를 통해 진단된 웹서버(200)에 대한 장애 유형에 대하여, 각 유형별로 매칭되어 있는 대응 제어 명령을 웹서버(200)로 전송함으로써, 웹서버(200)의 장애가 극복되도록 할 수 있다.The
다시 말해, 장애 처리부(320)는 장애 진단부(310)를 통해 장애가 진단되면, 미리 설정되어 있는 장애 진단 및 대응 규칙을 기반으로 하여 해당 진단 장애 유형에 대응되는 대응 제어 명령을 자동으로 웹서버(200)로 전송함으로써, 웹서버(200)가 발생된 장애에 대하여 자동으로 즉시 극복하도록 할 수 있다.In other words, when a failure is diagnosed through the
본 발명의 일 실시예에 따르면, 장애 진단부(310)를 통해 요청 초과 장애가 발생되었거나 발생될 것으로 진단된 경우, 장애 처리부(320)는 과도하게 발생된 사용자 요청을 임시 페이지로 우회시키는 제어 명령을 웹서버(200)로 전송함으로써, 웹서버(200)가 안정적인 상태로 유지되도록 하는 바, 장애에 대한 선대응 또는 즉시 대응을 실시할 수 있다.According to an embodiment of the present invention, when a request exceeded failure is generated or diagnosed to occur through the
장애 처리부(320)는 상기 임시 페이지로의 우회 제어 명령을 전송함에 따라, 장애 진단부(310)를 통해 웹서버(200) 가용 스레드 사용량이 임계치를 초과하지 않은 것으로 판단되면, 이 후 발생되는 사용자 요청에 대하여 더 이상 임시 페이지로 우회시키는 제어 명령을 전송하지 않을 수 있다.As the
본 발명의 다른 실시예에 따르면, 장애 진단부(310)를 통해 대용량 데이터베이스 데이터 조회 장애가 발생되었거나 발생될 것으로 진단된 경우, 장애 처리부(320)는 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어 명령을 웹서버(200)로 전송함으로써, 웹서버(200)가 안정적인 상태로 유지되도록 하는 바, 장애에 대한 선대응 또는 즉시 대응을 실시할 수 있다.According to another embodiment of the present invention, when a large database data inquiry failure has occurred or is diagnosed to occur through the
본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)를 통해 데이터베이스 연결 요청 초과 장애가 발생한 것으로 진단된 경우, 장애 처리부(320)는 발생된 사용자 요청을 임시 페이지로 우회시거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 웹서버(200)로 전송함으로써, 장애에서 격리되도록 하여 웹서버(200)가 안정적인 상태로 유지되도록 하는 바, 장애에 대한 즉각적인 대응을 실시할 수 있다.According to another embodiment of the present invention, when the database connection request exceeded failure is diagnosed through the
장애 처리부(320)는 상기 임시 페이지 우회로의 제어 명령을 전송함에 따라, 장애 진단부(310)를 통해 데이터베이스 연결 그룹이 임계치를 초과하지 않는 것으로 판단되면, 이 후 발생되는 서비스 요청에 대하여 더 이상 임시 페이지로 우회시키거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 전송하지 않을 수 있다.The
본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)를 통해 서비스 지연 장애가 발생되었거나 발생될 것으로 진단된 경우, 장애 처리부(320)는 장애가 진단된 서비스에 대한 스레드 사용률을 제한하는 제어 명령을 웹서버(200)로 전송함으로써, 통신 서비스 품질(Quality of Service, QoS)이 보장되도록 하는 바, 장애에 대한 선대응 또는 즉시 대응을 실시할 수 있다.According to another embodiment of the present invention, when a service delay failure occurs or is diagnosed to occur through the
장애 처리부(320)는 상기 스레드 사용률 제한 제어 명령을 전송함에 따라, 장애 진단부(310)를 통해 더 이상 서비스 지연 문제가 발생되지 않는 것으로 판단되면, 웹서버(200)로 스레드 사용률 제한 제어 해제 명령을 전송하여 사용률 제한 제어가 실시되지 않도록 할 수 있다.When the
본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)를 통해 메모리 부족 장애가 발생한 것으로 진단된 경우, 장애 처리부(320)는 덤프 생성 명령 및 서버 재기동 명령을 웹서버(200)로 전송하고, 장애 발생에 대한 알람 정보를 관리자 단말기(400)로 전송함으로써 장애에 대한 즉각적인 대응을 실시할 수 있다.According to another embodiment of the present invention, when it is diagnosed that a memory shortage failure has occurred through the
또한, 장애 진단부(310)를 통해 메모리 부족 장애가 발생할 것으로 미리 진단된 경우, 장애 처리부(320)는 웹서버(200)로 덤프 생성 명령을 전송하고 관리자 단말기(400)로 메모리 부족 장애 발생 가능 여부에 대한 알람을 제공함으로써, 메모리 부족 장애에 대한 선대응을 실시할 수 있다.In addition, if it is previously diagnosed that a memory shortage failure will occur through the
본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)를 통해 특정 서비스의 요청 초과 장애가 발생되었거나 발생될 것으로 진단된 경우, 장애 처리부(320)는 복수의 사용자에 대한 서비스 진입이 순차적으로 이뤄지도록 하는 요청 제어 명령을 웹서버(200)로 전송하고, 해당 장애 진단에 대한 알람 정보를 관리자 단말기(400)로 전송함으로써, 사용자의 서비스 이용에 대한 이탈이 방지되도록 하는 바, 장애에 대한 선대응 또는 즉시 대응을 실시할 수 있다.According to another embodiment of the present invention, when a request exceeding failure of a specific service is generated or diagnosed to be generated through the
본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)를 통해 정지 장애가 발생한 것으로 진단된 경우, 장애 처리부(320)는 웹서버(200)로 덤프 생성 명령 및 서버 재기동 명령을 전송하고, 관리자 단말기(400)로 해당 진단 장애에 대한 알람 정보를 전송함으로써, 웹서버(200)가 장애로부터 신속하게 복구되도록 하고, 시스템 전체의 장애 발생이 방지되도록 하는 바, 장애에 대한 즉각적인 대응을 실시할 수 있다.According to another embodiment of the present invention, when it is diagnosed that a stop failure has occurred through the
결과 제공부(330)는 웹서버(200)로부터 수신된 리소스 정보를 기초로 수행한 실시간 모니터링 정보를 관리자 단말기(400)로 전송하여 관리자에게 제공할 수 있다.The
또한, 결과 제공부(330)는 장애 진단 및 대응에 대한 결과 정보를 생성하여 관리자 단말기(400)로 전송할 수 있다.In addition, the
본 발명의 일 실시예에 따르면, 결과 제공부(330)는 장애 진단 및 대응에 대한 결과 정보를 장애 진단 일자 또는 시간 단위의 시계열 통계 정보로 생성하여 관리자 단말기(400)로 제공함으로써, 관리자로 하여금 시간 기반 장애 패턴 파악이 가능하도록 할 수 있다.According to an embodiment of the present invention, the
상기 장애 진단 및 대응에 대한 결과 정보에는, 진단 장애 유형 별 발생 원인 분석 정보, 시간에 따른 장애 진단 결과 정보, 특정일에 대한 장애 진단 및 대응 이력 정보 등이 포함될 수 있다.The result information on the diagnosis and response to the disorder may include analysis information on the cause of occurrence of each diagnosis type, information on the result of the diagnosis of the disorder over time, and information on the diagnosis and response on the specific date.
결과 제공부(330)는 장애 진단 및 대응 결과 정보를 관리자 단말기(400)로부터 수신되는 관리자 요청에 의해 생성하여 제공하거나, 미리 설정된 소정의 주기마다 자동으로 생성하여 제공할 수 있다.The
저장부(340)는 결과 제공부(330)에서 생성된 장애 진단 및 대응 결과 정보를 저장함으로써, 생성된 장애 진단 및 대응 결과 정보가 추후 실시간 모니터링에 따른 장애 진단을 위한 분석에 활용될 수 있도록 하며, 이를 통해 장애 진단부(310)로 하여금 유기적 또는 종합적인 분석이 가능하도록 할 수 있다.The
또한, 저장부(340)는 상기 장애 진단 및 대응 결과 정보를 저장함으로써, 관리자 단말기(400)로부터 장애 진단 및 대응에 대한 이력 정보 조회 요청 시, 요청된 조건에 대응되는 이력 정보가 제공되도록 할 수 있다.In addition, the
도 3은 본 발명의 일 실시예에 따라 웹서버(200)의 장애가 유형에 따라 진단되고, 그에 따른 대응으로 장애가 처리되는 과정을 도시한 흐름도이다.3 is a flowchart illustrating a process in which a failure of the
먼저, 웹서버(200)는 통합 관리 서버(300)로 서버 리소스 정보 및 노드 리소스 정보를 포함하는 리소스 정보를 전송함으로써 웹서버(200)에 대한 실시간 상태 정보를 전송할 수 있다(S301).First, the
통합 관리 서버(300)는 웹서버(200)로부터 수신된 실시간 상태 정보, 즉, 리소스 정보를 기초로 실시간 모니터링을 실시할 수 있다(S302).The
통합 관리 서버(300)는 모니터링 시 장애가 감지되면, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 유형별 장애 진단을 수행할 수 있다(S303). 이 때, 유형별 장애 진단은 서버 내 저장되어 있는 장애 진단 및 대응 결과 정보를 기초로 하는 유기적 또는 종합적 분석에 따라 실시될 수 있다.When a failure is detected during monitoring, the
장애 유형이 진단되면, 통합 관리 서버(300)는 상기 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 진단된 장애 유형에 대응되는 제어 명령을 웹서버(200)로 전송함으로써, 진단된 장애에 대한 대응 처리를 수행할 수 있다(S304).When the fault type is diagnosed, the
본 발명의 일 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 과도하게 발생한 서비스 요청으로 웹서버(200)의 가용 스레드 사용량이 임계치를 초과한 것으로 판단되면, 요청 초과 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 과도하게 발생된 사용자 요청을 임시 페이지로 우회시키는 제어 명령을 웹서버(200)로 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to an embodiment of the present invention, the
예를 들어, 웹서버(200)에 사용자로부터 대량 서비스 요청이 수신되면, 통합 관리 서버(300)가 웹서버(200)로 임시 페이지 우회 명령을 전송함에 따라, 웹서버(200)는 해당 사용자에게 임시 페이지를 제공함으로써, 요청 초과 장애가 발생하지 않도록 하거나 또는 발생된 요청 초과 장애를 신속하게 극복할 수 있다.For example, when a mass service request is received from a user to the
진단 장애에 대한 대응 실시 후, 웹서버(200)의 가용 스레드 사용량이 하회하여 임계치를 초과하지 않는 것으로 판단되면, 통합 관리 서버(300)는 상기 임시 페이지 우회 제어 명령을 웹서버(200)로 전송하지 않을 수 있다.After the response to the diagnosis failure, if it is determined that the available thread usage of the
상기 요청 초과 장애의 경우, 통합 관리 서버(300)뿐만 아니라 웹서버(200)에서도 사용자로부터의 대량 서비스 요청이 미리 설정된 가용 스레드 사용량 임계치를 초과하는지 여부를 판단할 수 있음에 따라, 웹서버(200)에서 사용자로부터의 대량 서비스 요청이 미리 설정된 가용 스레드 사용량 임계치를 초과하는 것으로 판단되면, 웹서버(200)는 통합 관리 서버(300)로부터 임시 페이지 우회 명령을 수신하지 않고도, 웹서버(200) 자체적으로 해당 사용자에게 임시 페이지를 제공함으로써, 요청 초과 장애가 발생하지 않도록 하거나 또는 발생된 요청 초과 장애가 보다 신속하게 극복되도록 할 수 있다.In the case of the request exceeding failure, the
본 발명의 다른 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되면, 대용량 데이터베이스 데이터 조회 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어 명령을 웹서버(200)로 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to another embodiment of the present invention, the
예를 들어, 특정 사용자가 서비스에 대한 대용량 데이터베이스 데이터 조회를 요청함에 따라 웹서버(200)의 대량 메모리가 사용되는 것으로 판단되면, 통합 관리 서버(300)가 웹서버(200)로 서비스 강제 종료 명령을 전송함에 따라, 웹서버(200)는 상기 사용자로부터 요청된 서비스를 강제로 종료시킴으로써, 대용량 데이터베이스 데이터 조회 장애가 발생하지 않도록 하거나 또는 발생된 대용량 데이터베이스 데이터 조회 장애를 신속하게 극복할 수 있다.For example, if it is determined that a large amount of memory of the
상기 대용량 데이터베이스 데이터 조회 장애의 경우, 통합 관리 서버(300)뿐만 아니라 웹서버(200)에서도 사용자로부터의 대용량 데이터베이스 데이터 조회 요청이 미리 설정된 조회 요청수의 임계치를 초과하는지 여부를 판단할 수 있음에 따라, 웹서버(200)에서 사용자로부터의 대용량 데이터베이스 데이터 조회 요청이 미리 설정된 조회 요청수의 임계치를 초과하는 것으로 판단되면, 웹서버(200)는 통합 관리 서버(300)로부터 제어 명령을 수신하지 않고도, 웹서버(200) 자체적으로 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 제어함으로써, 진단된 장애에 대한 대응을 보다 신속하게 극복할 수 있다.In the case of the large-capacity database data inquiry failure, as well as the
본 발명의 또 다른 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 웹서버(200) 내 데이터베이스의 처리 시간 지연, 데이터베이스 잠금 상태 등에 의해 데이터베이스 연결이 과도하게 점유된 것으로 판단되면, 즉, 데이터베이스 연결 그룹이 임계치를 초과하여 특정 데이터소스의 데이터베이스 연결이 과도하게 사용되고 있는 것으로 판단되면, 데이터베이스 연결 요청 초과 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 발생된 사용자 요청을 임시 페이지로 우회시키거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 웹서버(200)로 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to another embodiment of the present invention, if the
진단 장애에 대한 대응 실시 후, 데이터베이스 연결 그룹이 하회하여 임계치를 초과하지 않는 것으로 판단되면, 통합 관리 서버(300)는 상기 임시 페이지 우회 제어 명령이나 해당 데이터베이스 연결 획득 대기시간 강제 단축 제어 명령을 웹서버(200)로 전송하지 않을 수 있다.After performing the response to the diagnosis failure, if it is determined that the database connection group does not exceed the threshold value, the
본 발명의 또 다른 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 일시적인 네트워크, 연계시스템 문제 등으로 사용자로부터 요청된 서비스의 응답이 지연되거나, 사용자로부터 소정의 시간이 지연된 후에 제공되는 서비스에 대한 요청이 수신된 것으로 판단되면, 서비스 지연 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 장애가 진단된 서비스에 대한 스레드 사용률을 제한하는 제어 명령을 웹서버(200)로 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to another embodiment of the present invention, the
진단 장애에 대한 대응 실시 후, 서비스 지연 문제가 발생되지 않는 것으로 판단되면, 통합 관리 서버(300)는 웹서버(200)로 스레드 사용률 제한 제어 해제 명령을 전송하여 사용률 제한 제어가 실시되지 않도록 할 수 있다.After the response to the diagnosis failure, if it is determined that the service delay problem does not occur, the
본 발명의 또 다른 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 서비스 로직의 오류 또는 시스템의 과도한 메모리 사용에 의해 메모리 부족 문제가 발생한 것으로 판단되면, 메모리 부족 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 덤프 생성 명령 및 서버 재기동 명령을 웹서버(200)로 전송하고, 장애 발생에 대한 알람 정보를 관리자 단말기(400)로 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to another embodiment of the present invention, if the
또한, 통합 관리 서버(300)는 실시간 모니터링을 통해 메모리 자동 수거 현상 발생 빈도가 증가하거나 메모리 해제 불가 등의 상황이 지속적으로 발생하는 것으로 판단되면, 웹서버(200)에 대하여 메모리 부족 장애가 발생할 것으로 미리 진단하여, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 웹서버(200)로 덤프 생성 명령을 전송하고 관리자 단말기(400)로 메모리 부족 장애 발생 가능 여부에 대한 알람을 제공함으로써, 진단된 장애에 대한 선대응을 실시할 수 있다.In addition, if it is determined that the frequency of occurrence of an automatic memory collection phenomenon increases or a memory release cannot be continuously performed through real-time monitoring, the
본 발명의 또 다른 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 웹서버(200)로 수신된 특정 서비스에 대한 사용자의 요청이 웹서버(200)에서 처리 가능한 한계를 초과하는 것으로 판단되면, 특정 서비스의 요청 초과 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 복수의 사용자에 대한 서비스 진입이 순차적으로 이뤄지도록 하는 요청 제어 명령을 웹서버(200)로 전송하고, 해당 장애 진단에 대한 알람 정보를 관리자 단말기(400)로 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to another embodiment of the present invention, the
본 발명의 또 다른 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 웹서버(200)가 기동 중인 상태임에도 아무 기능도 수행하지 못하는 정지(Hang) 상태인 것으로 판단되면, 정지 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 웹서버(200)로 덤프 생성 명령 및 서버 재기동 명령을 전송하고, 관리자 단말기(400)로 해당 진단 장애에 대한 알람 정보를 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to another embodiment of the present invention, if the
통합 관리 서버(300)는 장애 진단 및 대응 결과 정보를 서버 내에 저장할 수 있으며, 관리자로부터 수신되는 요청 또는 미리 설정되어 있는 소정의 주기에 의해 결과 정보를 생성하여 관리자 단말기(400)로 제공할 수 있다(S305).The
이 때, 장애 진단 및 대응 결과 정보는 시간 또는 날짜 단위에 따라 시계열로 나열된 형태의 정보로 생성 및 제공될 수 있다.At this time, the diagnosis and response result information of the failure may be generated and provided in the form of information arranged in time series according to time or date units.
또한, 상기 생성 및 저장된 장애 진단 및 대응 결과 정보는 추후 실시되는 실시간 모니터링 또는 장애 진단 시 분석 자료로 이용될 수 있다.In addition, the generated and stored fault diagnosis and response result information may be used as real-time monitoring or analysis data when fault diagnosis is performed later.
도 4는 본 발명의 일 실시예에 따라 실시간 모니터링 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.4 is a diagram illustrating a screen displayed on the
먼저, 도 4에 도시된 바와 같이, 통합 관리 서버(300)는 관리자 단말기(400)로 웹서버(200)에 대한 실시간 모니터링 정보 확인 및 통합 관리가 가능하도록 하는 화면 또는 인터페이스를 제공할 수 있다.First, as shown in FIG. 4, the
통합 관리 서버(300)는 장애 진단 및 대응에 대한 결과 정보가 생성되면, 관리자 단말기(400)로 알람(401)을 제공할 수 있으며, 관리자에 의해 알람(401)이 선택되면, 관리자 단말기(400)는 통합 관리 서버(300)에서 생성된 장애 진단 및 대응에 대한 결과 정보의 목록(402)을 디스플레이 하여 제공할 수 있다.The
생성된 장애 진단 및 대응에 대한 결과 정보 중 어느 하나(403)가 관리자에 의해 선택되면, 관리자 단말기(400)는 해당 장애 진단 및 대응에 대한 결과 정보를 디스플레이 하여 제공하는데, 이에 대해서는 도 5에서 상세하게 설명하기로 한다.If any one of the generated result information for the diagnosis and response to the
관리자로부터 알람 이력 정보 제공에 대한 실행창(404)이 선택 입력되면, 관리자 단말기(400)는 통합 관리 서버(300)로부터 제공된 알람 이력 정보(405)를 디스플레이 하여 제공할 수 있다. 이 때, 알람 이력 정보는 최근 1개월 이내의 이력 정보에 대해서만 제공될 수 있다.When the
관리자 단말기(400)는 통합 관리 서버(300)로부터 제공되는 실시간 모니터링 화면을 통해 복수의 서버 및 노드에 대한 요약 정보(406)를 디스플레이 하여 관리자에게 제공할 수 있다.The
또한, 관리자 단말기(400)는 실시간 모니터링 화면을 통해 복수의 웹서버(200) 각각에 대한 상세 정보(407)를 제공할 수 있다.In addition, the
도 5는 본 발명의 일 실시예에 따라 장애 진단 및 대응에 대한 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.5 is a diagram illustrating a screen displayed on the
도 5에 도시된 바와 같이, 장애 진단 및 대응에 대한 결과 정보는 공통 정보(501), 진단 결과 정보(502) 및 상세 정보(503)로 구분되어 제공될 수 있다.As illustrated in FIG. 5, the result information for diagnosis and response to a failure may be provided by being divided into
특히, 진단 결과 정보(502)를 통해 시간대 별 진단 결과 확인이 가능하며, 특정 진단 시점에 대한 상세 정보(503)가 제공됨에 따라 진단 별 상세 내용 확인이 가능하다.In particular, the diagnosis result information can be checked for each time zone through the
구체적으로, 공통 정보(501)에는 장애가 감지된 최초 시간인 진단 수행 시간(Start Time), 장애가 감지된 마지막 시간인 진단 종료 시간(End Time), 장애가 발생한 총 횟수인 동일 진단 반복 횟수 정보(Total Diagnostics Repeat Count), 장애 진단 및 대응에 대한 결과 정보가 생성된 횟수인 결과 정보 생성 횟수 정보(Total Report Creation Count)가 포함될 수 있다.Specifically, the
본 발명의 일 실시예에 따르면, 통합 관리 서버(300)는 진단된 장애 유형이 동일한 유형이라고 판단되면, 최대 3건까지만 결과 정보를 생성하여, 다수의 동일한 결과 정보가 생성됨을 방지할 수 있다. 반면, 진단된 장애 유형이 동일하지 않은 유형이라고 판단되면, 통합 관리 서버(300)는 최대 100건의 결과 정보를 생성할 수 있다.According to an embodiment of the present invention, if it is determined that the diagnosed failure type is the same type, the
따라서, 공통 정보(501)를 통해, 관리자 입장에서는 동일 진단 반복 횟수 정보가 결과 정보 생성 횟수 정보 보다 큰 경우, 동일한 장애 진단이 다수 발생했다는 것을 판단할 수 있다.Therefore, through the
한편, 진단 결과 정보(502)는 장애가 진단된 시간 순으로 나열되어 제공될 수 있으며, 진단 시간에 따라 발생된 장애 유형이 색상으로 별도 표기되어 제공될 수 있다.Meanwhile, the
제공된 복수의 진단 결과 정보(502) 중 어느 하나가 선택되면, 선택된 진단 결과에 대한 상세 정보(503)가 제공될 수 있다.If any one of the plurality of provided
상세 정보(503)에는 장애 진단 시간 정보(504), 덤프 생성 시간 정보(505), 생성된 덤프 파일(506) 및 진단된 장애 유형에 대한 대응 정보(507)가 공통으로 포함되어 제공될 수 있다.The
도 6은 본 발명의 일 실시예에 따라 요청 초과 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.6 is a diagram illustrating a screen displayed on the
도 6에 도시된 바와 같이, 요청 초과 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 진단 시 사용된 임계값 정보(601), 임계값을 초과한 커넥터(Connector) 별 실제 사용률 정보(602) 및 장애 진단 시 다수 요청된 5건에 대한 서비스 정보(603)가 더 포함되어 제공될 수 있다.As illustrated in FIG. 6, when providing the result information according to the request exceeded fault diagnosis, the
이 때, 장애 진단 시 다수 요청된 5건에 대한 서비스 정보(603)에는 서비스 명칭과 서비스 별 평균 호출 횟수 정보가 포함되어 있을 수 있으며, 평균 호출 횟수 정보는, 5초 간격으로 3회 측정하여 산출된 평균 횟수일 수 있다.At this time, the
도 7은 본 발명의 일 실시예에 따라 대용량 데이터베이스 데이터 조회 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.7 is a diagram illustrating a screen displayed on the
도 7에 도시된 바와 같이, 대용량 데이터베이스 데이터 조회 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 진단 시 사용된 임계값 정보(701) 및 대용량 데이터베이스 데이터를 조회 요청한 서비스의 목록(702)이 더 포함되어 제공될 수 있다.As shown in FIG. 7, when providing the result information according to the diagnosis of a large database data query failure, the
도 8은 본 발명의 일 실시예에 따라 데이터베이스 연결 요청 초과 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.8 is a diagram illustrating a screen displayed on the
도 8에 도시된 바와 같이, 데이터베이스 연결 요청 초과 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 진단 시 사용된 임계값 정보(801) 및 데이터베이스 연결 그룹 사용량이 임계값을 초과한 데이터소스 및 데이터소스 별 사용률 정보(802)가 더 포함되어 제공될 수 있다.As illustrated in FIG. 8, when providing the result information according to the diagnosis of a database connection request exceeded failure, the
도 9는 본 발명의 일 실시예에 따라 서비스 지연 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.9 is a diagram illustrating a screen displayed on the
도 9에 도시된 바와 같이, 서비스 지연 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 진단 시 사용된 임계값 정보(901) 및 서비스 지연 목록(902)이 더 포함되어 제공될 수 있다.As illustrated in FIG. 9, when providing the result information according to the service delay failure diagnosis, the
이 때, 서비스 지연 목록(902)에는 서비스 명칭, 장애 진단 시점에 수행중인 서비스의 총 개수, 서비스 총 개수 대비 서비스 지연으로 판단된 서비스 개수, 장애 진단 시점 기준의 서비스 수행 시간 정보 등이 포함되어 제공될 수 있다.At this time, the
도 10은 본 발명의 일 실시예에 따라 메모리 부족 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.10 is a diagram illustrating a screen displayed on the
도 10에 도시된 바와 같이, 메모리 부족 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 메모리 부족 장애에 대한 세부 항목 정보(101)가 더 포함되어 제공될 수 있다.As illustrated in FIG. 10, when providing the result information according to the diagnosis of insufficient memory failure, the
메모리 부족 장애에 대한 세부 항목 정보(101)에는, Heap 사용률, 메모리 자동 수거 현상 빈도, Leak 여부, 대용량 데이터베이스 데이터 조회 요청 여부 및 heap dump 생성 시 파일명 정보 등이 포함되어 제공될 수 있다.The
도 11은 본 발명의 일 실시예에 따라 특정 서비스의 요청 초과 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.11 is a diagram illustrating a screen displayed on the
도 11에 도시된 바와 같이, 특정 서비스의 요청 초과 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 진단 시 사용된 임계값 정보(111), 대상 서비스가 과점유한 커넥터(Connector) 정보(112) 및 다수 수행된 서비스 5건에 대한 목록(113)이 더 포함되어 제공될 수 있다.As illustrated in FIG. 11, when providing result information according to a request exceeding fault diagnosis of a specific service, the
이 때, 다수 수행된 서비스 5건에 대한 목록(113)에는 서비스 명칭과 서비스 요청된 횟수 정보가 포함되어 제공될 수 있다.At this time, the
도 12는 본 발명의 일 실시예에 따라 정지 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.12 is a diagram illustrating a screen displayed on the
도 12에 도시된 바와 같이, 정지 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 연결 타임아웃 시간 정보 및 재시도 횟수 정보(121)가 더 포함되어 제공될 수 있다.As illustrated in FIG. 12, when providing the result information according to the diagnosis of the stop disorder, the
도 13은 본 발명의 일 실시예에 따라 시계열로 나열된 통계 형태의 장애 진단 및 대응에 대한 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.13 is a diagram illustrating a screen displayed on the
도 13에 도시된 바와 같이, 관리자 단말기(400)는 통합 관리 서버(300)로부터 제공된 날짜 기준의 시계열로 나열된 형태의 연간 장애 진단 결과(131)를 디스플레이 하여 관리자에게 제공할 수 있으며, 관리자에 의해 특정일이 선택되면(132), 선택된 날짜에 발생된 진단 결과가 시간 기준으로 나열된 형태의 결과 정보(133)를 디스플레이 하여 제공할 수 있다.As shown in FIG. 13, the
도 14는 본 발명의 일 실시예에 따라 진단 이력 검색 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.14 is a diagram illustrating a screen displayed on the
관리자는 관리자 단말기(400)를 통해 조회하고자 하는 웹서버(200)의 장애 진단 요약 정보 및 장애 진단 및 대응에 대한 결과 정보를 검색할 수 있다(141).The administrator may search the summary information of the failure diagnosis of the
이 때, 장애 진단 및 대응에 대한 결과 정보는 통합 관리 서버(300)에 7일간 보관되며, 7일 이후에 생성된 결과 정보는 자동으로 삭제될 수 있다.At this time, the result information for the diagnosis and response to the failure is stored in the
관리자에 의해 장애가 진단된 날짜 중 어느 하나가 선택되면(142), 관리자 단말기(400)는 해당 날짜에 생성된 장애 진단 및 대응에 대한 결과 정보 목록(143)을 디스플레이 하여 제공할 수 있다.When any one of the dates in which the failure is diagnosed by the administrator is selected (142), the
이와 같이, 본 발명의 일 실시예에 따르면, 일부 장애 현상에 대한 처리가 아닌, 다양한 장애 유형을 기반으로 복합 서버 장애 진단 및 대응을 실시함으로써, 서버에서 발생 가능한 다양한 장애에 대한 예방 및 방지가 가능한 바, 서버 운용에 있어서 신뢰성 및 안정성이 확보될 수 있다.As described above, according to an embodiment of the present invention, it is possible to prevent and prevent various failures that may occur in a server by performing a complex server failure diagnosis and response based on various failure types, rather than processing for some failure phenomenon. Bar and reliability can be secured in server operation.
본 발명의 다른 실시예에 따르면, 미리 설정되어 있는 규칙 기반의 장애 진단 및 대응을 실시함으로써, 서버 장애 발생 시, 미리 설정되어 있는 규칙을 기반으로 하여 자동적으로 장애에 대한 대응이 실시되는 바, 서버 장애가 발생 즉시 극복될 수 있다.According to another embodiment of the present invention, by performing a rule-based failure diagnosis and response based on a preset rule, when a server failure occurs, a response to a failure is automatically performed based on a preset rule, the server The obstacle can be overcome immediately.
본 발명의 또 다른 실시예에 따르면, 웹서버의 리소스 정보를 기초로 서버에 대한 통합 관리 및 실시간 제어를 수행하는 바, 서버 무중단 제어가 가능하다는 장점이 있다.According to another embodiment of the present invention, the server performs integrated management and real-time control of the server based on the resource information of the web server, and thus has an advantage that server uninterrupted control is possible.
본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.It should be understood that the effects of the present invention are not limited to the above-described effects, and include all effects that can be deduced from the configuration of the invention described in the detailed description or claims of the present invention.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.The above description of the present invention is for illustration only, and those skilled in the art to which the present invention pertains can understand that the present invention can be easily modified into other specific forms without changing the technical spirit or essential features of the present invention. will be. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive. For example, each component described as a single type may be implemented in a distributed manner, and similarly, components described as distributed may be implemented in a combined form.
본 발명의 범위는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is indicated by the following claims, and all modifications or variations derived from the meaning and scope of the claims and their equivalent concepts should be interpreted to be included in the scope of the present invention.
100 : 사용자 단말기
200 : 웹서버
300 : 통합 관리 서버
310 : 장애 진단부
320 : 장애 처리부
330 : 결과 제공부
340 : 저장부
400 : 관리자 단말기100: user terminal
200: web server
300: integrated management server
310: disability diagnosis unit
320: fault handling unit
330: result providing unit
340: storage unit
400: administrator terminal
Claims (36)
(a) 웹서버로부터 수신되는 실시간 상태 정보를 기초로 웹서버에 대한 모니터링을 수행하여, 장애가 감지되면, 감지된 장애의 유형을 진단하는 단계;
(b) 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 상기 진단된 장애 유형에 대응되는 제어 명령을 상기 웹서버로 전송함으로써 상기 웹서버가 상기 제어 명령에 따라 상기 감지된 장애에 대한 선대응 또는 즉시대응을 자동으로 실시하도록 제어하는 단계; 및
(c) 장애 진단 및 대응에 대한 결과 정보를 생성하여 저장하고, 생성한 결과 정보를 관리자 단말기로 전송하는 단계를 포함하고,
상기 (a) 단계는,
상기 웹서버에 대한 서버 리소스 정보 및 노드 리소스 정보를 포함하는 상기 실시간 상태 정보와 상기 장애 진단 및 대응에 대한 규칙을 기반으로 분석을 실시하여, 상기 감지된 장애의 유형을 요청 초과 장애, 대용량 데이터베이스 데이터 조회 장애, 데이터베이스 연결 요청 초과 장애, 서비스 지연 장애, 메모리 부족 장애, 특정 서비스의 요청 초과 장애 및 정지 장애 중 어느 하나로 진단하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
A method for the integrated management server to diagnose and respond to a server failure based on the type of failure,
(a) performing monitoring on the web server based on real-time status information received from the web server, and if a failure is detected, diagnosing the type of the detected failure;
(b) the web server transmits a control command corresponding to the diagnosed fault type to the web server based on a preset rule for diagnosis and response of the fault, so that the web server responds to the detected fault according to the control command. Controlling to automatically perform a line response or an immediate response; And
(c) generating and storing result information for diagnosis and response to the failure, and transmitting the generated result information to the manager terminal,
Step (a) is,
Analysis based on the real-time status information including the server resource information and the node resource information for the web server and the rules for diagnosing and responding to the failure, requesting the detected type of failure exceeded failure, large-capacity database data A method of diagnosing and responding to a server failure based on a type of failure, comprising diagnosing one of a query failure, a database connection request exceeded failure, a service delay failure, an out-of-memory failure, and a request for a particular service.
상기 (c) 단계는,
동일한 유형으로 진단된 장애에 대한 상기 장애 진단 및 대응에 대한 결과 정보의 생성 개수를 기설정 개수 이하로 제한하는 단계를 더 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Step (c) is,
A method of diagnosing and responding to a server failure based on a failure type, further comprising the step of limiting the number of generations of result information on the failure diagnosis and response to a failure diagnosed with the same type to a preset number or less.
상기 장애 진단 및 대응에 대한 결과 정보는
상기 장애가 감지된 최초 시간을 나타내는 진단 수행 시간, 상기 장애가 감지된 마지막 시간을 나타내는 진단 종료 시간, 상기 진단된 장애 유형과 동일한 유형의 장애가 발생한 총 횟수를 나타내는 동일 진단 반복 횟수 정보 및 장애 진단 및 대응에 대한 결과 정보가 생성된 총 횟수를 나타내는 결과 정보 생성 횟수 정보를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Result information on the diagnosis and response to the disorder
Diagnosis execution time indicating the first time the failure was detected, diagnosis end time indicating the last time the failure was detected, the same diagnosis repetition number information indicating the total number of occurrences of the same type of fault as the diagnosed fault type, and fault diagnosis and response A method for diagnosing and responding to a server failure based on a type of failure, including information on the number of result information generated indicating the total number of times the result information has been generated.
상기 (a) 단계는,
상기 실시간 상태 정보와 상기 통합 관리 서버 내 장애 진단 및 대응에 대한 결과 정보가 누적 저장되어 있는 이력 정보를 기반으로 분석을 실시하여 상기 감지된 장애의 유형을 진단하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Step (a) is,
And analyzing a diagnosis based on the real-time status information and history information in which result information for diagnosis and response of the failure in the integrated management server is accumulated, and diagnosing the detected type of the failure. How to diagnose and respond to server failures.
상기 (b) 단계는,
상기 진단된 장애 유형에 대한 알람 정보를 상기 관리자 단말기로 전송함으로써 상기 감지된 장애에 대한 대응을 실시하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Step (b) is,
And performing a response to the detected failure by sending the alarm information for the diagnosed failure type to the manager terminal.
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 상기 웹서버의 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되면, 요청 초과 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키는 제어 명령을 상기 웹서버로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
When it is determined through the monitoring that the available thread usage of the web server exceeds a threshold, the request is diagnosed as a failure, and the user request is temporarily based on a preset failure diagnosis and response rule. And transmitting a control command to bypass the page to the web server.
상기 사용자 요청을 임시 페이지로 우회시키는 제어는,
상기 웹서버 내에서 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되어, 요청 초과 장애가 진단되면, 상기 웹서버 자체적으로 요청 초과 장애 진단 즉시 자동 수행 가능한 것을 특징으로 하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
The method of claim 7,
Control to bypass the user request to a temporary page,
When it is determined that the usage of available threads in the web server exceeds a threshold, and a request exceeded fault is diagnosed, the web server itself can automatically perform a request exceeded fault diagnosis, which is based on a fault type based server fault How to diagnose and respond.
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되면, 대용량 데이터베이스 데이터 조회 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어 명령을 상기 웹서버로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
When it is determined through the monitoring that a large database data query for the service is requested from the user, the large database data query is diagnosed as a failure, and the request requested by the user is based on a preset rule for diagnosis and response to the failure. A method of diagnosing and responding to a server failure based on a type of failure, comprising the step of forcibly terminating the service or transmitting a control command to limit the service by a predetermined condition to the web server.
상기 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어는,
상기 웹서버 내에서 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되어, 대용량 데이터베이스 데이터 조회 장애가 진단되면, 상기 웹서버 자체적으로 대용량 데이터베이스 데이터 조회 장애 진단 즉시 자동 수행 가능한 것을 특징으로 하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
The method of claim 9,
The control for forcibly terminating the corresponding service requested from the user or for restricting the service by a predetermined condition,
When it is determined that a large database data inquiry for a service is requested from a user in the web server, and a large database data inquiry failure is diagnosed, the web server itself can automatically perform a large database data inquiry failure diagnosis immediately Type-based server failure diagnosis and response method.
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 상기 웹서버 내 데이터베이스 연결 그룹(Pool)이 임계치를 초과하여 특정 데이터소스(Datasource)의 데이터베이스 연결이 과도하게 사용되고 있는 것으로 판단되면, 데이터베이스 연결 요청 초과 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 상기 웹서버로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
When it is determined through the monitoring that the database connection group (Pool) in the web server exceeds the threshold and database connection of a specific data source is excessively used, it is diagnosed as a failure exceeding the database connection request, and is set in advance. Based on the rules for diagnosis and response to a failure, the method comprising a type of failure-based server, comprising: sending a control command to the web server to bypass a user request to a temporary page or forcibly reduce a waiting time for obtaining a corresponding database connection. Disability Diagnosis and Response Methods.
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 사용자로부터 요청된 서비스의 응답이 지연되거나 사용자로부터 소정의 시간이 지연된 후에 제공되는 서비스에 대한 요청이 수신된 것으로 판단되면, 서비스 지연 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 장애가 진단된 서비스에 대한 스레드 사용률을 제한하는 제어 명령을 상기 웹서버로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
When it is determined through the monitoring that a response to a service requested from a user is delayed or a request for a service provided after a predetermined time is delayed from the user, it is diagnosed as a service delay failure, and a preset failure diagnosis and response Based on the rule for, comprising the step of transmitting a control command for limiting the thread usage rate for the service diagnosed with a failure to the web server, the failure type based server failure diagnosis and response method.
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 서비스 로직(Logic)의 오류 또는 시스템의 과도한 메모리 사용에 의해 메모리 부족 문제(Out Of Memory, OOM)가 발생하거나 메모리 자동 수거 현상(Full Garbage Collection, Full GC) 발생 빈도가 증가하거나 메모리 해제 불가의 상황이 지속적으로 발생하는 것으로 판단되면, 메모리 부족 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 덤프 생성 명령 및 서버 재기동 명령을 상기 웹서버로 전송하고, 알람 정보를 상기 관리자 단말기로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
Through the monitoring, out of memory (OOM) occurs due to errors in service logic or excessive memory use in the system, or the frequency of occurrence of full garbage collection (full GC) increases or memory If it is determined that the situation of non-cancellation occurs continuously, it diagnoses as an out-of-memory failure, and transmits a dump generation command and a server restart command to the web server based on a preset rule for diagnosis and response to a failure. And transmitting the alarm information to the manager terminal.
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 상기 웹서버로 수신된 특정 서비스에 대한 사용자의 요청이 상기 웹서버에서 처리 가능한 한계를 초과하는 것으로 판단되면, 특정 서비스의 요청 초과 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 복수의 사용자에 대한 서비스 진입이 순차적으로 이뤄지도록 하는 요청 제어 명령을 상기 웹서버로 전송하고, 해당 장애 진단에 대한 알람 정보를 상기 관리자 단말기로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
When it is determined through the monitoring that a user request for a specific service received by the web server exceeds a limit that can be processed by the web server, it is diagnosed as a request exceeding failure of a specific service, and diagnoses and responds to a preset failure. And transmitting a request control command for sequentially entering service for a plurality of users to the web server based on a rule for, and transmitting alarm information for the diagnosis of the failure to the manager terminal. , Failure type based server failure diagnosis and response method.
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 상기 웹서버가 기동 중인 상태임에도 아무 기능도 수행하지 못하는 정지(Hang) 상태인 것으로 판단되면, 정지 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 상기 웹서버로 덤프 생성 명령 및 서버 재기동 명령을 전송하고, 상기 관리자 단말기로 해당 진단 장애에 대한 알람 정보를 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
If it is determined through the monitoring that the web server is in a stopped state that does not perform any function even though it is in the running state, it is diagnosed as a stopped fault and based on the rules for preset fault diagnosis and response, And sending a dump generation command and a server restart command to the web server, and transmitting alarm information for a corresponding diagnosis fault to the manager terminal.
상기 (c) 단계는,
상기 장애 진단 및 대응에 대한 결과 정보를 시계열로 나열된 통계 정보 형태로 생성하여 상기 관리자 단말기로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Step (c) is,
And generating the result information on the diagnosis and response in the form of statistical information arranged in a time series and transmitting the result to the manager terminal.
상기 (c) 단계는,
상기 관리자 단말기로부터 수신되는 관리자의 요청 또는 미리 설정되어 있는 소정의 주기에 의해 상기 장애 진단 및 대응에 대한 결과 정보를 생성하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Step (c) is,
And generating result information for the diagnosis and response to the failure at the request of the administrator received from the administrator terminal or a predetermined period of time.
상기 (c) 단계는,
상기 관리자 단말기로부터 소정의 검색 조건이 포함된 정보 조회 요청이 수신되면, 수신된 소정의 검색 조건에 상응하는 장애 진단 및 대응에 대한 결과 정보를 생성하여 상기 관리자 단말기로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Step (c) is,
When the request for information inquiry including a predetermined search condition is received from the manager terminal, generating and transmitting result information on the diagnosis and response to the failure corresponding to the received predetermined search condition, and transmitting the result information to the manager terminal. Type-based server failure diagnosis and response method.
미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 상기 진단된 장애 유형에 대응되는 제어 명령을 상기 웹서버로 전송함으로써 상기 웹서버가 상기 제어 명령에 따라 상기 감지된 장애에 대한 선대응 또는 즉시대응을 자동으로 실시하도록 제어하는 장애 처리부;
장애 진단 및 대응에 대한 결과 정보를 생성하여 관리자 단말기로 전송하는 결과 제공부; 및
상기 생성한 장애 진단 및 대응에 대한 결과 정보를 저장하는 저장부를 포함하고,
상기 장애 진단부는,
상기 웹서버에 대한 서버 리소스 정보 및 노드 리소스 정보를 포함하는 상기 실시간 상태 정보와 상기 장애 진단 및 대응에 대한 규칙을 기반으로 분석을 실시하여, 상기 감지된 장애의 유형을 요청 초과 장애, 대용량 데이터베이스 데이터 조회 장애, 데이터베이스 연결 요청 초과 장애, 서비스 지연 장애, 메모리 부족 장애, 특정 서비스의 요청 초과 장애 및 정지 장애 중 어느 하나로 진단하는, 통합 관리 서버.
A failure diagnosis unit that performs monitoring on the web server based on real-time status information received from the web server, and detects a type of the detected failure when a failure is detected;
The web server responds in advance to the detected failure according to the control command by transmitting a control command corresponding to the diagnosed fault type to the web server based on a preset rule for fault diagnosis and response. A failure processing unit that controls to perform an immediate response automatically;
A result providing unit generating and transmitting result information on the diagnosis and response to the manager terminal; And
It includes a storage unit for storing the result information for the generated diagnosis and response to the failure,
The disorder diagnosis unit,
Analysis based on the real-time status information including the server resource information and the node resource information for the web server and the rules for diagnosing and responding to the failure, requesting the detected type of failure exceeded failure, large-capacity database data An integrated management server that diagnoses any one of inquiry failure, database connection request exceeded failure, service delay failure, insufficient memory failure, specific service request exceeded failure and stop failure.
상기 결과 제공부는,
동일한 유형으로 진단된 장애에 대한 상기 장애 진단 및 대응에 대한 결과 정보의 생성 개수를 기설정 개수 이하로 제한하는, 통합 관리 서버.
The method of claim 19,
The result providing unit,
An integrated management server that limits the number of generations of result information for the diagnosis and response to the diagnosis of a failure diagnosed with the same type to a preset number or less.
상기 장애 진단 및 대응에 대한 결과 정보는
상기 장애가 감지된 최초 시간을 나타내는 진단 수행 시간, 상기 장애가 감지된 마지막 시간을 나타내는 진단 종료 시간, 상기 진단된 장애 유형과 동일한 유형의 장애가 발생한 총 횟수를 나타내는 동일 진단 반복 횟수 정보 및 장애 진단 및 대응에 대한 결과 정보가 생성된 총 횟수를 나타내는 결과 정보 생성 횟수 정보를 포함하는, 통합 관리 서버.
The method of claim 19,
Result information on the diagnosis and response to the disorder
Diagnosis execution time indicating the first time the failure was detected, diagnosis end time indicating the last time the failure was detected, the same diagnosis repetition number information indicating the total number of occurrences of the same type of fault as the diagnosed fault type, and fault diagnosis and response Integrated management server including result information generation number information indicating the total number of times the result information is generated.
상기 장애 진단부는,
상기 실시간 상태 정보와 상기 통합 관리 서버 내 장애 진단 및 대응에 대한 결과 정보가 누적 저장되어 있는 이력 정보를 기반으로 분석을 실시하여 상기 감지된 장애의 유형을 진단하는, 통합 관리 서버.
The method of claim 19,
The disorder diagnosis unit,
An integrated management server that diagnoses the type of the detected failure by performing an analysis based on the real-time status information and history information in which result information for diagnosis and response of failures in the integrated management server is accumulated.
상기 장애 처리부는,
상기 진단된 장애 유형에 대한 알람 정보를 상기 관리자 단말기로 전송함으로써 상기 감지된 장애에 대한 대응을 실시하는, 통합 관리 서버.
The method of claim 19,
The failure processing unit,
An integrated management server that responds to the detected failure by sending alarm information for the diagnosed failure type to the manager terminal.
상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버의 가용 스레드(Thead) 사용량이 임계치를 초과한 것으로 판단되면, 요청 초과 장애로 진단하고,
상기 장애 처리부는, 상기 요청 초과 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키는 제어 명령을 상기 웹서버로 전송하는, 통합 관리 서버.
The method of claim 19,
The failure diagnosis unit diagnoses as a request exceeded failure when it is determined that the usage amount of the available thread (Thead) of the web server exceeds a threshold through the monitoring,
The failure processing unit, when diagnosed as the request exceeded failure, based on the rules for the preset failure diagnosis and response, transmits a control command to bypass the user request to a temporary page, the integrated management server.
상기 사용자 요청을 임시 페이지로 우회시키는 제어는,
상기 웹서버 내에서 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되어, 요청 초과 장애가 진단되면, 상기 웹서버 자체적으로 요청 초과 장애 진단 즉시 자동 수행 가능한 것을 특징으로 하는, 통합 관리 서버.
The method of claim 25,
Control to bypass the user request to a temporary page,
If it is determined that the available thread usage in the web server exceeds a threshold, and a request exceeded fault is diagnosed, the web server itself can automatically perform a request exceeded fault diagnosis immediately, integrated management server.
상기 장애 진단부는, 상기 모니터링을 통해 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되면, 대용량 데이터베이스 데이터 조회 장애로 진단하고,
상기 장애 처리부는, 상기 대용량 데이터베이스 데이터 조회 장애로 판단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어 명령을 상기 웹서버로 전송하는, 통합 관리 서버.
The method of claim 19,
When it is determined that a query for a large amount of database data for a service is requested from a user through the monitoring, the failure diagnosis unit diagnoses a failure in a large amount of database data inquiry,
When it is determined that the large-capacity database data inquiry failure is determined, the failure processing unit forcibly terminates the corresponding service requested from the user or performs a service under a predetermined condition based on a preset rule for diagnosis and response to the failure. An integrated management server that transmits control commands to be restricted to the web server.
상기 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어는,
상기 웹서버 내에서 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되어, 대용량 데이터베이스 데이터 조회 장애가 진단되면, 상기 웹서버 자체적으로 대용량 데이터베이스 데이터 조회 장애 진단 즉시 자동 수행 가능한 것을 특징으로 하는, 통합 관리 서버.
The method of claim 27,
The control for forcibly terminating the corresponding service requested from the user or for restricting the service by a predetermined condition,
When it is determined that a large database data inquiry for a service is requested from a user within the web server, and a large database data inquiry failure is diagnosed, the web server itself can automatically perform a large database data inquiry failure diagnosis immediately and is integrated. Management server.
상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버 내 데이터베이스 연결 그룹(Pool)이 임계치를 초과하여 특정 데이터소스(Datasource)의 데이터베이스 연결이 과도하게 사용되고 있는 것으로 판단되면, 데이터베이스 연결 요청 초과 장애로 진단하고,
상기 장애 처리부는, 상기 데이터베이스 연결 요청 초과 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 상기 웹서버로 전송하는, 통합 관리 서버.
The method of claim 19,
If it is determined through the monitoring that the database connection group (Pool) in the web server exceeds a threshold and database connection of a specific data source (Datasource) is excessively used, diagnoses a database connection request excess failure. ,
When the failure processing unit is diagnosed as a failure exceeding the database connection request, the user request is bypassed to a temporary page or the waiting time for obtaining the corresponding database connection is forcibly based on a preset rule for diagnosis and response to the failure. An integrated management server that transmits a control command to reduce to the web server.
상기 장애 진단부는, 상기 모니터링을 통해 사용자로부터 요청된 서비스의 응답이 지연되거나 사용자로부터 소정의 시간이 지연된 후에 제공되는 서비스에 대한 요청이 수신된 것으로 판단되면, 서비스 지연 장애로 진단하고,
상기 장애 처리부는, 상기 서비스 지연 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 장애가 진단된 서비스에 대한 스레드 사용률을 제한하는 제어 명령을 상기 웹서버로 전송하는, 통합 관리 서버.
The method of claim 19,
The failure diagnosis unit diagnoses a service delay failure when it is determined that a response to a service requested from a user is delayed through the monitoring or a request for a service provided after a predetermined time is delayed from the user,
The failure processing unit, when diagnosed as the service delay failure, transmits a control command for limiting the thread usage rate for the service diagnosed with the failure to the web server, based on a preset rule for diagnosing and responding to the failure. , Integrated management server.
상기 장애 진단부는, 상기 모니터링을 통해 서비스 로직(Logic)의 오류 또는 시스템의 과도한 메모리 사용에 의해 메모리 부족 문제(Out Of Memory, OOM)가 발생하거나 메모리 자동 수거 현상(Full Garbage Collection, Full GC) 발생 빈도가 증가하거나 메모리 해제 불가 등의 상황이 지속적으로 발생하는 것으로 판단되면, 메모리 부족 장애로 진단하고,
상기 장애 처리부는, 상기 메모리 부족 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 덤프 생성 명령 및 서버 재기동 명령을 상기 웹서버로 전송하고 알람 정보를 상기 관리자 단말기로 전송하는, 통합 관리 서버.
The method of claim 19,
The fault diagnosis unit may cause an out of memory (OOM) or an automatic memory collection phenomenon (Full Garbage Collection, Full GC) due to an error in service logic or excessive memory use in the system through the monitoring. If it is judged that the frequency increases or the situation such as the inability to release the memory occurs continuously, it is diagnosed as insufficient memory,
The failure processing unit, when diagnosed as the memory shortage failure, transmits a dump generation command and a server restart command to the web server based on a preset rule for fault diagnosis and response, and sends alarm information to the manager terminal. To the integrated management server.
상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버로 수신된 특정 서비스에 대한 사용자의 요청이 상기 웹서버에서 처리 가능한 한계를 초과하는 것으로 판단되면, 특정 서비스의 요청 초과 장애로 진단하고,
상기 장애 처리부는, 상기 특정 서비스의 요청 초과 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 복수의 사용자에 대한 서비스 진입이 순차적으로 이뤄지도록 하는 요청 제어 명령을 상기 웹서버로 전송하고 해당 장애 진단에 대한 알람 정보를 상기 관리자 단말기로 전송하는, 통합 관리 서버.
The method of claim 19,
The failure diagnosis unit diagnoses a request exceeded failure of a specific service when it is determined that a user request for a specific service received through the monitoring exceeds a limit that can be processed by the web server,
The failure processing unit, when diagnosed as a failure exceeding the request of the specific service, based on a preset rule for failure diagnosis and response, requests control commands for sequentially entering services for a plurality of users Integrated management server that transmits to the web server and transmits the alarm information for the diagnosis of the failure to the manager terminal.
상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버가 기동 중인 상태임에도 아무 기능도 수행하지 못하는 정지(Hang) 상태인 것으로 판단되면, 정지 장애로 진단하고,
상기 장애 처리부는, 상기 정지 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 상기 웹서버로 덤프 생성 명령 및 서버 재기동 명령을 전송하고 상기 관리자 단말기로 해당 진단 장애에 대한 알람 정보를 전송하는, 통합 관리 서버.
The method of claim 19,
If it is determined through the monitoring that the web server is in a stopped state that cannot perform any function even though the web server is in a running state, the fault diagnosis unit diagnoses a stop fault,
The failure processing unit, when diagnosed as the stop failure, transmits a dump generation command and a server restart command to the web server based on a preset rule for diagnosis and response to a failure, and the diagnosis failure to the manager terminal Integrated management server, to send alarm information about.
상기 결과 제공부는,
상기 장애 진단 및 대응에 대한 결과 정보를 시계열로 나열된 통계 정보 형태로 생성하여 상기 관리자 단말기로 전송하는, 통합 관리 서버.
The method of claim 19,
The result providing unit,
An integrated management server that generates result information for the diagnosis and response to the failure in the form of statistical information arranged in a time series and transmits it to the manager terminal.
상기 결과 제공부는,
상기 관리자 단말기로부터 수신되는 관리자의 요청 또는 미리 설정되어 있는 소정의 주기에 의해 상기 장애 진단 및 대응에 대한 결과 정보를 생성하는, 통합 관리 서버.
The method of claim 19,
The result providing unit,
Integrated management server that generates the result information for the diagnosis and response to the failure by a predetermined period set in advance or the request of the administrator received from the manager terminal.
상기 결과 제공부는,
상기 관리자 단말기로부터 소정의 검색 조건이 포함된 정보 조회 요청이 수신되면, 수신된 소정의 검색 조건에 상응하는 장애 진단 및 대응에 대한 결과 정보를 생성하여 상기 관리자 단말기로 전송하는, 통합 관리 서버.The method of claim 19,
The result providing unit,
When an information inquiry request including a predetermined search condition is received from the manager terminal, the integrated management server generates and transmits result information for diagnosis and response to a failure corresponding to the received predetermined search condition.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180131810A KR102109536B1 (en) | 2018-10-31 | 2018-10-31 | Method for diagnosing and handling obstacle of server based on obstacle type |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180131810A KR102109536B1 (en) | 2018-10-31 | 2018-10-31 | Method for diagnosing and handling obstacle of server based on obstacle type |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200049028A KR20200049028A (en) | 2020-05-08 |
KR102109536B1 true KR102109536B1 (en) | 2020-05-28 |
Family
ID=70677777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180131810A KR102109536B1 (en) | 2018-10-31 | 2018-10-31 | Method for diagnosing and handling obstacle of server based on obstacle type |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102109536B1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102540221B1 (en) * | 2022-05-04 | 2023-06-08 | 오픈마루 주식회사 | A method for guiding the performance problems of middleware constituting the micro-service architecture and for guiding the problem-solving process |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101545215B1 (en) | 2013-10-30 | 2015-08-18 | 삼성에스디에스 주식회사 | system and method for automatically manageing fault events of data center |
JP2016206703A (en) | 2015-04-15 | 2016-12-08 | インテリジェントウィルパワー株式会社 | Virtual machine management system |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160132698A (en) * | 2015-05-11 | 2016-11-21 | 삼성에스디에스 주식회사 | Apparatus and method of intelligent system diagnosis |
KR101971013B1 (en) * | 2016-12-13 | 2019-04-22 | 나무기술 주식회사 | Cloud infra real time analysis system based on big date and the providing method thereof |
-
2018
- 2018-10-31 KR KR1020180131810A patent/KR102109536B1/en active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101545215B1 (en) | 2013-10-30 | 2015-08-18 | 삼성에스디에스 주식회사 | system and method for automatically manageing fault events of data center |
JP2016206703A (en) | 2015-04-15 | 2016-12-08 | インテリジェントウィルパワー株式会社 | Virtual machine management system |
Also Published As
Publication number | Publication date |
---|---|
KR20200049028A (en) | 2020-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11868237B2 (en) | Intelligent services for application dependency discovery, reporting, and management tool | |
US10922083B2 (en) | Determining problem dependencies in application dependency discovery, reporting, and management tool | |
US11966324B2 (en) | Discovery crawler for application dependency discovery, reporting, and management tool | |
US7937623B2 (en) | Diagnosability system | |
US9369356B2 (en) | Conducting a diagnostic session for monitored business transactions | |
US11221854B2 (en) | Dependency analyzer in application dependency discovery, reporting, and management tool | |
US20230251955A1 (en) | Intelligent services and training agent for application dependency discovery, reporting, and management tool | |
US20050055673A1 (en) | Automatic database diagnostic monitor architecture | |
US7376682B2 (en) | Time model | |
US11675692B2 (en) | Testing agent for application dependency discovery, reporting, and management tool | |
WO2016188100A1 (en) | Information system fault scenario information collection method and system | |
CN111382023A (en) | Code fault positioning method, device, equipment and storage medium | |
US11169896B2 (en) | Information processing system | |
KR102109536B1 (en) | Method for diagnosing and handling obstacle of server based on obstacle type | |
WO2020264319A1 (en) | Determining problem dependencies in application dependency discovery, reporting, and management tool | |
CN112463883A (en) | Reliability monitoring method, device and equipment based on big data synchronization platform | |
CN116680165A (en) | Interface performance testing method, device and equipment | |
CN115982049A (en) | Abnormity detection method and device in performance test and computer equipment | |
CN114356764A (en) | Software debugging method, device, equipment, system and medium | |
WO2022105685A1 (en) | Memory management method and device for optical transmission device, and storage medium | |
CN110225543B (en) | Mobile terminal software quality situation perception system and method based on network request data | |
CN116048859B (en) | Distributed database fault diagnosis method and device, electronic equipment and storage medium | |
CN114138522A (en) | Micro-service fault recovery method and device, electronic equipment and medium | |
CN117827587A (en) | Database abnormal node determination method, apparatus, device, medium and program product | |
KR20230085610A (en) | Detection and Recovery of Deadlocks In Database Management System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |