KR102109536B1 - Method for diagnosing and handling obstacle of server based on obstacle type - Google Patents

Method for diagnosing and handling obstacle of server based on obstacle type Download PDF

Info

Publication number
KR102109536B1
KR102109536B1 KR1020180131810A KR20180131810A KR102109536B1 KR 102109536 B1 KR102109536 B1 KR 102109536B1 KR 1020180131810 A KR1020180131810 A KR 1020180131810A KR 20180131810 A KR20180131810 A KR 20180131810A KR 102109536 B1 KR102109536 B1 KR 102109536B1
Authority
KR
South Korea
Prior art keywords
failure
diagnosis
response
web server
server
Prior art date
Application number
KR1020180131810A
Other languages
Korean (ko)
Other versions
KR20200049028A (en
Inventor
민병석
국주영
서경석
심상식
이승룡
Original Assignee
주식회사 엘지씨엔에스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘지씨엔에스 filed Critical 주식회사 엘지씨엔에스
Priority to KR1020180131810A priority Critical patent/KR102109536B1/en
Publication of KR20200049028A publication Critical patent/KR20200049028A/en
Application granted granted Critical
Publication of KR102109536B1 publication Critical patent/KR102109536B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0246Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols
    • H04L41/0253Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols using browsers or web-pages for accessing management information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

본 발명의 일 실시예에 따르면, 통합 관리 서버가, 장애 유형을 기반으로 하여 서버 장애를 진단하고 대응하는 방법에 있어서, (a) 웹서버로부터 수신되는 실시간 상태 정보를 기초로 웹서버에 대한 모니터링을 수행하여, 장애가 감지되면, 감지된 장애의 유형을 진단하는 단계; (b) 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 상기 진단된 장애 유형에 대응되는 제어 명령을 상기 웹서버로 전송함으로써 상기 감지된 장애에 대한 대응을 실시하는 단계; 및 (c) 장애 진단 및 대응에 대한 결과 정보를 생성하여 저장하고, 생성한 결과 정보를 상기 관리자 단말기로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법이 제공된다.According to an embodiment of the present invention, in a method for an integrated management server to diagnose and respond to a server failure based on a type of failure, (a) monitoring for the web server based on real-time status information received from the web server Performing, if a failure is detected, diagnosing the type of the detected failure; (b) performing a response to the detected failure by transmitting a control command corresponding to the diagnosed failure type to the web server on the basis of a rule for diagnosis and response to the failure; And (c) generating and storing the result information on the diagnosis and response to the failure, and transmitting the generated result information to the manager terminal.

Description

장애 유형 기반의 서버 장애 진단 및 대응 방법{METHOD FOR DIAGNOSING AND HANDLING OBSTACLE OF SERVER BASED ON OBSTACLE TYPE}METHOD FOR DIAGNOSING AND HANDLING OBSTACLE OF SERVER BASED ON OBSTACLE TYPE}

본 발명은 장애 유형 기반의 서버 장애 진단 및 대응 방법에 관한 것으로, 더욱 상세하게는, 서버에서 발생되는 복합 장애가 유형에 따라 진단되고, 진단된 장애에 대하여 미리 설정되어 있는 규칙 기반으로 대응 제어가 자동 실시되도록 함으로써, 진단 장애에 대한 자동적 선대응 또는 즉시대응이 가능하도록 하여 장애 예방 및 방지가 가능함에 따라, 웹서버로 하여금 효율적으로 장애 상황을 극복할 수 있도록 하는 방법에 관한 것이다.The present invention relates to a method for diagnosing and responding to a server failure based on a failure type, and more specifically, a complex failure occurring in a server is diagnosed according to a type, and response control is automatically performed based on a preset rule for the diagnosed failure. By implementing it, it is possible to automatically pre- respond or immediately respond to a diagnosis failure, thereby preventing and preventing the failure, and thus to a method of enabling the web server to effectively overcome the failure situation.

일반적으로, 웹서버 또는 웹 애플리케이션 서버는 서버 이용자가 급증하는 등의 경우에도 장애 없이 웹서비스를 제공할 수 있어야 한다.In general, a web server or a web application server should be able to provide web services without failure even in the case of a rapid increase in server users.

하지만, 서버 운용 중 장애가 발생하지 않는 것은 불가능하며, 이에 따라 서버를 실시간으로 모니터링 하여 발생되는 장애를 감지하고 이에 대한 신속한 대응을 실시함으로써, 장애 발생으로 인한 서버 운용의 문제가 최소화될 수 있도록 하는 기술 개발의 노력이 지속되고 있다.However, it is impossible to prevent a failure during server operation. Accordingly, by monitoring the server in real time, it detects a failure that occurs and promptly responds to it, thereby minimizing the problem of server operation due to failure. Development efforts are continuing.

웹서버 또는 웹 애플리케이션 서버의 경우, 서버에서 발생한 단순한 장애라고 할지라도 이 장애들이 복합적으로 연결되면 서버 전체가 웹 서비스를 제공할 수 없는 서비스 불능이라는 심각한 문제가 발생할 수도 있다.In the case of a web server or a web application server, even if it is a simple failure occurring in the server, if these failures are connected in a complex manner, a serious problem may arise that the entire server cannot provide a web service.

하지만, 기존의 서버 장애 감지 및 해결 프로세스의 경우, 소수 장애 유형만을 진단하며, 진단에 따른 대응에 대해서도, 장애 발생 알람 제공, 서버 재시작 등의 기본적인 대응 기능만을 제공한다.However, in the case of the existing server failure detection and resolution process, only a small number of failure types are diagnosed, and only the basic response functions such as providing a failure alarm and restarting the server are provided for the response according to the diagnosis.

다시 말해, 기존의 서버 장애 진단 및 대응 프로세스는 알람 제공 등의 이미 발생한 장애에 대한 기본적인 대응 처리만을 실시하기 때문에 다양한 서버 장애 유형에 대한 대응이 어려우며, 선제적으로 서버에 대한 문제를 진단하고 그에 대한 대응을 미리 하여 서버 장애 발생을 예방하는 방식이 아니기 때문에, 서버 전체의 서비스 불능과 같은 심각한 서버 장애에 대해서는 근본적인 대응이 불가능하다는 단점이 있다.In other words, the existing server failure diagnosis and response process only handles basic response to an already occurring failure such as providing an alarm, making it difficult to respond to various server failure types, and proactively diagnosing and resolving problems with the server. Since it is not a method to prevent the occurrence of a server failure by responding in advance, there is a disadvantage in that it is impossible to fundamentally respond to a serious server failure such as inability to service the entire server.

따라서, 서버에서 발생할 수 있는 다양한 주요 유형별 장애에 대한 즉각적 대응이 가능하며, 더 크고 복잡한 장애상황으로 장애가 전파되기 이전에 자동적으로 장애 진단 및 선대응 또한 가능하도록 하여, 웹서버의 장애가 효율적으로 극복되도록 하며, 사용자에게는 장애가 최소화된 웹서비스를 제공할 수 있도록 하는 기술 개발에 대한 요구가 점차 증대되고 있으며, 상술한 문제점을 해결하기 위한 방안이 시급한 실정이다.Therefore, it is possible to immediately respond to various major types of failures that can occur in the server, and to automatically diagnose and respond to failures before they are propagated to larger and more complex failure situations, so that the failure of the web server can be effectively overcome. In addition, there is an increasing demand for technology development to provide a web service with minimal obstacles to users, and an urgent need is to solve the above-mentioned problems.

본 발명은 전술한 종래기술의 문제점을 해결하기 위한 것으로, 서버에 대한 일부 장애 현상 처리가 아닌 다양한 장애 유형 기반으로 복합 장애 진단 및 대응 제어를 실시함으로써 다양하게 발생되는 서버 장애에 대한 예방 및 방지가 가능하도록 하는 것을 그 목적으로 한다.The present invention is to solve the above-mentioned problems of the prior art, and prevents and prevents various server failures caused by various failure diagnosis and response control based on various failure types rather than processing some failures on the server. Its purpose is to make it possible.

본 발명은 단순한 유형의 장애들이 복합적으로 연결되어 더 크고 복잡한 장애 상황으로 전파됨으로서, 서버 전체가 서비스 불능에 빠지는 것을 예방할 수 있도록 장애를 진단하고 선대응하는 것을 그 목적으로 한다.The present invention aims at diagnosing and responding to a failure so that the entire server can be prevented from becoming out of service by simply connecting the types of failures and spreading them to a larger and more complicated failure situation.

본 발명의 목적들은 이상에서 언급한 목적들로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.The objects of the present invention are not limited to the objects mentioned above, and other objects not mentioned will be clearly understood from the following description.

상술한 목적을 달성하기 위한 본 발명의 일 실시예에 따르면, 통합 관리 서버가, 장애 유형을 기반으로 하여 서버 장애를 진단하고 대응하는 방법에 있어서, (a) 웹서버로부터 수신되는 실시간 상태 정보를 기초로 웹서버에 대한 모니터링을 수행하여, 장애가 감지되면, 감지된 장애의 유형을 진단하는 단계; (b) 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 상기 진단된 장애 유형에 대응되는 제어 명령을 상기 웹서버로 전송함으로써 상기 감지된 장애에 대한 대응을 실시하는 단계; 및 (c) 장애 진단 및 대응에 대한 결과 정보를 생성하여 저장하고, 생성한 결과 정보를 상기 관리자 단말기로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법이 제공된다.According to an embodiment of the present invention for achieving the above object, the integrated management server, in the method of diagnosing and responding to a server failure based on the type of failure, (a) real-time status information received from the web server Performing monitoring on the web server as a basis, and if a failure is detected, diagnosing the type of the detected failure; (b) performing a response to the detected failure by transmitting a control command corresponding to the diagnosed failure type to the web server on the basis of a rule for diagnosis and response to the failure; And (c) generating and storing the result information on the diagnosis and response to the failure, and transmitting the generated result information to the manager terminal.

상기 실시간 상태 정보는, 상기 웹서버에 대한 서버 리소스 정보 및 노드 리소스 정보를 포함할 수 있다.The real-time status information may include server resource information and node resource information for the web server.

상기 (a) 단계는, 상기 실시간 상태 정보와 상기 통합 관리 서버 내 미리 저장되어 있는 장애 진단 및 대응 규칙을 기반으로 분석을 실시하여 상기 감지된 장애의 유형을 진단하는 단계를 포함할 수 있다.The step (a) may include diagnosing the type of the detected failure by performing an analysis based on the real-time status information and a failure diagnosis and response rule stored in advance in the integrated management server.

상기 (a) 단계는, 상기 실시간 상태 정보와 상기 통합 관리 서버 내 장애 진단 및 대응에 대한 결과 정보가 누적 저장되어 있는 이력 정보를 기반으로 분석을 실시하여 상기 감지된 장애의 유형을 진단하는 단계를 포함할 수 있다.The step (a) is to diagnose the type of the detected failure by performing an analysis based on the history information in which the real-time status information and the result information on the diagnosis and response to the failure in the integrated management server are accumulated and stored. It can contain.

상기 (b) 단계는, 상기 진단된 장애 유형에 대한 알람 정보를 상기 관리자 단말기로 전송함으로써 상기 감지된 장애에 대한 대응을 실시하는 단계를 포함할 수 있다.The step (b) may include performing a response to the detected failure by sending alarm information for the diagnosed failure type to the manager terminal.

상기 (a) 단계는, 상기 감지된 장애의 유형을, 요청 초과 장애, 대용량 데이터 베이스 데이터 조회 장애, 데이터베이스 연결 요청 초과 장애, 서비스 지연 장애, 메모리 부족 장애, 특정 서비스의 요청 초과 장애 및 정지 장애 중 어느 하나로 진단하는 단계를 포함할 수 있다.In step (a), the type of the detected failure is a request exceeding failure, a large database data inquiry failure, a database connection request exceeding failure, a service delay failure, an insufficient memory failure, a request exceeding failure and a stopping failure of a specific service. And diagnosing with any one.

상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 상기 웹서버의 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되면, 요청 초과 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키는 제어 명령을 상기 웹서버로 전송하는 단계를 포함할 수 있다.In the steps (a) and (b), when it is determined through the monitoring that the available thread usage of the web server exceeds a threshold, the request is diagnosed as a failure, and the diagnosis and response are set in advance. On the basis of the rules for, it may include transmitting a control command to bypass the user request to a temporary page to the web server.

상기 사용자 요청을 임시 페이지로 우회시키는 제어는, 상기 웹서버 내에서 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되어, 요청 초과 장애가 진단되면, 상기 웹서버 자체적으로 요청 초과 장애 진단 즉시 자동 수행 가능한 것을 특징으로 할 수 있다.Control to bypass the user request to a temporary page, if it is determined that the available thread usage in the web server has exceeded the threshold, and the request exceeded fault is diagnosed, the web server itself automatically performs the request exceeded fault diagnosis It can be characterized as possible.

상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되면, 대용량 데이터베이스 데이터 조회 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어 명령을 상기 웹서버로 전송하는 단계를 포함할 수 있다.In the steps (a) and (b), when it is determined that a large database data query for a service is requested from the user through the monitoring, the large database data query is diagnosed as a failure, and a preset failure diagnosis and response is determined. Based on the rule, it may include the step of forcibly terminating the corresponding service requested from the user or transmitting a control command to limit the service by a predetermined condition to the web server.

상기 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어는, 상기 웹서버 내에서 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되어, 대용량 데이터베이스 데이터 조회 장애가 진단되면, 상기 웹서버 자체적으로 대용량 데이터베이스 데이터 조회 장애 진단 즉시 자동 수행 가능한 것을 특징으로 할 수 있다.The control for forcibly terminating the corresponding service requested from the user or restricting the service by a predetermined condition is determined as a request for a large database data query for the service from the user in the web server, so that the large database data search is performed. When a failure is diagnosed, the web server itself can automatically perform a large database data inquiry failure diagnosis immediately.

상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 상기 웹서버 내 데이터베이스 연결 그룹(Pool)이 임계치를 초과하여 특정 데이터소스(Datasource)의 데이터베이스 연결이 과도하게 사용되고 있는 것으로 판단되면, 데이터베이스 연결 요청 초과 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 상기 웹서버로 전송하는 단계를 포함할 수 있다.In the steps (a) and (b), if it is determined through the monitoring that the database connection group (Pool) in the web server exceeds a threshold, database connection of a specific data source is excessively used, database connection Diagnose as a request exceeded failure, and send a control command to bypass the user request to a temporary page or forcibly reduce the waiting time for acquiring the corresponding database connection to the web server, based on the rules for diagnosing and responding to the failure. It may include the steps.

상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 사용자로부터 요청된 서비스의 응답이 지연되거나 사용자로부터 소정의 시간이 지연된 후에 제공되는 서비스에 대한 요청이 수신된 것으로 판단되면, 서비스 지연 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 장애가 진단된 서비스에 대한 스레드 사용률을 제한하는 제어 명령을 상기 웹서버로 전송하는 단계를 포함할 수 있다.Steps (a) and (b) may cause a service delay failure if it is determined that a response to a service requested from the user is delayed through the monitoring or a request for a service provided after a predetermined time is delayed from the user. Diagnosing, and based on a predetermined rule for diagnosis and response to the failure, may include transmitting a control command to the web server to limit the thread usage rate for the service diagnosed with the failure.

상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 서비스 로직(Logic)의 오류 또는 시스템의 과도한 메모리 사용에 의해 메모리 부족 문제(Out Of Memory, OOM)가 발생하거나 메모리 자동 수거 현상(Full Garbage Collection, Full GC) 발생 빈도가 증가하거나 메모리 해제 불가의 상황이 지속적으로 발생하는 것으로 판단되면, 메모리 부족 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 덤프 생성 명령 및 서버 재기동 명령을 상기 웹서버로 전송하고, 알람 정보를 상기 관리자 단말기로 전송하는 단계를 포함할 수 있다.In the above steps (a) and (b), out of memory (OOM) occurs due to an error in service logic or excessive use of the system through the monitoring, or an automatic memory collection phenomenon (Full Garbage) Collection, Full GC) If the frequency of occurrence increases or it is determined that a situation in which the memory cannot be released is continuously generated, it is diagnosed as an out-of-memory failure, and a dump generation command is based on the rules for diagnosing and responding to the failure. And transmitting a server restart command to the web server and transmitting alarm information to the manager terminal.

상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 상기 웹서버로 수신된 특정 서비스에 대한 사용자의 요청이 상기 웹서버에서 처리 가능한 한계를 초과하는 것으로 판단되면, 특정 서비스의 요청 초과 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 복수의 사용자에 대한 서비스 진입이 순차적으로 이뤄지도록 하는 요청 제어 명령을 상기 웹서버로 전송하고, 해당 장애 진단에 대한 알람 정보를 상기 관리자 단말기로 전송하는 단계를 포함할 수 있다.In the steps (a) and (b), if it is determined that a user request for a specific service received through the monitoring to the web server exceeds a limit that can be processed by the web server, a request exceeding failure of the specific service may result. Diagnosis, and transmits a request control command to the web server to sequentially enter the service for a plurality of users based on the rules for diagnosis and response to a preset failure, and alarm information for the diagnosis of the failure. It may include the step of transmitting to the administrator terminal.

상기 (a) 및 (b) 단계는, 상기 모니터링을 통해 상기 웹서버가 기동 중인 상태임에도 아무 기능도 수행하지 못하는 정지(Hang) 상태인 것으로 판단되면, 정지 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 상기 웹서버로 덤프 생성 명령 및 서버 재기동 명령을 전송하고, 상기 관리자 단말기로 해당 진단 장애에 대한 알람 정보를 전송하는 단계를 포함할 수 있다.In the steps (a) and (b), if it is determined through the monitoring that the web server is in a running state that does not perform any function even though it is in a running state, it is diagnosed as a stopping fault, and a preset fault The method may include transmitting a dump generation command and a server restart command to the web server based on the rules for diagnosis and response, and transmitting alarm information for the corresponding diagnosis failure to the manager terminal.

상기 (c) 단계는, 상기 장애 진단 및 대응에 대한 결과 정보를 시계열로 나열된 통계 정보 형태로 생성하여 상기 관리자 단말기로 전송하는 단계를 포함할 수 있다.The step (c) may include generating the result information on the diagnosis and response to the failure in the form of statistical information arranged in a time series and transmitting the result information to the manager terminal.

상기 (c) 단계는, 상기 관리자 단말기로부터 수신되는 관리자의 요청 또는 미리 설정되어 있는 소정의 주기에 의해 상기 장애 진단 및 대응에 대한 결과 정보를 생성하는 단계를 포함할 수 있다.The step (c) may include generating result information on the diagnosis and response to the failure at a predetermined period set in advance or at the request of the administrator received from the administrator terminal.

상기 (c) 단계는, 상기 관리자 단말기로부터 소정의 검색 조건이 포함된 정보 조회 요청이 수신되면, 수신된 소정의 검색 조건에 상응하는 장애 진단 및 대응에 대한 결과 정보를 생성하여 상기 관리자 단말기로 전송하는 단계를 포함할 수 있다.In step (c), when an information inquiry request including a predetermined search condition is received from the administrator terminal, the result of the diagnosis and response to the failure corresponding to the received predetermined search condition is generated and transmitted to the administrator terminal. It may include the steps.

한편, 본 발명의 다른 실시예에 따르면, 웹서버로부터 수신되는 실시간 상태 정보를 기초로 웹서버에 대한 모니터링을 수행하여, 장애가 감지되면, 감지된 장애의 유형을 진단하는 장애 진단부; 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 상기 진단된 장애 유형에 대응되는 제어 명령을 상기 웹서버로 전송함으로써 상기 감지된 장애에 대한 대응을 실시하는 장애 처리부; 장애 진단 및 대응에 대한 결과 정보를 생성하여 상기 관리자 단말기로 전송하는 결과 제공부; 및 상기 생성한 장애 진단 및 대응에 대한 결과 정보를 저장하는 저장부를 포함하는, 통합 관리 서버가 제공된다.On the other hand, according to another embodiment of the present invention, by performing a monitoring for the web server based on the real-time status information received from the web server, if a failure is detected, a failure diagnosis unit for diagnosing the type of the detected failure; A failure processing unit that performs a response to the detected failure by transmitting a control command corresponding to the diagnosed failure type to the web server based on a preset rule for failure diagnosis and response; A result providing unit generating and transmitting result information on the diagnosis and response to the manager terminal; And a storage unit for storing result information on the generated fault diagnosis and response.

상기 실시간 상태 정보는, 상기 웹서버에 대한 서버 리소스 정보 및 노드 리소스 정보를 포함할 수 있다.The real-time status information may include server resource information and node resource information for the web server.

상기 장애 진단부는, 상기 실시간 상태 정보와 상기 통합 관리 서버 내 미리 저장되어 있는 장애 진단 및 대응 규칙을 기반으로 분석을 실시하여 상기 감지된 장애의 유형을 진단할 수 있다.The failure diagnosis unit may diagnose the type of the detected failure by performing analysis based on the real-time status information and a failure diagnosis and response rule stored in advance in the integrated management server.

상기 장애 진단부는, 상기 실시간 상태 정보와 상기 통합 관리 서버 내 장애 진단 및 대응에 대한 결과 정보가 누적 저장되어 있는 이력 정보를 기반으로 분석을 실시하여 상기 감지된 장애의 유형을 진단할 수 있다.The failure diagnosis unit may diagnose the type of the detected failure by performing an analysis based on the real-time status information and history information in which result information for diagnosis and response of the failure in the integrated management server is accumulated and stored.

상기 장애 처리부는, 상기 진단된 장애 유형에 대한 알람 정보를 상기 관리자 단말기로 전송함으로써 상기 감지된 장애에 대한 대응을 실시할 수 있다.The failure processing unit may respond to the detected failure by transmitting alarm information for the diagnosed failure type to the manager terminal.

상기 장애 진단부는, 상기 감지된 장애의 유형을, 요청 초과 장애, 대용량 데이터베이스 데이터 조회 장애, 데이터베이스 연결 요청 초과 장애, 서비스 지연 장애, 메모리 부족 장애, 특정 서비스의 요청 초과 장애 및 정지 장애 중 어느 하나로 진단할 수 있다.The failure diagnosis unit diagnoses the type of the detected failure as one of a request exceeded failure, a large database data inquiry failure, a database connection request exceeded failure, a service delay failure, an insufficient memory failure, a request exceeded failure and a stop failure of a specific service. can do.

상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버의 가용 스레드(Thead) 사용량이 임계치를 초과한 것으로 판단되면, 요청 초과 장애로 진단하고, 상기 장애 처리부는, 상기 요청 초과 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키는 제어 명령을 상기 웹서버로 전송할 수 있다.If it is determined through the monitoring that the available thread (Thead) usage of the web server has exceeded the threshold value, the failure diagnosis unit diagnoses a request exceeded failure, and the failure processing unit detects the request exceeded failure in advance. Based on the established fault diagnosis and response rules, a control command for bypassing a user request to a temporary page may be transmitted to the web server.

상기 사용자 요청을 임시 페이지로 우회시키는 제어는, 상기 웹서버 내에서 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되어, 요청 초과 장애가 진단되면, 상기 웹서버 자체적으로 요청 초과 장애 진단 즉시 자동 수행 가능한 것을 특징으로 할 수 있다.Control to bypass the user request to a temporary page, if it is determined that the available thread usage in the web server has exceeded the threshold, and the request exceeded fault is diagnosed, the web server itself automatically performs the request exceeded fault diagnosis It can be characterized as possible.

상기 장애 진단부는, 상기 모니터링을 통해 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되면, 대용량 데이터베이스 데이터 조회 장애로 진단하고, 상기 장애 처리부는, 상기 대용량 데이터베이스 데이터 조회 장애로 판단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어 명령을 상기 웹서버로 전송할 수 있다.When the failure diagnosis unit determines that a large database data query for a service is requested from the user through the monitoring, the failure diagnosis unit diagnoses a large database data query failure, and the failure processing unit determines that the large database data query failure occurs, Based on a preset rule for diagnosis and response to a failure, a control command for forcibly terminating the corresponding service requested by the user or restricting the service by a predetermined condition may be transmitted to the web server.

상기 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어는, 상기 웹서버 내에서 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되어, 대용량 데이터베이스 데이터 조회 장애가 진단되면, 상기 웹서버 자체적으로 대용량 데이터베이스 데이터 조회 장애 진단 즉시 자동 수행 가능한 것을 특징으로 할 수 있다.The control for forcibly terminating the corresponding service requested from the user or restricting the service by a predetermined condition is determined as a request for a large database data query for the service from the user in the web server, so that the large database data search is performed. When a failure is diagnosed, the web server itself can automatically perform a large database data inquiry failure diagnosis immediately.

상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버 내 데이터베이스 연결 그룹(Pool)이 임계치를 초과하여 특정 데이터소스(Datasource)의 데이터베이스 연결이 과도하게 사용되고 있는 것으로 판단되면, 데이터베이스 연결 요청 초과 장애로 진단하고, 상기 장애 처리부는, 상기 데이터베이스 연결 요청 초과 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 상기 웹서버로 전송할 수 있다.If it is determined through the monitoring that the database connection group (Pool) in the web server exceeds a threshold and database connection of a specific data source (Datasource) is excessively used, diagnoses a database connection request excess failure. , When the failure processing unit is diagnosed as a failure exceeding the database connection request, the user request is bypassed to a temporary page or the waiting time for obtaining the corresponding database connection is enforced based on a preset rule for diagnosis and response to the failure. The control command reduced to can be transmitted to the web server.

상기 장애 진단부는, 상기 모니터링을 통해 사용자로부터 요청된 서비스의 응답이 지연되거나 사용자로부터 소정의 시간이 지연된 후에 제공되는 서비스에 대한 요청이 수신된 것으로 판단되면, 서비스 지연 장애로 진단하고, 상기 장애 처리부는, 상기 서비스 지연 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 장애가 진단된 서비스에 대한 스레드 사용률을 제한하는 제어 명령을 상기 웹서버로 전송할 수 있다.The failure diagnosis unit diagnoses a service delay failure when it is determined that a response to a service requested from a user is delayed through the monitoring or a request for a service provided after a predetermined time is delayed from the user, and the failure processing unit In the case of being diagnosed as the service delay failure, a control command for limiting the thread utilization rate for a service diagnosed with a failure may be transmitted to the web server based on a rule for diagnosis and response to a failure.

상기 장애 진단부는, 상기 모니터링을 통해 서비스 로직(Logic)의 오류 또는 시스템의 과도한 메모리 사용에 의해 메모리 부족 문제(Out Of Memory, OOM)가 발생하거나 메모리 자동 수거 현상(Full Garbage Collection, Full GC) 발생 빈도가 증가하거나 메모리 해제 불가 등의 상황이 지속적으로 발생하는 것으로 판단되면, 메모리 부족 장애로 진단하고, 상기 장애 처리부는, 상기 메모리 부족 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 덤프 생성 명령 및 서버 재기동 명령을 상기 웹서버로 전송하고 알람 정보를 상기 관리자 단말기로 전송할 수 있다.The fault diagnosis unit may cause an out of memory (OOM) or an automatic memory collection phenomenon (Full Garbage Collection, Full GC) due to an error in service logic or excessive memory use in the system through the monitoring. When it is determined that the frequency is increased or a situation such as the inability to release the memory is continuously generated, the diagnosis is made of an insufficient memory failure, and when the failure processing unit is diagnosed as the insufficient memory failure, preset failure diagnosis and response Based on the rules, a dump generation command and a server restart command may be transmitted to the web server and alarm information may be transmitted to the manager terminal.

상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버로 수신된 특정 서비스에 대한 사용자의 요청이 상기 웹서버에서 처리 가능한 한계를 초과하는 것으로 판단되면, 특정 서비스의 요청 초과 장애로 진단하고, 상기 장애 처리부는, 상기 특정 서비스의 요청 초과 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 복수의 사용자에 대한 서비스 진입이 순차적으로 이뤄지도록 하는 요청 제어 명령을 상기 웹서버로 전송하고 해당 장애 진단에 대한 알람 정보를 상기 관리자 단말기로 전송할 수 있다.When the user's request for a specific service received by the web server exceeds the limit that can be processed by the web server through the monitoring, the failure diagnosis unit diagnoses a request exceeding failure of the specific service, and the failure processing unit In the case of being diagnosed as a failure exceeding the request of the specific service, the web server issues a request control command to sequentially enter a service for a plurality of users based on a preset rule for diagnosis and response of the failure. And transmit the alarm information for the diagnosis of the failure to the manager terminal.

상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버가 기동 중인 상태임에도 아무 기능도 수행하지 못하는 정지(Hang) 상태인 것으로 판단되면, 정지 장애로 진단하고, 상기 장애 처리부는, 상기 정지 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 상기 웹서버로 덤프 생성 명령 및 서버 재기동 명령을 전송하고 상기 관리자 단말기로 해당 진단 장애에 대한 알람 정보를 전송할 수 있다.If it is determined through the monitoring that the web server is in a stopped state (Hang) that does not perform any function even though the web server is in a running state, the fault diagnosis unit diagnoses a stop fault, and the fault processing unit diagnoses the stop fault In this case, based on a preset rule for diagnosis and response to a failure, a dump generation command and a server restart command may be transmitted to the web server, and alarm information for the diagnosis failure may be transmitted to the manager terminal.

상기 결과 제공부는, 상기 장애 진단 및 대응에 대한 결과 정보를 시계열로 나열된 통계 정보 형태로 생성하여 상기 관리자 단말기로 전송할 수 있다.The result providing unit may generate result information on the diagnosis and response to the failure in the form of statistical information arranged in a time series and transmit the result information to the manager terminal.

상기 결과 제공부는, 상기 관리자 단말기로부터 수신되는 관리자의 요청 또는 미리 설정되어 있는 소정의 주기에 의해 상기 장애 진단 및 대응에 대한 결과 정보를 생성할 수 있다.The result providing unit may generate result information on the diagnosis and response to the failure by a request of an administrator received from the administrator terminal or a predetermined period.

상기 결과 제공부는, 상기 관리자 단말기로부터 소정의 검색 조건이 포함된 정보 조회 요청이 수신되면, 수신된 소정의 검색 조건에 상응하는 장애 진단 및 대응에 대한 결과 정보를 생성하여 상기 관리자 단말기로 전송할 수 있다.When the information inquiry request including the predetermined search condition is received from the administrator terminal, the result providing unit may generate result information on the diagnosis and response to the failure corresponding to the received predetermined search condition and transmit the result information to the administrator terminal. .

본 발명의 일 실시예에 따르면, 일부 장애 현상에 대한 처리가 아닌, 다양한 장애 유형을 기반으로 복합 서버 장애 진단 및 대응을 실시함으로써, 서버에서 발생 가능한 다양한 장애에 대한 예방 및 방지가 가능한 바, 서버 운용에 있어서 신뢰성 및 안정성이 확보될 수 있다.According to an embodiment of the present invention, it is possible to prevent and prevent various failures that may occur in a server by performing a complex server failure diagnosis and response based on various failure types, rather than processing for some failure phenomenon. In operation, reliability and stability can be ensured.

본 발명의 다른 실시예에 따르면, 미리 설정되어 있는 규칙 기반의 장애 진단 및 대응을 실시함으로써, 서버 장애 발생 시, 미리 설정되어 있는 규칙을 기반으로 하여 자동적으로 장애에 대한 대응이 실시되는 바, 서버 장애가 발생 즉시 극복될 수 있다.According to another embodiment of the present invention, by performing a rule-based failure diagnosis and response based on a preset rule, when a server failure occurs, a response to a failure is automatically performed based on a preset rule, the server The obstacle can be overcome immediately.

본 발명의 또 다른 실시예에 따르면, 웹서버의 리소스 정보를 기초로 서버에 대한 통합 관리 및 실시간 제어를 수행하는 바, 서버 무중단 제어가 가능하다는 장점이 있다.According to another embodiment of the present invention, the server performs integrated management and real-time control of the server based on the resource information of the web server, and thus has an advantage that server uninterrupted control is possible.

본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.It should be understood that the effects of the present invention are not limited to the above-described effects, and include all effects that can be deduced from the configuration of the invention described in the detailed description or claims of the present invention.

도 1은 본 발명의 일 실시예에 따른 장애 유형 기반의 서버 장애 진단 및 대응 시스템의 구성을 개략적으로 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 통합 관리 서버의 구성을 도시한 블록도이다.
도 3은 본 발명의 일 실시예에 따라 웹서버의 장애가 유형에 따라 진단되고, 그에 따른 대응으로 장애가 처리되는 과정을 도시한 흐름도이다.
도 4는 본 발명의 일 실시예에 따라 실시간 모니터링 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 5는 본 발명의 일 실시예에 따라 장애 진단 및 대응에 대한 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 6은 본 발명의 일 실시예에 따라 요청 초과 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 7은 본 발명의 일 실시예에 따라 대용량 데이터베이스 데이터 조회 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 8은 본 발명의 일 실시예에 따라 데이터베이스 연결 요청 초과 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 9는 본 발명의 일 실시예에 따라 서비스 지연 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 10은 본 발명의 일 실시예에 따라 메모리 부족 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 11은 본 발명의 일 실시예에 따라 특정 서비스의 요청 초과 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 12는 본 발명의 일 실시예에 따라 정지 장애 진단에 따른 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 13은 본 발명의 일 실시예에 따라 시계열로 나열된 통계 형태의 장애 진단 및 대응에 대한 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
도 14는 본 발명의 일 실시예에 따라 진단 이력 검색 결과 정보 제공 시 관리자 단말기에 디스플레이 되는 화면을 예시하는 도면이다.
1 is a diagram schematically showing a configuration of a system for diagnosing and responding to server failure based on a type of failure according to an embodiment of the present invention.
2 is a block diagram showing the configuration of an integrated management server according to an embodiment of the present invention.
3 is a flowchart illustrating a process in which a failure of a web server is diagnosed according to a type according to an embodiment of the present invention, and a failure is handled accordingly.
4 is a diagram illustrating a screen displayed on a manager terminal when providing real-time monitoring information according to an embodiment of the present invention.
FIG. 5 is a diagram illustrating a screen displayed on a manager terminal when providing result information on diagnosis and response to a failure according to an embodiment of the present invention.
6 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to a request exceeded fault diagnosis according to an embodiment of the present invention.
7 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to diagnosis of a large database data inquiry failure according to an embodiment of the present invention.
8 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to a diagnosis of a failure exceeding a database connection request according to an embodiment of the present invention.
9 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to a service delay failure diagnosis according to an embodiment of the present invention.
10 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to a diagnosis of a memory shortage failure according to an embodiment of the present invention.
11 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to diagnosis of a request exceeded failure of a specific service according to an embodiment of the present invention.
12 is a diagram illustrating a screen displayed on a manager terminal when providing result information according to diagnosis of a stop disorder according to an embodiment of the present invention.
13 is a diagram illustrating a screen displayed on a manager terminal when providing result information on diagnosis and response to a failure in the form of statistics arranged in a time series according to an embodiment of the present invention.
14 is a diagram illustrating a screen displayed on a manager terminal when providing diagnosis history search result information according to an embodiment of the present invention.

이하에서는 첨부한 도면을 참조하여 본 발명을 설명하기로 한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 따라서 여기에서 설명하는 실시예로 한정되는 것은 아니다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, the present invention will be described with reference to the accompanying drawings. However, the present invention may be implemented in various different forms, and thus is not limited to the embodiments described herein. In addition, in order to clearly describe the present invention in the drawings, parts irrelevant to the description are omitted, and like reference numerals are assigned to similar parts throughout the specification.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 부재를 사이에 두고 "간접적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 구비할 수 있다는 것을 의미한다.Throughout the specification, when a part is "connected" to another part, this includes not only "directly connected" but also "indirectly connected" with another member in between. . Also, when a part “includes” a certain component, this means that other components may be further provided instead of excluding other components, unless otherwise stated.

본 명세서에서, 웹서버는, 웹서버(Web server) 또는 웹 애플리케이션 서버(Web Application Server, WAS)일 수 있으며, 단일의 서버 형태로 설명을 기재하였으나, 복수의 서버 형태로 구성될 수 있음은 물론이다. 이에 따라, 본 명세서에서, 통합 관리 서버는, 복수의 웹서버에 대한 동시 모니터링이 가능하다.In this specification, the web server may be a web server (Web server) or a web application server (Web Application Server, WAS), and has been described in the form of a single server, but may be configured as a plurality of server types. to be. Accordingly, in the present specification, the integrated management server can simultaneously monitor a plurality of web servers.

이하 첨부된 도면을 참고하여 본 발명의 실시예를 상세히 설명하기로 한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 장애 유형 기반의 서버 장애 진단 및 대응 시스템의 구성을 개략적으로 도시한 도면이다.1 is a diagram schematically showing a configuration of a system for diagnosing and responding to server failure based on a type of failure according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 일 실시예에 따른 장애 유형 기반의 서버 장애 진단 및 대응 시스템은, 사용자 단말기(100), 웹서버(200), 통합 관리 서버(300) 및 관리자 단말기(400)로 구성될 수 있다.Referring to Figure 1, the failure type based server failure diagnosis and response system according to an embodiment of the present invention, the user terminal 100, the web server 200, the integrated management server 300 and the administrator terminal 400 It can be composed of.

사용자 단말기(100), 웹서버(200), 통합 관리 서버(300) 및 관리자 단말기(400) 각각은 통신망을 통해 연결되어 있을 수 있다. 여기서, 통신망은 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 근거리 통신망(LAN: Local Area Network), 도시권 통신망(MAN: Metropolitan Area Network), 광역 통신망(WAN: Wide Area Network) 등 다양한 통신망으로 구성될 수 있다.Each of the user terminal 100, the web server 200, the integrated management server 300, and the manager terminal 400 may be connected through a communication network. Here, the communication network may be configured regardless of its communication mode such as wired or wireless, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), etc. It can be composed of various communication networks.

사용자 단말기(100) 및 관리자 단말기(400)는 휴대폰, 스마트폰, PDA(Personal Digital Assistant), PMP(Portable Multimedia Player), 태블릿 PC 등과 같이 터치 스크린 패널이 구비된 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있으며, 이 외에도 데스크탑 PC, 태블릿 PC, 랩탑 PC, 셋탑 박스를 포함하는 IPTV와 같이, 애플리케이션을 설치하고 실행할 수 있는 기반이 마련된 장치도 포함할 수 있다.The user terminal 100 and the administrator terminal 400 are based on all types of handhelds equipped with a touch screen panel such as a mobile phone, a smart phone, a personal digital assistant (PDA), a portable multimedia player (PMP), a tablet PC, and the like. It may include a wireless communication device of, in addition to a desktop PC, tablet PC, laptop PC, IPTV including a set-top box, it may also include a device provided with a basis for installing and running applications.

관리자 단말기(400)는 서버 통합 관리 서비스를 제공하는 애플리케이션을 설치하여 메모리에 저장할 수 있다. 예를 들어, 관리자 단말기(400)는 각종 애플리케이션이 업로드 되어 있는 앱 스토어 서버(미도시)에 접속한 후, 모니터링 정보 조회, 장애 이력 정보 제공 등 다양한 서비스를 제공하는 서버 통합 관리 서비스 제공 애플리케이션을 다운로드 하여 설치할 수 있다.The manager terminal 400 may install an application providing a server integrated management service and store it in memory. For example, the administrator terminal 400 accesses an app store server (not shown) in which various applications are uploaded, and then downloads a server integrated management service providing application that provides various services such as monitoring information inquiry and failure history information provision. Can be installed.

본 발명의 일 실시예에 따르면, 관리자 단말기(400)는 서버 통합 관리 서비스가 제공되는 웹페이지에 접속하는 사용자 단말기(100)와 동일한 장치일 수 있다.According to an embodiment of the present invention, the administrator terminal 400 may be the same device as the user terminal 100 accessing a webpage provided with a server integrated management service.

사용자 단말기(100)에는 웹서버(200)로부터 제공되는 웹 서비스에 대한 인터페이스 및 화면이 제공될 수 있으며, 이를 통해 사용자로 하여금 이용하고자 하는 서비스를 선택하도록 할 수 있다.The user terminal 100 may be provided with an interface and a screen for a web service provided from the web server 200, through which the user can select a service to be used.

상기 제공한 인터페이스를 통해 사용자로부터 웹 서비스 중 어느 하나가 선택되면, 사용자 단말기(100)는 웹서버(200)로 해당 서비스 요청 신호를 전송할 수 있으며, 웹서버(200)는 이에 해당하는 웹서비스 화면 또는 인터페이스를 사용자 단말기(100)로 전송하여 사용자에게 제공할 수 있다.When any one of the web services is selected from the user through the provided interface, the user terminal 100 may transmit a corresponding service request signal to the web server 200, and the web server 200 may display a corresponding web service screen Alternatively, the interface may be transmitted to the user terminal 100 and provided to the user.

웹서버(200)는 통합 관리 서버(300)로 리소스 정보를 전송할 수 있다. 이 때, 리소스 정보는, 서버 리소스 정보 및 노드 리소스 정보를 포함하며, 리소스 정보를 통해 통합 관리 서버(300)에서는 웹서버(200)에 대한 실시간 모니터링을 실시할 수 있다. 상기 노드는, 웹서버가 설치되어 있는 물리적 장비나 컨테이너 등의 시스템을 의미할 수 있다.The web server 200 may transmit resource information to the integrated management server 300. At this time, the resource information includes server resource information and node resource information, and through the resource information, the integrated management server 300 may perform real-time monitoring of the web server 200. The node may refer to a system such as a physical device or a container in which a web server is installed.

본 발명의 일 실시예에 따르면, 웹서버(200)는 사용자 단말기(100)로부터 서비스 제공 요청 신호가 수신되는 경우에 통합 관리 서버(300)로 리소스 정보를 전송하거나, 또는, 별도의 요청 신호가 수신되지 않아도 소정의 주기마다 자동으로 리소스 정보를 전송하여 실시간 모니터링이 이뤄지도록 할 수 있다.According to an embodiment of the present invention, the web server 200 transmits resource information to the integrated management server 300 when a service provision request signal is received from the user terminal 100, or a separate request signal Even if it is not received, it is possible to automatically transmit resource information every predetermined period to perform real-time monitoring.

통합 관리 서버(300)는 웹서버(200)로부터 수신된 리소스 정보를 기초로 실시간 모니터링을 수행할 수 있으며, 분석을 통해 장애를 진단할 수 있다.The integrated management server 300 may perform real-time monitoring based on resource information received from the web server 200, and diagnose a failure through analysis.

통합 관리 서버(300)는 미리 설정되어 있는 규칙을 기반으로 하여 웹서버(200)의 장애를 진단할 수 있으며, 진단된 장애에 대한 대응 제어를 실시할 수 있다.The integrated management server 300 may diagnose a failure of the web server 200 based on a preset rule, and may perform response control for the diagnosed failure.

이 때, 미리 설정되어 있는 규칙은, 발생 장애에 대한 진단 유형별 대응 방법에 대한 것이며, 장애 유형 별로 대응 방법이 미리 매칭되어 있을 수 있다.At this time, the preset rule is for a diagnosis type response method for an occurrence disorder, and a response method for each type of failure may be matched in advance.

진단 유형에는, 요청 초과 진단, 대용량 데이터베이스 데이터 조회 진단, 데이터베이스 연결 요청 초과 진단, 서비스 지연 진단, 메모리 부족 진단, 특정 서비스의 요청 초과 진단 및 정지 진단이 있으며, 이에 대하여 매칭되어 있는 대응 제어 방법에는, 우회 페이지로 이동, 서비스 강제 종료, 서비스 제한 제어, 서비스 접속 제한, 알람 제공, 덤프 생성 및 서비스 재시작 제어가 포함될 수 있다.The types of diagnosis include request over-diagnosis, large database data inquiry diagnosis, database connection request over-diagnosis, service delay diagnosis, memory shortage diagnosis, request over-diagnosis and stop diagnosis of a specific service. This may include moving to the bypass page, forcibly shutting down the service, controlling service restrictions, restricting service access, providing alarms, generating dumps, and restarting services.

통합 관리 서버(300)는 진단된 장애 유형에 매칭되어 있는 대응 제어 명령을 웹서버(200)로 전송함으로써, 웹서버(200)가 장애 극복되도록 할 수 있다.The integrated management server 300 may cause the web server 200 to overcome the failure by transmitting a corresponding control command matching the diagnosed failure type to the web server 200.

본 발명의 일 실시예에 따르면, 요청 초과 장애 또는 대용량 데이터베이스 조회 장애의 경우, 웹서버(200) 내에서 가용 스레드(Thread) 사용량의 임계치 초과 여부를 판단하거나 사용자로부터의 서비스에 대한 대용량 데이터베이스 조회 요청 여부를 판단 가능함에 따라, 통합 관리 서버(300)의 개입 없이도, 웹서버(200) 자체적으로 상기 해당 장애가 발생한 것으로 판단되는 즉시 대응 제어를 수행할 수 있다. 이에 따라, 통합 관리 서버(300)에서 장애를 진단하고 해당 대응 제어 명령을 전송함에 따라 소요되는 시간으로 인해 장애를 대응할 수 있는 적정 시기를 놓치는 문제가 발생하지 않을 수 있다.According to an embodiment of the present invention, in the case of a request exceeding failure or a large database inquiry failure, it is determined whether the threshold of the available thread usage in the web server 200 is exceeded, or a large database inquiry request for a service from a user As it is possible to determine whether or not it is possible, the web server 200 itself can perform the response control as soon as it is determined that the corresponding failure has occurred, without the intervention of the integrated management server 300. Accordingly, a problem that misses an appropriate time to respond to the failure may not occur due to the time required as the integrated management server 300 diagnoses the failure and transmits the corresponding control control command.

웹서버(200)의 장애가 진단되고, 이에 대응되는 대응 제어가 실시된 경우, 통합 관리 서버(300)는 이러한 진단된 장애 유형 정보 및 그에 따라 대응한 대응 정보를 매칭하여 저장할 수 있다.When the failure of the web server 200 is diagnosed and corresponding control is performed, the integrated management server 300 may match and store the diagnosed failure type information and corresponding corresponding information accordingly.

또한, 통합 관리 서버(300)는 실시간 모니터링 정보를 관리자 단말기(400)로 전송함으로써 관리자 단말기(400)를 통해 서버 모니터링 정보가 제공될 수 있도록 하며, 장애가 진단된 경우, 장애 진단 알림 및 장애 발생에 따른 대응 이력을 관리자 단말기(400)로 전송함으로써 관리자에게 제공할 수 있다.In addition, the integrated management server 300 transmits real-time monitoring information to the manager terminal 400 so that server monitoring information can be provided through the manager terminal 400. The corresponding response history may be transmitted to the manager terminal 400 to be provided to the manager.

또한, 웹서버(200)가 복수인 경우, 통합 관리 서버(300)는 복수의 웹서버(200)에 대하여 선택적으로 관리자 단말기(400)에 각 서버에 대한 실시간 모니터링 정보를 제공할 수 있다.In addition, when there are multiple web servers 200, the integrated management server 300 may selectively provide real-time monitoring information for each server to the administrator terminal 400 for the plurality of web servers 200.

통합 관리 서버(300)는 장애 진단 및 대응 결과에 대한 보고서를 생성하여 관리자 단말기(400)로 전송할 수 있다. 이 때, 통합 관리 서버(300)는 장애 진단 및 대응 결과에 대하여 시계열로 나열된 통계 정보를 제공함으로써, 관리자로 하여금 시간 기반 장애 패턴 파악이 가능하도록 할 수 있다.The integrated management server 300 may generate a report on the result of diagnosis and response to the failure and transmit it to the manager terminal 400. At this time, the integrated management server 300 may provide the statistical information listed in time series for the diagnosis and response results of the failure, so that the administrator can grasp the time-based failure pattern.

관리자 단말기(400)는 통합 관리 서버(300)로부터 수신되는 실시간 모니터링 정보, 장애 진단 알림 정보, 장애 발생에 따른 대응 이력 정보 및 장애 진단 및 대응 결과에 대한 보고서를 디스플레이 하여 관리자에게 제공할 수 있다.The manager terminal 400 may display real-time monitoring information received from the integrated management server 300, failure diagnosis notification information, response history information according to the occurrence of the failure, and a report on the failure diagnosis and response results to the administrator.

또한, 관리자 단말기(400)는 통합 관리 서버(300)로부터 제공되는 통합 관리 서비스 제공 관련 인터페이스를 통해 사용자로부터 소정의 장애 진단 및 대응에 대한 정보 조회 요청이 입력되면, 해당 요청 정보를 통합 관리 서버(300)로 전송하여, 대응되는 정보를 제공받을 수 있다.In addition, the administrator terminal 400, when a request for information inquiry for a predetermined failure diagnosis and response is input from the user through the interface related to provision of the integrated management service provided from the integrated management server 300, the request information is integrated management server ( 300) to receive corresponding information.

도 2는 본 발명의 일 실시예에 따른 통합 관리 서버(300)의 구성을 도시한 블록도이다.2 is a block diagram showing the configuration of the integrated management server 300 according to an embodiment of the present invention.

도 2를 참조하면, 본 발명의 일 실시예에 따른 통합 관리 서버(300)는 장애 진단부(310), 장애 처리부(320), 결과 제공부(330) 및 저장부(340)를 포함할 수 있다.Referring to FIG. 2, the integrated management server 300 according to an embodiment of the present invention may include a fault diagnosis unit 310, a fault processing unit 320, a result providing unit 330, and a storage unit 340. have.

장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 웹서버(200)에 대한 실시간 모니터링을 수행할 수 있다.The failure diagnosis unit 310 may perform real-time monitoring of the web server 200 based on resource information received from the web server 200.

구체적으로, 장애 진단부(310)는 수신된 리소스 정보와 장애 진단 및 대응 결과에 대한 이력 정보 데이터를 기반으로 분석을 실시함으로써 실시간 모니터링을 수행할 수 있다.Specifically, the failure diagnosis unit 310 may perform real-time monitoring by performing analysis based on the received resource information and the history information data for the failure diagnosis and response results.

장애 진단부(310)는 상기 모니터링을 통해 장애가 감지되면, 미리 설정되어 있는 소정의 장애 유형에 따라 장애를 진단할 수 있다. 이 때, 진단 가능한 소정의 장애 유형에는, 요청 초과 진단, 대용량 데이터베이스 데이터 조회 진단, 데이터베이스 연결 요청 초과 진단, 서비스 지연 진단, 메모리 부족 진단, 특정 서비스의 요청 초과 진단 및 정지 진단이 포함될 수 있다.When a failure is detected through the monitoring, the failure diagnosis unit 310 may diagnose the failure according to a predetermined type of failure. At this time, the predetermined type of failure that can be diagnosed may include request over-diagnosis, large database data inquiry diagnosis, database connection request over-diagnosis, service delay diagnosis, memory shortage diagnosis, request over-diagnosis and stop diagnosis of a specific service.

본 발명의 일 실시예에 따르면, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 과도하게 발생한 사용자 서비스 요청으로 웹서버(200)의 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되면, 웹서버(200)에 대하여 요청 초과 장애를 진단할 수 있다.According to an embodiment of the present invention, the failure diagnosis unit 310 performs monitoring based on resource information received from the web server 200, and an available thread of the web server 200 is requested by an excessively generated user service request ( Thread) If it is determined that the usage exceeds the threshold, it is possible to diagnose a request exceeding failure with respect to the web server 200.

본 발명의 다른 실시예에 따르면, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되면, 웹서버(200)에 대하여 대용량 데이터베이스 데이터 조회 장애를 진단할 수 있다.According to another embodiment of the present invention, the failure diagnosis unit 310 performs monitoring based on resource information received from the web server 200, and when it is determined that a large database data query for the service is requested from the user, The web server 200 may diagnose a large database data inquiry failure.

본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 웹서버(200) 내 데이터베이스의 처리 시간 지연, 데이터베이스 잠금 상태 등에 의해 데이터베이스 연결이 과도하게 점유된 것으로 판단되면, 즉, 데이터베이스 연결 그룹(Pool)이 임계치를 초과하여 특정 데이터소스(Datasource)의 데이터베이스 연결이 과도하게 사용되고 있는 것으로 판단되면, 웹서버(200)에 대하여 데이터베이스 연결 요청 초과 장애를 진단할 수 있다.According to another embodiment of the present invention, the failure diagnosis unit 310 performs monitoring based on resource information received from the web server 200, delays processing time of the database in the web server 200, and locks the database. If it is determined that the database connection is excessively occupied by, for example, the database connection group (Pool) exceeds the threshold, and it is determined that the database connection of a specific data source (Datasource) is excessively used, the web server 200 The database connection request exceeded fault can be diagnosed.

본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 일시적인 네트워크, 연계시스템 문제 등으로 사용자로부터 요청된 서비스의 응답이 지연되거나, 사용자로부터 소정의 시간이 지연된 후에 제공되는 서비스에 대한 요청이 수신된 것으로 판단되면, 웹서버(200)에 대하여 서비스 지연 장애를 진단할 수 있다.According to another embodiment of the present invention, the fault diagnosis unit 310 performs monitoring based on resource information received from the web server 200 to respond to a service requested from a user due to a temporary network or linkage system problem. If it is determined that a request for a service provided is received after the delay or a predetermined time is delayed from the user, the service delay failure may be diagnosed with respect to the web server 200.

본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 서비스 로직(Logic)의 오류 또는 시스템의 과도한 메모리 사용에 의해 메모리 부족 문제(Out Of Memory, OOM)가 발생한 것으로 판단되면, 웹서버(200)에 대하여 메모리 부족 장애를 진단할 수 있다.According to another embodiment of the present invention, the fault diagnosis unit 310 performs monitoring based on resource information received from the web server 200, due to an error in service logic or excessive memory use of the system. If it is determined that an out-of-memory (OOM) problem has occurred, the out-of-memory failure may be diagnosed with respect to the web server 200.

또한, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 메모리 자동 수거 현상(Full Garbage Collection, Full GC) 발생 빈도가 증가하거나 메모리 해제 불가 등의 상황이 지속적으로 발생하는 것으로 판단되면, 웹서버(200)에 대하여 메모리 부족 장애가 발생할 것으로 미리 진단할 수 있다.In addition, the fault diagnosis unit 310 performs monitoring based on the resource information received from the web server 200, such that the frequency of occurrence of a full garbage collection (full GC) increases or memory release is impossible If it is determined to occur continuously, the web server 200 may be diagnosed in advance that a memory shortage failure will occur.

본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)는 웹서버(200)로부터 수신되는 리소스 정보를 기초로 모니터링을 실시하여, 웹서버(200)로 수신된 특정 서비스에 대한 사용자의 요청이 웹서버(200)에서 처리 가능한 한계를 초과하는 것으로 판단되면, 웹서버(200)에 대하여 특정 서비스의 요청 초과 장애를 진단할 수 있다.According to another embodiment of the present invention, the fault diagnosis unit 310 performs monitoring based on resource information received from the web server 200, and requests a user for a specific service received by the web server 200 If it is determined that the limit that can be processed by the web server 200 is exceeded, it is possible to diagnose a failure exceeding a request for a specific service for the web server 200.

본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)는 웹서버(200)가 기동 중인 상태임에도 아무 기능도 수행하지 못하는 정지(Hang) 상태인 것으로 판단되면, 웹서버(200)에 대하여 정지 장애를 진단할 수 있다.According to another embodiment of the present invention, if it is determined that the failure diagnosis unit 310 is in a hang state in which no function is performed even when the web server 200 is in the active state, the web server 200 is checked. Stop failure can be diagnosed.

장애 처리부(320)는 장애 진단부(310)를 통해 진단된 웹서버(200)에 대한 장애 유형에 대하여, 각 유형별로 매칭되어 있는 대응 제어 명령을 웹서버(200)로 전송함으로써, 웹서버(200)의 장애가 극복되도록 할 수 있다.The failure processing unit 320 transmits a corresponding control command matched for each type to the web server 200 with respect to the type of failure for the web server 200 diagnosed through the failure diagnosis unit 310, so that the web server ( 200) can be overcome.

다시 말해, 장애 처리부(320)는 장애 진단부(310)를 통해 장애가 진단되면, 미리 설정되어 있는 장애 진단 및 대응 규칙을 기반으로 하여 해당 진단 장애 유형에 대응되는 대응 제어 명령을 자동으로 웹서버(200)로 전송함으로써, 웹서버(200)가 발생된 장애에 대하여 자동으로 즉시 극복하도록 할 수 있다.In other words, when a failure is diagnosed through the failure diagnosis unit 310, the failure processing unit 320 automatically generates a response control command corresponding to the diagnosis failure type based on a preset failure diagnosis and response rule. 200), the web server 200 can automatically and immediately overcome the generated failure.

본 발명의 일 실시예에 따르면, 장애 진단부(310)를 통해 요청 초과 장애가 발생되었거나 발생될 것으로 진단된 경우, 장애 처리부(320)는 과도하게 발생된 사용자 요청을 임시 페이지로 우회시키는 제어 명령을 웹서버(200)로 전송함으로써, 웹서버(200)가 안정적인 상태로 유지되도록 하는 바, 장애에 대한 선대응 또는 즉시 대응을 실시할 수 있다.According to an embodiment of the present invention, when a request exceeded failure is generated or diagnosed to occur through the failure diagnosis unit 310, the failure processing unit 320 issues a control command to bypass the excessively generated user request to a temporary page. By transmitting to the web server 200, so that the web server 200 is maintained in a stable state, it is possible to perform a preliminary response or an immediate response to a failure.

장애 처리부(320)는 상기 임시 페이지로의 우회 제어 명령을 전송함에 따라, 장애 진단부(310)를 통해 웹서버(200) 가용 스레드 사용량이 임계치를 초과하지 않은 것으로 판단되면, 이 후 발생되는 사용자 요청에 대하여 더 이상 임시 페이지로 우회시키는 제어 명령을 전송하지 않을 수 있다.As the failure processing unit 320 transmits a bypass control command to the temporary page, when it is determined that the available thread usage of the web server 200 does not exceed a threshold value through the failure diagnosis unit 310, a user generated thereafter The request may no longer send control commands to bypass the temporary page.

본 발명의 다른 실시예에 따르면, 장애 진단부(310)를 통해 대용량 데이터베이스 데이터 조회 장애가 발생되었거나 발생될 것으로 진단된 경우, 장애 처리부(320)는 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어 명령을 웹서버(200)로 전송함으로써, 웹서버(200)가 안정적인 상태로 유지되도록 하는 바, 장애에 대한 선대응 또는 즉시 대응을 실시할 수 있다.According to another embodiment of the present invention, when a large database data inquiry failure has occurred or is diagnosed to occur through the failure diagnosis unit 310, the failure processing unit 320 forcibly terminates the corresponding service requested by the user or is predetermined. By transmitting a control command to limit the service by the condition to the web server 200, the web server 200 is maintained in a stable state, so that it is possible to perform a preliminary response or an immediate response to a failure.

본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)를 통해 데이터베이스 연결 요청 초과 장애가 발생한 것으로 진단된 경우, 장애 처리부(320)는 발생된 사용자 요청을 임시 페이지로 우회시거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 웹서버(200)로 전송함으로써, 장애에서 격리되도록 하여 웹서버(200)가 안정적인 상태로 유지되도록 하는 바, 장애에 대한 즉각적인 대응을 실시할 수 있다.According to another embodiment of the present invention, when the database connection request exceeded failure is diagnosed through the failure diagnosis unit 310, the failure processing unit 320 bypasses the generated user request to a temporary page or waits to acquire the database connection By transmitting a control command to forcibly reduce the time to the web server 200, it is isolated from the failure so that the web server 200 is maintained in a stable state, and an immediate response to the failure can be implemented.

장애 처리부(320)는 상기 임시 페이지 우회로의 제어 명령을 전송함에 따라, 장애 진단부(310)를 통해 데이터베이스 연결 그룹이 임계치를 초과하지 않는 것으로 판단되면, 이 후 발생되는 서비스 요청에 대하여 더 이상 임시 페이지로 우회시키거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 전송하지 않을 수 있다.The failure processing unit 320 transmits a control command of the temporary page bypass, and when it is determined that the database connection group does not exceed a threshold value through the failure diagnosis unit 310, the service request generated thereafter is no longer temporary. You may not send a control command to bypass the page or forcibly reduce the waiting time for obtaining the connection to the database.

본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)를 통해 서비스 지연 장애가 발생되었거나 발생될 것으로 진단된 경우, 장애 처리부(320)는 장애가 진단된 서비스에 대한 스레드 사용률을 제한하는 제어 명령을 웹서버(200)로 전송함으로써, 통신 서비스 품질(Quality of Service, QoS)이 보장되도록 하는 바, 장애에 대한 선대응 또는 즉시 대응을 실시할 수 있다.According to another embodiment of the present invention, when a service delay failure occurs or is diagnosed to occur through the failure diagnosis unit 310, the failure processing unit 320 issues a control command to limit the thread usage rate for the service in which the failure is diagnosed. By transmitting to the web server 200, communication quality of service (Quality of Service, QoS) is ensured, so it is possible to perform a preliminary response or an immediate response to a failure.

장애 처리부(320)는 상기 스레드 사용률 제한 제어 명령을 전송함에 따라, 장애 진단부(310)를 통해 더 이상 서비스 지연 문제가 발생되지 않는 것으로 판단되면, 웹서버(200)로 스레드 사용률 제한 제어 해제 명령을 전송하여 사용률 제한 제어가 실시되지 않도록 할 수 있다.When the failure processing unit 320 transmits the thread usage limit control command, if it is determined that the service delay problem no longer occurs through the failure diagnosis unit 310, the thread usage limit control release command to the web server 200 It is possible to prevent the usage rate limiting control from being carried out.

본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)를 통해 메모리 부족 장애가 발생한 것으로 진단된 경우, 장애 처리부(320)는 덤프 생성 명령 및 서버 재기동 명령을 웹서버(200)로 전송하고, 장애 발생에 대한 알람 정보를 관리자 단말기(400)로 전송함으로써 장애에 대한 즉각적인 대응을 실시할 수 있다.According to another embodiment of the present invention, when it is diagnosed that a memory shortage failure has occurred through the failure diagnosis unit 310, the failure processing unit 320 transmits a dump generation command and a server restart command to the web server 200, It is possible to perform an immediate response to a failure by transmitting the alarm information on the occurrence of the failure to the manager terminal 400.

또한, 장애 진단부(310)를 통해 메모리 부족 장애가 발생할 것으로 미리 진단된 경우, 장애 처리부(320)는 웹서버(200)로 덤프 생성 명령을 전송하고 관리자 단말기(400)로 메모리 부족 장애 발생 가능 여부에 대한 알람을 제공함으로써, 메모리 부족 장애에 대한 선대응을 실시할 수 있다.In addition, if it is previously diagnosed that a memory shortage failure will occur through the failure diagnosis unit 310, the failure processing unit 320 may transmit a dump generation command to the web server 200 and may cause a memory shortage failure to the administrator terminal 400. By providing an alarm for, it is possible to perform a preliminary response to an insufficient memory failure.

본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)를 통해 특정 서비스의 요청 초과 장애가 발생되었거나 발생될 것으로 진단된 경우, 장애 처리부(320)는 복수의 사용자에 대한 서비스 진입이 순차적으로 이뤄지도록 하는 요청 제어 명령을 웹서버(200)로 전송하고, 해당 장애 진단에 대한 알람 정보를 관리자 단말기(400)로 전송함으로써, 사용자의 서비스 이용에 대한 이탈이 방지되도록 하는 바, 장애에 대한 선대응 또는 즉시 대응을 실시할 수 있다.According to another embodiment of the present invention, when a request exceeding failure of a specific service is generated or diagnosed to be generated through the failure diagnosis unit 310, the failure processing unit 320 sequentially enters services for a plurality of users By sending a request control command to the web server 200, and by transmitting the alarm information for the diagnosis of the failure to the administrator terminal 400, so as to prevent the departure of the user's service use bar, preemptive response to the failure Or you can respond immediately.

본 발명의 또 다른 실시예에 따르면, 장애 진단부(310)를 통해 정지 장애가 발생한 것으로 진단된 경우, 장애 처리부(320)는 웹서버(200)로 덤프 생성 명령 및 서버 재기동 명령을 전송하고, 관리자 단말기(400)로 해당 진단 장애에 대한 알람 정보를 전송함으로써, 웹서버(200)가 장애로부터 신속하게 복구되도록 하고, 시스템 전체의 장애 발생이 방지되도록 하는 바, 장애에 대한 즉각적인 대응을 실시할 수 있다.According to another embodiment of the present invention, when it is diagnosed that a stop failure has occurred through the failure diagnosis unit 310, the failure processing unit 320 transmits a dump generation command and a server restart command to the web server 200, and an administrator By transmitting the alarm information for the corresponding diagnostic failure to the terminal 400, the web server 200 can be quickly recovered from the failure, and the entire system can be prevented from occurring, so that an immediate response to the failure can be performed. have.

결과 제공부(330)는 웹서버(200)로부터 수신된 리소스 정보를 기초로 수행한 실시간 모니터링 정보를 관리자 단말기(400)로 전송하여 관리자에게 제공할 수 있다.The result providing unit 330 may transmit real-time monitoring information performed on the basis of the resource information received from the web server 200 to the manager terminal 400 to provide it to the manager.

또한, 결과 제공부(330)는 장애 진단 및 대응에 대한 결과 정보를 생성하여 관리자 단말기(400)로 전송할 수 있다.In addition, the result providing unit 330 may generate result information on the diagnosis and response to the failure and transmit it to the manager terminal 400.

본 발명의 일 실시예에 따르면, 결과 제공부(330)는 장애 진단 및 대응에 대한 결과 정보를 장애 진단 일자 또는 시간 단위의 시계열 통계 정보로 생성하여 관리자 단말기(400)로 제공함으로써, 관리자로 하여금 시간 기반 장애 패턴 파악이 가능하도록 할 수 있다.According to an embodiment of the present invention, the result providing unit 330 generates the result information on the diagnosis and response of the failure as time-series statistical information of the date or time of diagnosis of the failure and provides it to the administrator terminal 400, thereby allowing the administrator Time-based failure patterns can be identified.

상기 장애 진단 및 대응에 대한 결과 정보에는, 진단 장애 유형 별 발생 원인 분석 정보, 시간에 따른 장애 진단 결과 정보, 특정일에 대한 장애 진단 및 대응 이력 정보 등이 포함될 수 있다.The result information on the diagnosis and response to the disorder may include analysis information on the cause of occurrence of each diagnosis type, information on the result of the diagnosis of the disorder over time, and information on the diagnosis and response on the specific date.

결과 제공부(330)는 장애 진단 및 대응 결과 정보를 관리자 단말기(400)로부터 수신되는 관리자 요청에 의해 생성하여 제공하거나, 미리 설정된 소정의 주기마다 자동으로 생성하여 제공할 수 있다.The result providing unit 330 may generate and provide fault diagnosis and response result information according to an administrator request received from the manager terminal 400, or automatically generate and provide it every predetermined predetermined period.

저장부(340)는 결과 제공부(330)에서 생성된 장애 진단 및 대응 결과 정보를 저장함으로써, 생성된 장애 진단 및 대응 결과 정보가 추후 실시간 모니터링에 따른 장애 진단을 위한 분석에 활용될 수 있도록 하며, 이를 통해 장애 진단부(310)로 하여금 유기적 또는 종합적인 분석이 가능하도록 할 수 있다.The storage unit 340 stores the fault diagnosis and response result information generated by the result providing unit 330, so that the generated fault diagnosis and response result information can be used for analysis for diagnosis of a disorder according to real-time monitoring in the future. Through this, it is possible to enable the disorder diagnosis unit 310 to perform organic or comprehensive analysis.

또한, 저장부(340)는 상기 장애 진단 및 대응 결과 정보를 저장함으로써, 관리자 단말기(400)로부터 장애 진단 및 대응에 대한 이력 정보 조회 요청 시, 요청된 조건에 대응되는 이력 정보가 제공되도록 할 수 있다.In addition, the storage unit 340 may store history information corresponding to the requested condition when requesting the inquiry of the history information on the diagnosis and response to the failure from the administrator terminal 400 by storing the result of the diagnosis and response to the failure. have.

도 3은 본 발명의 일 실시예에 따라 웹서버(200)의 장애가 유형에 따라 진단되고, 그에 따른 대응으로 장애가 처리되는 과정을 도시한 흐름도이다.3 is a flowchart illustrating a process in which a failure of the web server 200 is diagnosed according to a type according to an embodiment of the present invention, and a failure is handled accordingly.

먼저, 웹서버(200)는 통합 관리 서버(300)로 서버 리소스 정보 및 노드 리소스 정보를 포함하는 리소스 정보를 전송함으로써 웹서버(200)에 대한 실시간 상태 정보를 전송할 수 있다(S301).First, the web server 200 may transmit real-time status information for the web server 200 by transmitting resource information including server resource information and node resource information to the integrated management server 300 (S301).

통합 관리 서버(300)는 웹서버(200)로부터 수신된 실시간 상태 정보, 즉, 리소스 정보를 기초로 실시간 모니터링을 실시할 수 있다(S302).The integrated management server 300 may perform real-time monitoring based on real-time status information received from the web server 200, that is, resource information (S302).

통합 관리 서버(300)는 모니터링 시 장애가 감지되면, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 유형별 장애 진단을 수행할 수 있다(S303). 이 때, 유형별 장애 진단은 서버 내 저장되어 있는 장애 진단 및 대응 결과 정보를 기초로 하는 유기적 또는 종합적 분석에 따라 실시될 수 있다.When a failure is detected during monitoring, the integrated management server 300 may perform a failure diagnosis for each type based on rules for preset failure diagnosis and response (S303). At this time, the diagnosis of each type of failure may be performed according to an organic or comprehensive analysis based on information on the result of the diagnosis and response stored in the server.

장애 유형이 진단되면, 통합 관리 서버(300)는 상기 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 진단된 장애 유형에 대응되는 제어 명령을 웹서버(200)로 전송함으로써, 진단된 장애에 대한 대응 처리를 수행할 수 있다(S304).When the fault type is diagnosed, the integrated management server 300 transmits a control command corresponding to the diagnosed fault type to the web server 200 based on the preset rules for fault diagnosis and response, thereby diagnosing the fault type. A response process for a failure may be performed (S304).

본 발명의 일 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 과도하게 발생한 서비스 요청으로 웹서버(200)의 가용 스레드 사용량이 임계치를 초과한 것으로 판단되면, 요청 초과 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 과도하게 발생된 사용자 요청을 임시 페이지로 우회시키는 제어 명령을 웹서버(200)로 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to an embodiment of the present invention, the integrated management server 300 diagnoses a request exceeded failure when it is determined that the available thread usage of the web server 200 exceeds a threshold due to excessive service requests through real-time monitoring. , In response to a preset diagnosis and response rule, a control command for bypassing an excessively generated user request to a temporary page is transmitted to the web server 200 to respond to the diagnosed failure.

예를 들어, 웹서버(200)에 사용자로부터 대량 서비스 요청이 수신되면, 통합 관리 서버(300)가 웹서버(200)로 임시 페이지 우회 명령을 전송함에 따라, 웹서버(200)는 해당 사용자에게 임시 페이지를 제공함으로써, 요청 초과 장애가 발생하지 않도록 하거나 또는 발생된 요청 초과 장애를 신속하게 극복할 수 있다.For example, when a mass service request is received from a user to the web server 200, as the integrated management server 300 transmits a temporary page bypass command to the web server 200, the web server 200 is sent to the user. By providing a temporary page, it is possible to prevent a request exceeding failure from occurring or to quickly overcome a request exceeding failure that has occurred.

진단 장애에 대한 대응 실시 후, 웹서버(200)의 가용 스레드 사용량이 하회하여 임계치를 초과하지 않는 것으로 판단되면, 통합 관리 서버(300)는 상기 임시 페이지 우회 제어 명령을 웹서버(200)로 전송하지 않을 수 있다.After the response to the diagnosis failure, if it is determined that the available thread usage of the web server 200 is lower than the threshold, the integrated management server 300 transmits the temporary page bypass control command to the web server 200 You may not.

상기 요청 초과 장애의 경우, 통합 관리 서버(300)뿐만 아니라 웹서버(200)에서도 사용자로부터의 대량 서비스 요청이 미리 설정된 가용 스레드 사용량 임계치를 초과하는지 여부를 판단할 수 있음에 따라, 웹서버(200)에서 사용자로부터의 대량 서비스 요청이 미리 설정된 가용 스레드 사용량 임계치를 초과하는 것으로 판단되면, 웹서버(200)는 통합 관리 서버(300)로부터 임시 페이지 우회 명령을 수신하지 않고도, 웹서버(200) 자체적으로 해당 사용자에게 임시 페이지를 제공함으로써, 요청 초과 장애가 발생하지 않도록 하거나 또는 발생된 요청 초과 장애가 보다 신속하게 극복되도록 할 수 있다.In the case of the request exceeding failure, the web server 200 may be determined in the integrated management server 300 as well as the web server 200, as it is possible to determine whether a mass service request from a user exceeds a preset available thread usage threshold. ), If it is determined that the mass service request from the user exceeds a preset available thread usage threshold, the web server 200 does not receive a temporary page bypass command from the integrated management server 300, the web server 200 itself By providing a temporary page to the corresponding user, it is possible to prevent a request excess failure from occurring or to more quickly overcome the generated request excess failure.

본 발명의 다른 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되면, 대용량 데이터베이스 데이터 조회 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어 명령을 웹서버(200)로 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to another embodiment of the present invention, the integrated management server 300 diagnoses a large database data inquiry failure when a large database data inquiry for a service is requested from a user through real-time monitoring, and a preset diagnosis And a response to the diagnosed failure by forcibly terminating the corresponding service requested from the user according to the rule for the response or by transmitting a control command to the web server 200 to limit the service by a predetermined condition. have.

예를 들어, 특정 사용자가 서비스에 대한 대용량 데이터베이스 데이터 조회를 요청함에 따라 웹서버(200)의 대량 메모리가 사용되는 것으로 판단되면, 통합 관리 서버(300)가 웹서버(200)로 서비스 강제 종료 명령을 전송함에 따라, 웹서버(200)는 상기 사용자로부터 요청된 서비스를 강제로 종료시킴으로써, 대용량 데이터베이스 데이터 조회 장애가 발생하지 않도록 하거나 또는 발생된 대용량 데이터베이스 데이터 조회 장애를 신속하게 극복할 수 있다.For example, if it is determined that a large amount of memory of the web server 200 is used as a specific user requests a large database data query for the service, the integrated management server 300 commands the service to be terminated to the web server 200 By transmitting the data, the web server 200 may forcibly terminate the service requested from the user, so that a large database data inquiry failure does not occur or the generated large database data inquiry failure can be quickly overcome.

상기 대용량 데이터베이스 데이터 조회 장애의 경우, 통합 관리 서버(300)뿐만 아니라 웹서버(200)에서도 사용자로부터의 대용량 데이터베이스 데이터 조회 요청이 미리 설정된 조회 요청수의 임계치를 초과하는지 여부를 판단할 수 있음에 따라, 웹서버(200)에서 사용자로부터의 대용량 데이터베이스 데이터 조회 요청이 미리 설정된 조회 요청수의 임계치를 초과하는 것으로 판단되면, 웹서버(200)는 통합 관리 서버(300)로부터 제어 명령을 수신하지 않고도, 웹서버(200) 자체적으로 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 제어함으로써, 진단된 장애에 대한 대응을 보다 신속하게 극복할 수 있다.In the case of the large-capacity database data inquiry failure, as well as the integrated management server 300, the web server 200 can determine whether a large database data inquiry request from a user exceeds a threshold of a preset number of inquiry requests. When the web server 200 determines that a request for querying a large amount of database data from a user exceeds a threshold of a preset number of query requests, the web server 200 does not receive a control command from the integrated management server 300, The web server 200 itself controls the service to be limited by a predetermined condition by forcibly shutting down the corresponding service requested from the user or controlling the service to be restricted according to a predetermined condition for diagnosis and response. It can be overcome quickly.

본 발명의 또 다른 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 웹서버(200) 내 데이터베이스의 처리 시간 지연, 데이터베이스 잠금 상태 등에 의해 데이터베이스 연결이 과도하게 점유된 것으로 판단되면, 즉, 데이터베이스 연결 그룹이 임계치를 초과하여 특정 데이터소스의 데이터베이스 연결이 과도하게 사용되고 있는 것으로 판단되면, 데이터베이스 연결 요청 초과 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 발생된 사용자 요청을 임시 페이지로 우회시키거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 웹서버(200)로 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to another embodiment of the present invention, if the integrated management server 300 determines that the database connection is excessively occupied due to a processing time delay of a database in the web server 200 through a real-time monitoring, a database lock state, etc., that is, When the database connection group exceeds the threshold and it is determined that the database connection of a specific data source is excessively used, the database connection request exceeded fault is diagnosed, and the user request generated according to the preset rules for diagnosis and response By sending a control command to the web server 200 to bypass the temporary page or forcibly reduce the waiting time for acquiring the database connection, a response to the diagnosed failure may be performed.

진단 장애에 대한 대응 실시 후, 데이터베이스 연결 그룹이 하회하여 임계치를 초과하지 않는 것으로 판단되면, 통합 관리 서버(300)는 상기 임시 페이지 우회 제어 명령이나 해당 데이터베이스 연결 획득 대기시간 강제 단축 제어 명령을 웹서버(200)로 전송하지 않을 수 있다.After performing the response to the diagnosis failure, if it is determined that the database connection group does not exceed the threshold value, the integrated management server 300 sends the temporary page bypass control command or the corresponding database connection acquisition waiting time forced shortening control command to the web server. It may not be transmitted to (200).

본 발명의 또 다른 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 일시적인 네트워크, 연계시스템 문제 등으로 사용자로부터 요청된 서비스의 응답이 지연되거나, 사용자로부터 소정의 시간이 지연된 후에 제공되는 서비스에 대한 요청이 수신된 것으로 판단되면, 서비스 지연 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 장애가 진단된 서비스에 대한 스레드 사용률을 제한하는 제어 명령을 웹서버(200)로 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to another embodiment of the present invention, the integrated management server 300 is provided after the response of the service requested from the user is delayed or a predetermined time is delayed from the user due to a temporary network, a connection system problem, etc. through real-time monitoring. When it is determined that the request for the service is received, the service delay diagnosis is performed, and a control command for limiting the thread usage rate for the service diagnosed with the failure according to the preset rules for diagnosis and response is sent to the web server 200. By transmitting, it is possible to respond to the diagnosed disorder.

진단 장애에 대한 대응 실시 후, 서비스 지연 문제가 발생되지 않는 것으로 판단되면, 통합 관리 서버(300)는 웹서버(200)로 스레드 사용률 제한 제어 해제 명령을 전송하여 사용률 제한 제어가 실시되지 않도록 할 수 있다.After the response to the diagnosis failure, if it is determined that the service delay problem does not occur, the integrated management server 300 may transmit the thread utilization limit control release command to the web server 200 so that the utilization limit control is not performed. have.

본 발명의 또 다른 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 서비스 로직의 오류 또는 시스템의 과도한 메모리 사용에 의해 메모리 부족 문제가 발생한 것으로 판단되면, 메모리 부족 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 덤프 생성 명령 및 서버 재기동 명령을 웹서버(200)로 전송하고, 장애 발생에 대한 알람 정보를 관리자 단말기(400)로 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to another embodiment of the present invention, if the integrated management server 300 determines that a memory shortage problem is caused by an error in service logic or excessive memory use of the system through real-time monitoring, the memory shortage fault is diagnosed, and Respond to the diagnosed failure by sending a dump generation command and a server restart command to the web server 200 according to the established rules for diagnosis and response, and sending alarm information for a failure occurrence to the manager terminal 400 Can be done.

또한, 통합 관리 서버(300)는 실시간 모니터링을 통해 메모리 자동 수거 현상 발생 빈도가 증가하거나 메모리 해제 불가 등의 상황이 지속적으로 발생하는 것으로 판단되면, 웹서버(200)에 대하여 메모리 부족 장애가 발생할 것으로 미리 진단하여, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 웹서버(200)로 덤프 생성 명령을 전송하고 관리자 단말기(400)로 메모리 부족 장애 발생 가능 여부에 대한 알람을 제공함으로써, 진단된 장애에 대한 선대응을 실시할 수 있다.In addition, if it is determined that the frequency of occurrence of an automatic memory collection phenomenon increases or a memory release cannot be continuously performed through real-time monitoring, the integrated management server 300 may cause an insufficient memory failure to the web server 200 in advance. Diagnosing, by sending a dump generation command to the web server 200 according to the rules for pre-set diagnosis and response, and provides an alarm on whether or not an out-of-memory failure may occur to the administrator terminal 400, thereby detecting a diagnosed failure. It is possible to conduct a preliminary response to Korea.

본 발명의 또 다른 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 웹서버(200)로 수신된 특정 서비스에 대한 사용자의 요청이 웹서버(200)에서 처리 가능한 한계를 초과하는 것으로 판단되면, 특정 서비스의 요청 초과 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 복수의 사용자에 대한 서비스 진입이 순차적으로 이뤄지도록 하는 요청 제어 명령을 웹서버(200)로 전송하고, 해당 장애 진단에 대한 알람 정보를 관리자 단말기(400)로 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to another embodiment of the present invention, the integrated management server 300 is that the user's request for a specific service received by the web server 200 through real-time monitoring exceeds the limit that can be processed by the web server 200 If it is determined, diagnoses a request exceeded failure of a specific service, transmits a request control command to the web server 200 to sequentially enter a service for a plurality of users according to a preset rule for diagnosis and response, and , By transmitting the alarm information for the diagnosis of the failure to the manager terminal 400, it is possible to respond to the diagnosed failure.

본 발명의 또 다른 실시예에 따르면, 통합 관리 서버(300)는 실시간 모니터링을 통해 웹서버(200)가 기동 중인 상태임에도 아무 기능도 수행하지 못하는 정지(Hang) 상태인 것으로 판단되면, 정지 장애를 진단하며, 미리 설정되어 있는 진단 및 대응에 대한 규칙에 따라 웹서버(200)로 덤프 생성 명령 및 서버 재기동 명령을 전송하고, 관리자 단말기(400)로 해당 진단 장애에 대한 알람 정보를 전송함으로써, 진단된 장애에 대한 대응을 실시할 수 있다.According to another embodiment of the present invention, if the integrated management server 300 determines that the web server 200 is in a running state that does not perform any function through real-time monitoring, it stops the failure. Diagnosis, and transmits a dump generation command and a server restart command to the web server 200 according to the preset rules for diagnosis and response, and transmits alarm information for the diagnosis failure to the manager terminal 400, thereby diagnosing Responds to disabled disorders.

통합 관리 서버(300)는 장애 진단 및 대응 결과 정보를 서버 내에 저장할 수 있으며, 관리자로부터 수신되는 요청 또는 미리 설정되어 있는 소정의 주기에 의해 결과 정보를 생성하여 관리자 단말기(400)로 제공할 수 있다(S305).The integrated management server 300 may store fault diagnosis and response result information in the server, and generate result information according to a request received from a manager or a predetermined cycle, and provide the result to the manager terminal 400. (S305).

이 때, 장애 진단 및 대응 결과 정보는 시간 또는 날짜 단위에 따라 시계열로 나열된 형태의 정보로 생성 및 제공될 수 있다.At this time, the diagnosis and response result information of the failure may be generated and provided in the form of information arranged in time series according to time or date units.

또한, 상기 생성 및 저장된 장애 진단 및 대응 결과 정보는 추후 실시되는 실시간 모니터링 또는 장애 진단 시 분석 자료로 이용될 수 있다.In addition, the generated and stored fault diagnosis and response result information may be used as real-time monitoring or analysis data when fault diagnosis is performed later.

도 4는 본 발명의 일 실시예에 따라 실시간 모니터링 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.4 is a diagram illustrating a screen displayed on the manager terminal 400 when providing real-time monitoring information according to an embodiment of the present invention.

먼저, 도 4에 도시된 바와 같이, 통합 관리 서버(300)는 관리자 단말기(400)로 웹서버(200)에 대한 실시간 모니터링 정보 확인 및 통합 관리가 가능하도록 하는 화면 또는 인터페이스를 제공할 수 있다.First, as shown in FIG. 4, the integrated management server 300 may provide a screen or interface that enables real-time monitoring information confirmation and integrated management of the web server 200 to the administrator terminal 400.

통합 관리 서버(300)는 장애 진단 및 대응에 대한 결과 정보가 생성되면, 관리자 단말기(400)로 알람(401)을 제공할 수 있으며, 관리자에 의해 알람(401)이 선택되면, 관리자 단말기(400)는 통합 관리 서버(300)에서 생성된 장애 진단 및 대응에 대한 결과 정보의 목록(402)을 디스플레이 하여 제공할 수 있다.The integrated management server 300 may provide the alarm 401 to the manager terminal 400 when the result information on the diagnosis and response to the failure is generated, and when the alarm 401 is selected by the manager, the manager terminal 400 ) May display and provide a list 402 of result information on failure diagnosis and response generated by the integrated management server 300.

생성된 장애 진단 및 대응에 대한 결과 정보 중 어느 하나(403)가 관리자에 의해 선택되면, 관리자 단말기(400)는 해당 장애 진단 및 대응에 대한 결과 정보를 디스플레이 하여 제공하는데, 이에 대해서는 도 5에서 상세하게 설명하기로 한다.If any one of the generated result information for the diagnosis and response to the failure 403 is selected by the administrator, the administrator terminal 400 displays and provides the result information for the corresponding diagnosis and response, which is detailed in FIG. 5. I will explain.

관리자로부터 알람 이력 정보 제공에 대한 실행창(404)이 선택 입력되면, 관리자 단말기(400)는 통합 관리 서버(300)로부터 제공된 알람 이력 정보(405)를 디스플레이 하여 제공할 수 있다. 이 때, 알람 이력 정보는 최근 1개월 이내의 이력 정보에 대해서만 제공될 수 있다.When the execution window 404 for providing alarm history information is selected and input from the administrator, the administrator terminal 400 may display and provide the alarm history information 405 provided from the integrated management server 300. At this time, the alarm history information may be provided only for the history information within the last month.

관리자 단말기(400)는 통합 관리 서버(300)로부터 제공되는 실시간 모니터링 화면을 통해 복수의 서버 및 노드에 대한 요약 정보(406)를 디스플레이 하여 관리자에게 제공할 수 있다.The manager terminal 400 may display summary information 406 for a plurality of servers and nodes through a real-time monitoring screen provided from the integrated management server 300 and provide it to the manager.

또한, 관리자 단말기(400)는 실시간 모니터링 화면을 통해 복수의 웹서버(200) 각각에 대한 상세 정보(407)를 제공할 수 있다.In addition, the administrator terminal 400 may provide detailed information 407 for each of the plurality of web servers 200 through a real-time monitoring screen.

도 5는 본 발명의 일 실시예에 따라 장애 진단 및 대응에 대한 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.5 is a diagram illustrating a screen displayed on the manager terminal 400 when providing result information on diagnosis and response to a failure according to an embodiment of the present invention.

도 5에 도시된 바와 같이, 장애 진단 및 대응에 대한 결과 정보는 공통 정보(501), 진단 결과 정보(502) 및 상세 정보(503)로 구분되어 제공될 수 있다.As illustrated in FIG. 5, the result information for diagnosis and response to a failure may be provided by being divided into common information 501, diagnosis result information 502, and detailed information 503.

특히, 진단 결과 정보(502)를 통해 시간대 별 진단 결과 확인이 가능하며, 특정 진단 시점에 대한 상세 정보(503)가 제공됨에 따라 진단 별 상세 내용 확인이 가능하다.In particular, the diagnosis result information can be checked for each time zone through the diagnosis result information 502, and detailed information for each diagnosis can be checked as detailed information 503 for a specific diagnosis time point is provided.

구체적으로, 공통 정보(501)에는 장애가 감지된 최초 시간인 진단 수행 시간(Start Time), 장애가 감지된 마지막 시간인 진단 종료 시간(End Time), 장애가 발생한 총 횟수인 동일 진단 반복 횟수 정보(Total Diagnostics Repeat Count), 장애 진단 및 대응에 대한 결과 정보가 생성된 횟수인 결과 정보 생성 횟수 정보(Total Report Creation Count)가 포함될 수 있다.Specifically, the common information 501 includes information on the number of times the diagnosis was started (Start Time), the last time the fault was detected, the end time of the diagnosis (End Time), and the total number of times the fault was detected (Total Diagnostics) Repeat Count), and the result information generation count information (Total Report Creation Count), which is the number of times result information for fault diagnosis and response is generated, may be included.

본 발명의 일 실시예에 따르면, 통합 관리 서버(300)는 진단된 장애 유형이 동일한 유형이라고 판단되면, 최대 3건까지만 결과 정보를 생성하여, 다수의 동일한 결과 정보가 생성됨을 방지할 수 있다. 반면, 진단된 장애 유형이 동일하지 않은 유형이라고 판단되면, 통합 관리 서버(300)는 최대 100건의 결과 정보를 생성할 수 있다.According to an embodiment of the present invention, if it is determined that the diagnosed failure type is the same type, the integrated management server 300 may generate up to 3 result information, thereby preventing a plurality of identical result information from being generated. On the other hand, if it is determined that the diagnosed failure type is not the same type, the integrated management server 300 may generate up to 100 result information.

따라서, 공통 정보(501)를 통해, 관리자 입장에서는 동일 진단 반복 횟수 정보가 결과 정보 생성 횟수 정보 보다 큰 경우, 동일한 장애 진단이 다수 발생했다는 것을 판단할 수 있다.Therefore, through the common information 501, when the same diagnosis repetition number information is greater than the result information generation number information, it can be determined from the administrator's point of view that a plurality of the same diagnosis has occurred.

한편, 진단 결과 정보(502)는 장애가 진단된 시간 순으로 나열되어 제공될 수 있으며, 진단 시간에 따라 발생된 장애 유형이 색상으로 별도 표기되어 제공될 수 있다.Meanwhile, the diagnosis result information 502 may be provided in the order in which the disorders are diagnosed, and the types of the faults generated according to the diagnosis time may be separately provided in color.

제공된 복수의 진단 결과 정보(502) 중 어느 하나가 선택되면, 선택된 진단 결과에 대한 상세 정보(503)가 제공될 수 있다.If any one of the plurality of provided diagnostic result information 502 is selected, detailed information 503 for the selected diagnostic result may be provided.

상세 정보(503)에는 장애 진단 시간 정보(504), 덤프 생성 시간 정보(505), 생성된 덤프 파일(506) 및 진단된 장애 유형에 대한 대응 정보(507)가 공통으로 포함되어 제공될 수 있다.The detailed information 503 may be provided by commonly including the fault diagnosis time information 504, the dump generation time information 505, the generated dump file 506, and the corresponding information 507 for the diagnosed fault type. .

도 6은 본 발명의 일 실시예에 따라 요청 초과 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.6 is a diagram illustrating a screen displayed on the manager terminal 400 when providing result information according to a request exceeded fault diagnosis according to an embodiment of the present invention.

도 6에 도시된 바와 같이, 요청 초과 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 진단 시 사용된 임계값 정보(601), 임계값을 초과한 커넥터(Connector) 별 실제 사용률 정보(602) 및 장애 진단 시 다수 요청된 5건에 대한 서비스 정보(603)가 더 포함되어 제공될 수 있다.As illustrated in FIG. 6, when providing the result information according to the request exceeded fault diagnosis, the detailed information 503 includes threshold information 601 used at the time of diagnosis and actual utilization information for each connector exceeding the threshold value ( 602) and service information 603 for a plurality of requested 5 cases when diagnosing a disorder may be further included and provided.

이 때, 장애 진단 시 다수 요청된 5건에 대한 서비스 정보(603)에는 서비스 명칭과 서비스 별 평균 호출 횟수 정보가 포함되어 있을 수 있으며, 평균 호출 횟수 정보는, 5초 간격으로 3회 측정하여 산출된 평균 횟수일 수 있다.At this time, the service information 603 for a number of requests for diagnosis of a failure may include service name and average number of calls per service, and average number of calls is measured and calculated three times at 5 second intervals. It may be the average number of times.

도 7은 본 발명의 일 실시예에 따라 대용량 데이터베이스 데이터 조회 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.7 is a diagram illustrating a screen displayed on the manager terminal 400 when providing result information according to diagnosis of a large database data inquiry failure according to an embodiment of the present invention.

도 7에 도시된 바와 같이, 대용량 데이터베이스 데이터 조회 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 진단 시 사용된 임계값 정보(701) 및 대용량 데이터베이스 데이터를 조회 요청한 서비스의 목록(702)이 더 포함되어 제공될 수 있다.As shown in FIG. 7, when providing the result information according to the diagnosis of a large database data query failure, the detailed information 503 includes threshold information 701 used during diagnosis and a list of services requesting the query of large database data 702 This may be included further.

도 8은 본 발명의 일 실시예에 따라 데이터베이스 연결 요청 초과 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.8 is a diagram illustrating a screen displayed on the manager terminal 400 when providing result information according to a diagnosis of a failure exceeding a database connection request according to an embodiment of the present invention.

도 8에 도시된 바와 같이, 데이터베이스 연결 요청 초과 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 진단 시 사용된 임계값 정보(801) 및 데이터베이스 연결 그룹 사용량이 임계값을 초과한 데이터소스 및 데이터소스 별 사용률 정보(802)가 더 포함되어 제공될 수 있다.As illustrated in FIG. 8, when providing the result information according to the diagnosis of a database connection request exceeded failure, the detailed information 503 includes a threshold information 801 used at the time of diagnosis and a data source in which database connection group usage exceeds a threshold value And usage rate information 802 for each data source.

도 9는 본 발명의 일 실시예에 따라 서비스 지연 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.9 is a diagram illustrating a screen displayed on the manager terminal 400 when providing result information according to a service delay failure diagnosis according to an embodiment of the present invention.

도 9에 도시된 바와 같이, 서비스 지연 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 진단 시 사용된 임계값 정보(901) 및 서비스 지연 목록(902)이 더 포함되어 제공될 수 있다.As illustrated in FIG. 9, when providing the result information according to the service delay failure diagnosis, the detailed information 503 may further include the threshold information 901 and the service delay list 902 used in the diagnosis. .

이 때, 서비스 지연 목록(902)에는 서비스 명칭, 장애 진단 시점에 수행중인 서비스의 총 개수, 서비스 총 개수 대비 서비스 지연으로 판단된 서비스 개수, 장애 진단 시점 기준의 서비스 수행 시간 정보 등이 포함되어 제공될 수 있다.At this time, the service delay list 902 includes the service name, the total number of services being performed at the time of failure diagnosis, the number of services determined to be service delay compared to the total number of services, and service execution time information based on the time of failure diagnosis. Can be.

도 10은 본 발명의 일 실시예에 따라 메모리 부족 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.10 is a diagram illustrating a screen displayed on the manager terminal 400 when providing result information according to a diagnosis of a memory shortage failure according to an embodiment of the present invention.

도 10에 도시된 바와 같이, 메모리 부족 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 메모리 부족 장애에 대한 세부 항목 정보(101)가 더 포함되어 제공될 수 있다.As illustrated in FIG. 10, when providing the result information according to the diagnosis of insufficient memory failure, the detailed information 503 may further include and provide detailed item information 101 about the insufficient memory failure.

메모리 부족 장애에 대한 세부 항목 정보(101)에는, Heap 사용률, 메모리 자동 수거 현상 빈도, Leak 여부, 대용량 데이터베이스 데이터 조회 요청 여부 및 heap dump 생성 시 파일명 정보 등이 포함되어 제공될 수 있다.The detailed item information 101 about the memory shortage failure may include and be provided with a heap utilization rate, a frequency of automatic memory collection, a leak, a request for querying a large database data, and file name information when creating a heap dump.

도 11은 본 발명의 일 실시예에 따라 특정 서비스의 요청 초과 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.11 is a diagram illustrating a screen displayed on the manager terminal 400 when providing result information according to diagnosis of a request exceeded failure of a specific service according to an embodiment of the present invention.

도 11에 도시된 바와 같이, 특정 서비스의 요청 초과 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 진단 시 사용된 임계값 정보(111), 대상 서비스가 과점유한 커넥터(Connector) 정보(112) 및 다수 수행된 서비스 5건에 대한 목록(113)이 더 포함되어 제공될 수 있다.As illustrated in FIG. 11, when providing result information according to a request exceeding fault diagnosis of a specific service, the detailed information 503 includes threshold information 111 used during diagnosis, and connector information occupied by the target service ( 112) and a list 113 of five performed services may be further included and provided.

이 때, 다수 수행된 서비스 5건에 대한 목록(113)에는 서비스 명칭과 서비스 요청된 횟수 정보가 포함되어 제공될 수 있다.At this time, the list 113 of the five services performed may include the service name and the number of service requests.

도 12는 본 발명의 일 실시예에 따라 정지 장애 진단에 따른 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.12 is a diagram illustrating a screen displayed on the manager terminal 400 when providing result information according to diagnosis of a stop disorder according to an embodiment of the present invention.

도 12에 도시된 바와 같이, 정지 장애 진단에 따른 결과 정보 제공 시, 상세 정보(503)에는 연결 타임아웃 시간 정보 및 재시도 횟수 정보(121)가 더 포함되어 제공될 수 있다.As illustrated in FIG. 12, when providing the result information according to the diagnosis of the stop disorder, the detailed information 503 may further include connection timeout time information and retry count information 121.

도 13은 본 발명의 일 실시예에 따라 시계열로 나열된 통계 형태의 장애 진단 및 대응에 대한 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.13 is a diagram illustrating a screen displayed on the manager terminal 400 when providing result information on diagnosis and response to a failure in the form of statistics arranged in a time series according to an embodiment of the present invention.

도 13에 도시된 바와 같이, 관리자 단말기(400)는 통합 관리 서버(300)로부터 제공된 날짜 기준의 시계열로 나열된 형태의 연간 장애 진단 결과(131)를 디스플레이 하여 관리자에게 제공할 수 있으며, 관리자에 의해 특정일이 선택되면(132), 선택된 날짜에 발생된 진단 결과가 시간 기준으로 나열된 형태의 결과 정보(133)를 디스플레이 하여 제공할 수 있다.As shown in FIG. 13, the manager terminal 400 may display the annual failure diagnosis result 131 in the form of a time series based on a date provided from the integrated management server 300 and provide it to the manager, by the manager When a specific day is selected (132), the diagnosis result generated on the selected date may be displayed and provided in the form of result information 133 listed based on time.

도 14는 본 발명의 일 실시예에 따라 진단 이력 검색 결과 정보 제공 시 관리자 단말기(400)에 디스플레이 되는 화면을 예시하는 도면이다.14 is a diagram illustrating a screen displayed on the manager terminal 400 when providing diagnosis history search result information according to an embodiment of the present invention.

관리자는 관리자 단말기(400)를 통해 조회하고자 하는 웹서버(200)의 장애 진단 요약 정보 및 장애 진단 및 대응에 대한 결과 정보를 검색할 수 있다(141).The administrator may search the summary information of the failure diagnosis of the web server 200 to be searched through the administrator terminal 400 and the result information of the diagnosis and response to the failure (141).

이 때, 장애 진단 및 대응에 대한 결과 정보는 통합 관리 서버(300)에 7일간 보관되며, 7일 이후에 생성된 결과 정보는 자동으로 삭제될 수 있다.At this time, the result information for the diagnosis and response to the failure is stored in the integrated management server 300 for 7 days, and the result information generated after 7 days may be automatically deleted.

관리자에 의해 장애가 진단된 날짜 중 어느 하나가 선택되면(142), 관리자 단말기(400)는 해당 날짜에 생성된 장애 진단 및 대응에 대한 결과 정보 목록(143)을 디스플레이 하여 제공할 수 있다.When any one of the dates in which the failure is diagnosed by the administrator is selected (142), the administrator terminal 400 may display and provide a result information list 143 for diagnosis and response to the failure generated on the date.

이와 같이, 본 발명의 일 실시예에 따르면, 일부 장애 현상에 대한 처리가 아닌, 다양한 장애 유형을 기반으로 복합 서버 장애 진단 및 대응을 실시함으로써, 서버에서 발생 가능한 다양한 장애에 대한 예방 및 방지가 가능한 바, 서버 운용에 있어서 신뢰성 및 안정성이 확보될 수 있다.As described above, according to an embodiment of the present invention, it is possible to prevent and prevent various failures that may occur in a server by performing a complex server failure diagnosis and response based on various failure types, rather than processing for some failure phenomenon. Bar and reliability can be secured in server operation.

본 발명의 다른 실시예에 따르면, 미리 설정되어 있는 규칙 기반의 장애 진단 및 대응을 실시함으로써, 서버 장애 발생 시, 미리 설정되어 있는 규칙을 기반으로 하여 자동적으로 장애에 대한 대응이 실시되는 바, 서버 장애가 발생 즉시 극복될 수 있다.According to another embodiment of the present invention, by performing a rule-based failure diagnosis and response based on a preset rule, when a server failure occurs, a response to a failure is automatically performed based on a preset rule, the server The obstacle can be overcome immediately.

본 발명의 또 다른 실시예에 따르면, 웹서버의 리소스 정보를 기초로 서버에 대한 통합 관리 및 실시간 제어를 수행하는 바, 서버 무중단 제어가 가능하다는 장점이 있다.According to another embodiment of the present invention, the server performs integrated management and real-time control of the server based on the resource information of the web server, and thus has an advantage that server uninterrupted control is possible.

본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.It should be understood that the effects of the present invention are not limited to the above-described effects, and include all effects that can be deduced from the configuration of the invention described in the detailed description or claims of the present invention.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.The above description of the present invention is for illustration only, and those skilled in the art to which the present invention pertains can understand that the present invention can be easily modified into other specific forms without changing the technical spirit or essential features of the present invention. will be. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive. For example, each component described as a single type may be implemented in a distributed manner, and similarly, components described as distributed may be implemented in a combined form.

본 발명의 범위는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is indicated by the following claims, and all modifications or variations derived from the meaning and scope of the claims and their equivalent concepts should be interpreted to be included in the scope of the present invention.

100 : 사용자 단말기
200 : 웹서버
300 : 통합 관리 서버
310 : 장애 진단부
320 : 장애 처리부
330 : 결과 제공부
340 : 저장부
400 : 관리자 단말기
100: user terminal
200: web server
300: integrated management server
310: disability diagnosis unit
320: fault handling unit
330: result providing unit
340: storage unit
400: administrator terminal

Claims (36)

통합 관리 서버가, 장애 유형을 기반으로 하여 서버 장애를 진단하고 대응하는 방법에 있어서,
(a) 웹서버로부터 수신되는 실시간 상태 정보를 기초로 웹서버에 대한 모니터링을 수행하여, 장애가 감지되면, 감지된 장애의 유형을 진단하는 단계;
(b) 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 상기 진단된 장애 유형에 대응되는 제어 명령을 상기 웹서버로 전송함으로써 상기 웹서버가 상기 제어 명령에 따라 상기 감지된 장애에 대한 선대응 또는 즉시대응을 자동으로 실시하도록 제어하는 단계; 및
(c) 장애 진단 및 대응에 대한 결과 정보를 생성하여 저장하고, 생성한 결과 정보를 관리자 단말기로 전송하는 단계를 포함하고,
상기 (a) 단계는,
상기 웹서버에 대한 서버 리소스 정보 및 노드 리소스 정보를 포함하는 상기 실시간 상태 정보와 상기 장애 진단 및 대응에 대한 규칙을 기반으로 분석을 실시하여, 상기 감지된 장애의 유형을 요청 초과 장애, 대용량 데이터베이스 데이터 조회 장애, 데이터베이스 연결 요청 초과 장애, 서비스 지연 장애, 메모리 부족 장애, 특정 서비스의 요청 초과 장애 및 정지 장애 중 어느 하나로 진단하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
A method for the integrated management server to diagnose and respond to a server failure based on the type of failure,
(a) performing monitoring on the web server based on real-time status information received from the web server, and if a failure is detected, diagnosing the type of the detected failure;
(b) the web server transmits a control command corresponding to the diagnosed fault type to the web server based on a preset rule for diagnosis and response of the fault, so that the web server responds to the detected fault according to the control command. Controlling to automatically perform a line response or an immediate response; And
(c) generating and storing result information for diagnosis and response to the failure, and transmitting the generated result information to the manager terminal,
Step (a) is,
Analysis based on the real-time status information including the server resource information and the node resource information for the web server and the rules for diagnosing and responding to the failure, requesting the detected type of failure exceeded failure, large-capacity database data A method of diagnosing and responding to a server failure based on a type of failure, comprising diagnosing one of a query failure, a database connection request exceeded failure, a service delay failure, an out-of-memory failure, and a request for a particular service.
제1항에 있어서,
상기 (c) 단계는,
동일한 유형으로 진단된 장애에 대한 상기 장애 진단 및 대응에 대한 결과 정보의 생성 개수를 기설정 개수 이하로 제한하는 단계를 더 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Step (c) is,
A method of diagnosing and responding to a server failure based on a failure type, further comprising the step of limiting the number of generations of result information on the failure diagnosis and response to a failure diagnosed with the same type to a preset number or less.
제1항에 있어서,
상기 장애 진단 및 대응에 대한 결과 정보는
상기 장애가 감지된 최초 시간을 나타내는 진단 수행 시간, 상기 장애가 감지된 마지막 시간을 나타내는 진단 종료 시간, 상기 진단된 장애 유형과 동일한 유형의 장애가 발생한 총 횟수를 나타내는 동일 진단 반복 횟수 정보 및 장애 진단 및 대응에 대한 결과 정보가 생성된 총 횟수를 나타내는 결과 정보 생성 횟수 정보를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Result information on the diagnosis and response to the disorder
Diagnosis execution time indicating the first time the failure was detected, diagnosis end time indicating the last time the failure was detected, the same diagnosis repetition number information indicating the total number of occurrences of the same type of fault as the diagnosed fault type, and fault diagnosis and response A method for diagnosing and responding to a server failure based on a type of failure, including information on the number of result information generated indicating the total number of times the result information has been generated.
제1항에 있어서,
상기 (a) 단계는,
상기 실시간 상태 정보와 상기 통합 관리 서버 내 장애 진단 및 대응에 대한 결과 정보가 누적 저장되어 있는 이력 정보를 기반으로 분석을 실시하여 상기 감지된 장애의 유형을 진단하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Step (a) is,
And analyzing a diagnosis based on the real-time status information and history information in which result information for diagnosis and response of the failure in the integrated management server is accumulated, and diagnosing the detected type of the failure. How to diagnose and respond to server failures.
제1항에 있어서,
상기 (b) 단계는,
상기 진단된 장애 유형에 대한 알람 정보를 상기 관리자 단말기로 전송함으로써 상기 감지된 장애에 대한 대응을 실시하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Step (b) is,
And performing a response to the detected failure by sending the alarm information for the diagnosed failure type to the manager terminal.
삭제delete 제1항에 있어서,
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 상기 웹서버의 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되면, 요청 초과 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키는 제어 명령을 상기 웹서버로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
When it is determined through the monitoring that the available thread usage of the web server exceeds a threshold, the request is diagnosed as a failure, and the user request is temporarily based on a preset failure diagnosis and response rule. And transmitting a control command to bypass the page to the web server.
제7항에 있어서,
상기 사용자 요청을 임시 페이지로 우회시키는 제어는,
상기 웹서버 내에서 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되어, 요청 초과 장애가 진단되면, 상기 웹서버 자체적으로 요청 초과 장애 진단 즉시 자동 수행 가능한 것을 특징으로 하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
The method of claim 7,
Control to bypass the user request to a temporary page,
When it is determined that the usage of available threads in the web server exceeds a threshold, and a request exceeded fault is diagnosed, the web server itself can automatically perform a request exceeded fault diagnosis, which is based on a fault type based server fault How to diagnose and respond.
제1항에 있어서,
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되면, 대용량 데이터베이스 데이터 조회 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어 명령을 상기 웹서버로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
When it is determined through the monitoring that a large database data query for the service is requested from the user, the large database data query is diagnosed as a failure, and the request requested by the user is based on a preset rule for diagnosis and response to the failure. A method of diagnosing and responding to a server failure based on a type of failure, comprising the step of forcibly terminating the service or transmitting a control command to limit the service by a predetermined condition to the web server.
제9항에 있어서,
상기 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어는,
상기 웹서버 내에서 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되어, 대용량 데이터베이스 데이터 조회 장애가 진단되면, 상기 웹서버 자체적으로 대용량 데이터베이스 데이터 조회 장애 진단 즉시 자동 수행 가능한 것을 특징으로 하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
The method of claim 9,
The control for forcibly terminating the corresponding service requested from the user or for restricting the service by a predetermined condition,
When it is determined that a large database data inquiry for a service is requested from a user in the web server, and a large database data inquiry failure is diagnosed, the web server itself can automatically perform a large database data inquiry failure diagnosis immediately Type-based server failure diagnosis and response method.
제1항에 있어서,
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 상기 웹서버 내 데이터베이스 연결 그룹(Pool)이 임계치를 초과하여 특정 데이터소스(Datasource)의 데이터베이스 연결이 과도하게 사용되고 있는 것으로 판단되면, 데이터베이스 연결 요청 초과 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 상기 웹서버로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
When it is determined through the monitoring that the database connection group (Pool) in the web server exceeds the threshold and database connection of a specific data source is excessively used, it is diagnosed as a failure exceeding the database connection request, and is set in advance. Based on the rules for diagnosis and response to a failure, the method comprising a type of failure-based server, comprising: sending a control command to the web server to bypass a user request to a temporary page or forcibly reduce a waiting time for obtaining a corresponding database connection. Disability Diagnosis and Response Methods.
제1항에 있어서,
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 사용자로부터 요청된 서비스의 응답이 지연되거나 사용자로부터 소정의 시간이 지연된 후에 제공되는 서비스에 대한 요청이 수신된 것으로 판단되면, 서비스 지연 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 장애가 진단된 서비스에 대한 스레드 사용률을 제한하는 제어 명령을 상기 웹서버로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
When it is determined through the monitoring that a response to a service requested from a user is delayed or a request for a service provided after a predetermined time is delayed from the user, it is diagnosed as a service delay failure, and a preset failure diagnosis and response Based on the rule for, comprising the step of transmitting a control command for limiting the thread usage rate for the service diagnosed with a failure to the web server, the failure type based server failure diagnosis and response method.
제1항에 있어서,
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 서비스 로직(Logic)의 오류 또는 시스템의 과도한 메모리 사용에 의해 메모리 부족 문제(Out Of Memory, OOM)가 발생하거나 메모리 자동 수거 현상(Full Garbage Collection, Full GC) 발생 빈도가 증가하거나 메모리 해제 불가의 상황이 지속적으로 발생하는 것으로 판단되면, 메모리 부족 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 덤프 생성 명령 및 서버 재기동 명령을 상기 웹서버로 전송하고, 알람 정보를 상기 관리자 단말기로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
Through the monitoring, out of memory (OOM) occurs due to errors in service logic or excessive memory use in the system, or the frequency of occurrence of full garbage collection (full GC) increases or memory If it is determined that the situation of non-cancellation occurs continuously, it diagnoses as an out-of-memory failure, and transmits a dump generation command and a server restart command to the web server based on a preset rule for diagnosis and response to a failure. And transmitting the alarm information to the manager terminal.
제1항에 있어서,
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 상기 웹서버로 수신된 특정 서비스에 대한 사용자의 요청이 상기 웹서버에서 처리 가능한 한계를 초과하는 것으로 판단되면, 특정 서비스의 요청 초과 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 복수의 사용자에 대한 서비스 진입이 순차적으로 이뤄지도록 하는 요청 제어 명령을 상기 웹서버로 전송하고, 해당 장애 진단에 대한 알람 정보를 상기 관리자 단말기로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
When it is determined through the monitoring that a user request for a specific service received by the web server exceeds a limit that can be processed by the web server, it is diagnosed as a request exceeding failure of a specific service, and diagnoses and responds to a preset failure. And transmitting a request control command for sequentially entering service for a plurality of users to the web server based on a rule for, and transmitting alarm information for the diagnosis of the failure to the manager terminal. , Failure type based server failure diagnosis and response method.
제1항에 있어서,
상기 (a) 및 (b) 단계는,
상기 모니터링을 통해 상기 웹서버가 기동 중인 상태임에도 아무 기능도 수행하지 못하는 정지(Hang) 상태인 것으로 판단되면, 정지 장애로 진단하고, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 상기 웹서버로 덤프 생성 명령 및 서버 재기동 명령을 전송하고, 상기 관리자 단말기로 해당 진단 장애에 대한 알람 정보를 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Steps (a) and (b) are:
If it is determined through the monitoring that the web server is in a stopped state that does not perform any function even though it is in the running state, it is diagnosed as a stopped fault and based on the rules for preset fault diagnosis and response, And sending a dump generation command and a server restart command to the web server, and transmitting alarm information for a corresponding diagnosis fault to the manager terminal.
제1항에 있어서,
상기 (c) 단계는,
상기 장애 진단 및 대응에 대한 결과 정보를 시계열로 나열된 통계 정보 형태로 생성하여 상기 관리자 단말기로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Step (c) is,
And generating the result information on the diagnosis and response in the form of statistical information arranged in a time series and transmitting the result to the manager terminal.
제1항에 있어서,
상기 (c) 단계는,
상기 관리자 단말기로부터 수신되는 관리자의 요청 또는 미리 설정되어 있는 소정의 주기에 의해 상기 장애 진단 및 대응에 대한 결과 정보를 생성하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Step (c) is,
And generating result information for the diagnosis and response to the failure at the request of the administrator received from the administrator terminal or a predetermined period of time.
제1항에 있어서,
상기 (c) 단계는,
상기 관리자 단말기로부터 소정의 검색 조건이 포함된 정보 조회 요청이 수신되면, 수신된 소정의 검색 조건에 상응하는 장애 진단 및 대응에 대한 결과 정보를 생성하여 상기 관리자 단말기로 전송하는 단계를 포함하는, 장애 유형 기반의 서버 장애 진단 및 대응 방법.
According to claim 1,
Step (c) is,
When the request for information inquiry including a predetermined search condition is received from the manager terminal, generating and transmitting result information on the diagnosis and response to the failure corresponding to the received predetermined search condition, and transmitting the result information to the manager terminal. Type-based server failure diagnosis and response method.
웹서버로부터 수신되는 실시간 상태 정보를 기초로 웹서버에 대한 모니터링을 수행하여, 장애가 감지되면, 감지된 장애의 유형을 진단하는 장애 진단부;
미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여 상기 진단된 장애 유형에 대응되는 제어 명령을 상기 웹서버로 전송함으로써 상기 웹서버가 상기 제어 명령에 따라 상기 감지된 장애에 대한 선대응 또는 즉시대응을 자동으로 실시하도록 제어하는 장애 처리부;
장애 진단 및 대응에 대한 결과 정보를 생성하여 관리자 단말기로 전송하는 결과 제공부; 및
상기 생성한 장애 진단 및 대응에 대한 결과 정보를 저장하는 저장부를 포함하고,
상기 장애 진단부는,
상기 웹서버에 대한 서버 리소스 정보 및 노드 리소스 정보를 포함하는 상기 실시간 상태 정보와 상기 장애 진단 및 대응에 대한 규칙을 기반으로 분석을 실시하여, 상기 감지된 장애의 유형을 요청 초과 장애, 대용량 데이터베이스 데이터 조회 장애, 데이터베이스 연결 요청 초과 장애, 서비스 지연 장애, 메모리 부족 장애, 특정 서비스의 요청 초과 장애 및 정지 장애 중 어느 하나로 진단하는, 통합 관리 서버.
A failure diagnosis unit that performs monitoring on the web server based on real-time status information received from the web server, and detects a type of the detected failure when a failure is detected;
The web server responds in advance to the detected failure according to the control command by transmitting a control command corresponding to the diagnosed fault type to the web server based on a preset rule for fault diagnosis and response. A failure processing unit that controls to perform an immediate response automatically;
A result providing unit generating and transmitting result information on the diagnosis and response to the manager terminal; And
It includes a storage unit for storing the result information for the generated diagnosis and response to the failure,
The disorder diagnosis unit,
Analysis based on the real-time status information including the server resource information and the node resource information for the web server and the rules for diagnosing and responding to the failure, requesting the detected type of failure exceeded failure, large-capacity database data An integrated management server that diagnoses any one of inquiry failure, database connection request exceeded failure, service delay failure, insufficient memory failure, specific service request exceeded failure and stop failure.
제19항에 있어서,
상기 결과 제공부는,
동일한 유형으로 진단된 장애에 대한 상기 장애 진단 및 대응에 대한 결과 정보의 생성 개수를 기설정 개수 이하로 제한하는, 통합 관리 서버.
The method of claim 19,
The result providing unit,
An integrated management server that limits the number of generations of result information for the diagnosis and response to the diagnosis of a failure diagnosed with the same type to a preset number or less.
제19항에 있어서,
상기 장애 진단 및 대응에 대한 결과 정보는
상기 장애가 감지된 최초 시간을 나타내는 진단 수행 시간, 상기 장애가 감지된 마지막 시간을 나타내는 진단 종료 시간, 상기 진단된 장애 유형과 동일한 유형의 장애가 발생한 총 횟수를 나타내는 동일 진단 반복 횟수 정보 및 장애 진단 및 대응에 대한 결과 정보가 생성된 총 횟수를 나타내는 결과 정보 생성 횟수 정보를 포함하는, 통합 관리 서버.
The method of claim 19,
Result information on the diagnosis and response to the disorder
Diagnosis execution time indicating the first time the failure was detected, diagnosis end time indicating the last time the failure was detected, the same diagnosis repetition number information indicating the total number of occurrences of the same type of fault as the diagnosed fault type, and fault diagnosis and response Integrated management server including result information generation number information indicating the total number of times the result information is generated.
제19항에 있어서,
상기 장애 진단부는,
상기 실시간 상태 정보와 상기 통합 관리 서버 내 장애 진단 및 대응에 대한 결과 정보가 누적 저장되어 있는 이력 정보를 기반으로 분석을 실시하여 상기 감지된 장애의 유형을 진단하는, 통합 관리 서버.
The method of claim 19,
The disorder diagnosis unit,
An integrated management server that diagnoses the type of the detected failure by performing an analysis based on the real-time status information and history information in which result information for diagnosis and response of failures in the integrated management server is accumulated.
제19항에 있어서,
상기 장애 처리부는,
상기 진단된 장애 유형에 대한 알람 정보를 상기 관리자 단말기로 전송함으로써 상기 감지된 장애에 대한 대응을 실시하는, 통합 관리 서버.
The method of claim 19,
The failure processing unit,
An integrated management server that responds to the detected failure by sending alarm information for the diagnosed failure type to the manager terminal.
삭제delete 제19항에 있어서,
상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버의 가용 스레드(Thead) 사용량이 임계치를 초과한 것으로 판단되면, 요청 초과 장애로 진단하고,
상기 장애 처리부는, 상기 요청 초과 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키는 제어 명령을 상기 웹서버로 전송하는, 통합 관리 서버.
The method of claim 19,
The failure diagnosis unit diagnoses as a request exceeded failure when it is determined that the usage amount of the available thread (Thead) of the web server exceeds a threshold through the monitoring,
The failure processing unit, when diagnosed as the request exceeded failure, based on the rules for the preset failure diagnosis and response, transmits a control command to bypass the user request to a temporary page, the integrated management server.
제25항에 있어서,
상기 사용자 요청을 임시 페이지로 우회시키는 제어는,
상기 웹서버 내에서 가용 스레드(Thread) 사용량이 임계치를 초과한 것으로 판단되어, 요청 초과 장애가 진단되면, 상기 웹서버 자체적으로 요청 초과 장애 진단 즉시 자동 수행 가능한 것을 특징으로 하는, 통합 관리 서버.
The method of claim 25,
Control to bypass the user request to a temporary page,
If it is determined that the available thread usage in the web server exceeds a threshold, and a request exceeded fault is diagnosed, the web server itself can automatically perform a request exceeded fault diagnosis immediately, integrated management server.
제19항에 있어서,
상기 장애 진단부는, 상기 모니터링을 통해 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되면, 대용량 데이터베이스 데이터 조회 장애로 진단하고,
상기 장애 처리부는, 상기 대용량 데이터베이스 데이터 조회 장애로 판단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어 명령을 상기 웹서버로 전송하는, 통합 관리 서버.
The method of claim 19,
When it is determined that a query for a large amount of database data for a service is requested from a user through the monitoring, the failure diagnosis unit diagnoses a failure in a large amount of database data inquiry,
When it is determined that the large-capacity database data inquiry failure is determined, the failure processing unit forcibly terminates the corresponding service requested from the user or performs a service under a predetermined condition based on a preset rule for diagnosis and response to the failure. An integrated management server that transmits control commands to be restricted to the web server.
제27항에 있어서,
상기 사용자로부터 요청된 해당 서비스를 강제로 종료시키거나 소정 조건에 의해 서비스가 제한되도록 하는 제어는,
상기 웹서버 내에서 사용자로부터 서비스에 대한 대용량 데이터베이스 데이터 조회가 요청된 것으로 판단되어, 대용량 데이터베이스 데이터 조회 장애가 진단되면, 상기 웹서버 자체적으로 대용량 데이터베이스 데이터 조회 장애 진단 즉시 자동 수행 가능한 것을 특징으로 하는, 통합 관리 서버.
The method of claim 27,
The control for forcibly terminating the corresponding service requested from the user or for restricting the service by a predetermined condition,
When it is determined that a large database data inquiry for a service is requested from a user within the web server, and a large database data inquiry failure is diagnosed, the web server itself can automatically perform a large database data inquiry failure diagnosis immediately and is integrated. Management server.
제19항에 있어서,
상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버 내 데이터베이스 연결 그룹(Pool)이 임계치를 초과하여 특정 데이터소스(Datasource)의 데이터베이스 연결이 과도하게 사용되고 있는 것으로 판단되면, 데이터베이스 연결 요청 초과 장애로 진단하고,
상기 장애 처리부는, 상기 데이터베이스 연결 요청 초과 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 사용자 요청을 임시 페이지로 우회시키거나 해당 데이터베이스 연결 획득 대기시간을 강제로 줄이는 제어 명령을 상기 웹서버로 전송하는, 통합 관리 서버.
The method of claim 19,
If it is determined through the monitoring that the database connection group (Pool) in the web server exceeds a threshold and database connection of a specific data source (Datasource) is excessively used, diagnoses a database connection request excess failure. ,
When the failure processing unit is diagnosed as a failure exceeding the database connection request, the user request is bypassed to a temporary page or the waiting time for obtaining the corresponding database connection is forcibly based on a preset rule for diagnosis and response to the failure. An integrated management server that transmits a control command to reduce to the web server.
제19항에 있어서,
상기 장애 진단부는, 상기 모니터링을 통해 사용자로부터 요청된 서비스의 응답이 지연되거나 사용자로부터 소정의 시간이 지연된 후에 제공되는 서비스에 대한 요청이 수신된 것으로 판단되면, 서비스 지연 장애로 진단하고,
상기 장애 처리부는, 상기 서비스 지연 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 장애가 진단된 서비스에 대한 스레드 사용률을 제한하는 제어 명령을 상기 웹서버로 전송하는, 통합 관리 서버.
The method of claim 19,
The failure diagnosis unit diagnoses a service delay failure when it is determined that a response to a service requested from a user is delayed through the monitoring or a request for a service provided after a predetermined time is delayed from the user,
The failure processing unit, when diagnosed as the service delay failure, transmits a control command for limiting the thread usage rate for the service diagnosed with the failure to the web server, based on a preset rule for diagnosing and responding to the failure. , Integrated management server.
제19항에 있어서,
상기 장애 진단부는, 상기 모니터링을 통해 서비스 로직(Logic)의 오류 또는 시스템의 과도한 메모리 사용에 의해 메모리 부족 문제(Out Of Memory, OOM)가 발생하거나 메모리 자동 수거 현상(Full Garbage Collection, Full GC) 발생 빈도가 증가하거나 메모리 해제 불가 등의 상황이 지속적으로 발생하는 것으로 판단되면, 메모리 부족 장애로 진단하고,
상기 장애 처리부는, 상기 메모리 부족 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 덤프 생성 명령 및 서버 재기동 명령을 상기 웹서버로 전송하고 알람 정보를 상기 관리자 단말기로 전송하는, 통합 관리 서버.
The method of claim 19,
The fault diagnosis unit may cause an out of memory (OOM) or an automatic memory collection phenomenon (Full Garbage Collection, Full GC) due to an error in service logic or excessive memory use in the system through the monitoring. If it is judged that the frequency increases or the situation such as the inability to release the memory occurs continuously, it is diagnosed as insufficient memory,
The failure processing unit, when diagnosed as the memory shortage failure, transmits a dump generation command and a server restart command to the web server based on a preset rule for fault diagnosis and response, and sends alarm information to the manager terminal. To the integrated management server.
제19항에 있어서,
상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버로 수신된 특정 서비스에 대한 사용자의 요청이 상기 웹서버에서 처리 가능한 한계를 초과하는 것으로 판단되면, 특정 서비스의 요청 초과 장애로 진단하고,
상기 장애 처리부는, 상기 특정 서비스의 요청 초과 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 복수의 사용자에 대한 서비스 진입이 순차적으로 이뤄지도록 하는 요청 제어 명령을 상기 웹서버로 전송하고 해당 장애 진단에 대한 알람 정보를 상기 관리자 단말기로 전송하는, 통합 관리 서버.
The method of claim 19,
The failure diagnosis unit diagnoses a request exceeded failure of a specific service when it is determined that a user request for a specific service received through the monitoring exceeds a limit that can be processed by the web server,
The failure processing unit, when diagnosed as a failure exceeding the request of the specific service, based on a preset rule for failure diagnosis and response, requests control commands for sequentially entering services for a plurality of users Integrated management server that transmits to the web server and transmits the alarm information for the diagnosis of the failure to the manager terminal.
제19항에 있어서,
상기 장애 진단부는, 상기 모니터링을 통해 상기 웹서버가 기동 중인 상태임에도 아무 기능도 수행하지 못하는 정지(Hang) 상태인 것으로 판단되면, 정지 장애로 진단하고,
상기 장애 처리부는, 상기 정지 장애로 진단된 경우, 미리 설정되어 있는 장애 진단 및 대응에 대한 규칙을 기반으로 하여, 상기 웹서버로 덤프 생성 명령 및 서버 재기동 명령을 전송하고 상기 관리자 단말기로 해당 진단 장애에 대한 알람 정보를 전송하는, 통합 관리 서버.
The method of claim 19,
If it is determined through the monitoring that the web server is in a stopped state that cannot perform any function even though the web server is in a running state, the fault diagnosis unit diagnoses a stop fault,
The failure processing unit, when diagnosed as the stop failure, transmits a dump generation command and a server restart command to the web server based on a preset rule for diagnosis and response to a failure, and the diagnosis failure to the manager terminal Integrated management server, to send alarm information about.
제19항에 있어서,
상기 결과 제공부는,
상기 장애 진단 및 대응에 대한 결과 정보를 시계열로 나열된 통계 정보 형태로 생성하여 상기 관리자 단말기로 전송하는, 통합 관리 서버.
The method of claim 19,
The result providing unit,
An integrated management server that generates result information for the diagnosis and response to the failure in the form of statistical information arranged in a time series and transmits it to the manager terminal.
제19항에 있어서,
상기 결과 제공부는,
상기 관리자 단말기로부터 수신되는 관리자의 요청 또는 미리 설정되어 있는 소정의 주기에 의해 상기 장애 진단 및 대응에 대한 결과 정보를 생성하는, 통합 관리 서버.
The method of claim 19,
The result providing unit,
Integrated management server that generates the result information for the diagnosis and response to the failure by a predetermined period set in advance or the request of the administrator received from the manager terminal.
제19항에 있어서,
상기 결과 제공부는,
상기 관리자 단말기로부터 소정의 검색 조건이 포함된 정보 조회 요청이 수신되면, 수신된 소정의 검색 조건에 상응하는 장애 진단 및 대응에 대한 결과 정보를 생성하여 상기 관리자 단말기로 전송하는, 통합 관리 서버.
The method of claim 19,
The result providing unit,
When an information inquiry request including a predetermined search condition is received from the manager terminal, the integrated management server generates and transmits result information for diagnosis and response to a failure corresponding to the received predetermined search condition.
KR1020180131810A 2018-10-31 2018-10-31 Method for diagnosing and handling obstacle of server based on obstacle type KR102109536B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180131810A KR102109536B1 (en) 2018-10-31 2018-10-31 Method for diagnosing and handling obstacle of server based on obstacle type

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180131810A KR102109536B1 (en) 2018-10-31 2018-10-31 Method for diagnosing and handling obstacle of server based on obstacle type

Publications (2)

Publication Number Publication Date
KR20200049028A KR20200049028A (en) 2020-05-08
KR102109536B1 true KR102109536B1 (en) 2020-05-28

Family

ID=70677777

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180131810A KR102109536B1 (en) 2018-10-31 2018-10-31 Method for diagnosing and handling obstacle of server based on obstacle type

Country Status (1)

Country Link
KR (1) KR102109536B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102540221B1 (en) * 2022-05-04 2023-06-08 오픈마루 주식회사 A method for guiding the performance problems of middleware constituting the micro-service architecture and for guiding the problem-solving process

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101545215B1 (en) 2013-10-30 2015-08-18 삼성에스디에스 주식회사 system and method for automatically manageing fault events of data center
JP2016206703A (en) 2015-04-15 2016-12-08 インテリジェントウィルパワー株式会社 Virtual machine management system

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160132698A (en) * 2015-05-11 2016-11-21 삼성에스디에스 주식회사 Apparatus and method of intelligent system diagnosis
KR101971013B1 (en) * 2016-12-13 2019-04-22 나무기술 주식회사 Cloud infra real time analysis system based on big date and the providing method thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101545215B1 (en) 2013-10-30 2015-08-18 삼성에스디에스 주식회사 system and method for automatically manageing fault events of data center
JP2016206703A (en) 2015-04-15 2016-12-08 インテリジェントウィルパワー株式会社 Virtual machine management system

Also Published As

Publication number Publication date
KR20200049028A (en) 2020-05-08

Similar Documents

Publication Publication Date Title
US11868237B2 (en) Intelligent services for application dependency discovery, reporting, and management tool
US10922083B2 (en) Determining problem dependencies in application dependency discovery, reporting, and management tool
US11966324B2 (en) Discovery crawler for application dependency discovery, reporting, and management tool
US7937623B2 (en) Diagnosability system
US9369356B2 (en) Conducting a diagnostic session for monitored business transactions
US11221854B2 (en) Dependency analyzer in application dependency discovery, reporting, and management tool
US20230251955A1 (en) Intelligent services and training agent for application dependency discovery, reporting, and management tool
US20050055673A1 (en) Automatic database diagnostic monitor architecture
US7376682B2 (en) Time model
US11675692B2 (en) Testing agent for application dependency discovery, reporting, and management tool
WO2016188100A1 (en) Information system fault scenario information collection method and system
CN111382023A (en) Code fault positioning method, device, equipment and storage medium
US11169896B2 (en) Information processing system
KR102109536B1 (en) Method for diagnosing and handling obstacle of server based on obstacle type
WO2020264319A1 (en) Determining problem dependencies in application dependency discovery, reporting, and management tool
CN112463883A (en) Reliability monitoring method, device and equipment based on big data synchronization platform
CN116680165A (en) Interface performance testing method, device and equipment
CN115982049A (en) Abnormity detection method and device in performance test and computer equipment
CN114356764A (en) Software debugging method, device, equipment, system and medium
WO2022105685A1 (en) Memory management method and device for optical transmission device, and storage medium
CN110225543B (en) Mobile terminal software quality situation perception system and method based on network request data
CN116048859B (en) Distributed database fault diagnosis method and device, electronic equipment and storage medium
CN114138522A (en) Micro-service fault recovery method and device, electronic equipment and medium
CN117827587A (en) Database abnormal node determination method, apparatus, device, medium and program product
KR20230085610A (en) Detection and Recovery of Deadlocks In Database Management System

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant