KR102176028B1 - System for Real-time integrated monitoring and method thereof - Google Patents
System for Real-time integrated monitoring and method thereof Download PDFInfo
- Publication number
- KR102176028B1 KR102176028B1 KR1020200106526A KR20200106526A KR102176028B1 KR 102176028 B1 KR102176028 B1 KR 102176028B1 KR 1020200106526 A KR1020200106526 A KR 1020200106526A KR 20200106526 A KR20200106526 A KR 20200106526A KR 102176028 B1 KR102176028 B1 KR 102176028B1
- Authority
- KR
- South Korea
- Prior art keywords
- monitoring
- monitoring server
- screen
- server
- usage
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/321—Display for diagnostics, e.g. diagnostic result display, self-test user interface
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/323—Visualisation of programs or trace data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
본 발명은 실시간 통합 모니터링 시스템 및 그 방법에 관한 것으로서, 특히 복수의 대상 서버에 설치된 모니터링 에이전트를 통해 각 대상 서버로부터 자원 현황을 수집하고, 수집된 대상 서버별 자원 현황을 시각화하여 직관적으로 대시보드를 통해 표시하는 실시간 통합 모니터링 시스템 및 그 방법에 관한 것이다.The present invention relates to a real-time integrated monitoring system and method thereof, in particular, collecting resource status from each target server through a monitoring agent installed on a plurality of target servers, and visualizing the collected resource status of each target server to intuitively display a dashboard. It relates to a real-time integrated monitoring system and method for displaying through.
데이터 관리 시스템(Data Management System)은 컴퓨터로 처리되는 데이터 집합(프로그램, 데이터)에 명칭을 붙여 그 형식이나 구조 및 기억 장치의 물리적 조건 등에 관계없이 주기억 장치에 등록하거나 이것을 질서적, 능률적으로 편성, 배열, 수정하여 필요에 따라 식별, 검색하는 등 제어 프로그램의 기능을 사용하는 방식 혹은 체계이다.The Data Management System assigns a name to a data set (program, data) processed by a computer and registers it in the main memory device regardless of its format, structure, and physical condition of the storage device, or organizes it in an orderly and efficient manner. It is a method or system that uses the functions of the control program, such as arranging, modifying and identifying and searching as necessary.
이러한 데이터 관리 시스템이 복수의 서버를 관리하고자 하는 경우, 산발적인 시스템의 자원에 대한 효율적인 모니터링이 부재하며, 장애 발생시 원인 파악에 많은 시간이 소비되어 장애 시간이 증가하며, 예측적이지 못한 사후 자원 증설 계획에 따라 기업의 부담이 증가한다.When such a data management system wants to manage multiple servers, there is no efficient monitoring of the resources of the sporadic system, and when a failure occurs, a lot of time is spent in determining the cause, increasing the failure time, and unpredictable post resource expansion. The burden on the enterprise increases according to the plan.
본 발명의 목적은 복수의 대상 서버에 설치된 모니터링 에이전트를 통해 각 대상 서버로부터 자원 현황을 수집하고, 수집된 대상 서버별 자원 현황을 시각화하여 직관적으로 대시보드를 통해 표시하는 실시간 통합 모니터링 시스템 및 그 방법을 제공하는 데 있다.An object of the present invention is a real-time integrated monitoring system and method for collecting resource status from each target server through a monitoring agent installed on a plurality of target servers, visualizing the collected resource status by target server, and intuitively displaying it through a dashboard To provide.
본 발명의 다른 목적은 CPU, 메모리, 디스크, 네트워크 등의 기본 데이터 외에 미리 설정된 성능 지표를 수집하고, 수집된 기본 데이터, 성능 지표 등을 근거로 성능 분석 보고서를 제공하고, 중요 심각도 및 패턴에 레벨을 두어 장애 발생에 따른 이벤트를 통지하는 실시간 통합 모니터링 시스템 및 그 방법을 제공하는 데 있다.Another object of the present invention is to collect preset performance indicators in addition to basic data such as CPU, memory, disk, network, etc., provide a performance analysis report based on the collected basic data, performance indicators, etc. It is to provide a real-time integrated monitoring system and method for notifying an event according to a failure occurrence.
본 발명의 실시예에 따른 실시간 통합 모니터링 시스템은 모니터링 에이전트가 설치된 대상 서버; 및 상기 하나 이상의 대상 서버에 각각 설치된 모니터링 에이전트를 통해, 미리 설정된 주기마다 상기 하나 이상의 대상 서버로부터 자원 현황을 수집하고, 상기 수집된 자원 현황을 시각화하여, 대시보드 형태로 모니터링 화면을 표시하는 모니터링 서버를 포함할 수 있다.A real-time integrated monitoring system according to an embodiment of the present invention includes a target server on which a monitoring agent is installed; And a monitoring server that collects resource status from the one or more target servers at each preset period through a monitoring agent installed on each of the one or more target servers, visualizes the collected resource status, and displays a monitoring screen in the form of a dashboard. It may include.
본 발명과 관련된 일 예로서 상기 모니터링 서버는, 상기 모니터링 서버에 미리 설치된 모니터링 앱을 실행하고, 모니터링 앱 실행에 따른 모니터링 화면을 표시하고, 상기 모니터링 서버의 화면 일측에 표시되는 복수의 메뉴 중에서 미리 설정된 대시보드 메뉴가 선택될 때 대시보드 형태로 자원 현황을 시각화하여 표시하기 위한 대시보드 화면을 표시할 수 있다.As an example related to the present invention, the monitoring server executes a monitoring app pre-installed on the monitoring server, displays a monitoring screen according to the execution of the monitoring app, and is preset among a plurality of menus displayed on one side of the screen of the monitoring server. When the dashboard menu is selected, a dashboard screen for visualizing and displaying the resource status in the form of a dashboard can be displayed.
본 발명과 관련된 일 예로서 상기 대시보드 화면은, 요약 항목, 베이직 항목, IPMI(Intelligent Platform Management Interface) 항목 및 이벤트 로그 항목 중 적어도 하나를 포함할 수 있다.As an example related to the present invention, the dashboard screen may include at least one of a summary item, a basic item, an IPMI (Intelligent Platform Management Interface) item, and an event log item.
본 발명과 관련된 일 예로서 상기 요약 항목은, 양호(good)/경고(warning)/크리티컬(critical) 호스트 개수, 양호/경고/크리티컬 아이템 개수, 양호/경고/크리티컬 가상 개수, 양호/경고/크리티컬 IPMI 개수, 양호/경고/크리티컬 이벤트 개수, 양호/경고/크리티컬 셀프 개수 및 마지막 업데이트 정보를 포함하며, 상기 베이직 항목은, 고유 번호, 호스트, OS, CPU 사용량, 메모리 사용량, 파티션 사용량, 네트워크(NET) 사용량, 스왑(swap), 설명 및 마지막 업데이트 정보를 포함하며, 상기 IPMI 항목은, 고유 번호, 호스트, 벤더, CPU, 메모리, FAN, 전력, 설명 및 마지막 업데이트 정보를 포함하며, 상기 이벤트 로그 항목은, 고유 번호, 호스트, OS의 레벨, OS, 날짜와 시각, 메시지 및 마지막 업데이트 정보를 포함할 수 있다.As an example related to the present invention, the summary items include the number of good/warning/critical hosts, the number of good/warning/critical items, the good/warning/critical virtual number, good/warning/critical IPMI number, good/warning/critical event count, good/warning/critical self count, and last update information.The basic items include unique number, host, OS, CPU usage, memory usage, partition usage, network (NET ) Includes usage, swap, description and last update information, and the IPMI item includes unique number, host, vendor, CPU, memory, FAN, power, description and last update information, and the event log item May include a unique number, host, OS level, OS, date and time, message, and last update information.
본 발명과 관련된 일 예로서 상기 모니터링 서버는, 상기 모니터링 서버의 화면 일측에 표시되는 복수의 메뉴 중에서 미리 설정된 사용자 정의보기 메뉴가 선택될 때, 시스템의 전체 상태나 특정 정보를 표시하도록 설정하기 위한 사용자 정의보기 화면을 표시할 수 있다.As an example related to the present invention, the monitoring server is configured to display the entire system status or specific information when a preset user-defined view menu is selected from among a plurality of menus displayed on one side of the screen of the monitoring server. You can display the definition view screen.
본 발명과 관련된 일 예로서 상기 모니터링 서버는, 상기 모니터링 서버의 화면 일측에 표시되는 복수의 메뉴 중에서 미리 설정된 설정 메뉴가 선택될 때, 알림 임계수치에 대한 정책을 설정하기 위한 알림 정책 설정 화면을 표시하고, 상기 모니터링 서버에 표시되는 알림 정책 설정 화면에서 모니터링 서버의 관리자 입력에 따른 복수의 입력 항목에 대응하는 복수의 입력값을 포함하는 알림 정책 설정 정보를 수신하고, 상기 수신된 알림 정책 설정 정보를 근거로 상기 알림 정책을 사용할 호스트명/그룹명으로부터 수집되는 자원 현황에 대해서 모니터링 기능을 수행하고, 이상 여부 발생 시 알람 기능을 제공할 수 있다.As an example related to the present invention, the monitoring server, when a preset setting menu is selected from among a plurality of menus displayed on one side of the screen of the monitoring server, displays a notification policy setting screen for setting a policy for a notification threshold value. And, receiving notification policy setting information including a plurality of input values corresponding to a plurality of input items according to an administrator input of the monitoring server on the notification policy setting screen displayed on the monitoring server, and receiving the received notification policy setting information As a basis, it is possible to perform a monitoring function on the status of resources collected from the host name/group name that will use the notification policy, and provide an alarm function when an abnormality occurs.
본 발명의 실시예에 따른 실시간 통합 모니터링 방법은 모니터링 서버에 의해, 상기 모니터링 서버에 미리 설치된 모니터링 앱을 실행하고, 모니터링 앱 실행에 따른 모니터링 화면을 표시하는 단계; 상기 모니터링 서버의 화면 일측에 표시되는 복수의 메뉴 중에서 미리 설정된 대시보드 메뉴가 선택될 때, 상기 모니터링 서버에 의해, 대시보드 형태로 자원 현황을 시각화하여 표시하기 위한 대시보드 화면을 표시하는 단계; 및 상기 모니터링 서버의 화면의 다른 일측에 표시되는 하나 이상의 대상 서버 중에서 특정 대상 서버가 선택될 때, 상기 모니터링 서버에 의해, 상기 수집된 특정 대상 서버와 관련한 자원 현황을 시각화한 상세 정보를 표시하는 단계를 포함할 수 있다.A real-time integrated monitoring method according to an embodiment of the present invention includes, by a monitoring server, executing a monitoring app pre-installed on the monitoring server, and displaying a monitoring screen according to execution of the monitoring app; Displaying, by the monitoring server, a dashboard screen for visualizing and displaying resource status in a dashboard form when a preset dashboard menu is selected from among a plurality of menus displayed on one side of the screen of the monitoring server; And when a specific target server is selected from among one or more target servers displayed on the other side of the screen of the monitoring server, displaying detailed information visualizing the status of resources related to the collected specific target server by the monitoring server. It may include.
본 발명의 실시예에 따른 상기 자원 현황은, 상기 모니터링 서버에 의해, 하나 이상의 대상 서버에 각각 설치된 모니터링 에이전트를 통해, 미리 설정된 주기마다 상기 하나 이상의 대상 서버로부터 수집되며, 상기 대상 서버가 하이퍼바이저로 구성된 상태일 때, 상기 모니터링 서버에 의해, VMware API를 통해서 상기 하이퍼바이저로 구성된 대상 서버와 관련한 자원 현황이 수집되며, CPU 사용량, 메모리 사용량, 디스크 사용량, 네트워크 사용량, 파티션 사용량, 스왑 사용량 및 OS별 로그 중 적어도 하나를 포함할 수 있다.The resource status according to an embodiment of the present invention is collected from the one or more target servers at preset periods by the monitoring server, through monitoring agents respectively installed in one or more target servers, and the target server is a hypervisor. When configured, the monitoring server collects the resource status related to the target server configured with the hypervisor through the VMware API, and CPU usage, memory usage, disk usage, network usage, partition usage, swap usage and OS It may include at least one of the logs.
본 발명의 실시예에 따른 상기 모니터링 서버의 화면 일측에 표시되는 복수의 메뉴 중에서 미리 설정된 사용자 정의보기 메뉴가 선택될 때, 상기 모니터링 서버에 의해, 시스템의 전체 상태나 특정 정보를 표시하도록 설정하기 위한 사용자 정의보기 화면을 표시하는 단계를 더 포함할 수 있다.When a preset user-defined view menu is selected from among a plurality of menus displayed on one side of the screen of the monitoring server according to an embodiment of the present invention, by the monitoring server, for setting to display the overall state of the system or specific information It may further include displaying a user-defined view screen.
본 발명의 실시예에 따른 상기 모니터링 서버의 화면 일측에 표시되는 복수의 메뉴 중에서 미리 설정된 설정 메뉴가 선택될 때, 상기 모니터링 서버에 의해, 알림 임계수치에 대한 정책을 설정하기 위한 알림 정책 설정 화면을 표시하는 단계; 상기 모니터링 서버에 의해, 상기 모니터링 서버에 표시되는 알림 정책 설정 화면에서 모니터링 서버의 관리자 입력에 따른 복수의 입력 항목에 대응하는 복수의 입력값을 포함하는 알림 정책 설정 정보를 수신하는 단계; 및 상기 모니터링 서버에 의해, 상기 수신된 알림 정책 설정 정보를 근거로 상기 알림 정책을 사용할 호스트명/그룹명으로부터 수집되는 자원 현황에 대해서 모니터링 기능을 수행하고, 이상 여부 발생 시 알람 기능을 제공하는 단계를 더 포함할 수 있다.When a preset setting menu is selected from among a plurality of menus displayed on one side of the screen of the monitoring server according to an embodiment of the present invention, a notification policy setting screen for setting a policy for a notification threshold is displayed by the monitoring server. Displaying; Receiving, by the monitoring server, notification policy setting information including a plurality of input values corresponding to a plurality of input items according to an administrator input of the monitoring server from a notification policy setting screen displayed on the monitoring server; And performing, by the monitoring server, a monitoring function for the status of resources collected from the host name/group name to be used for the notification policy based on the received notification policy setting information, and providing an alarm function when an abnormality occurs. It may further include.
본 발명은 복수의 대상 서버에 설치된 모니터링 에이전트를 통해 각 대상 서버로부터 자원 현황을 수집하고, 수집된 대상 서버별 자원 현황을 시각화하여 직관적으로 대시보드를 통해 표시함으로써, 효율적인 모니터링과 알람을 통한 장애 발생을 사전에 관리할 수 있는 효과가 있다.The present invention collects resource status from each target server through a monitoring agent installed in a plurality of target servers, visualizes the collected resource status by target server, and intuitively displays it through a dashboard, resulting in efficient monitoring and failure through alarm It has the effect of being able to manage in advance.
또한, 본 발명은 CPU, 메모리, 디스크, 네트워크 등의 기본 데이터 외에 미리 설정된 성능 지표를 수집하고, 수집된 기본 데이터, 성능 지표 등을 근거로 성능 분석 보고서를 제공하고, 중요 심각도 및 패턴에 레벨을 두어 장애 발생에 따른 이벤트를 통지함으로써, 장애발생시 빠른 원인 파악으로 서비스 장애 시간을 감소시키고, 시스템 분석을 통해 향후 자원 증설 계획을 수립 및 실행할 수 있는 효과가 있다.In addition, the present invention collects preset performance indicators in addition to basic data such as CPU, memory, disk, network, etc., provides a performance analysis report based on the collected basic data, performance indicators, etc., and assigns levels to critical severity and patterns. By notifying the event according to the occurrence of a failure, there is an effect of reducing the service failure time by quickly identifying the cause when a failure occurs, and establishing and executing a plan for future resource expansion through system analysis.
도 1은 본 발명의 실시예에 따른 실시간 통합 모니터링 시스템의 구성을 나타낸 블록도이다.
도 2는 본 발명의 실시예에 따른 실시간 통합 모니터링 방법을 나타낸 흐름도이다.
도 3 내지 도 7은 본 발명의 실시예에 따른 모니터링 서버의 화면의 예를 나타낸 도이다.1 is a block diagram showing the configuration of a real-time integrated monitoring system according to an embodiment of the present invention.
2 is a flowchart showing a real-time integrated monitoring method according to an embodiment of the present invention.
3 to 7 are diagrams showing examples of screens of a monitoring server according to an embodiment of the present invention.
본 발명에서 사용되는 기술적 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아님을 유의해야 한다. 또한, 본 발명에서 사용되는 기술적 용어는 본 발명에서 특별히 다른 의미로 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미로 해석되어야 하며, 과도하게 포괄적인 의미로 해석되거나, 과도하게 축소된 의미로 해석되지 않아야 한다. 또한, 본 발명에서 사용되는 기술적인 용어가 본 발명의 사상을 정확하게 표현하지 못하는 잘못된 기술적 용어일 때에는 당업자가 올바르게 이해할 수 있는 기술적 용어로 대체되어 이해되어야 할 것이다. 또한, 본 발명에서 사용되는 일반적인 용어는 사전에 정의되어 있는 바에 따라, 또는 전후 문맥상에 따라 해석되어야 하며, 과도하게 축소된 의미로 해석되지 않아야 한다.It should be noted that the technical terms used in the present invention are used only to describe specific embodiments, and are not intended to limit the present invention. In addition, the technical terms used in the present invention should be interpreted as generally understood by those of ordinary skill in the technical field to which the present invention belongs, unless otherwise defined in the present invention, and is excessively comprehensive. It should not be construed as a human meaning or an excessively reduced meaning. In addition, when a technical term used in the present invention is an incorrect technical term that does not accurately express the spirit of the present invention, it should be replaced with a technical term that can be correctly understood by those skilled in the art. In addition, general terms used in the present invention should be interpreted as defined in the dictionary or according to the context before and after, and should not be interpreted as an excessively reduced meaning.
또한, 본 발명에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함한다. 본 발명에서 "구성된다" 또는 "포함한다" 등의 용어는 발명에 기재된 여러 구성 요소들 또는 여러 단계를 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다.In addition, the singular expression used in the present invention includes a plurality of expressions unless the context clearly indicates otherwise. In the present invention, terms such as “consisting of” or “comprising” should not be construed as necessarily including all of the various components or steps described in the invention, and some components or some steps may not be included. It should be construed that it may or may further include additional components or steps.
또한, 본 발명에서 사용되는 제 1, 제 2 등과 같이 서수를 포함하는 용어는 구성 요소들을 설명하는데 사용될 수 있지만, 구성 요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제 1 구성 요소는 제 2 구성 요소로 명명될 수 있고, 유사하게 제 2 구성 요소도 제 1 구성 요소로 명명될 수 있다.In addition, terms including ordinal numbers such as first and second used in the present invention may be used to describe the constituent elements, but the constituent elements should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, a first component may be referred to as a second component, and similarly, a second component may be referred to as a first component.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성 요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings, but the same or similar components are assigned the same reference numerals regardless of the reference numerals, and redundant descriptions thereof will be omitted.
또한, 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 발명의 사상을 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 발명의 사상이 제한되는 것으로 해석되어서는 아니 됨을 유의해야 한다.In addition, in describing the present invention, when it is determined that a detailed description of a related known technology may obscure the subject matter of the present invention, a detailed description thereof will be omitted. In addition, it should be noted that the accompanying drawings are only for easily understanding the spirit of the present invention and should not be construed as limiting the spirit of the present invention by the accompanying drawings.
도 1은 본 발명의 실시예에 따른 실시간 통합 모니터링 시스템(10)의 구성을 나타낸 블록도이다.1 is a block diagram showing the configuration of a real-time integrated
도 1에 도시한 바와 같이, 실시간 통합 모니터링 시스템(10)은 하나 이상의 대상 서버(100) 및 모니터링 서버(200)로 구성된다. 도 1에 도시된 실시간 통합 모니터링 시스템(10)의 구성 요소 모두가 필수 구성 요소인 것은 아니며, 도 1에 도시된 구성 요소보다 많은 구성 요소에 의해 실시간 통합 모니터링 시스템(10)이 구현될 수도 있고, 그보다 적은 구성 요소에 의해서도 실시간 통합 모니터링 시스템(10)이 구현될 수도 있다.As shown in FIG. 1, the real-time integrated
상기 대상 서버(100) 및 상기 모니터링 서버(200) 각각은 다른 단말들/서버들과의 통신 기능을 수행하기 위한 통신부(미도시), 다양한 정보 및 프로그램(또는 애플리케이션)을 저장하기 위한 저장부(미도시), 다양한 정보 및 프로그램 실행 결과를 표시하기 위한 표시부(미도시), 상기 다양한 정보 및 프로그램 실행 결과에 대응하는 음성 정보를 출력하기 위한 음성 출력부(미도시), 각 단말의 다양한 구성 요소 및 기능을 제어하기 위한 제어부(미도시) 등을 포함할 수 있다.Each of the
상기 대상 서버(100)는 윈도우 또는 리눅스 운영체제를 사용하는 개인용 컴퓨터(Personal Computer), 노트북 컴퓨터, 슬레이트 PC(Slate PC), 태블릿 PC(Tablet PC), 울트라북(ultrabook) 등과 같은 다양한 단말기와, 웹 서버, 데이터베이스 서버, 프록시 서버, 분산 서버 등과 같은 다양한 서버에 적용될 수 있다.The
또한, 상기 대상 서버(100)는 상기 모니터링 서버(200) 등과 통신한다.In addition, the
또한, 상기 대상 서버(100)는 상기 모니터링 서버(200)로부터 제공되는 모니터링 에이전트를 해당 대상 서버(100)에 설치한다. 이때, 상기 모니터링 에이전트는 해당 대상 서버(100)의 동작(또는 운영)에 영향을 끼치지 않도록 적은 리소스를 사용하도록 구성하며, 트래픽을 최소화하여 시스템에 영향을 최소화하도록 구성한다.In addition, the
또한, 상기 대상 서버(100)는 해당 대상 서버(100)에 설치된 모니터링 에이전트를 통해서 해당 대상 서버(100)와 관련한 자원 현황을 상기 모니터링 서버(200)에 제공(또는 전송)한다. 여기서, 상기 자원 현황(또는 자원 현황 정보)은 CPU 사용량, 메모리 사용량, 디스크 사용량, 네트워크 사용량, 파티션 사용량, 스왑 사용량, OS별 로그 등을 포함한다.In addition, the
상기 모니터링 서버(200)는 상기 하나 이상의 대상 서버(100) 등과 통신한다.The
또한, 상기 모니터링 서버(200)는 상기 대상 서버(100)에 상기 모니터링 에이전트를 제공한다.In addition, the
또한, 상기 모니터링 서버(200)는 상기 모니터링 에이전트에 대한 업데이트 등의 관리 기능을 제공(또는 수행)한다.In addition, the
또한, 상기 모니터링 서버(200)는 해당 모니터링 에이전트에 대한 자체 검사(health check) 기능을 제공한다.In addition, the
또한, 상기 모니터링 서버(200)는 하나의 솔루션으로 HPE 서버, DellEMC 서버 등과 같이 이종의 대상 서버(100)를 동시에 지원한다.In addition, the
또한, 상기 모니터링 서버(200)는 하나 이상의 대상 서버(100)에 각각 설치된 모니터링 에이전트를 통해, 미리 설정된 주기마다 상기 하나 이상의 대상 서버(100)로부터 자원 현황을 수집하거나 또는, 해당 모니터링 서버(200)의 정보 요청에 대한 응답으로 하나 이상의 대상 서버(100)로부터 전송되는(또는 제공되는) 자원 현황을 수집한다. 여기서, 상기 자원 현황(또는 자원 현황 정보)은 CPU 사용량, 메모리 사용량, 디스크 사용량, 네트워크 사용량, 파티션 사용량, 스왑 사용량, OS별 로그 등을 포함한다. 또한, 상기 CPU 사용량은 이용률, 속도, 프로세스 개수, 스레드 개수, 핸들 개수, 작동 시간, 기본 속도, 소켓, 코어, 논리프로세서, 가상화 여부, Hyper-V 지원 여부, 캐시 등을 포함하며, 상기 메모리 사용량은 사용 중(압축) 용량, 사용가능 용량, 커밋됨 용량, 캐시됨 용량, 페이징 풀(Paged pool) 용량, 비페이징 풀(NonPaged pool) 용량, 속도, 사용된 슬롯, 폼 팩터(Form factor), 하드웨어 예약 등을 포함하며, 상기 디스크 사용량은 활성 시간, 평균 응답 시간, 읽기 속도, 쓰기 속도, 용량, 포맷, 시스템 디스크 여부, 페이지 파일 여부 등을 포함하며, 상기 네트워크 사용량은 보내기 속도, 받기 속도, 어댑터 이름, 연결 형식, IPv4 주소, IPv6 주소 등을 포함한다.In addition, the
이때, 상기 대상 서버(100)가 하이퍼바이저(hypervisor)로 구성된 경우, 상기 모니터링 서버(200)는 VMware API(Application Programming Interface)를 통해서 해당 대상 서버(100)와 관련한 자원 현황을 수집할 수 있다.At this time, when the
또한, 상기 모니터링 서버(200)는 부하를 최소화하여 서비스에 부담이 없도록 구성하며, 보고 주기가 길더라도 시스템에 이상 징후가 있으면 즉시 보고하도록 구성한다.In addition, the
또한, 상기 모니터링 서버(200)는 실시간 성능 모니터링(예를 들어 체크 주기 설정 기능 등 포함)을 제공하고, 대시보드 커스터마이징이 가능하여 모니터링에 집중할 수 있는 화면 또는 환경을 제공한다.In addition, the
또한, 상기 모니터링 서버(200)는 상기 수집된 자원 현황을 시각화하여, 대시보드 형태로 모니터링 화면을 표시한다.In addition, the
즉, 상기 모니터링 서버(200)는 해당 모니터링 서버(200)에 미리 설치된 모니터링 앱(또는 전용 앱)을 실행하고, 모니터링 앱 실행에 따른 모니터링 화면을 표시한다. 이때, 상기 모니터링 화면(또는 앱 실행 결과 화면)은 상기 모니터링 서버(200)에서 관리 중인 하나 이상의 대상 서버(100)에 대한 목록과 온/오프 상태를 표시하기 위한 OS별 대상 서버 목록 메뉴(또는 버튼/항목), 대시보드 형태로 자원 현황을 시각화하여 표시하기 위한 대시보드 메뉴, 시스템의 전체 상태나 특정 정보를 표시하도록 설정하기 위한 사용자 정의보기 메뉴, 알림 정책을 설정하기 위한 설정 메뉴, 로그인 또는 로그아웃을 관리하기 위한 로그인/로그아웃 메뉴 등의 복수의 메뉴를 포함한다. 여기서, 상기 모니터링 서버(200)는 해당 모니터링 앱과 관련해서 회원 가입한 상태로, 회원 가입에 따른 아이디 및 비밀번호, 상기 아이디를 포함하는 바코드 또는 QR 코드 등을 이용해서 상기 전용 앱 실행 시 로그인 절차를 수행하여, 해당 모니터링 앱(또는 전용 앱)의 하나 이상의 기능(예를 들어 자원 현황 수집 기능, 대시보드 기능, 사용자 정의보기 기능, 설정 기능 등 포함)을 수행할 수 있다.That is, the
또한, 상기 모니터링 서버(200)의 화면 일측(또는 상기 모니터링 화면 일측)에 표시되는 복수의 메뉴 중에서 미리 설정된 대시보드 메뉴가 선택되는 경우, 상기 모니터링 서버(200)는 대시보드 형태로 자원 현황을 시각화하여 표시하기 위한 대시보드 화면을 표시한다. 여기서, 상기 대시보드 화면은 요약(summary) 항목(예를 들어 양호(good)/경고(warning)/크리티컬(critical) 호스트 개수, 양호/경고/크리티컬 아이템 개수, 양호/경고/크리티컬 가상 개수, 양호/경고/크리티컬 IPMI 개수, 양호/경고/크리티컬 이벤트 개수, 양호/경고/크리티컬 셀프 개수, 마지막 업데이트 정보 등 포함), 베이직 항목(예를 들어 고유 번호, 호스트, OS, CPU 사용량, 메모리 사용량, 파티션 사용량, 네트워크(NET) 사용량, 스왑(swap), 설명, 마지막 업데이트 정보 등 포함), IPMI(Intelligent Platform Management Interface: 지능형 플랫폼 관리 인터페이스) 항목(예를 들어 고유 번호, 호스트, 벤더, CPU, 메모리, FAN, 전력, 설명, 마지막 업데이트 정보 등 포함), 이벤트 로그 항목(예를 들어 고유 번호, 호스트, OS의 레벨(일 예로 메이저, 마이너, 크리티컬 등 포함), OS, 날짜와 시각, 메시지, 마지막 업데이트 정보 등 포함) 등을 포함한다. 또한, 상기 아이템 개수는 이상 상황(예를 들어 경고, 크리티컬 등 포함)이 발생한 CPU, 메모리, 디스크, 네트워크 등의 개수를 나타내고, 상기 셀프 개수는 해당 모니터링 서버(200)에서 발생하는 이상 상황에 대한 개수(또는 해당 모니터링 서버(200)에서 이상 상황이 발생한 CPU, 메모리, 디스크, 네트워크 등의 개수)를 나타낸다.In addition, when a preset dashboard menu is selected from among a plurality of menus displayed on one side of the screen of the monitoring server 200 (or one side of the monitoring screen), the
이때, 해당 모니터링 서버(200)에 미리 설치된 모니터링 앱(또는 전용 앱)을 실행하는 경우(또는 상기 모니터링 앱 실행 후 로그인하는 경우), 상기 모니터링 서버(200)는 상기 대시보드 메뉴에 대응하는 상기 대시보드 화면을 디폴트로 표시할 수도 있다.At this time, when executing a monitoring app (or a dedicated app) preinstalled in the monitoring server 200 (or when logging in after running the monitoring app), the
이와 같이, 상기 모니터링 서버(200)는 다양한 시스템(또는 대상 서버(100))의 성능 및 구성 정보를 가공하여 관리자가 쉽게 시스템의 전체 상황을 파악할 수 있도록 상기 대시보드 화면을 통해 제공할 수 있다.In this way, the
또한, 이와 같이, 상기 모니터링 서버(200)는 감시대상 시스템(또는 대상 서버(100))의 지표에 대해 마지막 상태 변화 시각을 알려주어(또는 표시/출력하여) 현재 상태의 지속 시간을 확인할 수 있다.In addition, in this way, the
또한, 이와 같이, 상기 모니터링 서버(200)는 중요한 시스템에 대해서는 별도의 표시를 통해 장애의 중요도를 파악하도록 구성할 수 있다.In addition, as described above, the
또한, 이와 같이, 상기 모니터링 서버(200)는 하드웨어 자체 지표(예를 들어 iLO, iDRAC 등 포함)를 지원하게 쉽게 하드웨어 자체에 대한 상태를 확인할 수 있도록 구성할 수 있다.In addition, as described above, the
또한, 이와 같이, 상기 모니터링 서버(200)는 실시간 성능 모니터링 기능, 디스크(Disk)/파티션(Partition)별 성능 모니터링 기능, 네트워크 인터페이스별 성능 모니터링 기능, 사용자/프로세스별 성능 모니터링 기능, 관리자설정 성능 모니터링 기능, 자원 과다 사용 프로세스 모니터링 기능 등을 제공할 수 있다.In addition, as described above, the
또한, 상기 모니터링 서버(200)의 화면의 다른 일측(또는 상기 모니터링 화면/대시보드 화면 다른 일측)에 표시되는 하나 이상의 대상 서버(100) 중에서(또는 상기 OS별 대상 서버 목록/리스트 중에서) 특정 대상 서버(100)가 선택되는 경우, 상기 모니터링 서버(200)는 상기 선택된 특정 대상 서버(100)와 관련한 상세 정보를 표시한다. 여기서, 상기 특정 대상 서버(100)와 관련한 상세 정보는 상기 수집된 특정 대상 서버(100)와 관련한 자원 현황을 시각화한 정보로, 텍스트, 그래프 등의 형태로 제공되며, CPU, 메모리, 디스크, 네트워크, 파티션, 스왑, 프로세스 등에 대한 사용량 등의 정보를 포함한다.In addition, a specific target among one or
이때, 상기 모니터링 서버(200)는 해당 모니터링 서버(200)의 관리자 입력에 따라 기간, 항목 등을 설정하여, 상기 설정된 기간, 항목 등에 대응하는 상세 정보(또는 상태 정보)를 조회(또는 검색/확인)할 수도 있다.At this time, the
또한, 상기 모니터링 서버(200)는 해당 특정 대상 서버(100)와 관련한 상세 정보의 통계 정보를 표시하고, 상기 특정 대상 서버(100)와 관련한 상세 정보, 통계 정보 등을 포함하는 보고서(또는 리포트/전자 문서 형태의 파일)를 생성한다.In addition, the
또한, 상기 모니터링 서버(200)는 미리 설정된 주기에 따라 자동으로 보고서를 생성하여 미리 등록된 관리자 소유의 관리자 단말(미도시)에 전송하는 기능을 이용해서, 시스템 전체 상태를 보고할 수 있다.In addition, the
또한, 상기 모니터링 서버(200)는 정상/비정상 지표의 상태를 추적하는 테이블을 통해 시스템 장애 시 어떤 지표가 얼마나 오래 문제가 있었는지 쉽게 추적할 수 있다.In addition, the
또한, 상기 모니터링 서버(200)는 한눈에 파악할 수 있는 모든 지표를 통합한 그래프와 연동되어 그래프에서 추적 테이블의 값을 쉽게 찾을 수 있도록 구성한다.In addition, the
이와 같이, 상기 모니터링 서버(200)는 별도 리포트 기능 제공으로 원하는 보고서를 작성하고, 설정한 주기에 자동으로 보고서를 작성하여 관리자에게 제공할 수 있다.In this way, the
또한, 상기 모니터링 서버(200)의 화면 일측(또는 상기 모니터링 화면 일측)에 표시되는 복수의 메뉴 중에서 상기 사용자 정의보기 메뉴가 선택되는 경우, 상기 모니터링 서버(200)는 시스템의 전체 상태나 특정 정보를 표시하도록 설정하기 위한 사용자 정의보기 화면을 표시한다. 이때, 상기 복수의 메뉴는, 상기 OS별 대상 서버 목록 메뉴, 상기 대시보드 메뉴, 상기 사용자 정의보기 메뉴, 상기 설정 메뉴, 상기 로그인/로그아웃 메뉴 등을 포함한다. 여기서, 상기 사용자 정의보기 화면은 시스템의 전체 상태나, 특정 정보를 사용자가 직접 선택하여 구성한 화면을 제공하며, CPU의 사용량, 메모리의 사용량, 디스크의 사용량, 네트워크의 사용량, 파티션의 사용량, 스왑의 사용량, OS별 로그 등 사용자가 정의한 하나 이상의 정보를 포함한다.In addition, when the user-defined view menu is selected from among a plurality of menus displayed on one side of the screen (or one side of the monitoring screen) of the
또한, 상기 모니터링 서버(200)는 화면 설정을 저장하고, 미리 설정해 놓은 상태에 대응하는 화면(또는 상기 사용자 정의보기 화면)을 그대로 불러와 표시한다.In addition, the
이와 같이, 사용자 정의 페이지(또는 상기 사용자 정의보기 화면)에서는 모든 정보를 불러올 수 있기 때문에, 모니터링 환경에 최적의 상태를 관리자가 직접 구성하여 시스템 감시를 수행할 수 있다.As described above, since all information can be loaded from the user-defined page (or the user-defined view screen), the administrator can directly configure the optimal state for the monitoring environment to perform system monitoring.
또한, 상기 모니터링 서버(200)의 화면 일측(또는 상기 모니터링 화면 일측)에 표시되는 복수의 메뉴 중에서 상기 설정 메뉴가 선택되는 경우, 상기 모니터링 서버(200)는 알림 임계수치에 대한 정책을 설정하기 위한 알림 정책 설정 화면을 표시한다. 여기서, 상기 알림 정책 설정 화면은 관리자가 시스템에 따라 알림을 줄 임계수치를 각각 지정하기 위해서, CPU 항목, 메모리 항목, 파티션 사용 항목, 스왑 항목, 네트워크 항목, 디스크 정보 항목, 이벤트 항목, 포트 항목, 수집주기 항목, 정책이름 항목, 정책을 사용할 호스트 항목, 항목별 알림 경고값과 알림 크리티컬값과 수집 방식(예를 들어 간단/심플, 상세/디테일 등 포함)에 대한 항목, 알림 정책을 사용할(또는 적용할) 호스트명/그룹명 선택 항목 등을 포함한다.In addition, when the setting menu is selected from among a plurality of menus displayed on one side of the screen (or one side of the monitoring screen) of the
또한, 상기 모니터링 서버(200)는 상기 모니터링 서버(200)에 표시되는 알림 정책 설정 화면에서 모니터링 서버(200)의 관리자 입력(또는 사용자/관리자 선택/터치/제어)에 따른 복수의 입력 항목에 대응하는 복수의 입력값을 포함하는 알림 정책 설정 정보를 수신한다. 여기서, 상기 알림 정책 설정 정보는 알림 경고값과 알림 크리티컬값과 수집 방식을 포함하는 CPU 설정 정보, 알림 경고값과 알림 크리티컬값과 수집 방식을 포함하는 메모리 설정 정보, 알림 경고값과 알림 크리티컬값과 수집 방식을 포함하는 파티션 사용 설정 정보, 알림 경고값과 알림 크리티컬값과 수집 방식을 포함하는 스왑 설정 정보, 알림 경고값과 알림 크리티컬값과 수집 방식을 포함하는 네트워크 설정 정보, 수집 방식을 포함하는 디스크 정보 설정 정보, 수집 방식을 포함하는 이벤트 설정 정보, 수집 방식을 포함하는 포트 설정 정보, 수집 주기, 정책이름 등을 포함한다. 이때, 상기 수집 방식은 간단/심플(simple), 상세/디테일(detail) 등을 포함하며, 수집 방식에 따라 수집되는 데이터 종류가 다를 수 있다.In addition, the
또한, 상기 모니터링 서버(200)는 상기 수신된 알림 정책 설정 정보를 근거로 상기 알림 정책을 사용할 호스트명/그룹명으로부터 수집되는 자원 현황에 대해서 모니터링 기능을 수행하고, 이상 여부 발생 시 알람 기능을 제공한다.In addition, the
이때, 상기 모니터링 서버(200)는 해당 모니터링 서버(200)에서 관리 중인 하나 이상의 대상 서버(100)에 대해서 개별 대상 서버(100)별로 개별 알림 정책 설정 정보를 설정하거나 또는, 적어도 하나의 대상 서버(100)로 구성된 그룹별로 알림 정책 설정 정보를 설정하여, 모니터링 기능을 수행할 수 있다.At this time, the
이와 같이, 상기 모니터링 서버(200)는 운영체제 이벤트를 지원하고, 운영체제에서 관리하는 이벤트를 그대로 추적하고, 중요 심각도 및 패턴에 레벨을 두어 장애 대응이 용이하도록 구성할 수 있다.In this way, the
또한, 상기 모니터링 서버(200)는 일정 기간 이후 수집된 현황 정보 등의 데이터를 가공하여 저장하기 위해서 모니터링 데이터베이스(미도시)를 더 포함할 수 있다. 이때, 상기 모니터링 데이터베이스는 상기 모니터링 서버(200)와 별개로 구성할 수도 있다.In addition, the
이에 따라, 상기 모니터링 서버(200)는 상기 모니터링 데이터베이스를 통해 빠르고 정확한 데이터를 제공하여 장애 원인 분석을 효율성을 강화할 수 있다.Accordingly, the
이와 같이, 상기 모니터링 서버(200)는 수집된 정보를 체계적으로 관리하고, 능동적인 정보 요청으로 정보를 빠르게 가져올 수 있고, 자원 임계치에 대한 통지 설정으로 상태를 알려줄 수 있다.In this way, the
또한, 이와 같이, 복수의 대상 서버에 설치된 모니터링 에이전트를 통해 각 대상 서버로부터 자원 현황을 수집하고, 수집된 대상 서버별 자원 현황을 시각화하여 직관적으로 대시보드를 통해 표시할 수 있다.In addition, as described above, resource statuses can be collected from each target server through a monitoring agent installed on a plurality of target servers, and the collected resource statuses for each target server can be visualized and intuitively displayed through a dashboard.
또한, 이와 같이, CPU, 메모리, 디스크, 네트워크 등의 기본 데이터 외에 미리 설정된 성능 지표를 수집하고, 수집된 기본 데이터, 성능 지표 등을 근거로 성능 분석 보고서를 제공하고, 중요 심각도 및 패턴에 레벨을 두어 장애 발생에 따른 이벤트를 통지할 수 있다.In addition, in addition to basic data such as CPU, memory, disk, and network, pre-set performance indicators are collected, and performance analysis reports are provided based on the collected basic data and performance indicators, and levels are assigned to critical severity and patterns. You can also notify the event according to the occurrence of a failure.
이하에서는, 본 발명에 따른 실시간 통합 모니터링 방법을 도 1 내지 도 7을 참조하여 상세히 설명한다.Hereinafter, a real-time integrated monitoring method according to the present invention will be described in detail with reference to FIGS. 1 to 7.
도 2는 본 발명의 실시예에 따른 실시간 통합 모니터링 방법을 나타낸 흐름도이다.2 is a flowchart showing a real-time integrated monitoring method according to an embodiment of the present invention.
먼저, 모니터링 서버(200)는 하나 이상의 대상 서버(100)에 각각 설치된 모니터링 에이전트를 통해, 미리 설정된 주기마다 상기 하나 이상의 대상 서버(100)로부터 자원 현황을 수집하거나 또는, 해당 모니터링 서버(200)의 정보 요청에 대한 응답으로 하나 이상의 대상 서버(100)로부터 전송되는(또는 제공되는) 자원 현황을 수집한다. 여기서, 상기 자원 현황(또는 자원 현황 정보)은 CPU 사용량, 메모리 사용량, 디스크 사용량, 네트워크 사용량, 파티션 사용량, 스왑 사용량, OS별 로그 등을 포함한다. 또한, 상기 CPU 사용량은 이용률, 속도, 프로세스 개수, 스레드 개수, 핸들 개수, 작동 시간, 기본 속도, 소켓, 코어, 논리프로세서, 가상화 여부, Hyper-V 지원 여부, 캐시 등을 포함하며, 상기 메모리 사용량은 사용 중(압축) 용량, 사용가능 용량, 커밋됨 용량, 캐시됨 용량, 페이징 풀 용량, 비페이징 풀 용량, 속도, 사용된 슬롯, 폼 팩터, 하드웨어 예약 등을 포함하며, 상기 디스크 사용량은 활성 시간, 평균 응답 시간, 읽기 속도, 쓰기 속도, 용량, 포맷, 시스템 디스크 여부, 페이지 파일 여부 등을 포함하며, 상기 네트워크 사용량은 보내기 속도, 받기 속도, 어댑터 이름, 연결 형식, IPv4 주소, IPv6 주소 등을 포함한다.First, the
이때, 상기 대상 서버(100)가 하이퍼바이저로 구성된 경우, 상기 모니터링 서버(200)는 VMware API를 통해서 해당 대상 서버(100)와 관련한 자원 현황을 수집할 수 있다.At this time, when the
일 예로, 상기 모니터링 서버(200)는 윈도우 기반의 대상 서버(100)인 SU-TEST-WIN7 서버, DESKTOP-U4N3 서버 및 MERSOLEIL-BTCP 서버와, 리눅스 기반의 대상 서버(100)인 SVN-VIRTUAL-MACHINE 서버와 연동하여, 해당 대상 서버(100)에 각각 설치된 모니터링 에이전트 및/또는 VMware API를 통해서 상기 SU-TEST-WIN7 서버와 관련한 제 1 CPU 사용량, 제 1 메모리 사용량, 제 1 디스크 사용량, 제 1 네트워크 사용량, 제 1 파티션 사용량, 제 1 스왑 사용량, 제 1 OS별 로그와, 상기 DESKTOP-U4N3 서버와 관련한 제 2 CPU 사용량, 제 2 메모리 사용량, 제 2 디스크 사용량, 제 2 네트워크 사용량, 제 2 파티션 사용량, 제 2 스왑 사용량, 제 2 OS별 로그와, 상기 MERSOLEIL-BTCP 서버와 관련한 제 3 CPU 사용량, 제 3 메모리 사용량, 제 3 디스크 사용량, 제 3 네트워크 사용량, 제 3 파티션 사용량, 제 3 스왑 사용량, 제 3 OS별 로그와, 상기 SVN-VIRTUAL-MACHINE 서버와 관련한 제 4 CPU 사용량, 제 4 메모리 사용량, 제 4 디스크 사용량, 제 4 네트워크 사용량, 제 4 파티션 사용량, 제 4 스왑 사용량, 제 4 OS별 로그를 각각 수집한다(S210).For example, the
이후, 상기 모니터링 서버(200)는 상기 수집된 자원 현황을 시각화하여, 대시보드 형태로 모니터링 화면을 표시한다.Thereafter, the
즉, 상기 모니터링 서버(200)는 해당 모니터링 서버(200)에 미리 설치된 모니터링 앱(또는 전용 앱)을 실행하고, 모니터링 앱 실행에 따른 모니터링 화면을 표시한다. 이때, 상기 모니터링 화면(또는 앱 실행 결과 화면)은 상기 모니터링 서버(200)에서 관리 중인 하나 이상의 대상 서버(100)에 대한 목록과 온/오프 상태를 표시하기 위한 OS별 대상 서버 목록 메뉴(또는 버튼/항목), 대시보드 형태로 자원 현황을 시각화하여 표시하기 위한 대시보드 메뉴, 시스템의 전체 상태나 특정 정보를 표시하도록 설정하기 위한 사용자 정의보기 메뉴, 알림 정책을 설정하기 위한 설정 메뉴, 로그인 또는 로그아웃을 관리하기 위한 로그인/로그아웃 메뉴 등의 복수의 메뉴를 포함한다. 여기서, 상기 모니터링 서버(200)는 해당 모니터링 앱과 관련해서 회원 가입한 상태로, 회원 가입에 따른 아이디 및 비밀번호, 상기 아이디를 포함하는 바코드 또는 QR 코드 등을 이용해서 상기 전용 앱 실행 시 로그인 절차를 수행하여, 해당 모니터링 앱(또는 전용 앱)의 하나 이상의 기능(예를 들어 자원 현황 수집 기능, 대시보드 기능, 사용자 정의보기 기능, 설정 기능 등 포함)을 수행할 수 있다.That is, the
또한, 상기 모니터링 서버(200)의 화면 일측(또는 상기 모니터링 화면 일측)에 표시되는 복수의 메뉴 중에서 미리 설정된 대시보드 메뉴가 선택되는 경우, 상기 모니터링 서버(200)는 대시보드 형태로 자원 현황을 시각화하여 표시하기 위한 대시보드 화면을 표시한다. 여기서, 상기 대시보드 화면은 요약(summary) 항목(예를 들어 양호(good)/경고(warning)/크리티컬(critical) 호스트 개수, 양호/경고/크리티컬 아이템 개수, 양호/경고/크리티컬 가상 개수, 양호/경고/크리티컬 IPMI 개수, 양호/경고/크리티컬 이벤트 개수, 양호/경고/크리티컬 셀프 개수, 마지막 업데이트 정보 등 포함), 베이직 항목(예를 들어 고유 번호, 호스트, OS, CPU 사용량, 메모리 사용량, 파티션 사용량, 네트워크(NET) 사용량, 스왑(swap), 설명, 마지막 업데이트 정보 등 포함), IPMI(Intelligent Platform Management Interface) 항목(예를 들어 고유 번호, 호스트, 벤더, CPU, 메모리, FAN, 전력, 설명, 마지막 업데이트 정보 등 포함), 이벤트 로그 항목(예를 들어 고유 번호, 호스트, OS의 레벨(일 예로 메이저, 마이너, 크리티컬 등 포함), OS, 날짜와 시각, 메시지, 마지막 업데이트 정보 등 포함) 등을 포함한다. 또한, 상기 아이템 개수는 이상 상황(예를 들어 경고, 크리티컬 등 포함)이 발생한 CPU, 메모리, 디스크, 네트워크 등의 개수를 나타내고, 상기 셀프 개수는 해당 모니터링 서버(200)에서 발생하는 이상 상황에 대한 개수(또는 해당 모니터링 서버(200)에서 이상 상황이 발생한 CPU, 메모리, 디스크, 네트워크 등의 개수)를 나타낸다.In addition, when a preset dashboard menu is selected from among a plurality of menus displayed on one side of the screen of the monitoring server 200 (or one side of the monitoring screen), the
이때, 해당 모니터링 서버(200)에 미리 설치된 모니터링 앱(또는 전용 앱)을 실행하는 경우(또는 상기 모니터링 앱 실행 후 로그인하는 경우), 상기 모니터링 서버(200)는 상기 대시보드 메뉴에 대응하는 상기 대시보드 화면을 디폴트로 표시할 수도 있다.At this time, when executing a monitoring app (or a dedicated app) preinstalled in the monitoring server 200 (or when logging in after running the monitoring app), the
이와 같이, 상기 모니터링 서버(200)는 다양한 시스템(또는 대상 서버(100))의 성능 및 구성 정보를 가공하여 관리자가 쉽게 시스템의 전체 상황을 파악할 수 있도록 상기 대시보드 화면을 통해 제공할 수 있다.In this way, the
일 예로, 상기 모니터링 서버(200)는 해당 모니터링 서버(200)에 미리 설치된 모니터링 앱을 실행하고, 도 3에 도시된 바와 같이, 모니터링 앱 실행에 따른 모니터링 화면에 포함된 대시보드 메뉴(310)에 대응하는 대시보드 화면(300)을 표시한다(S220).For example, the
또한, 상기 모니터링 서버(200)의 화면의 다른 일측(또는 상기 모니터링 화면/대시보드 화면 다른 일측)에 표시되는 하나 이상의 대상 서버(100) 중에서(또는 상기 OS별 대상 서버 목록/리스트 중에서) 특정 대상 서버(100)가 선택되는 경우, 상기 모니터링 서버(200)는 상기 선택된 특정 대상 서버(100)와 관련한 상세 정보를 표시한다. 여기서, 상기 특정 대상 서버(100)와 관련한 상세 정보는 상기 수집된 특정 대상 서버(100)와 관련한 자원 현황을 시각화한 정보로, 텍스트, 그래프 등의 형태로 제공되며, CPU, 메모리, 디스크, 네트워크, 파티션, 스왑, 프로세스 등에 대한 사용량 등의 정보를 포함한다.In addition, a specific target among one or
이때, 상기 모니터링 서버(200)는 해당 모니터링 서버(200)의 관리자 입력에 따라 기간, 항목 등을 설정하여, 상기 설정된 기간, 항목 등에 대응하는 상세 정보(또는 상태 정보)를 조회(또는 검색/확인)할 수도 있다.At this time, the
일 예로, 상기 대시보드 화면(300)의 다른 일측에 표시되는 DESKTOP-U4N3 서버(340)가 선택될 때, 도 4 내지 도 5에 도시된 바와 같이, 상기 모니터링 서버(200)는 상기 선택된 DESKTOP-U4N3 서버(340)와 관련한 상세 정보(400, 500)를 표시한다(S230).For example, when the DESKTOP-
또한, 상기 모니터링 서버(200)의 화면 일측(또는 상기 모니터링 화면 일측)에 표시되는 복수의 메뉴 중에서 상기 사용자 정의보기 메뉴가 선택되는 경우, 상기 모니터링 서버(200)는 시스템의 전체 상태나 특정 정보를 표시하도록 설정하기 위한 사용자 정의보기 화면을 표시한다. 이때, 상기 복수의 메뉴는, 상기 OS별 대상 서버 목록 메뉴, 상기 대시보드 메뉴, 상기 사용자 정의보기 메뉴, 상기 설정 메뉴, 상기 로그인/로그아웃 메뉴 등을 포함한다. 여기서, 상기 사용자 정의보기 화면은 시스템의 전체 상태나, 특정 정보를 사용자가 직접 선택하여 구성한 화면을 제공하며, CPU의 사용량, 메모리의 사용량, 디스크의 사용량, 네트워크의 사용량, 파티션의 사용량, 스왑의 사용량, OS별 로그 등 사용자가 정의한 하나 이상의 정보를 포함한다.In addition, when the user-defined view menu is selected from among a plurality of menus displayed on one side of the screen (or one side of the monitoring screen) of the
또한, 상기 모니터링 서버(200)는 화면 설정을 저장하고, 미리 설정해 놓은 상태에 대응하는 화면(또는 상기 사용자 정의보기 화면)을 그대로 불러와 표시한다.In addition, the
이와 같이, 사용자 정의 페이지(또는 상기 사용자 정의보기 화면)에서는 모든 정보를 불러올 수 있기 때문에, 모니터링 환경에 최적의 상태를 관리자가 직접 구성하여 시스템 감시를 수행할 수 있다.As described above, since all information can be loaded from the user-defined page (or the user-defined view screen), the administrator can directly configure the optimal state for the monitoring environment to perform system monitoring.
일 예로, 상기 대시보드 화면(300)의 일측에 표시되는 사용자 정의보기 메뉴(320)가 선택될 때, 도 6에 도시된 바와 같이, 상기 모니터링 서버(200)는 상기 선택된 사용자 정의보기 메뉴(320)에 대응하는 사용자 정의보기 화면(600)을 표시한다(S240).For example, when the user-defined
또한, 상기 모니터링 서버(200)의 화면 일측(또는 상기 모니터링 화면 일측)에 표시되는 복수의 메뉴 중에서 상기 설정 메뉴가 선택되는 경우, 상기 모니터링 서버(200)는 알림 임계수치에 대한 정책을 설정하기 위한 알림 정책 설정 화면을 표시한다. 여기서, 상기 알림 정책 설정 화면은 관리자가 시스템에 따라 알림을 줄 임계수치를 각각 지정하기 위해서, CPU 항목, 메모리 항목, 파티션 사용 항목, 스왑 항목, 네트워크 항목, 디스크 정보 항목, 이벤트 항목, 포트 항목, 수집주기 항목, 정책이름 항목, 정책을 사용할 호스트 항목, 항목별 알림 경고값과 알림 크리티컬값과 수집 방식(예를 들어 간단/심플, 상세/디테일 등 포함)에 대한 항목, 알림 정책을 사용할(또는 적용할) 호스트명/그룹명 선택 항목 등을 포함한다.In addition, when the setting menu is selected from among a plurality of menus displayed on one side of the screen (or one side of the monitoring screen) of the
또한, 상기 모니터링 서버(200)는 상기 모니터링 서버(200)에 표시되는 알림 정책 설정 화면에서 모니터링 서버(200)의 관리자 입력(또는 사용자/관리자 선택/터치/제어)에 따른 복수의 입력 항목에 대응하는 복수의 입력값을 포함하는 알림 정책 설정 정보를 수신한다. 여기서, 상기 알림 정책 설정 정보는 알림 경고값과 알림 크리티컬값과 수집 방식을 포함하는 CPU 설정 정보, 알림 경고값과 알림 크리티컬값과 수집 방식을 포함하는 메모리 설정 정보, 알림 경고값과 알림 크리티컬값과 수집 방식을 포함하는 파티션 사용 설정 정보, 알림 경고값과 알림 크리티컬값과 수집 방식을 포함하는 스왑 설정 정보, 알림 경고값과 알림 크리티컬값과 수집 방식을 포함하는 네트워크 설정 정보, 수집 방식을 포함하는 디스크 정보 설정 정보, 수집 방식을 포함하는 이벤트 설정 정보, 수집 방식을 포함하는 포트 설정 정보, 수집 주기, 정책이름 등을 포함한다. 이때, 상기 수집 방식은 간단/심플(simple), 상세/디테일(detail) 등을 포함하며, 수집 방식에 따라 수집되는 데이터 종류가 다를 수 있다.In addition, the
또한, 상기 모니터링 서버(200)는 상기 수신된 알림 정책 설정 정보를 근거로 상기 알림 정책을 사용할 호스트명/그룹명으로부터 수집되는 자원 현황에 대해서 모니터링 기능을 수행하고, 이상 여부 발생 시 알람 기능을 제공한다.In addition, the
이때, 상기 모니터링 서버(200)는 해당 모니터링 서버(200)에서 관리 중인 하나 이상의 대상 서버(100)에 대해서 개별 대상 서버(100)별로 개별 알림 정책 설정 정보를 설정하거나 또는, 적어도 하나의 대상 서버(100)로 구성된 그룹별로 알림 정책 설정 정보를 설정하여, 모니터링 기능을 수행할 수 있다.At this time, the
일 예로, 상기 대시보드 화면(300)의 일측에 표시되는 설정 메뉴(330)가 선택될 때, 도 7에 도시된 바와 같이, 상기 모니터링 서버(200)는 상기 선택된 설정 메뉴(330)에 대응하는 알림 정책 설정 화면(700)을 표시한다.For example, when a
또한, 상기 모니터링 서버(200)는 상기 모니터링 서버(200)에 표시되는 알림 정책 설정 화면(700)에서 모니터링 서버(200)의 관리자 입력에 따른 제 1 CPU 설정 정보(예를 들어 30%의 알림 경고값, 50%의 알림 크리티컬값, 심플 수집 방식 등 포함), 제 1 메모리 설정 정보(예를 들어 30%의 알림 경고값, 50%의 알림 크리티컬값, 심플 수집 방식 등 포함), 제 1 파티션 사용 설정 정보(예를 들어 30%의 알림 경고값, 50%의 알림 크리티컬값, 심플 수집 방식 등 포함), 제 1 스왑 설정 정보(예를 들어 30%의 알림 경고값, 50%의 알림 크리티컬값, 심플 수집 방식 등 포함), 제 1 네트워크 설정 정보(예를 들어 30%의 알림 경고값, 50%의 알림 크리티컬값, 심플 수집 방식 등 포함), 제 1 디스크 정보 설정 정보(예를 들어 디테일 수집 방식 등 포함), 제 1 이벤트 설정 정보(예를 들어 디테일 수집 방식 등 포함), 제 1 포트 설정 정보(예를 들어 디테일 수집 방식 등 포함), 제 1 수집 주기(예를 들어 5초), 제 1 정책이름(예를 들어 EOS_POL), 알림 정책을 사용할 제 1 호스트명(예를 들어 SVN-VIRTUAL-MACHINE 서버) 등을 포함하는 제 1 알림 정책 설정 정보를 수신한다.In addition, the monitoring server 200 is the first CPU setting information according to the administrator input of the monitoring server 200 in the notification policy setting screen 700 displayed on the monitoring server 200 (for example, 30% notification warning Value, 50% notification critical value, simple collection method, etc.), first memory setting information (for example, 30% notification warning value, 50% notification critical value, simple collection method, etc.), use of the first partition Setting information (for example, 30% notification warning value, 50% notification critical value, simple collection method, etc.), first swap setting information (for example, 30% notification warning value, 50% notification critical value, Simple collection method, etc.), first network setting information (for example, 30% notification warning value, 50% notification critical value, simple collection method, etc.), first disk information setting information (for example, detailed collection method) Etc.), first event setting information (eg, including detail collection method), first port setting information (eg, including detail collection method, etc.), first collection period (eg, 5 seconds), first First notification policy setting information including a policy name (eg EOS_POL), a first host name to use the notification policy (eg, SVN-VIRTUAL-MACHINE server), and the like is received.
또한, 상기 모니터링 서버(200)는 상기 수신된 제 1 알림 정책 설정 정보를 근거로 상기 SVN-VIRTUAL-MACHINE 서버로부터 수집되는 하나 이상의 자원 현황에 대해서 모니터링 기능을 수행하고, 이상 여부 발생시 알람 기능을 제공한다(S250).In addition, the
본 발명의 실시예는 앞서 설명된 바와 같이, 복수의 대상 서버에 설치된 모니터링 에이전트를 통해 각 대상 서버로부터 자원 현황을 수집하고, 수집된 대상 서버별 자원 현황을 시각화하여 직관적으로 대시보드를 통해 표시하여, 효율적인 모니터링과 알람을 통한 장애 발생을 사전에 관리할 수 있다.As described above, the embodiment of the present invention collects the resource status from each target server through a monitoring agent installed in a plurality of target servers, visualizes the collected resource status by target server, and intuitively displays it through a dashboard. In addition, it is possible to manage failures in advance through efficient monitoring and alarms.
또한, 본 발명의 실시예는 앞서 설명된 바와 같이, CPU, 메모리, 디스크, 네트워크 등의 기본 데이터 외에 미리 설정된 성능 지표를 수집하고, 수집된 기본 데이터, 성능 지표 등을 근거로 성능 분석 보고서를 제공하고, 중요 심각도 및 패턴에 레벨을 두어 장애 발생에 따른 이벤트를 통지하여, 장애발생시 빠른 원인 파악으로 서비스 장애 시간을 감소시키고, 시스템 분석을 통해 향후 자원 증설 계획을 수립 및 실행할 수 있다.In addition, as described above, an embodiment of the present invention collects preset performance indicators in addition to basic data such as CPU, memory, disk, and network, and provides a performance analysis report based on the collected basic data and performance indicators. In addition, by placing a level on the critical severity and pattern, it notifies the event according to the occurrence of a failure, reduces service failure time by quickly identifying the cause when a failure occurs, and establishes and executes a plan for future resource expansion through system analysis.
전술된 내용은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above contents may be modified and modified without departing from the essential characteristics of the present invention by those of ordinary skill in the technical field to which the present invention belongs. Accordingly, the embodiments disclosed in the present invention are not intended to limit the technical idea of the present invention, but to explain the technical idea, and the scope of the technical idea of the present invention is not limited by these embodiments. The scope of protection of the present invention should be interpreted by the following claims, and all technical ideas within the scope equivalent thereto should be interpreted as being included in the scope of the present invention.
10: 실시간 통합 모니터링 시스템 100: 하나 이상의 대상 서버
200: 모니터링 서버10: real-time integrated monitoring system 100: one or more target servers
200: monitoring server
Claims (10)
하나 이상의 대상 서버에 각각 설치된 모니터링 에이전트를 통해, 미리 설정된 주기마다 상기 하나 이상의 대상 서버로부터 자원 현황을 수집하고, 상기 수집된 자원 현황을 시각화하여, 대시보드 형태로 모니터링 화면을 표시하는 모니터링 서버를 포함하며,
상기 모니터링 서버는,
상기 모니터링 서버의 화면 일측에 표시되는 복수의 메뉴 중에서 미리 설정된 설정 메뉴가 선택될 때, 알림 임계수치에 대한 정책을 설정하기 위한 알림 정책 설정 화면을 표시하고, 상기 모니터링 서버에 표시되는 알림 정책 설정 화면에서 모니터링 서버의 관리자 입력에 따른 복수의 입력 항목에 대응하는 복수의 입력값을 포함하는 알림 정책 설정 정보를 수신하고, 상기 수신된 알림 정책 설정 정보를 근거로 상기 알림 정책을 사용할 호스트명/그룹명으로부터 수집되는 자원 현황에 대해서 모니터링 기능을 수행하고, 이상 여부 발생 시 알람 기능을 제공하는 것을 특징으로 하는 실시간 통합 모니터링 시스템.A target server on which a monitoring agent is installed; And
Includes a monitoring server that collects resource status from the one or more target servers at each preset cycle through monitoring agents installed on one or more target servers, visualizes the collected resource status, and displays a monitoring screen in the form of a dashboard. And
The monitoring server,
When a preset setting menu is selected from among a plurality of menus displayed on one side of the screen of the monitoring server, a notification policy setting screen for setting a policy for a notification threshold is displayed, and a notification policy setting screen displayed on the monitoring server Receives notification policy setting information including a plurality of input values corresponding to a plurality of input items according to the administrator input of the monitoring server, and uses the notification policy based on the received notification policy setting information Real-time integrated monitoring system, characterized in that it performs a monitoring function for the status of resources collected from and provides an alarm function when an abnormality occurs.
상기 모니터링 서버는,
상기 모니터링 서버에 미리 설치된 모니터링 앱을 실행하고, 모니터링 앱 실행에 따른 모니터링 화면을 표시하고, 상기 모니터링 서버의 화면 일측에 표시되는 복수의 메뉴 중에서 미리 설정된 대시보드 메뉴가 선택될 때 대시보드 형태로 자원 현황을 시각화하여 표시하기 위한 대시보드 화면을 표시하는 것을 특징으로 하는 실시간 통합 모니터링 시스템.The method of claim 1,
The monitoring server,
A resource in the form of a dashboard when a preset dashboard menu is selected from among a plurality of menus displayed on one side of the screen of the monitoring server by executing the monitoring app pre-installed on the monitoring server, displaying a monitoring screen according to the execution of the monitoring app Real-time integrated monitoring system, characterized in that displaying a dashboard screen for visualizing and displaying the status.
상기 대시보드 화면은,
요약 항목, 베이직 항목, IPMI(Intelligent Platform Management Interface) 항목 및 이벤트 로그 항목 중 적어도 하나를 포함하는 것을 특징으로 하는 실시간 통합 모니터링 시스템.The method of claim 2,
The dashboard screen,
A real-time integrated monitoring system comprising at least one of a summary item, a basic item, an IPMI (Intelligent Platform Management Interface) item, and an event log item.
상기 요약 항목은,
양호(good)/경고(warning)/크리티컬(critical) 호스트 개수, 양호/경고/크리티컬 아이템 개수, 양호/경고/크리티컬 가상 개수, 양호/경고/크리티컬 IPMI 개수, 양호/경고/크리티컬 이벤트 개수, 양호/경고/크리티컬 셀프 개수 및 마지막 업데이트 정보를 포함하며,
상기 베이직 항목은,
고유 번호, 호스트, OS, CPU 사용량, 메모리 사용량, 파티션 사용량, 네트워크(NET) 사용량, 스왑(swap), 설명 및 마지막 업데이트 정보를 포함하며,
상기 IPMI 항목은,
고유 번호, 호스트, 벤더, CPU, 메모리, FAN, 전력, 설명 및 마지막 업데이트 정보를 포함하며,
상기 이벤트 로그 항목은,
고유 번호, 호스트, OS의 레벨, OS, 날짜와 시각, 메시지 및 마지막 업데이트 정보를 포함하는 것을 특징으로 하는 실시간 통합 모니터링 시스템.The method of claim 3,
The summary items above are:
Number of good/warning/critical hosts, number of good/warning/critical items, number of good/warning/critical virtual number, number of good/warning/critical IPMI, number of good/warning/critical events, good Includes /warning/critical self count and last update information,
The above basic items,
Contains unique number, host, OS, CPU usage, memory usage, partition usage, network (NET) usage, swap, description and last update information,
The above IPMI items are:
Contains unique number, host, vendor, CPU, memory, FAN, power, description and last updated information,
The event log entries above are,
A real-time integrated monitoring system comprising a unique number, host, level of OS, OS, date and time, message and last update information.
상기 모니터링 서버는,
상기 모니터링 서버의 화면 일측에 표시되는 복수의 메뉴 중에서 미리 설정된 사용자 정의보기 메뉴가 선택될 때, 시스템의 전체 상태나 특정 정보를 표시하도록 설정하기 위한 사용자 정의보기 화면을 표시하는 것을 특징으로 하는 실시간 통합 모니터링 시스템.The method of claim 2,
The monitoring server,
Real-time integration, characterized in that, when a preset user-defined view menu is selected from among a plurality of menus displayed on one side of the screen of the monitoring server, a user-defined view screen for setting to display the overall status of the system or specific information is displayed. Monitoring system.
상기 모니터링 서버의 화면 일측에 표시되는 복수의 메뉴 중에서 미리 설정된 대시보드 메뉴가 선택될 때, 상기 모니터링 서버에 의해, 대시보드 형태로 자원 현황을 시각화하여 표시하기 위한 대시보드 화면을 표시하는 단계;
상기 모니터링 서버의 화면의 다른 일측에 표시되는 하나 이상의 대상 서버 중에서 특정 대상 서버가 선택될 때, 상기 모니터링 서버에 의해, 수집된 특정 대상 서버와 관련한 자원 현황을 시각화한 상세 정보를 표시하는 단계;
상기 모니터링 서버의 화면 일측에 표시되는 복수의 메뉴 중에서 미리 설정된 설정 메뉴가 선택될 때, 상기 모니터링 서버에 의해, 알림 임계수치에 대한 정책을 설정하기 위한 알림 정책 설정 화면을 표시하는 단계;
상기 모니터링 서버에 의해, 상기 모니터링 서버에 표시되는 알림 정책 설정 화면에서 모니터링 서버의 관리자 입력에 따른 복수의 입력 항목에 대응하는 복수의 입력값을 포함하는 알림 정책 설정 정보를 수신하는 단계; 및
상기 모니터링 서버에 의해, 상기 수신된 알림 정책 설정 정보를 근거로 상기 알림 정책을 사용할 호스트명/그룹명으로부터 수집되는 자원 현황에 대해서 모니터링 기능을 수행하고, 이상 여부 발생 시 알람 기능을 제공하는 단계를 포함하는 실시간 통합 모니터링 방법.Executing, by a monitoring server, a monitoring app pre-installed on the monitoring server, and displaying a monitoring screen according to execution of the monitoring app;
Displaying, by the monitoring server, a dashboard screen for visualizing and displaying resource status in a dashboard form when a preset dashboard menu is selected from among a plurality of menus displayed on one side of the screen of the monitoring server;
When a specific target server is selected from among one or more target servers displayed on the other side of the screen of the monitoring server, displaying, by the monitoring server, detailed information visualizing the collected resource status related to the specific target server;
Displaying, by the monitoring server, a notification policy setting screen for setting a policy for a notification threshold value when a preset setting menu is selected from among a plurality of menus displayed on one side of the screen of the monitoring server;
Receiving, by the monitoring server, notification policy setting information including a plurality of input values corresponding to a plurality of input items according to an administrator input of the monitoring server from a notification policy setting screen displayed on the monitoring server; And
By the monitoring server, based on the received notification policy setting information, performing a monitoring function on the resource status collected from the host name/group name to be used for the notification policy, and providing an alarm function when an abnormality occurs. Including real-time integrated monitoring method.
상기 자원 현황은,
상기 모니터링 서버에 의해, 하나 이상의 대상 서버에 각각 설치된 모니터링 에이전트를 통해, 미리 설정된 주기마다 상기 하나 이상의 대상 서버로부터 수집되며,
상기 대상 서버가 하이퍼바이저로 구성된 상태일 때, 상기 모니터링 서버에 의해, VMware API를 통해서 상기 하이퍼바이저로 구성된 대상 서버와 관련한 자원 현황이 수집되며,
CPU 사용량, 메모리 사용량, 디스크 사용량, 네트워크 사용량, 파티션 사용량, 스왑 사용량 및 OS별 로그 중 적어도 하나를 포함하는 것을 특징으로 하는 실시간 통합 모니터링 방법.The method of claim 7,
The above resource status,
It is collected from the one or more target servers at preset periods by the monitoring server, through monitoring agents respectively installed on one or more target servers,
When the target server is configured as a hypervisor, the status of resources related to the target server configured as the hypervisor is collected by the monitoring server through the VMware API,
Real-time integrated monitoring method comprising at least one of CPU usage, memory usage, disk usage, network usage, partition usage, swap usage, and OS-specific logs.
상기 모니터링 서버의 화면 일측에 표시되는 복수의 메뉴 중에서 미리 설정된 사용자 정의보기 메뉴가 선택될 때, 상기 모니터링 서버에 의해, 시스템의 전체 상태나 특정 정보를 표시하도록 설정하기 위한 사용자 정의보기 화면을 표시하는 단계를 더 포함하는 것을 특징으로 하는 실시간 통합 모니터링 방법.The method of claim 7,
When a preset user-defined view menu is selected from among a plurality of menus displayed on one side of the screen of the monitoring server, the monitoring server displays a user-defined view screen for setting to display the overall status of the system or specific information. Real-time integrated monitoring method, characterized in that it further comprises the step.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200106526A KR102176028B1 (en) | 2020-08-24 | 2020-08-24 | System for Real-time integrated monitoring and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200106526A KR102176028B1 (en) | 2020-08-24 | 2020-08-24 | System for Real-time integrated monitoring and method thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102176028B1 true KR102176028B1 (en) | 2020-11-09 |
Family
ID=73429423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200106526A KR102176028B1 (en) | 2020-08-24 | 2020-08-24 | System for Real-time integrated monitoring and method thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102176028B1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102403522B1 (en) * | 2021-06-29 | 2022-05-31 | 주식회사 에이텍 | Failure prevention apparatus and method using computer advance detection |
KR20220121008A (en) * | 2021-02-24 | 2022-08-31 | 주식회사 위젯누리 | Method for provinding integrated management platform for device failures |
CN117331793A (en) * | 2023-11-27 | 2024-01-02 | 南京掌控网络科技有限公司 | Automatic on-duty process monitoring method and system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100059517A (en) * | 2008-11-26 | 2010-06-04 | (주) 엘지텔레콤 | Monitoring sysyem and operating method thereof |
US20140040343A1 (en) * | 2005-09-15 | 2014-02-06 | Peter Nickolov | Globally Distributed Utility Computing Cloud |
KR20170021338A (en) * | 2014-08-22 | 2017-02-27 | 인텔 코포레이션 | A power aware job scheduler and manager for a data processing system |
KR20170070568A (en) * | 2015-12-14 | 2017-06-22 | 주식회사 이스턴생명과학 | System and method for managing servers totally |
-
2020
- 2020-08-24 KR KR1020200106526A patent/KR102176028B1/en active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140040343A1 (en) * | 2005-09-15 | 2014-02-06 | Peter Nickolov | Globally Distributed Utility Computing Cloud |
KR20100059517A (en) * | 2008-11-26 | 2010-06-04 | (주) 엘지텔레콤 | Monitoring sysyem and operating method thereof |
KR20170021338A (en) * | 2014-08-22 | 2017-02-27 | 인텔 코포레이션 | A power aware job scheduler and manager for a data processing system |
KR20170070568A (en) * | 2015-12-14 | 2017-06-22 | 주식회사 이스턴생명과학 | System and method for managing servers totally |
KR101783201B1 (en) | 2015-12-14 | 2017-10-13 | 주식회사 이스턴생명과학 | System and method for managing servers totally |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220121008A (en) * | 2021-02-24 | 2022-08-31 | 주식회사 위젯누리 | Method for provinding integrated management platform for device failures |
KR102549129B1 (en) * | 2021-02-24 | 2023-06-30 | 주식회사 위젯누리 | Method for provinding integrated management platform for device failures |
KR102403522B1 (en) * | 2021-06-29 | 2022-05-31 | 주식회사 에이텍 | Failure prevention apparatus and method using computer advance detection |
CN117331793A (en) * | 2023-11-27 | 2024-01-02 | 南京掌控网络科技有限公司 | Automatic on-duty process monitoring method and system |
CN117331793B (en) * | 2023-11-27 | 2024-02-23 | 南京掌控网络科技有限公司 | Automatic on-duty process monitoring method and system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102176028B1 (en) | System for Real-time integrated monitoring and method thereof | |
US10810096B2 (en) | Deferred server recovery in computing systems | |
JP4980792B2 (en) | Virtual machine performance monitoring method and apparatus using the method | |
US8516106B2 (en) | Use tag clouds to visualize components related to an event | |
EP2251790A1 (en) | Server device, method of detecting failure of server device, and program of detecting failure of server device | |
US8910049B2 (en) | User-initiated mode for remote support | |
US20120005609A1 (en) | Management system and management system control method | |
US11329869B2 (en) | Self-monitoring | |
US8935373B2 (en) | Management system and computer system management method | |
JP4811830B1 (en) | Computer resource control system | |
EP3330855A1 (en) | Managing hardware resources | |
US8516097B2 (en) | Server managing apparatus and server managing method | |
US9021078B2 (en) | Management method and management system | |
US9317354B2 (en) | Dynamically determining an external systems management application to report system errors | |
CN111782341B (en) | Method and device for managing clusters | |
JP5597293B2 (en) | Computer system and program | |
CN114816914A (en) | Data processing method, equipment and medium based on Kubernetes | |
CN114443439B (en) | ARM server-based control method, ARM server-based control device, ARM server-based control equipment and storage medium | |
JP5390651B2 (en) | Computer system and program | |
JP2012089109A (en) | Computer resource control system | |
US20220391277A1 (en) | Computing cluster health reporting engine | |
JP2023061137A (en) | Management method of virtual server and virtual server management system used for the same | |
CN113918329A (en) | Information display method and device | |
CN115292139A (en) | Resource regulation and control method, cloud platform, equipment and readable storage medium | |
US20140040447A1 (en) | Management system and program product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |