KR20170070568A - 서버 통합 관리 시스템 및 방법 - Google Patents

서버 통합 관리 시스템 및 방법 Download PDF

Info

Publication number
KR20170070568A
KR20170070568A KR1020150178246A KR20150178246A KR20170070568A KR 20170070568 A KR20170070568 A KR 20170070568A KR 1020150178246 A KR1020150178246 A KR 1020150178246A KR 20150178246 A KR20150178246 A KR 20150178246A KR 20170070568 A KR20170070568 A KR 20170070568A
Authority
KR
South Korea
Prior art keywords
server
managed
failure
management
battery
Prior art date
Application number
KR1020150178246A
Other languages
English (en)
Other versions
KR101783201B1 (ko
Inventor
유세권
Original Assignee
주식회사 이스턴생명과학
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 이스턴생명과학 filed Critical 주식회사 이스턴생명과학
Priority to KR1020150178246A priority Critical patent/KR101783201B1/ko
Publication of KR20170070568A publication Critical patent/KR20170070568A/ko
Application granted granted Critical
Publication of KR101783201B1 publication Critical patent/KR101783201B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/30Transportation; Communications
    • G06Q50/32Post and telecommunications
    • H04L51/22
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • H04W4/14Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]

Abstract

본 발명은 서버들을 통합하여 관리하는 서버 통합 관리 시스템 및 그 방법에 관한 것으로서, 본 발명은 둘 이상의 관리 대상 서버를 통합하여 관리하는 서버 통합 관리 시스템에서, 둘 이상의 관리 대상 서버로부터 하드웨어 정보 및 소프트웨어 정보를 수집하여, 각 서버의 현황을 파악하고 관리하는 관리 서버, 수집된 하드웨어 정보 및 소프트웨어 정보를 저장하고 있으며, 저장하고 있는 정보를 상기 관리 서버에 제공하기 위한 데이터베이스 및 서버 통합 관리 시스템을 관리하는 관리자가 사용하는 단말로서, 상기 관리 서버와 통신하며, 관리 대상 서버의 현황을 화면에 표시하고, 관리자로부터 입력된 명령을 상기 관리 서버에 전달하는 관리자 단말을 포함하되, 상기 관리 서버는 관리 대상 서버의 장애 패턴을 분석하여 유사한 장애가 발생하는 것을 예방하기 위하여, 관리 대상 서버에서 미리 정해진 이벤트 발생시, 발생된 이벤트에 따른 장애가 발생할 수 있음을 기재한 예상 장애 발생 메시지를 해당 관리 대상 서버에 송신하고, 이와 함께 예상 장애에 대한 해결 방법을 해당 관리 대상 서버에 전달한다. 본 발명에 의하면, 선제적으로 서버에서 발생하는 장애를 예측하여 경고하고 해결 방법을 제공함으로써, 서버에서 발생할 수 있는 장애를 미리 예방하고, 서버 장애에 따른 피해를 감소시킬 수 있는 효과가 있다.

Description

서버 통합 관리 시스템 및 방법 {System and method for managing servers totally}
본 발명은 서버들을 통합하여 관리하는 서버 통합 관리 시스템 및 그 방법에 관한 것으로서, 더욱 상세하게는 서버에서 발생하는 장애 패턴을 분석하여, 특정 이벤트 발생시 선제적으로 장애 발생을 경고함으로써, 신속히 대처할 수 있도록 하는 서버 통합 관리 시스템 및 방법에 관한 것이다.
최근 컴퓨터가 대용량화, 고속화됨에 따라, 시스템의 에러나 바이러스 등에 의한 컴퓨터 장애가 자주 발생되고 있다. 특히 대용량의 서버의 경우 다양한 응용 프로그램의 동작과 데이터 저장, 독출 및 전송 등 여러 요인에 의한 장애가 빈번하게 발생할 수 있다. 따라서 각 기업에서는 이러한 서버를 관리하는 별도의 서버 관리자를 상주시켜 서버를 관리하고, 장애 발생시 이를 처리하도록 하고 있다.
그런데, 서버 관리에는 전문적인 기술이 요구되며, 그러한 전문 인력을 채용하기에는 상당한 비용이 요구된다. 따라서 특히 소규모의 기업 등에서는 해당 서버 관리자로서 전문 기술자를 채용하는 것이 아니라, 사내 기존 인력 중에서 적절한 사람을 선택하여 서버 관리자로서 두고 있는 실정이다. 그럴 경우에는 서버 관리가 원활히 이루어지기 힘들며, 더구나 서버 장애 발생시에 원활히 대처하기가 거의 불가능하다.
또한, 서버 관리를 위해 전문 기술을 가진 서버 관리자를 채용하였을 경우에도, 서버 관리자가 출장 등의 이유로 서버에서 원격지에 있을 경우에는 서버의 장애 발생시 이러한 서버의 상황이 관리자에 신속히 통보되기가 힘들어서 서버 장애 발생시에 원활히 대처하기가 힘들었다 더욱이 서버 관리자가 해당 서버의 장애 발생을 통보 받았을 경우에도, 원격지에 있는 관계로 이에 대한 즉각적인 대처가 어려워서, 결국 서버가 다운되는 등 막대한 손실이 초래될 수 있다.
종래에는 다수의 서버들을 통합하여 관리하는 서버 통합 관리 시스템에서 어떤 서버에 장애가 발생하면, 이를 감지하고, 사후에 장애를 복구하는 방식이다. 그러나, 이러한 종래의 사후 장애 복구 방식은, 장애가 발생한 서버를 복구하는 기간 동안 해당 서버의 동작이 중단되고, 서버 사용 중단에 따른 손실이 발생하고, 복구하는데 드는 인력과 비용에 따른 손해가 크다는 문제점이 있다.
대한민국 공개특허 10-2015-0124642
본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 서버에서 발생하는 장애 패턴을 분석하여, 특정 이벤트 발생시 장애 발생을 경고함으로써, 선제적으로 장애 발생을 예방할 수 있도록 하는 서버 통합 관리 시스템 및 방법을 제공하는데 그 목적이 있다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
이와 같은 목적을 달성하기 위한 본 발명은 둘 이상의 관리 대상 서버를 통합하여 관리하는 서버 통합 관리 시스템에서, 둘 이상의 관리 대상 서버로부터 하드웨어 정보 및 소프트웨어 정보를 수집하여, 각 서버의 현황을 파악하고 관리하는 관리 서버, 수집된 하드웨어 정보 및 소프트웨어 정보를 저장하고 있으며, 저장하고 있는 정보를 상기 관리 서버에 제공하기 위한 데이터베이스 및 서버 통합 관리 시스템을 관리하는 관리자가 사용하는 단말로서, 상기 관리 서버와 통신하며, 관리 대상 서버의 현황을 화면에 표시하고, 관리자로부터 입력된 명령을 상기 관리 서버에 전달하는 관리자 단말을 포함하되, 상기 관리 서버는 관리 대상 서버의 장애 패턴을 분석하여 유사한 장애가 발생하는 것을 예방하기 위하여, 관리 대상 서버에서 미리 정해진 이벤트 발생시, 발생된 이벤트에 따른 장애가 발생할 수 있음을 기재한 예상 장애 발생 메시지를 해당 관리 대상 서버에 송신하고, 이와 함께 예상 장애에 대한 해결 방법을 해당 관리 대상 서버에 전달한다.
상기 관리 서버는 상기 데이터베이스에 등록된 해당 관리 대상 서버의 담당 관리자에게 SMS(short message service)와 이메일(e-mail)을 통해 예상 장애 발생 메시지를 송신하고, 해당 관리 대상 서버에 대한 상세한 정보와 함께, 예상 장애에 대한 해결 방법을 전달할 수 있다.
상기 관리 서버는 관리 대상 서버의 BBU(Backup Battery Unit) 주기를 점검하여, 미리 정해진 주기가 되면, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
상기 관리 서버는 관리 대상 서버의 BBU 충전 용량을 점검하여, 배터리의 충전 효율이 미리 정해진 수치 이하로 감소하면, 이 내용을 해당 관리 대상 서버에 알릴 수 있다. 예를 들어, 상기 관리 서버는 관리 대상 서버의 BBU 충전 용량을 점검하여, 배터리의 충전 효율이 40% 이하로 감소되면, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
상기 관리 서버는 관리 대상 서버의 BBU 잔여 용량을 점검하여, 배터리의 잔량이 미리 정해진 수치 이하인 경우, 이 내용을 해당 관리 대상 서버에 알릴 수 있다. 예를 들어, 상기 관리 서버는 관리 대상 서버의 BBU 잔여 용량을 점검하여, 배터리의 잔량이 10% 이하인 경우, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
상기 관리 서버는 관리 대상 서버의 BBU 쓰기 정책(Write Policy)을 점검하여, 쓰기 정책이 변경되면, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
상기 관리 대상 서버들 중 델(Dell) 서버가 포함되어 있으며, 상기 관리 서버는 상기 델 서버에서 커널(Kernel) 업데이트(update) 후, OS(Operating system) 상에서 이상 작동이 발견되면, 이로 인해 발생할 수 있는 예상 장애 발생 메시지를 해당 관리 대상 서버에 송신하고, 이와 함께 예상 장애에 대한 해결 방법을 해당 관리 대상 서버에 전달할 수 있다.
상기 관리 서버는 관리 대상 서버의 메모리 생산 주기를 진단하고, 미리 정해진 메모리 생산 주기를 불량으로 판정하고, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
본 발명의 둘 이상의 관리 대상 서버를 통합하여 관리하는 서버 통합 관리 시스템에서의 서버 통합 관리 방법에서, 상기 서버 통합 관리 시스템은 둘 이상의 관리 대상 서버로부터 하드웨어 정보 및 소프트웨어 정보를 수집하여, 각 서버의 현황을 파악하고 관리하는 단계, 관리 대상 서버의 장애 패턴을 분석하는 단계 및 장애 패턴 분석 결과, 미리 정해진 이벤트 발생시, 발생된 이벤트에 따른 장애가 발생할 수 있음을 기재한 예상 장애 발생 메시지를 해당 관리 대상 서버에 송신하고, 이와 함께 예상 장애에 대한 해결 방법을 해당 관리 대상 서버에 전달할 수 있다.
상기 서버 통합 관리 시스템은 등록된 해당 관리 대상 서버의 담당 관리자에게 SMS(short message service)와 이메일(e-mail)을 통해 예상 장애 발생 메시지를 송신하고, 해당 관리 대상 서버에 대한 상세한 정보와 함께, 예상 장애에 대한 해결 방법을 전달할 수 있다.
상기 서버 통합 관리 시스템은 관리 대상 서버의 BBU(Backup Battery Unit) 주기를 점검하여, 미리 정해진 주기가 되면, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
상기 서버 통합 관리 시스템은 관리 대상 서버의 BBU 충전 용량을 점검하여, 배터리의 충전 효율이 미리 정해진 수치 이하로 감소하면, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
상기 서버 통합 관리 시스템은 관리 대상 서버의 BBU 충전 용량을 점검하여, 배터리의 충전 효율이 40% 이하로 감소되면, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
상기 서버 통합 관리 시스템은 관리 대상 서버의 BBU 잔여 용량을 점검하여, 배터리의 잔량이 미리 정해진 수치 이하인 경우, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
상기 서버 통합 관리 시스템은 관리 대상 서버의 BBU 잔여 용량을 점검하여, 배터리의 잔량이 10% 이하인 경우, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
상기 서버 통합 관리 시스템은 관리 대상 서버의 BBU 쓰기 정책(Write Policy)을 점검하여, 쓰기 정책이 변경되면, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
상기 관리 대상 서버들 중 델(Dell) 서버가 포함되어 있으며, 상기 서버 통합 관리 시스템은 상기 델 서버에서 커널(Kernel) 업데이트(update) 후, OS(Operating system) 상에서 이상 작동이 발견되면, 이로 인해 발생할 수 있는 예상 장애 발생 메시지를 해당 관리 대상 서버에 송신하고, 이와 함께 예상 장애에 대한 해결 방법을 해당 관리 대상 서버에 전달할 수 있다.
상기 서버 통합 관리 시스템은 관리 대상 서버의 메모리 생산 주기를 진단하고, 미리 정해진 메모리 생산 주기를 불량으로 판정하고, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
본 발명에 의하면, 선제적으로 서버에서 발생하는 장애를 예측하여 경고하고 해결 방법을 제공함으로써, 서버에서 발생할 수 있는 장애를 미리 예방하고, 서버 장애에 따른 피해를 감소시킬 수 있는 효과가 있다.
또한, 본 발명에 의하면, 서버에서 발생하는 장애 패턴을 분석하여 업데이트함으로써, 다양한 서버 장애에 능동적으로 대응할 수 있다는 효과가 있다.
또한, 본 발명에 의하면, 서버 장애를 미리 경고할 뿐만 아니라, 그 해결 방법도 제시함으로써, 서버 관리자가 보다 용이하게 서버를 관리할 수 있도록 편의를 제공한다는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 서버 통합 관리 시스템의 네트워크 구성을 보여주는 도면이다.
도 2는 본 발명의 일 실시예에 따른 서버 통합 관리 시스템의 내부 구성으로 보여주는 블록도이다.
도 3 내지 도 12는 본 발명의 일 실시예에 따른 서버 통합 관리 시스템의 화면예이다.
도 13 내지 도 16은 본 발명의 일 실시예에 따른 서버 통합 관리 시스템의 리포트 화면예이다.
도 17은 본 발명의 일 실시예에 따른 서버에서 이벤트가 발생한 경우의 화면예이다.
도 18은 본 발명의 일 실시예에 따른 서버 통합 관리 방법을 보여주는 흐름도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 갖는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
본 발명은 둘 이상의 관리 대상 서버를 통합하여 관리하는 서버 통합 관리 시스템에 대한 것이다.
도 1은 본 발명의 일 실시예에 따른 서버 통합 관리 시스템의 네트워크 구성을 보여주는 도면이다.
도 1을 참조하면, 본 발명의 서버 통합 관리 시스템은 관리 서버(110), 데이터베이스(120), 관리자 단말(130)을 포함한다.
서버 통합 관리 시스템은 다수의 서버들(10, 20, 30, 40)을 통합하여 관리한다. 본 발명에서 관리 대상이 되는 서버는 다양한 x86 서버로서, 예를 들어 Dell 서버(10), HP 서버(20), IBM 서버(30), X86 서버(40)일 수 있다.
관리 대상이 되는 서버들(10, 20, 30, 40)과 관리 서버(110)는 다양한 유무선 통신 방식을 통해 통신하며, 예를 들어 HTTP 통신이나 JSON 형식의 POST 전송 방식으로 통신할 수 있다.
또한, 서버들(10, 20, 30, 40)은 대규모 전산환경의 다양한 x86 서버에서 정해진 스케쥴링에 따라 스크립트를 자동 실행한다.
관리자는 관리자 단말(130)을 통해 관리 서버(110)에 접속하고, 관리 서버(120)에 정해진 스케쥴링에 따라 배치(BATCH) 프로그램을 실행하여, 기존 데이터와 비교하여 변경 이력을 관리한다. 본 발명에서 관리자 단말(130)은 데스크탑 컴퓨터, 랩탑 컴퓨터, 태블릿 PC, 핸드폰, 휴대폰, 스마트 폰 등이 될 수 있다.
관리 서버(110)는 자동으로 서버들(10, 20, 30, 40)의 하드웨어 정보 및 소프트웨어 정보를 수집하고, 이를 기반으로 각 서버의 현황을 파악하고, 각 서버의 요구 상황에 맞춰 관리 서비스를 제공한다.
데이터베이스(120)는 서버들(10, 20, 30, 40)의 관리에 필요한 데이터를 저장하고 있으며, 관리 서버(110)의 요청에 의해 데이터를 제공한다. 즉, 데이터베이스(120)는 수집된 하드웨어 정보 및 소프트웨어 정보를 저장하고 있으며, 저장하고 있는 정보를 관리 서버(110)에 제공한다.
관리자 단말(130)은 서버 통합 관리 시스템을 관리하는 관리자가 사용하는 단말로서, 관리 서버(110)와 통신하며, 관리 대상 서버(10, 20, 30, 40)의 현황을 화면에 표시하고, 관리자로부터 입력된 명령을 관리 서버(110)에 전달한다.
본 발명에서 관리 서버(110)는 관리 대상 서버의 장애 패턴을 분석하여 유사한 장애가 발생하는 것을 예방하기 위하여, 관리 대상 서버(10, 20, 30, 40)를 진단하여 미리 정해진 이벤트 발생시, 발생된 이벤트에 따른 장애가 발생할 수 있음을 기재한 예상 장애 발생 메시지를 해당 관리 대상 서버에 송신하고, 이와 함께 예상 장애에 대한 해결 방법을 해당 관리 대상 서버에 전달한다.
관리 서버(110)는 데이터베이스(120)에 등록된 해당 관리 대상 서버의 담당 관리자에게 SMS(short message service)와 이메일(e-mail)을 통해 예상 장애 발생 메시지를 송신하고, 해당 관리 대상 서버에 대한 상세한 정보와 함께, 예상 장애에 대한 해결 방법을 전달한다.
관리 서버(110)는 관리 대상 서버의 BBU(Backup Battery Unit) 주기를 점검하여, 미리 정해진 주기가 되면, 이 내용을 해당 관리 대상 서버에 알린다.
또한, 관리 서버(110)는 관리 대상 서버의 BBU 충전 용량을 점검하여, 배터리의 충전 효율이 미리 정해진 수치 이하로 감소하면, 이 내용을 해당 관리 대상 서버에 알린다. 예를 들어, 관리 서버(110)는 관리 대상 서버의 BBU 충전 용량을 점검하여, 배터리의 충전 효율이 40% 이하로 감소되면, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
관리 서버(110)는 관리 대상 서버의 BBU 잔여 용량을 점검하여, 배터리의 잔량이 미리 정해진 수치 이하인 경우, 이 내용을 해당 관리 대상 서버에 알린다. 예를 들어, 관리 서버(110)는 관리 대상 서버의 BBU 잔여 용량을 점검하여, 배터리의 잔량이 10% 이하인 경우, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
또한, 관리 서버(110)는 관리 대상 서버의 BBU 쓰기 정책(Write Policy)을 점검하여, 쓰기 정책이 변경되면, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
도 2는 본 발명의 일 실시예에 따른 서버 통합 관리 시스템의 내부 구성으로 보여주는 블록도이다.
도 2를 참조하면, 관리 대상이 되는 서버(10)는 정보 수집부(11), 정보 가공부(12), 정보 전송부(13), 명령 수신부(14) 및 명령 실행부(15)를 포함한다.
관리 서버(110)는 정보 수신부(111), 정보 분석부(112), 정보 저장부(113), 명령 수신부(114), 명령 전송부(115)를 포함한다.
관리자 단말(130)은 명령 전송부(131)를 포함한다.
관리 대상이 되는 서버(10)의 정보 수집부(11)는 서버(10)의 진단에 필요한 정보를 수집한다.
정보 가공부(12)는 수집한 정보를 전송 형식에 맞게 가공한다.
정보 전송부(13)는 가공된 정보를 관리 서버(110)에 전송한다.
명령 수신부(14)는 관리 서버(110)로부터 전송된 명령을 수신한다.
명령 실행부(15)는 수신된 명령을 실행하는 역할을 한다.
관리 서버(110)의 정보 수신부(111)는 서버(10)에서 전송된 정보를 수신하는 역할을 한다.
정보 분석부(112)는 수신된 정보를 분석하는 역할을 한다.
정보 저장부(113)는 분석된 정보를 데이터베이스(120)에 저장하도록 하는 역할을 한다.
명령 수신부(114)는 관리자 단말(130)로부터 전송된 명령을 수신한다.
명령 전송부(115)는 수신된 명령을 서버(10)에 전송하는 역할을 한다.
관리자 단말(130)의 명령 전송부(131)는 관리자로부터 입력된 명령을 관리 서버(110)에 전송한다.
본 발명의 다수의 서버를 통합하여 관리하는 서버 통합 관리 시스템에 대한 것으로서, 서버의 다양한 기능을 진단하고, 장애를 미리 예측하여 경고하고, 해결 방법을 함께 제시한다.
먼저, 본 발명에서는 서버의 다양한 기능 중에서 BBU(Backup Battery Unit)를 예시하기로 한다.
Dell 서버를 예시하면, RAID 컨트롤러의 배터리 실패(failure)로 인한 캐쉬(cache) 데이터의 손실 방지를 위해, BBU의 배터리 상태 점검 및 선제적 교체 진행이 필요하다. 이를 위하여, Dell 서버의 로그(log) 확인을 통해 배터리 완전 충전(Full Charging) 효율(%)을 확인하고, 완전 충전 효율이 50% 미만인 장비를 확인하고, 배터리 교체를 진행한다. 36개월 이후의 배터리 충전 효율은 대략 70% 전후로 자연적으로 감소되며, 이를 감안하여 대략 20% 정도 추가적인 감소가 있는 배터리에 대해 충전효율 불량으로 판정할 수 있다.
도 3 내지 도 6은 본 발명의 일 실시예에 따른 BBU 관리 기능을 예시한 화면예이다.
도 3 내지 도 6을 참조하면, 본 발명의 서버 통합 관리 시스템은 BBU 주기 점검, 충전용량 점검, 잔여 용량 점검, 쓰기 정책(Write Policy) 점검을 수행하며, 이를 통해 캐쉬 데이터 손실을 방지하고, 배터리 상태에 대한 위험 요인을 사전에 방지한다.
도 3은 BBU 주기 점검의 화면예로서, 배터리 충전시 디스크 쓰기 정책이 WriteBack에서 WriteThrough으로 변경되면서 속도 저하 및 데이터 유실이 발생하는 증상이 나타나며, 처리 방안으로는 PM 작업이 필요하고, 배터리의 주기가 90일에 임박하면 해당 서버에 관련 정보를 알린다.
도 4는 BBU 충전용량 점검의 화면예로서, 증상으로는 배터리의 충전효율이 떨어져 잦은 충전현상이 일어나고, 처리방안으로는 배터리 교체가 필요하며, 배터리의 충전효율이 40% 이하로 감소하면 해당 서버에 관련 정보를 알린다.
도 5는 BBU 잔여용량 점검의 화면예로서, 증상으로는 배터리의 잔량이 위험수준까지 떨어져 디스크 쓰기 정책이 변경될 가능성이 있으며, 처리 방안으로는 배터리 충전이 필요하고, 배터리 잔량이 10% 남으면 해당 서버에 관련 정보를 알린다.
도 6은 BBU 쓰기 정책 점검의 화면예로서, 증상으로는 RC 카드의 쓰기 정책이 변경됨으로써 속도가 저하되고, 처리방안으로는 RC 카드 및 배터리 점검이 필요하며, 쓰기 정책이 W/B에서 W/T로 변경 시, 알림 기능을 통하여 변경된 서버를 점검한다.
도 7 내지 도 13은 본 발명의 일 실시예에 따른 서버 통합 관리 시스템의 기능을 보여주는 화면예이다.
도 7은 Windows, Linux, Vmware 등 다양한 OS 정보를 조회할 수 있도록 한 화면예이다.
도 7을 참조하면, 관리 대상 서버의 물리적 시스템, OS, 소프트웨어 정보를 한 번에 조회할 수 있다.
도 8은 전체 관리 대상 서버에 대한 소프트웨어 현황 및 특정 소프트웨어 버전을 조회할 수 있도록 하는 화면예이다.
도 8을 참조하면, 본 발명의 서버 통합 관리 시스템에서는 관리 대상 서버의 개별 시스템에 접속하여 조회하는 것이 아니라, 전체 관리 대상 서버의 각 시스템에 설치된 소프트웨어 목록을 조회할 수 있으며, 특정 소프트웨어가 설치된 서버의 시스템을 조회할 수 있다.
도 9는 조건 검색을 통해 특정 장비의 작업 이력을 파악할 수 있도록 한 화면예로서, 축적된 데이터를 통한 조건 검색을 지원하기 때문에 빠르게 특정 장비의 작업 이력 정보를 파악할 수 있다.
도 10은 유사한 장애에 대한 패턴을 분석하여 사전 예방 및 대처할 수 있도록 한 화면예로서, 예측 모델이 예시되어 있다.
도 10을 참조하면, 특정 장애 패턴에 의한 위험군인 장애 위험군을 선별하여 유사 장애를 예방하고 대처할 수 있다.
본 발명의 서버 통합 관리 시스템은 장애 발생 일시, 작업 일시, 완료 일시 등의 날짜 조건을 검색하여 장애 정보를 파악할 수 있다.
도 11은 날짜 조건을 검색하여 월간 장애를 검색한 화면예이다.
도 12는 장애 패턴을 분석하여 유사한 장애를 예방하도록 한 화면예이다.
도 12에서 검색 조건을, 모델은 PE6850을 포함하고, BIOS는 A06을 포함하지 않고, OS종류는 Windows 2003을 포함하도록 하여 검색한 결과이고, 재부팅시 M/B Fatal Error 발생이 있을 수 있음을 진단하여 예방할 수 있다.
도 13 내지 도 16은 본 발명의 일 실시예에 따른 서버 통합 관리 시스템의 리포트 화면예이다.
도 13을 참조하면, 사전 예방 점검 리포트(Report)의 위험군 관리 화면예이다.
도 13에서 보는 바와 같이, 화면 상부에 위험군 관리 화면을 그래프와 차트 형식으로 표시하여 용이하게 내용을 파악할 수 있으며, 화면 하부에 위험군명, 설명, 대상 장비, 정상 숫자, 비정상 숫자, 미확인 숫자, 비고 항목이 있는 표 형태로 표시하여 위험군에 대한 세부 정보를 용이하게 파악할 수 있다.
도 14는 사전 예방 점검 리포트에서 작업 관리 화면예이고, 차트와 함께, 장애명, 작업구분, 그룹, 모델, 작업자, 상태 항목이 있는 표 형태로 표시되어 있다.
도 15는 사전 예방 점검 리포트에서 인벤토리 관리 화면예이고, 차트와 함께, 호스트명, 변경 번호, 모델, 변경일시, 상태 항목이 있는 표 형태로 표시되어 있다.
도 16은 사전 예방 점검 리포트에서 시스템 관리 화면예이고, 차트와 함께, 템플릿, 전체 대수, 모델, 담당자, 등록일시 항목이 있는 표 형태로 표시되어 있다.
본 발명에서는 어떤 이벤트가 발생할 때, 해당 이벤트를 통해 서버에 장애가 발생할 수 있음을 진단하여, 미리 해당 서버의 시스템에 경고하고, 해결 방법에 대한 정보를 함께 전달한다. 이와 관련하여, 서버에서 발생하는 이벤트는 매우 다양하고, 전에 없던 이벤트가 새롭게 발생할 수도 있다. 이제 본 발명에서는 이러한 서버에서 발생할 수 있는 이벤트 중에서 몇 가지 이벤트를 예시하기로 한다.
1. iDRAC7 최신 버전 1.51.51 적용된 최신 제품 Dell R720 서버에서 팬(FAN) 소음(Reading 12,000 RPM 이상).
이에 대한 해결 방법은 iDRAC7 1.46.45 버전으로 다운그레이드(Downgrade) 할 것을 권장한다.
2. 랙 PDU#1 및 PDU#2에서 전력 사용률이 PDU#1으로 쏠림 현상이 발생.
도 17을 참조하면, Dell 서버뿐만 아니라, HP 서버도 마찬가지로 파워 서플라이(Power Supply)의 디폴트(Default)로 액티브 스탠바이(Active Standby)로 작동되게끔 셋팅되어 있으며, 이로 인해 전력이 랙(Rack) PDU의 한쪽으로 몰리는 상황이 발생하는데 밸런스(Balance)를 맞추기 위해서는 Primary - PSU 의 비율을 맞춰줄 필요가 있다.
3. Dell R620 서버 커널 업데이트(kernel update) 후 OS 이상 작동.
이때, 관리 서버(110)는 델(dell) 서버에서 커널(Kernel) 업데이트(update) 후, OS(Operating system) 상에서 이상 작동이 발견되면, 이로 인해 발생할 수 있는 예상 장애 발생 메시지를 해당 관리 대상 서버에 송신하고, 이와 함께 예상 장애에 대한 해결 방법을 해당 관리 대상 서버에 전달한다.
4. TCP/IP 포트(Port) 부족으로 인한 서비스 불가.
이는 윈도우(windows) 2008에서 업타임(Uptime)이 497일 이상 일 때, 네트워크(Network) TIME_WAIT 세션(session)이 클로즈(close)되지 못하고 남아 있는 현상이다. 이로 인하여 포트(port)를 점유하게 되고 더 이상의 포트(port)가 없을 때 문제가 된다. 윈도우(windows) 2008 서버와 윈도우(Windows) 2012 서버가 대상이 되며, 업데이트된 패치를 제거함으로써 장애를 해결할 수 있다.
5. 윈도우(Windows) 2003, 2008 이벤트 로그 발생.
6. 메모리(Memory) 생산 주기 진단.
이는 특정 메모리의 특정 생산주기가 불량인 것을 확인하는 것으로서, 장애 대상은 13세대 장비(R730, R930, R630)이고, 장애 OS는 윈도우(Windows) 2012 R2 서버(Server)에서 KB3064209 hotfix가 포함된 서버이고, 해결 방법은 해당 hotfix를 제거하는 것이다.
본 발명에서 관리 서버(110)는 관리 대상 서버의 메모리 생산 주기를 진단하고, 미리 정해진 메모리 생산 주기를 불량으로 판정하고, 이 내용을 해당 관리 대상 서버에 알린다.
7. PCIe Type의 SSD를 사용하고 있는 경우 장치설정에서 응답이 멈추는 현상.
이에 대한 해결 방법은 BIOS 1.1.4 -> 1.2.10으로 업데이트하는 것이다.
8. 12G 서버(Server) BIOS 업데이트 이후 온도(Temperature) 센서가 정상 작동하지 않아 경고음(Alert_)이 계속 발생하는 이슈.
이에 대한 해결 방법은 BIOS 2.5.2 버전을 진단하고 최신 펌웨어로
업데이트하는 것이다.
9. 패치 Update후 BSOD 발생후 부팅(Booting) 불가 현상
이 이벤트는 2014년 8월 Patch Tuesday update 윈도우 오류 KB2982791로 인한 현상이다.
장애 대상은 windows2008 서버이고, 패치 업데이트를 통해 장애를 해결할 수 있다.
10. 윈도우(Windows) 2012 Active Director를 사용한 클라이언트(Client)에서 DNS 연결 오류 발생.
서버에서 도메인 계정으로 로그인 시 계정과 암호가 정상적임에도 “사용자 이름 또는 암호가 올바르지 않습니다” 는 오류가 발생한다.
윈도우 서버(Windows Server) 2008 R2 / Windows 7 부터 DES-CBC-MD5 및 DES-CBC-CRC 암호화를 사용하지 않고, AES256-CTS-HMAC-SHA1-96, AES128-CTS-HMAC-SHA1-96, RC4-HMAC 암호화만을 사용하게 되는데, AD 서버가 윈도우 서버(Windows Server) 2012 R2이고, 도메인 멤버(Domain Member)가 윈도우 서버(Windows Server) 2008 R2 또는 윈도우(Windows) 7 일 경우, 컴퓨터 계정에 대한 암호 갱신 시에 AES 키 생성이 실패하는 제품 상의 이슈로 인해 발생한 현상이다.
11. GNU Bash 4.3 Shell에 존재하는 취약점.
Bash 취약점을 이용해 공격자는 웹 서버의 콘텐츠 및 코드 변경, 웹사이트 변조, 사용자 데이터 유출 및 DDoS 공격 수행이 가능한 것으로 알려져 있다. 이 외에도 SSH, DHCP 프로토콜 등 다양한 환경 하에서의 Bash 코드 인젝션 취약점 공격 시나리오도 제기되고 있는 상황이다.
장애 대상은 Red Hat Enterprise Linux 5,6,7 서버이고, 장애 해결 방법은 Bash 업데이트이다.
12. GNU C 라이브러리(glibc)의 버퍼 오버플로우 취약점.
네트워크 연결 시 자주 쓰이는 gethostbyname(), gethostbyname2() 함수 호출 시, 취약한 함수가 호출되는 현상으로서, 외부의 공격자는 취약한 서버에서 원격으로 임의의 코드를 실행시킬 수 있다.
장애 대상은 Red Hat Enterprise Linux 5,6,7 서버이고, 장애 해결 방법은 GLIBC 업데이트이다.
13. Radhat V5 및 V6 계열 OS의 버그.
Intel CPU를 사용하는 Red Hat Enterprise Linux 6 or 5 모든 버전에서 208.5일 이후 Reboot 현상이 발생하는 버그이다.
장애 대상은 Red Hat Enterprise Linux 5,6 서버이고, 장애 해결 방법은 커널 업데이트이다.
14. 레이드 컨트롤러 배터리 페일(Raid Controller Battery Fail).
레이드 컨트롤러 캐쉬(Raid Controller Cache) 사용 불가로 인한 I/O 성능이 저하된다. 장애 대상은 Dell Perc 5i, 6i용 Raid Controller Battery이고, 장애 해결 방법은 Dell Perc 5i, 6i용 Raid Controller Battery의 사용 주기 4~5년마다 사전 교체하는 것이다.
15. CPU IERR 에러(Error) 발생으로 인한 시스템 다운(SYSTEM DOWN).
장애 대상은 인텔 아이브릿지 V2 사용 CPU 사용 서버(PE R720, PE R920)이고, 장애 해결 방법은 BIOS 세팅(Setting)을 변경하는 것이다.
예를 들어, 시스템 프로파일 세팅(System Profile Settings)을 시스템 프로파일(System Profile)을 Custom으로 설정하고, CPU 파워 매니지먼트(Power Management)를 Maximum Performance로 하고, C1E를 Disabled C States Disabled로 하고, Monitor/Mwait를 Disabled로 설정한다.
16. iDrac 1.50.50 F/W(Firmware)(해당 버전 검색) 사용시 관리 Web 접속 불가.
iDrac F/W(Firmware) 1.51.51로 업그레이드(Upgrade)한다.
1)OS상에서의 F/W 업그레이드(Upgrade)
2)일상 생활에서의 미디어를 통한 업그레이드(Upgrade)
도 18은 본 발명의 일 실시예에 따른 서버 통합 관리 방법을 보여주는 흐름도이다.
도 18을 참조하면, 둘 이상의 관리 대상 서버를 통합하여 관리하는 서버 통합 관리 시스템에서의 서버 통합 관리 방법은 다음과 같다.
먼저, 둘 이상의 관리 대상 서버로부터 하드웨어 정보 및 소프트웨어 정보를 수집하여, 각 서버의 현황을 파악하고 관리한다(S210).
그리고, 관리 대상 서버의 장애 패턴을 분석한다(S220).
장애 패턴 분석 결과, 미리 정해진 이벤트 발생시(S230), 발생된 이벤트에 따른 장애가 발생할 수 있음을 기재한 예상 장애 발생 메시지를 해당 관리 대상 서버에 송신한다(S240).
이와 함께 예상 장애에 대한 해결 방법을 해당 관리 대상 서버에 전달한다(S250).
본 발명에서 서버 통합 관리 시스템은 등록된 해당 관리 대상 서버의 담당 관리자에게 SMS(short message service)와 이메일(e-mail)을 통해 예상 장애 발생 메시지를 송신하고, 해당 관리 대상 서버에 대한 상세한 정보와 함께, 예상 장애에 대한 해결 방법을 전달할 수 있다.
서버 통합 관리 시스템은 관리 대상 서버의 BBU(Backup Battery Unit) 주기를 점검하여, 미리 정해진 주기가 되면, 이 내용을 해당 관리 대상 서버에 알린다.
또한, 서버 통합 관리 시스템은 관리 대상 서버의 BBU 충전 용량을 점검하여, 배터리의 충전 효율이 미리 정해진 수치 이하로 감소하면, 이 내용을 해당 관리 대상 서버에 알린다. 예를 들어, 서버 통합 관리 시스템은 관리 대상 서버의 BBU 충전 용량을 점검하여, 배터리의 충전 효율이 40% 이하로 감소되면, 이 내용을 해당 관리 대상 서버에 알린다.
서버 통합 관리 시스템은 관리 대상 서버의 BBU 잔여 용량을 점검하여, 배터리의 잔량이 미리 정해진 수치 이하인 경우, 이 내용을 해당 관리 대상 서버에 알린다. 예를 들어, 서버 통합 관리 시스템은 관리 대상 서버의 BBU 잔여 용량을 점검하여, 배터리의 잔량이 10% 이하인 경우, 이 내용을 해당 관리 대상 서버에 알린다.
서버 통합 관리 시스템은 관리 대상 서버의 BBU 쓰기 정책(Write Policy)을 점검하여, 쓰기 정책이 변경되면, 이 내용을 해당 관리 대상 서버에 알린다.
본 발명의 일 실시예에서 관리 대상 서버들 중 델(Dell) 서버가 포함되어 있으며, 서버 통합 관리 시스템은 델 서버에서 커널(Kernel) 업데이트(update) 후, OS(Operating system) 상에서 이상 작동이 발견되면, 이로 인해 발생할 수 있는 예상 장애 발생 메시지를 해당 관리 대상 서버에 송신하고, 이와 함께 예상 장애에 대한 해결 방법을 해당 관리 대상 서버에 전달할 수 있다.
서버 통합 관리 시스템은 관리 대상 서버의 메모리 생산 주기를 진단하고, 미리 정해진 메모리 생산 주기를 불량으로 판정하고, 이 내용을 해당 관리 대상 서버에 알릴 수 있다.
이상 본 발명을 몇 가지 바람직한 실시예를 사용하여 설명하였으나, 이들 실시예는 예시적인 것이며 한정적인 것이 아니다. 본 발명이 속하는 기술분야에서 통상의 지식을 지닌 자라면 본 발명의 사상과 첨부된 특허청구범위에 제시된 권리범위에서 벗어나지 않으면서 다양한 변화와 수정을 가할 수 있음을 이해할 것이다.
110 관리 서버 120 데이터베이스
130 관리자 단말 10 관리 대상 서버
11 정보 수집부 12 정보 가공부
13 정보 전송부 14 명령 수신부
15 명령 실행부 111 정보 수신부
112 정보 분석부 113 정보 저장부
114 명령 수신부 115 명령 전송부
131 명령 전송부

Claims (20)

  1. 둘 이상의 관리 대상 서버를 통합하여 관리하는 서버 통합 관리 시스템에서,
    둘 이상의 관리 대상 서버로부터 하드웨어 정보 및 소프트웨어 정보를 수집하여, 각 서버의 현황을 파악하고 관리하는 관리 서버;
    수집된 하드웨어 정보 및 소프트웨어 정보를 저장하고 있으며, 저장하고 있는 정보를 상기 관리 서버에 제공하기 위한 데이터베이스; 및
    서버 통합 관리 시스템을 관리하는 관리자가 사용하는 단말로서, 상기 관리 서버와 통신하며, 관리 대상 서버의 현황을 화면에 표시하고, 관리자로부터 입력된 명령을 상기 관리 서버에 전달하는 관리자 단말을 포함하되,
    상기 관리 서버는 관리 대상 서버의 장애 패턴을 분석하여 유사한 장애가 발생하는 것을 예방하기 위하여, 관리 대상 서버에서 미리 정해진 이벤트 발생시, 발생된 이벤트에 따른 장애가 발생할 수 있음을 기재한 예상 장애 발생 메시지를 해당 관리 대상 서버에 송신하고, 이와 함께 예상 장애에 대한 해결 방법을 해당 관리 대상 서버에 전달하는 것을 특징으로 하는 서버 통합 관리 시스템.
  2. 청구항 1에 있어서,
    상기 관리 서버는 상기 데이터베이스에 등록된 해당 관리 대상 서버의 담당 관리자에게 SMS(short message service)와 이메일(e-mail)을 통해 예상 장애 발생 메시지를 송신하고, 해당 관리 대상 서버에 대한 상세한 정보와 함께, 예상 장애에 대한 해결 방법을 전달하는 것을 특징으로 하는 서버 통합 관리 시스템.
  3. 청구항 1에 있어서,
    상기 관리 서버는 관리 대상 서버의 BBU(Backup Battery Unit) 주기를 점검하여, 미리 정해진 주기가 되면, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 시스템.
  4. 청구항 1에 있어서,
    상기 관리 서버는 관리 대상 서버의 BBU 충전 용량을 점검하여, 배터리의 충전 효율이 미리 정해진 수치 이하로 감소하면, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 시스템.
  5. 청구항 4에 있어서,
    상기 관리 서버는 관리 대상 서버의 BBU 충전 용량을 점검하여, 배터리의 충전 효율이 40% 이하로 감소되면, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 시스템.
  6. 청구항 1에 있어서,
    상기 관리 서버는 관리 대상 서버의 BBU 잔여 용량을 점검하여, 배터리의 잔량이 미리 정해진 수치 이하인 경우, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 시스템.
  7. 청구항 6에 있어서,
    상기 관리 서버는 관리 대상 서버의 BBU 잔여 용량을 점검하여, 배터리의 잔량이 10% 이하인 경우, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 시스템.
  8. 청구항 1에 있어서,
    상기 관리 서버는 관리 대상 서버의 BBU 쓰기 정책(Write Policy)을 점검하여, 쓰기 정책이 변경되면, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 시스템.
  9. 청구항 1에 있어서,
    상기 관리 대상 서버들 중 델(Dell) 서버가 포함되어 있으며,
    상기 관리 서버는 상기 델 서버에서 커널(Kernel) 업데이트(update) 후, OS(Operating system) 상에서 이상 작동이 발견되면, 이로 인해 발생할 수 있는 예상 장애 발생 메시지를 해당 관리 대상 서버에 송신하고, 이와 함께 예상 장애에 대한 해결 방법을 해당 관리 대상 서버에 전달하는 것을 특징으로 하는 서버 통합 관리 시스템.
  10. 청구항 1에 있어서,
    상기 관리 서버는 관리 대상 서버의 메모리 생산 주기를 진단하고, 미리 정해진 메모리 생산 주기를 불량으로 판정하고, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 시스템.
  11. 둘 이상의 관리 대상 서버를 통합하여 관리하는 서버 통합 관리 시스템에서의 서버 통합 관리 방법에서,
    상기 서버 통합 관리 시스템은 둘 이상의 관리 대상 서버로부터 하드웨어 정보 및 소프트웨어 정보를 수집하여, 각 서버의 현황을 파악하고 관리하는 단계;
    관리 대상 서버의 장애 패턴을 분석하는 단계; 및
    장애 패턴 분석 결과, 미리 정해진 이벤트 발생시, 발생된 이벤트에 따른 장애가 발생할 수 있음을 기재한 예상 장애 발생 메시지를 해당 관리 대상 서버에 송신하고, 이와 함께 예상 장애에 대한 해결 방법을 해당 관리 대상 서버에 전달하는 것을 특징으로 하는 서버 통합 관리 방법.
  12. 청구항 11에 있어서,
    상기 서버 통합 관리 시스템은 등록된 해당 관리 대상 서버의 담당 관리자에게 SMS(short message service)와 이메일(e-mail)을 통해 예상 장애 발생 메시지를 송신하고, 해당 관리 대상 서버에 대한 상세한 정보와 함께, 예상 장애에 대한 해결 방법을 전달하는 것을 특징으로 하는 서버 통합 관리 방법.
  13. 청구항 11에 있어서,
    상기 서버 통합 관리 시스템은 관리 대상 서버의 BBU(Backup Battery Unit) 주기를 점검하여, 미리 정해진 주기가 되면, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 방법.
  14. 청구항 11에 있어서,
    상기 서버 통합 관리 시스템은 관리 대상 서버의 BBU 충전 용량을 점검하여, 배터리의 충전 효율이 미리 정해진 수치 이하로 감소하면, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 방법.
  15. 청구항 14에 있어서,
    상기 서버 통합 관리 시스템은 관리 대상 서버의 BBU 충전 용량을 점검하여, 배터리의 충전 효율이 40% 이하로 감소되면, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 방법.
  16. 청구항 11에 있어서,
    상기 서버 통합 관리 시스템은 관리 대상 서버의 BBU 잔여 용량을 점검하여, 배터리의 잔량이 미리 정해진 수치 이하인 경우, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 방법.
  17. 청구항 16에 있어서,
    상기 서버 통합 관리 시스템은 관리 대상 서버의 BBU 잔여 용량을 점검하여, 배터리의 잔량이 10% 이하인 경우, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 방법.
  18. 청구항 11에 있어서,
    상기 서버 통합 관리 시스템은 관리 대상 서버의 BBU 쓰기 정책(Write Policy)을 점검하여, 쓰기 정책이 변경되면, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 방법.
  19. 청구항 11에 있어서,
    상기 관리 대상 서버들 중 델(Dell) 서버가 포함되어 있으며,
    상기 서버 통합 관리 시스템은 상기 델 서버에서 커널(Kernel) 업데이트(update) 후, OS(Operating system) 상에서 이상 작동이 발견되면, 이로 인해 발생할 수 있는 예상 장애 발생 메시지를 해당 관리 대상 서버에 송신하고, 이와 함께 예상 장애에 대한 해결 방법을 해당 관리 대상 서버에 전달하는 것을 특징으로 하는 서버 통합 관리 방법.
  20. 청구항 11에 있어서,
    상기 서버 통합 관리 시스템은 관리 대상 서버의 메모리 생산 주기를 진단하고, 미리 정해진 메모리 생산 주기를 불량으로 판정하고, 이 내용을 해당 관리 대상 서버에 알리는 것을 특징으로 하는 서버 통합 관리 방법.



KR1020150178246A 2015-12-14 2015-12-14 서버 통합 관리 시스템 및 방법 KR101783201B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150178246A KR101783201B1 (ko) 2015-12-14 2015-12-14 서버 통합 관리 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150178246A KR101783201B1 (ko) 2015-12-14 2015-12-14 서버 통합 관리 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20170070568A true KR20170070568A (ko) 2017-06-22
KR101783201B1 KR101783201B1 (ko) 2017-10-13

Family

ID=59282914

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150178246A KR101783201B1 (ko) 2015-12-14 2015-12-14 서버 통합 관리 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR101783201B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102139058B1 (ko) * 2019-05-10 2020-07-29 (주)비앤에스컴 서버 관리 장치를 구비한 클라우드 서버 및 로컬 서버를 이용하는 제로클라이언트 단말기용 클라우드 컴퓨팅 시스템
KR102176028B1 (ko) * 2020-08-24 2020-11-09 (주)에오스와이텍 실시간 통합 모니터링 시스템 및 그 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100840129B1 (ko) 2006-11-16 2008-06-20 삼성에스디에스 주식회사 통계적인 분석을 이용한 성능장애 관리시스템 및 그 방법
US9251029B2 (en) 2013-09-30 2016-02-02 At&T Intellectual Property I, L.P. Locational prediction of failures

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102139058B1 (ko) * 2019-05-10 2020-07-29 (주)비앤에스컴 서버 관리 장치를 구비한 클라우드 서버 및 로컬 서버를 이용하는 제로클라이언트 단말기용 클라우드 컴퓨팅 시스템
KR102176028B1 (ko) * 2020-08-24 2020-11-09 (주)에오스와이텍 실시간 통합 모니터링 시스템 및 그 방법

Also Published As

Publication number Publication date
KR101783201B1 (ko) 2017-10-13

Similar Documents

Publication Publication Date Title
US11269750B2 (en) System and method to assess information handling system health and resource utilization
US10761926B2 (en) Server hardware fault analysis and recovery
US10069710B2 (en) System and method to identify resources used by applications in an information handling system
US8839032B2 (en) Managing errors in a data processing system
US8713350B2 (en) Handling errors in a data processing system
US8892965B2 (en) Automated trouble ticket generation
US20110004791A1 (en) Server apparatus, fault detection method of server apparatus, and fault detection program of server apparatus
US10275330B2 (en) Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus
US20160378602A1 (en) Pre-boot self-healing and adaptive fault isolation
US7318171B2 (en) Policy-based response to system errors occurring during OS runtime
CN108292342B (zh) 向固件中的侵入的通知
US9798625B2 (en) Agentless and/or pre-boot support, and field replaceable unit (FRU) isolation
KR101783201B1 (ko) 서버 통합 관리 시스템 및 방법
US20100011100A1 (en) Health Check System, Server Apparatus, Health Check Method, and Storage Medium
KR20130075807A (ko) 백업 하드디스크 드라이브가 구비된 금융자동화기기 및 금융자동화기기의 부팅 방법
WO2019241199A1 (en) System and method for predictive maintenance of networked devices
KR102526368B1 (ko) 멀티벤더를 지원하는 서버 관리 시스템
KR20230073469A (ko) 장애 대응이 가능한 서버 관리 시스템
US11593191B2 (en) Systems and methods for self-healing and/or failure analysis of information handling system storage
JP6477524B2 (ja) サーバ装置、画面情報取得方法およびbmc
US20220391277A1 (en) Computing cluster health reporting engine
US20240028723A1 (en) Suspicious workspace instantiation detection
US20240086288A1 (en) Privacy and security assurance during operating system crash events
JP2011159234A (ja) 障害対応システム及び障害対応方法
CN116701036A (zh) 一种bmc系统自动检测修复方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right