KR20180068002A - 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법 - Google Patents

빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법 Download PDF

Info

Publication number
KR20180068002A
KR20180068002A KR1020160169515A KR20160169515A KR20180068002A KR 20180068002 A KR20180068002 A KR 20180068002A KR 1020160169515 A KR1020160169515 A KR 1020160169515A KR 20160169515 A KR20160169515 A KR 20160169515A KR 20180068002 A KR20180068002 A KR 20180068002A
Authority
KR
South Korea
Prior art keywords
data
cloud
failure
server
information
Prior art date
Application number
KR1020160169515A
Other languages
English (en)
Other versions
KR101971013B1 (ko
Inventor
문성규
Original Assignee
나무기술 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 나무기술 주식회사 filed Critical 나무기술 주식회사
Priority to KR1020160169515A priority Critical patent/KR101971013B1/ko
Publication of KR20180068002A publication Critical patent/KR20180068002A/ko
Application granted granted Critical
Publication of KR101971013B1 publication Critical patent/KR101971013B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/004Error avoidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

본 발명에 따른 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템은, 복수의 고객 서버들과 형성된 클라우드 인프라에서 운영중인 AaaS(Analytics as a Service)를 통해 각 고객 서버의 클라우드 운영 데이터를 수집하는 데이터 수집 서버; 상기 데이터 수집 서버에서 수집된 클라우드 운영 데이터를 분류하여 저장하는 수집 데이터 DB; 상기 데이터 수집 서버에서 수집된 클라우드 운영 데이터의 비정형 데이터를 분석하여 에러 프로세스를 검출하고, 검출된 에러 프로세스의 장애 여부를 지속적으로 모니터링하는 데이터 분석 서버; 및 상기 데이터 분석 서버에서 비정형 데이터로부터 검출된 에러 프로세스를 저장하는 분석 데이터 DB; 를 포함하는 점에 그 특징이 있다.
본 발명에 따르면, 클라우드 인프라 운영 환경에 있어서 실시간으로 빅데이터를 분석하여 비정형 데이터의 신규 프로세스를 지속적으로 모니터링하여 학습함으로써 장애 원인을 조속히 발견하여 대처할 수 있다.

Description

빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법{Cloud infra real time analysis system based on big date and the providing method thereof}
본 발명은 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법에 관한 것으로, 특히 클라우드 인프라 운영 환경에 있어서 실시간으로 빅데이터를 분석하여 비정형 데이터의 신규 프로세스를 지속적으로 모니터링하여 장애 발생 여부를 예측할 수 있는 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법에 관한 것이다.
"클라우드(cloud)" 컴퓨팅은 종종 통상적으로는 서비스를 요청하는 위치로부터 떨어진 위치에서 함께 네트워킹 되는 다수의 컴퓨터 서버에 의한 서비스로서의 컴퓨팅 자원의 제공을 지칭한다. 클라우드 데이터 센터는 통상적으로 클라우드 또는 클라우드의 특정 부분을 구성하는 서버의 물리적 배열을 지칭한다. 예로서, 서버는 데이터 센터 내에서 방, 그룹, 열 및 선반(racks) 내에 배열될 수 있다. 데이터 센터는 하나 이상의 서버 방을 포함할 수 있는 하나 이상의 "구역(zone)"을 가질 수 있다. 각각의 방은 하나 이상의 서버 열을 포함할 수 있고, 각각의 열은 하나 이상의 선반을 포함할 수 있다. 각각의 선반은 하나 이상의 개별 서버 노드를 포함할 수 있다. 구역, 방, 선반 및/또는 열 내의 서버는 전력, 에너지, 온도, 열 및/또는 다른 요건을 포함할 수 있는 데이터 센터 설비의 물리 기반구조 요건에 기초하여 가상 그룹 내에 배열될 수 있다.
서버 및 그의 자원의 부분은 데이터 센터 내의 자신의 물리적 위치에도 불구하고 보안, 서비스 품질, 처리량, 처리 능력 및/또는 다른 기준과 같은 실제 또는 예상 사용 요건에 따라 (예로서, 데이터 센터의 상이한 고객에 의한 사용을 위해) 할당될 수 있다. 예로서, 하나의 고객의 컴퓨팅 워크로드가 가상화를 이용하여 (데이터 센터의 상이한 열, 선반, 그룹 또는 방 안에 위치할 수 있는) 다수의 물리 서버 사이에 또는 동일 서버상의 다수의 노드 또는 자원 사이에 분산될 수 있다. 따라서, 가상화와 관련하여, 서버는 워크로드 요건을 충족시키도록 논리적으로 그룹화될 수 있다.
오늘날 클라우드 데이터 센터 내에 복잡한 구성이 구현됨에 따라 클라우드 데이터 센터를 효율적으로 관리하는 것이 점점 더 어려워졌다. 이러한 어려움에 기여하는 주요 팩터는 데이터 센터를 구성하는 각각의 장치 및/또는 서비스에 의해 생성되는 다수의 동작 데이터이다. 그러한 데이터의 많은 양으로 인해, 데이터 센터 관리자가 종종 자신의 데이터 센터의 건전성(health), 성능 또는 심지어 레이아웃의 전반적인 모습을 실시간으로 획득하여 장애 발생을 점검하기에 어려운 문제점이 있다.
한국공개특허 제2015-0049541호
본 발명은 클라우드 인프라 운영 환경에 있어서 실시간으로 빅데이터를 분석하여 비정형 데이터의 신규 프로세스를 지속적으로 모니터링하여 장애 발생 여부를 예측할 수 있는 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법을 제공하는 것을 목적으로 한다.
상기의 과제를 달성하기 위한 본 발명에 따른 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템은, 복수의 고객 서버들과 형성된 클라우드 인프라에서 운영중인 AaaS(Analytics as a Service)를 통해 각 고객 서버의 클라우드 운영 데이터를 수집하는 데이터 수집 서버; 상기 데이터 수집 서버에서 수집된 클라우드 운영 데이터를 분류하여 저장하는 수집 데이터 DB; 상기 데이터 수집 서버에서 수집된 클라우드 운영 데이터의 비정형 데이터를 분석하여 에러 프로세스를 검출하고, 검출된 에러 프로세스의 장애 여부를 지속적으로 모니터링하는 데이터 분석 서버; 및 상기 데이터 분석 서버에서 비정형 데이터로부터 검출된 에러 프로세스를 저장하는 분석 데이터 DB; 를 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 데이터 분석 서버로부터 분석된 에러 프로세스의 장애 여부에 대응하는 처리 결과를 관리하는 대응 관리 서버; 및 상기 대응 관리 서버의 에러 프로세스의 장애 검출에 대한 처리결과를 저장하는 장애 패턴 데이터 DB를 더 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 클라우드 운영 데이터는, 정형 데이터, 비정형 데이터 및 상태 데이터를 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 정형 데이터는 하드웨어 구성인 CPU, 메모리, 디스크 및 네트워크를 포함하는 구동 정보인 점에 그 특징이 있다.
여기서, 특히 상기 비정형 데이터는 클라우드 OS 정보, 하이퍼바이저 정보, 가상 OS 정보, IT 운영 성능 정보 및 성능 측정 응답 시간을 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 상태 데이터는 IT 운영 상태 정보로 서버, 프로세스 및 DBMS의 구동 온/오프 상태 정보를 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 데이터 분석 서버는, 상기 수집되는 클라우드 운영 데이터의 정형 데이터, 비정형 데이터 및 상태 데이터 유형을 실시간으로 분석하는 데이터 실시간 분석부; 상기 데이터 실시간 분석부에서 분석된 데이터 유형별로 장애 패턴 DB에 저장된 데이터와 비교하여 장애를 판단하는 장애 패턴 DB 기반 분석부; 상기 데이터 실시간 분석부의 비정형 데이터의 키워드를 분석하여 에러 프로세스를 검출하는 장애 패턴 도출 분석부; 상기 장애 패턴 DB 기반 분석부에서 판단된 장애 발생과 상기 장애 패턴 도출 분석부에서 검출된 에러 프로세스의 발생에 대한 이벤트를 송부하는 장애 이벤트 발생/알림부; 및 상기 장애 패턴 도출 분석부에서 검출된 에러 프로세스 정보를 등록하는 클라우드 분석 에이전트 동기화부를 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 장애 패턴 도출 분석부에서 상기 에러 프로세스의 검출은 비정형 데이터의 기등록된 키워드 텍스트(TEXT) 파일과 비교하여 신규 키워드 텍스트 파일 검출하는 점에 그 특징이 있다.
또한, 상기의 과제를 달성하기 위한 본 발명에 따른 빅데이터 기반의 클라우드 인프라 실시간 분석 서비스 제공 방법에 있어서, 복수의 고객 서버들과 형성된 클라우드 인프라 운영 데이터를 수신하는 단계; 상기 수신된 운영 데이터를 비정형 데이터, 정형 데이터 및 상태 데이터로 분류하여 분석하는 단계; 상기 분석하는 하는 단계에서 분석된 상기 비정형 데이터를 기저장된 장애 패턴과 비교하여 비정형 데이터의 장애 여부를 판단하는 단계; 상기 비정형 데이터의 장애 패턴이 검출되지 않는 경우, 빅데이터 DB와 비교하여 비정형 데이터가 에러 프로세스인지 여부를 판단하고, 에러 프로세스가 아닌 경우 신규 프로세스로 검출하여 모니터링 리스트에 등록하는 단계; 및 상기 신규 프로세스를 클라우드 인프라 운영 AaaS(Analytics as a Service)에 동기화하는 단계;를 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 클라우드 인프라 운영 데이터를 수신하는 단계이전, 복수의 고객 서버들과 형성된 클라우드 인프라에서 운영중인 AaaS(Analytics as a Service)를 통해 각 고객 서버의 클라우드 운영 데이터를 수집하는 단계; 및 상기 데이터 수집 서버에서 수집된 클라우드 운영 데이터를 분류하여 저장하는 단계를 더 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 빅데이터 DB는, 로그 데이터, 성능 데이터, 점검 데이터 및 이벤트 데이터를 포함하는 분석 데이터 DB인 점에 그 특징이 있다.
여기서, 특히 상기 신규 프로세스를 검출하는 단계에서, 상기 검출된 신규 프로세스에 대한 이벤트를 송신하는 단계를 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 클라우드 운영 데이터는, 정형 데이터, 비정형 데이터 및 상태 데이터를 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 정형 데이터는 고객 서버의 하드웨어 구성인 CPU, 메모리, 디스크 및 네트워크를 포함하는 구동 정보인 점에 그 특징이 있다.
여기서, 특히 상기 비정형 데이터는 클라우드 OS 정보, 하이퍼바이저 정보, 가상 OS 정보, IT 운영 성능 정보 및 성능 측정 응답 시간을 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 상태 데이터는 IT 운영 상태 정보로 서버, 프로세스 및 DBMS의 구동 온/오프 상태 정보를 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 장애 여부를 판단하는 단계에서 상기 분석된 정형 데이터를 빅데이터 DB의 하드웨어 구동 임계치와 비교하여 장애 여부를 판단하는 점에 그 특징이 있다.
여기서, 특히 상기 장애 여부 판단에서 상기 분석된 정형 데이터가 구동 임계치를 초과하면 장애 발생 이벤트를 송신하고, 빅데이터 DB에 장애 발생 정형 데이터를 저장하는 단계를 수행하는 점에 그 특징이 있다.
여기서, 특히 상기 장애 여부를 판단하는 단계에서 상기 분석된 상태 데이터인 서버, 프로세스 및 DBMS의 구동 온/오프 상태를 판단하여 장애 여부를 판단하는 것을 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 장애 여부 판단에서 상기 상태 데이터가 오프 상태로 판단되면, 장애 발생 이벤트를 송신하고, 빅데이터 DB에 장애 발생 상태 데이터를 저장하는 단계를 수행하는 점에 그 특징이 있다.
여기서, 특히 상기 비정형 데이터의 장애 패턴이 검출되지 않는 경우, 빅데이터 DB와 비교하여 비정형 데이터가 에러 프로세스로 판단된 경우 에러 프로세스 장애 검출 이벤트를 송신하는 단계를 포함하는 점에 그 특징이 있다.
여기서, 특히 상기 동기화하는 단계 이후, 상기 검출된 신규 프로세스를 빅데이터 DB의 비정형 데이터로 저장하는 단계를 수행하는 점에 그 특징이 있다.
여기서, 특히 상기 비정형 데이터를 기저장된 장애 패턴 비교하여 비정형 데이터의 장애 여부를 판단하는 단계에서 비정형 데이터가 장애 데이터로 판단되면 장애 발생 이벤트를 송신하는 점에 그 특징이 있다.
본 발명에 따르면, 클라우드 인프라 운영 환경에 있어서 실시간으로 빅데이터를 분석하여 비정형 데이터의 신규 프로세스를 지속적으로 모니터링하여 학습함으로써 장애 원인을 조속히 발견하여 대처할 수 있다.
도 1은 본 발명의 실시 예에 따른 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템에 대한 전체적인 구성을 개략적으로 도시한 도면.
도 2는 상기 도 1의 데이터 수집 서버에 수집되는 데이터 계층을 도시한 도면.
도 3은 상기 도 1의 데이터 분석 서버의 구성을 개략적으로 도시한 도면이다.
도 4는 본 발명의 실시 예에 따른 빅테이터 기반의 클라우드 인프라 분석 서비스 제공방법에 대한 순서도.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시 예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 이를 상세한 설명을 통해 상세히 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
본 발명을 설명함에 있어 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자(예를 들어, 제1, 제2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.
또한, 본 명세서에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다.
이하, 본 발명의 바람직한 실시 예를 첨부한 도면에 의거하여 상세하게 설명하면 다음과 같다.
도 1은 본 발명의 실시 예에 따른 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템에 대한 전체적인 구성을 개략적으로 도시한 도면이고, 도 2는 상기 도 1의 데이터 수집 서버에 수집되는 데이터 계층을 도시한 도면이고, 도 3은 상기 도 1의 데이터 분석 서버의 구성을 개략적으로 도시한 도면이다.
도 1에 도시된 바와 같이, 본 발명에 따른 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템은, 복수의 고객 서버들(100), 데이터 수집 서버(200), 수집 데이터 DB(210), 데이터 분석 서버(300), 분석 데이터 DB(310), 대응 관리 서버(400) 및 장애 패턴 데이터 DB(410)를 포함하여 구성된다.
상기 데이터 수집 서버(200)는 복수의 고객 서버들과 형성된 클라우드 인프라에서 운영중인 분석 서비스 에이전트(AaaS:Analytics as a Service)(미도시)를 통해 각 고객 서버의 클라우드 운영 데이터를 수집한다.
여기서, 상기 데이터 수집 서버(200)는 상기 복수의 고객 서버들(100)이 사전에 등록되어 있는 에이전트 접속인지 타당성 여부를 검증한다. 예를 들어, 호스트(host)명, IP 어드레스(address) 등을 검증하는 것이 바람직하다. 즉, 대규모 클라우드 환경에서도 운영 가능하도록 병렬 구성 즉, L4 기반 하드웨어 부하 분산 및 타스크 큐(Task Queue)를 이용한 스토어-엔드-포워드(store-and-forward)방식 지원을 한다.
또한, 상기 데이터 수집 서버(200)에서 상기 클라우드 인프라의 구성, 성능, 장애 데이터 수집을 위해 지원하는 VDI 환경은 Citrix XenDesktop, 및 VMware View 환경을 포함하며, 하이퍼바이저(Hypervisor) 환경은 XEN, KVM, RHEV, VMware vSphere, 및 마이크로소프트 Hyper-V 환경과, IBM PowerVM, 및 HP VM 환경을 포함하고, 상기 클라우드 인프라 스토리지는 RDBMS(관계형 데이터베이스) DB, 및 NoSQL DB를 포함하게 된다.
도 2에 도시된 바와 같이, 상기 데이터 수집 서버(200)에 수집된 상기 클라우드 운영 데이터는 정형 데이터, 비정형 데이터 및 상태 데이터를 포함하게 된다. 상기 정형 데이터는 하드웨어 구성인 CPU, 메모리, 디스크 및 네트워크를 포함하는 구동 정보이고, 상기 비정형 데이터는 클라우드 OS 정보, 하이퍼바이저 정보, 가상 OS 정보, IT 운영 성능 정보 및 성능 측정 응답 시간을 포함하게 된다. 상기 상태 데이터는 IT 운영 상태 정보로 서버, 프로세스 및 DBMS의 구동 온/오프 상태 정보를 포함하는 것을 의미한다.
상기 수집 데이터 DB(210)는 상기 데이터 수집 서버(200)에서 수집된 클라우드 운영 데이터의 환경, 이벤트, 성능, 장애 데이터를 분류하여 저장하게 된다.
상기 데이터 분석 서버(300)는 상기 데이터 수집 서버(200)에서 수집된 클라우드 운영 데이터의 비정형 데이터를 분석하여 에러 프로세스를 검출하고, 검출된 에러 프로세스의 장애 여부를 지속적으로 모니터링하게 된다.
도 3에 도시된 바와 같이, 상기 데이터 분석 서버(300)는 데이터 실시간 분석부(320), 장애 패턴 DB 기반 분석부(330), 장애 이벤트 발생/알림부(340), 장애 패턴 도출 분석부(350) 및 클라우드 분석 에이전트 동기화부(360)를 포함하여 구성된다.
상기 데이터 실시간 분석부(320)는 상기 수집되는 클라우드 운영 데이터의 정형 데이터, 비정형 데이터 및 상태 데이터 유형을 실시간으로 분석하게 된다.
보다 구체적으로, 상기 데이터 실시간 분석부(320)는 상기 데이터 수집 서버(200)에서 수집된 클라우드 운영 데이터의 상기 정형 데이터는 하드웨어 구성인 CPU, 메모리, 디스크 및 네트워크 구동 정보를 포함하여 구분하고, 상기 비정형 데이터는 클라우드 OS 정보, 하이퍼바이저 정보, 가상 OS 정보, IT 운영 성능 정보 및 성능 측정 응답 시간을 포함하여 구분하게 된다. 그리고 상기 상태 데이터는 IT 운영 상태 정보로 서버, 프로세스 및 DBMS의 구동 온/오프 상태 정보를 포함하여 구분하게 된다.
이러한 상기 데이터 실시간 분석부(320)에서는 상기 데이터 수집 서버(200)에서 수집되는 상기 고객 서버들(100)과 형성된 분석 서비스 에이전트(미도시)에서 송신되는 클라우드 운영 데이터를 분석하게 되고, 이러한 클라우드 운영 데이터는, VDI Layer 구성, 성능, 장애 데이터와, VM(Virtual Mashin) Layer 구성, 성능, 장애 데이터와, 상기 하이퍼바이저 계층(Hypervisor Layer) 구성, 성능, 장애 데이터와, 상기 클라우드 인프라 네트워크 구성, 성능, 장애 데이터와, 상기 클라우드 인프라 스토리지 구성, 성능, 장애 데이터를 포함하여 유형별로 분석하게 된다.
상기 장애 패턴 DB 기반 분석부(330)는 상기 데이터 실시간 분석부(320)에서 분석된 데이터 유형별로 장애 패턴 DB에 저장된 데이터와 비교하여 장애를 판단하게 된다.
보다 구체적으로, 상기 비정형 데이터 수신 내용과 장애 패턴 DB의 일치 여부를 검색하게 된다. 이러한 장애 패턴 DB의 유형은 관리자/운영자가 입력한 검색 키워드, 밴더(vendor)에서 제공하는 중요 키워드, 유지보수 분석 결과 또는 타 사이트에서 발생한 사례를 통한 중요 키워드, 기타 일반적으로 알려진 범용적으로 관리되고 있는 중요 키워드, 비정형 데이터 내의 패턴 항목별 빈도수를 집계하게 된다.
상기 장애 패턴 도출 분석부(350)는 상기 데이터 실시간 분석부(320)의 비정형 데이터의 키워드를 분석하여 에러 프로세스를 검출하게 된다. 여기서, 상기 장애 패턴 도출 검출부(350)는 상기 에러 프로세스의 검출은 비정형 데이터의 기등록된 키워드 텍스트(TEXT) 파일과 비교하여 신규 키워드 텍스트 파일 검출하게 된다.
보다 구체적으로, 시스템 사용률이 과다하게 높은 문제 프로세스, 현재 운영중인 클라우드 에이전트에서 분석된 사용률이 높은 상위 프로세스를 검출하게 되고, 이때 OS/WAS/DBMS 등 시스템 프로세스는 제외하게 된다.
또한, 장애/문제가 발생한 시스템에서 검출된 등록되지 않은 패턴과 동일한 유형의 텍스트, 동일한 인프라 문제 즉, 예를 들어, 네트워크, 디스크, DB 접속 오류 등의 발생시 등록되어 있는 클라우드 인프라 구성 정보와 비정형 데이터 패턴의 문제 텍스트를 연계하여 연관 관계를 분석하게 된다.
상기 장애 이벤트 발생/알림부(340)는 상기 장애 패턴 DB 기반 분석부(330)에서 판단된 장애 발생과 상기 장애 패턴 도출 분석부에서 검출된 에러 프로세스의 발생에 대한 이벤트를 송부하게 된다. 즉, 상기 비정형 데이터 분석을 통해 도출된 문제 유형, 분석 결과, 서버 정보(호스트명, ip 어드레스) 등을 통합 대시보드에 JSON 기반의 표준 이벤트로 변환하여 송신하게 된다. 즉, 분석된 문제 패턴의 관리자 확인을 위하여 통합 대시보드에 분석 결과에 대한 이벤트 송신을 하게 된다.
상기 클라우드 분석 에이전트 동기화부(360)는 상기 장애 패턴 도출 분석부(350)에서 검출된 에러 프로세스 정보를 등록하게 된다. 여기서, 상기 장애 패턴 DB 기반 분석부(330)에 등록되지 않은 신규 패턴 프로세스(에러 프로세스)를 추가 모니터링을 자동화하기 위해 현재 등록/접속되어 있는 AaaS 에이전트에 패턴 정보 송신 및 동기화를 하게 된다. 즉, 신규 접속 또는 재접속되는 에이전트에 장애 패턴 DB 정보 이외에 신규로 등록된 패턴 정보를 송신하여 동기화하게 된다.
상기 분석 데이터 DB(310)는 상기 데이터 분석 서버(300)에서 비정형 데이터로부터 검출된 에러 프로세스를 저장하게 된다. 여기서, 분석 데이터 DB(310)는 빅데이터 DB에 해당하는 것으로, 빅데이터는 정형, 비정형 및 상태 데이터를 모두 포괄하게 된다. 즉, 정형, 비정형 및 상태를 포괄하는 빅데이터를 이용하여 장애 패턴 정보를 예측하여 그에 대응할 수 있다.
상기 대응 관리 서버(400)는 상기 데이터 분석 서버(300)로부터 분석된 에러 프로세스의 장애 여부에 대응하는 처리 결과를 관리한다.
상기 장애 패턴 데이터 DB(410)는 상기 대응 관리 서버(400)의 에러 프로세스의 장애 검출에 대한 처리결과를 저장하게 된다.
또한, 도 4는 본 발명의 실시 예에 따른 빅테이터 기반의 클라우드 인프라 분석 서비스 제공방법에 대한 순서도이다.
도 4에 도시된 바와 같이, 본 발명에 따른 빅데이터 기반의 클라우드 인프라 실시간 분석 서비스 제공 방법은, 먼저 복수의 고객 서버들(100)과 형성된 클라우드 인프라에서 운영중인 AaaS(Analytics as a Service)를 통해 클라우드 인프라 운영 데이터를 수신하여 수집하는 단계가 수행된다(S401).
그리고 상기 데이터 수집 서버(200)에서 수집된 클라우드 운영 데이터를 실시간으로 분석하여 수집 데이터 DB(210)에 저장하는 단계를 수행하게 된다(S402). 여기서, 상기 수신된 운영 데이터를 비정형 데이터, 정형 데이터 및 상태 데이터로 분류하여 분석하게 된다. 상기 수집되는 클라우드 운영 데이터의 정형 데이터, 비정형 데이터 및 상태 데이터 유형을 실시간으로 분석하게 된다.
보다 구체적으로, 상기 데이터 실시간 분석부(320)는 상기 데이터 수집 서버(200)에서 수집된 클라우드 운영 데이터의 상기 정형 데이터는 하드웨어 구성인 CPU, 메모리, 디스크 및 네트워크 구동 정보를 포함하여 구분하고, 상기 비정형 데이터는 클라우드 OS 정보, 하이퍼바이저 정보, 가상 OS 정보, IT 운영 성능 정보 및 성능 측정 응답 시간을 포함하여 구분하게 된다. 그리고 상기 상태 데이터는 IT 운영 상태 정보로 서버, 프로세스 및 DBMS의 구동 온/오프 상태 정보를 포함하여 구분하게 된다.
이어서, 상기 분석하는 하는 단계에서 분석된 상기 비정형 데이터를 기저장된 장애 패턴과 비교하여(S403) 비정형 데이터의 장애 여부를 판단하는 단계가 수행된다(S404). 보다 구체적으로, 상기 비정형 데이터 수신 내용과 장애 패턴 DB의 일치 여부를 검색하게 된다. 이러한 장애 패턴 DB의 유형은 관리자/운영자가 입력한 검색 키워드, 밴더(vendor)에서 제공하는 중요 키워드, 유지보수 분석 결과 또는 타 사이트에서 발생한 사례를 통한 중요 키워드, 기타 일반적으로 알려진 범용적으로 관리되고 있는 중요 키워드, 비정형 데이터 내의 패턴 항목별 빈도수를 집계하게 된다.
그 다음, 상기 비정형 데이터의 장애 패턴이 검출되지 않는 경우, 빅데이터 DB와 비교하여 비정형 데이터가 에러 프로세스인지 여부를 판단하게 된다(S406). 즉, 상기 데이터 실시간 분석부에서 상기 빅데이터 DB와 비정형 데이터의 키워드를 비교 분석하여 에러 프로세스에 해당되는지를 판단하게 된다.
이어, 상기 에러 프로세스가 아닌 경우 신규 프로세스로 검출하고, 상기 검출된 신규 프로세스에 대한 이벤트를 송신하게 된다(S408). 여기서, 상기 에러 프로세스의 검출은 비정형 데이터의 기등록된 키워드 텍스트(TEXT) 파일과 비교하여 신규 프로세스의 키워드 텍스트 파일을 검출하게 된다.
보다 구체적으로, 시스템 사용률이 과다하게 높은 문제 프로세스, 현재 운영중인 클라우드 에이전트에서 분석된 사용률이 높은 상위 프로세스를 검출하게 되고, 이때 OS/WAS/DBMS 등 시스템 프로세스는 제외하게 된다.
또한, 장애/문제가 발생한 시스템에서 검출된 등록되지 않은 패턴과 동일한 유형의 텍스트, 동일한 인프라 문제 즉, 예를 들어, 네트워크, 디스크, DB 접속 오류 등의 발생시 등록되어 있는 클라우드 인프라 구성 정보와 비정형 데이터 패턴의 문제 텍스트를 연계하여 연관 관계를 분석하게 된다.
그리고 상기 검출된 신규 프로세스를 모니터링 리스트에 등록하는 단계를 수행하게 된다(S409). 즉, 검출된 신규 프로세스가 장애 데이터 가능성을 보유할 수 있으므로 지속적으로 모니터링을 하기 위함이다.
그 다음, 상기 신규 프로세스를 클라우드 인프라 운영 AaaS(Analytics as a Service)에 동기화하는 단계가 수행된다(S410).
보다 구체적으로, 상기 장애 패턴 DB 기반 분석부에 등록되지 않은 신규 패턴 프로세스(에러 프로세스)를 추가 모니터링을 자동화하기 위해 현재 등록/접속되어 있는 AaaS 에이전트에 패턴 정보 송신 및 동기화를 하게 된다. 즉, 신규 접속 또는 재접속되는 에이전트에 장애 패턴 DB 정보 이외에 신규로 등록된 패턴 정보를 송신하여 동기화하게 된다.
이어, 상기 동기화하는 단계 이후, 상기 검출된 신규 프로세스를 빅데이터 DB의 비정형 데이터로 저장하는 단계를 수행하게 된다(S411). 여기서, 상기 검출된 신규 프로세스의 텍스트를 네트워크, 디스크, DB 접속 오류 등의 발생시 등록되어 있는 클라우드 인프라 구성 정보와 비정형 데이터 패턴의 문제 텍스트를 연계하여 빅데이터 DB에 저장하고, 상기 비정형 데이터에 대한 장애 데이터 검출의 반복적인 과정을 거친 학습 과정을 통해 새로 발생되는 장애 데이터에 대해 조속한 장애 처리를 할 수 있게 된다.
한편, 상기 비정형 데이터를 기저장된 장애 패턴 비교하여 비정형 데이터의 장애 여부를 판단하는 단계(S404)에서 비정형 데이터가 장애 데이터로 판단되면 장애 발생 이벤트를 송신하는 단계를 수행한다(S405).
또한, 상기 비정형 데이터의 장애 패턴을 검출하는 단계에서 장애 패턴이 검출되지 않는 경우(S404), 빅데이터 DB와 비교하여 비정형 데이터가 에러 프로세스로 판단된 경우(S406)에 에러 프로세스 장애 검출 이벤트를 송신하는 단계가 수행된다(S407).
한편, 상기 분석하는 하는 단계(S402) 이후, 상기 분석된 데이터가 비정형 데이터가 아닌 경우, 정형 데이터인지 여부를 판단하고(S420), 빅데이터 DB의 하드웨어 구동 임계치와 비교하여(S421) 상기 분석된 정형 데이터가 구동 임계치를 초과하는 경우 장애 데이터로 판단하여, 장애 발생 이벤트 송부를 하게 된다(S422). 그리고 장애 발생 정형 데이터를 빅데이터 DB에 저장하게 된다(S423).
또한, 상기 분석된 데이터가 정형 데이터인지 여부를 판단하는 단계(S420)에서 상기 분석된 데이터가 정형 데이터가 아닌 경우 상태 데이터인지 여부를 판단하게 된다(S430). 즉, 정형 데이터인 서버, 프로세스 및 DBMS의 구동 온/오프 상태를 판단하여 장애 여부를 판단하게 된다. 이때, 상기 장애 여부 판단에서 상기 상태 데이터가 오프 상태이면, 장애로 판단되고(S431), 장애 발생 이벤트를 송신하고(S432), 빅데이터 DB에 장애 발생 상태 데이터를 저장하는 단계(S433)를 수행하게 된다.
마지막으로, 상기 비정형 데이터, 상기 정형 데이터 및 상태 데이터의 장애 데이터 여부를 판단하는 과정을 거쳐 처리된 데이터 처리 결과를 장애 패턴 DB에 저장하게 된다(S412).
따라서, 본 발명에 따르면, 클라우드 인프라 운영 환경에 있어서 실시간으로 빅데이터를 분석하여 비정형 데이터의 신규 프로세스를 지속적으로 모니터링하여 빅데이터 DB를 통해 학습함으로써 장애 원인을 조속히 발견하여 대처할 수 있다.
본 발명의 권리범위는 상술한 실시 예에 한정되는 것이 아니라 첨부된 특허청구범위 내에서 다양한 형태의 실시 예로 구현될 수 있다. 특허청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자라면 누구든지 변형 가능한 다양한 범위까지 본 발명의 청구범위 기재의 범위 내에 있는 것으로 본다.
100 --- 고객 서버 200 --- 데이터 수집 서버
210 --- 수집 데이터 DB 300 --- 데이터 분석 서버
310 --- 분석 데이터 DB 320 --- 데이터 실시간 분석부
330 --- 장애 패턴 DB 기반 분석부 340 --- 장애 이벤트 발생/알림부
350 --- 장애 패턴 도출 분석부 360 --- 클라우드 분석 에이전트 동기화부
400 --- 대응 관리 서버 410 --- 장애 패턴 데이터 DB

Claims (23)

  1. 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템에 있어서,
    복수의 고객 서버들과 형성된 클라우드 인프라에서 운영중인 AaaS(Analytics as a Service)를 통해 각 고객 서버의 클라우드 운영 데이터를 수집하는 데이터 수집 서버;
    상기 데이터 수집 서버에서 수집된 클라우드 운영 데이터를 분류하여 저장하는 수집 데이터 DB;
    상기 데이터 수집 서버에서 수집된 클라우드 운영 데이터의 비정형 데이터를 분석하여 에러 프로세스를 검출하고, 검출된 에러 프로세스의 장애 여부를 지속적으로 모니터링하는 데이터 분석 서버; 및
    상기 데이터 분석 서버에서 비정형 데이터로부터 검출된 에러 프로세스를 저장하는 분석 데이터 DB; 를 포함하는 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템.
  2. 제1항에 있어서,
    상기 데이터 분석 서버로부터 분석된 에러 프로세스의 장애 여부에 대응하는 처리 결과를 관리하는 대응 관리 서버; 및
    상기 대응 관리 서버의 에러 프로세스의 장애 검출에 대한 처리결과를 저장하는 장애 패턴 데이터 DB를 더 포함하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템.
  3. 제1항에 있어서,
    상기 클라우드 운영 데이터는,
    정형 데이터, 비정형 데이터 및 상태 데이터를 포함하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템.
  4. 제3항에 있어서,
    상기 정형 데이터는 하드웨어 구성인 CPU, 메모리, 디스크 및 네트워크를 포함하는 구동 정보인 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템.
  5. 제3항에 있어서,
    상기 비정형 데이터는 클라우드 OS 정보, 하이퍼바이저 정보, 가상 OS 정보, IT 운영 성능 정보 및 성능 측정 응답 시간을 포함하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템.
  6. 제3항에 있어서,
    상기 상태 데이터는 IT 운영 상태 정보로 서버, 프로세스 및 DBMS의 구동 온/오프 상태 정보를 포함하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템.
  7. 제1항에 있어서,
    상기 데이터 분석 서버는,
    상기 수집되는 클라우드 운영 데이터의 정형 데이터, 비정형 데이터 및 상태 데이터 유형을 실시간으로 분석하는 데이터 실시간 분석부;
    상기 데이터 실시간 분석부에서 분석된 데이터 유형별로 장애 패턴 DB에 저장된 데이터와 비교하여 장애를 판단하는 장애 패턴 DB 기반 분석부;
    상기 데이터 실시간 분석부의 비정형 데이터의 키워드를 분석하여 에러 프로세스를 검출하는 장애 패턴 도출 분석부;
    상기 장애 패턴 DB 기반 분석부에서 판단된 장애 발생과 상기 장애 패턴 도출 분석부에서 검출된 에러 프로세스의 발생에 대한 이벤트를 송부하는 장애 이벤트 발생/알림부; 및
    상기 장애 패턴 도출 분석부에서 검출된 에러 프로세스 정보를 등록하는 클라우드 분석 에이전트 동기화부를 포함하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템.
  8. 제7항에 있어서,
    상기 장애 패턴 도출 분석부에서
    상기 에러 프로세스의 검출은 비정형 데이터의 기등록된 키워드 텍스트(TEXT) 파일과 비교하여 신규 키워드 텍스트 파일 검출하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템.
  9. 빅데이터 기반의 클라우드 인프라 실시간 분석 서비스 제공 방법에 있어서,
    복수의 고객 서버들과 형성된 클라우드 인프라 운영 데이터를 수신하는 단계;
    상기 수신된 운영 데이터를 비정형 데이터, 정형 데이터 및 상태 데이터로 분류하여 분석하는 단계;
    상기 분석하는 하는 단계에서 분석된 상기 비정형 데이터를 기저장된 장애 패턴과 비교하여 비정형 데이터의 장애 여부를 판단하는 단계;
    상기 비정형 데이터의 장애 패턴이 검출되지 않는 경우, 빅데이터 DB와 비교하여 비정형 데이터가 에러 프로세스인지 여부를 판단하고, 에러 프로세스가 아닌 경우 신규 프로세스로 검출하여 모니터링 리스트에 등록하는 단계; 및
    상기 신규 프로세스를 클라우드 인프라 운영 AaaS(Analytics as a Service)에 동기화하는 단계;를 포함하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  10. 제9항에 있어서,
    상기 클라우드 인프라 운영 데이터를 수신하는 단계이전,
    복수의 고객 서버들과 형성된 클라우드 인프라에서 운영중인 AaaS(Analytics as a Service)를 통해 각 고객 서버의 클라우드 운영 데이터를 수집하는 단계; 및
    상기 데이터 수집 서버에서 수집된 클라우드 운영 데이터를 분류하여 저장하는 단계를 더 포함하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  11. 제9항에 있어서,
    상기 빅데이터 DB는,
    로그 데이터, 성능 데이터, 점검 데이터 및 이벤트 데이터를 포함하는 분석 데이터 DB인 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  12. 제9항에 있어서,
    상기 신규 프로세스를 검출하는 단계에서,
    상기 검출된 신규 프로세스에 대한 이벤트를 송신하는 단계를 포함하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  13. 제9항에 있어서,
    상기 클라우드 운영 데이터는,
    정형 데이터, 비정형 데이터 및 상태 데이터를 포함하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  14. 제13항에 있어서,
    상기 정형 데이터는 고객 서버의 하드웨어 구성인 CPU, 메모리, 디스크 및 네트워크를 포함하는 구동 정보인 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  15. 제13항에 있어서,
    상기 비정형 데이터는 클라우드 OS 정보, 하이퍼바이저 정보, 가상 OS 정보, IT 운영 성능 정보 및 성능 측정 응답 시간을 포함하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  16. 제13항에 있어서,
    상기 상태 데이터는 IT 운영 상태 정보로 서버, 프로세스 및 DBMS의 구동 온/오프 상태 정보를 포함하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  17. 제9항에 있어서,
    상기 장애 여부를 판단하는 단계에서 상기 분석된 정형 데이터를 빅데이터 DB의 하드웨어 구동 임계치와 비교하여 장애 여부를 판단하는 것을 포함하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  18. 제17항에 있어서,
    상기 장애 여부 판단에서 상기 분석된 정형 데이터가 구동 임계치를 초과하면 장애 발생 이벤트를 송신하고, 빅데이터 DB에 장애 발생 정형 데이터를 저장하는 단계를 수행하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  19. 제9항에 있어서,
    상기 장애 여부를 판단하는 단계에서 상기 분석된 상태 데이터인 서버, 프로세스 및 DBMS의 구동 온/오프 상태를 판단하여 장애 여부를 판단하는 것을 포함하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  20. 제19항에 있어서,
    상기 장애 여부 판단에서 상기 상태 데이터가 오프 상태로 판단되면, 장애 발생 이벤트를 송신하고, 빅데이터 DB에 장애 발생 상태 데이터를 저장하는 단계를 수행하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  21. 제9항에 있어서,
    상기 비정형 데이터의 장애 패턴이 검출되지 않는 경우, 빅데이터 DB와 비교하여 비정형 데이터가 에러 프로세스로 판단된 경우 에러 프로세스 장애 검출 이벤트를 송신하는 단계를 포함하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  22. 제9항에 있어서,
    상기 동기화하는 단계 이후, 상기 검출된 신규 프로세스를 빅데이터 DB의 비정형 데이터로 저장하는 단계를 수행하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공방법.
  23. 제9항에 있어서,
    상기 비정형 데이터를 기저장된 장애 패턴 비교하여 비정형 데이터의 장애 여부를 판단하는 단계에서 비정형 데이터가 장애 데이터로 판단되면 장애 발생 이벤트를 송신하는 것을 특징으로 하는 빅데이터 기반의 클라우드 인프라 실시간 분석 제공 방법.
KR1020160169515A 2016-12-13 2016-12-13 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법 KR101971013B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160169515A KR101971013B1 (ko) 2016-12-13 2016-12-13 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160169515A KR101971013B1 (ko) 2016-12-13 2016-12-13 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법

Publications (2)

Publication Number Publication Date
KR20180068002A true KR20180068002A (ko) 2018-06-21
KR101971013B1 KR101971013B1 (ko) 2019-04-22

Family

ID=62806774

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160169515A KR101971013B1 (ko) 2016-12-13 2016-12-13 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법

Country Status (1)

Country Link
KR (1) KR101971013B1 (ko)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101987664B1 (ko) * 2018-07-19 2019-06-11 나무기술 주식회사 클라우드 플랫폼에서 복수의 클러스터 및 어플리케이션을 모니터링하는 방법
KR102083666B1 (ko) * 2019-12-04 2020-03-02 대한민국 클라우드 컴퓨팅 기반 서버 모니터링 시스템 및 방법
KR20200049028A (ko) * 2018-10-31 2020-05-08 주식회사 엘지씨엔에스 장애 유형 기반의 서버 장애 진단 및 대응 방법
KR20200106124A (ko) * 2019-02-28 2020-09-11 한국정보통신기술협회 빅데이터 분석용 dbms를 위한 테스트 자동화 프레임워크 및 테스트 자동화 방법
KR102181625B1 (ko) * 2019-11-20 2020-11-23 주식회사 이노그리드 멀티클라우드 실시간 모니터링 시스템 및 방법
KR102256198B1 (ko) * 2020-09-18 2021-05-27 (주)시큐레이어 작업 도중 발생한 프로세스 성능 저하 또는 프로세스 장애 상황을 실시간으로 탐지하고 개선함으로써 작업량 손실을 최소화하는 방법 및 장치
KR102307641B1 (ko) * 2021-04-30 2021-10-01 나무기술 주식회사 클라우드 운영 데이터 분석을 위한 병렬 처리 제어 시스템
KR20220072338A (ko) * 2020-11-25 2022-06-02 스트라토 주식회사 엣지 서비스 증설 제어 시스템 및 그 제어방법
KR102492409B1 (ko) * 2022-06-22 2023-01-27 (주) 이노트리 멀티/하이브리드 클라우드 실시간 모니터링 시스템
KR20230043362A (ko) 2021-09-24 2023-03-31 주식회사 에스티 클라우드 기반 인공지능 학습 물류 관리 시스템 및 방법
KR102540221B1 (ko) * 2022-05-04 2023-06-08 오픈마루 주식회사 마이크로서비스 아키텍처를 구성하는 미들웨어의 성능 상의 문제점 및 문제점에 대한 해결절차를 안내하는 방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102560230B1 (ko) * 2023-02-16 2023-07-27 나무기술 주식회사 클라우드 기반의 클라이언트 운영 분석 결과를 기반으로 하는 모니터링 정책의 자동 처리 및 배포 방법
KR102560225B1 (ko) * 2023-02-16 2023-07-27 나무기술 주식회사 클라우드 인프라 기반의 가상os 다중 장애 발생 모니터링 및 병렬 처리 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080044508A (ko) * 2006-11-16 2008-05-21 삼성에스디에스 주식회사 통계적인 분석을 이용한 성능장애 관리시스템 및 그 방법
KR100942456B1 (ko) * 2009-07-23 2010-02-12 주식회사 안철수연구소 클라우드 컴퓨팅을 이용한 DDoS 공격 탐지 및 차단 방법 및 서버
KR101505468B1 (ko) * 2013-11-29 2015-03-25 고려대학교 산학협력단 클라우드 컴퓨팅 환경 내 데이터 비교 처리 방법 및 시스템
KR20150049541A (ko) 2013-10-30 2015-05-08 삼성에스디에스 주식회사 데이터 센터 장애 이벤트 관리 자동화 시스템 및 방법
KR20160069444A (ko) * 2014-12-08 2016-06-16 엔트릭스 주식회사 클라우드 스트리밍 서비스를 위한 서비스 품질 모니터링 시스템 및 방법, 그리고 컴퓨터 프로그램이 기록된 기록매체

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080044508A (ko) * 2006-11-16 2008-05-21 삼성에스디에스 주식회사 통계적인 분석을 이용한 성능장애 관리시스템 및 그 방법
KR100942456B1 (ko) * 2009-07-23 2010-02-12 주식회사 안철수연구소 클라우드 컴퓨팅을 이용한 DDoS 공격 탐지 및 차단 방법 및 서버
KR20150049541A (ko) 2013-10-30 2015-05-08 삼성에스디에스 주식회사 데이터 센터 장애 이벤트 관리 자동화 시스템 및 방법
KR101505468B1 (ko) * 2013-11-29 2015-03-25 고려대학교 산학협력단 클라우드 컴퓨팅 환경 내 데이터 비교 처리 방법 및 시스템
KR20160069444A (ko) * 2014-12-08 2016-06-16 엔트릭스 주식회사 클라우드 스트리밍 서비스를 위한 서비스 품질 모니터링 시스템 및 방법, 그리고 컴퓨터 프로그램이 기록된 기록매체

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101987664B1 (ko) * 2018-07-19 2019-06-11 나무기술 주식회사 클라우드 플랫폼에서 복수의 클러스터 및 어플리케이션을 모니터링하는 방법
WO2020017844A1 (ko) * 2018-07-19 2020-01-23 나무기술 주식회사 클라우드 플랫폼에서 복수의 클러스터 및 어플리케이션을 모니터링하는 방법
KR20200049028A (ko) * 2018-10-31 2020-05-08 주식회사 엘지씨엔에스 장애 유형 기반의 서버 장애 진단 및 대응 방법
KR20200106124A (ko) * 2019-02-28 2020-09-11 한국정보통신기술협회 빅데이터 분석용 dbms를 위한 테스트 자동화 프레임워크 및 테스트 자동화 방법
KR102181625B1 (ko) * 2019-11-20 2020-11-23 주식회사 이노그리드 멀티클라우드 실시간 모니터링 시스템 및 방법
KR102083666B1 (ko) * 2019-12-04 2020-03-02 대한민국 클라우드 컴퓨팅 기반 서버 모니터링 시스템 및 방법
KR102256198B1 (ko) * 2020-09-18 2021-05-27 (주)시큐레이어 작업 도중 발생한 프로세스 성능 저하 또는 프로세스 장애 상황을 실시간으로 탐지하고 개선함으로써 작업량 손실을 최소화하는 방법 및 장치
KR20220072338A (ko) * 2020-11-25 2022-06-02 스트라토 주식회사 엣지 서비스 증설 제어 시스템 및 그 제어방법
KR102307641B1 (ko) * 2021-04-30 2021-10-01 나무기술 주식회사 클라우드 운영 데이터 분석을 위한 병렬 처리 제어 시스템
KR20230043362A (ko) 2021-09-24 2023-03-31 주식회사 에스티 클라우드 기반 인공지능 학습 물류 관리 시스템 및 방법
KR102540221B1 (ko) * 2022-05-04 2023-06-08 오픈마루 주식회사 마이크로서비스 아키텍처를 구성하는 미들웨어의 성능 상의 문제점 및 문제점에 대한 해결절차를 안내하는 방법
KR102492409B1 (ko) * 2022-06-22 2023-01-27 (주) 이노트리 멀티/하이브리드 클라우드 실시간 모니터링 시스템

Also Published As

Publication number Publication date
KR101971013B1 (ko) 2019-04-22

Similar Documents

Publication Publication Date Title
KR101971013B1 (ko) 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법
JP6959736B2 (ja) ネットワーク障害のトラブルシューティング・オプションの識別
Oliner et al. What supercomputers say: A study of five system logs
US9021077B2 (en) Management computer and method for root cause analysis
EP2523115B1 (en) Operation management device, operation management method, and program storage medium
US20160378583A1 (en) Management computer and method for evaluating performance threshold value
US9495234B1 (en) Detecting anomalous behavior by determining correlations
CN103069749B (zh) 虚拟环境中的问题的隔离的方法和系统
JP5267749B2 (ja) 運用管理装置、運用管理方法、及びプログラム
US8336099B2 (en) Methods, hardware products, and computer program products for implementing introspection data comparison utilizing hypervisor guest introspection data
WO2007068602A2 (en) Remote performance monitor in a virtual data center complex
US11329869B2 (en) Self-monitoring
US9692654B2 (en) Systems and methods for correlating derived metrics for system activity
Pannu et al. A self-evolving anomaly detection framework for developing highly dependable utility clouds
US20220050733A1 (en) Component failure prediction
JP2024521357A (ja) Mlモデルを用いて準リアルタイムデータ/オフラインデータでデータセンタの大規模な故障の検出
US9021078B2 (en) Management method and management system
US10360614B1 (en) Assessing and rating deployments of resources
US20190258725A1 (en) Service regression detection using real-time anomaly detection of log data
US8554908B2 (en) Device, method, and storage medium for detecting multiplexed relation of applications
Mdhaffar et al. Reactive performance monitoring of Cloud computing environments
US20150067152A1 (en) Monitoring system, system, and monitoring method
Cardoso et al. Architecture for highly configurable dashboards for operations monitoring and support
CN115102838A (zh) 服务器宕机风险的应急处理方法和装置、电子设备
JP5747765B2 (ja) 障害分析装置、障害分析方法、およびプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
N231 Notification of change of applicant
GRNT Written decision to grant