KR102614848B1 - 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템 - Google Patents

인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템 Download PDF

Info

Publication number
KR102614848B1
KR102614848B1 KR1020210101345A KR20210101345A KR102614848B1 KR 102614848 B1 KR102614848 B1 KR 102614848B1 KR 1020210101345 A KR1020210101345 A KR 1020210101345A KR 20210101345 A KR20210101345 A KR 20210101345A KR 102614848 B1 KR102614848 B1 KR 102614848B1
Authority
KR
South Korea
Prior art keywords
cloud
artificial intelligence
failure
failure prediction
big data
Prior art date
Application number
KR1020210101345A
Other languages
English (en)
Other versions
KR20230020052A (ko
Inventor
김명진
정혜원
김회
안은별
김은비
Original Assignee
주식회사 이노그리드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 이노그리드 filed Critical 주식회사 이노그리드
Priority to KR1020210101345A priority Critical patent/KR102614848B1/ko
Publication of KR20230020052A publication Critical patent/KR20230020052A/ko
Application granted granted Critical
Publication of KR102614848B1 publication Critical patent/KR102614848B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45591Monitoring or debugging support

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Hardware Redundancy (AREA)

Abstract

인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템이 개시된다. 본 발명의 일측면에 따른 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템은, 복수개의 클라우드 시스템들 각각의 장애이력을 포함하는 운영이력을 저장하기 위한 빅데이터 서버; 운영이력에 대한 빅데이터 분석을 기반으로 각 클라우드 시스템의 장애를 예측하는 인공지능모듈; 및 클라우드 시스템들의 자원을 이용한 가상화 단일 클라우드 서비스를 제공하되, 인공지능모듈들에 의한 장애예측정보를 기반으로 선정한 이용우선순위를 이용하여 클라우드 시스템을 선택운영하는 가상 클라우드 서버를 포함한다.

Description

인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템{Multi-cloud service method and system using failure prediction by artificial intelligence and big data platform}
본 발명은 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템에 관한 것이다.
근래에는 클라이언트단에서 각종 프로그램을 직접 설치하여 이용하는 방식을 탈피하여 서버단에서 응용프로그램뿐 아니라 다양한 플랫폼까지도 서비스 방식으로 제공하는 클라우드 서비스에 대한 이용자가 늘고 있는 추세이다. 
다시 말해, 클라우드 컴퓨팅은 인터넷 기술을 활용하여 다수의 고객들에게 높은 수준의 확장성을 가진 IT 자원들을 서비스로 제공하는 시스템으로, 사용자들은 가상화된 리소스를 할당 받아 개인의 데스크탑 환경처럼 사용할 수 있다. 
이러한 클라우드 서비스의 확장에 따라 많은 수의 CSP(cloud service provider)가 운영되는 형태의 멀티클라우드가 서비스되고 있다. 멀티 클라우드는 서로 다른 업체에서 2개 이상의 클라우드를 이용해 하나의 서비스를 운영하는 것을 말하는 것으로, 클라우드 시스템 업체를 다르게 하여 이중 구성하는 형태로 업체 종속성을 피하고, 특정 업체의 클라우드 시스템에 장애가 발생했을 때 서비스에 타격을 주지 않기 위한 목적 등으로 이용된다. 
그러나, 사용자 입장에서는 복수개의 CSP를 이용함에 따른 다중 비용 부담이 증가하게 되며, 또한 비용 효율을 위해 작은 개수의 CSP를 활용하게 되는 경우엔 장애 발생에 따른 서비스 이용불가뿐 아니라 데이터 손실 등의 위험이 커진다.
대한민국 등록특허 제10-1998564 (등록일자 2019년07월04일) 클라우드 플랫폼에서의 멀티 클러스터 프로비저닝 및 관리 방법
따라서, 본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로서, 멀티 멀티클라우드를 활용하여 단일 가상화 클라우드 서비스를 제공하되 각 클라우드 시스템의 장애 발생을 예측하여 안정된 서비스를 제공하는, 인공지능과 빅데이터 플랫폼을 이용한 멀티클라우드 장애 예보 서비스 방법 및 시스템을 제공하기 위한 것이다.
본 발명의 다른 목적들은 이하에 서술되는 바람직한 실시예를 통하여 보다 명확해질 것이다.
본 발명의 일 측면에 따르면, 복수개의 클라우드 시스템들 각각의 장애이력을 포함하는 운영이력을 저장하기 위한 빅데이터 서버; 상기 운영이력에 대한 빅데이터 분석을 기반으로 각 클라우드 시스템의 장애를 예측하는 인공지능모듈; 및 상기 클라우드 시스템들의 자원을 이용한 가상화 단일 클라우드 서비스를 제공하되, 상기 인공지능모듈들에 의한 장애예측정보를 기반으로 선정한 이용우선순위를 이용하여 클라우드 시스템을 선택운영하는 가상 클라우드 서버를 포함하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템이 제공된다.
여기서, 상기 인공지능모듈은 대상 클라우드 시스템이 설치된 지역에 대한 뉴스정보와 날씨정보를 탐색하여 장애예측에 더 활용한다.
또한, 상기 가상 클라우드 서버는, 장애예측정보에 따른 장애발생확률이 임계값 이상인 클라우드 시스템을 이용한 서비스에 대해서는 타 클라우드 시스템을 이용한 동일 서비스를 이중화한다.
또한, 상기 가상 클라우드 서버는, 상기 장애발생확률을 포함한 상기 장애예측정보에 따라 상기 이중화를 수행하는 기간을 결정한다.
또한, 상기 가상 클라우드 서버는, 장애발생확률과 이용률을 기반으로 상기 이중화를 위한 타 클라우드 시스템을 선택한다.
또한, 상기 가상 클라우드 서버는, 상기 이중화에 따른 상기 타 클라우드 시스템으로부터의 클라이언트 데이터는 대응된 인공지능모듈로 제공하고, 주기적으로 상기 인공지능모듈의 모니터링정보와 상기 이중화 수행 대상인 클라우드 시스템의 모니터링정보를 수집하여 서로 비교함으로써 서비스 제공 정상 여부를 확인한다.
또한, 상기 이중화가 일정 시간 수행되는 경우, 상기 타 클라이언트 시스템으로부터의 모니터링정보와 상기 이중화 수행 대상인 클라우드 시스템으로부터 데이터를 수신하는 클라이언트로부터의 모니터링정보를 수집하여 서로 비교한다.
또한, 상기 인공지능모듈로부터의 모니터링정보와 상기 클라이언트로부터의 모니터링정보를 이용하여 각 클라이언트 시스템에서의 처리속도를 비교하고, 비교 결과에 따라 상기 이중화의 유지 여부를 결정한다.
본 발명의 다른 측면에 따르면, 복수개의 클라우드서비스 제공장치들의 자원을 이용한 가상화 단일 클라우드 서비스를 제공하는 가상 클라우드 서버에서 수행되는 멀티클라우드 서비스 방법에 있어서, 클라우드 시스템들 각각의 장애이력을 포함하는 운영이력에 대한 빅데이터 분석을 기반으로 각 클라우드 시스템의 장애를 예측한 인공지능모듈로부터 장애예측정보를 수신하는 단계; 및 상기 장애예측정보를 기반으로 각 클라우드 시스템의 이용우선순위를 선정하는 단계; 및 상기 이용우선순위에 따른 클라우드 시스템을 선택하여 가상화 단일 클라우드 서비스를 제공하는 단계를 포함하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 그 방법을 실행하는 프로그램이 기록된 기록매체가 제공된다.
여기서, 장애예측정보에 따른 장애발생확률이 임계값 이상인 클라우드 시스템을 이용한 서비스에 대해서는 타 클라우드 시스템을 이용한 동일 서비스를 이중화하는 단계를 더 포함한다.
또한, 상기 이중화에 따른 상기 타 클라우드 시스템으로부터의 클라이언트 데이터는 대응된 인공지능모듈로 제공하고, 주기적으로 상기 인공지능모듈의 모니터링정보와 상기 이중화를 수행하는 클라우드 시스템의 모니터링정보를 수집하여 서로 비교함으로써 서비스 제공 정상 여부를 확인하는 단계를 더 포함한다.
본 발명에 따르면, 각 클라우드 시스템의 장애를 예측함으로써 최적의 단일 클라우드 서비스를 제공하여 유지비용 부담을 줄여주고 기업의 서비스 연속성을 보장할 수 있다.
도 1 및 도 2는 본 발명의 각 실시예에 따른 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스를 제공하는 전체 시스템을 도시한 구성도들.
도 3은 본 발명의 일 실시예에 따른 인공지능모듈과 가상 클라우드 서버간의 장애예측에 의한 멀티클라우드 서비스를 제공하는 과정을 도시한 흐름도.
도 4는 본 발명의 일 실시예에 따른 가상 클라우드 서버에서 수행되는 장애대응 이중화 서비스 과정을 도시한 흐름도.
도 5 및 도 6은 본 발명의 각 실시예에 따른 이중화 서비스시의 모니터링 방식을 도시한 예시도들.
도 7은 본 발명의 일 실시예에 따른 모니터링 정보를 활용한 이중화 유지 여부 확인 과정을 도시한 흐름도.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 후술될 제1 임계값, 제2 임계값 등의 용어는 실질적으로는 각각 상이하거나 일부는 동일한 값인 임계값들로 미리 지정될 수 있으나, 임계값이라는 동일한 단어로 표현될 때 혼동의 여지가 있으므로 구분의 편의상 제1, 제2 등의 용어를 병기하기로 한다.
본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
또한, 각 도면을 참조하여 설명하는 실시예의 구성 요소가 해당 실시예에만 제한적으로 적용되는 것은 아니며, 본 발명의 기술적 사상이 유지되는 범위 내에서 다른 실시예에 포함되도록 구현될 수 있으며, 또한 별도의 설명이 생략될지라도 복수의 실시예가 통합된 하나의 실시예로 다시 구현될 수도 있음은 당연하다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일하거나 관련된 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
도 1 및 도 2는 본 발명의 각 실시예에 따른 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스를 제공하는 전체 시스템을 도시한 구성도들이고, 도 3은 본 발명의 일 실시예에 따른 인공지능모듈과 가상 클라우드 서버간의 장애예측에 의한 멀티클라우드 서비스를 제공하는 과정을 도시한 흐름도이다.
먼저, 도 1을 참조하면, 본 실시예에 따른 전체 시스템은 복수개의 클라우드 시스템(10-1, ..., 10-n, 이하 10으로 통칭), 인공지능서버(20), 빅데이터서버(30) 및 가상 클라우드 서버(50)를 포함한다.
클라우드 시스템(10)은 클라우드서비스를 제공하는 시스템(CSP : cloud service provider)으로, 가상 클라우드 서버(50)는 이러한 복수개의 클라우드 시스템을 이용하여 가상의 단일 클라우드 서비스를 클라이언트에게 제공한다. 예를 들어, 고객A는 가상 클라우드 서버(50)에서 제공하는 클라우드 서비스를 이용하면, 클라우드 시스템을 복수개 이용하는 것과 같이 임의의 클라우드 시스템에 장애가 발생하더라도 안정적으로 서비스를 이용할 수 있게 된다. 이러한 멀티 클라우드 서비스에 대해서는 당업자에게는 자명할 것이므로 더욱 상세한 설명은 생략한다.
특히, 본 실시예에 따르면 빅데이터서버(30)가 운영되어 각 클라우드 시스템(10)에 대한 장애이력을 포함하는 운영이력이 저장 및 관리된다. 예를 들어, 제1 클라우드 시스템(10-1)의 운영이력으로서, 장애발생 시각, 장애이유, 장애유지시간 등이 장애이력으로서 관리되고, 365일 각 일자에 따른 시간별 접속자수/동시접속자수/송수신데이터량/네트워크상태 등이 운영이력으로서 관리될 수 있다.
그리고, 인공지능서버(20)는 이러한 빅데이터서버(30)에 저장된 운영이력에 대한 빅데이터 분석을 기반으로 각 클라우드 시스템의 장애를 예측한다. 예를 들어, 제1 클라우드 시스템(10-1)의 운영이력으로서 작년 동일 시점에 장애가 발생된 이력이 있고, 그때의 접속자수/송수신데이터량 등이 유사하다면 인공지능서버(20)는 제1 클라우드 시스템(10-1)에 장애가 발생될 확률이 높다고 판단할 수 있을 것이다. 다시 말해, 인공지능서버(20)는 대상 클라우드 시스템에 대해 과거의 운영이력과 현재의 운영상태, 앞으로의 운영상태를 예측하여 장애가 발생될 확률을 산출한다.
가상 클라우드 서버(50)는 인공지능서버(20)에 의한 장애예측에 기반하여, 각 클라우드 시스템(10)의 이용우선순위를 선정하고, 그 이용우선순위에 따라 클라우드 시스템(10)을 선택운영하여 가상의 단일 클라우드 서비스를 클라이언트에게 제공한다.
본 실시예에서는 인공지능서버(20)가 운영되는 형태를 예시하였으나, 다른 실시예에 따른 도 2를 참조하면, 인공지능모듈(21)이 각 클라우드 시스템(10)에 구비되어, 각 인공지능모듈(21)이 대응된 클라우드 시스템의 장애예측을 수행하고 그에 대한 정보를 가상 클라우드 서버(50)로 제공하는 형태일 수 있다. 이하에서는 도 2에 따른 실시예를 위주로 설명하기로 한다.
장애예측에 의한 멀티클라우드 서비스를 제공하는 과정을 도시한 도 3을 참조하면, 각각의 인공지능모듈(21)은 주기적으로(예를 들어, 1시간 등) 대응된 클라우드 시스템(10)의 장애예측을 수행한다(S310). 상술한 바와 같이 인공지능모듈(21)은 빅데이터서버(30)에 저장된 운영이력에 대한 빅데이터 분석을 기반으로 대상 클라우드 시스템(10)의 장애를 예측한다. 여기서, 일례에 따르면, 인공지능모듈(21)은 대상 클라우드 시스템이 설치된 지역에 대한 뉴스정보와 날씨정보를 탐색하여 장애예측에 더 활용할 수 있다. 즉, 단순히 클라우드 시스템 자체에 대한 운영이력만이 아니라, 시스템이 구축된 지역에 발생된 뉴스정보(주변 사고, 정전, 지진, 홍수 등)와 날씨정보(온도, 습도, 강수량 등)를 탐색하고 분석함으로써 장애예측의 정확도를 높일 수 있다. 예를 들어, 지진이 발생하고 고온이 발생된 경우 클라우드 시스템이 구축된 건물에 문제가 발생하거나 고온에 의해 장비에 장애가 발생된 사례가 존재한다면 장애발생 확률은 보다 높게 산출될 수 있을 것이다.
인공지능모듈(21) 각각은 산출된 장애발생확률에 대한 정보를 포함하는 장애예측정보를 가상 클라우드 서버(50)로 제공한다(S320). 가상 클라우드 서버(50)는 수신된 각 클라우드 시스템에 대한 장애예측정보를 분석하여 이용우선순위를 선정한다(S330). 당연히 장애발생확률이 낮은 클라우드 시스템의 이용우선순위가 높게 설정될 수 있을 것이다. 다만, 단순히 장애발생확률과 같은 장애발생 가능성만을 이용할 수도 있으나, 현재의 각 클라우드 시스템의 이용정도, 부하율, 요금제 등을 고려하여 이용우선순위를 선정한다.
가상 클라우드 서버(50)는 접속된 고개에게 가상의 단일 클라우드 서비스를 제공함에 있어 선정된 이용우선순위를 기반으로 사용할 클라우드 시스템을 선택하여 운영한다(S340).
본 실시예에 따르면, 각 클라우드 시스템(10)에 대한 장애를 예측함으로써, 미리 장애 발생에 대비하여 해당 클라우드 시스템의 이용을 최소화함으로써 그 피해를 최소화하여 고객에게 안정된 클라우드 서비스를 제공할 수 있다.
이하에서는 장애발생확률이 높은 클라우드 시스템이 존재하는 경우의 처리과정에 대하 상세히 설명하기로 한다.
도 4는 본 발명의 일 실시예에 따른 가상 클라우드 서버(50)에서 수행되는 장애대응 이중화 서비스 과정을 도시한 흐름도이다.
도 4를 참조하면, 가상 클라우드 서버(50)는 각 클라우드 시스템의 장애예측정보를 확인하고(S410), 장애발생확률이 미리 설정된 임계값을 초과하는 것이 존재하는지를 판단한다(S420).
임의의 클라우드 시스템의 장애발생확률이 임계값을 초과하는 경우, 해당 클라우드 시스템(이하 이중화대상 클라우드 시스템이라 칭함)에서 제공하는 서비스는 타 클라우드 시스템을 이용한 이중화를 수행한다(S430). 다시 말해, 제1 클라우드 시스템이 이중화대상 클라우드 시스템인 경우, 타 클라우드 시스템(예를 들어 제2 클라우드 시스템)을 이용하여 동일한 서비스를 수행하는 것이다. 즉, 장애에 즉각 대응하기 위해 동일한 서비스를 두개의 클라우드 시스템을 이용하여 이중화는 것이며, 이때 그 중 하나인 이중화대상 클라우드 시스템에 의한 데이터만을 클라이언트로 제공한다.
여기서, 제2 클라우드 시스템을 이용한 서비스에 따른 클라이언트에게 제공되는 데이터는 다른 저장공간에 저장하거나 또는 이중화대상 클라우드 시스템에 대응된 인공지능모듈로 제공한다.
일례에 따르면, 이중화를 수행함에 따라 두개의 클라우드 시스템을 이용하게 되므로, 이중으로 비용이 발생될 수 있으므로 이에 대해 클라이언트에게 안내할 수 있으며, 또한 이중화 기간을 효율적으로 선정함이 필요하다.
이를 위해, 가상 클라우드 서버(50)는 장애발생확률을 포함한 장애예측정보에 따라 이중화를 수행하는 기간을 결정한다. 또한 클라이언트로 장애예측정보를 안내하여 이중화를 수행하는 기간을 선택하도록 할 수도 있다.
그리고, 가상 클라우드 서버(50)는 각 클라우드 시스템의 장애발생확률과 현재 이용률을 기반으로 이중화를 위한 타 클라우드 시스템을 선택한다. 예를 들어 장애발생확률이 낮고 이용률이 적은 클라우드 시스템이 선택될 수 있을 것이다.
이와 달리 장애발생확률이 임계값을 초과하는 것이 없다면, 정상적으로 이용우선순위를 선정하여 활용한다(S440).
도 5 및 도 6은 본 발명의 각 실시예에 따른 이중화 서비스시의 모니터링 방식을 도시한 예시도들이고, 도 7은 본 발명의 일 실시예에 따른 모니터링 정보를 활용한 이중화 유지 여부 확인 과정을 도시한 흐름도이다.
도면에는 도시되지 않았으나 클라이언트 단말은 클라우드 컴퓨팅 서비스를 이용하는 이용자의 단말장치로서, 개인PC뿐 아니라, 스마트폰, 태블릿PC 등 통신망을 통한 통신수단을 구비한 컴퓨팅 장치일 수 있다. 클라이언트 단말 및 클라우드 시스템에는 클라우드 서비스에 따른 모니터링을 수행하여 모니터링 정보를 생성하는 에이전트가 설치될 수 있다. 클라우드 시스템(30)에 설치된 에이전트인 서버에이전트는 가상머신(VM)의 운용체제(OS: Operating System) 또는 가상머신에서 운용되는 애플리케이션(application)의 운용현황(이용한 클라이언트 단말정보, 애플리케이션 이용정보 등) 또는 성능 정보(예를 들어 가상 서버의 CPU, Memory, Disk, Network 상황 등)를 모니터링하여 정보를 생성한다. 클라이언트 단말에 설치된 클라이언트에이전트는 가상머신으로부터 제공받는 클라우드 컴퓨팅 서비스를 모니터링하여 가상머신 정보(예를 들어 일련번호 등), 애플리케이션 이용정보 등의 모니터링 정보를 생성한다.
따라서, 가상 클라우드 서버(50)는 각 에이전트로부터 모니터링 정보를 수신함으로써, 정상적으로 서비스가 되고 있는지를 모니터링할 수 있다.
먼저 일례에 따른 도 5를 참조하면, 가상 클라우드 서버(50)는 이중화에 따른 타 클라우드 시스템(10-2)으로부터의 클라이언트 데이터는 대응된 인공지능모듈(21-2)로 제공하고, 주기적으로 인공지능모듈(21-2)의 모니터링정보와 이중화대상인 클라우드 시스템(10-1)의 모니터링정보를 수집하여 서로 비교함으로써 서비스 제공 정상 여부를 확인한다.
즉, 제1 클라우드 시스템과 제2 클라우드 시스템이 이중화 서비스로 동일한 서비스를 수행하고 있으므로, 제1 클라우드 시스템(10-1)으로부터의 제1 모니터링정보와, 제2 클라우드 시스템(10-2)에 의한 클라이언트 데이터를 수신하는 제2 인공지능모듈(21-2)의 제2 모니터링정보를 비교함으로써 두 클라우드 시스템의 정상서비스 여부를 동시에 확인할 수 있다.
그리고 도 6을 참조하면, 이러한 이중화가 미리 설정된 기간 이상이 수행되는 경우, 타 클라이언트 시스템(10-2)으로부터의 모니터링정보(제4 모니터링정보)와 이중화대상 클라우드 시스템(10-1)으로부터 데이터를 수신하는 클라이언트 단말로부터의 모니터링정보(제3 모니터링정보)를 수집하여 서로 비교하여 정상 서비스 여부를 더 확인한다.
그리고, 도 7을 참조하면, 인공지능모듈로부터의 제2모니터링정보와 클라이언트로부터의 제3모니터링정보를 이용하여 각 클라이언트 시스템에서의 처리속도 등의 환경을 분석한다(S710).
분석결과에 따라 이중화대상 클라우드 시스템과 이중화를 수행하는 타 클라우드 시스템의 환경을 비교한다(S720). 예를 들어, 제2모니터링정보에 의한 데이터 수신시각에 비해 제3모니터링정보에 의한 데이터 수신시각이 너무 늦다면, 이중화대상 클라우드 시스템에서의 처리속도가 늦은 것으로 판단될 수 있다.
비교 결과에 따라 이중화의 유지 여부를 결정한다(S730). 예를 들어, 처리속도 등이 유사하다면 이중화를 중단하고, 처리 속도의 차이가 임계값 이상인 경우 이중화를 수행하거나 또는 이중화대상 클라우드 시스템을 이용한 서비스 자체를 중단시킬 수도 있다.
상술한 본 발명에 따른 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터 시스템에 의하여 해독될 수 있는 데이터가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
또한, 상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
10 : 클라우드 시스템
20 : 인공지능서버
21 : 인공지능모듈
30 : 빅데이터서버
50 : 가상 클라우드 서버

Claims (12)

  1. 복수개의 클라우드 시스템들 각각의 장애이력을 포함하는 운영이력을 저장하기 위한 빅데이터 서버;
    상기 클라우드 시스템들 각각에 구비되며, 상기 운영이력에 대한 빅데이터 분석을 기반으로 해당하는 클라우드 시스템의 장애를 예측하는 인공지능모듈들; 및
    상기 클라우드 시스템들의 자원을 이용한 가상화 단일 클라우드 서비스를 제공하되, 상기 인공지능모듈들에 의한 장애예측정보를 기반으로 선정한 이용우선순위를 이용하여 클라우드 시스템을 선택운영하는 가상 클라우드 서버를 포함하되,
    상기 가상 클라우드 서버는,
    상기 장애예측정보에 따른 장애발생확률이 임계값 이상인 클라우드 시스템을 이용한 서비스에 대해서는 타 클라우드 시스템을 이용한 동일 서비스를 이중화하여 서비스하되,
    이중화대상 클라우드 시스템에 의한 클라이언트 데이터만을 클라이언트로 제공하고 이중화에 따른 상기 타 클라우드 시스템으로부터의 클라이언트 데이터는 대응된 인공지능모듈로 제공하며, 주기적으로 상기 인공지능모듈로부터의 모니터링정보와 상기 이중화대상 클라우드 시스템의 모니터링정보를 수집하여 서로 비교함으로써 서비스 제공 정상 여부를 확인하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
  2. 청구항 1에 있어서,
    상기 인공지능모듈은 대상 클라우드 시스템이 설치된 지역에 대한 뉴스정보와 날씨정보를 탐색하여 장애예측에 더 활용하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
  3. 삭제
  4. 청구항 1에 있어서,
    상기 가상 클라우드 서버는,
    상기 장애발생확률을 포함한 상기 장애예측정보에 따라 상기 이중화를 수행하는 기간을 결정하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
  5. 청구항 1에 있어서,
    상기 가상 클라우드 서버는,
    장애발생확률과 이용률을 기반으로 상기 이중화를 위한 타 클라우드 시스템을 선택하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
  6. 삭제
  7. 청구항 1에 있어서,
    상기 이중화가 일정 시간 수행되는 경우,
    상기 타 클라우드 시스템으로부터의 모니터링정보와 상기 이중화대상 클라우드 시스템으로부터 데이터를 수신하는 클라이언트로부터의 모니터링정보를 수집하여 서로 비교하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
  8. 청구항 7에 있어서,
    상기 인공지능모듈로부터의 모니터링정보와 상기 클라이언트로부터의 모니터링정보를 이용하여 각 클라이언트 시스템에서의 처리속도를 비교하고, 비교 결과에 따라 상기 이중화의 유지 여부를 결정하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
  9. 복수개의 클라우드서비스 제공장치들의 자원을 이용한 가상화 단일 클라우드 서비스를 제공하는 가상 클라우드 서버에서 수행되는 멀티클라우드 서비스 방법에 있어서,
    클라우드 시스템들 각각에 구비되어 해당 클라우드 시스템의 장애이력을 포함하는 운영이력에 대한 빅데이터 분석을 기반으로 클라우드 시스템의 장애를 예측한 인공지능모듈들로부터 장애예측정보를 수신하는 단계;
    상기 장애예측정보를 기반으로 각 클라우드 시스템의 이용우선순위를 선정하는 단계; 및
    상기 이용우선순위에 따른 클라우드 시스템을 선택하여 가상화 단일 클라우드 서비스를 제공하는 단계를 포함하되,
    상기 장애예측정보에 따른 장애발생확률이 임계값 이상인 클라우드 시스템을 이용한 서비스에 대해서는 타 클라우드 시스템을 이용한 동일 서비스를 이중화하여 서비스하되,
    이중화대상 클라우드 시스템에 의한 클라이언트 데이터만을 클라이언트로 제공하고 이중화에 따른 상기 타 클라우드 시스템으로부터의 클라이언트 데이터는 대응된 인공지능모듈로 제공하며, 주기적으로 상기 인공지능모듈로부터의 모니터링정보와 상기 이중화대상 클라우드 시스템의 모니터링정보를 수집하여 서로 비교함으로써 서비스 제공 정상 여부를 확인하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법.
  10. 삭제
  11. 삭제
  12. 제 9항의 방법을 수행하기 위한 컴퓨터에 의해 실행되는 애플리케이션이나 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체.
KR1020210101345A 2021-08-02 2021-08-02 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템 KR102614848B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210101345A KR102614848B1 (ko) 2021-08-02 2021-08-02 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210101345A KR102614848B1 (ko) 2021-08-02 2021-08-02 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20230020052A KR20230020052A (ko) 2023-02-10
KR102614848B1 true KR102614848B1 (ko) 2023-12-20

Family

ID=85223486

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210101345A KR102614848B1 (ko) 2021-08-02 2021-08-02 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR102614848B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117041072B (zh) * 2023-06-25 2024-02-13 兴容(上海)信息技术股份有限公司 一种基于人工智能的多模态数据管理系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101506250B1 (ko) * 2014-12-10 2015-03-27 (주)한위드정보기술 가상화 서비스 제공을 위한 가상화 서버 접속 이중화 시스템
KR101959055B1 (ko) * 2017-10-02 2019-07-04 광주과학기술원 멀티 가상 머신의 클라우드간 마이그레이션
KR102231359B1 (ko) * 2019-11-04 2021-03-24 주식회사 이노그리드 고성능 클라우드 서비스를 위한 단일 가상화 시스템 및 프로세스 스케줄링 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102473637B1 (ko) * 2017-06-29 2022-12-02 주식회사 케이티 5g 분산 클라우드 시스템의 빅 데이터를 이용하여 장애를 관리하는 장치 및 방법
KR20190077696A (ko) * 2017-12-26 2019-07-04 경희대학교 산학협력단 클라우드 서비스 제공 시스템, 컴퓨팅 장치, 클라우드 서비스 제공 방법, 상기 방법을 실행하기 위한 프로그램 및 상기 프로그램이 기록된 기록 매체
KR101998564B1 (ko) 2018-07-19 2019-07-10 나무기술 주식회사 클라우드 플랫폼에서의 멀티 클러스터 프로비저닝 및 관리 방법
KR102320317B1 (ko) * 2019-11-11 2021-11-02 한국전자기술연구원 클라우드 엣지 환경에서 예측 기반 마이그레이션 후보 및 대상 선정 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101506250B1 (ko) * 2014-12-10 2015-03-27 (주)한위드정보기술 가상화 서비스 제공을 위한 가상화 서버 접속 이중화 시스템
KR101959055B1 (ko) * 2017-10-02 2019-07-04 광주과학기술원 멀티 가상 머신의 클라우드간 마이그레이션
KR102231359B1 (ko) * 2019-11-04 2021-03-24 주식회사 이노그리드 고성능 클라우드 서비스를 위한 단일 가상화 시스템 및 프로세스 스케줄링 방법

Also Published As

Publication number Publication date
KR20230020052A (ko) 2023-02-10

Similar Documents

Publication Publication Date Title
US10048996B1 (en) Predicting infrastructure failures in a data center for hosted service mitigation actions
US10838803B2 (en) Resource provisioning and replacement according to a resource failure analysis in disaggregated data centers
US10375169B1 (en) System and method for automatically triggering the live migration of cloud services and automatically performing the triggered migration
US10693740B2 (en) Data transformation of performance statistics and ticket information for network devices for use in machine learning models
US11050637B2 (en) Resource lifecycle optimization in disaggregated data centers
US10387241B2 (en) Cognitive analysis for healing an IT system
US7975165B2 (en) Management of information technology risk using virtual infrastructures
US9898359B2 (en) Predictive disaster recovery system
JP6091436B2 (ja) ネットワーク・イベント管理のための装置、方法、およびコンピュータ・プログラム
US10764165B1 (en) Event-driven framework for filtering and processing network flows
US10754720B2 (en) Health check diagnostics of resources by instantiating workloads in disaggregated data centers
US9710122B1 (en) Customer support interface
US11188408B2 (en) Preemptive resource replacement according to failure pattern analysis in disaggregated data centers
US10831580B2 (en) Diagnostic health checking and replacement of resources in disaggregated data centers
US10761915B2 (en) Preemptive deep diagnostics and health checking of resources in disaggregated data centers
CN111538558A (zh) 用于自动选择安全虚拟机的系统和方法
KR102139058B1 (ko) 서버 관리 장치를 구비한 클라우드 서버 및 로컬 서버를 이용하는 제로클라이언트 단말기용 클라우드 컴퓨팅 시스템
US10255124B1 (en) Determining abnormal conditions of host state from log files through Markov modeling
KR102614848B1 (ko) 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템
US11263069B1 (en) Using unsupervised learning to monitor changes in fleet behavior
US9225608B1 (en) Evaluating configuration changes based on aggregate activity level
US20220317744A1 (en) Data analytics for mitigation of data center thermal issues
KR102188987B1 (ko) 서버 관리 장치를 구비한 클라우드 서버 및 로컬 서버를 이용하는 제로클라이언트 단말기용 클라우드 컴퓨팅 시스템의 운영 방법
US11824922B2 (en) Operating cloud-managed remote edge sites at reduced disk capacity
Wang et al. Prediction‐based survivable virtual network mapping against disaster failures

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant