KR20230020052A - 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템 - Google Patents
인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템 Download PDFInfo
- Publication number
- KR20230020052A KR20230020052A KR1020210101345A KR20210101345A KR20230020052A KR 20230020052 A KR20230020052 A KR 20230020052A KR 1020210101345 A KR1020210101345 A KR 1020210101345A KR 20210101345 A KR20210101345 A KR 20210101345A KR 20230020052 A KR20230020052 A KR 20230020052A
- Authority
- KR
- South Korea
- Prior art keywords
- cloud
- artificial intelligence
- failure prediction
- big data
- failure
- Prior art date
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000007405 data analysis Methods 0.000 claims abstract description 7
- 238000012544 monitoring process Methods 0.000 claims description 37
- 238000012545 processing Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000006424 Flood reaction Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45562—Creating, deleting, cloning virtual machine instances
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/4557—Distribution of virtual machine instances; Migration and load balancing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45591—Monitoring or debugging support
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Hardware Redundancy (AREA)
Abstract
인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템이 개시된다. 본 발명의 일측면에 따른 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템은, 복수개의 클라우드 시스템들 각각의 장애이력을 포함하는 운영이력을 저장하기 위한 빅데이터 서버; 운영이력에 대한 빅데이터 분석을 기반으로 각 클라우드 시스템의 장애를 예측하는 인공지능모듈; 및 클라우드 시스템들의 자원을 이용한 가상화 단일 클라우드 서비스를 제공하되, 인공지능모듈들에 의한 장애예측정보를 기반으로 선정한 이용우선순위를 이용하여 클라우드 시스템을 선택운영하는 가상 클라우드 서버를 포함한다.
Description
본 발명은 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템에 관한 것이다.
근래에는 클라이언트단에서 각종 프로그램을 직접 설치하여 이용하는 방식을 탈피하여 서버단에서 응용프로그램뿐 아니라 다양한 플랫폼까지도 서비스 방식으로 제공하는 클라우드 서비스에 대한 이용자가 늘고 있는 추세이다.
다시 말해, 클라우드 컴퓨팅은 인터넷 기술을 활용하여 다수의 고객들에게 높은 수준의 확장성을 가진 IT 자원들을 서비스로 제공하는 시스템으로, 사용자들은 가상화된 리소스를 할당 받아 개인의 데스크탑 환경처럼 사용할 수 있다.
이러한 클라우드 서비스의 확장에 따라 많은 수의 CSP(cloud service provider)가 운영되는 형태의 멀티클라우드가 서비스되고 있다. 멀티 클라우드는 서로 다른 업체에서 2개 이상의 클라우드를 이용해 하나의 서비스를 운영하는 것을 말하는 것으로, 클라우드 시스템 업체를 다르게 하여 이중 구성하는 형태로 업체 종속성을 피하고, 특정 업체의 클라우드 시스템에 장애가 발생했을 때 서비스에 타격을 주지 않기 위한 목적 등으로 이용된다.
그러나, 사용자 입장에서는 복수개의 CSP를 이용함에 따른 다중 비용 부담이 증가하게 되며, 또한 비용 효율을 위해 작은 개수의 CSP를 활용하게 되는 경우엔 장애 발생에 따른 서비스 이용불가뿐 아니라 데이터 손실 등의 위험이 커진다.
따라서, 본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로서, 멀티 멀티클라우드를 활용하여 단일 가상화 클라우드 서비스를 제공하되 각 클라우드 시스템의 장애 발생을 예측하여 안정된 서비스를 제공하는, 인공지능과 빅데이터 플랫폼을 이용한 멀티클라우드 장애 예보 서비스 방법 및 시스템을 제공하기 위한 것이다.
본 발명의 다른 목적들은 이하에 서술되는 바람직한 실시예를 통하여 보다 명확해질 것이다.
본 발명의 일 측면에 따르면, 복수개의 클라우드 시스템들 각각의 장애이력을 포함하는 운영이력을 저장하기 위한 빅데이터 서버; 상기 운영이력에 대한 빅데이터 분석을 기반으로 각 클라우드 시스템의 장애를 예측하는 인공지능모듈; 및 상기 클라우드 시스템들의 자원을 이용한 가상화 단일 클라우드 서비스를 제공하되, 상기 인공지능모듈들에 의한 장애예측정보를 기반으로 선정한 이용우선순위를 이용하여 클라우드 시스템을 선택운영하는 가상 클라우드 서버를 포함하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템이 제공된다.
여기서, 상기 인공지능모듈은 대상 클라우드 시스템이 설치된 지역에 대한 뉴스정보와 날씨정보를 탐색하여 장애예측에 더 활용한다.
또한, 상기 가상 클라우드 서버는, 장애예측정보에 따른 장애발생확률이 임계값 이상인 클라우드 시스템을 이용한 서비스에 대해서는 타 클라우드 시스템을 이용한 동일 서비스를 이중화한다.
또한, 상기 가상 클라우드 서버는, 상기 장애발생확률을 포함한 상기 장애예측정보에 따라 상기 이중화를 수행하는 기간을 결정한다.
또한, 상기 가상 클라우드 서버는, 장애발생확률과 이용률을 기반으로 상기 이중화를 위한 타 클라우드 시스템을 선택한다.
또한, 상기 가상 클라우드 서버는, 상기 이중화에 따른 상기 타 클라우드 시스템으로부터의 클라이언트 데이터는 대응된 인공지능모듈로 제공하고, 주기적으로 상기 인공지능모듈의 모니터링정보와 상기 이중화 수행 대상인 클라우드 시스템의 모니터링정보를 수집하여 서로 비교함으로써 서비스 제공 정상 여부를 확인한다.
또한, 상기 이중화가 일정 시간 수행되는 경우, 상기 타 클라이언트 시스템으로부터의 모니터링정보와 상기 이중화 수행 대상인 클라우드 시스템으로부터 데이터를 수신하는 클라이언트로부터의 모니터링정보를 수집하여 서로 비교한다.
또한, 상기 인공지능모듈로부터의 모니터링정보와 상기 클라이언트로부터의 모니터링정보를 이용하여 각 클라이언트 시스템에서의 처리속도를 비교하고, 비교 결과에 따라 상기 이중화의 유지 여부를 결정한다.
본 발명의 다른 측면에 따르면, 복수개의 클라우드서비스 제공장치들의 자원을 이용한 가상화 단일 클라우드 서비스를 제공하는 가상 클라우드 서버에서 수행되는 멀티클라우드 서비스 방법에 있어서, 클라우드 시스템들 각각의 장애이력을 포함하는 운영이력에 대한 빅데이터 분석을 기반으로 각 클라우드 시스템의 장애를 예측한 인공지능모듈로부터 장애예측정보를 수신하는 단계; 및 상기 장애예측정보를 기반으로 각 클라우드 시스템의 이용우선순위를 선정하는 단계; 및 상기 이용우선순위에 따른 클라우드 시스템을 선택하여 가상화 단일 클라우드 서비스를 제공하는 단계를 포함하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 그 방법을 실행하는 프로그램이 기록된 기록매체가 제공된다.
여기서, 장애예측정보에 따른 장애발생확률이 임계값 이상인 클라우드 시스템을 이용한 서비스에 대해서는 타 클라우드 시스템을 이용한 동일 서비스를 이중화하는 단계를 더 포함한다.
또한, 상기 이중화에 따른 상기 타 클라우드 시스템으로부터의 클라이언트 데이터는 대응된 인공지능모듈로 제공하고, 주기적으로 상기 인공지능모듈의 모니터링정보와 상기 이중화를 수행하는 클라우드 시스템의 모니터링정보를 수집하여 서로 비교함으로써 서비스 제공 정상 여부를 확인하는 단계를 더 포함한다.
본 발명에 따르면, 각 클라우드 시스템의 장애를 예측함으로써 최적의 단일 클라우드 서비스를 제공하여 유지비용 부담을 줄여주고 기업의 서비스 연속성을 보장할 수 있다.
도 1 및 도 2는 본 발명의 각 실시예에 따른 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스를 제공하는 전체 시스템을 도시한 구성도들.
도 3은 본 발명의 일 실시예에 따른 인공지능모듈과 가상 클라우드 서버간의 장애예측에 의한 멀티클라우드 서비스를 제공하는 과정을 도시한 흐름도.
도 4는 본 발명의 일 실시예에 따른 가상 클라우드 서버에서 수행되는 장애대응 이중화 서비스 과정을 도시한 흐름도.
도 5 및 도 6은 본 발명의 각 실시예에 따른 이중화 서비스시의 모니터링 방식을 도시한 예시도들.
도 7은 본 발명의 일 실시예에 따른 모니터링 정보를 활용한 이중화 유지 여부 확인 과정을 도시한 흐름도.
도 3은 본 발명의 일 실시예에 따른 인공지능모듈과 가상 클라우드 서버간의 장애예측에 의한 멀티클라우드 서비스를 제공하는 과정을 도시한 흐름도.
도 4는 본 발명의 일 실시예에 따른 가상 클라우드 서버에서 수행되는 장애대응 이중화 서비스 과정을 도시한 흐름도.
도 5 및 도 6은 본 발명의 각 실시예에 따른 이중화 서비스시의 모니터링 방식을 도시한 예시도들.
도 7은 본 발명의 일 실시예에 따른 모니터링 정보를 활용한 이중화 유지 여부 확인 과정을 도시한 흐름도.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 후술될 제1 임계값, 제2 임계값 등의 용어는 실질적으로는 각각 상이하거나 일부는 동일한 값인 임계값들로 미리 지정될 수 있으나, 임계값이라는 동일한 단어로 표현될 때 혼동의 여지가 있으므로 구분의 편의상 제1, 제2 등의 용어를 병기하기로 한다.
본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
또한, 각 도면을 참조하여 설명하는 실시예의 구성 요소가 해당 실시예에만 제한적으로 적용되는 것은 아니며, 본 발명의 기술적 사상이 유지되는 범위 내에서 다른 실시예에 포함되도록 구현될 수 있으며, 또한 별도의 설명이 생략될지라도 복수의 실시예가 통합된 하나의 실시예로 다시 구현될 수도 있음은 당연하다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일하거나 관련된 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
도 1 및 도 2는 본 발명의 각 실시예에 따른 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스를 제공하는 전체 시스템을 도시한 구성도들이고, 도 3은 본 발명의 일 실시예에 따른 인공지능모듈과 가상 클라우드 서버간의 장애예측에 의한 멀티클라우드 서비스를 제공하는 과정을 도시한 흐름도이다.
먼저, 도 1을 참조하면, 본 실시예에 따른 전체 시스템은 복수개의 클라우드 시스템(10-1, ..., 10-n, 이하 10으로 통칭), 인공지능서버(20), 빅데이터서버(30) 및 가상 클라우드 서버(50)를 포함한다.
클라우드 시스템(10)은 클라우드서비스를 제공하는 시스템(CSP : cloud service provider)으로, 가상 클라우드 서버(50)는 이러한 복수개의 클라우드 시스템을 이용하여 가상의 단일 클라우드 서비스를 클라이언트에게 제공한다. 예를 들어, 고객A는 가상 클라우드 서버(50)에서 제공하는 클라우드 서비스를 이용하면, 클라우드 시스템을 복수개 이용하는 것과 같이 임의의 클라우드 시스템에 장애가 발생하더라도 안정적으로 서비스를 이용할 수 있게 된다. 이러한 멀티 클라우드 서비스에 대해서는 당업자에게는 자명할 것이므로 더욱 상세한 설명은 생략한다.
특히, 본 실시예에 따르면 빅데이터서버(30)가 운영되어 각 클라우드 시스템(10)에 대한 장애이력을 포함하는 운영이력이 저장 및 관리된다. 예를 들어, 제1 클라우드 시스템(10-1)의 운영이력으로서, 장애발생 시각, 장애이유, 장애유지시간 등이 장애이력으로서 관리되고, 365일 각 일자에 따른 시간별 접속자수/동시접속자수/송수신데이터량/네트워크상태 등이 운영이력으로서 관리될 수 있다.
그리고, 인공지능서버(20)는 이러한 빅데이터서버(30)에 저장된 운영이력에 대한 빅데이터 분석을 기반으로 각 클라우드 시스템의 장애를 예측한다. 예를 들어, 제1 클라우드 시스템(10-1)의 운영이력으로서 작년 동일 시점에 장애가 발생된 이력이 있고, 그때의 접속자수/송수신데이터량 등이 유사하다면 인공지능서버(20)는 제1 클라우드 시스템(10-1)에 장애가 발생될 확률이 높다고 판단할 수 있을 것이다. 다시 말해, 인공지능서버(20)는 대상 클라우드 시스템에 대해 과거의 운영이력과 현재의 운영상태, 앞으로의 운영상태를 예측하여 장애가 발생될 확률을 산출한다.
가상 클라우드 서버(50)는 인공지능서버(20)에 의한 장애예측에 기반하여, 각 클라우드 시스템(10)의 이용우선순위를 선정하고, 그 이용우선순위에 따라 클라우드 시스템(10)을 선택운영하여 가상의 단일 클라우드 서비스를 클라이언트에게 제공한다.
본 실시예에서는 인공지능서버(20)가 운영되는 형태를 예시하였으나, 다른 실시예에 따른 도 2를 참조하면, 인공지능모듈(21)이 각 클라우드 시스템(10)에 구비되어, 각 인공지능모듈(21)이 대응된 클라우드 시스템의 장애예측을 수행하고 그에 대한 정보를 가상 클라우드 서버(50)로 제공하는 형태일 수 있다. 이하에서는 도 2에 따른 실시예를 위주로 설명하기로 한다.
장애예측에 의한 멀티클라우드 서비스를 제공하는 과정을 도시한 도 3을 참조하면, 각각의 인공지능모듈(21)은 주기적으로(예를 들어, 1시간 등) 대응된 클라우드 시스템(10)의 장애예측을 수행한다(S310). 상술한 바와 같이 인공지능모듈(21)은 빅데이터서버(30)에 저장된 운영이력에 대한 빅데이터 분석을 기반으로 대상 클라우드 시스템(10)의 장애를 예측한다. 여기서, 일례에 따르면, 인공지능모듈(21)은 대상 클라우드 시스템이 설치된 지역에 대한 뉴스정보와 날씨정보를 탐색하여 장애예측에 더 활용할 수 있다. 즉, 단순히 클라우드 시스템 자체에 대한 운영이력만이 아니라, 시스템이 구축된 지역에 발생된 뉴스정보(주변 사고, 정전, 지진, 홍수 등)와 날씨정보(온도, 습도, 강수량 등)를 탐색하고 분석함으로써 장애예측의 정확도를 높일 수 있다. 예를 들어, 지진이 발생하고 고온이 발생된 경우 클라우드 시스템이 구축된 건물에 문제가 발생하거나 고온에 의해 장비에 장애가 발생된 사례가 존재한다면 장애발생 확률은 보다 높게 산출될 수 있을 것이다.
인공지능모듈(21) 각각은 산출된 장애발생확률에 대한 정보를 포함하는 장애예측정보를 가상 클라우드 서버(50)로 제공한다(S320). 가상 클라우드 서버(50)는 수신된 각 클라우드 시스템에 대한 장애예측정보를 분석하여 이용우선순위를 선정한다(S330). 당연히 장애발생확률이 낮은 클라우드 시스템의 이용우선순위가 높게 설정될 수 있을 것이다. 다만, 단순히 장애발생확률과 같은 장애발생 가능성만을 이용할 수도 있으나, 현재의 각 클라우드 시스템의 이용정도, 부하율, 요금제 등을 고려하여 이용우선순위를 선정한다.
가상 클라우드 서버(50)는 접속된 고개에게 가상의 단일 클라우드 서비스를 제공함에 있어 선정된 이용우선순위를 기반으로 사용할 클라우드 시스템을 선택하여 운영한다(S340).
본 실시예에 따르면, 각 클라우드 시스템(10)에 대한 장애를 예측함으로써, 미리 장애 발생에 대비하여 해당 클라우드 시스템의 이용을 최소화함으로써 그 피해를 최소화하여 고객에게 안정된 클라우드 서비스를 제공할 수 있다.
이하에서는 장애발생확률이 높은 클라우드 시스템이 존재하는 경우의 처리과정에 대하 상세히 설명하기로 한다.
도 4는 본 발명의 일 실시예에 따른 가상 클라우드 서버(50)에서 수행되는 장애대응 이중화 서비스 과정을 도시한 흐름도이다.
도 4를 참조하면, 가상 클라우드 서버(50)는 각 클라우드 시스템의 장애예측정보를 확인하고(S410), 장애발생확률이 미리 설정된 임계값을 초과하는 것이 존재하는지를 판단한다(S420).
임의의 클라우드 시스템의 장애발생확률이 임계값을 초과하는 경우, 해당 클라우드 시스템(이하 이중화대상 클라우드 시스템이라 칭함)에서 제공하는 서비스는 타 클라우드 시스템을 이용한 이중화를 수행한다(S430). 다시 말해, 제1 클라우드 시스템이 이중화대상 클라우드 시스템인 경우, 타 클라우드 시스템(예를 들어 제2 클라우드 시스템)을 이용하여 동일한 서비스를 수행하는 것이다. 즉, 장애에 즉각 대응하기 위해 동일한 서비스를 두개의 클라우드 시스템을 이용하여 이중화는 것이며, 이때 그 중 하나인 이중화대상 클라우드 시스템에 의한 데이터만을 클라이언트로 제공한다.
여기서, 제2 클라우드 시스템을 이용한 서비스에 따른 클라이언트에게 제공되는 데이터는 다른 저장공간에 저장하거나 또는 이중화대상 클라우드 시스템에 대응된 인공지능모듈로 제공한다.
일례에 따르면, 이중화를 수행함에 따라 두개의 클라우드 시스템을 이용하게 되므로, 이중으로 비용이 발생될 수 있으므로 이에 대해 클라이언트에게 안내할 수 있으며, 또한 이중화 기간을 효율적으로 선정함이 필요하다.
이를 위해, 가상 클라우드 서버(50)는 장애발생확률을 포함한 장애예측정보에 따라 이중화를 수행하는 기간을 결정한다. 또한 클라이언트로 장애예측정보를 안내하여 이중화를 수행하는 기간을 선택하도록 할 수도 있다.
그리고, 가상 클라우드 서버(50)는 각 클라우드 시스템의 장애발생확률과 현재 이용률을 기반으로 이중화를 위한 타 클라우드 시스템을 선택한다. 예를 들어 장애발생확률이 낮고 이용률이 적은 클라우드 시스템이 선택될 수 있을 것이다.
이와 달리 장애발생확률이 임계값을 초과하는 것이 없다면, 정상적으로 이용우선순위를 선정하여 활용한다(S440).
도 5 및 도 6은 본 발명의 각 실시예에 따른 이중화 서비스시의 모니터링 방식을 도시한 예시도들이고, 도 7은 본 발명의 일 실시예에 따른 모니터링 정보를 활용한 이중화 유지 여부 확인 과정을 도시한 흐름도이다.
도면에는 도시되지 않았으나 클라이언트 단말은 클라우드 컴퓨팅 서비스를 이용하는 이용자의 단말장치로서, 개인PC뿐 아니라, 스마트폰, 태블릿PC 등 통신망을 통한 통신수단을 구비한 컴퓨팅 장치일 수 있다. 클라이언트 단말 및 클라우드 시스템에는 클라우드 서비스에 따른 모니터링을 수행하여 모니터링 정보를 생성하는 에이전트가 설치될 수 있다. 클라우드 시스템(30)에 설치된 에이전트인 서버에이전트는 가상머신(VM)의 운용체제(OS: Operating System) 또는 가상머신에서 운용되는 애플리케이션(application)의 운용현황(이용한 클라이언트 단말정보, 애플리케이션 이용정보 등) 또는 성능 정보(예를 들어 가상 서버의 CPU, Memory, Disk, Network 상황 등)를 모니터링하여 정보를 생성한다. 클라이언트 단말에 설치된 클라이언트에이전트는 가상머신으로부터 제공받는 클라우드 컴퓨팅 서비스를 모니터링하여 가상머신 정보(예를 들어 일련번호 등), 애플리케이션 이용정보 등의 모니터링 정보를 생성한다.
따라서, 가상 클라우드 서버(50)는 각 에이전트로부터 모니터링 정보를 수신함으로써, 정상적으로 서비스가 되고 있는지를 모니터링할 수 있다.
먼저 일례에 따른 도 5를 참조하면, 가상 클라우드 서버(50)는 이중화에 따른 타 클라우드 시스템(10-2)으로부터의 클라이언트 데이터는 대응된 인공지능모듈(21-2)로 제공하고, 주기적으로 인공지능모듈(21-2)의 모니터링정보와 이중화대상인 클라우드 시스템(10-1)의 모니터링정보를 수집하여 서로 비교함으로써 서비스 제공 정상 여부를 확인한다.
즉, 제1 클라우드 시스템과 제2 클라우드 시스템이 이중화 서비스로 동일한 서비스를 수행하고 있으므로, 제1 클라우드 시스템(10-1)으로부터의 제1 모니터링정보와, 제2 클라우드 시스템(10-2)에 의한 클라이언트 데이터를 수신하는 제2 인공지능모듈(21-2)의 제2 모니터링정보를 비교함으로써 두 클라우드 시스템의 정상서비스 여부를 동시에 확인할 수 있다.
그리고 도 6을 참조하면, 이러한 이중화가 미리 설정된 기간 이상이 수행되는 경우, 타 클라이언트 시스템(10-2)으로부터의 모니터링정보(제4 모니터링정보)와 이중화대상 클라우드 시스템(10-1)으로부터 데이터를 수신하는 클라이언트 단말로부터의 모니터링정보(제3 모니터링정보)를 수집하여 서로 비교하여 정상 서비스 여부를 더 확인한다.
그리고, 도 7을 참조하면, 인공지능모듈로부터의 제2모니터링정보와 클라이언트로부터의 제3모니터링정보를 이용하여 각 클라이언트 시스템에서의 처리속도 등의 환경을 분석한다(S710).
분석결과에 따라 이중화대상 클라우드 시스템과 이중화를 수행하는 타 클라우드 시스템의 환경을 비교한다(S720). 예를 들어, 제2모니터링정보에 의한 데이터 수신시각에 비해 제3모니터링정보에 의한 데이터 수신시각이 너무 늦다면, 이중화대상 클라우드 시스템에서의 처리속도가 늦은 것으로 판단될 수 있다.
비교 결과에 따라 이중화의 유지 여부를 결정한다(S730). 예를 들어, 처리속도 등이 유사하다면 이중화를 중단하고, 처리 속도의 차이가 임계값 이상인 경우 이중화를 수행하거나 또는 이중화대상 클라우드 시스템을 이용한 서비스 자체를 중단시킬 수도 있다.
상술한 본 발명에 따른 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터 시스템에 의하여 해독될 수 있는 데이터가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
또한, 상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
10 : 클라우드 시스템
20 : 인공지능서버
21 : 인공지능모듈
30 : 빅데이터서버
50 : 가상 클라우드 서버
20 : 인공지능서버
21 : 인공지능모듈
30 : 빅데이터서버
50 : 가상 클라우드 서버
Claims (12)
- 복수개의 클라우드 시스템들 각각의 장애이력을 포함하는 운영이력을 저장하기 위한 빅데이터 서버;
상기 운영이력에 대한 빅데이터 분석을 기반으로 각 클라우드 시스템의 장애를 예측하는 인공지능모듈; 및
상기 클라우드 시스템들의 자원을 이용한 가상화 단일 클라우드 서비스를 제공하되, 상기 인공지능모듈들에 의한 장애예측정보를 기반으로 선정한 이용우선순위를 이용하여 클라우드 시스템을 선택운영하는 가상 클라우드 서버를 포함하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
- 청구항 1에 있어서,
상기 인공지능모듈은 대상 클라우드 시스템이 설치된 지역에 대한 뉴스정보와 날씨정보를 탐색하여 장애예측에 더 활용하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
- 청구항 1에 있어서
상기 가상 클라우드 서버는
장애예측정보에 따른 장애발생확률이 임계값 이상인 클라우드 시스템을 이용한 서비스에 대해서는 타 클라우드 시스템을 이용한 동일 서비스를 이중화하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
- 청구항 3에 있어서,
상기 가상 클라우드 서버는,
상기 장애발생확률을 포함한 상기 장애예측정보에 따라 상기 이중화를 수행하는 기간을 결정하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
- 청구항 3에 있어서,
상기 가상 클라우드 서버는,
장애발생확률과 이용률을 기반으로 상기 이중화를 위한 타 클라우드 시스템을 선택하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
- 청구항 3에 있어서,
상기 가상 클라우드 서버는,
상기 이중화에 따른 상기 타 클라우드 시스템으로부터의 클라이언트 데이터는 대응된 인공지능모듈로 제공하고, 주기적으로 상기 인공지능모듈의 모니터링정보와 상기 이중화 수행 대상인 클라우드 시스템의 모니터링정보를 수집하여 서로 비교함으로써 서비스 제공 정상 여부를 확인하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
- 청구항 6에 있어서,
상기 이중화가 일정 시간 수행되는 경우,
상기 타 클라이언트 시스템으로부터의 모니터링정보와 상기 이중화 수행 대상인 클라우드 시스템으로부터 데이터를 수신하는 클라이언트로부터의 모니터링정보를 수집하여 서로 비교하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
- 청구항 7에 있어서,
상기 인공지능모듈로부터의 모니터링정보와 상기 클라이언트로부터의 모니터링정보를 이용하여 각 클라이언트 시스템에서의 처리속도를 비교하고, 비교 결과에 따라 상기 이중화의 유지 여부를 결정하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 시스템.
- 복수개의 클라우드서비스 제공장치들의 자원을 이용한 가상화 단일 클라우드 서비스를 제공하는 가상 클라우드 서버에서 수행되는 멀티클라우드 서비스 방법에 있어서,
클라우드 시스템들 각각의 장애이력을 포함하는 운영이력에 대한 빅데이터 분석을 기반으로 각 클라우드 시스템의 장애를 예측한 인공지능모듈로부터 장애예측정보를 수신하는 단계;
상기 장애예측정보를 기반으로 각 클라우드 시스템의 이용우선순위를 선정하는 단계; 및
상기 이용우선순위에 따른 클라우드 시스템을 선택하여 가상화 단일 클라우드 서비스를 제공하는 단계를 포함하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법.
- 청구항 9에 있어서
장애예측정보에 따른 장애발생확률이 임계값 이상인 클라우드 시스템을 이용한 서비스에 대해서는 타 클라우드 시스템을 이용한 동일 서비스를 이중화하는 단계를 더 포함하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법.
- 청구항 10에 있어서,
상기 이중화에 따른 상기 타 클라우드 시스템으로부터의 클라이언트 데이터는 대응된 인공지능모듈로 제공하고, 주기적으로 상기 인공지능모듈의 모니터링정보와 상기 이중화를 수행하는 클라우드 시스템의 모니터링정보를 수집하여 서로 비교함으로써 서비스 제공 정상 여부를 확인하는 단계를 더 포함하는, 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법.
- 제 9항의 방법을 수행하기 위한 컴퓨터에 의해 실행되는 애플리케이션이나 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210101345A KR102614848B1 (ko) | 2021-08-02 | 2021-08-02 | 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210101345A KR102614848B1 (ko) | 2021-08-02 | 2021-08-02 | 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230020052A true KR20230020052A (ko) | 2023-02-10 |
KR102614848B1 KR102614848B1 (ko) | 2023-12-20 |
Family
ID=85223486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210101345A KR102614848B1 (ko) | 2021-08-02 | 2021-08-02 | 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102614848B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117041072A (zh) * | 2023-06-25 | 2023-11-10 | 兴容(上海)信息技术股份有限公司 | 一种基于人工智能的多模态数据管理系统及方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101506250B1 (ko) * | 2014-12-10 | 2015-03-27 | (주)한위드정보기술 | 가상화 서비스 제공을 위한 가상화 서버 접속 이중화 시스템 |
KR20190002280A (ko) * | 2017-06-29 | 2019-01-08 | 주식회사 케이티 | 5g 분산 클라우드 시스템의 빅 데이터를 이용하여 장애를 관리하는 장치 및 방법 |
KR20190077696A (ko) * | 2017-12-26 | 2019-07-04 | 경희대학교 산학협력단 | 클라우드 서비스 제공 시스템, 컴퓨팅 장치, 클라우드 서비스 제공 방법, 상기 방법을 실행하기 위한 프로그램 및 상기 프로그램이 기록된 기록 매체 |
KR101959055B1 (ko) * | 2017-10-02 | 2019-07-04 | 광주과학기술원 | 멀티 가상 머신의 클라우드간 마이그레이션 |
KR101998564B1 (ko) | 2018-07-19 | 2019-07-10 | 나무기술 주식회사 | 클라우드 플랫폼에서의 멀티 클러스터 프로비저닝 및 관리 방법 |
KR102231359B1 (ko) * | 2019-11-04 | 2021-03-24 | 주식회사 이노그리드 | 고성능 클라우드 서비스를 위한 단일 가상화 시스템 및 프로세스 스케줄링 방법 |
KR20210056655A (ko) * | 2019-11-11 | 2021-05-20 | 한국전자기술연구원 | 클라우드 엣지 환경에서 예측 기반 마이그레이션 후보 및 대상 선정 방법 |
-
2021
- 2021-08-02 KR KR1020210101345A patent/KR102614848B1/ko active IP Right Grant
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101506250B1 (ko) * | 2014-12-10 | 2015-03-27 | (주)한위드정보기술 | 가상화 서비스 제공을 위한 가상화 서버 접속 이중화 시스템 |
KR20190002280A (ko) * | 2017-06-29 | 2019-01-08 | 주식회사 케이티 | 5g 분산 클라우드 시스템의 빅 데이터를 이용하여 장애를 관리하는 장치 및 방법 |
KR101959055B1 (ko) * | 2017-10-02 | 2019-07-04 | 광주과학기술원 | 멀티 가상 머신의 클라우드간 마이그레이션 |
KR20190077696A (ko) * | 2017-12-26 | 2019-07-04 | 경희대학교 산학협력단 | 클라우드 서비스 제공 시스템, 컴퓨팅 장치, 클라우드 서비스 제공 방법, 상기 방법을 실행하기 위한 프로그램 및 상기 프로그램이 기록된 기록 매체 |
KR101998564B1 (ko) | 2018-07-19 | 2019-07-10 | 나무기술 주식회사 | 클라우드 플랫폼에서의 멀티 클러스터 프로비저닝 및 관리 방법 |
KR102231359B1 (ko) * | 2019-11-04 | 2021-03-24 | 주식회사 이노그리드 | 고성능 클라우드 서비스를 위한 단일 가상화 시스템 및 프로세스 스케줄링 방법 |
KR20210056655A (ko) * | 2019-11-11 | 2021-05-20 | 한국전자기술연구원 | 클라우드 엣지 환경에서 예측 기반 마이그레이션 후보 및 대상 선정 방법 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117041072A (zh) * | 2023-06-25 | 2023-11-10 | 兴容(上海)信息技术股份有限公司 | 一种基于人工智能的多模态数据管理系统及方法 |
CN117041072B (zh) * | 2023-06-25 | 2024-02-13 | 兴容(上海)信息技术股份有限公司 | 一种基于人工智能的多模态数据管理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
KR102614848B1 (ko) | 2023-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10048996B1 (en) | Predicting infrastructure failures in a data center for hosted service mitigation actions | |
US10838803B2 (en) | Resource provisioning and replacement according to a resource failure analysis in disaggregated data centers | |
US11050637B2 (en) | Resource lifecycle optimization in disaggregated data centers | |
US11290360B2 (en) | Analyzing resource placement fragmentation for capacity planning | |
US10375169B1 (en) | System and method for automatically triggering the live migration of cloud services and automatically performing the triggered migration | |
US10270668B1 (en) | Identifying correlated events in a distributed system according to operational metrics | |
US9246996B1 (en) | Data volume placement techniques | |
US9503517B1 (en) | Data volume placement techniques | |
US10754720B2 (en) | Health check diagnostics of resources by instantiating workloads in disaggregated data centers | |
US9823840B1 (en) | Data volume placement techniques | |
US9898359B2 (en) | Predictive disaster recovery system | |
US9575548B2 (en) | Apparatus for migrating virtual machines to another physical server, and method thereof | |
EP2284775A2 (en) | Management of information technology risk using virtual infrastructures | |
US9804993B1 (en) | Data volume placement techniques | |
US11188408B2 (en) | Preemptive resource replacement according to failure pattern analysis in disaggregated data centers | |
US10761915B2 (en) | Preemptive deep diagnostics and health checking of resources in disaggregated data centers | |
US10255124B1 (en) | Determining abnormal conditions of host state from log files through Markov modeling | |
US10831580B2 (en) | Diagnostic health checking and replacement of resources in disaggregated data centers | |
US10154091B1 (en) | Deploying infrastructure units according to resource hosting constraints | |
US11644876B2 (en) | Data analytics for mitigation of data center thermal issues | |
US9225608B1 (en) | Evaluating configuration changes based on aggregate activity level | |
KR102614848B1 (ko) | 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템 | |
US10324779B1 (en) | Using unsupervised learning to monitor changes in fleet behavior | |
Meza et al. | Defcon: Preventing Overload with Graceful Feature Degradation | |
US11983578B2 (en) | Provisioning a computing subsystem including disaggregated hardware resources that comply with a power domain requirement for a workload |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |