KR102613655B1 - 이상징후 선별대응에 기반한 클라우드서버 관리 방법 및 이를 구현하는 클라우드서버 관리 시스템 - Google Patents
이상징후 선별대응에 기반한 클라우드서버 관리 방법 및 이를 구현하는 클라우드서버 관리 시스템 Download PDFInfo
- Publication number
- KR102613655B1 KR102613655B1 KR1020230042543A KR20230042543A KR102613655B1 KR 102613655 B1 KR102613655 B1 KR 102613655B1 KR 1020230042543 A KR1020230042543 A KR 1020230042543A KR 20230042543 A KR20230042543 A KR 20230042543A KR 102613655 B1 KR102613655 B1 KR 102613655B1
- Authority
- KR
- South Korea
- Prior art keywords
- virtual machine
- correlation
- physical
- virtual machines
- module
- Prior art date
Links
- 238000007726 management method Methods 0.000 title claims description 94
- 230000004044 response Effects 0.000 title description 3
- 238000004364 calculation method Methods 0.000 claims abstract description 98
- 238000000034 method Methods 0.000 claims description 45
- 238000004891 communication Methods 0.000 claims description 18
- 230000005856 abnormality Effects 0.000 claims description 15
- 238000007689 inspection Methods 0.000 claims description 13
- 238000010586 diagram Methods 0.000 claims description 11
- 238000012935 Averaging Methods 0.000 claims description 8
- 238000010187 selection method Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 description 15
- 238000013508 migration Methods 0.000 description 15
- 230000005012 migration Effects 0.000 description 15
- 238000012544 monitoring process Methods 0.000 description 11
- 230000002159 abnormal effect Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 208000024891 symptom Diseases 0.000 description 8
- 238000012546 transfer Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000005484 gravity Effects 0.000 description 4
- 238000013341 scale-up Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- QVFWZNCVPCJQOP-UHFFFAOYSA-N chloralodol Chemical compound CC(O)(C)CC(C)OC(O)C(Cl)(Cl)Cl QVFWZNCVPCJQOP-UHFFFAOYSA-N 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/301—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is a virtual computing platform, e.g. logically partitioned systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1021—Server selection for load balancing based on client or server locations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45591—Monitoring or debugging support
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Debugging And Monitoring (AREA)
Abstract
본 발명의 일 실시예에 따른 클라우드서버 관리 시스템은, 가상머신이 물리서버 상에서 가동되면서 발생되는 정보인 동작정보를 수집하는 수집모듈; 상기 동작정보를 활용하여 미리 정해진 연관도 산출 방법을 통해 상기 가상머신들 간의 연관도인 종합연관도를 산출하는 연관도 산출모듈; 및 특정 가상머신에 문제가 발생되었을 경우, 상기 종합연관도를 기초로 상기 특정 가상머신 이외의 가상머신 중에서 점검이 필요한 상기 가상머신을 선별하는 관리모듈;을 포함할 수 있다.
Description
본 발명은 가상머신의 장애 복구, 배치, 관리를 위해 클라우드 서비스를 제공하는 클라우드 서버를 관리하는 클라우드서버 관리 방법 및 이를 구현하는 클라우드서버 관리 시스템에 대한 것이다.
인터넷 네트워크의 기술력이 증가되고, 재택 근무와 같이 컴퓨터 업무의 공간적 제약이 없어짐에 따라, 최근 클라우드 환경은 급격하게 성장하고 있다. 클라우드 서비스를 제공하는 사업자 입장에서는 클라우드 서비스를 중단없이 제공하기 위해서는 물리서버 상의 가상머신을 어떻게 관리할지가 매우 중요한 사항이다.
현재에는 안정적인 클라우드 서비스를 제공하기 위해서, 가상머신에서 발생하는 부하를 기초로 클라우드서버인 물리서버 상에 가상머신을 적절하게 배치하고, 동일한 기능의 가상머신을 여러 개 만들어서 부하분산을 실시하고 있다. 다만, 기존의 방법들은 가상머신들 간의 영향력을 제대로 반영하지 않아, 최적배치 및 효율 서버 운영을 위해 서버 관리자가 추가적으로 고려할 사항들이 늘게되어 인력과 시간이 낭비되고 소요되는 문제가 발생되었다.
또한, 현재에는 클라우드 시스템이 복잡해짐에 따라 각 가상머신들은 서로 직, 간접적으로 연관되어 있어 한 가상머신에서 문제가 발생할 경우 그 문제는 다른 가상머신에게 영향을 미치는 일이 빈번하다. 이로 인해, 연관된 가상머신들을 종합적으로 살펴볼 수 있는 기술들이 개발되었다. 다만, 최근 확장된 클라우드 생태계에서는 수십, 수백개의 가상머신들이 연관되기 때문에 이를 전부 확인하기에는 현실적으로 시간이 부족한 문제가 발생되었다.
본 발명은 상술한 문제점을 해결하기 위한 것으로, 가상머신들 간의 연관성을 고려한 가상머신을 관리, 운영하는 클라우드서버 관리 방법 및 이를 구현하는 클라우드서버 관리 시스템을 제공하고자 한다.
본 발명의 일 실시예에 따른 클라우드서버 관리 시스템은, 가상머신이 물리서버 상에서 가동되면서 발생되는 정보인 동작정보를 수집하는 수집모듈; 상기 동작정보를 활용하여 미리 정해진 연관도 산출 방법을 통해 상기 가상머신들 간의 연관도인 종합연관도를 산출하는 연관도 산출모듈; 및 특정 가상머신에 문제가 발생되었을 경우, 상기 종합연관도를 기초로 상기 특정 가상머신 이외의 가상머신 중에서 점검이 필요한 상기 가상머신을 선별하는 관리모듈;을 포함할 수 있다.
또한, 상기 미리 정해진 연관도 산출 방법은, 상기 가상머신들 간의 물리적 관련성을 나타내는 물리적연관도를 활용하여 상기 종합연관도를 산출하는 방법일 수 있다.
또한, 상기 연관도 산출모듈은, 물리적 거리가 가까워울수록 상기 물리적연관도를 더 높게 산출할 수 있다.
또한, 상기 미리 정해진 연관도 산출 방법은, 제1 산출 방법을 통해 상기 가상머신들 간의 논리적 관련성을 나타내는 값인 논리연관도를 산출하고, 제2 산출 방법을 통해 상기 가상머신들 간의 물리적 관련성을 나타내는 물리연관도를 산출하며, 상기 논리연관도와 상기 물리연관도를 활용하여 상기 종합연관도를 산출하는 방법일 수 있다.
또한, 상기 제1 산출방법은, 상기 가상머신의 자체 동작과 관련된 정보를 기초로 연관도를 산출하는 방법인 제1-1 산출방법 또는 상기 가상머신들 간의 통신과 관련된 정보들을 기초로 연관도를 산출하는 방법인 제1-2 산출방법을 구비할 수 있다.
또한, 상기 미리 정해진 연관도 산출 방법은, 상기 논리연관도와 상기 물리연관도를 가중치를 다르게 평균내어 상기 종합연관도를 산출하며, 상기 특정 가상머신에 발생된 이상징후의 종류에 따라 가중치를 변경하는 방법일 수 있다.
또한, 상기 연관도 산출모듈은, 상기 특정 가상머신에 문제가 발생되어 점검이 필요한 상기 가상머신에 대해서 점검이 필요한 사항이 보완되었으나, 상기 특정 가상머신의 문제가 해결되지 않을 경우, 점검이 필요하다고 판단된 상기 가상머신에 대한 상기 종합연관도를 수정할 수 있다.
또한, 상기 종합연관도는, 상기 가상머신들 간의 논리적 관련성을 나타내는 값인 논리연관도와 상기 가상머신들 간의 물리적 관련성을 나타내는 물리연관도에 의해 산출되며, 상기 연관도 산출모듈은, 상기 특정 가상머신에 발생된 이상징후의 종류에 따라 상기 논리연관도와 상기 물리연관도를 비중이 다르게 수정할 수 있다.
본 발명의 일 실시예에 따른 클라우드서버 관리 방법은, 클라우드서버 관리 시스템에 의해 구현되며, 물리서버에서 동작되는 복수개의 가상머신을 관리하는 클라우드서버 관리 방법에 있어서, 수집모듈에 의해, 상기 가상머신이 상기 물리서버 상에서 가동되면서 발생되는 정보인 동작정보가 수집되는 단계; 연관도 산출모듈에 의해, 상기 동작정보가 활용되어, 미리 정해진 연관도 산출 방법을 통해 상기 가상머신들 간의 연관도인 종합연관도가 산출되는 단계; 및 관리 모듈에 의해, 특정 가상머신에 문제가 발생되었을 경우, 상기 종합연관도를 기초로 상기 특정 가상머신 이외의 가상머신 중에서 점검이 필요한 가상머신이 산출단계;를 포함할 수 있다.
또한, 상기 관리모듈에 의해, 미리 정해진 선정방법에 의해 점검이 필요한 상기 가상머신의 우선순위가 산출되는 단계; 및 상기 관리모듈에 의해, 상기 가상머신에 발생된 문제의 시급한 정도와 관련된 문제위험도가 산출되는 단계;를 더 포함하고, 상기 미리 정해진 선정방법은, 상기 종합연관도와 상기 문제위험도를 모두 반영하여 상기 가상머신의 우선순위를 산출하는 방법일 수 있다.
본 발명에 따른 클라우드서버 관리 방법 및 이를 구현하는 클라우드서버 관리 시스템은 클라우드 서비스의 안정성을 극대화할 수 있다.
또한, 클라우드 서비스 관리를 위한 인력을 최소할 수 있다.
또한, 클라우드 서비스 관리를 위한 시간 소요를 최소화할 수 있다.
다만, 본 발명의 효과가 상술한 효과들로 제한되는 것은 아니며, 언급되지 아니한 효과들은 본 명세서 및 첨부된 도면으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확히 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 클라우드서버 관리 시스템의 관계도
도 2는 본 발명의 일 실시예에 따른 클라우드서버 관리 시스템의 구성도
도 3은 본 발명의 일 실시예에 따른 클라우드서버 관리 시스템의 모듈 간의 프로세스를 표현한 도면
도 4는 본 발명의 일 실시예에 따른 클라우드서버 관리 방법 중 이상징후 대응 방법에 대한 순서도
도 5은 본 발명의 일 실시예에 따른 클라우드서버 관리 방법 중 우선순위에 해당되는 가상머신들을 표시하는 화상 예시
도 6은 본 발명의 일 실시예에 따른 가상머신 관리 시스템이 구현하는 마이그레이션의 기준이 되는 미리 정해진 배치 기준을 설명하기 위한 표
도 7은 본 발명의 일 실시예에 따른 클라우드서버 관리 방법 중 마이그레이션 방법에 대한 순서도
도 2는 본 발명의 일 실시예에 따른 클라우드서버 관리 시스템의 구성도
도 3은 본 발명의 일 실시예에 따른 클라우드서버 관리 시스템의 모듈 간의 프로세스를 표현한 도면
도 4는 본 발명의 일 실시예에 따른 클라우드서버 관리 방법 중 이상징후 대응 방법에 대한 순서도
도 5은 본 발명의 일 실시예에 따른 클라우드서버 관리 방법 중 우선순위에 해당되는 가상머신들을 표시하는 화상 예시
도 6은 본 발명의 일 실시예에 따른 가상머신 관리 시스템이 구현하는 마이그레이션의 기준이 되는 미리 정해진 배치 기준을 설명하기 위한 표
도 7은 본 발명의 일 실시예에 따른 클라우드서버 관리 방법 중 마이그레이션 방법에 대한 순서도
이하에서는 도면을 참조하여 본 발명의 구체적인 실시예를 상세하게 설명한다. 다만, 본 발명의 사상은 제시되는 실시예에 제한되지 아니하고, 본 발명의 사상을 이해하는 당업자는 동일한 사상의 범위 내에서 다른 구성요소를 추가, 변경, 삭제 등을 통하여, 퇴보적인 다른 발명이나 본 발명 사상의 범위 내에 포함되는 다른 실시예를 용이하게 제안할 수 있을 것이나, 이 또한 본원 발명 사상 범위 내에 포함된다고 할 것이다.
또한, 각 실시예의 도면에 나타나는 동일한 사상의 범위 내의 기능이 동일한 구성요소는 동일한 참조부호를 사용하여 설명한다.
도 1은 본 발명의 일 실시예에 따른 클라우드서버 관리 시스템의 관계도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 클라우드서버 관리 시스템은 클라우드 서비스를 제공하는 클라우드서버인 물리서버에 설치된 가상머신을 운영, 보수, 이전 등을 수행하는 시스템일 수 있다.
구체적인 일례로, 클라우드서버 관리 시스템은 가상머신에 문제가 발생하였는지 여부를 모니터링할 수 있고, 가상머신에 문제가 발생하였을 경우 가상머신의 스케일을 업/다운하는 등의 방안으로 문제를 해결할 수 있다. 또한, 클라우드서버 관리 시스템은 물리서버 상의 가상머신을 자원활용 측면에서 최적으로 배치할 수 있다.
클라우드서버 관리 시스템은 물리서버(200)와 유/무선 네트워크로 연결되어, 클라우드서버 관리 시스템은 물리서버(200)에서 가상머신이 가동되면서 발생되는 모든 정보를 수신할 수 있다.
또한, 클라우드 사용자 혹은 관리자(300)는 물리서버(200)에 설치된 가상머신을 이용하여 클라우드를 서비스를 제공받을 수 있다.
또한, 클라우드 사용자 혹은 관리자(300)는 클라우드서버 관리 시스템과 네트워크 연결되어 클라우드 서비스가 제공되는데 필요하고 발생한 정보들을 제공받을 수 있다.
본 발명에서의 네트워크라 함은 유선 공중망, 무선 이동 통신망, 또는 휴대 인터넷 등과 통합된 코어 망일 수도 있고, TCP/IP 프로토콜 및 그 상위 계층에 존재하는 여러 서비스, 즉 HTTP(Hyper Text Transfer Protocol), HTTPS(Hyper Text Transfer Protocol Secure), Telnet, FTP(File Transfer Protocol), DNS(Domain Name System), SMTP(Simple Mail Transfer Protocol) 등을 제공하는 전 세계적인 개방형 컴퓨터 네트워크 구조를 의미할 수 있으며, 이러한 예에 한정하지 않고 다양한 형태로 데이터를 송수신할 수 있는 데이터 통신망을 포괄적으로 의미하는 것이다.
본 발명에서의 물리서버는 서버의 서버 환경을 수행하기 위한 다른 구성들이 포함될 수도 있다. 서버는 임의의 형태의 장치는 모두 포함할 수 있다.
일례로, 서버는 디지털 기기로서, 랩탑 컴퓨터, 노트북 컴퓨터, 데스크톱 컴퓨터, 웹 패드, 이동 전화기와 같이 프로세서를 탑재하고 메모리를 구비한 연산 능력을 갖춘 디지털 기기일 수 있다.
일례로, 서버는 웹 서버일 수 있다. 다만, 이에 한정하지 않고, 서버의 종류는 통상의 기술자에게 자명한 수준에서 다양하게 변경 가능하다.
클라우드 서비스를 제공받는 자는 클라우드서버 관리 시스템으로부터 자신이 신청한 클라우드 서비스(가상머신)가 어떻게 운영되고 관리되고 있는지, 활용되고 있는 자원이 얼마인지 등을 제공받을 수 있다.
또한, 클라우드 서비스를 제공받는 자는 클라우드서버 관리 시스템으로부터 가상머신이 비 이상적으로 동작되고 있는지 여부 및 오류 발생시에 알람 등과 같이 실시간 장애 모니터링 서비스를 제공받을 수 있다.
도 2는 본 발명의 일 실시예에 따른 클라우드서버 관리 시스템의 구성도이고, 도 3은 본 발명의 일 실시예에 따른 클라우드서버 관리 시스템의 모듈 간의 프로세스를 표현한 도면이다.
도 2 및 도 3을 참조하면, 본 발명의 일 실시예에 클라우드서버 관리 시스템(100)은, 물리서버에서 동작되는 복수개의 가상머신을 관리하는 클라우드서버 관리 시스템(100)에 있어서, 상기 가상머신이 상기 물리서버 상에서 가동되면서 발생되는 정보인 동작정보를 수집하는 수집모듈(110), 상기 동작정보를 활용하여 미리 정해진 연관도 산출 방법을 통해 상기 가상머신들 간의 연관도인 종합연관도를 산출하는 연관도 산출모듈(120) 및 특정 가상머신에 문제가 발생되었을 경우, 상기 종합연관도를 기초로 상기 특정 가상머신 이외의 가상머신 중에서 점검이 필요한 상기 가상머신과 점검이 필요한 사항을 산출하는 관리모듈(140)을 포함할 수 있다.
또한, 클라우드서버 관리 시스템(100)은 상기 연관도 산출모듈(120)에 의해 산출된 연관도를 기초로 상기 가상머신들을 복수의 그룹들로 그룹핑하는 그룹핑모듈(130)을 더 포함할 수 있다.
또한, 클라우드서버 관리 시스템(100)은 상기 가상머신을 미리 정해진 배치 방법으로 상기 물리서버 상에 배치하는 마이그레이션 모듈(150), 클라우드서버 관리 방법을 운영하는데 필요한 모든 정보가 저장되어 있는 저장모듈(160) 및 클라우드서버 관리 방법을 통해 변경된 가상머신의 배치, 가상머신의 사용상태 등을 수요자 혹은 관리자가 확인할 수 있도록 인터페이스를 산출하고 수요자 혹은 관리자에게 전송하는 인터페이스모듈(170)을 더 포함할 수 있다.
또한, 상기 클라우드서버 관리 시스템(100)은 관리자(사용자)가 가상머신들을 제어하고 통제할 수 있는 입력 신호를 전달받고 다른 클라우드서버 관리 시스템(100)의 모듈들에게 전달하는 입력모듈(180)을 더 포함할 수 있다.
수집모듈(110)은 가상머신이 동작되면서 발생되는 동작정보들을 수집할 수 있다.
일례로, 동작정보는 가상머신의 CPU 사용량, MEMORY 점유율, Storage 처리량을 포함할 수 있다.
일례로, 동작정보는 가상머신들 간의 통신에 관한 정보로서, 지연율, 전송 byte량, 단위시간단 전송회수에 대한 정보들을 더 포함할 수 있다.
다만, 이에 본 발명이 한정되는 것은 아니고, 나열한 것 이외의 정보들을 모두 포함할 수 있다.
수집모듈(110)은 통신 모듈로서, 물리서버와 네트워크 연결되어 정보들을 수집할 수 있다.
일례로, 통신 모듈은 셀룰러 모듈, WiFi 모듈, 블루투스 모듈, GNSS 모듈, NFC 모듈, RF 모듈, 5G 모듈, LTE 모듈, NB-IOT 모듈 및/또는 LoRa 모듈을 포함할 수 있다.
다만, 이에 한정하지 않고, 통신 모듈이 포함하는 모듈은 통상의 기술자에게 자명한 수준에서 다양하게 변형 가능하다.
연관도 산출모듈(120)은 미리 정해진 연관도 산출 방법을 이용하여 가상머신들 간의 연관도를 산출할 수 있다.
미리 정해진 연관도 산출 방법은 상기 가상머신들 간의 논리적 관련성을 나타내는 값인 논리연관도를 산출하는 제1 산출방법 및 상기 가상머신들 간의 물리적 관련성을 나타내는 제2 산출방법을 구비할 수 있다.
제1 산출방법은 상기 가상머신의 자체 동작과 관련된 정보를 기초로 연관도를 산출하는 방법인 제1-1 산출방법 또는 상기 가상머신들 간의 통신과 관련된 정보들을 기초로 연관도를 산출하는 방법인 제1-2 산출방법을 구비할 수 있다.
연관도 산출모듈(120)은 제1-1 산출방법만을 이용하여 논리연관도를 산출할 수도 있고, 제1-2 산출방법만을 이용하여 논리연관도를 산출하수도 있으며, 제1-1 산출방법과 제1-2 산출방법을 모두 이용하여 논리연관도를 산출할 수 있다.
이하, 연관도 산출모듈(120)이 제1-1 산출방법과 제1-2 산출방법을 모두 활용하여 가상머신들 간의 논리적 연관도를 산출하는 것을 기준으로 설명하나, 이에 본 발명이 한정되는 것은 아니다.
제1-1 산출방법은 가상머신의 동작에 따른 유사한 정도를 산출하는 방법일 수 있다.
구체적인 일례로서, 가상머신들 간의 CPU 사용량, Memory 점유율, Storage 처리량이 시간에 따라서 변화되는 값들이 서로 유사하며, 피어슨 상관계수가 높을 수록 두 가상머신들 간에 연관도(상관 관계)가 높다고 판단될 수 있다.
연관도 산출모듈(120)은 제1-1 산출방법을 활용하여 모든 가상머신들끼리 연관도를 산출할 수 있으며, 이러한 연관도는 소정 수치 범위로 환산하여 산출할 수 있다.
일례로, 연관도 산출모듈(120)은 0 내지 100의 수치로 제1 임시연관도를 산출할 수 있다.
다만, 이에 한정하지 않고, 소정 수치 범위는 통상의 기술자에게 자명한 수준에서 다양하게 변형 가능하다.
제1-2 산출방법은 가상머신들 간의 통신이 활발하게 이루어지는가를 기준으로 가상머신들 간의 유사한 정도를 산출하는 방법일 수 있다.
구체적인 일례로서, 수집모듈(110)은 가상머신들의 네트워크 메트릭 데이터(통신 지연율, 전송 바이트량, 단위 시간당 전송회수)를 수집하고, 이를 연관도 산출모듈(120)에 전달할 수 있으며, 연관도 산출모듈(120)은 가상머신들 간의 통신 지연율, 전송 바이트량, 단위 시간당 전송횟수 등을 이용하여 가상머신들 간의 유사한 정도를 산출할 수 있다.
가상머신들 간의 통신이 활발하다면, 즉 통신 지연율이 작고, 전송 바이트량이 크며, 단위 시간당 전송횟수가 크다면, 가상머신은 논리적으로 서로 연결되어 있다고 보는 것이 바람직할 수 있어, 연관도가 높게 산출될 수 있다.
연관도 산출모듈(120)은 제1-2 산출방법을 활용하여 모든 가상머신들끼리 연관도를 산출할 수 있으며, 이러한 연관도는 소정 수치 범위로 환산하여 산출할 수 있다.
일례로, 연관도 산출모듈(120)은 0 내지 100의 수치로 제2 임시연관도를 산출할 수 있다.
다만, 이에 한정하지 않고, 소정 수치 범위는 통상의 기술자에게 자명한 수준에서 다양하게 변형 가능하다.
연관도 산출모듈(120)은 상기 제1-1 산출방법 방법을 통해 산출된 제1 임시연관도와 상기 제1-2 산출방법을 통해 산출된 제2 임시연관도를 평균 내어 논리연관도를 산출할 수 있다.
일례로, 동일한 가중치로 평균을 산출할 수 있다.
다만, 이에 한정하지 않고, 연관도 산출모듈(120)은 가중치를 설정하여 제1 임시연관도와 제2 임시연관도의 평균을 내어 연관도를 산출할 수 있다.
일례로, MSA등의 구조로 인해, 서로 독립적이지 않은 가상머신들의 숫자가 제1 비중 이상일 경우, 연관도 산출모듈(120)은 제2 임시연관도를 제1 임시연관도보다 더욱 가중치를 두어 평균을 내어 연관도를 산출할 수 있다.
일례로, 제1 비중은 70%일 수 있다.
다만, 이에 한정하지 않고 상기 제1 비중은 구체적인 수치는 통상의 기술자에게 자명한 수준에서 다양하게 변형 가능하다.
일례로, 서로 독립적이지 않은 가상머신들의 숫자가 제2 비중 이하 일 경우, 연관도 산출모듈(120)은 제1 임시연관도를 제2 임시연관도보다 더욱 가중치를 두어 평균을 내어 연관도를 산출할 수 있다.
일례로, 제2 비중은 30%일 수 있다.
다만, 이에 한정하지 않고 상기 제2 비중은 구체적인 수치는 통상의 기술자에게 자명한 수준에서 다양하게 변형 가능하다.
연관도 산출모듈(120)은 제2 산출방법을 통해 가상머신들 간의 물리적 관련성을 나타내는 물리연관도를 산출할 수 있다.
구체적인 일례로서, 물리연관도는 가상머신이 위치한 물리적 정보들을 기반으로 산출될 수 있다.
이러한, 물리적 정보들을 저장모듈(160)에 저장된 물리서버들의 위치, 가상머신의 물리서버 위치에 의해 연관도 산출모듈(120)에 의해 산출될 수 있다.
물리적 거리가 가까울수록 물리적연관도가 높아질 수 있다.
일례로, 같은 물리서버에 가상머신이 존재한다면 물리적연관도가 클 수 있다.
반대로, 다른 지역의 물리서버에 가상머신이 존재한다면 물리연관도가 작을 수 있다.
연관도 산출모듈(120)은 0 내지 100의 수치로 물리연관도를 산출할 수 있다.
연관도 산출모듈(120)은 논리연관도와 물리연관도를 평균내어 종합연관도를 산출할 수 있다.
다만, 이에 한정하지 않고, 종합연관도의 산출 방법은 통상의 기술자에게 자명한 수준에서 다양하게 변형 가능하다.
일례로, 연관도 산출모듈(120)은 상기 논리연관도와 상기 물리연관도를 가중치를 다르게 평균내어 종합연관도를 산출할 수 있다.
미리 정해진 연관도 산출 방법은 상기 논리연관도와 상기 물리연관도를 가중치를 다르게 평균내어 상기 종합연관도를 산출하며, 상기 특정 가상머신에 발생된 이상징후의 종류에 따라 가중치를 변경하는 방법일 수 있다.
이상징후(오류)의 종류가 가상머신의 논리적 연관성에 더욱 영향을 주는 것일 경우, 논리연관도가 물리연관도보다 더 큰 가중치를 두어 종합연관도가 산출될 수 있다.
반대로, 이상징후(오류)의 종류가 가상머신의 물리적 연관성에 더욱 영향을 주는 것일 경우, 물리연관도가 논리연관도보다 더 큰 가중치를 두어 종합연관도가 산출될 수 있다.
이를 위해, 연관도 산출모듈(120)은 각각의 가상머신들 간의 논리연관도와 물리연관도를 산출한 상태에서, 후술하는 모니터링부(143)로부터 이상징후를 전달받는 경우, 이상징후의 종류를 분류하고, 이상징후의 종류에 따라 미리 정해진 가중치를 반영하여 종합연관도를 산출할 수 있다.
미리 정해진 연관도 산출 방법은 상술한 것과 다르게 제1 산출방법만으로 연관도를 산출하는 방법일 수 있다.
또는, 미리 정해진 연관도 산출 방법은 상술한 것과 다르게 제2 산출방법만으로 연관도를 산출하는 방법일 수 있다.
이하, 미리 정해진 연관도 산출 방법의 변형된 예에 대해서 상술한 내용과 중복되는 한도에서 자세한 설명은 생략될 수 있다.
그룹핑모듈(130)은 논리연관도를 기초로 가상머신들을 복수의 그룹들로 그룹핑할 수 있다.
여기서, 그룹핑모듈(130)은 소정의 논리연관도 이상의 가상머신들을 하나의 그룹으로 그룹핑할 수 있다.
일례로, 그룹핑되기 위한 논리연관도는 60일 수 있으나, 이에 본 발명이 한정되는 것은 아니고 구체적인 수치는 통상의 기술자에게 자명한 수준에서 다양하게 변형 가능하다.
이는, 논리적으로 서로 연관 있는 가상머신들을 통합적으로 관리, 운영하여 관리 효율성을 증대시키기 위함일 수 있다.
관리모듈(140)은 그룹핑된 가상머신들을 통합적으로 관리하는 통합관리부(142), 가상머신이 정상적으로 동작하고 있는지를 실시간으로 모니터링하는 모니터링부(143), 이상징후의 위험도를 산출하고 오류있는 가상머신들 간의 우선순위를 산출하는 순위선정부(141) 및 오류에 대한 해결방안이 적용된 후 가상머신의 문제가 해결되었는지 여부를 모니터링하는 피드백부(144)를 구비할 수 있다.
모니터링부(143)는 가상머신이 정상적으로 동작하고 있는지 여부를 모니터링할 수 있다
모니터링부(143)는 가상머신에게 오류가 발생하였을 경우, 이를 감지하고 가상머신의 오류를 해결할 수 있는 해결방안을 도출할 수 있다.
모니터링부(143)에는 가상머신에서 발생되는 오류에 대한 해결방안을 산출할 수 있는 해결모델이 저장되어 있을 수 있다.
여기서, 해결모델을 딥러닝을 통해 산출될 수 있으며, 이에 대한 자세한 설명은 상술한 내용과 중복되는 한도에서 생략될 수 있다.
가상머신에게 오류가 발생하였을 경우, 모니터링부(143)는 오류를 해결할 수 있는 문제점을 도출하거나 저장모듈(160)로부터 전달받아 해결방안을 결정할 수 있다.
모니터링부(143)는 가상머신에 오류가 발생하였을 경우, 이상징후 현상과 그에 대한 해결방안 및 가상머신 정보를 순위선정부(141)에 전달할 수 있다.
모니터링부(143)는 특정 가상머신뿐만 아니라 물리서버에 존재하는 모든 가상머신들에 대해서 정상적으로 동작되는지 여부를 모니터링할 수 있다.
통합관리부(142)는 논리적으로 연관되어 있는 가상머신들을 서로 함께 관리할 수 있다.
관리자는 입력모듈(180)에 가상머신에 대한 관리 및 통제, 제어를 실시할 수 있다.
통합관리부(142)는 임의의 가상머신에 대해서 변경(최초 변경안)이 이루어진다면, 변경이 이루어진 가상머신과 함께 그룹핑된 가상머신들에 대해서 유사한 변경안을 산출할 수 있다.
유사한 변경안은 인터페이스 모듈을 통해 관리자에게 추천될 수 있다.
여기서, 유사한 변경안은 논리적으로 연관도가 높을수록 최초 변경안과 유사할 수 있다.
반대로, 유사한 변경안은 논리적으로 연관도가 작을수록 최초 변경안과 유사하지 않을 수 있다.
일례로, 관리자가 임의의 가상머신에 대해서 100GB의 스토리지를 스케일업을 하였다면, 통합관리부(142)는 임의의 가상머신과 논리유사도가 90인 제1 가상머신에 대해서는 90GB 스토리지를 스케일업할 것을 산출할 수 있다.
여기서, 사용자에게 제안할 경우, 인터페이스모듈(170)은 스케일업 여부 및 스케일업의 구체적인 사항들을 관리자에게 문의할 수 있는 인터페이스를 산출할 수 있다.
이를 통해, 관리자는 연관있는 가상머신을 통합적으로 관리할 수 있음에 따라, 시스템을 효율적으로 운영할 수 있다.
또한, 통합관리부(142)는 하나의 가상머신에 대해서 관리가 이루어져 있을 경우, 제어가 이루어진 가상머신과 동일하게 그룹핑된 다른 가상머신도 관리가 이루어질지를 인터페이스모듈(170)을 활용하여 관리자에게 문의할 수 있다.
통합관리부(142)은 하나의 가상머신에 대해서 관리가 이루어졌을 경우, 미리 정해진 연관도 기준 이상의 가상머신들에 대해서만 연관도를 고려한 관리 방안을 산출하여 추천할 수 있다.
여기서, 미리 정해진 연관도 기준은 그룹핑되기 위한 연관도보다 더 높을 수 있다.
일례로, 미리 정해진 연관도 기준은 85일 수 있다.
다만, 이에 한정하지 않고, 상기 미리 정해진 연관도 기준은 통상의 기술자에게 자명한 수준에서 다양하게 변형 가능하다.
일례로, 상술한 제1 가상머신 내지 제3 가상머신을 고려하여 예를 들 수 있다. 관리자는 제1 가상머신에 대해서 스케일 업하여 30GB을 더 확대할 수 있다. 이때, 관리모듈(140)은 제2 가상머신에 대해서 27GB 스토리지 용량을 확대할 것을 제2 가상머신 사용자 및/또는 관리자에게 추천할 수 있다. 이와 달리 제3 가상머신에 대해서는 별도의 선 추천은 하지 않을 수 있다.
이는, 문제가 발생하지도 않은 그룹핑된 모든 가상머신들에 대해서 선 제안 및 추천할 경우, 물리서버의 자원이 효과적으로 활용되지 못할 수 있기 때문일 수 있다.
이를 통해, 관리모듈(140)은 논리적으로 동일(연관도 100)하거나 유사한 가상머신을 통합 관리하여, 가상머신을 효율적으로 관리할 수 있다.
순위선정부(141)는 미리 정해진 선정방법을 기초로 점검이 필요한 상기 가상머신의 우선순위를 산출할 수 있다.
관리모듈(140)(순위선정부(141))는 상기 가상머신에 발생된 문제의 시급한 정도와 관련된 문제위험도를 산출할 수 있다.
순위선정부(141)에는 오류의 종류와 정도에 따라 문제위험도가 미리 지정되어 있을 수 있다.
일례로, 문제위험도는 0 내지 100의 숫자로 수치화 될 수 있으며, 수치가 클수록 오류의 위험도가 클 수 있다.
다만, 이에 한정하지 않고 문제위험도의 수치화 방식은 통상의 기술자에게 자명한 수준에서 다양하게 변형 가능하다.
모니터링부(143)로부터 특정 가상머신에 대해서 이상징후를 전달받으면, 순위선정부(141)는 이상징후의 문제위험도를 산출할 수 있다.
미리 정해진 선정방법은 상기 종합연관도와 상기 문제위험도를 모두 반영하여 상기 가상머신의 우선순위를 산출하는 방법일 수 있다.
여기서, 우선순위는 종합연관도가 높을수록 높을 수 있다. 반대로 우선순위는 종합연관도가 낮을수록 낮을 수 있다.
또한, 우선순위는 문제위험도가 높을수록 높을 수 있다. 반대로 우선순위는 문제위험도가 낮을수록 낮을 수 있다.
일례로, 종합연관도와 문제위험도의 평균이 높을수록 우선순위가 높을 수 있다. 만일, 종합연관도와 문제위험도의 평균이 같다면, 문제위험도가 더 높은 가상머신의 우선순위가 더 높을 수 있다.
인터페이스모듈(170)은 모니터링부에서 감지한 오류있는 특정 가상머신의 정보, 특정 가상머신의 오류 정보, 특정 가상머신의 오류 해결방안, 순위 선정부에서 선정한 우선순위를 기반으로 소정 우선순위 내에 있는 가상머신의 정보 및 그 가상머신의 오류와 해결방안 정보를 관리자에게 전달할 인터페이스를 산출할 수 있다.
여기서, 해결방안은 문제에 대한 명명, 문제의 근거가 되는 로그 기록, 문제를 해결하기 위한 방법 등에 대한 정보를 포함할 수 있다.
일례로, "해당 가상머신의 이상과 관련된 가상머신은 A1, A2, A3 등 총 56개입니다. 이 중 확인해 볼만한 가상머신의 우선순위는 A2, B1, B9, C3 순으로 A2 가상머신은 memory usage와 B1 가상머신은 network 병목을 최우선적으로 확인하는 것을 추천 드립니다. 근거가 되는 로그는'[Error] C : Out of Memory' '[Error] F : Network time out'입니다. " 와 같은 메시지를 포함하는 정보가 인터페이스모듈(170)에서 생성되는 인터페이스를 통해 관리자에게 전달될 수 있다.
피드백부(144)는 특정 가상머신에 문제가 발생되어 점검이 필요한 가상머신들에 대해서 인터페이스모듈(170)을 통해 관리자에게 안내가 나간 후에, 관리자가 안내받은 내용대로 가상머신을 보완한 후 상기 특정 가상머신의 오류가 해결되었는지 여부를 판단할 수 있다.
만일, 우선순위로 지정되어 보완요청 받은 가상머신들이 변경된 후에도 특정 가상머신의 오류가 해결되지 않았다면, 피드백부(144)는 연관도 산출모듈(120)에 종합연관도를 수정할 것을 요청할 수 있다.
연관도 산출모듈(120)은 상기 특정 가상머신에 문제가 발생되어 점검이 필요한 상기 가상머신에 대해서 점검이 필요한 사항이 보완되었으나, 상기 특정 가상머신의 문제가 해결되지 않을 경우, 점검이 필요하다고 판단된 상기 가상머신에 대한 상기 종합연관도를 수정, 변경할 수 있다.
구체적인 일례로서, 앞서 기재한 예시를 들어 설명하면, A2가상머신에 대해서 memory usage를 보완하였으나, 특정 가상머신에 발생한 문제가 해결되지 않았다면, 연관도 산출모듈(120)은 특정 가상머신과 A2 가상머신과의 종합연관도를 낮게 조정할 수 있다.
종합연관도는 가상머신의 운영 상태와, 배치된 물리서버 상태 등에 따라 유동적으로 변경될 수 있다. 다만, 가상머신들 간의 근본적인 연관 관계는 가상머신이 소멸되기 전까지 유지될 수 있다. 따라서, 피드백부(144)에 의해 연관도가 조정된 특징은 연관도 산출모듈(120)에 저장되어, 추후에 연관도를 산출하는데도 반영될 수 있다.
구체적인 일례로서, 추후에 특정 가상머신과 A2 가상머신의 종합연관도가 산출될 때, 원칙적으로 산출되는 종합연관도보다 더 낮게 산출될 수 있다.
피드백부(144) 요청에 의할 때, 연관도 산출모듈(120)은 상기 특정 가상머신에 발생된 이상징후의 종류에 따라 상기 논리연관도와 상기 물리연관도를 비중이 다르게 수정할 수 있다.
이는, 이상징후 종류에 따라 논리연관도와 물리연관도의 중요도가 서로 다르기 때문일 수 있다.
일례로, 특정 가상머신과 A2 가상머신의 종합연관도가 90이며, 논리연관도가 85.3이고, 물리연관도가 92이라고 가정하며, A2가상머신에 대해서 memory usage를 보완하였으나, 특정 가상머신에 발생한 문제가 해결되지 않았고, memory usage는 논리연관도가 30% 비중을 차지하고, 물리연관도가 70% 비중을 차지하는 이상징후라고 가정할 수 있다. 연관도 산출모듈(120)은 피드백부(144)의 요청이 있을 경우, 종합연관도를 20만큼 다운되어, 이상징후 적용 비율에 따라 논리연관도를 79.3로 하향 조정하고, 물리연관도를 78로 하향 조정할 수 있다.
이와 같이, 가상머신들 간의 연관도를 현장 상황에 맞게 효과적으로 피드백 함으로써, 이상징후 감지 및 후술하는 가상머신 배치도 더욱 정확하게 실시할 수 있다.
마이그레이션 모듈(150) 미리 정해진 배치 방법으로 가상머신을 물리서버상에 배치할 수 있다.
미리 정해진 배치 방법은 상기 연관도가 높을수록 물리적 거리를 멀게 배치하는 방법일 수 있다.
마이그레이션 모듈(150)은 가상머신들의 과거 워크로드를 기반으로 가상머신들의 워크로드를 예측할 수 있으며, 예측된 워크로드를 기반으로 목적함수가 최소화되는 가상머신들의 최적 배치를 산출할 수 있다.
여기서, 목적함수는 마이그레이션 수에 대한 목적함수, 가동 물리서버에 대한 목적함수, 워크로드 변화율에 대한 목적함수 등으로 이루어질 수 있으며, 이에 대한 자세한 설명은 공지된 기술과 중복되는 한도에서 생략될 수 있다.
여기서, 논리연관도와 물리적 거리와의 관계에 목적함수도 상술한 마이그레이션 기준의 목적함수에 포함될 수 있다.
이를 위해서는 마이그레이션 모듈(150)은 가상머신들 간의 연관도를 예측할 수 있는 연관도 예측모델을 이용하여 가상머신들 간의 연관도를 예측할 수 있다.
연관도 예측모델은 과거의 가상머신의 동작정보와 가상머신들 간의 연관도가 딥러닝 되어 산출될 수 있으며, 이에 대한 자세한 설명은 공지된 기술과 중복되는 한도에서 생략될 수 있다.
미리 정해진 배치 방법은 논리연관도가 높을수록 물리적 거리를 멀게 배치하고, 논리연관도가 낮을수록 물리적 거리를 가깝게 배치하는 방법일 수 있다.
이는, 논리연관도가 높을수록 물리적 거리가 가깝다면, 화재, 지진, 정전 등과 같은 외부적 환경에 동일하게 취약할 수 있으며, 논리연관도 높은 가상머신이 함께 위협되어, 클라우드 서비스가 불안정해질 수 있기 때문일 수 있다.
미리 정해진 배치 방법은 논리연관도에 기초하여 미리 정해진 배치 기준에 따라 상기 가상머신을 상기 물리서버에 배치하는 방법일 수 있다.
여기서, 미리 정해진 배치 기준은 공간적으로 구별되는 기준일 수 있다.
구체적인 일례로서, 미리 정해진 배치 방법은 동일 서버실 내에 배치하는 기준인 제1 배치기준, 동일 서버실은 아니나 동일 건물 내에 배치하는 기준인 제2 배치기준, 동일 건물은 아니나 동일 지역 내에 배치하는 기준인 제3 배치기준 및 동일 지역이 아니게 배치하는 기준인 제4 배치기준을 구비할 수 있다.
논리연관도에 기초하여 제1 배치기준 내지 제4 배치기준에 따라 가상머신이 배치될지 여부가 결정될 수 있다.
구체적인 일례로서, 논리연관도 81 내지 100일 경우 제4 배치기준에 따라 가상머신들이 배치되며, 논리연관도 61 내지 80일 경우 제3 배치기준에 따라 가상머신들이 배치되며, 논리연관도 41 내지 60일 경우 제2 배치기준에 따라 가상머신들이 배치되며, 논리연관도 40 이하일 경우 제1 배치기준에 따라 배치될 수 있다.
동일 서버실이란 하나로 구획되는 공간(일례로, 방)을 의미할 수 있다.
동일 건물이란 등기부등본 상 하나의 건물로 구분되거나, 사회통념상 하나의 건물로 구분되는 것을 의미할 수 있다.
동일 지역은 행정 구역 상 동일한 것을 의미하며, 구분 기준은 '시'를 기준으로 할 수 있다. 다만, 이에 한정하지 않고, 구분 기준은 통상의 기술자에게 자명한 수준에서 다양하게 변형 가능하다.
미리 정해진 배치 방법은 미리 정해진 조건이 만족되는 경우 미리 정해진 배치 기준을 변경하여 가상머신을 물리서버에 배치할 수 있다.
미리 정해진 조건은 제1 임시연관도가 제2 임시연관도보다 소정 기준 이상 클 경우인 미리 정해진 제1 조건과 제2 임시연관도가 제1 임시연관도보다 소정 기준 이상 클 경우인 미리 정해진 제2 조건으로 이루어질 수 있다.
여기서, 소정 기준은 20일 수 있으나, 이에 본 발명이 한정되는 것은 아니고 소정 기준은 통상의 기술자에게 자명한 수준에서 다양하게 변형 가능하다.
미리 정해진 배치 방법은 상기 미리 정해진 제1 조건이 만족되는 경우, 미리 정해진 배치 기준에 따라 설정된 배치기준보다 물리적 거리가 더 먼 배치기준을 적용하여 가상머신을 물리서버 상에 배치하는 방법일 수 있다.
일례로, 미리 정해진 제1 조건이 만족되는 경우, 마이그레이션 모듈(150)은 원래 제3 배치기준이 적용되어야 하는 것이지만 한단계 배치 기준을 더 낮춘 제2 배치기준이 적용하여 가상머신을 배치할 수 있다.
또한, 미리 정해진 배치 방법은 상기 미리 정해진 제2 조건이 만족되는 경우, 미리 정해진 배치 기준에 따라 설정된 배치기준보다 물리적 거리가 더 가깝도록 배치기준을 적용하여 가상머신을 물리서버 상에 배치하는 방법일 수 있다.
일례로, 미리 정해진 제2 조건이 만족되는 경우, 마이그레이션 모듈(150)은 원래 제3 배치기준이 적용되어야 하는 것이지만 한단계 배치 기준을 더 높인 제4 배치기준이 적용하여 가상머신을 배치할 수 있다.
이는, 미리 정해진 제1 조건이 만족되는 경우 가상머신들 간의 직접적 통신 비중이 적으나, 가상머신의 동작 경향성이 유사한 것으로서 다른 가상머신들을 매개하여 간접적으로 연관되어 있을 가능성이 높을 수 있다. 따라서, 물리적 거리를 높임으로써 통신 로드의 문제를 크게 고려하지 않아도 되기에, 안전성을 확보하기 위해 물리적 거리를 더욱 확장시키는 것이 바람직할 수 있다.
또한, 미리 정해진 제2 조건이 만족되는 경우 가상머신들 간의 직접적 통신의 비중이 더욱 큰 것으로서 물리적 거리를 확대할 경우 가상머신들 간의 통신 부하 및 속도가 저감될 수 있다. 따라서, 물리적 거리를 기존 기준보다 줄임으로써, 가상머신들 간의 통신 로드를 최소화할 수 있다.
도 4는 본 발명의 일 실시예에 따른 클라우드서버 관리 방법 중 이상징후 대응 방법에 대한 순서도이다.
이하, 상술한 내용과 중복되는 한도에서 자세한 설명은 생략될 수 있다.
도 4를 참조하면, 본 발명의 일 실시예에 따른 클라우드서버 관리 방법은, 클라우드서버 관리 시스템에 의해 구현되며, 물리서버에서 동작되는 복수개의 가상머신을 관리하는 클라우드서버 관리 방법에 있어서,수집모듈에 의해, 상기 가상머신이 상기 물리서버 상에서 가동되면서 발생되는 정보인 동작정보가 수집되는 단계, 연관도 산출모듈에 의해, 상기 동작정보가 활용되어, 미리 정해진 연관도 산출 방법을 통해 상기 가상머신들 간의 연관도인 종합연관도가 산출되는 단계 및 관리 모듈에 의해, 특정 가상머신에 문제가 발생되었을 경우, 상기 종합연관도를 기초로 상기 특정 가상머신 이외의 가상머신 중에서 점검이 필요한 가상머신과 점검이 필요한 사항이 산출단계를 포함할 수 있다.
수집모듈은 동작 정보 및 가상머신들의 배치정보, 물리서버의 위치 정보 등을 수집할 수 있다.
연관도 산출모듈은 수집모듈로부터 전달받은 정보들을 기초로 실시간으로 가상머신들 간의 종합연관도를 산출할 수 있다.
관리모듈이 특정 가상머신에 대한 이상징후를 발견할 경우, 이상징후에 대한 원인을 분석할 수 있다. 동시에 관리모듈은 특정 가상머신 이외의 가상머신들의 이상징후도 함께 감지하여, 다른 가상머신의 이상징후에 대한 원인도 분석할 수 있다.
관리모듈은 특정 가상머신의 이상징후에 대해서 우선적으로 살펴봐야할 가상머신을 선정하여, 해당 리스트 정보들을 인터페이스모듈에 전달할 수 있다.
인터페이스모듈은 우선적으로 검토해야할 가상머신들과 검토사항들이 표시되는 인터페이스를 산출하고 관리자 컴퓨팅 시스템에 전송할 수 있다.
도 5은 본 발명의 일 실시예에 따른 클라우드서버 관리 방법 중 우선순위에 해당되는 가상머신들을 표시하는 화상 예시이다.
도 5를 참조하면, 인터페이스모듈은 특정 가상머신(X10)을 중심으로 우선순위를 기준으로 가상머신(Y10)들이 정렬되는 인터페이스를 산출할 수 있다.
구체적인 일례로서, 우선순위가 높은 가상머신일수록 특정 가상머신과 가깝게 화상에서 표시될 수 있다.
반대로, 우선순위가 낮은 가상머신일수록 특정 가상머신과 멀게 화상에서 표시될 수 있다.
일례로, 특정 가상머신과 그 이외의 가상머신은 연결아이콘(R10)에 의해 연결되게 화상에서 표시될 수 있다. 일례로, 연결아이콘은 '화살표'일 수 있으나, 이에 본 발명이 한정되는 것은 아니고, 연결아이콘의 종류는 통상의 기술자에게 자명한 수준에서 다양하게 변형 가능하다.
연결아이콘의 상 및/또는 하측에는 우선순위를 선정하는 기준(N10)이 되는 값이 표시될 수 있다.
일례로, 우선순위를 선정하는 기준은 종합연관도와 문제위험도의 평균이 표시될 수 있다.
상술한 인터페이스에는 가상머신에서 발생한 이상징후(오류) 현상과 검토사항이 함께 기재될 수 있다.
인터페이스모듈은 특정 가상머신과 우선순위로 선정된 가상머신 간의 우선순위를 선정하는 기준을 변경할 수 있는 인터페이스를 산출할 수 있다.
일례로, 인터페이스모듈은 연결아이콘의 길이를 변경하여 선정된 가상머신 간의 우선순위를 선정하는 기준을 변경할 수 있는 인터페이스를 제공할 수 있다.
일례로, 관리자는 화면에 표시된 연결아이콘 화상의 길이를 조절함으로써, 특정 가상머신과 우선순위 가상머신의 문제위험도와 종합연관도를 직접적으로 변경할 수 있으며, 변경된 정도는 연관도 산출모듈과 순위선정부에 저장되어 추후 종합연관도와 문제위험도가 산출되는데 동일하게 적용될 수 있다.
이를 통해, 관리자는 직관적으로 우선순위의 가상머신들을 파악하고 수정하여, 관리 효율성을 극대화할 수 있다.
도 6은 본 발명의 일 실시예에 따른 클라우드서버 관리 시스템이 구현하는 마이그레이션의 기준이 되는 미리 정해진 배치 기준을 설명하기 위한 표이다.
구체적인 일례로서, 도 6은 특정 가상머신을 기준으로 제1 가상머신 내지 제4 가상머신의 논리연관도와 미리 정해진 배치 기준으로 적용된 것을 도시한 표이다.
제1 가상머신은 논리연관도가 90으로서 제4 배치기준에 따라 특정 가상머신과 동일 지역이 아니게 배치될 수 있다. 일례로, 특정 가상머신이 서울에 배치되었다면 제1 가상머신은 경기도에 배치될 수 있다.
제2 가상머신은 논리연관도가 80으로서 제3 배치기준에 따라 특정 가상머신과 동일한 지역 내에 배치될 수 있다. 일례로, 일례로, 특정 가상머신이 서울에 배치되었다면 제1 가상머신도 서울에 배치될 수 있다.
다만, 제2 가상머신은 제1 임시연관도가 제2 임시연관도보다 22가 더 크기 때문에 미리 정해진 제1 조건이 만족될 수 있다. 이로 인해, 마이그레이션 모듈은 제3 배치기준이 아닌 제4 배치기준을 적용하여 제2 가상머신을 배치할 수 있다.
제3 가상머신은 논리연관도가 55인 것으로서 제2 배치기준에 따라 특정 가상머신과 동일 서버실은 아니나 동일 건물에 배치될 수 있다. 일례로, 특정 가상머신은 2층의 물리서버실에 배치될 수 있고, 제3 가상머신은 3층의 물리서버실에 배치될 수 있다.
다만, 제3 가상머신은 제2 임시연관도가 제1 임시연관도보다 26이 더 크기 때문에 미리 정해진 제2 조건이 만족될 수 있다. 이로 인해, 마이그레이션 모듈은 제2 배치기준이 아닌 제1 배치기준을 적용하여 제3 가상머신을 배치할 수 있다.
제4 가상머신은 논리연관도가 30인 것으로 제1 배치기준에 따라 특정 가상머신과 동일 서버실 내에 배치될 수 있다.
다시 도 2를 참조하면, 저장모듈은 가상머신 관리 방법이 구현되는데 필요한 모든 정보들이 저장되어 있을 수 있다.
또한, 상기 저장모듈은 가상머신의 오류별로 해결 방안들이 데이터베이스화 되어 저장되어 있을 수 있다.
저장 모듈은 모듈은 내장 메모리 및/또는 외장 메모리를 포함할 수 있다.
일례로, 내장 메모리는 휘발성 메모리(예: DRAM, SRAM, 또는 SDRAM 등), 비휘발성 메모리(예: OTPROM(one time programmable ROM), PROM, EPROM, EEPROM, mask ROM, flash ROM, 플래시 메모리, 하드 드라이브, 또는 솔리드 스테이트 드라이브 (SSD) 중 적어도 하나를 포함할 수 있다
외장 메모리는 플래시 드라이브(flash drive), 예를 들면, CF(compact flash), SD(secure digital), Micro-SD, Mini-SD, xD(extreme digital), MMC(multi-media card) 또는 메모리 스틱 등을 포함할 수 있다.
인터페이스모듈은 사용자 혹은 관리자와 네트워크를 통해 필요한 정보들을 송수신 하여, 사용자 혹은 관리자의 요청을 전달받을 수 있다.
일례로, 입력모듈은 터치 패널, (디지털) 펜 센서, 키, 또는 초음파 입력 장치를 포함할 수 있다. 터치 패널은, 예를 들면, 정전식, 감압식, 적외선 방식, 또는 초음파 방식 중 적어도 하나의 방식을 사용할 수 있다. 또한, 터치 패널은 제어 회로를 더 포함할 수도 있다. 터치 패널은 택타일 레이어(tactile layer)를 더 포함하여, 사용자에게 촉각 반응을 제공할 수 있다. (디지털) 펜 센서는, 예를 들면, 터치 패널의 일부이거나, 별도의 인식용 쉬트를 포함할 수 있다. 키는, 예를 들면, 물리적인 버튼, 광학식 키, 또는 키패드를 포함할 수 있다. 초음파 입력 장치는 마이크(예: 마이크)를 통해, 입력 도구에서 발생된 초음파를 감지하여, 상기 감지된 초음파에 대응하는 데이터를 확인할 수 있다.
도 7은 본 발명의 일 실시예에 따른 클라우드서버 관리 시스템이 구현하는 가상머신 관리 방법의 순서도이다.
이하, 상술한 내용과 중복되는 한도에서 자세한 설명은 생략될 수 있다.
도 2 및 도 7을 참조하면, 본 발명의 일 실시예에 따른 클라우드서버 관리 방법은, 클라우드서버 관리 시스템에 의해 운영되며, 물리서버에서 가상화되어 운영되는 복수개의 가상머신을 관리하는 가상머신 관리 방법에 있어서, 수집모듈에 의해, 상기 가상머신이 상기 물리서버 상에서 가동되면서 발생되는 정보인 동작정보가 수집되는 수집 단계, 연관도 산출모듈에 의해, 상기 동작정보를 활용하여 미리 정해진 연관도 판단 방법을 통해 가상머신들 간의 연관도가 판단되는 연관도 판단 단계, 그룹핑모듈에 의해, 논리연관도를 기초로 상기 가상머신들이 복수의 그룹별로 그룹핑되는 구분 단계 및 관리모듈에 의해, 상기 가상머신에 문제가 발생될 경우 문제해결 방안이 산출되고 그룹별로 상기 가상머신들이 관리되는 관리 단계를 포함할 수 있다.
또한, 클라우드서버 관리 방법은 마이그레이션 모듈에 의해, 미리 정해진 배치 방법으로 상기 가상머신이 상기 물리서버 상에 배치되는 마이그레이션 단계를 더 포함할 수 있다.
또한, 상기 클라우드서버 관리 방법은 가상머신에 대한 동작, 오류정보, 추천정보, 발생비용 등을 확인할 수 있는 인터페이스를 산출하고 사용자 혹은 관리자에게 전송하는 표시 단계를 더 포함할 수 있다.
이와 같이, 이상징후에 대해서, 연관 높은 가상머신에 대해서 선별적으로 대응할 수 있으므써, 이상징후에 대해서 더욱 효과적으로 대응할 수 있다.
첨부된 도면은 본 발명의 기술적 사상을 보다 명확하게 표현하기 위해, 본 발명의 기술적 사상과 관련성이 없거나 떨어지는 구성에 대해서는 간략하게 표현하거나 생략하였다.
상기에서는 본 발명에 따른 실시예를 기준으로 본 발명의 구성과 특징을 설명하였으나 본 발명은 이에 한정되지 않으며, 본 발명의 사상과 범위 내에서 다양하게 변경 또는 변형할 수 있음은 본 발명이 속하는 기술분야의 당업자에게 명백한 것이며, 따라서 이와 같은 변경 또는 변형은 첨부된 특허청구범위에 속함을 밝혀둔다.
110 : 수집모듈 120 : 연관도 산출모듈
130 : 그룹핑모듈 140 : 관리모듈
130 : 그룹핑모듈 140 : 관리모듈
Claims (10)
- 가상머신이 물리서버 상에서 가동되면서 발생되는 정보인 동작정보를 수집하는 수집모듈;
상기 동작정보를 활용하여 미리 정해진 연관도 산출 방법을 통해 상기 가상머신들 간의 연관도인 종합연관도를 산출하는 연관도 산출모듈; 및
특정 가상머신에 문제가 발생되었을 경우, 상기 종합연관도를 기초로 상기 특정 가상머신 이외의 가상머신 중에서 점검이 필요한 상기 가상머신을 선별하는 관리모듈;을 포함하고,
상기 미리 정해진 연관도 산출 방법은,
상기 가상머신들 간의 물리적 관련성을 나타내는 물리적연관도를 활용하여 상기 종합연관도를 산출하는 방법인,
클라우드서버 관리 시스템.
- 제1항에 있어서,
상기 연관도 산출모듈은,
가상머신의 물리서버 위치에 의해 산출되는 물리적 정보들을 기반으로 상기 물리적연관도를 산출하는,
클라우드서버 관리 시스템.
- 제1항에 있어서,
상기 연관도 산출모듈은,
물리적 거리가 가까워울수록 상기 물리적연관도를 더 높게 산출하는,
클라우드서버 관리 시스템.
- 가상머신이 물리서버 상에서 가동되면서 발생되는 정보인 동작정보를 수집하는 수집모듈;
상기 동작정보를 활용하여 미리 정해진 연관도 산출 방법을 통해 상기 가상머신들 간의 연관도인 종합연관도를 산출하는 연관도 산출모듈; 및
특정 가상머신에 문제가 발생되었을 경우, 상기 종합연관도를 기초로 상기 특정 가상머신 이외의 가상머신 중에서 점검이 필요한 상기 가상머신을 선별하는 관리모듈;을 포함하고,
상기 미리 정해진 연관도 산출 방법은,
제1 산출 방법을 통해 상기 가상머신들 간의 논리적 관련성을 나타내는 값인 논리연관도를 산출하고, 제2 산출 방법을 통해 상기 가상머신들 간의 물리적 관련성을 나타내는 물리연관도를 산출하며,
상기 논리연관도와 상기 물리연관도를 활용하여 상기 종합연관도를 산출하는 방법인,
클라우드서버 관리 시스템.
- 제4항에 있어서,
상기 제1 산출방법은,
상기 가상머신의 자체 동작과 관련된 정보를 기초로 연관도를 산출하는 방법인 제1-1 산출방법 또는 상기 가상머신들 간의 통신과 관련된 정보들을 기초로 연관도를 산출하는 방법인 제1-2 산출방법을 구비하는,
클라우드서버 관리 시스템.
- 제4항에 있어서,
상기 미리 정해진 연관도 산출 방법은,
상기 논리연관도와 상기 물리연관도를 가중치를 다르게 평균내어 상기 종합연관도를 산출하며, 상기 특정 가상머신에 발생된 이상징후의 종류에 따라 가중치를 변경하는 방법인,
클라우드서버 관리 시스템.
- 가상머신이 물리서버 상에서 가동되면서 발생되는 정보인 동작정보를 수집하는 수집모듈;
상기 동작정보를 활용하여 미리 정해진 연관도 산출 방법을 통해 상기 가상머신들 간의 연관도인 종합연관도를 산출하는 연관도 산출모듈; 및
특정 가상머신에 문제가 발생되었을 경우, 상기 종합연관도를 기초로 상기 특정 가상머신 이외의 가상머신 중에서 점검이 필요한 상기 가상머신을 선별하는 관리모듈;을 포함하고,
상기 연관도 산출모듈은,
상기 특정 가상머신에 문제가 발생되어 점검이 필요한 상기 가상머신에 대해서 점검이 필요한 사항이 보완되었으나, 상기 특정 가상머신의 문제가 해결되지 않을 경우, 점검이 필요하다고 판단된 상기 가상머신에 대한 상기 종합연관도를 수정하는,
클라우드서버 관리 시스템.
- 제7항에 있어서,
상기 종합연관도는,
상기 가상머신들 간의 논리적 관련성을 나타내는 값인 논리연관도와 상기 가상머신들 간의 물리적 관련성을 나타내는 물리연관도에 의해 산출되며,
상기 연관도 산출모듈은,
상기 특정 가상머신에 발생된 이상징후의 종류에 따라 상기 논리연관도와 상기 물리연관도를 비중이 다르게 수정하는,
클라우드서버 관리 시스템.
- 클라우드서버 관리 시스템에 의해 구현되며, 물리서버에서 동작되는 복수개의 가상머신을 관리하는 클라우드서버 관리 방법에 있어서,
수집모듈에 의해, 상기 가상머신이 상기 물리서버 상에서 가동되면서 발생되는 정보인 동작정보가 수집되는 단계;
연관도 산출모듈에 의해, 상기 동작정보가 활용되어, 미리 정해진 연관도 산출 방법을 통해 상기 가상머신들 간의 연관도인 종합연관도가 산출되는 단계; 및
관리 모듈에 의해, 특정 가상머신에 문제가 발생되었을 경우, 상기 종합연관도를 기초로 상기 특정 가상머신 이외의 가상머신 중에서 점검이 필요한 가상머신이 산출단계;를 포함하고,
상기 미리 정해진 연관도 산출 방법은,
상기 가상머신들 간의 물리적 관련성을 나타내는 물리적연관도를 활용하여 상기 종합연관도를 산출하는 방법인,
클라우드서버 관리 방법.
- 제9항에 있어서,
상기 관리모듈에 의해, 미리 정해진 선정방법에 의해 점검이 필요한 상기 가상머신의 우선순위가 산출되는 단계; 및
상기 관리모듈에 의해, 상기 가상머신에 발생된 문제의 시급한 정도와 관련된 문제위험도가 산출되는 단계;를 더 포함하고,
상기 미리 정해진 선정방법은,
상기 종합연관도와 상기 문제위험도를 모두 반영하여 상기 가상머신의 우선순위를 산출하는 방법인,
클라우드서버 관리 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230042543A KR102613655B1 (ko) | 2023-03-31 | 2023-03-31 | 이상징후 선별대응에 기반한 클라우드서버 관리 방법 및 이를 구현하는 클라우드서버 관리 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230042543A KR102613655B1 (ko) | 2023-03-31 | 2023-03-31 | 이상징후 선별대응에 기반한 클라우드서버 관리 방법 및 이를 구현하는 클라우드서버 관리 시스템 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102613655B1 true KR102613655B1 (ko) | 2023-12-14 |
Family
ID=89166950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230042543A KR102613655B1 (ko) | 2023-03-31 | 2023-03-31 | 이상징후 선별대응에 기반한 클라우드서버 관리 방법 및 이를 구현하는 클라우드서버 관리 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102613655B1 (ko) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010244181A (ja) * | 2009-04-02 | 2010-10-28 | Nec Corp | 仮想マシン管理システム,仮想マシン配置設定方法及びそのプログラム |
KR101578177B1 (ko) * | 2014-09-12 | 2015-12-16 | 성균관대학교산학협력단 | 클라우드 컴퓨팅 환경에서의 자원 이용률에 기초한 마이그레이션 방법 및 시스템 |
-
2023
- 2023-03-31 KR KR1020230042543A patent/KR102613655B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010244181A (ja) * | 2009-04-02 | 2010-10-28 | Nec Corp | 仮想マシン管理システム,仮想マシン配置設定方法及びそのプログラム |
KR101578177B1 (ko) * | 2014-09-12 | 2015-12-16 | 성균관대학교산학협력단 | 클라우드 컴퓨팅 환경에서의 자원 이용률에 기초한 마이그레이션 방법 및 시스템 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10637745B2 (en) | Algorithms for root cause analysis | |
US11290360B2 (en) | Analyzing resource placement fragmentation for capacity planning | |
JP4374378B2 (ja) | 運用実績評価装置、運用実績評価方法、およびプログラム | |
CN101689161B (zh) | 自动管理计算机网络中的系统停机时间 | |
US11561849B1 (en) | Intelligently adaptive log level management of a service mesh | |
KR101916847B1 (ko) | 크로스-클라우드식 관리 및 고장수리 기법 | |
JP4609380B2 (ja) | 仮想サーバ管理システムおよびその方法ならびに管理サーバ装置 | |
WO2021000693A1 (zh) | 一种服务熔断方法、装置及消息中间件 | |
US7680991B2 (en) | Correlated analysis of wasted space and capacity efficiency in complex storage infrastructures | |
US10931533B2 (en) | System for network incident management | |
US10397164B2 (en) | Deputizing agents to reduce a volume of event logs sent to a coordinator | |
WO2012050224A1 (ja) | コンピュータリソース制御システム | |
JP2010039878A (ja) | ログ管理システムおよびログ表示システム | |
KR102549129B1 (ko) | 디바이스 장애 통합 관리 플랫폼 제공 방법 | |
US11226984B2 (en) | Preventing data loss in event driven continuous availability systems | |
KR102569867B1 (ko) | 상관분석을 활용한 가상머신 관리 방법 및 이를 구현하는 가상머신 관리 시스템 | |
KR102473637B1 (ko) | 5g 분산 클라우드 시스템의 빅 데이터를 이용하여 장애를 관리하는 장치 및 방법 | |
KR102613655B1 (ko) | 이상징후 선별대응에 기반한 클라우드서버 관리 방법 및 이를 구현하는 클라우드서버 관리 시스템 | |
CN117579651A (zh) | 物联网系统 | |
Singh et al. | Reliability on the Internet of Things with designing approach for exploratory analysis | |
KR102188987B1 (ko) | 서버 관리 장치를 구비한 클라우드 서버 및 로컬 서버를 이용하는 제로클라이언트 단말기용 클라우드 컴퓨팅 시스템의 운영 방법 | |
JP2013175232A (ja) | 仮想サーバ管理システムおよびその方法ならびに管理サーバ装置 | |
KR102542149B1 (ko) | 우선순위 기반의 장애 모니터링을 통한 가상머신 통합관리 방법 및 이를 구현하는 가상머신 통합관리 시스템 | |
US11838193B1 (en) | Real-time load limit measurement for a plurality of nodes | |
JP5360000B2 (ja) | 仮想サーバ管理システムおよびその方法ならびに管理サーバ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |