KR20210056655A - 클라우드 엣지 환경에서 예측 기반 마이그레이션 후보 및 대상 선정 방법 - Google Patents

클라우드 엣지 환경에서 예측 기반 마이그레이션 후보 및 대상 선정 방법 Download PDF

Info

Publication number
KR20210056655A
KR20210056655A KR1020190143369A KR20190143369A KR20210056655A KR 20210056655 A KR20210056655 A KR 20210056655A KR 1020190143369 A KR1020190143369 A KR 1020190143369A KR 20190143369 A KR20190143369 A KR 20190143369A KR 20210056655 A KR20210056655 A KR 20210056655A
Authority
KR
South Korea
Prior art keywords
cloud edge
failure
pod
data
cloud
Prior art date
Application number
KR1020190143369A
Other languages
English (en)
Other versions
KR102320317B1 (ko
Inventor
안재훈
김영환
Original Assignee
한국전자기술연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자기술연구원 filed Critical 한국전자기술연구원
Priority to KR1020190143369A priority Critical patent/KR102320317B1/ko
Publication of KR20210056655A publication Critical patent/KR20210056655A/ko
Application granted granted Critical
Publication of KR102320317B1 publication Critical patent/KR102320317B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/301Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)

Abstract

클라우드 엣지 관리방법 및 클라우드 엣지 장치가 제공된다. 본 클라우드 엣지 관리방법에 따르면, 워크로드 데이터가 수신되면 학습된 예측모델을 이용하여 포드(Pod)의 장애발생 가능성을 산출하고, 산출된 장애발생 가능성에 따라 해당 포드에 대해 마이그레이션을 수행할 수 있게 되어, 마이그레이션 후보 관리를 통해 발생 가능한 리스크를 미리 방지할 수 있게 되어 클라우드 엣지 환경에서 운용 데이터의 즉시성 및 서비스 안정성을 지속적으로 제공할 수 있게 된다.

Description

클라우드 엣지 환경에서 예측 기반 마이그레이션 후보 및 대상 선정 방법 {Method for selecting predict-based migration candidate and target on cloud edge}
본 발명은 클라우드 엣지 관리방법 및 클라우드 엣지 장치에 관한 것으로, 더욱 상세하게는, 클라우드 엣지 환경에서 예측기반 마이그레이션을 수행하는 클라우드 엣지 관리방법 및 클라우드 엣지 장치에 관한 것이다.
이 부분에 기술된 내용은 단순히 본 실시 예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.
최근 클라우드 기술은 다양한 분야의 IT 서비스에 적용되고 있다. 하지만, 클라우드 데이터 센터가 물리적으로 먼 거리에 있을 경우에는 속도가 느려지고 병목현상으로 처리시간이 지연되는 문제가 있다.
이러한 점을 보완하기 위해, 클라우드 기술에 엣지(Edge) 컴퓨팅 기술이 더해져 더욱 강력한 클라우드 엣지 기술이 제공되고 있다. 엣지 컴퓨팅은 포그 컴퓨팅(Fog Computing)이라고도 알려져 있으며, 네트워크 가장자리나 사용자 근처에 위치한 엣지(또는 포그, 작은 클라우드 노드)들이 주요 데이터 분석 처리 기능을 수행하고, 메인 클라우드에는 처리된 결과만을 전송하는 방식이다.
하지만, 클라우드 엣지 환경에서는 자원에 대한 가용성 지원이 불가하고, 클라우드 엣지 특성에 따른 과부하 제어는 메시지 로그 분석을 통한 후처리로 처리할수 밖에 없다.
또한, 대규모 클라우드 환경에 자원 분석은 진행되고 있었으나, 엣지 환경에 대한 자원 분석은 되지 않는 것이 일반적이다.
그리고, 클라우드 환경에서의 워크로드 관리 및 예측 또한 대규모 클라우드 환경에 대한 것이 대부분이고, 엣지환경에 대한 워크로드 관리 및 예측은 이루어지지 않고 있는 것이 일반적이다.
따라서, 이러한 클라우드 엣지 환경에서의 워크로드 관리 및 예측을 위한 방안의 모색이 요청된다.
본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 워크로드 데이터가 수신되면, 학습된 예측모델을 이용하여 포드(Pod)의 장애발생 가능성을 산출하고, 산출된 장애발생 가능성에 따라 해당 포드에 대해 마이그레이션을 수행하는 클라우드 엣지 관리방법 및 클라우드 엣지 장치를 제공함에 있다.
본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 클라우드 엣지 관리장치에 의한 클라우드 엣지 관리방법은, 워크로드 데이터가 수신되면, 학습된 예측모델을 이용하여 포드(Pod)의 장애발생 가능성을 산출하는 단계; 및 산출된 장애발생 가능성에 따라, 해당 포드에 대해 마이그레이션을 수행하는 단계;를 포함한다.
그리고, 마이그레이션을 수행하는 단계는, 산출된 장애발생 가능성이 제1 임계값 이상일 경우, 해당 포드에 저장된 데이터들을 가상 자원이 더 많은 가상머신으로 마이그레이션할 수도 있다.
또한, 마이그레이션을 수행하는 단계는, 산출된 장애발생 가능성이 제2 임계값 이하일 경우, 해당 포드에 저장된 데이터들을 가상 자원이 더 적은 가상머신으로 마이그레이션할 수도 있다.
그리고, 워크로드 데이터를 이용하여 장애발생 가능성을 예측하는 예측모델을 딥러닝을 통해 학습시키는 단계;를 더 포함할 수도 있다.
또한, 학습시키는 단계는, LSTM(Long Short Term Memory) 알고리즘을 이용하여 예측모델을 학습시킬 수도 있다.
그리고, 워크로드 데이터는, 노드 및 포드의 워크로드 데이터, 가상머신의 워크로드 데이터, 컨테이너의 워크로드 데이터, 및 애플리케이션의 워크로드 데이터를 포함할 수도 있다.
또한, 워크로드 데이터는, CPU 사용량 데이터 및 메모리 사용량 데이터를 포함할 수도 있다.
한편, 본 발명의 일 실시예에 따른, 클라우드 엣지 관리장치는, 포드(Pod)의 워크로드 데이터를 수신하는 통신부; 및 워크로드 데이터가 수신되면, 학습된 예측모델을 이용하여 포드의 장애발생 가능성을 산출하고, 산출된 장애발생 가능성에 따라 해당 포드에 대해 마이그레이션을 수행하는 제어부;를 포함한다.
본 발명의 다양한 실시예에 따르면, 워크로드 데이터가 수신되면 학습된 예측모델을 이용하여 포드(Pod)의 장애발생 가능성을 산출하고, 산출된 장애발생 가능성에 따라 해당 포드에 대해 마이그레이션을 수행하는 클라우드 엣지 관리방법 및 클라우드 엣지 장치를 제공할 수 있게 되어, 마이그레이션 후보 관리를 통해 발생 가능한 리스크를 미리 방지할 수 있게 되어 클라우드 엣지 환경에서 운용 데이터의 즉시성 및 서비스 안정성을 지속적으로 제공할 수 있게 된다.
본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에 서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명에 관한 이해를 돕기 위해 상세한 설명의 일부로 포함되는, 첨부 도면은 본 발명에 대한 실시 예를 제공하고, 상세한 설명과 함께 본 발명의 기술적 특징을 설명한다.
도 1은 본 발명의 일 실시예에 따른, 클라우드 엣지 환경을 도시한 도면,
도 2는 본 발명의 일 실시예에 따른, 클라우드 엣지의 구성을 도시한 도면,
도 3은 본 발명의 일 실시예에 따른, 클라우드 엣지 관리장치의 구조를 도시한 도면,
도 4는 본 발명의 일 실시예에 따른, 클라우드 엣지 관리방법을 설명하기 위해 제공되는 흐름도,
도 5는 본 발명의 일 실시예에 따른, 클라우드 엣지 관리방법이 수행되는 과정을 도식화한 도면,
도 6은 본 발명의 일 실시예에 따른, 클라우드 엣지 환경에서 포드별 장애발생 가능성을 예측한 예시를 도시한 도면이다.
본 발명의 과제 해결 수단의 특징 및 이점을 보다 명확히 하기 위하여, 첨부된 도면에 도시된 본 발명의 특정 실시 예를 참조하여 본 발명을 더 상세하게 설명한다.
다만, 하기의 설명 및 첨부된 도면에서 본 발명의 요지를 흐릴 수 있는 공지기능 또는 구성에 대한 상세한 설명은 생략한다. 또한, 도면 전체에 걸쳐 동일한 구성 요소들은 가능한 한 동일한 도면 부호로 나타내고 있음에 유의하여야 한다.
이하의 설명 및 도면에서 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위한 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.
따라서 본 명세서에 기재된 실시 예와 도면에 도시된 구성은 본 발명의 가장바람직한 일 실시 예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
또한, 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하기 위해 사용하는 것으로, 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용될 뿐, 상기 구성요소들을 한정하기 위해 사용되지 않는다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제2 구성요소는 제1 구성요소로 명명될 수 있고, 유사하게 제1 구성요소도 제2 구성요소로 명명될 수 있다.
더하여, 어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급할 경우, 이는 논리적 또는 물리적으로 연결되거나, 접속될 수 있음을의미한다.
다시 말해, 구성요소가 다른 구성요소에 직접적으로 연결되거나 접속되어 있을 수 있지만, 중간에 다른 구성요소가 존재할 수도 있으며, 간접적으로 연결되거나 접속될 수도 있다고 이해되어야 할 것이다.
또한, 본 명세서에서 기술되는 "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
또한, 명세서에 기재된 "…부", "…기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
또한, "일(a 또는 an)", "하나(one)", "그(the)" 및 유사어는 본 발명을 기술하는 문맥에 있어서(특히, 이하의 청구항의 문맥에서) 본 명세서에 달리 지시되거나 문맥에 의해 분명하게 반박되지 않는 한, 단수 및 복수 모두를 포함하는 의미로 사용될 수 있다.
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른, 클라우드 엣지 환경을 도시한 도면이다.
도 1에 도시된 바와 같이, 클라우드 엣지(10)는 클라우드 엣지 관리장치(100)에 의해 관리된다. 구체적으로, 클라우드 엣지 관리장치(100)는 클라우드 엣지(10)의 자원 사용 상황, 환경 데이터, 워크로드 데이터 등을 관리하고, 그에 따라 클라우드 엣지의 포드(Pod)의 데이터를 마이그레이션하는 등의 관리를 수행하게 된다.
클라우드 엣지 관리장치(100)는 그 자체로 물리적으로 독립된 장치로 구현될 수 있을 뿐만 아니라, 어떤 장치나 시스템의 일부로 포함되어 있는 형태로 구현될 수도 있으며, 스마트폰이나 컴퓨터나 서버 등에 설치된 프로그램 또는 프레임워크 또는 애플리케이션 등의 소프트웨어 형태로 구현될 수도 있음은 물론이다. 또한, 클라우드 엣지 관리장치(100)의 각 구성요소는 물리적 구성요소로 구현될 수도 있고 소프트웨어의 기능 형태의 구성요소로 구현될 수도 있다.
클라우드 엣지(Edge)는 클라우드 기술에 엣지(Edge) 컴퓨팅 기술이 더해져 더욱 강력한 클라우드를 제공하는 기술이다. 엣지 컴퓨팅은 포그 컴퓨팅(Fog Computing)이라고도 알려져 있으며, 네트워크 가장자리나 사용자 근처에 위치한 엣지(또는 포그, 노드)들이 주요 데이터 분석 처리 기능을 수행하고, 메인 클라우드에는 처리된 결과만을 전송하는 방식이다.
도 1에 도시된 바와 같이, 클라우드 엣지(10)는 복수개의 노드(Node)들을 포함하고, 노드 내에는 적어도 하나의 포드(Pod)를 포함하고 있는 것을 확인할 수 있다. 이하에서는, 도 2를 참고하여 클라우드 엣지의 구조에 대해 더욱 상세히 설명한다.
클라우드 엣지(10)에서 엣지(edge)는 IT 인프라에서 사용자와 가장 가까운 네트워크에 위치한 노드(Node, 서버 등)를 한다. 즉, 클라우드 엣지(10)는 사용자가 요청한 데이터 또는 콘텐츠를 사용자 가장 가까이에서 전송하고 처리할 수 있도록 인프라를 구성하는 것이다. 예를 들어, 콘텐츠 전송 네트워크는 클라우드 엣지 개념을 활용한 네트워크 서비스로, 유튜브, 넷플릭스를 비롯한 대부분의 글로벌 컨텐츠 서비스들은 컨텐츠 전송 네트워크를 통해 콘텐츠를 제공하고 있습니다.
클라우드 엣지(10)의 엣지 컴퓨팅은 중앙에서 데이터를 집중 처리하는 클라우드 컴퓨팅 방식이 아닌, 여러 지점에서 소규모 설비로 데이터를 처리하는 컴퓨팅 방식을 말한다. 사물 인터넷 시대에 본격 진입하게 되면 다양한 경로를 통해 중앙으로 수집되는 데이터의 양이 많아지고 실시간 처리가 중요한 사물 인터넷 환경에서는 집중된 데이터를 지연 없이 처리해야 하는데 기존의 중앙 집중형 클라우드 컴퓨팅 환경에서는 빠르게 결과를 받아 보는 것이 불가능하다. 이런 문제를 보완하기 위해 클라우드 엣지(10)는 여러 곳에 설치한 엣지 서버인 '노드'에서 바로 데이터를 처리하고, 결과를 메인 클라우드에 알려주게 된다.
클라우드 엣지(10)는 기존의 클라우드 컴퓨팅에 비해 지연 시간(latency)이 짧다. 가장 가까운 단말 혹은 사물 인터넷 기기에서 직접 데이터를 처리하기 때문에 지연 시간 없이 상황에 대응할 수 있고, 빠른 응답속도를 보장하므로 자율 주행 산업 등에서도 사용될 수 있다.
또한, 클라우드 엣지(10)는 클라우드의 보안 문제를 어느 정도 완화할 수 있다. 기존의 클라우드는 중앙의 데이터센터에 문제가 발생하면 그와 연결된 모든 웹/모바일 서비스에 영향을 미친다. 하지만, 클라우드 엣지(10)는 각각의 장비에서 대부분의 연산을 처리하기 때문에, 어느 한 시스템을 공략한다고 해서 전체 서비스에 피해를 주지는 않는다는 점에서 안전하다고 볼 수 있다.
도 2는 본 발명의 일 실시예에 따른, 클라우드 엣지(10)의 구성을 도시한 도면이다. 도 2에 도시된 바와 같이, 클라우드 엣지(10)는 복수개의 노드(Node)(200)들을 포함하고, 노드 내에는 적어도 하나의 포드(Pod)(210)를 포함하고 있다.
도 2에 도시된 클라우드 엣지(10)는 쿠버네티스를 이용하여 구현될 수도 있다. 이 경우, 클라우드 엣지 관리장치(100)는 전체 클러스터를 관리하는 마스터와 같은 기능을 수행하게 된다. 모든 명령은 마스터인 클라우드 엣지 관리장치(100)의 API 서버를 호출하고 노드(200)는 클라우드 엣지 관리장치(100)와 통신하면서 필요한 작업을 수행한다. 특정 노드(200)의 컨테이너에 명령하거나 로그를 조회할 때도 노드(200)에 직접 명령하는 게 아니라 클라우드 엣지 관리장치(100)에 명령을 내리고 클라우드 엣지 관리장치(100)가 노드(200)에 접속하여 대신 결과를 응답하게 된다.
노드(200)는 하나의 서버 또는 복수개의 서버로 구성된 작은 클라우드로 구성된다. 노드(200)는 클라우드 엣지 관리장치(100)와 통신하면서 필요한 포드(210)를 생성하고 네트워크와 스토리지를 설정한다.
포드(210)는 실제 컨테이너들이 생성되는 곳으로 수백, 수천개로 확장할 수 있다. 포드(210)는 각각에 라벨을 붙여 사용목적(GPU 특화, SSD 서버 등)을 정의할 수도 있다. 포드(210)는 쿠버네티스에서 배포할 수 있는 가장 작은 단위로 한 개 이상의 컨테이너(211)와 스토리지(213)와 네트워크(215) 속성을 가진다. 포드(210) 속한 적어도 하나의 컨테이너(211)는 스토리지(213)와 네트워크(215)를 공유하고 서로 로컬호스트(localhost)로 접근할 수 있다.
클라우드 엣지(10)는 이와 같은 구조의 복수개의 노드 및 포드를 포함하게 된다.
이하에서는, 도 3을 참고하여, 클라우드 엣지 관리장치(100)의 구성에 대해 더욱 상세히 설명한다. 도 3은 본 발명의 일 실시예에 따른, 클라우드 엣지 관리장치(100)의 구조를 도시한 도면
도 3에 도시된 바와 같이, 클라우드 엣지 관리장치(100)는 입력부(110)와 제어부(120)를 포함한다.
통신부(110)는 클라우드 엣지(10)와 통신 가능하도록 연결되며, 클라우드 엣지(10)의 포드(Pod)의 워크로드 데이터가 수신된다. 여기에서, 워크로드 데이터는 클라우드 엣지(10)에서 사용되고 있는 가상 자원의 양에 대한 데이터를 나타내는 것으로, CPU 사용량 데이터, 메모리 사용량 데이터, 스토리지 사용량 데이터, 네트워크 부하량 데이터 등을 포함할 수도 있다. 워크로드 데이터는 노드 및 포드의 워크로드 데이터, 가상머신의 워크로드 데이터, 컨테이너의 워크로드 데이터, 및 애플리케이션의 워크로드 데이터를 포함할 수도 있다.
통신부(110)는 블루투스, 와이파이(WIFI), 근거리무선통신(NFC), 셀룰러, LTE(Long-Term Evolution) 등 다양한 무선 통신 방식으로 통신을 수행할 수 있으며, 유선랜 등의 유선 통신으로 통신을 할 수도 있음은 물론이다.
제어부(120)는 클라우드 엣지 관리장치(100)의 전반적인 동작을 제어한다. 구체적으로, 제어부(120)는 워크로드 데이터가 수신되면, 학습된 예측모델을 이용하여 포드의 장애발생 가능성을 산출하고, 산출된 장애발생 가능성에 따라 해당 포드에 대해 마이그레이션을 수행한다. 여기에서, 장애발생 가능성은 데이터 센터에 포함된 서버나 장비들에서 장애가 발생될 가능성을 나타내는 값으로, 장애발생 가능성 값이 높을수록 일정 시간 내에 장애가 발생될 가능성이 높다는 것을 의미한다.
이외에 제어부(120)의 상세한 동작은 도 4를 참고하여 설명한다. 도 4는 본 발명의 일 실시예에 따른, 클라우드 엣지 관리 방법을 설명하기 위해 제공되는 흐름도이다.
우선, 제어부(120)는 포드 별 워크로드 데이터를 이용하여 포드 별로 장애발생 가능성을 예측하는 예측모델을 딥러닝을 통해 학습시킨다.
이 때, 제어부(120)는 다양한 딥러닝 알고리즘을 이용하여 예측모델을 학습시킬 수 있으며, 예를 들어, 제어부(120)는 LSTM(Long Short Term Memory) 알고리즘을 이용하여 예측모델을 학습시킬 수도 있다. 또한, 제어부(120)는, Inference Pipeline, Policy, Training Pipeline 과정을 적용하여 예측모델을 학습시킬 수도 있다. 예를 들어, 제어부(120)는 일정 기간동안 장애가 발생되지 않았을 때의 워크로드 데이터 세트와 일정 기간 중에 장애가 발생되었을 때의 워크로드 데이터 세트를 예측모델에 입력하고, 딥러닝 알고리즘을 이용해 예측모델을 학습시키게 된다.
그리고, 제어부(120)는 학습이 완료되면 학습이 완료된 해당 예측모델을 이용하게 되며, 구체적으로, 제어부(120)는 워크로드 데이터가 수신되면, 학습된 예측모델을 이용하여 포드(Pod)의 장애발생 가능성을 포드 별로 산출하게 된다(S420). 예측모델은 포드별로 워크로드 데이터가 입력되면 포드 각각에 대한 장애발생 가능성을 산출하여 출력하는 인공지능 딥러닝 학습 모델이다.
그 후에, 제어부(120)는 산출된 장애발생 가능성에 따라, 해당 포드에 대해 마이그레이션 수행여부를 결정하고 기설정된 조건이 만족되면 마이그레이션을 수행한다(S430). 구체적으로, 제어부(120)는 산출된 장애발생 가능성이 제1 임계값 이상일 경우, 해당 포드에 저장된 데이터들을 가상 자원이 더 많은 가상머신으로 마이그레이션할 수 있다. 그리고, 제어부(120)는 산출된 장애발생 가능성이 제2 임계값 이하일 경우, 해당 포드에 저장된 데이터들을 가상 자원이 더 적은 가상머신으로 마이그레이션할 수도 있다.
예를 들어, 제어부(120)는 장애발생 가능성이 제1 임계값인 80% 이상인 경우, 해당 포드에 저장된 데이터들을 가상 자원(CPU, 메모리, 스토리지 등)이 2배 이상 더 많은 가상머신으로 마이그레이션할 수 있다. 또한, 제어부(120)는 장애발생 가능성이 제2 임계값인 20% 이하인 경우, 해당 포드에 저장된 데이터들을 가상 자원(CPU, 메모리, 스토리지 등)이 1/2배 이하로 더 적은 가상머신으로 마이그레이션할 수 있다. 제1 임계값과 제2 임계값은 사용자에 의해 정책에 따라 설정될 수 있으며 변경 가능한 값이다. 이외에도, 제어부(120)는 다양한 방식으로 장애발생 가능성에 따라 클라우드 엣지(10)의 포드를 마이그레이션할 수 있다.
이와 같은 과정을 통해, 클라우드 엣지 관리장치(100)는 장애발생 가능성을 학습 및 예측하여 클라우드 엣지의 포드의 데이터를 마이그레이션함으로써, 클라우드 엣지 환경에서도 장애 관리 리스크를 최소화 할 수 있게 되며 마이그레이션 후보 관리를 통해 발생 가능한 리스크를 미리 방지할 수 있게 되어 클라우드 엣지 환경에서 운용 데이터의 즉시성 및 서비스 안정성을 지속적으로 제공할 수 있게 된다.
도 5는 본 발명의 일 실시예에 따른, 클라우드 엣지 관리방법이 수행되는 과정을 도식화한 도면이다.
도 5에 도시된 바와 같이, 워크로드 데이터(510)는 노드 및 포드의 워크로드 데이터, 가상머신의 워크로드 데이터, 컨테이너의 워크로드 데이터, 및 애플리케이션의 워크로드 데이터를 포함할 수도 있다. 노드 및 포드의 워크로드 데이터는 해당 포드에 대응되는 노드와 해당 포드에서 각각 사용 중인 CPU 사용량, 메모리 사용량, 스토리지 사용량, 네트워크 사용량 등을 나타낸다. 컨테이너의 워크로드 데이터는 해당 포드에 포함된 컨테이너들 각각에서 사용 중인 CPU 사용량, 메모리 사용량, 스토리지 사용량, 네트워크 사용량 등을 나타낸다. 가상머신의 워크로드 데이터는 해당 포드에 포함된 가상머신들 각각에서 사용 중인 CPU 사용량, 메모리 사용량, 스토리지 사용량, 네트워크 사용량 등을 나타낸다. 애플리케이션의 워크로드 데이터는 해당 포드에 포함된 애플리케이션들이 각각 사용 중인 CPU 사용량, 메모리 사용량, 스토리지 사용량, 네트워크 사용량 등을 나타낸다.
이와 같은, 워크로드 데이터(510)는 클라우드 엣지 장치(100)에 입력된다. 그러면, 클라우드 엣지 장치(100)는 LSTM(Long Short Term Memory) 알고리즘을 이용하여 예측모델을 학습시킬 수 있으며, 구체적으로, Inference Pipeline, Policy, Training Pipeline 과정을 적용하여 예측모델을 학습시킬 수도 있다.
그리고, 클라우드 엣지 장치(100)는 장애 발생 가능성을 포드별 게이지(520, 530)로 표시할 수도 있다.
이를 통해, 클라우드 엣지 장치(100)는 사용자에게 더욱 직관적으로 장애 발생 가능성을 표시할 수 있게 된다.
도 6은 본 발명의 일 실시예에 따른, 클라우드 엣지 환경에서 포드별 장애발생 가능성을 예측한 예시를 도시한 도면이다.
도 6에는 2개의 노드(Node1, Node2)가 포함된 클라우드 엣지(10) 환경을 도시하고 있다. 그리고, 노드1(Node1)에는 4개의 포드(Pod11, Pod12, Pod13, Pod14)가 포함되어 있고, 노드2(Node2)에는 4개의 포드(Pod21, Pod22, Pod23)가 포함되어 있다.
그리고, Pod11의 장애발생 가능성은 90%, Pod12의 장애발생 가능성은 55%, Pod13의 장애발생 가능성은 10%, Pod14의 장애발생 가능성은 75%, Pod21의 장애발생 가능성은 50%, Pod22의 장애발생 가능성은 80%, Pod23의 장애발생 가능성은 15%인 것을 확인할 수 있다. 즉, 제1 임계값이 80%이고 제2 임계값이 20%인 경우, Pod11과 Pod22는 더 큰 규모의 가상머신으로 마이그레이션을 수행할 대상이 되고 Pod13과 Pod23은 더 작은 규모의 가상머신으로 마이그레이션을 수행할 대상이 되게 된다.
따라서, 클라우드 엣지 장치(100)는 Pod11과 Pod22를 가상자원이 더 많은 가상머신으로 마이그레이션 하고, Pod13과 Pod23은 가상 자원이 더 적은 가상머신으로 마이그레이션하게 된다.
이를 통해, 클라우드 엣지 장치(100)는 자원이 부족하여 장애가 발생될 가능성이 높은 포드는 가상자원이 더 많은 가상머신으로, 자원이 충분하여 장애가 발생될 가능성이 낮은 포드는 가상자원이 더 적은 가상머신으로 마이그레이션을 하게 되어, 클라우드 엣지의 가상 자원을 효율적으로 이용하고 예측 기반으로 장애발생 가능성을 최소화할 수 있게 된다.
한편, 본 실시예에 따른 장치의 기능 및 방법을 수행하게 하는 컴퓨터 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록매체에도 본 발명의 기술적 사상이 적용될 수 있음은 물론이다. 또한, 본 발명의 다양한 실시예에 따른 기술적 사상은 컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터로 읽을 수 있는 프로그래밍 언어 코드 형태로 구현될 수도 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터에 의해 읽을 수 있고 데이터를 저장할 수 있는 어떤 데이터 저장 장치이더라도 가능하다. 예를 들어, 컴퓨터로 읽을 수 있는 기록매체는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광디스크, 하드 디스크 드라이브, 플래시 메모리, 솔리드 스테이트 디스크(SSD) 등이 될 수 있음은 물론이다. 또한, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터로 읽을 수 있는 코드 또는 프로그램은 컴퓨터간에 연결된 네트워크를 통해 전송될 수도 있다.
본 명세서와 도면에서는 예시적인 장치 구성을 기술하고 있지만, 본 명세서에서 설명하는 기능적인 동작과 주제의 구현물은 다른 유형의 디지털 전자 회로로구현되거나, 본 명세서에서 개시하는 구조 및 그 구조적인 등가물들을 포함하는 컴퓨터 소프트웨어, 펌웨어 혹은 하드웨어로 구현되거나, 이들 중 하나 이상의 결합으로 구현 가능하다.
따라서, 상술한 예를 참조하여 본 발명을 상세하게 설명하였지만, 본 발명이속하는 분야의 통상의 기술자라면 본 발명의 범위를 벗어나지 않으면서도 본 예들에 대한 개조, 변경 및 변형을 가할 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
10 : 클라우드 엣지
100 : 클라우드 엣지 관리장치
110 : 통신부
120 : 제어부

Claims (8)

  1. 클라우드 엣지 관리장치에 의한 클라우드 엣지 관리방법에 있어서,
    워크로드 데이터가 수신되면, 학습된 예측모델을 이용하여 포드(Pod)의 장애발생 가능성을 산출하는 단계; 및
    산출된 장애발생 가능성에 따라, 해당 포드에 대해 마이그레이션을 수행하는 단계;를 포함하는 클라우드 엣지 관리방법.
  2. 청구항 1에 있어서,
    마이그레이션을 수행하는 단계는,
    산출된 장애발생 가능성이 제1 임계값 이상일 경우, 해당 포드에 저장된 데이터들을 가상 자원이 더 많은 가상머신으로 마이그레이션하는 것을 특징으로 하는 클라우드 엣지 관리방법.
  3. 청구항 1에 있어서,
    마이그레이션을 수행하는 단계는,
    산출된 장애발생 가능성이 제2 임계값 이하일 경우, 해당 포드에 저장된 데이터들을 가상 자원이 더 적은 가상머신으로 마이그레이션하는 것을 특징으로 하는 클라우드 엣지 관리방법.
  4. 청구항 1에 있어서,
    워크로드 데이터를 이용하여 장애발생 가능성을 예측하는 예측모델을 딥러닝을 통해 학습시키는 단계;를 더 포함하는 것을 특징으로 하는 클라우드 엣지 관리방법.
  5. 청구항 4에 있어서,
    학습시키는 단계는,
    LSTM(Long Short Term Memory) 알고리즘을 이용하여 예측모델을 학습시키는 것을 특징으로 하는 클라우드 엣지 관리방법.
  6. 청구항 1에 있어서,
    워크로드 데이터는,
    노드 및 포드의 워크로드 데이터, 가상머신의 워크로드 데이터, 컨테이너의 워크로드 데이터, 및 애플리케이션의 워크로드 데이터를 포함하는 것을 특징으로 하는 클라우드 엣지 관리방법.
  7. 청구항 6에 있어서,
    워크로드 데이터는,
    CPU 사용량 데이터 및 메모리 사용량 데이터를 포함하는 것을 특징으로 하는 클라우드 엣지 관리방법.
  8. 포드(Pod)의 워크로드 데이터를 수신하는 통신부; 및
    워크로드 데이터가 수신되면, 학습된 예측모델을 이용하여 포드의 장애발생 가능성을 산출하고, 산출된 장애발생 가능성에 따라 해당 포드에 대해 마이그레이션을 수행하는 제어부;를 포함하는 클라우드 엣지 관리장치.
KR1020190143369A 2019-11-11 2019-11-11 클라우드 엣지 환경에서 예측 기반 마이그레이션 후보 및 대상 선정 방법 KR102320317B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190143369A KR102320317B1 (ko) 2019-11-11 2019-11-11 클라우드 엣지 환경에서 예측 기반 마이그레이션 후보 및 대상 선정 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190143369A KR102320317B1 (ko) 2019-11-11 2019-11-11 클라우드 엣지 환경에서 예측 기반 마이그레이션 후보 및 대상 선정 방법

Publications (2)

Publication Number Publication Date
KR20210056655A true KR20210056655A (ko) 2021-05-20
KR102320317B1 KR102320317B1 (ko) 2021-11-02

Family

ID=76142947

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190143369A KR102320317B1 (ko) 2019-11-11 2019-11-11 클라우드 엣지 환경에서 예측 기반 마이그레이션 후보 및 대상 선정 방법

Country Status (1)

Country Link
KR (1) KR102320317B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230020052A (ko) * 2021-08-02 2023-02-10 주식회사 이노그리드 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템
KR20230069815A (ko) 2021-11-12 2023-05-19 한국전자통신연구원 엣지 컴퓨팅 환경의 자원 할당 방법 및 장치
US11973842B2 (en) 2022-02-11 2024-04-30 International Business Machines Corporation Service status prediction based transaction failure avoidance

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090059851A (ko) * 2007-12-07 2009-06-11 한국전자통신연구원 가상 서버 환경에서의 서비스 수준 관리 시스템 및 그 방법
KR20120063662A (ko) * 2010-12-08 2012-06-18 텔코웨어 주식회사 로드 밸런서 및 이를 이용한 부하 분산 관리 방법
CN109710376A (zh) * 2018-12-12 2019-05-03 中国联合网络通信集团有限公司 容器集群管理系统的动态调度方法和装置
CN110187990A (zh) * 2019-05-31 2019-08-30 东北大学 一种基于模式转移的虚拟机混合备用动态可靠性评估方法
CN110209467A (zh) * 2019-05-23 2019-09-06 华中科技大学 一种基于机器学习的弹性资源扩展方法和系统
US20190286475A1 (en) * 2018-03-14 2019-09-19 Microsoft Technology Licensing, Llc Opportunistic virtual machine migration

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090059851A (ko) * 2007-12-07 2009-06-11 한국전자통신연구원 가상 서버 환경에서의 서비스 수준 관리 시스템 및 그 방법
KR20120063662A (ko) * 2010-12-08 2012-06-18 텔코웨어 주식회사 로드 밸런서 및 이를 이용한 부하 분산 관리 방법
US20190286475A1 (en) * 2018-03-14 2019-09-19 Microsoft Technology Licensing, Llc Opportunistic virtual machine migration
CN109710376A (zh) * 2018-12-12 2019-05-03 中国联合网络通信集团有限公司 容器集群管理系统的动态调度方法和装置
CN110209467A (zh) * 2019-05-23 2019-09-06 华中科技大学 一种基于机器学习的弹性资源扩展方法和系统
CN110187990A (zh) * 2019-05-31 2019-08-30 东北大学 一种基于模式转移的虚拟机混合备用动态可靠性评估方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230020052A (ko) * 2021-08-02 2023-02-10 주식회사 이노그리드 인공지능과 빅데이터 플랫폼에 의한 장애 예측을 이용한 멀티클라우드 서비스 방법 및 시스템
KR20230069815A (ko) 2021-11-12 2023-05-19 한국전자통신연구원 엣지 컴퓨팅 환경의 자원 할당 방법 및 장치
US11973842B2 (en) 2022-02-11 2024-04-30 International Business Machines Corporation Service status prediction based transaction failure avoidance

Also Published As

Publication number Publication date
KR102320317B1 (ko) 2021-11-02

Similar Documents

Publication Publication Date Title
KR102154446B1 (ko) 분산·협업형 컨테이너 플랫폼 환경에서의 자원 균등 배분을 위한 고속 스케줄링 방법
US10908936B2 (en) System and method for network function virtualization resource management
US10956849B2 (en) Microservice auto-scaling for achieving service level agreements
US10091070B2 (en) System and method of using a machine learning algorithm to meet SLA requirements
EP3799653B1 (en) Multi-phase cloud service node error prediction
KR20210119372A (ko) 네트워크 최적화 및 비 일시적 컴퓨터 판독 가능 매체를 위한 장치 및 방법
Xu et al. Dynamic resource provisioning for workflow scheduling under uncertainty in edge computing environment
KR102320317B1 (ko) 클라우드 엣지 환경에서 예측 기반 마이그레이션 후보 및 대상 선정 방법
KR102245341B1 (ko) 클라우드 엣지 내 워크로드 분산을 위한 예측 모델 적용 방법
US10430723B1 (en) Storage system with machine learning based skew prediction
CN107967164B (zh) 一种虚拟机热迁移的方法及系统
US20150186256A1 (en) Providing virtual storage pools for target applications
US20220150666A1 (en) Intelligent dynamic communication handoff for mobile applications
US10877791B2 (en) Live migration of virtual machines between compute only nodes and hyperconverged nodes
US10831525B2 (en) Intelligent assignment of virtual machines to compute only or hyper converged nodes
US10616064B2 (en) Soft reservation techniques and systems for virtualized environments
CN106933654B (zh) 一种基于缓存的虚拟机启动方法
KR102172607B1 (ko) 분산·협업형 컨테이너 플랫폼 환경에서의 자원간 균형적 스케일아웃 방법
Li et al. Research on energy‐saving virtual machine migration algorithm for green data center
US11743790B2 (en) 5G and SDN powered virtualized personal device framework
US10289958B1 (en) Storage system with machine learning based skew prediction
KR102227644B1 (ko) 마이크로 데이터센터 환경에서의 학습형 워크로드 측정 방법
US11546422B2 (en) Dynamic management of locations of modules of a platform hosted by a distributed system
CN107783823A (zh) 一种负载均衡方法及装置
CN108984271A (zh) 一种均衡负载的方法以及相关设备

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant