KR102448702B1 - 엣지 서비스 증설 제어 시스템 및 그 제어방법 - Google Patents

엣지 서비스 증설 제어 시스템 및 그 제어방법 Download PDF

Info

Publication number
KR102448702B1
KR102448702B1 KR1020200159828A KR20200159828A KR102448702B1 KR 102448702 B1 KR102448702 B1 KR 102448702B1 KR 1020200159828 A KR1020200159828 A KR 1020200159828A KR 20200159828 A KR20200159828 A KR 20200159828A KR 102448702 B1 KR102448702 B1 KR 102448702B1
Authority
KR
South Korea
Prior art keywords
information
edge service
cloud
request
trend
Prior art date
Application number
KR1020200159828A
Other languages
English (en)
Other versions
KR20220072338A (ko
Inventor
김형두
김화성
박성훈
윤지운
Original Assignee
스트라토 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 스트라토 주식회사 filed Critical 스트라토 주식회사
Priority to KR1020200159828A priority Critical patent/KR102448702B1/ko
Publication of KR20220072338A publication Critical patent/KR20220072338A/ko
Application granted granted Critical
Publication of KR102448702B1 publication Critical patent/KR102448702B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5066Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances

Abstract

본 발명은 엣지 서비스 증설 제어 시스템 및 그 제어방법에 관한 것이다. 본 발명에 따른 엣지 서비스 이용 장치의 요청을 클라우드 서버에 전달하고 클라우드 서버의 응답을 엣지 서비스 이용 장치에 전송하는 엣지 서비스 증설 제어 시스템의 제어방법은, 상기 각 클라우드 엣지 서비스 각각에 대한 자원 사용량에 대한 정보와 상기 각 클라우드 엣지 서비스로의 요청량 정보 중 적어도 어느 하나와, 상기 각 클라우드 엣지 서비스의 오류 상태 정보를 포함하는 모니터링 정보를 수집하는 단계와; 상기 수집된 모니터링 정보를 기초로 각 클라우드 엣지 서비스에 오류가 발생한 순간의 자원 사용량 또는 요청량을 판단하여 장애 가능 정보로 등록하는 단계와; 상기 각 클라우드 엣지 서비스 각각에 대한 자원 사용량 추이 정보와, 상기 각 클라우드 엣지 서비스로의 요청량 추이 정보 중 적어도 어느 하나를 수집하는 단계와; 상기 수집된 각 추이 정보를 기초로 예측 정보를 생성하는 단계와; 상기 생성된 예측 정보가 상기 장애 가능 정보에 부합하는 경우 해당하는 클라우드 엣지 서비스에 대한 증설 제어를 수행하는 단계를 포함하는 것을 특징으로 한다.

Description

엣지 서비스 증설 제어 시스템 및 그 제어방법{EDGE SERVICE SCALING OUT CONTROL SYSTEM AND CONTROL METHOD THEREOF}
본 발명은 엣지 서비스 증설 제어 시스템 및 그 제어방법에 관한 것으로, 보다 상세하게는 엣지 서비스에 대해 사전에 그 소요량을 예측하여 미리 증설을 처리하는 시스템 및 그 제어방법에 관한 것이다.
일명 클라우드 컴퓨팅이란 "클라우드", 즉 인터넷을 통해 서버, 저장소, 소프트웨어, 분석 등의 컴퓨팅 서비스를 제공하는 것을 의미한다. 예를 들어 네이버의 엔드라이브, 구글 Docs, 윈도우를 설치하면 함께 설치되는 OneDrive 등이 이런 서비스의 대표적인 예라 할 수 있다는데, 현재 많은 사용자들이 클라우드 기능을 손쉽게 사용하고 있다.
그런데 이런 클라우드 컴퓨팅에도 여러 문제점이 있다.
클라우드 서비스를 이용하는 사람들이 기하급수적으로 늘어나면서 서버 및 데이터 센터에서 처리할 수 있는 데이터의 양을 넘어서기 시작하고, 이에 더해 수집한 데이터를 분석하고 송신하는 과정에서 발생하는 데이터 지연 현상이 발생되고 있다.
이러한 종래의 클라우드 컴퓨팅에서의 문제점 특히 데이터 처리 속도 및 용량과 관련된 문제를 해결할 방식 중 하나로서 엣지 컴퓨팅이 도입되었다.
포그 컴퓨팅, MEC(Mobile Edge Computing) 등 여러 가지로 불리는 엣지 컴퓨팅은 말단 기기, 즉 '엣지'에서 컴퓨팅을 수행하는 것을 의미한다.
클라우드 컴퓨팅처럼 데이터를 처리하고 연산하는 곳이 멀리 떨어진 데이터 센터에 있는 게 아니라, 사용자들이 사용하는 단말 장치들과 가까운 곳에 컴퓨팅 장치가 위치한다는 것을 의미한다.
특히 지금까지 '엣지'에 위치한 장비들이 단순히 데이터 전송의 역할만을 수행하거나 데이터 저장의 역할만 수행한다면, 엣지 컴퓨팅에서는 이 '엣지' 장비에 컴퓨팅 능력을 부가하여 데이터 분석이나 기타 다양한 서비스를 제공하도록 하고 있다.
이러한 엣지 컴퓨팅은 그 단독으로 구성되기 보다는 클라우드의 한 변형된 형태로 이용될 수 있고, 이를 클라우드 엣지 컴퓨팅이라 할 수 있는데, 최근 이러한 클라우드 엣지 컴퓨팅에 대한 논의 및 서비스 구현이 활발히 이루어지고 있다.
그런데 이러한 클라우드 엣지 컴퓨팅을 구현하기 위해 만들어진 시스템, 즉, 클라우드 엣지 시스템에서는 다양한 서비스가 제공될 수 있는데, 예를 들어 서비스 제공 기반은 '컨테이너'일 수 있다.
여기서 컨테이너는 일종의 가상화 기술의 하나로서, 각 서비스 제공에 필요한 데이터, 프로그램, 정보들을 포함하고 있으므로, 동일한 컨테이너는 서버 운영체제 버전 등에 상관없이 동일한 기능을 수행할 수 있어서 널리 이용되고 있다.
클라우드 엣지 시스템 내에 구비된 서비스들 각각은 엣지 서비스 또는 엣지 서비스 인스턴스라고 부를 수 있는데, 각각 클라우드 엣지 시스템 내의 자원을 소모하면서 서비스를 제공한다.
그런데 복수의 엣지 서비스를 운영하는 경우 특정 엣지 서비스로의 빈번한 요청으로 인해 해당 엣지 서비스(즉, 그 인스턴스)가 제대로 동작하지 않는 경우가 발생하게 되고, 이 경우 부하로 인한 문제이므로 해당 엣지 서비스를 동적으로 증설을 하여 오류를 해소시켜야 한다.
종래에는 각 엣지 서비스 인스턴스의 자원 사용률(예를 들어 CPU와 메모리 사용률)이 임계치에 도달하는 등의 이유로 해당 엣지 서비스에 오류가 발생하는 경우 Scale Out을 통해 많은 엣지 서비스 인스턴스에 의해 부하가 분산되도록 하여 서비스 오류를 해소시켰는데, 이 경우 scale out에 의해 새로운 인스턴스가 생성되기 전까지 기존 엣지 서비스 인스턴스가 제공할 수 있는 서비스량을 초과한 요청에 대해서는 오류 처리 되는 문제가 있었다.
특히, 게이트웨이(예를 들어 API G/W)에서 엣지 서비스별로 기준 시간당 API 처리량을 산정하여 해당 기준치를 초과할 경우 해당 엣지 서비스에 대한 API 요청에 대해 오류 처리하는 방식으로 과부하 제어를 수행한다 하여도, 그 엣지 서비스 인스턴스의 생성을 위한 최소한의 시간이 필요하므로 보다 선제적인 조치의 필요성이 대두되고 있는 실정이다.
공개특허 제10-2020-0044200호
본 발명은 상기한 종래의 요청에 부응 부응하기 위해 안출된 것으로서 그 목적은 클라우드 엣지 서비스 인스턴스의 리소스(CPU/메모리) 사용률 증가 또는 해당 엣지 서비스로의 요청 증가 등으로 인한 장애발생을 예측하여 장애발생 이전에 미리 클라우드 엣지 서비스에 대한 scale out이 처리되도록 하는 시스템 및 그 제어방법을 제공하는 것이다.
상기한 목적을 달성하기 위해 본 발명에 따른 엣지 서비스 이용 장치의 요청을 클라우드 서버에 전달하고 클라우드 서버의 응답을 엣지 서비스 이용 장치에 전송하는 엣지 서비스 증설 제어 시스템은, 상기 각 클라우드 엣지 서비스 각각에 대한 자원 사용량에 대한 정보와 상기 각 클라우드 엣지 서비스로의 요청량 정보 중 적어도 어느 하나와, 상기 각 클라우드 엣지 서비스의 오류 상태 정보를 포함하는 모니터링 정보를 수집하는 기초 정보 수집부와; 상기 정보 수집부에서 수집된 모니터링 정보를 기초로 각 클라우드 엣지 서비스에 오류가 발생한 순간의 자원 사용량 또는 요청량을 판단하여 장애 가능 정보로 등록하는 정보 등록부와; 상기 각 클라우드 엣지 서비스 각각에 대한 자원 사용량 추이 정보와, 상기 각 클라우드 엣지 서비스로의 요청량 추이 정보 중 적어도 어느 하나를 수집하는 추이 정보 수집부와; 상기 추이 정보 수집부에서 수집된 각 추이 정보를 기초로 예측 정보를 생성하는 예측 정보 생성부와; 상기 예측 정보 생성부에서 생성된 예측 정보가 상기 장애 가능 정보에 부합하는 경우 해당하는 클라우드 엣지 서비스에 대한 증설 제어를 수행하는 증설 제어부를 포함하여 구성된다.
또, 상기한 목적을 달성하기 위해 본 발명에 따른 엣지 서비스 이용 장치의 요청을 클라우드 서버에 전달하고 클라우드 서버의 응답을 엣지 서비스 이용 장치에 전송하는 엣지 서비스 증설 제어 시스템의 제어방법은, 상기 각 클라우드 엣지 서비스 각각에 대한 자원 사용량에 대한 정보와 상기 각 클라우드 엣지 서비스로의 요청량 정보 중 적어도 어느 하나와, 상기 각 클라우드 엣지 서비스의 오류 상태 정보를 포함하는 모니터링 정보를 수집하는 단계와; 상기 수집된 모니터링 정보를 기초로 각 클라우드 엣지 서비스에 오류가 발생한 순간의 자원 사용량 또는 요청량을 판단하여 장애 가능 정보로 등록하는 단계와; 상기 각 클라우드 엣지 서비스 각각에 대한 자원 사용량 추이 정보와, 상기 각 클라우드 엣지 서비스로의 요청량 추이 정보 중 적어도 어느 하나를 수집하는 단계와; 상기 수집된 각 추이 정보를 기초로 예측 정보를 생성하는 단계와; 상기 생성된 예측 정보가 상기 장애 가능 정보에 부합하는 경우 해당하는 클라우드 엣지 서비스에 대한 증설 제어를 수행하는 단계를 포함하여 이루어진다.
이상 설명한 바와 같이 본 발명에 따르면, 추기 분석을 통해 클라우드 엣지 서비스 인스턴스의 증설 즉, scale out이 선제적으로 이루어짐으로써, 해당 클라우드 엣지 서비스로 향하는 요청량(호출량) 증가나 해당 클라우드 엣지 서비스가 이용하는 cpu/메모리 등 자원의 부족으로 인한 서비스 장애를 사전에 예방하고, 안정적인 서비스 제공이 이루어질 수 있다.
도 1은 본 발명의 일 실시예에 따른 엣지 서비스 증설 제어 시스템을 포함하는 전체 시스템의 개략 구성도이고,
도 2는 도 1의 엣지 서비스 증설 제어 시스템의 기능 블록도이고,
도 3 및 도 4는 도 1의 엣지 서비스 증설 제어 시스템의 전체적인 제어흐름도이다.
이하에서는 첨부도면을 참조하여 본 발명에 대해 상세히 설명한다.
이하 본 발명에 따른 각 실시예는 본 발명의 이해를 돕기 위한 하나의 예에 불과하고, 본 발명이 이러한 실시예에 한정되는 것은 아니다. 특히 본 발명은 각 실시예에 포함되는 개별 구성, 개별 기능, 또는 개별 단계 중 적어도 어느 하나 이상의 조합으로 구성될 수 있다.
특히, 편의상 청구 범위의 일부 청구항에는 '(a)'와 같은 알파벳을 포함시켰으나, 이러한 알파벳이 각 단계의 순서를 규정하는 것은 아니다.
또한 이하 본 발명에 따른 각 실시예에서 언급하는 각 신호는 한 번의 연결 등에 의해 전송되는 하나의 신호를 의미할 수도 있지만, 후술하는 특정 기능 수행을 목적으로 전송되는 일련의 신호 그룹을 의미할 수도 있다. 즉, 각 실시예에서는 소정의 시간 간격을 두고 전송되거나 상대 장치로부터의 응답 신호를 수신한 이후에 전송되는 복수 개의 신호들이 편의상 하나의 신호명으로 표현될 수 있는 것이다.
본 발명의 일 실시예에 따른 엣지 서비스 증설 제어 시스템(100)을 포함하는 전체 시스템의 개략 구성은 도 1에 도시된 바와 같다.
동 도면에서 엣지 서비스 이용 장치(200)는 클라우드 서버(300)에 구비된 각 클라우드 엣지 서비스를 이용하는 장치로서, 예를 들어 개인용 컴퓨터, 스마트폰과 같은 사용자 단말기에 해당할 수도 있고, 또는 네트워크에 존재하여 사용자의 요청을 처리하는 별도의 서버일 수도 있다.
클라우드 서버(300)는 적어도 하나의 클라우드 엣지 서비스를 구비하고서, 상술한 엣지 서비스 이용 장치(200)의 요청에 따라 각종 서비스를 제공하는 것으로서, 이때 클라우드 서버(300)는 구비된 클라우드 엣지 서비스(즉, 그 인스턴스)의 동작에 의해 각각의 서비스를 제공할 수 있다.
클라우드 서버(300)가 기 구비된 클라우드 엣지 서비스를 구동시키고, 이러한 각 클라우드 엣지 서비스에 의해 소정의 서비스를 제공하는 것 자체는 공지된 기술에 해당하므로 보다 상세한 설명은 생략한다.
본 실시예에서 엣지 서비스 이용 장치(200)의 요청은 곧바로 클라우드 서버(300)에 전송되는 것은 아니고, 본 발명에 따른 엣지 서비스 증설 제어 시스템(100)을 경유하게 된다.
즉, 엣지 서비스 증설 제어 시스템(100)은 엣지 서비스 이용 장치(200)와 클라우드 서버(300)간의 통신 경로 중간에 위치하고서 스스로의 판단에 따라 엣지 서비스 이용 장치(200)의 요청을 클라우드 서버(300)로의 전달하고, 그 결과 응답을 엣지 서비스 이용 장치(200)에 전달하는 기능을 수행한다.
더 나아가 엣지 서비스 증설 제어 시스템(100)은 클라우드 서버(300)로부터 각 클라우드 엣지 서비스들의 상태(예를 들어 자원 소모량, 처리 성공/실패 상태 등)를 수신하고, 그 정보에 따라 각 클라우드 엣지 서비스의 증설(scale out)을 제어할 수 있다.
이러한 엣지 서비스 증설 제어 시스템(100)의 구체적인 기능 블록의 일 예는 도 2에 도시된 바와 같다.
동 도면에 도시된 바와 같이 엣지 서비스 증설 제어 시스템(100)은 기초 정보 수집부(110), 정보 등록부(120), 추이 정보 수집부(130), 예측 정보 생성부(140), 증설 제어부(150)를 포함하여 구성될 수 있다.
기초 정보 수집부(110)는 각 클라우드 엣지 서비스 각각에 대한 자원 사용량에 대한 정보와 각 클라우드 엣지 서비스로의 요청량 정보 중 적어도 어느 하나와, 각 클라우드 엣지 서비스의 오류 상태 정보를 포함하는 모니터링 정보를 수집하는 기능을 수행한다.
예를 들어 기초 정보 수집부(110)는 주기적으로 클라우드 서버(300)에 각 클라우드 엣지 서비스의 실행과 관련된 정보를 요청하고, 클라우드 서버(300)는 각 클라우드 엣지 서비스들의 자원 소모량(cpu, 메모리 등의 이용량)과 클라우드 엣지 서비스들의 실행 상태에 해당하는 실행 성공 또는 실행 실패 등에 대한 정보를 제공할 수 있는 것이다.
특히 기초 정보 수집부(110)는 이처럼 클라우드 서버(300)로부터 수집되는 정보 이외에도 클라우드 서버(300)의 각 클라우드 엣지 서비스로 향하는 엣지 서비스 이용 장치(200)의 요청량도 함께 수집할 수 있다.
기초 정보 수집부(110)가 이처럼 모니터링 정보를 수집함에 있어서 자원 소모량 또는 요청량의 증가로 인해 발생되지 않은 클라우드 엣지 서비스의 오류는 제외시킬 수 있다.
즉, 본 실시예에서 관심이 있는 부분은 클라우드 엣지 서비스에서 자원 부족 상태 또는 과도한 요청 처리 상태로 인해 정상적인 서비스가 이루어지지 않는 경우이므로, 이러한 경우를 제외한 예를 들어 네트워크 장애나 인스턴스 종료 등의 상태에 수집된 정보는 제외시킬 수 있는 것이다. 이는 수집되는 정보의 양을 최소화하고 불필요한 정보의 수집으로 인해 기능 저하를 방지하기 위함이다.
정보 등록부(120)는 정보 수집부에서 수집된 모니터링 정보(즉, 각 클라우드 엣지 서비스의 자원 사용량, 오류 상태 정보, 해당 클라우드 엣지 서비스로 향하는 요청량 정보)를 기초로 각 클라우드 엣지 서비스에 오류가 발생한 순간의 자원 사용량 또는 요청량을 판단하여 기능을 수행한다.
예를 들어 정보 등록부(120)는 클라우드 서버(300)로부터 특정 클라우드 엣지 서비스의 부하 증가로 인한 오류 발생을 사실을 수신한 경우, 그 시점의 해당 클라우드 엣지 서비스의 자원 사용량 또는 해당 클라우드 엣지 서비스로 향하는 요청량을 판단하여 그 정보들을 장애 가능 정보로 등록하는 것이다.
즉, 해당 자원 사용량 또는 해당 요청량에 도달하는 경우에는 특정 클라우드 엣지 서비스에 장애가 발생할 가능성이 높다는 의미로 장애 가능 정보로 등록하는 것이다.
이러한 정보 등록부(120)의 기능은 지속적으로 수행되는 것으로서, 예를 들어 특정 클라우드 엣지 서비스에 오류가 발생한 순간의 자원 사용량 또는 요청량이 복수 개인 경우 가장 작은 값을 가지는 자원 사용량 또는 요청량을 장애 가능 정보로 등록할 수 있다.
예를 들어 기존에 A라는 클라우드 엣지 서비스의 cpu 사용량이 70%일 때 해당 A 클라우드 엣지 서비스에 장애가 발생함에 따라 cpu-70%를 A 클라우드 엣지 서비스에 매칭시켜 등록해 놓은 상태에서, 추후 그 A 클라우드 엣지 서비스의 cpu 사용량이 65%일 때도 A 클라우드 엣지 서비스에 장애가 발생한 경우에는 정보 등록부(120)는 기존에 등록된 내용을 갱신하여 cpu-65%를 A 클라우드 엣지 서비스에 매칭시켜 등록할 수 있는 것이다.
추이 정보 수집부(130)는 각 클라우드 엣지 서비스 각각에 대한 자원 사용량 추이 정보와, 각 클라우드 엣지 서비스로의 요청량 추이 정보 중 적어도 어느 하나를 수집하는 기능을 수행한다.
여기서 추이 정보는 변화해 가는 정보를 의미하는 것으로서, 예를 들어 특정 클라우드 엣지 서비스의 자원 사용량이 증가하거나 감소하는 추세 또는 해당 클라우드 엣지 서비스로 향하는 요청량이 증가하거나 감소하는 추세를 나타내는 정보라 할 수 있다.
이를 위해 기 설정된 기간 동안에 각각의 정보들을 누적 저장하면서 모니터링 해야 함은 당연하다.
추이 정보 수집부(130)는 기 설정된 시간 간격으로 각 추이 정보(즉, 자원 사용량 추이 정보 또는 요청량 추이 정보)를 수집할 수 있는데, 예를 들어 10초 간격으로 이러한 각 추이 정보를 수집할 수 있다.
더 나아가 추이 정보 수집부(130)는 각 클라우드 엣지 서비스로 향하는 요청의 종류와 각 요청에 의해 소모되는 자원 사용량을 포함하는 요청 관련 정보를 추가적으로 수집할 수도 있다.
엣지 서비스 이용 장치(200)가 클라우드 서버(300)에 요청하는 요청의 종류는 다양할 수 있는데(예를 들어 특정 리스트의 전달을 요청하는 요청, 또는 특정 계산을 요청하는 요청 등), 추이 정보 수집부(130)는 이러한 요청의 종류를 서로 구별하여 수집할 수 있다.
또한 각 요청의 처리를 위해 클라우드 엣지 서비스에서 필요로 하는 자원 소모량이 다를 수 있는데, 추이 정보 수집부(130)는 이러한 각 요청을 처리하기 위한 클라우드 엣지 서비스의 자원 소모량을 클라우드 서버(300)로부터 수집할 수 있는 것이다.
클라우드 서버(300)에서 각 요청에 의한 자원 소모량을 판단하는 것 그 자체는 공지된 기술에 해당하므로 보다 상세한 설명은 생략한다.
예측 정보 생성부(140)는 추이 정보 수집부(130)에서 수집된 각 추이 정보를 기초로 예측 정보를 생성하는 기능을 수행한다.
예를 들어 예측 정보 생성부(140)는 각 추이 정보별 기 설정된 알고리즘에 따라 예측 정보를 생성할 수 있는데, 각 추이 정보별 알고리즘은 누적된 빅데이터를 통해 생성된 고차원 함수일 수 있고, 또는 정보 등록부(120)에서 등록된 별도의 정보와의 비교를 수행하는 기능을 포함하는 것일 수도 있다.
예를 들어 앞서 설명에서는 정보 등록부(120)는 각 클라우드 엣지 서비스에 오류가 발생한 순간의 자원 사용량 또는 요청량을 판단하여 장애 가능 정보로 등록하는 것에 대해서만 설명하였으나, 정보 등록부(120)는 이러한 자원 사용량 또는 요청량의 추이 정보(예를 들어 그 변화 곡선)를 등록할 수 있고, 이 경우 예측 정보 생성부(140)는 현 시점의 각 추이 정보(즉, 추이 정보 수집부(130)에서 수집한 추이 정보)와 정보 등록부(120)에서 등록한 추이 정보(변화 곡선)를 서로 비교하여 장래의 예측 정보를 생성할 수 있는 것이다.
예를 들어 추이 정보 수집부(130)가 10초 간격으로 추이 정보를 수집하는 경우, 예측 정보 생성부(140)는 현 시점까지 수집된 추이 정보를 정보 등록부(120)에 의해 등록된 추이 정보와 비교하여 다음 10초 뒤의 특정 클라우드 엣지 서비스의 자원 사용량 또는 해당 클라우드 엣지 서비스로 향하는 요청량에 해당하는 예측 정보를 생성할 수 있는 것이다.
다른 예로써, 상술한 바와 같이 추이 정보 수집부(130)가 각 클라우드 엣지 서비스로 향하는 요청의 종류와 각 요청에 의해 소모되는 자원 사용량을 포함하는 요청 관련 정보를 추가적으로 수집하는 경우, 예측 정보 생성부(140)는 추이 정보 수집부(130)에서 수집한 각 추이 정보 및 요청 관련 정보를 함께 고려하여 예측 정보를 생성할 수도 있다.
예를 들어 특정 클라우드 엣지 서비스로 향하는 요청량에 대해서 설명하면, 단순히 요청량의 추이만을 이용하는 경우 예측 정보의 정확도가 떨어질 수 있지만, 요청의 종류를 함께 고려하여 즉, 특정 요청의 추이를 이용하는 경우 예측 정보의 정확도가 높아질 수 있는 것이다.
이는 특정 요청에 대한 자원 사용량을 이용하여 예측하는 경우에도 마찬가지이다.
증설 제어부(150)는 예측 정보 생성부(140)에서 생성된 예측 정보가 장애 가능 정보에 부합하는 경우 해당하는 클라우드 엣지 서비스에 대한 증설 제어를 수행한다.
예를 들어 특정 클라우드 엣지 서비스에 대해 cpu 사용률이 65%가 장애 가능 정보로써 등록된 경우, 증설 제어부(150)는 예측 정보 생성부(140)에서 생성된 cpu 사용률 예측 정보가 65% 이상이 되는 경우 클라우드 엣지 서비스에 대한 증설 제어를 수행하는 것이다.
이러한 증설 제어는 클라우드 서버(300)에 scale out 명령을 내리는 방식으로 이루어질 수도 있고, 클라우드 서버(300)는 이러한 명령에 따라 특정 클라우드 엣지 서비스에 대한 scale out(증설) 처리를 수행할 수 있다.
특정 클라우드 엣지 서비스에 대한 scale out 처리 과정 그 자체는 공지된 기술에 해당하므로 보다 상세한 설명은 생략한다.
이에 따라 클라우드 엣지 서비스에서 실제 오류가 발생되기 미리 특정 클라우드 엣지 서비스에 대한 scale out이 이루어짐으로써, 클라우드 엣지 서비스의 서비스 오류 발생 시간을 최소화할 수 있다.
이하에서는 도 3 및 도 4를 참조하여 본 발명의 일 실시예에 따른 엣지 서비스 증설 제어 시스템(100)의 전체적인 제어 과정을 설명한다.
우선 도 3에는 장애 가능 정보가 등록되는 과정이 도시되었다.
엣지 서비스 증설 제어 시스템(100)은 클라우드 엣지 서비스별 cpu/메모리 사용률을 주기적으로 수집하는(단계 S1) 한편, 각 클라우드 엣지 서비스로 향하는 요청량을 주기적으로 수집한다(단계 S3).
예를 들어 엣지 서비스 증설 제어 시스템(100)은 해당 특정 클라우드 엣지 서비스의 처리 오류 시점의 cpu/메모리 사용률과, 해당 특정 클라우드 엣지 서비스로 향하는 요청량 정보를 확인할 수 있다.
이후, 엣지 서비스 증설 제어 시스템(100)은 그 특정 클라우드 엣지 서비스에서의 처리 오류 발생 시점의 cpu/메모리 사용률과 요청량 정보를 확인하는데(단계 S5), 이때 엣지 서비스 증설 제어 시스템(100)은 cpu/메모리 사용률과 요청량 증가와 무관한 오류는 제외시킨다(단계 S7).
엣지 서비스 증설 제어 시스템(100)은 특정 클라우드 엣지 서비스의 처리 오류 발생 시점의 cpu/메모리 사용률과 요청량의 최솟값(복수 개의 정보가 수집된 경우에 한함)을 장애 가능 정보로써 그 특정 클라우드 엣지 서비스에 매칭시켜 등록한다(단계 S9).
다음으로 도 4에는 상술한 바와 같이 특정 클라우드 엣지 서비스에 대해 장애 가능 정보가 등록된 상태에서 실시간으로 사전에 스케일 아웃이 진행되는 과정이 도시되었다.
엣지 서비스 증설 제어 시스템(100)은 클라우드 엣지 서비스별 cpu/메모리 사용률을 주기적으로 수집하는(단계 S11) 한편, 각 클라우드 엣지 서비스로 향하는 요청량을 주기적으로 수집한다(단계 S13).
이어서 엣지 서비스 증설 제어 시스템(100)은 그 수집되는 정보를 기초로 각 클라우드 엣지 서비스별 cpu/메모리 사용률과 각 클라우드 엣지 서비스별 요청량의 추이를 분석한다(단계 S15).
이러한 분석을 통해 엣지 서비스 증설 제어 시스템(100)은 다음 정보 수집 주기의 각 클라우드 엣지 서비스의 cpu/메모리 사용률(자원 소모량) 및 해당 클라우드 엣지 서비스로 향하는 요청량을 예측한다(단계 S17).
예측 결과 특정 클라우드 엣지 서비스의 cpu/메모리 사용량이 장애 가능 정보에 부합하는 경우(단계 S19) 엣지 서비스 증설 제어 시스템(100)은 그 특정 클라우드 엣지 서비스에 대한 scale out 제어 처리를 수행한다(단계 S23).
마찬가지로 예측 결과 특정 클라우드 엣지 서비스로 향하는 엣지 서비스 이용 장치(200)의 요청량이 장애 가능 정보에 부합하는 경우(단계 S21) 엣지 서비스 증설 제어 시스템(100)은 그 특정 클라우드 엣지 서비스에 대한 scale out 제어 처리를 수행한다(단계 S23).
한편, 상술한 각 실시예를 수행하는 과정은 소정의 기록 매체(예를 들어 컴퓨터로 판독 가능한)에 저장된 프로그램 또는 애플리케이션에 의해 이루어질 수 있음은 물론이다. 여기서 기록 매체는 RAM(Random Access Memory)과 같은 전자적 기록 매체, 하드 디스크와 같은 자기적 기록 매체, CD(Compact Disk)와 같은 광학적 기록 매체 등을 모두 포함한다.
이때, 기록 매체에 저장된 프로그램은 컴퓨터나 스마트폰 등과 같은 하드웨어 상에서 실행되어 상술한 각 실시예를 수행할 수 있다. 특히, 상술한 본 발명에 따른 엣지 서비스 증설 제어 시스템(100)의 기능 블록 중 적어도 어느 하나는 이러한 프로그램 또는 애플리케이션에 의해 구현될 수 있다.
또한, 본 발명은 상기한 특정 실시예에 한정되는 것이 아니라 본 발명의 요지를 벗어나지 않는 범위 내에서 여러 가지로 변형 및 수정하여 실시할 수 있는 것이다. 이러한 변형 및 수정이 첨부되는 청구범위에 속한다면 본 발명에 포함된다는 것은 자명할 것이다.
100 : 엣지 서비스 증설 제어 시스템 200 : 엣지 서비스 이용 장치
300 : 클라우드 서버 110 : 기초 정보 수집부
120 : 정보 등록부 130 : 추이 정보 수집부
140 : 예측 정보 생성부 150 : 증설 제어부

Claims (9)

  1. 엣지 서비스 이용 장치의 요청을 클라우드 서버에 전달하고 클라우드 서버의 응답을 엣지 서비스 이용 장치에 전송하는 엣지 서비스 증설 제어 시스템의 제어방법에 있어서,
    (a) 상기 클라우드 서버에 구비된 클라우드 엣지 서비스 각각에 대한 자원 사용량에 대한 정보와 상기 각 클라우드 엣지 서비스로의 요청량 정보 중 적어도 어느 하나와, 상기 각 클라우드 엣지 서비스의 오류 상태 정보를 포함하는 모니터링 정보를 수집하는 단계와;
    (b) 상기 (a) 단계에서 수집된 모니터링 정보를 기초로 각 클라우드 엣지 서비스에 오류가 발생한 순간의 자원 사용량 또는 요청량을 판단하여 장애 가능 정보로 등록하는 단계와;
    (c) 상기 각 클라우드 엣지 서비스 각각에 대한 자원 사용량 추이 정보와, 상기 각 클라우드 엣지 서비스로의 요청량 추이 정보 중 적어도 어느 하나를 수집하는 단계와;
    (d) 상기 (c) 단계에서 수집된 각 추이 정보를 기초로 예측 정보를 생성하는 단계와;
    (e) 상기 (d) 단계에서 생성된 예측 정보가 상기 장애 가능 정보에 부합하는 경우 해당하는 클라우드 엣지 서비스에 대한 증설 제어를 수행하는 단계를 포함하고,
    상기 (c) 단계에서는 각 클라우드 엣지 서비스로 향하는 요청의 종류와 각 요청에 의해 소모되는 자원 사용량을 포함하는 요청 관련 정보를 추가적으로 수집하고,
    상기 (d) 단계에서는 상기 (c) 단계에서 수집된 각 추이 정보 및 요청 관련 정보를 기초로 예측 정보를 생성하는 것을 특징으로 하는 엣지 서비스 증설 제어 시스템의 제어방법.
  2. 제1항에 있어서,
    상기 (c) 단계에서는 기 설정된 시간 간격으로 상기 각 추이 정보를 수집하고,
    상기 (d) 단계에서는 상기 (c) 단계에서 수집된 현재까지의 추이 정보를 기초로 다음 추이 정보 수집 시점에 대응되는 예측 정보를 생성하는 것을 특징으로 하는 엣지 서비스 증설 제어 시스템의 제어방법.
  3. 제1항에 있어서,
    상기 (b) 단계에서는 클라우드 엣지 서비스에 오류가 발생한 순간의 자원 사용량 또는 요청량이 복수 개인 경우 가장 작은 값을 가지는 자원 사용량 또는 요청량을 장애 가능 정보로 등록하는 것을 특징으로 하는 엣지 서비스 증설 제어 시스템의 제어방법.
  4. 삭제
  5. 하드웨어와 결합되어 제1항 내지 제3항 중 어느 한 항의 방법을 실행시키기 위하여 컴퓨터 판독 가능 기록 매체에 저장된 응용 프로그램.
  6. 엣지 서비스 이용 장치의 요청을 클라우드 서버에 전달하고 클라우드 서버의 응답을 엣지 서비스 이용 장치에 전송하는 엣지 서비스 증설 제어 시스템에 있어서,
    상기 클라우드 서버에 구비된 클라우드 엣지 서비스 각각에 대한 자원 사용량에 대한 정보와 상기 각 클라우드 엣지 서비스로의 요청량 정보 중 적어도 어느 하나와, 상기 각 클라우드 엣지 서비스의 오류 상태 정보를 포함하는 모니터링 정보를 수집하는 기초 정보 수집부와;
    상기 정보 수집부에서 수집된 모니터링 정보를 기초로 각 클라우드 엣지 서비스에 오류가 발생한 순간의 자원 사용량 또는 요청량을 판단하여 장애 가능 정보로 등록하는 정보 등록부와;
    상기 각 클라우드 엣지 서비스 각각에 대한 자원 사용량 추이 정보와, 상기 각 클라우드 엣지 서비스로의 요청량 추이 정보 중 적어도 어느 하나를 수집하는 추이 정보 수집부와;
    상기 추이 정보 수집부에서 수집된 각 추이 정보를 기초로 예측 정보를 생성하는 예측 정보 생성부와;
    상기 예측 정보 생성부에서 생성된 예측 정보가 상기 장애 가능 정보에 부합하는 경우 해당하는 클라우드 엣지 서비스에 대한 증설 제어를 수행하는 증설 제어부를 포함하고,
    상기 추이 정보 수집부는 각 클라우드 엣지 서비스로 향하는 요청의 종류와 각 요청에 의해 소모되는 자원 사용량을 포함하는 요청 관련 정보를 추가적으로 수집하고,
    상기 예측 정보 생성부는 상기 추이 정보 수집부에서 수집한 각 추이 정보 및 요청 관련 정보를 기초로 예측 정보를 생성하는 것을 특징으로 하는 엣지 서비스 증설 제어 시스템.
  7. 제6항에 있어서,
    상기 추이 정보 수집부는 기 설정된 시간 간격으로 상기 각 추이 정보를 수집하고,
    상기 예측 정보 생성부는 상기 추이 정보 수집부에서 수집한 현재까지의 추이 정보를 기초로 다음 추이 정보 수집 시점에 대응되는 예측 정보를 생성하는 것을 특징으로 하는 엣지 서비스 증설 제어 시스템.
  8. 제6항에 있어서,
    상기 정보 등록부는 클라우드 엣지 서비스에 오류가 발생한 순간의 자원 사용량 또는 요청량이 복수 개인 경우 가장 작은 값을 가지는 자원 사용량 또는 요청량을 장애 가능 정보로 등록하는 것을 특징으로 하는 엣지 서비스 증설 제어 시스템.
  9. 삭제
KR1020200159828A 2020-11-25 2020-11-25 엣지 서비스 증설 제어 시스템 및 그 제어방법 KR102448702B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200159828A KR102448702B1 (ko) 2020-11-25 2020-11-25 엣지 서비스 증설 제어 시스템 및 그 제어방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200159828A KR102448702B1 (ko) 2020-11-25 2020-11-25 엣지 서비스 증설 제어 시스템 및 그 제어방법

Publications (2)

Publication Number Publication Date
KR20220072338A KR20220072338A (ko) 2022-06-02
KR102448702B1 true KR102448702B1 (ko) 2022-09-29

Family

ID=81985631

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200159828A KR102448702B1 (ko) 2020-11-25 2020-11-25 엣지 서비스 증설 제어 시스템 및 그 제어방법

Country Status (1)

Country Link
KR (1) KR102448702B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019028538A (ja) 2017-07-26 2019-02-21 日本電信電話株式会社 オートスケール処理装置、オートスケール方法及びプログラム
US20200007460A1 (en) * 2018-06-29 2020-01-02 Intel Corporation Scalable edge computing

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101971013B1 (ko) * 2016-12-13 2019-04-22 나무기술 주식회사 빅데이터 기반의 클라우드 인프라 실시간 분석 시스템 및 그 제공방법
KR102110592B1 (ko) 2018-10-10 2020-06-08 전자부품연구원 IoT 컴퓨팅 환경에서의 클라우드와 엣지간의 분산 처리 방법 및 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019028538A (ja) 2017-07-26 2019-02-21 日本電信電話株式会社 オートスケール処理装置、オートスケール方法及びプログラム
US20200007460A1 (en) * 2018-06-29 2020-01-02 Intel Corporation Scalable edge computing

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Mbarka Soualhia 외 2명. Infrastructure fault detection and prediction in edge cloud environments. 2019년 11월

Also Published As

Publication number Publication date
KR20220072338A (ko) 2022-06-02

Similar Documents

Publication Publication Date Title
CN109597685B (zh) 任务分配方法、装置和服务器
CN107592345B (zh) 交易限流装置、方法及交易系统
US10158541B2 (en) Group server performance correction via actions to server subset
US8099379B2 (en) Performance evaluating apparatus, performance evaluating method, and program
US8234229B2 (en) Method and apparatus for prediction of computer system performance based on types and numbers of active devices
US10904112B2 (en) Automatic capture of detailed analysis information based on remote server analysis
CN107370806B (zh) Http状态码监控方法、装置、存储介质和电子设备
CN107924360B (zh) 计算系统中的诊断框架
US8005654B2 (en) Method, apparatus and computer program product for intelligent workload control of distributed storage
US9176789B2 (en) Capacity control
JP6481299B2 (ja) 監視装置、サーバ、監視システム、監視方法および監視プログラム
CN111405030B (zh) 一种消息推送方法、装置、电子设备和存储介质
US11809505B2 (en) Method for pushing information, electronic device
CN111311286A (zh) 一种智能客服数据处理方法、装置及计算设备、存储介质
CN115269108A (zh) 一种数据处理方法、装置及设备
JP2005128866A (ja) 計算機装置及び計算機装置の制御方法
KR102448702B1 (ko) 엣지 서비스 증설 제어 시스템 및 그 제어방법
Zhou et al. Cushion: A proactive resource provisioning method to mitigate SLO violations for containerized microservices
CN115168042A (zh) 监控集群的管理方法及装置、计算机存储介质、电子设备
CN113656391A (zh) 数据检测方法及装置、存储介质及电子设备
US20170372334A1 (en) Agent-based monitoring of an application management system
US20230132786A1 (en) Artificial intelligence based power consumption optimization
CN117097635B (zh) 调用链路采样方法、装置、存储介质及设备
US11818227B1 (en) Application usage analysis-based experiment generation
CN115396319B (zh) 数据流分片方法、装置、设备及存储介质

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant