KR101781063B1 - 동적 자원 관리를 위한 2단계 자원 관리 방법 및 장치 - Google Patents

동적 자원 관리를 위한 2단계 자원 관리 방법 및 장치 Download PDF

Info

Publication number
KR101781063B1
KR101781063B1 KR1020120037937A KR20120037937A KR101781063B1 KR 101781063 B1 KR101781063 B1 KR 101781063B1 KR 1020120037937 A KR1020120037937 A KR 1020120037937A KR 20120037937 A KR20120037937 A KR 20120037937A KR 101781063 B1 KR101781063 B1 KR 101781063B1
Authority
KR
South Korea
Prior art keywords
resource
virtual node
virtual
virtual machine
job
Prior art date
Application number
KR1020120037937A
Other languages
English (en)
Other versions
KR20130115553A (ko
Inventor
임은지
차규일
김영호
안신영
김진미
배승조
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020120037937A priority Critical patent/KR101781063B1/ko
Priority to CN2013101589292A priority patent/CN103377092A/zh
Publication of KR20130115553A publication Critical patent/KR20130115553A/ko
Application granted granted Critical
Publication of KR101781063B1 publication Critical patent/KR101781063B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/301Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources

Abstract

본 발명은 다중 노드가 네트워크로 연결된 클러스터 시스템 환경에서의 자원 관리 방법 및 장치에 관한 발명으로, 상세하게는, 클러스터 시스템에서 실행하고자 하는 작업을 입력 받고, 상기 입력된 작업에 대응되는 제1 유휴작업을 생성하여 상기 생성된 제1 유휴작업에 대응되는 제1 가상 머신을 생성하고, 생성된 제1 가상 머신에서 상기 입력된 작업을 실행하고, 상기 입력된 작업이 실행되는 중, 상기 제1 가상 머신의 가상 노드의 자원 사용을 감시하여 상기 가상 노드가 과부하 또는 저부하 상태인 경우, 상기 가상 노드의 조정을 수행함으로써, 작업이 실행될 때 자원의 사용 상태에 따라서 동적으로 자원을 조정할 수 있도록 하여 시스템의 자원 활용 효율을 높이고, 자원 부족으로 인한 서비스의 성능 저하를 방지 할 수 있게 하는 발명이다.

Description

동적 자원 관리를 위한 2단계 자원 관리 방법 및 장치{TWO-LEVEL RESOURCE MANAGEMENT METHOD AND APPRATUS FOR DYNAMIC RESOURCE MANAGEMENT}
본 발명은, 다중 노드가 네트워크로 연결된 클러스터 시스템 환경에서의 자원 관리 방법 및 장치에 관한 발명으로, 상세하게는, 자원들이 포함된 클러스터 컴퓨팅 환경에서, 동적으로 가용 자원을 분배하고, 관리할 수 있도록 하는 효율적인 자원 관리 방법 및 장치에 관한 발명이다.
고성능 컴퓨팅(High Performance Computing; HPC)분야에서, 주류를 이루는 분산/병렬 컴퓨팅 환경은 클러스터 시스템이다. 또한, 하드웨어 기술의 발달로 클러스터를 구성하는 노드들의 자원 구성이 다양화 되고 각 자원이 지원하는 용량도 대용량화 되고 있다.
클러스터 시스템의 자원 관리 시스템은 사용자의 작업 실행 요청을 받아서 작업에 자원을 할당하고, 작업을 관리 한다.
즉, 사용자는 작업을 제출할 때 필요한 자원량을 함께 제시할 수 있고, 자원 관리 시스템은 각 노드의 자원 상태를 파악하고 유지할 수 있다.
따라서, 자원 관리 시스템은, 작업 실행 요청을 받았을 때 작업을 실행하기 위해 필요한 가용한 자원이 있으면 작업에 자원을 할당하고, 가용한 자원이 없으면 작업을 대기열에 넣고, 추후 가용자원이 생기면 대기열에 있는 작업에 자원을 할당하고 작업을 실행시킬 수 있다.
또한, 자원 관리 시스템은 작업을 시작할 때 자원을 할당하고, 작업이 종료되면 자원을 회수할 수 있을 뿐, 작업의 실행 도중에 자원의 사용 상태에 따라서 동적으로 할당 자원을 조정하지 않는다.
즉, 일부의 종래 기술(에서 작업의 실행 도중 자원을 조정할 수 있는 기능이 포함되어 있지만, 시스템에 의해 자동화되지 않고 사용자가 수동으로 해야 하는 경우이고, 또한, 다른 종래 기술(한국 공개 특허: 제2008-0051040호; 가상화 기반 고가용성 클러스터 시스템 및 고가용성 클러스터 시스템에서 장애관리 방법)에서, 작업의 실행 중, 자원을 조정할 수 있는 기술을 개시하고 있으나, 조정할 수 있는 자원이 극히 제한적이며 미세한 단위(fine-grained)로 조정을 하지 못하게 되는 문제점이 존재하였다.
본 발명은 작업의 실행 도중에 자원의 사용 상태에 따라서 동적으로 할당 자원을 조정하여, 시스템의 자원을 최적으로 활용하여 자원 효율성을 높이는데 그 목적이 있다. 또한, 종래 기술의 자원 관리 시스템을 그대로 활용하면서, 자원 효율성을 향상 시키고자 한다.
본 발명의 실시 예에 따른, 클러스터 시스템의 메인 제어기를 통한 자원 관리 방법은, 상기 클러스터 시스템에서 실행하고자 하는 작업을 입력 받는 단계, 상기 입력된 작업에 대응되는 제1 유휴작업을 생성하는 단계, 상기 생성된 제1 유휴작업에 대응되는 제1 가상 머신을 생성하고, 생성된 가상 머신을 상기 클러스터 시스템의 가상 노드로 등록하는 단계, 상기 가상 노드에서 상기 입력된 작업을 실행하는 단계, 및, 상기 입력된 작업이 실행되는 중, 상기 제1 가상 머신의 가상 노드의 자원 사용을 감시하고, 상기 가상 노드가 과부하 또는 저부하 상태인 경우, 상기 가상 노드를 조정하는 단계를 포함하는 것을 특징으로 한다.
또한, 본 발명의 다른 실시 예에 따른, 자원 관리 장치는, 클러스터 시스템에서 실행하고자 하는 작업이 수신되면, 상기 수신된 작업에 기초하여 가상 머신을 생성하고 생성된 가상 머신에 물리 자원을 할당하는 물리 자원 관리부, 상기 물리 자원 관리부에서 생성된 가상 머신의 가상 노드에 대한 자원 사용 상태를 감시하는 가상 노드 자원 감시부, 및 상기 작업이 입력되면 상기 입력된 작업에 대응되는 제1 유휴작업을 생성하여 상기 물리 자원 관리부로 상기 제1 유휴작업을 전송하고, 상기 물리 자원 관리부에서 상기 제1 유휴작업에 대응되는 제1 가상 머신이 생성하여 생성된 가상 머신을 상기 클러스터 시스템의 가상 노드로 등록하고, 상기 가상 노드를 통하여 상기 입력된 작업을 실행하고, 상기 입력된 작업의 실행 중, 상기 가상 노드 자원 감시부에서 상기 가상 노드의 과부하 또는 저부하가 감지되면, 상기 가상 노드를 조정하도록 제어하는 메인 제어부를 포함하는 것을 특징으로 한다.
본 발명의 구성에 따른 동적 자원 관리 시스템은 작업이 실행될 때 자원의 사용 상태에 따라서 동적으로 자원을 조정할 수 있어서, 자원이 낭비되거나, 작업의 자원이 부족하지 않도록 해주므로, 시스템의 자원 활용 효율을 높이고, 자원 부족으로 인한 서비스의 성능 저하를 방지 할 수 있다.
그리고 기존에 개발된 자원 관리 시스템을 그대로 활용할 수 있어서 동적 자원 관리 시스템의 개발이 용이하고 시스템의 안정성을 높일 수 있다.
또한, 가상 머신을 통해 작업을 실행함으로써, 가상 노드에 결함이 발생해도 이것이 물리 노드 전체에 전파되지 않고 가상 머신에 국한되어 영향을 미치므로 다른 가상 노드에서 실행중인 작업은 계속 실행될 수 있다.
도 1은 종래 기술에 따른 자원 관리 장치를 도시한 도면이다.
도 2는 본 발명의 실시 예에 따른 자원 관리 방법을 도시한 순서도이다.
도 3은 본 발명의 실시 예에 따른 가상 노드 조정 단계를 도시한 순서도이다.
도 4는 본 발명의 실시 예에 따른 가상 노드 조정 단계를 상세히 도시한 도면이다.
도 5는 본 발명의 실시 예에 따른 자원 관리 장치의 구성을 도시한 도면이다.
도 6은 본 발명의 실시 예에 따른 자원 관리 장치의 작업 실행을 도시한 도면이다.
도 7은 본 발명의 실시 예에 따른 자원 관리 장치의 작업 동적 이전을 도시한 도면이다.
도 8은 본 발명의 실시 예에 따른 자원 관리 장치의 조정된 작업 실행을 도시한 도면이다.
이하에서는 첨부된 도면을 참조하여 본 발명의 여러 가지 실시 예들을 보다 상세히 설명하도록 하겠다. 나아가, 이하의 설명에서 사용되는 구성요소에 대한 접미사 "부", “모듈” 및 "장치"는 단순히 본 명세서 작성의 용이함을 고려하여 부여되는 것으로서, 상기 "부", “모듈” 및 "장치"는 서로 혼용되어 사용될 수 있으며, 하드웨어 또는 소프트웨어로 설계 가능하다.
나아가, 이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 실시 예를 상세하게 설명하지만, 본 발명이 실시 예들에 의해 제한되거나 한정되는 것은 아니다.
도 1은 종래 기술에 따른 자원 관리 장치를 도시한 도면이다.
실시 예에 따라, 클러스터 시스템의 자원 관리 장치(101)가 처음 구동되면 설정된 정보를 바탕으로, 클러스터 시스템에 포함된 모든 노드(103, 104, 105)의 자원 상태를 수집한다.
상기 자원 상태는 각 노드의 CPU 개수, 메모리 크기, 네트워크 최대 대역폭 등에 대한 정보를 포함할 수 있다.
따라서, 사용자에 의해 클러스터 시스템에서 수행하고자 하는 작업이 입력되면 자원 관리 장치(101)는 작업에 필요한 자원이 가용한지 검사하여 상기 작업에 클러스터 시스템의 자원을 할당한다.
또한, 다른 작업이 추가적으로 입력되면, 이전 작업에 할당되지 않고 남은 자원 중에서 필요 자원을 추가적으로 입력된 자원에 할당한다.
또한, 클러스터 시스템의 할당할 여유 자원이 없는 경우에는 대기열(102)에 작업을 넣고, 작업에 할당이 가능한 가용 자원이 생길 때까지 입력된 작업을 대기시킬 수 있다.
도 2는 본 발명의 실시 예에 따른 자원 관리 방법을 도시한 순서도이다.
먼저, 클러스터 시스템의 메인 제어기가 상기 클러스터 시스템에서 실행하고자 하는 작업을 입력 받는다(S201).
다음으로, 상기 입력된 작업에 대응되는 제1 유휴작업을 생성한다(S202).
다음으로, 상기 생성된 제1 유휴작업에 대응되는 제1 가상 머신을 생성한다(S203).
즉, 서버 가상화를 통한 가상 머신을 생성한다. 서버 가상화는 독립적인 CPU, 메모리, 네트워크, 운영체계 등을 갖는 복수의 가상 머신이 하나의 물리적인 시스템의 자원을 분할해 사용하는 것이다.
다음으로, 생성된 가상 머신을 상기 클러스터 시스템의 가상 노드로 등록하고, 등록된 가상 노드에서 작업을 실행함으로써, 상기 생성된 제1 가상 머신에서 상기 입력된 작업을 실행한다(S204).
다음으로, 상기 입력된 작업이 실행되는 중, 상기 제1 가상 머신의 가상 노드의 자원 사용을 감시하고, 상기 가상 노드가 과부하 또는 저부하 상태인 경우, 상기 가상 노드를 조정한다(S205).
상기 가상 노드 조정에 관하여는 이하 도 3 내지 도 4에서 상세히 설명한다.
즉, 본 발명의 실시 예에 따른 자원 활용 방법은, 상기와 같은 단계들을 통하여 효율적인 자원 활용을 위한 동작을 수행할 수 있다.
도 3은 본 발명의 실시 예에 따른 가상 노드 조정 단계를 도시한 순서도이다.
실시 예에 따라, 생성된 가상 머신을 통하여 입력된 작업이 실행되면, 메인 제어부는, 가상 머신의 가상 노드에 대한 자원의 활용 정보를 계속하여 수집함으로써, 가상 노드 자원을 감시한다(S301).
상기 감시 결과, 가상 노드의 과부하 또한 저부하 상태가 감지되는지 여부를 판단하고(S302), 판단 결과, 과부하 또는 저부하 상태가 감지되면, 가상 노드 조정을 수행한다(S303).
즉, 상기 가상 노드가 과부하 상태일 경우에 상기 가상 노드를 확장하고, 상기 가상 노드가 저부하 상태일 경우에 상기 가상 노드를 축소할 수 있다.
가상 노드 조정에 관하여는 이하 도 4에서 상세히 설명한다.
도 4는 본 발명의 실시 예에 따른 가상 노드 조정 단계를 상세히 도시한 도면이다.
상기 도 3의 과부하 또는 저부하 상태 감지 단계에서, 가상 노드 자원의 과부하 또는 저부하가 감지되면, 메인 제어부는 물리 자원 관리부로 갱신된 자원 명세(Resource Description) 및 새로운 유휴작업을 전달할 수 있고(S401), 이를 통하여 새로운 가상 머신이 생성되도록 할 수 있다(S402).
자원 명세는, 작업 수행에 필요한 자원에 관한 정보를 포함할 수 있으며, 상기 갱신된 자원 명세는, 가상 노드가 과부하 상태일 경우에 확장된 자원 명세일 수 있고, 가상 노드가 저부하 상태일 경우에 축소된 자원 명세일 수 있다.
다음으로, 신규로 생성된 가상 머신으로 실행 중인 작업에 대한 가상 머신 동적 이전(S403)을 수행할 수 있다.
가상 머신의 동적 이전(live migration)은 하나의 서버에서 구동 중인 가상 머신을 기존 운영체제나 소프트웨어의 중단, 조정 없이 또 다른 서버로 옮기는 것이다.
즉, 실시 예에 따라, 작업이 실행 중인 가상 노드를 유지한 채, 가상 노드가 등록된 가상 머신이 제1 가상 머신에서 제2 가상 머신으로 변경되므로, 작업의 중단 없는 자원의 확장 또는 축소를 수행할 수 있다.
도 5는 본 발명의 실시 예에 따른 자원 관리 장치의 구성을 도시한 도면이다.
본 발명의 실시 예에 따른 자원 관리 장치(200)는, 메인 제어부(201), 물리 자원 관리부(202), 가상 자원 관리부(203), 자원 상태정보 저장부(204), 및 가상 노드 자원 감시부(205)를 포함할 수 있다.
또한, 물리 자원 관리부(202)와 가상 자원 관리부(206)는 종래 기술의 자원 관리 시스템을 활용할 수 있다.
물리 자원 관리부(202)는 클러스터의 물리 노드들의 등록 및 관리, 물리 노드의 자원 할당 상태, 가용 자원 상태 정보를 유지한다.
또한, 물리 자원 관리부(202)는 자신에게 제출된 작업을 위해 물리 노드의 자원을 할당하고 작업을 실행한다.
가상 자원 관리부(203)는 자신에게 등록된 가상 노드를 관리한다.
즉, 가상 노드의 자원 할당 상태, 가용 자원 상태 정보를 유지하고, 제출된 작업을 위해 가상 노드의 자원을 할당하고 작업을 실행한다.
메인 제어부(201)는 가상 머신을 관리하여 동적 자원 관리를 수행할 수 있다.
따라서, 메인 제어부(201)는 사용자로부터 클러스터 시스템에서 수행될 작업과 상기 작업의 요구 자원 내역을 입력 받을 수 있다.
따라서, 메인 제어부(201)는 유휴 작업과 요구 자원 내역을 물리 자원 관리부(202)로 전달한다. 유휴작업은 실작업(real job)과 같은 자원을 요구하지만 실제로는 아무런 시스템 자원도 사용하지 않는 작업이다.
물리 자원 관리부(202)는 물리 노드에 요구 자원을 할당하고 유휴 작업을 실행한다. 이를 통하여, 물리 자원 관리부(202)로부터 물리 노드에 가상 머신을 생성하기 위한 자원을 할당 받을 수 있다. 또한, 가상 머신을 위해 할당한 자원 할당 정보를 물리 자원 관리부(202)가 유지하도록 할 수 있다.
또한, 물리 자원 관리부(202)로부터 자원을 할당 받은 후, 메인 제어부(201)는 물리 노드에 가상 머신을 생성하고, 생성한 가상 머신을 가상 자원 관리자(203)의 가상 노드로 등록하여, 입력된 작업이 가상 자원 관리부(203)로 전달되어 가상 노드에서 작업이 실행되도록 할 수 있다.
도 6은 본 발명의 실시 예에 따른 자원 관리 장치의 작업 실행을 도시한 도면이다.
실시 예에 따라, 물리 자원 관리부(602)로부터 자원(604)을 할당 받은 후 메인 제어부(601)는 제1 물리 노드(603)에 제1 가상 머신(605)을 생성한다.
또한, 생성된 제1 가상 머신(605)을 가상 자원 관리부(606)의 노드로 등록한다. 그리고 사용자의 실제 작업을 가상 자원 관리부(606)로 전달하여 제1 가상 머신(605)의 가상 노드에서 작업이 실행되도록 한다.
또한, 작업이 완료된 후, 물리 자원의 해제와 가상 머신의 해제를 수행할 수 있다.
즉, 실행 중인 작업이 완료되면, 가상 자원 관리부(606)는 메인 제어부(601)에게 작업의 완료를 알릴 수 있고, 메인 제어부는 가상 머신(605)을 제거하고, 물리 자원 관리부(602)에게 유휴작업의 취소를 요청할 수 있다.
따라서, 물리 자원 관리부(602)는 유휴작업을 취소하고 물리 노드(603)의 자원을 해제하여, 가용 자원으로 복귀되도록 할 수 있다.
도 7은 본 발명의 실시 예에 따른 자원 관리 장치의 작업 동적 이전을 도시한 도면이다.
실시 예에 따라, 상기 도 6에 도시된 바와 같은 구성을 통하여 작업을 수행 중, 가상화 기술을 통한 가상 머신의 동적 이전이 수행될 수 있다. 동적 이전은 하나의 서버에서 구동 중인 가상 머신을 소프트웨어의 중단 없이 또 다른 서버로 옮기는 기술을 의미한다.
즉, 도 7에 도시된 바와 같은 구성을 통하여 가상 노드의 자원을 확장하기 위한 가상 머신 동적 이전이 수행될 수 있다.
먼저, 메인제어부(701)가, 가상 노드 자원 감시부(703)를 통하여, 기존에 제1 물리 노드(705)에서 운영 중이던 제1 가상 머신(706)의 자원 과부하를 감지하면, 제1 가상 머신(709)를 제2 가상 머신(710)으로 동적 이동시켜서 자원을 확장하는 과정을 수행할 수 있다.
가상 노드 자원 감시부(703)는 제1 가상 머신(709)의 가상 노드의 자원 상태를 계속적으로 감시하고 정보를 수집한다. 감시 대상 자원은 CPU, 메모리, 네트워크 대역폭을 포함할 수 있다.
또한, 수집한 자원 상태 정보를 자원 상태 정보 저장부(702)에 저장한다.
한편, 메인 제어부(701)에는 사용자에 의해 설정된 자원 사용률의 상위 임계치와 하위 임계치가 존재한다. 따라서, 제1 가상 머신(709)의 자원 활용률이 일정시간이상 상위 임계치 이상 유지되면 과부하 상태로 판단하고, 일정시간이상 하위 임계치 이하로 유지되면 저부하 상태로 판단한다.
따라서, 메인제어부(701)는 과부하 상태나 저부하 상태가 포착되면 가상 노드의 확장 또는 축소를 실행한다. 즉, 과부하 상태일 경우에 가상 노드가 확장되고, 저부하 상태일 경우에 가상 노드가 축소되도록 제2 가상 머신(710)을 생성하여 동적 이전을 수행할 수 있다. 상기 임계치와 일정 유지 시간은 시스템의 설정에 따라 달라질 수 있다.
즉, 메인제어부(701)는 제1 가상 머신(709)을 동적 이동시킬 새로운 물리 노드를 찾기 위해서 물리 자원 관리부(704)에게 확장 자원 명세와 제2 유휴작업을 전달할 수 있다.
따라서, 물리 자원 관리부는 확장 자원이 가용한 새로운 제2 물리 노드(707)를 선택하고, 신규로 자원을 할당(708)할 수 있다.
즉, 메인 제어부는 제2 물리 노드(707)에 확장 자원을 갖는 새로운 제2 가상 머신(710)을 생성할 수 있고, 이를 통하여 가상 머신의 동적 이전을 수행할 수 있다.
즉, 작업이 구동 중인 제1 가상 머신(709)에서 실행 중이던 작업이 중단되지 않고 계속 실행될 수 있고, 가상 머신을 동적 이전하는 경우에도 네트워크 연결을 그대로 유지할 수 있으므로, 가상 자원 관리부(711)에 등록된 가상 노드도 그대로 유지될 수 있다.
또한, 메인 제어부(701)는, 가상 노드 자원 감시부(703) 및 자원 상태 정보 저장부(702)를 통하여 작업의 수행에 따른 자원 사용 상태에 관한 정보를 계속하여 파악할 수 있다.
도 8은 본 발명의 실시 예에 따른 자원 관리 장치의 조정된 작업 실행을 도시한 도면이다.
상기 도 7에 도시된 바와 같이, 실행 중인 작업이 제2 물리 노드(903)의 제2 가상 머신(904)로 동적 이전되면, 메인 제어부(901)는, 물리 자원 관리부(902)로 제1 가상 머신을 생성하기 위하여 전송하였던 제1 유휴작업의 취소 명령을 전송하여, 제1 가상 머신이 제거되도록 할 수 있다.
따라서, 상기 취소 명령의 전송에 대응하여, 물리 자원 관리부(902)는, 물리 노드 1의 가상 머신을 제거하고, 물리 노드 1에 할당되었던 자원을 해제할 수 있다.
즉, 이를 통하여, 가상 머신의 동적 이전이 수행됨에 따라 더 이상 필요하지 않은 자원들을 가용 자원으로 되돌림으로써, 자원 활용의 효율성을 향상시킬 수 있다.
또한, 현재 실행 중인 작업은 제2 물리 노드(903)의 제2 가상 머신(904)상에서 계속하여 실행될 수 있고, 가상 자원 관리부(905)를 통하여 제2 가상 머신(904)에 할당된 가상 자원을 관리하도록 하여 작업의 실행에 필요한 동작들이 수행되도록 할 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해돼서는 안 될 것이다.
101: 자원 관리 시스템
102: 작업 대기열
103, 104, 105: 자원 노드

Claims (12)

  1. 클러스터 시스템의 메인 제어기를 통한 자원 관리 방법에 있어서,
    상기 클러스터 시스템에서 실행하고자 하는 작업을 입력 받는 단계;
    상기 입력된 작업에 대응되는 제1 유휴작업을 생성하는 단계;
    상기 생성된 제1 유휴작업에 대응되는 제1 가상 머신을 생성하고, 생성된 가상 머신을 상기 클러스터 시스템의 가상 노드로 등록하는 단계;
    상기 가상 노드에서 상기 입력된 작업을 실행하는 단계; 및
    상기 입력된 작업의 실행 중, 상기 가상 노드의 자원 사용을 감시하고, 상기 가상 노드가 과부하 또는 저부하 상태인 경우, 상기 가상 노드를 조정하는 단계를 포함하고,
    상기 가상 노드를 조정하는 단계는,
    상기 가상 노드가 과부하 또는 저부하 상태인 경우, 상기 클러스터 시스템의 물리 자원 관리자로 갱신된 자원 명세 및 제2 유휴작업을 전달하여, 제2 가상 머신이 생성되도록 하는 단계; 및
    상기 실행 중인 작업의 가상 노드를 상기 제2 가상 머신으로 동적 이전하는 단계를 포함하고,
    상기 가상 노드를 조정하는 단계는,
    기 설정된 자원 사용률의 상위 임계치와 하위 임계치에 기초하여, 가상 노드의 자원 활용률이 일정시간 상위 임계치 이상 유지되면 과부하 상태로 판단하고, 일정시간 이상 하위 임계치 이하로 유지되면 저부하 상태로 판단하고,
    상기 가상 노드를 조정하는 단계는,
    상기 과부하 상태로 판단한 경우, 상기 갱신된 자원 명세는 확장된 자원 명세로 갱신하여 상기 물리 자원 관리자로 전달하고, 상기 저부하 상태로 판단한 경우, 상기 갱신된 자원 명세는 축소된 자원 명세로 갱신하여 상기 물리자원 관리자로 전달하고, 상기 확장된 자원 명세 및 상기 축소된 자원 명세 중 어느 하나에 기반하여 상기 제2 가상 머신을 생성하고,
    상기 동적 이전하는 단계는
    상기 실행중인 작업의 가상 노드를 유지한 채, 상기 가상 노드가 등록된 가상 머신을 상기 제1 가상 머신에서 상기 제2 가상 머신으로 변경하여 상기 실행중인 작업의 중단 없이, 상기 동적 이전을 수행하는 것을 특징으로 하는 자원 관리 방법.
  2. 삭제
  3. 청구항 1에 있어서,
    상기 가상 노드를 조정하는 단계는,
    상기 실행 중인 작업의 동적 이전이 완료되면, 상기 물리 자원 관리자로 상기 제1 유휴작업의 취소 명령을 보내어, 상기 제1 가상 머신이 제거되고, 상기 제1 가상 머신에 할당된 자원이 해제되도록 하는 단계를 포함하는 것을 특징으로 하는 자원 관리 방법.
  4. 삭제
  5. 청구항 1에 있어서,
    상기 일정시간, 상기 상위 임계치, 및 상기 하위 임계치는 시스템 설정에 따라 변경되는 것을 특징으로 하는 자원 관리 방법.
  6. 청구항 1에 있어서,
    상기 가상 노드를 조정하는 단계는,
    상기 가상 노드가 과부하 상태일 경우에 상기 가상 노드를 확장하고, 상기 가상 노드가 저부하 상태일 경우에 상기 가상 노드를 축소하는 것을 특징으로 하는 자원 관리 방법.
  7. 클러스터 시스템에서 실행하고자 하는 작업이 입력되면, 상기 입력된 작업에 기초하여 가상 머신을 생성하고, 생성된 가상 머신에 물리 자원을 할당하는 물리 자원 관리부;
    상기 물리 자원 관리부에서 생성된 가상 머신의 가상 노드에 대한 자원 사용 상태를 감시하는 가상 노드 자원 감시부; 및
    상기 작업이 입력되면, 상기 입력된 작업에 대응되는 제1 유휴작업을 생성하여 상기 물리 자원 관리부로 상기 제1 유휴작업을 전송하고, 상기 물리 자원 관리부에서 상기 제1 유휴작업에 대응되는 제1 가상 머신이 생성하여 생성된 가상 머신을 상기 클러스터 시스템의 가상 노드로 등록하고, 상기 가상 노드를 통하여 상기 입력된 작업을 실행하고, 상기 입력된 작업의 실행 중, 상기 가상 노드 자원 감시부에서 상기 가상 노드의 과부하 또는 저부하가 감지되면, 상기 가상 노드를 조정하도록 제어하는 메인 제어부를 포함하고,
    상기 메인 제어부는,
    상기 가상 노드 자원 감시부에서, 상기 가상 노드의 과부하 또는 저부하 상태가 감지되면, 상기 물리 자원 관리부로 갱신된 자원 명세 및 제2 유휴작업을 전달하여, 제2 가상 머신이 생성되도록 하고, 상기 실행 중인 작업이 상기 제2 가상 머신으로 동적 이전되도록 제어하고,
    상기 가상 노드 자원 감시부는,
    기 설정된 자원 사용률의 상위 임계치와 하위 임계치에 기초하여, 상기 가상 노드의 자원 활용률이 일정시간 상위 임계치 이상 유지되면 과부하 상태로 판단하고, 일정시간 이상 하위 임계치 이하로 유지되면 저부하 상태로 판단하고,
    상기 메인 제어부는,
    상기 과부하 상태로 판단한 경우, 상기 갱신된 자원 명세는 확장된 자원 명세로 갱신하여 상기 물리 자원 관리부로 전달하고, 상기 저부하 상태로 판단한 경우, 상기 갱신된 자원 명세는 축소된 자원 명세로 갱신하여 상기 물리자원 관리부로 전달하고, 상기 확장된 자원 명세 및 상기 축소된 자원 명세 중 어느 하나에 기반하여 상기 제2 가상 머신을 생성하고,
    상기 메인 제어부는
    상기 실행중인 작업의 가상 노드를 유지한 채, 상기 가상 노드가 등록된 가상 머신을 상기 제1 가상 머신에서 상기 제2 가상 머신으로 변경하여 상기 실행중인 작업의 중단 없이, 상기 동적 이전을 수행하는 것을 특징으로 하는 자원 관리 장치.
  8. 삭제
  9. 청구항 7에 있어서,
    상기 메인 제어부는,
    상기 실행 중인 작업이 상기 제2 가상 머신으로 동적 이전되면, 상기 물리 자원 관리부로 상기 제1 유휴작업의 취소 명령을 보내어, 상기 제1 가상 머신이 제거되고, 상기 제1 가상 머신에 할당된 자원이 해제되도록 하는 것을 특징으로 하는 자원 관리 장치.
  10. 삭제
  11. 청구항 7에 있어서,
    상기 일정시간, 상기 상위 임계치, 및 상기 하위 임계치는 시스템 설정에 따라 변경되는 것을 특징으로 하는 자원 관리 장치.
  12. 청구항 7에 있어서,
    상기 메인 제어부는,
    상기 가상 노드가 과부하 상태일 경우에 상기 가상 노드를 확장하고, 상기 가상 노드가 저부하 상태일 경우에 상기 가상 노드를 축소하는 것을 특징으로 하는 자원 관리 장치.
KR1020120037937A 2012-04-12 2012-04-12 동적 자원 관리를 위한 2단계 자원 관리 방법 및 장치 KR101781063B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020120037937A KR101781063B1 (ko) 2012-04-12 2012-04-12 동적 자원 관리를 위한 2단계 자원 관리 방법 및 장치
CN2013101589292A CN103377092A (zh) 2012-04-12 2013-02-26 用于动态资源管理的两级动态资源管理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120037937A KR101781063B1 (ko) 2012-04-12 2012-04-12 동적 자원 관리를 위한 2단계 자원 관리 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20130115553A KR20130115553A (ko) 2013-10-22
KR101781063B1 true KR101781063B1 (ko) 2017-09-22

Family

ID=49462249

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120037937A KR101781063B1 (ko) 2012-04-12 2012-04-12 동적 자원 관리를 위한 2단계 자원 관리 방법 및 장치

Country Status (2)

Country Link
KR (1) KR101781063B1 (ko)
CN (1) CN103377092A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190061241A (ko) 2017-11-27 2019-06-05 주식회사 비디 리소스 통합관리를 위한 메소스 처리 장치 및 방법
KR20190070659A (ko) 2017-12-13 2019-06-21 주식회사 넥스클라우드 컨테이너 기반의 자원 할당을 지원하는 클라우드 컴퓨팅 장치 및 방법
KR102187382B1 (ko) 2020-07-31 2020-12-07 나무기술 주식회사 클라우드 인프라 기반의 컨테이너 가상os 통합 모니터링 운영 방법
KR102560225B1 (ko) 2023-02-16 2023-07-27 나무기술 주식회사 클라우드 인프라 기반의 가상os 다중 장애 발생 모니터링 및 병렬 처리 방법

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102206351B1 (ko) * 2014-04-28 2021-01-22 삼성전자 주식회사 전자 장치 및 이의 작업 연계 방법
CN104317635B (zh) * 2014-10-13 2017-11-07 北京航空航天大学 混合任务下的动态资源调度方法及系统
US9256467B1 (en) * 2014-11-11 2016-02-09 Amazon Technologies, Inc. System for managing and scheduling containers
CN104615498B (zh) * 2015-01-22 2018-04-03 北京仿真中心 一种基于任务迁移的集群系统动态负载均衡方法
CN104714851B (zh) * 2015-03-30 2018-11-02 中国联合网络通信集团有限公司 一种实现资源分配的方法及装置
KR102518269B1 (ko) * 2015-10-12 2023-04-06 주식회사 엘지유플러스 트래픽 유실 방지장치 및 그 트래픽 유실 방지방법
US10261782B2 (en) 2015-12-18 2019-04-16 Amazon Technologies, Inc. Software container registry service
US10135837B2 (en) 2016-05-17 2018-11-20 Amazon Technologies, Inc. Versatile autoscaling for containers
US10412022B1 (en) 2016-10-19 2019-09-10 Amazon Technologies, Inc. On-premises scaling using a versatile scaling service and an application programming interface management service
US10409642B1 (en) 2016-11-22 2019-09-10 Amazon Technologies, Inc. Customer resource monitoring for versatile scaling service scaling policy recommendations
EP3617889B1 (en) * 2017-06-27 2021-08-11 Huawei Technologies Co., Ltd. Stutter detection method and device
CN109189581B (zh) * 2018-09-20 2021-08-31 郑州云海信息技术有限公司 一种作业调度方法和装置
JP7310378B2 (ja) * 2019-07-08 2023-07-19 富士通株式会社 情報処理プログラム、情報処理方法、および情報処理装置
CN110377398A (zh) * 2019-07-10 2019-10-25 腾讯科技(深圳)有限公司 一种资源管理方法、装置及主机设备、存储介质
US11669365B1 (en) 2019-08-26 2023-06-06 Amazon Technologies, Inc. Task pool for managed compute instances
KR102231357B1 (ko) * 2019-11-04 2021-03-24 주식회사 이노그리드 고성능 클라우드 서비스를 위한 단일 가상화 시스템 및 소프트웨어 정의 서버 배포 스케줄링 방법
CN111143037B (zh) * 2019-12-31 2023-11-21 联想(北京)有限公司 一种虚拟机资源分配方法、设备、系统及存储介质
CN114995997A (zh) * 2022-04-24 2022-09-02 阿里巴巴(中国)有限公司 任务处理方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030233446A1 (en) * 2002-06-12 2003-12-18 Earl William J. System and method for managing a distributed computing system
CN100440888C (zh) * 2004-01-17 2008-12-03 中国科学院计算技术研究所 基于网络存储和资源虚拟化的大型服务系统的管理系统及其方法
CN101969391B (zh) * 2010-10-27 2012-08-01 北京邮电大学 一种支持融合网络业务的云平台及其工作方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190061241A (ko) 2017-11-27 2019-06-05 주식회사 비디 리소스 통합관리를 위한 메소스 처리 장치 및 방법
KR20190070659A (ko) 2017-12-13 2019-06-21 주식회사 넥스클라우드 컨테이너 기반의 자원 할당을 지원하는 클라우드 컴퓨팅 장치 및 방법
KR102187382B1 (ko) 2020-07-31 2020-12-07 나무기술 주식회사 클라우드 인프라 기반의 컨테이너 가상os 통합 모니터링 운영 방법
KR102560225B1 (ko) 2023-02-16 2023-07-27 나무기술 주식회사 클라우드 인프라 기반의 가상os 다중 장애 발생 모니터링 및 병렬 처리 방법

Also Published As

Publication number Publication date
CN103377092A (zh) 2013-10-30
KR20130115553A (ko) 2013-10-22

Similar Documents

Publication Publication Date Title
KR101781063B1 (ko) 동적 자원 관리를 위한 2단계 자원 관리 방법 및 장치
JP5088366B2 (ja) 仮想計算機制御プログラム、仮想計算機制御システムおよび仮想計算機移動方法
JP2008226181A (ja) 並列実行プログラム、該プログラムを記録した記録媒体、並列実行装置および並列実行方法
US8782657B2 (en) Dynamic creation and destruction of IO resources based on actual load and resource availability
US20170017524A1 (en) Quality of service implementation in a networked storage system with hierarchical schedulers
US10394606B2 (en) Dynamic weight accumulation for fair allocation of resources in a scheduler hierarchy
JP2012094030A (ja) 計算機システム及び処理制御方法
JP2007207219A (ja) 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
CN104508634A (zh) 虚拟机的动态资源分配
KR101474872B1 (ko) 클라우드 상에 가상 클러스터들의 효율적 구축을 위한 탄력적 가상 클러스터 관리 방법, 이를 이용한 가상 클러스터 관리 장치 및 클라우드 시스템
KR20110046719A (ko) 복수 코어 장치 및 그의 로드 조정 방법
JP2017037492A (ja) 分散処理プログラム、分散処理方法および分散処理装置
KR20200080458A (ko) 클라우드 멀티-클러스터 장치
CN112882827A (zh) 用于负载均衡的方法、电子设备和计算机程序产品
JP5151509B2 (ja) 仮想マシンシステム及びそれに用いる仮想マシン分散方法
WO2011096249A1 (ja) 負荷制御装置
JP2007328413A (ja) 負荷分散方法
JP2014067322A (ja) 仮想サーバの負荷分散システム、および負荷分散方法
JP2010231601A (ja) グリッドコンピューティングシステム、リソース制御方法およびリソース制御プログラム
JP2013127685A (ja) 情報処理システムおよび運用管理方法
JP6191361B2 (ja) 情報処理システム、情報処理システムの制御方法及び制御プログラム
Liu et al. Improving resource utilization of a cloud-based testing platform for android applications
KR102014246B1 (ko) 리소스 통합관리를 위한 메소스 처리 장치 및 방법
JP5758358B2 (ja) 仮想マシンシステム及びその高速ライブマイグレーション方法
JP6657910B2 (ja) 帯域設定方法、帯域設定プログラム、情報処理装置及び情報処理システム

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant