WO2022145613A1

WO2022145613A1 - 다중 코어 할당 장치 및 방법

Info

Publication number: WO2022145613A1
Application number: PCT/KR2021/009997
Authority: WO
Inventors: 김대훈; 박경서
Original assignee: 재단법인대구경북과학기술원
Priority date: 2020-12-28
Filing date: 2021-07-30
Publication date: 2022-07-07
Also published as: KR102442675B1; KR20220093923A

Abstract

본 발명은 서비스 부하에 따라 다중 코어를 할당하는 장치 및 방법을 제공한다. 다중 코어 환경에서 실행 중인 적어도 하나의 어플리케이션에 대한 서비스 요청에 대응하는 서비스 부하를 모니터링하는 모니터링부 및 서비스 부하에 기반하여 다중 코어를 할당하는 코어할당부를 포함하고, 코어할당부는 서비스 부하의 변화에 따라, 서비스 요청에 응답하여 적어도 하나의 어플리케이션을 실행하는 제 1 코어 및 적어도 하나의 어플리케이션이 수반하는 패킷 프로세싱을 수행하는 제 2 코어의 조합을 결정한다. 본 발명의 실시예에 따르면 시스템 자원 요구량을 예측하기 어려운 저지연이 요구되는 서비스의 성능 저하 없이 에너지 효율성을 제공할 수 있다.

Description

다중 코어 할당 장치 및 방법

본 발명은 다중 코어 할당 장치 및 방법에 관한 것으로, 보다 상세하게는 서비스 부하에 기반하여 어플리케이션과 패킷 프로세싱에 대한 다중 코어 할당을 조정하는 장치 및 방법에 관한 것이다.

본 발명은 과학기술정보통신부의 지원을 받은 다음의 사업들의 일환으로 수행한 연구로부터 도출된 것이다. 1. 과제번호: 2020010088, 과제명: 실시간 자율 복원 사이버물리 시스템 기초 연구(고신뢰CPS연구센터) 2. 과제번호: 2020030004, 과제명: (3차) 암흑데이터 극한활용 연구센터 (ERC) 3. 과제번호: 2020030095, 과제명: 마이크로서비스 구조에서 사용자 서비스 수준 목표(SLO) 만족을 위한 컴퓨팅 자원 관리 기술 및 통합 관리 프레임워크 연구 및 개발

이하에서 기술되는 내용은 본 발명의 실시예와 관련되는 배경 정보를 제공할 목적으로 기재된 것일 뿐이고, 기술되는 내용들이 당연하게 종래기술을 구성하는 것은 아니다.

네트워크 인터페이스 컨트롤러(Network Interface Card; NIC)는 외부의 서버와 데이터를 주고 받기 위해 사용되는 I/O(Input/Output) 장치이다. NIC가 장착된 서버는 데이터 송신 및 수신을 위하여, 프로세서의 코어에서 데이터를 패킷의 형태로 변환시켜 데이터를 송신하거나 수신한 패킷을 원래의 데이터로 변환하는 작업인 패킷 프로세싱을 수행한다.

정적인 병렬 패킷 프로세싱은 과도한 병렬성으로 인한 불필요한 에너지 소모를 유발하고, 패킷 프로세싱 코어의 비정기적 활성화는 코어 스위칭으로 인한 에너지 소모가 발생한다.

한편, 저지연이 요구되는 서비스(Latency Critical Service)는 해당 서비스를 이용하는 사용자와의 규약인 SLO(Service Level Objective)를 만족해야 한다. 특히 저지연이 요구되는 서비스는 SLO의 규정 중, 유저가 서비스를 이용하기 위해 요청한 패킷들의 꼬리 지연시간(tail latency)이 규약된 시간을 만족하도록 보장해야 한다.

서버 장치에 대한 서비스 부하가 급증함에 따라 지연시간 및 에너지 효율성을 고려한 코어 할당 기술이 필요하다.

본 발명의 일 과제는, 서비스 부하에 기반하여 코어 할당 조합을 결정하는 다중 코어 할당 장치를 제공하는 것이다.

본 발명의 일 과제는, 오프라인 프로파일링에 기반하여 지연시간 및 에너지 효율성을 고려한 다중 코어 할당 방법을 제공하는 것이다.

본 발명의 목적은 이상에서 언급한 과제에 한정되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 발명의 실시예에 의해 보다 분명하게 이해될 것이다.

또한, 본 발명의 목적 및 장점들은 청구범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 알 수 있을 것이다.

본 발명의 일 실시예에 따른 다중 코어 할당 장치는, 다중 코어 환경에서 실행 중인 적어도 하나의 어플리케이션에 대한 서비스 요청에 대응하는 서비스 부하를 모니터링하는 모니터링부 및 서비스 부하에 기반하여 다중 코어를 할당하는 코어할당부를 포함할 수 있다.

코어할당부는 서비스 부하의 변화에 따라, 서비스 요청에 응답하여 적어도 하나의 어플리케이션을 실행하는 제 1 코어 및 적어도 하나의 어플리케이션이 수반하는 패킷 프로세싱을 수행하는 제 2 코어의 조합을 결정하도록 구성된다.

본 발명의 일 실시예에 따른 다중 코어 할당 방법은, 모니터링부에 의해, 다중 코어 환경에서 실행 중인 적어도 하나의 어플리케이션에 대한 서비스 요청에 대응하는 서비스 부하를 모니터링하는 단계 및 코어할당부에 의해, 서비스 부하에 기반하여 다중 코어를 할당하는 단계를 포함할 수 있다.

다중 코어를 할당하는 단계는, 서비스 부하의 변화에 따라, 서비스 요청에 응답하여 적어도 하나의 어플리케이션을 실행하는 제 1 코어 및 적어도 하나의 어플리케이션이 수반하는 패킷 프로세싱을 수행하는 제 2 코어의 조합을 결정하는 단계를 포함할 수 있다.

전술한 것 외의 다른 측면, 특징, 및 이점이 이하의 도면, 청구범위 및 발명의 상세한 설명으로부터 명확해질 것이다.

본 발명의 실시예에 따르면 패킷 프로세싱을 위한 코어의 수를 동적으로 조절하여, 코어의 낭비 없이 SLO를 만족하기 위한 최소한의 코어의 수를 제공할 수 있다.

본 발명의 실시예에 따르면 시스템 자원 요구량을 예측하기 어려운 저지연이 요구되는 서비스의 성능 저하 없이 에너지 효율성을 제공할 수 있다.

본 발명의 실시예에 따르면 별도의 비용 없이, 에너지 소모량에 따른 유지 비용이 큰 데이터 센터에 적용 시 데이터센터 전체 유지비용의 절감이 가능하다.

본 발명의 효과는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 효과들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.

도 1은 실시예에 따른 다중 코어 할당 장치의 예시적인 동작 환경을 개략적으로 보여주는 도면이다.

도 2는 실시예에 따른 다중 코어 할당 장치의 블록도이다.

도 3은 실시예에 따른 다중 코어 할당 장치의 실행 환경을 설명하기 위한 도면이다.

도 4는 실시예에 따른 다중 코어 할당 방법의 흐름도이다.

도 5는 실시예에 따른 다중 코어 할당 방법의 세부 흐름도이다.

도 6은 예시적인 서비스 부하에 따른 제 1 코어 및 제 2 코어의 조합에 대한 매핑 테이블을 도시한다.

도 7은 실시예에 따른 다중 코어 할당 장치의 코어 할당 과정을 예시적으로 설명하기 위한 도면이다.

이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다. 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 여기에서 설명하는 실시예들에 한정되지 않는다. 이하 실시예에서는 본 발명을 명확하게 설명하기 위해서 설명과 직접적인 관계가 없는 부분을 생략하지만, 본 발명의 사상이 적용된 장치 또는 시스템을 구현함에 있어서, 이와 같이 생략된 구성이 불필요함을 의미하는 것은 아니다. 아울러, 명세서 전체를 통하여 동일 또는 유사한 구성요소에 대해서는 동일한 참조번호를 사용한다.

이하의 설명에서 제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안되며, 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 또한, 이하의 설명에서 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.

이하의 설명에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

이하 도면을 참고하여 본 발명을 상세히 설명하기로 한다.

다중 코어 할당 장치(100)는 다양한 어플리케이션 환경에서 서비스 부하 변화에 따라 최적화된 다중 코어의 동적 할당을 제공할 수 있다.

일 예에서 다중 코어 할당 장치(100)는 네트워크(300) 환경에서 클라이언트(200)의 서비스 요청을 처리하는 서버일 수 있다. 서버는 네트워크(300)를 통해 클라이언트(200)의 서비스 요청을 수신하고, 서비스 요청에 대응하는 동작을 수행하고, 이에 대한 응답을 네트워크(300)를 통해 클라이언트(200)에 전송하는 서버일 수 있다.

다중 코어 할당 장치(100)는 후술할 도 2를 참조하여 프로세서(110) 및 메모리(120)를 포함하는 컴퓨팅 장치일 수 있다.

네트워크(300)는 유선 및 무선 네트워크, 예를 들어 LAN(local area network), WAN(wide area network), 인터넷(internet), 인트라넷(intranet) 및 엑스트라넷(extranet), 그리고 모바일 네트워크, 예를 들어 셀룰러, 3G, LTE, 5G, WiFi 네트워크, 애드혹 네트워크 및 이들의 조합을 비롯한 임의의 적절한 통신 네트워크 일 수 있다.

네트워크(300)는 허브, 브리지, 라우터, 스위치 및 게이트웨이와 같은 네트워크 요소들의 연결을 포함할 수 있다. 네트워크(300)는 인터넷과 같은 공용 네트워크 및 안전한 기업 사설 네트워크와 같은 사설 네트워크를 비롯한 하나 이상의 연결된 네트워크들, 예컨대 다중 네트워크 환경을 포함할 수 있다. 네트워크(300)에의 액세스는 하나 이상의 유선 또는 무선 액세스 네트워크들을 통해 제공될 수 있다.

도 2는 실시예에 따른 다중 코어 할당 장치의 블록도이다.

실시예에 따른 다중 코어 할당 장치(100)는 프로세서(110) 및 메모리(120)를 포함할 수 있다.

프로세서(110)는 일종의 중앙처리장치로서, 메모리(120)에 저장된 하나 이상의 명령어를 실행하여 다중 코어 할당 장치(100)의 동작을 제어할 수 있다. 프로세서(110)는 데이터를 처리할 수 있는 모든 종류의 장치를 포함할 수 있다.

프로세서(110)는 예를 들어 프로그램 내에 포함된 코드 또는 명령으로 표현된 기능을 수행하기 위해 물리적으로 구조화된 회로를 갖는, 하드웨어에 내장된 데이터 처리 장치를 의미할 수 있다. 이와 같이 하드웨어에 내장된 데이터 처리 장치의 일 예로서, 마이크로프로세서(microprocessor), 중앙처리장치(central processing unit: CPU), 프로세서 코어(processor core), 멀티프로세서(multiprocessor), ASIC(application-specific integrated circuit), FPGA(field programmable gate array) 등의 처리 장치를 망라할 수 있으나, 이에 한정되는 것은 아니다. 프로세서(110)는 하나 이상의 프로세서를 포함할 수 있다. 프로세서(110)는 다중 코어(multicore)로 구성될 수 있다.

다중 코어 할당 장치(100)는 모니터링부(111) 및 코어할당부(112)를 더 포함할 수 있다.

모니터링부(111)는 프로세서(110)의 다중 코어에서 실행 중인 어플리케이션에 대한 서비스 요청에 대응하는 서비스 부하를 모니터링하고 서비스 부하를 코어할당부(112)에 전달할 수 있다.

코어할당부(112)는 모니터링부(111)로부터 수신한 서비스 부하에 기반하여 다중 코어를 할당할 수 있다.

코어할당부(112)는 모니터링부(111)로부터 획득한 서비스 부하의 변화에 따라, 사용자의 서비스 요청에 응답하여 적어도 하나의 어플리케이션을 실행하는 제 1 코어 및 이러한 적어도 하나의 어플리케이션이 수반하는 패킷 프로세싱을 수행하는 제 2 코어의 조합을 결정할 수 있다.

모니터링부(111) 및 코어할당부(112)는 프로세서(110)에 의해 실행가능한 프로그램으로 구현될 수 있다. 프로세서(110)는 메모리(120)에 저장된 해당 프로그램을 실행하여 모니터링부(111) 및 코어할당부(112)를 실행할 수 있다.

다중 코어 할당 장치(100)는 메모리(120)를 더 포함할 수 있다.

메모리(120)는 다중 코어 할당 장치(100)가 코어 할당 과정을 실행하기 위한 명령 등을 저장할 수 있다. 메모리(120)는 모니터링부(111) 및 코어할당부(112)의 동작을 구현한 실행가능한 프로그램을 저장할 수 있다.

프로세서(110)는 메모리(120)에 저장된 프로그램 및 명령어들에 기반하여 실시예에 따른 다중 코어 할당 과정을 실행할 수 있다.

메모리(120)는 후술할 오프라인 프로파일링을 수행한 결과로 생성된 정보(예를 들어 서비스 부하에 따른 제 1 코어 및 제 2 코어의 조합에 대한 매핑 테이블)를 더 저장할 수 있다.

메모리(120)는 내장 메모리 및/또는 외장 메모리를 포함할 수 있으며, DRAM, SRAM, 또는 SDRAM 등과 같은 휘발성 메모리, OTPROM(one time programmable ROM), PROM, EPROM, EEPROM, mask ROM, flash ROM, NAND 플래시 메모리, 또는 NOR 플래시 메모리 등과 같은 비휘발성 메모리, SSD, CF(compact flash) 카드, SD 카드, Micro-SD 카드, Mini-SD 카드, Xd 카드, 또는 메모리 스틱(memory stick) 등과 같은 플래시 드라이브, 또는 HDD와 같은 저장 장치를 포함할 수 있다. 메모리(120)는 자기 저장 매체(magnetic storage media) 또는 플래시 저장 매체(flash storage media)를 포함할 수 있으나, 이에 한정되는 것은 아니다.

네트워크 인터페이스 컨트롤러(Network Interface Controller; NIC)(130)는 패킷 통신을 인터페이싱할 수 있는 통신 장치를 의미한다. 예를 들어 네트워크 인터페이스 컨트롤러(130)는 외부 장치로부터 패킷을 수신하거나 외부장치로 패킷을 송신할 수 있다.

버스(140)는 프로세서(110), 메모리(120) 및 네트워크 인터페이스 컨트롤러(130)를 연결하는 논리적/물리적 경로이다. 프로세서(110)는 버스(140)를 통해 메모리(120) 및 네트워크 인터페이스 컨트롤러(130)에 대한 읽기/쓰기(read/write)를 수행할 수 있다.

NIC(130)는 외부 장치와 통신하기 위한 하드웨어로서, 패킷을 받거나 보내는 장치이다. NIC(130)는 외부 장치로부터 수신한 패킷을 네트워크 드라이버에게 전달한다.

네트워크 드라이버는 NIC(130)를 운영체제(Operating System; OS)가 사용할 수 있도록 도와주는 소프트웨어로 NIC(130)에 패킷이 도착했음을 운영체제에게 알려주고, 해당 패킷을 TCP/IP 스택으로 전달한다.

TCP/IP 스택은 패킷에서 정보가 담겨있는 IP와 Port를 추출하여 어떠한 어플리케이션에게 전달해야 할지를 파악하고, 패킷에서 데이터를 추출하여 이를 어플리케이션에게 전달한다.

어플리케이션은 데이터를 전달 받고, 어플리케이션 고유의 작업을 수행한다.

실시예에 따른 다중 코어 할당 장치(100)의 모니터링부(111) 및 코어할당부(112)는 운영체제 영역에서 작동한다. 모니터링부(111) 및 코어할당부(112)는 운영체제 영역에서 주기적으로 깨어나서 백그라운드(background)에서 작업을 수행하는 일종의 데몬(daemon) 프로세스로서 동작할 수 있다. 일 예에서 하나의 데몬이 모니터링부(111)와 코어할당부(112)를 실행할 수 있다.

모니터링부(111) 및 코어할당부(112)는 프로세서(110)에 포함된 다중 코어 중 하나의 코어에서 실행될 수 있다.

이하에서 도 4 및 도 5를 참조하여 실시예에 따른 다중 코어 할당 방법에 대하여 구체적으로 살펴본다.

도 4는 실시예에 따른 다중 코어 할당 방법의 흐름도이다.

실시예에 따른 다중 코어 할당 방법은 프로세서(110)에 의해 서비스 부하에 따라서, 적어도 하나의 어플리케이션을 실행하는 제 1 코어 및 이와 같은 적어도 하나의 어플리케이션이 수반하는 패킷 프로세싱을 수행하는 제 2 코어의 조합에 대한 오프라인 프로파일링을 수행하는 단계(S10)를 포함할 수 있다.

단계(S10)은 사전정의된 서비스 부하를 처리하기 위한 에너지 소모량 및 지연시간에 기반하여 각 사전정의된 서비스 부하에 대한 제 1 코어 및 제 2 코어의 조합을 결정하는 단계를 포함할 수 있다.

여기서 에너지 소모량은 사전정의된 서비스 부하를 처리하는 동안 프로세서(110)에서 소모된 에너지량을 의미한다. 지연시간은 서비스 요청에 대한 응답 지연시간을 의미한다.

구체적으로 살펴보면, 오프라인 프로파일링은 어플리케이션을 서비스하기 이전에 오프라인 프로파일링을 수행할 수 있는 환경에서 실행된다. 오프라인 프로파일을 수행할 수 있는 환경은 어플리케이션 서비스를 동작하는 서버 컴퓨터와 서비스 요청(request)을 생성하여 전송하는 클라이언트 컴퓨터를 포함한다.

오프라인 프로파일링 과정에서, 클라이언트 컴퓨터는 서비스 요청을 서버 컴퓨터에게 전송한다. 여기서 서버 컴퓨터는 실시예에 따른 다중 코어 할당 장치(100)에 대응한다.

서버 컴퓨터는 어플리케이션을 실행하는 서비스 코어의 수와 패킷 프로세싱을 수행하는 코어의 수의 가능한 조합 중 하나를 선택하고 해당 조합에 맞추어 서비스 코어와 패킷 프로세싱 코어를 할당한다.

예를 들어, 코어가 총 8개라고 가정하면, 서비스 코어를 위한 수는 1 내지 8개가 가능하고, 패킷 프로세싱을 위한 코어의 수 또한 1 내지 8개가 가능하고, 따라서 총 64가지의 조합이 가능하다.

이후 코어의 각 조합마다 일정 시간(예를 들어 5초) 동안 클라이언트 컴퓨터가 서비스 요청들을 소정의 서비스 부하(Service Load)로 서버 컴퓨터에게 전송한다. 여기서 서비스 부하는 RPS(Request Per Second)를 지표로 하여 표현될 수 있다.

이후 서버 컴퓨터는 상술한 일정 시간(예를 들어 5초) 동안 소비된 에너지와 서비스 요청에 대한 꼬리 지연시간 (Tail Latency)을 측정한다. 꼬리 지연시간이란, 사용자가 요청한 모든 패킷들의 지연시간들을 낮은 순서대로 나열하였을 때, 95th, 99th percentile latency 처럼 뒤쪽에 해당하는 패킷 지연시간을 의미한다.

결과적으로, 프로세서(110)는 오프라인 프로파일링을 실행한 결과 사전정의된 서비스 부하를 실행함에 있어서 소정의 지연시간 요구 조건을 만족하는 하나 이상의 제 1 코어 및 제 2 코어의 조합 중에서 에너지 소모량이 가장 낮은 코어의 조합을 해당 서비스 부하에 대한 제 1 코어 및 제 2 코어의 조합으로 결정할 수 있다. 여기서 소정의 지연시간 요구 조건은 95th 퍼센트 지연(95th percentile latency, P95) 혹은 99^th 퍼센트 지연(99^th percentile latency, P99) 메트릭을 적용할 수 있다.

이와 같은 과정을 모든 코어의 조합에서 소정의 RPS 범위마다 실행하여 꼬리 지연시간과 에너지 소비량을 측정하고, 최적의 코어 할당 조합을 결정한다. 오프라인 프로파일링이 완료되면, 각 코어 조합 및 RPS에 따른 꼬리 지연시간과 에너지 소비량이 저장된 데이터 결과를 구할 수 있다. 이로써 획득된 오프라인 프로파일링 결과는 메모리(120)에 저장될 수 있다.

일 예에서 프로세서(110)는 메모리(120)에, 오프라인 프로파일링의 결과를 각 서비스 부하에 대한 상기 제 1 코어 및 상기 제 2 코어의 조합의 매핑 테이블로 저장할 수 있다. 오프라인 프로파일링 결과에 대한 예시적인 매핑 테이블에 대하여는 도 6을 참조하여 후술한다.

실시예에 따른 다중 코어 할당 방법은 모니터링부(111)에 의해, 다중 코어 환경에서 실행 중인 적어도 하나의 어플리케이션에 대한 서비스 요청에 대응하는 서비스 부하를 모니터링하는 단계(S20) 및 코어할당부(112)에 의해, 서비스 부하에 기반하여 다중 코어를 할당하는 단계(S30)를 포함할 수 있다.

단계(S20)에서 모니터링부(111)는 다중 코어 환경에서 실행 중인 적어도 하나의 어플리케이션에 대한 서비스 요청에 대응하는 서비스 부하를 모니터링할 수 있다.

단계(S20)에서 모니터링부(111)는 단위 시간당 수신된 서비스 요청의 수에 기반하여 서비스 부하를 획득할 수 있다.

다중 코어 환경에서 실행 중인 어플리케이션은 사용자 측의 단말 장치에서 실행되는 클라이언트로부터 서비스 요청을 받고 이에 대한 응답을 단말 장치에게 전송한다. 일 예에서 서비스 부하는 단위 시간당 서비스 요청의 개수를 의미한다.

일 예에서, 모니터링부(111)는 운영체제에 포함된 네트워크 드라이버에서 측정되는 Request Packet Count 기능을 이용하여 Request Per Second (RPS)를 계산하고, 계산된 RPS에 따라 서비스 부하를 결정할 수 있다.

RPS는 단위 시간당 처리된 패킷의 개수로서 단위 시간당 서비스 요청의 개수, 즉 서비스 부하를 나타내는 지표가 된다. 이는 서비스 요청 및 이에 대한 처리는 하나 이상의 패킷에 대응하기 때문이다.

단계(S20)은 주기적으로 실행되어 서비스 부하를 모니터링할 수 있다. 예를 들어, 모니터링부(111)를 실행하는 데몬 프로세스의 실행 주기에 따라 단계(S20)을 실행할 수 있다.

단계(S30)에서 코어할당부(112)는 서비스 부하에 기반하여 다중 코어를 할당할 수 있다.

단계(S30)은 서비스 부하의 변화에 따라, 서비스 요청에 응답하여 적어도 하나의 어플리케이션을 실행하는 제 1 코어 및 적어도 하나의 어플리케이션이 수반하는 패킷 프로세싱을 수행하는 제 2 코어의 조합을 결정하는 단계를 포함할 수 있다.

여기서 제 1 코어는 적어도 하나의 어플리케이션을 실행하도록 생성된 적어도 하나의 스레드(thread)를 실행하는 적어도 하나의 코어에 대응한다. 제 2 코어는 적어도 하나의 어플리케이션이 수반하는 패킷 프로세싱을 수행하는 적어도 하나의 코어에 대응한다.

단계(S30)은 단계(S20)의 모니터링 결과 서비스 부하에 변화가 발생한 경우 수행될 수 있다.

단계(S30)에서 코어할당부(112)는, 단계(S10)에서 수행된 오프라인 프로파일링의 결과에 기반하여 서비스 부하에 대한 제 1 코어 및 제 2 코어의 조합을 결정할 수 있다.

예를 들어 코어할당부(112)는 메모리(120)에 저장된 오프라인 프로파일링 결과에 대한 매핑 테이블을 참조하여 현재의 서비스 부하에 대한 제 1 코어 및 제 2 코어의 조합을 결정할 수 있다.

일 예에서 코어 할당에 대한 조합은 제 1 코어의 수 및 제 2 코어의 수의 페어(pair)에 대응한다. 즉, 코어할당부(112)는 단계(S30)에서 제 1 코어의 수 및 제 2 코어의 수의 페어를 결정할 수 있다.

단계(S30)에서 코어할당부(112)는, 다중 코어 환경을 구성하는 하나 이상의 코어 중에서 제 1 코어의 수만큼의 코어를 적어도 하나의 어플리케이션을 실행하는 제 1 코어로 할당할 수 있다.

단계(S30)에서 코어할당부(112)는 다중 코어 환경을 구성하는 하나 이상의 코어 중에서 제 2 코어의 수만큼의 코어를 패킷 프로세싱을 수행하는 제 2 코어로 할당할 수 있다.

단계(S30)에 대하여는 도 5를 참조하여 구체적으로 후술한다.

단계(S30)이 완료되면 다음 실행 주기에 단계(S20)에서 모니터링부(111)가 실행된다.

도 4를 참조하여 단계(S30)은 단계(S31), 단계(S32) 및 단계(S33)을 포함할 수 있다.

전술한대로 단계(S20)은 주기적으로 수행되고, 해당 주기마다 단계(S31)이 수행된다.

단계(S31)에서 코어할당부(112)는 단계(S20)에서 모니터링부(111)가 획득한 현재 서비스 부하(즉, 현재 RPS)와 이전 주기의 서비스 부하(즉, 이전 RPS)를 비교한다.

비교의 결과, 현재 서비스 부하와 이전 서비스 부하가 동일하면 코어할당부(112)의 실행이 종료되고 단계(S20)로 복귀한다. 현재 서비스 부하와 이전 서비스 부하가 상이하면 코어할당부(112)는 단계(S32) 및 단계(S33)을 실행한다.

단계(S32)에서 코어할당부(112)는 도 4를 참조하여 단계(S10)에서 수행된 오프라인 프로파일링의 결과에 기반하여 서비스 부하에 대한 제 1 코어 및 제 2 코어의 조합을 결정할 수 있다. 예를 들어, 코어할당부(112)는 메모리(120)에 저장된 매핑 테이블에 기초하여 현재 서비스 부하에 대한 최적의 코어 할당 조합을 결정할 수 있다.

단계(S33)에서 코어할당부(112)는 단계(S32)에서 결정된 조합에 기반하여 어플리케이션을 실행할 제 1 코어와 패킷 프로세싱을 처리할 제 2 코어를 할당할 수 있다.

일 예에서 결정된 최적의 코어 할당 조합에 따라 n개의 다중 코어 중, 가장 낮은 번호의 코어부터 순차적으로 할당할 수 있다.

예를 들어, 코어할당부(112)는 어플리케이션을 위한 코어 할당을 위해 운영체제에게 요청을 보내고, 운영체제는 낮은 번호 코어부터 순차적으로 제 1 코어를 할당할 수 있다. 예를 들어, 코어할당부(112)는 패킷 프로세싱을 위한 제 2 코어를 할당을 위해 운영체제의 네트워크 드라이버에게 요청을 보내어, 패킷 프로세싱을 위한 코어를 낮은 번호 코어부터 순차적으로 제 2 코어를 할당할 수 있다.

이와 같은 코어 할당 순서는 예시적인 것이며, 높은 번호 코어부터 순차적으로 할당하거나 코어 사용량이 가장 적은 코어부터 순차적으로 할당하는 것도 가능하며, 이에 제한되지 않는다.

또한, 코어할당부(112)는 제 1 코어를 할당한 후에 제 2 코어를 할당하거나 또는 제 2 코어를 할당한 후에 제 1 코어를 할당하거나 또는 동시에 제 1 코어 및 제 2 코어를 할당할 수 있다.

일 예에서 단계(S33)에서 코어할당부(112)는, 제 1 코어와 제 2 코어가 서로 중복되도록 할당할 수 있다. 예를 들어, 코어할당부(112)는 제 1 코어와 제 2 코어가 서로 최대로 겹치도록 할당할 수 있다. 이로써 비활성화 코어를 확보하고 에너지 소모량 및 지연시간이 감소될 수 있다.

구체적으로, 예를 들어 전체 코어가 8개인 다중 코어 환경에서 오프라인 프로파일링 결과에 따른 최적 코어 할당 조합이 제 1 코어 4개, 제 2 코어 4개인 경우, 코어할당부(112)는 제 1 코어를 1, 2, 3, 4번 코어에 할당하고, 제 2 코어를 제 1 코어와 동일한 코어인 1, 2, 3, 4번 코어에 할당할 수 있다. 또는 코어할당부(112)는 제 2 코어를 1, 2, 3, 4번 코어에 할당하고, 제 1 코어를 제 2 코어와 동일한 코어인 1, 2, 3, 4번 코어에 할당할 수 있다.

예를 들어, 전체 코어가 8개인 다중 코어 환경에서 오프라인 프로파일링 결과에 따른 최적 코어 할당 조합이 제 1 코어 3개, 제 2 코어 2개인 경우, 코어할당부(112)는 제 1 코어를 8, 7, 6번 코어에 할당하고, 제 2 코어를 제 1 코어가 할당된 8, 7, 6번 코어 중에서 선택된 2개의 코어에 할당할 수 있다. 또는, 코어할당부(112)는 제 2 코어를 8, 7번 코어에 할당하고, 제 1 코어를 제 2 코어가 할당된 8, 7번 및 나머지 코어 중 하나의 코어에 할당할 수 있다.

이후 패킷 프로세싱 코어에서 처리된 패킷 데이터는 메모리(120)에 저장되고, 패킷 데이터가 저장된 주소를 어플리케이션에 전달한다. 이와 반대로 어플리케이션에서 패킷을 송신하기 위해서, 송신할 데이터가 저장된 메모리(120)의 주소를 패킷 프로세싱 작업에 알려주고, 패킷 프로세싱 작업은 해당 데이터를 메모리(120)에서 읽어와서 패킷의 형태로 변환한다.

예를 들어 8개의 코어를 포함하는 다중 코어 환경에서, 테이블(a)는 제 1 서비스 부하에서의 매핑 테이블이고, 테이블(b)는 제 2 서비스 부하에서의 매핑 테이블이고, 테이블(c)는 제 3 서비스 부하에서의 매핑 테이블을 예시적으로 보여준다. 도시된 예에서 테이블(a), 테이블(b), 테이블(c)로 갈수록 서비스 부하의 양이 증가한다.

각 테이블의 가로축은 패킷 프로세싱을 위한 제 2 코어의 개수(1P, 2P, ... , 8P)이고, 세로축은 어플리케이션 수행을 위한 제 1 코어의 개수(1T, 2T, ..., 8T)를 나타낸다.

각 테이블의 셀의 값은 제 2 코어의 개수와 제 1 코어의 할당 조합에 대한 에너지 소모량을 수치화한 값이다. 예시에서, 각 테이블의 셀의 값은 제 2 코어의 개수와 제 1 코어의 개수의 페어에 대한 에너지 소모량을 제 2 코어와 제 1 코어에 전체 코어를 할당한 경우(즉, 8T-8P)의 에너지 소모량에 대하여 정규화한 값으로 설정되었다.

여기서 해당 코어 할당 조합에 대한 꼬리 지연시간이 SLO 규정을 만족하지 못하는 경우는 Vio.로 표기되어 있으며, 코어할당부(112)는 셀의 값이 Vio.인 코어 할당 조합은 코어 할당 시에 고려하지 않는다.

한편, 도 6에 도시된 결과에서 제 1 코어의 수와 제 2 코어의 수가 동일하거나 유사한 경우에 에너지 소모량이 상대적으로 적게 나타나는 경향이 있음을 알 수 있다.

코어할당부(112)는 다중 코어 중 하나에서 실행되어 서비스 부하에 따라 어플리케이션 실행을 위한 코어와 패킷 프로세싱을 위한 코어의 조합을 조정한다. 코어할당부(112)는 메모리(120)에 저장된 오프라인 프로파일링 결과에 기초하여 최적의 코어 할당 조합을 결정할 수 있다.

예를 들어, 오프라인 프로파일링 결과에 따라 현재 서비스 부하에 대한 최적의 코어 할당 조합은 어플리케이션 실행을 위한 제 1 코어 3개, 패킷 프로세싱을 위한 제 2 코어 2개(즉, T3-P2)인 경우, 순차적으로 해당 코어들을 할당할 수 있다. 여기서 제 1 코어와 제 2 코어는 서로 중복되도록 할당될 수 있다. 예를 들어, 서로 간의 중복이 최대가 되도록 제 1 코어와 제 2 코어를 할당할 수 있다.

이상에서 설명한 바와 같이, 실시예에 따른 다중 코어 할당 기법은 RSS(Receive Side Scaling)가 적용된 NIC를 사용하는 서버 환경을 확장하여, 서비스를 수행하기 위해 사용하는 코어의 수와 패킷 프로세싱을 수행하는 코어의 수를 서비스의 부하에 따라 동적으로 조절하고, SLO에 규약된 꼬리 지연시간을 보장하고 에너지 소비를 줄일 수 있다.

이를 위하여, 실시예에 따른 다중 코어 할당 기법은 서비스를 수행하기 위해 사용하는 코어의 수와 패킷 프로세싱을 위한 코어의 수를 가능한 모든 조합에서, 서비스 부하를 점차 증가시키며 에너지소비와 꼬리 지연시간을 측정하는 오프라인 프로파일 기법을 수행한다. 측정한 결과 중, 각 로드에 대하여 SLO의 위반 없이 에너지 소모가 가장 작은 조합을 탐색한다.

즉, 모니터링부(111)는 주기적으로 서비스 부하인 RPS(Request Per Seconds)를 측정한다. 코어할당부(112)는 이전에 측정된 RPS와 현재 측정된 RPS가 같은 지 판단한다. 만약 다를 경우, 코어할당부(112)는 현재 측정된 서비스 부하에서 SLO 위반 없이 에너지 소모를 최소화 할 수 있는 코어 할당의 조합을 메모리(120)에 저장된 오프라인 프로파일링 결과를 기반으로 찾아 적용한다.

실시예에 따른 다중 코어 할당 기법은, 지연시간에 민감한 서비스의 부하에 따라 서비스를 수행하는 코어 수와 패킷 프로세싱을 위한 코어 수를 동시에 조절하는 기법을 통합하여 도입하여, SLO를 위반하지 않으면서 활성화된 코어의 수를 줄여 비활성화 코어를 확보하고 에너지 소모를 줄일 수 있다.

한편, 실시예에 따른 다중 코어 할당 기법은 NIC 이외에도 SSD(Solid State Drive)를 비롯한 다양한 주변 I/O 장치에 대한 I/O 처리에도 적용가능하다.

이상 설명된 본 발명에 따른 실시예는 컴퓨터 상에서 다양한 구성요소를 통하여 실행될 수 있는 컴퓨터 프로그램의 형태로 구현될 수 있으며, 이와 같은 컴퓨터 프로그램은 컴퓨터로 판독 가능한 매체에 기록될 수 있다. 이때, 매체는 하드 디스크, SSD(Solid State Drive), SDD(Silicon Disk Drive), 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치를 포함할 수 있다.

한편, 상기 컴퓨터 프로그램은 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 프로그램의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함될 수 있다.

이상 설명된 본 발명의 실시예에 대한 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 청구범위에 의하여 나타내어지며, 청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims

다중 코어 환경에서 실행 중인 적어도 하나의 어플리케이션에 대한 서비스 요청에 대응하는 서비스 부하를 모니터링하는 모니터링부; 및

상기 서비스 부하에 기반하여 상기 다중 코어를 할당하는 코어할당부

를 포함하고,

상기 코어할당부는,

상기 서비스 부하의 변화에 따라,

상기 서비스 요청에 응답하여 상기 적어도 하나의 어플리케이션을 실행하는 제 1 코어 및 상기 적어도 하나의 어플리케이션이 수반하는 패킷 프로세싱을 수행하는 제 2 코어의 조합을 결정하도록 구성되는,

다중 코어 할당 장치.
제 1 항에 있어서,

상기 모니터링부는,

주기적으로 상기 서비스 부하를 모니터링하는,

다중 코어 할당 장치.
제 1 항에 있어서,

상기 모니터링부는,

단위 시간당 수신된 상기 서비스 요청의 수에 기반하여 상기 서비스 부하를 획득하는,

다중 코어 할당 장치.
제 1 항에 있어서,

상기 서비스 부하 및 상기 서비스 부하에 따른 상기 제 1 코어 및 상기 제 2 코어의 조합에 대한 오프라인 프로파일링을 수행하는 프로세서

를 더 포함하고,

상기 프로세서는,

사전정의된 서비스 부하를 처리하기 위한 에너지 소모량 및 지연시간에 기반하여 각 사전정의된 서비스 부하에 대한 상기 제 1 코어 및 상기 제 2 코어의 조합을 결정하도록 구성되는,

다중 코어 할당 장치.
제 4 항에 있어서,

상기 코어할당부는

상기 오프라인 프로파일링의 결과에 기반하여 상기 서비스 부하에 대한 상기 제 1 코어 및 상기 제 2 코어의 조합을 결정하는,

다중 코어 할당 장치.
제 4 항에 있어서,

상기 오프라인 프로파일링의 결과를 각 서비스 부하에 대한 상기 제 1 코어 및 상기 제 2 코어의 조합의 매핑 테이블로 저장하는 메모리

를 더 포함하는,

다중 코어 할당 장치.
제 1 항에 있어서,

상기 조합은 상기 제 1 코어의 수 및 상기 제 2 코어의 수의 페어(pair)에 대응하고,

상기 코어할당부는,

상기 다중 코어 환경을 구성하는 하나 이상의 코어 중에서 상기 제 1 코어의 수만큼의 코어를 상기 제 1 코어로 할당하고,

상기 하나 이상의 코어 중에서 상기 제 2 코어의 수만큼의 코어를 상기 제 2 코어로 할당하는,

다중 코어 할당 장치.
제 7 항에 있어서,

상기 코어할당부는,

상기 제 1 코어와 상기 제 2 코어가 서로 중복되도록 상기 제 1 코어 및 상기 제 2 코어를 할당하는,

다중 코어 할당 장치.
모니터링부에 의해, 다중 코어 환경에서 실행 중인 적어도 하나의 어플리케이션에 대한 서비스 요청에 대응하는 서비스 부하를 모니터링하는 단계; 및

코어할당부에 의해, 상기 서비스 부하에 기반하여 상기 다중 코어를 할당하는 단계

를 포함하고,

상기 다중 코어를 할당하는 단계는,

상기 서비스 부하의 변화에 따라,

상기 서비스 요청에 응답하여 상기 적어도 하나의 어플리케이션을 실행하는 제 1 코어 및 상기 적어도 하나의 어플리케이션이 수반하는 패킷 프로세싱을 수행하는 제 2 코어의 조합을 결정하는 단계

를 포함하는,

다중 코어 할당 방법.
제 9 항에 있어서,

상기 모니터링하는 단계는,

주기적으로 상기 서비스 부하를 모니터링하는,

다중 코어 할당 방법.
제 9 항에 있어서,

상기 모니터링하는 단계는,

단위 시간당 수신된 상기 서비스 요청의 수에 기반하여 상기 서비스 부하를 획득하는 단계

를 포함하는,

다중 코어 할당 방법.
제 9 항에 있어서,

프로세서에 의해, 상기 서비스 부하 및 상기 서비스 부하에 따른 상기 제 1 코어 및 상기 제 2 코어의 조합에 대한 오프라인 프로파일링을 수행하는 단계

를 더 포함하고,

상기 오프라인 프로파일링을 수행하는 단계는,

사전정의된 서비스 부하를 처리하기 위한 에너지 소모량 및 지연시간에 기반하여 각 사전정의된 서비스 부하에 대한 상기 제 1 코어 및 상기 제 2 코어의 조합을 결정하는 단계

를 포함하는,

다중 코어 할당 방법.
제 12 항에 있어서,

상기 제 1 코어 및 상기 제 2 코어의 조합을 결정하는 단계,

상기 오프라인 프로파일링의 결과에 기반하여 상기 서비스 부하에 대한 상기 제 1 코어 및 상기 제 2 코어의 조합을 결정하는 단계

를 포함하는,

다중 코어 할당 방법.
제 12 항에 있어서,

메모리에, 상기 오프라인 프로파일링의 결과를 각 서비스 부하에 대한 상기 제 1 코어 및 상기 제 2 코어의 조합의 매핑 테이블로 저장하는 단계

를 더 포함하는,

다중 코어 할당 방법.
제 9 항에 있어서,

상기 조합은 상기 제 1 코어의 수 및 상기 제 2 코어의 수의 페어(pair)에 대응하고,

상기 다중 코어를 할당하는 단계는,

상기 다중 코어 환경을 구성하는 하나 이상의 코어 중에서 상기 제 1 코어의 수만큼의 코어를 상기 제 1 코어로 할당하는 단계; 및

상기 하나 이상의 코어 중에서 상기 제 2 코어의 수만큼의 코어를 상기 제 2 코어로 할당하는 단계

를 포함하는,

다중 코어 할당 방법.
제 15 항에 있어서,

상기 다중 코어를 할당하는 단계는,

상기 제 1 코어와 상기 제 2 코어가 서로 중복되도록 상기 제 1 코어 및 상기 제 2 코어를 할당하는 단계

를 더 포함하는

다중 코어 할당 장치.