KR101889657B1 - 빅데이터 워크로드 처리를 위한 메모리 서브시스템 자원 관리 방법 - Google Patents
빅데이터 워크로드 처리를 위한 메모리 서브시스템 자원 관리 방법 Download PDFInfo
- Publication number
- KR101889657B1 KR101889657B1 KR1020170068198A KR20170068198A KR101889657B1 KR 101889657 B1 KR101889657 B1 KR 101889657B1 KR 1020170068198 A KR1020170068198 A KR 1020170068198A KR 20170068198 A KR20170068198 A KR 20170068198A KR 101889657 B1 KR101889657 B1 KR 101889657B1
- Authority
- KR
- South Korea
- Prior art keywords
- big data
- latency
- memory
- workload
- memory bandwidth
- Prior art date
Links
- 238000007726 management method Methods 0.000 title abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 23
- 230000000750 progressive effect Effects 0.000 claims description 2
- 238000005457 optimization Methods 0.000 abstract description 2
- 230000000116 mitigating effect Effects 0.000 abstract 1
- 238000000638 solvent extraction Methods 0.000 description 6
- 238000002955 isolation Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 3
- 239000002699 waste material Substances 0.000 description 2
- 238000010420 art technique Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
- G06F9/5016—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Abstract
Description
도 2는 레이턴시 크리티컬(latency-critical) 빅데이터 워크로드와 배치 처리(batch-processing) 빅데이터 워크로드의 캐시 크기에 따른 성능 변화 민감도를 측정한 결과를 보여주는 그래프이다.
도 3은 샘플링 된 QPS 지점들에 대하여 메모리 대역폭 크기에 따른 테일 레이턴시(tail latency)를 예측하는 예측선을 보여주는 그래프이다.
도 4는 도 3의 예측선을 이용하여 QPS별로 특정 메모리 대역폭 크기에 따른 테일 레이턴시(tail latency)를 예측하는 예측선을 보여주는 그래프이다.
도 5는 특정 QPS를 선택하여 예측한 예측선과 실제값을 함께 비교하여 나타낸 그래프이다.
도 6 실제로 배치 처리(Batch-processing) 빅데이터 워크로드와 함께 수행했을 때의 테일 레이턴시(tail-latency)의 값과 예측선을 함께 나타낸 그래프이다.
레이턴시 크리티컬 빅데이터 워크로드 | 배치 처리 빅데이터 워크로드와 함께 | |
서버 사용률 | 17 % | 71 % |
Claims (5)
- 레이턴시 크리티컬(latency-critical) 빅데이터 워크로드와 배치 처리(batch-processing) 빅데이터 워크로드가 함께 수행 되는 환경에서 메모리 서브시스템 관리 시스템이 메모리 서브시스템의 자원을 관리하는 방법에 있어서,
(a) 레이턴시 크리티컬(latency-critical) 빅데이터 워크로드에서 요구되는 서비스 레벨 목표(SLO)를 유지할 수 있는 캐시 크기를 결정하여 결정된 크기의 캐시 메모리를 레이턴시 크리티컬(latency-critical) 빅데이터 워크로드에 격리 할당하고, 나머지의 캐시 메모리를 배치 처리(batch-processing) 빅데이터 워크로드에 할당하는 단계; 및
(b) 레이턴시 크리티컬(latency-critical) 빅데이터 워크로드에서 요구되는 서비스 레벨 목표(SLO)를 유지할 수 있는 메모리 대역폭을 결정하여 결정된 크기의 메모리 대역폭을 레이턴시 크리티컬(latency-critical) 빅데이터 워크로드에 격리 할당하고, 나머지의 메모리 대역폭을 배치 처리(batch-processing) 빅데이터 워크로드에 할당하는 단계;를 포함함을 특징으로 하는 메모리 서브시스템 자원 관리 방법. - 제1항에 있어서, 상기 (a) 단계는 소프트웨어에 의한 캐시 분할 기법을 사용하여 캐시 메모리를 격리 할당하고,
상기 (b) 단계는 소프트웨어에 의한 메모리 대역폭 분할 기법을 사용하여 메모리 대역폭을 격리 할당하는 것을 특징으로 하는 메모리 서브시스템 자원 관리 방법. - 제1항에 있어서, 상기 (b) 단계는,
(b1) 샘플링된 QPS(Query Per Second)와 메모리 대역폭으로 메모리 대역폭 크기에 따른 QPS별 테일 레이턴시(tail-latency) 예측선을 점진적 학습 방법으로 생성하는 단계; 및
(b2) (b1) 단계에서 생성된 예측선을 이용하여 주어진 QPS에 따른 메모리 대역폭별 테일 레이턴시(tail-latency) 예측선을 생성하는 단계;를 구비하고,
상기 (b2) 단계에서 생성된 예측선을 이용하여 레이턴시 크리티컬(latency-critical) 빅데이터 워크로드에서 요구되는 서비스 레벨 목표(SLO)를 유지할 수 있는 메모리 대역폭을 결정하는 것을 특징으로 하는 메모리 서브시스템 자원 관리 방법. - 제3항에 있어서, 상기 (b1) 단계는,
QPS의 최소값, 중간값, 최대값을 샘플링하여 사전 프로파일링을 하고, 각 프로파일링 결과를 비교하여 최소값과 중간값의 구간과 중간값과 최대값의 구간 중에서 테일 레이턴시(tail-latency)가 더 급격히 변하는 구간을 기준으로 다시 새로운 중간값을 샘플링하는 방식을 다수 반복한 후, 이웃하는 QPS 지점을 이어 예측선을 생성하는 것을 특징으로 하는 메모리 서브시스템 자원 관리 방법. - 제3항에 있어서, 상기 (b1) 단계는 메모리 대역폭을 최대로 사용하는 스트림 벤치 마크(stream benchmark)를 레이턴시 크리티컬(latency-critical) 빅데이터 워크로드가 사용하고 있는 코어를 제외한 나머지 코어에서 수행하는 상태에서 측정한 테일 레이턴시(tail-latency)에 의한 예측선임을 특징으로 하는 메모리 서브시스템 자원 관리 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170054276 | 2017-04-27 | ||
KR20170054276 | 2017-04-27 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101889657B1 true KR101889657B1 (ko) | 2018-08-20 |
Family
ID=63442883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170068198A KR101889657B1 (ko) | 2017-04-27 | 2017-06-01 | 빅데이터 워크로드 처리를 위한 메모리 서브시스템 자원 관리 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101889657B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200045927A (ko) * | 2018-10-23 | 2020-05-06 | 울산과학기술원 | 시스템의 메모리 대역폭을 분할하는 방법 및 장치 |
KR20210004710A (ko) | 2019-07-05 | 2021-01-13 | 서울대학교산학협력단 | 데이터센터 워크로드를 위한 적응형 성능격리 시스템 |
US11330042B2 (en) * | 2018-05-17 | 2022-05-10 | International Business Machines Corporation | Optimizing dynamic resource allocations for storage-dependent workloads in disaggregated data centers |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7774554B2 (en) * | 2007-02-20 | 2010-08-10 | International Business Machines Corporation | System and method for intelligent software-controlled cache injection |
JP2012515971A (ja) * | 2009-01-30 | 2012-07-12 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー. | キャパシティ計画及び作業負荷管理を統合するためのシステム及び方法 |
US8812797B2 (en) * | 2009-08-14 | 2014-08-19 | Nxp, B.V. | Memory controller with external refresh mechanism |
KR20160076969A (ko) * | 2014-12-23 | 2016-07-01 | 인텔 코포레이션 | 엔드-투-엔드 데이터센터 성능 제어 |
-
2017
- 2017-06-01 KR KR1020170068198A patent/KR101889657B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7774554B2 (en) * | 2007-02-20 | 2010-08-10 | International Business Machines Corporation | System and method for intelligent software-controlled cache injection |
JP2012515971A (ja) * | 2009-01-30 | 2012-07-12 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー. | キャパシティ計画及び作業負荷管理を統合するためのシステム及び方法 |
US8812797B2 (en) * | 2009-08-14 | 2014-08-19 | Nxp, B.V. | Memory controller with external refresh mechanism |
KR20160076969A (ko) * | 2014-12-23 | 2016-07-01 | 인텔 코포레이션 | 엔드-투-엔드 데이터센터 성능 제어 |
Non-Patent Citations (2)
Title |
---|
Harshad Kasture et al., Ubik: Efficient Cache Sharing with Strict QoS for Latency-CriticalWorkloads, in Proc. of the 19th international conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS-XIX), March 2014. |
남윤성 외 3명. '멀티쓰레드 워크로드를 위한 DVFS 기반 메모리 경합 인지 스케줄링 기법'. 한국정보과학회 2016년 동계학술대회 논문집, 2016.12, pp.1242-1244. * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11330042B2 (en) * | 2018-05-17 | 2022-05-10 | International Business Machines Corporation | Optimizing dynamic resource allocations for storage-dependent workloads in disaggregated data centers |
KR20200045927A (ko) * | 2018-10-23 | 2020-05-06 | 울산과학기술원 | 시스템의 메모리 대역폭을 분할하는 방법 및 장치 |
KR102132598B1 (ko) | 2018-10-23 | 2020-07-10 | 울산과학기술원 | 시스템의 메모리 대역폭을 분할하는 방법 및 장치 |
KR20210004710A (ko) | 2019-07-05 | 2021-01-13 | 서울대학교산학협력단 | 데이터센터 워크로드를 위한 적응형 성능격리 시스템 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8533719B2 (en) | Cache-aware thread scheduling in multi-threaded systems | |
Jog et al. | Exploiting core criticality for enhanced GPU performance | |
US7818594B2 (en) | Power efficient resource allocation in data centers | |
EP3507692B1 (en) | Resource oversubscription based on utilization patterns in computing systems | |
US9519562B2 (en) | Process demand prediction for distributed power and resource management | |
US8190795B2 (en) | Memory buffer allocation device and computer readable medium having stored thereon memory buffer allocation program | |
US9921861B2 (en) | Virtual machine management method and information processing apparatus | |
KR101889657B1 (ko) | 빅데이터 워크로드 처리를 위한 메모리 서브시스템 자원 관리 방법 | |
JP2008191949A (ja) | マルチコアシステムおよびマルチコアシステムの負荷分散方法 | |
KR102469927B1 (ko) | 분할 메모리 관리장치 및 방법 | |
US20200183722A1 (en) | Systems and methods for selecting virtual machines to be migrated | |
US11681447B2 (en) | Method, device and computer program product of balance of storage space for file system | |
KR20150097981A (ko) | 가상화 시스템에서 메모리 조정방법 | |
Nasim et al. | Optimizing virtual machine consolidation in virtualized datacenters using resource sensitivity | |
US20120042322A1 (en) | Hybrid Program Balancing | |
KR101848418B1 (ko) | 불균일 기억 장치 접근(numa) 구조에서 메모리 정책기반 쓰레드 재배치 방법 | |
JP6158751B2 (ja) | 計算機資源割当装置及び計算機資源割当プログラム | |
KR102062332B1 (ko) | 처리 시간에 민감한 워크로드에 대한 메모리 대역폭 할당 방법 및 장치 | |
Modi et al. | CABARRE: Request response arbitration for shared cache management | |
JP2024037487A (ja) | 情報記憶装置、制御システムおよび制御方法 | |
KR102319718B1 (ko) | 동적 매니코어 파티셔닝 장치 및 방법 | |
Nabavinejad et al. | Data locality and VM interference aware mitigation of data skew in hadoop leveraging modern portfolio theory | |
Jing et al. | An energy efficient and resource‐constrained scheduling framework for smart city application | |
US10642657B2 (en) | Client-server architecture for multicore computer system to realize single-core-equivalent view | |
US12118394B2 (en) | Method and apparatus for memory integrated management of cluster system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20170601 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20180315 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20180807 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20180810 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20180810 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20220107 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20230801 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20240724 Start annual number: 7 End annual number: 7 |