KR20160042003A - 와트당 최적 성능을 위한 지능형 멀티코어 제어 - Google Patents

와트당 최적 성능을 위한 지능형 멀티코어 제어 Download PDF

Info

Publication number
KR20160042003A
KR20160042003A KR1020167005945A KR20167005945A KR20160042003A KR 20160042003 A KR20160042003 A KR 20160042003A KR 1020167005945 A KR1020167005945 A KR 1020167005945A KR 20167005945 A KR20167005945 A KR 20167005945A KR 20160042003 A KR20160042003 A KR 20160042003A
Authority
KR
South Korea
Prior art keywords
processor
processor cores
temperature
multicore
workload
Prior art date
Application number
KR1020167005945A
Other languages
English (en)
Other versions
KR101700567B1 (ko
Inventor
희준 박
스티븐 톰슨
로날드 프랭크 앨튼
에도아르도 레기니
사티쉬 고베르단
피테르-라위스 담 박케르
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20160042003A publication Critical patent/KR20160042003A/ko
Application granted granted Critical
Publication of KR101700567B1 publication Critical patent/KR101700567B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3243Power saving in microcontroller unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3287Power saving characterised by the action undertaken by switching off individual functional units in the computer system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5094Allocation of resources, e.g. of the central processing unit [CPU] where the allocation takes into account power or heat criteria
    • Y02B60/1239
    • Y02B60/1275
    • Y02B60/1282
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

여러 양태들은 멀티코어 집적회로의 복수의 프로세서 코어들의 지능형 멀티코어 제어에 대한 디바이스 및 방법들을 제공한다. 그 양태들은 주어진 작업부하에 대해 최저 레벨 전력 소비 또는 주어진 전력 예산에 대해 최고 성능을 달성하기 위해 프로세서 코어들의 최적의 세트를 식별하고 활성화할 수도 있다. 프로세서 코어들의 최적의 세트는 활성 프로세서 코어들의 수 또는 특정의 활성 프로세서 코어들의 지정일 수도 있다. 프로세서 코어들의 온도 판독값이 임계값 아래에 있는 경우, 프로세스 코어들의 세트는 주어진 작업부하에 대해 최저 전력 소비를 제공하도록 선택될 수도 있다. 프로세서 코어들의 온도 판독값이 임계값 위에 있는 경우, 프로세스 코어들의 세트는 주어진 전력 예산에 대해 최선의 성능을 제공하도록 선택될 수도 있다.

Description

와트당 최적 성능을 위한 지능형 멀티코어 제어{INTELLIGENT MULTICORE CONTROL FOR OPTIMAL PERFORMANCE PER WATT}
본 출원은 2013년 8월 8일자로 출원된 발명의 명칭이 "Intelligent Multicore Control For Optimal Performance Per Watt" 인 미국 가특허 출원 제 61/863,554 호에 대한 우선권의 이익을 주장하며, 그의 전체 내용들은 참조로 여기에 병합된다.
현재, 제조자들은 다수의 프로세서 코어들의 프로세싱 클록 주파수를 억제함으로써 멀티코어 디바이스들에서의 전력 소비 및 열 문제들을 관리한다. 멀티코어 디바이스들의 다수의 프로세서 코어들의 프로세싱 클록 주파수를 억제하는 것은 멀티코어 프로세서들에 의해 달성되는 작업의 레이트를 감소시킴으로써 전력 소비 및 열 문제들을 관리하는 것을 도울 수 있다. 그러나, 이러한 기법은 성능을 희생하여 이들 문제들을 관리하는 것에 초점을 맞춘다.
이동 디바이스들은 이동 디바이스들상에서 동시에 실행되는 애플리케이션 소프트웨어 및 시스템의 요구들을 다루기 위해 멀티코어 프로세서들을 증가적으로 포함시키고 있다. 이동 디바이스들은 더 높은 성능 레벨들을 달성하거나, 더 큰 소프트웨어 프로세싱 요구들을 다루면서 성능 레벨들을 유지하기 위해 이동 디바이스에 의해 더 많은 전력이 소비되기 때문에 더 빠르게 고갈되는 제한된 전력 예산들을 가짐으로써 제한된다. 소프트웨어 프로세싱 요구들이 증가하고 있는 반면, 사용자들은 프로세싱 속도 및 배터리 수명의 면에서 그들의 이동 디바이스들에 대해 소정 레벨의 성능을 유지하기를 기대한다. 이동 디바이스에 대한 사용자 기대 레벨의 성능을 유지하는 것은 멀티코어 프로세서들의 열 문제들을 관리하면서 지속성 (longevity) 을 위해 성능을 희생시킬지, 또는 성능을 위해 지속성을 희생시킬지 여부에 대한 모순을 생성한다.
여러 양태들의 방법들 및 장치들은, 복수의 프로세서 코어들의 온도 판독값들을 온도 임계값과 비교하는 것, 프로세서 코어 정보 및 복수의 가설적 케이스들에 기초하여 복수의 프로세서 코어들에 대한 맵을 계산하는 것, 온도 판독값들이 온도 임계값보다 작은 경우 주어진 작업부하에 대해 전력 소비를 최적화하는 프로세서 코어들의 제 1 구성을 식별하는 것, 온도 판독값들이 온도 임계값보다 큰 경우 주어진 전력 예산에 대해 성능을 최적화하는 프로세서 코어들의 제 2 구성을 식별하는 것, 및 식별된 구성에 기초하여 복수의 프로세서 코어들의 각각의 프로세서 코어에 대한 활동 상태를 제어하는 것을 포함하는 멀티코어 집적회로의 복수의 프로세서 코어들의 제어를 제공한다. 일 양태의 방법에서, 프로세서 코어 정보 및 복수의 가설적 케이스들에 기초하여 복수의 프로세서 코어들에 대한 맵을 계산하는 것은 온도 판독값들이 온도 임계값보다 작은 경우 주어진 작업부하의 주어진 대표값에 대해 복수의 프로세서 코어들의 조합들에 대한 전력 소비와 온도 사이의 관계들을 나타내는 전력 맵을 계산하는 것, 및 온도 판독값들이 온도 임계값보다 큰 경우 주어진 온도에 대해 복수의 프로세서 코어들의 조합들에 대한 전력 소비와 작업부하 사이의 관계들을 나타내는 성능 맵을 계산하는 것을 포함할 수도 있다.
일 양태의 방법에서, 프로세서 코어들의 제 1 및 제 2 구성들은 활성 프로세서 코어들의 수를 나타낼 수도 있다. 일 양태의 방법에서, 프로세서 코어들의 제 1 및 제 2 구성들은 복수의 프로세서 코어들 중 어느 프로세서 코어들이 활성 프로세서 코어들인지를 나타낼 수도 있다. 일 양태의 방법에서, 프로세서 코어들의 제 1 및 제 2 구성들은 주어진 주파수에 대한 가장 낮은 누설, 가장 낮은 온도, 또는 가장 낮은 전압 레벨을 갖는 프로세서 코어들을 포함할 수도 있다.
일 양태의 방법은 각각의 프로세서 코어와 연관된 프로세서 코어 정보를 판독하는 것으로서, 그 프로세서 코어 정보는 누설 전류, 프로세서 코어 속도, 프로세서 전압 설정 테이블, 최대 클록 주파수, 온도 판독값, 및 현재의 작업부하를 포함하는, 상기 프로세서 코어 정보를 판독하는 것, 및 현재의 작업부하를 현재의 작업부하의 대표 값으로 변환하는 것을 더 포함할 수도 있다. 일 양태의 방법에서, 프로세서 코어 정보는 온도 판독값 및 현재의 작업부하를 포함하는 동적 정보를 포함할 수도 있고, 그 양태의 방법은 그 동적 정보를 반복적으로 판독하는 것을 더 포함할 수도 있다.
일 양태의 방법에서, 멀티코어 집적회로의 프로세서 코어들은 중앙 프로세싱 유닛, 그래픽 프로세싱 유닛의 셰이더 프로세서, 그래픽 프로세싱 유닛의 텍스쳐 파이프, 또는 디지털 신호 프로세서를 포함하는 그룹으로부터 선택된 하나 이상의 프로세서 코어 타입들을 포함할 수도 있다.
일 양태는 복수의 프로세서 코어들을 갖는 멀티코어 집적회로를 포함하는 장치를 포함하고, 여기서 그 멀티코어 집적회로는 상술된 하나 이상의 양태의 방법들의 동작들을 수행하는 프로세서-실행가능 명령들로 구성된다.
일 양태는 상술된 하나 이상의 양태의 방법들의 기능들을 수행하는 수단을 포함하는 멀티코어 집적회로의 복수의 프로세서 코어들의 멀티코어 제어를 위한 장치를 포함한다.
일 양태는 멀티코어 집적회로로 하여금 상술된 하나 이상의 양태의 방법들의 동작들을 수행하게 하도록 구성된 프로세서-실행가능 소프트웨어 명령들을 저장한 비일시적 프로세서 판독가능 매체를 포함한다.
여기에 포함되고 본 명세서의 부분을 구성하는 첨부하는 도면들은 본 발명의 예시적인 양태들을 도시하고, 위에서 주어진 일반적인 설명 및 아래에 주어지는 상세한 설명과 함께, 본 발명의 특징들을 설명하는 작용을 한다.
도 1a 는 다수의 디스플레이들 상에 일 양태의 멀티코어 디바이스에 의해 제시된 다수의 비디오 프리젠테이션을 도시하는 다이어그램이다.
도 1b 는 멀티코어 디바이스의 디스플레이 상에 일 양태의 멀티코어 디바이스에 의해 제시된 다수의 비디오 프리젠테이션을 도시하는 다이어그램이다.
도 2a 는 일 양태의 멀티코어 디바이스 상에서 통상적인 부품들에 의해 프로세싱되는 일정한 작업부하에 대한 전력 소비 및 열 출력에서의 변화들을 도시하는 그래프이다.
도 2b 는 일 양태의 멀티코어 디바이스 상에서 느린 부품들에 의해 프로세싱되는 일정한 작업부하에 대한 전력 소비 및 열 출력에서의 변화들을 도시하는 그래프이다.
도 3 은 멀티코어 디바이스 상의 일 양태의 지능형 멀티코어 제어를 도시하는 블록도이다.
도 4 는 멀티코어 디바이스에 대한 지능형 멀티코어 제어에 대한 예시의 전력 맵들의 일련의 그래프들이다.
도 5a 는 멀티코어 디바이스에 대한 지능형 멀티코어 제어에 대한 일 양태의 성능 맵의 그래프이다.
도 5b 는 멀티코어 디바이스에 대한 지능형 멀티코어 제어에 대한 일 양태의 성능 맵의 그래프이다.
도 6 은 멀티코어 디바이스에 대한 일 양태의 지능형 멀티코어 제어 방법을 도시하는 프로세스 흐름도이다.
도 7 은 지능형 멀티코어 제어와 함께 사용하기 위한 멀티코어 그래픽 집적회로의 예를 도시하는 컴포넌트 블록도이다.
도 8 은 일 양태의 지능형 멀티코어 제어 방법과 함께 사용하기에 적합한 예시의 멀티코어 디바이스를 도시하는 컴포넌트 다이어그램이다.
여러 양태들이 첨부하는 도면들을 참조하여 상세히 기술될 것이다. 가능한 경우에, 동일한 참조 번호들은 동일하거나 유사한 부분들을 지칭하기 위해 도면들 전체에 걸쳐 사용될 것이다. 특정의 예들 및 구현들에 대해 행해진 참조들은 예시의 목적이고, 본 발명 또는 청구범위의 범위를 제한하는 것으로 의도되지 않는다.
여기에서 사용된 바와 같이, 용어 "컴퓨팅 디바이스" 는 스마트 폰들, 랩톱 컴퓨터들, 개인용 컴퓨터들, 서버들, 태블릿 컴퓨터들, 팜-톱 컴퓨터들, 및 개별적으로 프로그램가능 프로세서 및 메모리 및 집적회로 (IC) 에 신호들을 전송하는 회로를 포함하는 유사한 전자 다비이스들 중 임의의 것 또는 모두를 지칭한다.
여기에서 사용된 바와 같이, 용어 "멀티코어 디바이스" 는 다수의 프로세서 코어들을 갖는 IC/시스템-온-칩 (SoC)/프로세서를 갖는 임의의 컴퓨팅 디바이스를 지칭한다. 예시의 멀티코어 디바이스들은 여기서 멀티코어 IC 들을 갖는 것으로서 기술된다. 멀티코어 IC 들의 면에서 멀티코어 디바이스들을 기술하는 것은 예시적인 것이며 어떠한 방식으로든 제한하는 것이 아니라는 것을 의미한다. 멀티코어 IC 들의 설명들은 (중앙 프로세싱 유닛들 (CPU), 그래픽 프로세싱 유닛들 (GPU), 가속화된 프로세싱 유닛들 (APU), 물리 프로세싱 유닛들 (PPU), 디지털 신호 프로세서들 (DSP), 마이크로프로세서들, 및 다른 프로그램가능 로직 디바이스들과 같은) 멀티코어 프로세서들 및 멀티코어 SoC 들과 교환가능할 수도 있다.
여기서 사용된 바와 같이, 용어들 "실리콘 누설", "누설", "IDDQ" 및 "누설 전류" 는 교환가능하게 사용되며, 디바이스가 오프일 때 반도체들의 절연 영역들 및 반도체들의 도전 영역들을 통해 흐르는 전류를 지칭한다. 누설 전류는 온도가 증가함에 따라 지수적으로 증가한다.
멀티코어 디바이스들의 멀티코어 IC 들에 의한 증가된 전력 소비는 종종 멀티코어 IC 들의 증가된 열 방사 또는 증가된 온도, 및 감소된 배터리 수명를 야기한다. 멀티코어 IC 의 온도가 증가하는 경우, 그것은 과도한 가열을 야기하고, 임계 온도들에 도달할 때 프로세서들을 셧다운시킴으로써 멀티코어 디바이스의 성능을 감소시켜, 사용자 경험을 작게 한다. 증가된 전력 소비는 제한된 전력 예산을 갖는 멀티코어 디바이스의 배터리 수명을 매우 감소시킬 수도 있고, 또한 사용자 경험을 작게 한다. 멀티코어 디바이스들에서의 현재의 열 및 전력 관리는 프로세서 코어들의 프로세서 클록 주파수를 억제하거나 감소시키는 것을 수반한다. 더 느린 프로세서 클록은 더 적은 열 출력을 생성하고 더 적은 전력을 사용하지만, 또한 프로세서에 대한 작업부하의 스루풋을 감소시킨다.
다양한 양태들의 방법들 및 다바이스들은 소비된 전력의 와트당 최적 성능을 달성하기 위해 프로세서 태스크들을 수행하기 위해 멀티코어 디바이스들의 멀티코어 IC 들 내의 어느 프로세서 코어들이 사용되어야 하는지 그리고 그 수를 제어함으로써 멀티코어 디바이스들에서의 열 및 전력 문제들을 관리하는 대안적인 방법들을 제공한다. 동일한 작업부하에 대한 전력 소비는 누설 및 동적 전력 트렌드들에 기인하여 작업부하를 실행하는 활성 프로세서 코어들의 수에 따라 변한다. 여러 양태들에서, 와트당 최선의 성능을 위한 활성 코어들의 최적의 수는 예를 들어 온도, 속도, 누설, 부품 타입, 및 총 작업부하와 같은 여러 팩터들에 기초하여 결정될 수도 있다.
멀티코어 디바이스들 상의 동시적인 멀티미디어 프로세스들은 제한된 전력 예산들을 갖는 멀티코어 디바이스들에 대한 상당한 전력 프로파일들을 요구한다. 그러한 멀티미디어 프로세스들의 예들은 하나 이상의 디바이스들 상에서의 하나 이상의 출력들을 위한 그래픽스, 피직스, 비디오, 이미지, 오디오, 및 통신 프로세싱을 포함한다. 도 1a 및 도 1b 는 동시적인 멀티미디어 프로세스들을 실행하는 예시적인 멀티코어 디바이스 (10) (예를 들어, 스마트폰) 를 도시한다. 도 1a 에서, 멀티코어 디바이스 (10) 는 무선 (또는 유선) 연결 (14) 을 통해 디스플레이 디바이스 (12) 에 연결될 수도 있다. 멀티코어 디바이스 (10) 는 멀티미디어 프로세스 출력 (16) 의 디스플레이를 위해 데이터를 송신할 수도 있다. 예를 들어, 멀티코어 디바이스 (10) 는 초당 60 프레임들 (fps) 로 1080p 해상도로 비디오 게임 그래픽을 디스플레이하기 위해 사용될 수도 있는 데이터를 송신할 수도 있다. 디스플레이 디바이스 (12) 는 멀티미디어 프로세스 출력을 제시하기 위해 멀티코어 디바이스 (10) 롤부터 무선 연결 (14) 을 통해 수신된 데이터를 사용할 수도 있다. 이러한 예에서, 디스플레이 디바이스 (12) 는 임의의 컴퓨팅 디바이스, 연결된 텔레비젼 또는 모니터, 또는 다른 멀티코어 디바이스일 수도 있다. 동시에, 멀티코어 디바이스 (10) 는 상이한 멀티미디어 프로세스 출력 (18) 을 제시할 수도 있다. 예를 들어, 멀티코어 디바이스 (10) 는 상이한 게임 장면, 통신 인터페이스, 게임 제어기, 또는 게임, 애플리케이션 또느느 이동 디바이스 사용자 인터페이스를 제시할 수도 있으며, 이들은 디스플레이 디바이스 (12) 상에 제시된 멀티미디어 프로세스 출력과는 상이한 복잡성을 가질 수도 있다. 멀티코어 디바이스 (10) 및 디스플레이 디바이스 (12) 양자는 예를 들어 멀티코어 디바이스 (10) 의 사용자의 상대방 및/또는 사용자의 하나 이상의 추가의 이미지들 또는 비디오들을 디스플레이할 수도 있다.
도 1b 에서 도시된 예는 멀티코어 디바이스 (10) 가 다수의 멀티미디어 프로세스 출력들을 동시에 제시할 수도 있다는 것을 도시한다. 이러한 예에서, 멀티코어 디바이스 (10) 는 디스플레이 (20) 상에 멀티미디어 프로세스 출력 (16) 및 하나 이상의 상이한 멀티미디어 프로세스 출력들 (18) 을 동시적으로 제시할 수도 있다. 멀티미디어 프로세스 출력 (16) 은 예를 들어 60 fps 에서 1080p 해상도로 비디오 게임 그래픽들을 포함할 수도 있고, 하나 이상의 상이한 멀티미디어 프로세스 출력들 (18) 은 예를 들어 30 fps 에서 1080p 해상도로 사용자의 상대방 및/또는 사용자의 비디오들을 포함할 수도 있다. 디스플레이 (20) 는 다양한 기지의 디스플레이 기술들에 의해 구현될 수도 있고 소정 범위의 해상도들 및 리프레시 레이트들을 지원할 수도 있다. 도 1a 및 도 1b 양자에 도시된 예들에서, 멀티코어 디바이스 (10) 및 디스플레이 디바이스 (12) 는 비디오 게임의 오디오 부분들 및/또는 사용자와 상대방 사이의 통신들과 같은 다른 멀티미디어 프로세스 출력들을 제시할 수도 있다. 멀티코어 디바이스 (10) 는 또한 제시에 관련된 진동들과 같은 햅틱 피드백을 제공할 수도 있다. 이들 예들에 수반된 출력들을 제시하기 위한 그리고 멀티미디어 프로세스들 모두를 프로세싱하기 위한 멀티코어 디바이스 (10) 의 작업부하는 멀티코어 IC 들에 의한 열 출력 및 전력 소비에서의 상당한 증가들을 초래할 수도 있다.
도 2a 및 도 2b 의 그래프들은 여러 온도 레벨들에서의 멀티코어 디바이스들 상의 통상적이고 느린 부품들에 의해 프로세싱된 일정한 작업부하에 대한 전력 소비에서의 변동들을 도시한다. 작업부하의 양은 초당 백만개의 명령들 (Million of Instructions per Second) 을 나타내는 MIPS 로서 측정되고 나타내질 수 있다. 대량 생산 가동에서, 각각의 멀티코어 IC 는 그 멀티코어 IC 의 컴포넌트 재료들에서의 고유의, 자연적 변동들에 기인하여 약간 상이한 물리적 및 성능 특성들을 가질 수도 있고, 이것은 배치 내의 각 멀티코어 IC 의 프로세싱 속도 및 열 성능에서의 다양성을 도입할 수도 있다. 성능에서의 변동들은 빠른, 통상적인/정격의, 또는 느린 멀티코어 IC 로서 카테고리화되는 멀티코어 IC 를 야기할 수도 있다. 성능에서의 변동들은 또한 멀티코어 IC 에서의 코어-투-코어 차이들, 상이한 능력들을 가지고 및/또는 상이한 목적들을 위해 구성된 프로세서들 및/또는 코어들, 및 작업부하 분포로부터 야기될 수도 있다. 코어들이 동일한 회로 설계를 갖는 경우에도, 동일한 Si 다이 상의 코어들의 특징들은 Si 제조 범위, 작업부하 차이에 따른 동적 온도 변화들, 코어 로케이션에 기인한 열 소산 차이, Si 다이 플로어플랜 상의 근처의 다른 기능 블록들로부터의 열 전도와 같은 수개의 이유들로 변화할 수도 있다. 멀티코어 IC 들에 의해 달성되는 성능은 트랜지스터 접합 온도에 따른다. 도 2a 및 도 2b 의 그래프들은 각각 2 개, 3 개, 및 4 개의 활성 프로세서 코어들을 갖는 통상적이고 느린 멀티코어 IC 들의 경우들을 나타낸다. 통상적인 멀티코어 IC 들의 성능을 묘사하는 그래프 (200) 는, 그들의 온도가 대략 25 ℃ 와 90 ℃ 사이일 때, 3 개의 활성 프로세서 코어들로 (라인 204) 일정한 작업부하를 실행하기 위해 예시적인 멀티코어 IC 가 어떻게 최적으로 실행될 (최소의 전력을 사용할) 수도 있는지를 보여준다. 대략 90 ℃ 위에서, 동일한 멀티코어 IC 는 2 개의 활성 프로세서 코어들로 (라인 206) 일정한 작업부하를 실행하기 위해 최적으로 실행될 수도 있다. 이러한 예에서, 도시된 온도 범위에서 동일한 양의 작업부하를 프로세싱하기 위해 제 4 프로세서 코어를 활성화하는 것은 이러한 예시의 멀티코어 IC 에 대해 최적이 아닐 수도 있다 (라인 208). 동일한 온도 범위 내의 예시적인 느린 멀티코어 IC 의 경우, 그래프 (202) 는 2 개의 활성 프로세서 코어들 (라인 212), 또는 4 개의 활성 프로세서 코어들 (라인 214) 보다는 3 개의 활성 프로세서 코어들 (라인 210) 로 일정한 작업부하를 프로세싱하는 것이 최적일 수도 있다는 것을 보여준다. 최저 전력 소비를 위한 활성 코어들의 최적의 수는 온도, IC 속도, 및 작업부하의 양 (요구되는 MIPS 또는 MHz) 에 따라 변할 수도 있다.
도 3 은 멀티코어 IC 에서 활성이어야 하는 다수의 프로세서 코어들의 수 및 특정의 프로세서 코어들을 제어하는 일 양태의 지능형 멀티코어 제어를 도시한다. 이러한 예에서의 멀티코어 IC (300) 는 코어 0, 코어 1, 코어 2, 및 코어 3 으로 라벨링된 4 개의 프로세서 코어들 (302) 을 포함한다. 임의의 멀티코어 IC (300) 내의 프로세서 코어들 (302) 의 수는 변할 수도 있고, 도 3 에 도시된 4 개의 프로세서 코어들보다 더 많거나 더 적을 수도 있다. 각각의 프로세서 코어 (302) 는 프로세서 코어 (302) 로부터 액세스될 수도 있거나, 별개의 프로세서 (도시하지 않음) 또는 메모리 (도시하지 않음) 로부터 액세스될 수도 있는 다양한 프로세서 코어 (또는 Si) 정보 (304) 와 연관될 수도 있다. 프로세서 코어 정보 (304) 는 IDDQ 테스팅 결과들 또는 누설 전류, 부품 타입 또는 프로세서 코어 (또는 Si) 속도 (예를 들어, 느린, 통상의/정격의, 또는 빠른), 프로세서 전압 스케일링 (PVS) 테이블, 최대 클록 주파수 (Fmax), 온도 판독값들, 및 현재의 작업부하를 포함할 수도 있다.
어느 프로세서 코어들 (302) 을 활성으로 해야 할지 및 그 최적의 수를 결정하기 위해, 작업부하 분석기 (306) 는 각각의 프로세서 코어 (302) 에 대한 프로세서 코어 정보 (304) 를 갖는 신호들 (316) 을 모을 수도 있다. 작업부하 분석기 (306) 는 프로세서 코어들 (302) 로부터의 소정의 정적 정보를 저장하기 위해 사용될 수도 있는 메모리 (도시하지 않음) 와 연관될 수도 있다. 프로세서 코어들 (302) 의 정적 정보는 누설, PVS 테이블, 부품 타입 또는 속도, 및 최대 클록 주파수와 같은, 일정한 프로세서 코어 정보 (304) 일 수도 있다. 이러한 정적 정보를 저장하는 것은 프로세서 코어들 (302) 에 대한 정적 정보를 취출하는 오버헤드를 감소시킬 수도 있으며, 이것에 의해 프로세서 코어들 (302) 의 최적의 조합을 결정하는데 요구되는 시간 및 전력을 감소시킨다. 정적 정보는 프로세서 코어 (302) 에 대한 제조자 사양들 및/또는 프로세서 코어 (302) 의 제조 프로세스 동안의 테스팅으로부터 야기될 수도 있다. 제조자는 정적 정보가 사용자에 의한 프로세서 코어 (302) 의 사용 이전에 멀티코어 디바이스 내에 포함되도록 제조하는 동안 프로세서 코어 (302), 별개의 프로세서, 또는 메모리상에 정적 정보를 저장할 수도 있다. 나머지 프로세서 코어 정보 (304) 는 시간이 경과함에 따라 변할 수도 있는 동적 정보일 수도 있다. 그러한 동적 정보는 프로세서 코어들 (302) 의 온도 판독값들 및 작업부하들을 포함할 수도 있다. 그러한 동적 정보는 예를 들어 프로세서 코어들 (302) 의 최적의 조합의 각 결정을 위해 필요에 따라 작업부하 분석기 (306) 에 의해 취출될 수도 있다. 작업부하 분석기 (306) 는 프로세서 코어들 (302) 의 현재의 작업부하 정보를 프로세서 코어들 (302) 에 대한 작업부하의 대표값으로 변환할 수도 있다. 예를 들어, 작업부하는 MIPS, 프로세서 활용도, 클록 주파수, 또는 일부 성능 카운터 값들에 의해 표현될 수도 있다. 현재의 작업부하 정보 및 작업부하의 대표값은 프로세서 코어들 (302) 의 개체 또는 그룹일 수도 있다.
실시간 멀티코어 전력 모델 (308) 은 변환된 작업부하 대표값을 포함하여, 일부 또는 모든 프로세서 코어 정보 (304) 를 갖는 신호 (318) 를 수신할 수도 있다. 실시간 멀티코어 전력 모델 (308) 은 가설적 케이스들의 범위에 대한 프로세서 코어 정보 (304) 및 현재 제공된 프로세서 코어 정보 (304) 를 컴퓨팅하기 위해 프로세서 코어 정보 (304) 를 사용할 수도 있다. 이들 가설적 케이스들은 작업부하 값에서 소정 범위의 온도들에 대해 활성 프로세서 코어들 (302) 의 여러 조합들을 포함할 수도 있다. 실시간 멀티코어 전력 모델 (308) 은 주어진 작업부하들 (또는 작업부하들의 주어진 대표값) 에 대한 프로세서 코어들 (302) 의 조합들에 대한 온도와 전력 소비 사이의 관계들을 나타내는 실제의 및 가설적 계산들 및/또는 계산 결과들로 이루어지는 전력 맵들, 또는 데이터 세트들을 생성할 수도 있다. 가설적 케이스들은 또한 주어진 온도에서 소정 범위의 작업부하들에 대해 활성 프로세서 코어들 (302) 의 여러 조합들을 포함할 수도 있다. 실시간 멀티코어 전력 모델 (308) 은 소정의 가설적 케이스들에 대한 프로세서 코어 정보 (304) 및 현재 제공된 프로세서 코어 정보 (304) 에 기초하여 성능 맵들, 또는 데이터 세트들을 유사하게 생성할 수도 있다. 계산들은 선택된 온도들에서 프로세서 코어들 (302) 의 조합들에 대한 예를 들어 초당 실행된 명령들 또는 스루풋에 의해 표현되는 작업부하와 전력 소비 사이의 관계들을 나타낸다. 전력 및 성능 맵들은 온도들 및 대표 작업부하 값들과 같은, 그 맵들을 결정하기 위해 사용되는 팩터들, 및 신호 (320) 로서 프로세서 코어 정보 (304) 의 일부 또는 전부와 함께 실시간 멀티코어 전력 모델 (308) 에 의해 출력될 수도 있다.
실시간 멀티코어 전력 모델 (308) 은 주어진 작업부하에 대한 최저-전력 또는 주어진 전력 예산에 대한 최고-성능 중 하나일 수도 있는 현재의 최적화 정책에 따라 전력 또는 성능 맵들을 생성할 수도 있다. 다른 양태에서, 실시간 멀티코어 전력 모델 (308) 이 전력 맵 또는 성능 맵을 생성하는지 여부는 소정의 팩터들에 달려있을 수도 있다. 예를 들어, 온도 임계값이 어느 맵을 생성해야할지를 결정하기 위해 적용될 수도 있다. 온도 판독값들이 임계값 아래에 있는 경우, 실시간 멀티코어 전력 모델 (308) 은 주어진 작업부하에 대한 최저 전력 소비를 결정하는 것을 돕기 위해 전력 맵을 생성할 수도 있다. 이것은 멀티코어 디바이스가 가능한 한 낮은 전력 소비를 유지하면서 작업부하 필요들을 충족시키는 것을 허용할 수도 있으며, 이것에 의해 배터리의 수명을 연장한다. 전력 소비를 가능한 한 낮게 유지하는 것은 작업부하에 대한 성능 목표들을 여전히 달성하면서 온도를 가능한 한 낮게 유지하는 것을 야기한다. 온도 판독값들이 임계값 위에 있는 경우, 실시간 멀티코어 전력 모델 (308) 은 주어진 전력 예산 또는 레벨에 대해 최저 전력 소비에서 최선의 성능, 또는 최고 작업부하를 결정하는 것을 돕기 위해 성능 맵을 생성할 수도 있다. 이것은 멀티코어 디바이스가 최소 전력량으로 최고 적업부하를 제공하는 것을 허용하며, 이것에 의해 이들 파라미터들 내에서 최선의 사용자 경험을 제공하면서 온도를 상승시키는 것에 최소의 영향을 미치거나 심지어 온도를 유지하거나 감소시킨다.
그 맵들을 생성하는데 있어서, 실시간 멀티코어 전력 모델 (308) 은 개개의 프로세서 코어들 (302) 의 여러 조합들에 기초하여 결과들을 계산하기 위해 각 프로세서 코어 (302) 의 프로세서 코어 정보 (304) 를 사용할 수도 있다. 예를 들어, 실시간 멀티코어 전력 모델 (308) 은 최저 온도들, 최소 누설, 최고 속도, 및/또는 최소 작업부하를 갖는 프로세서 코어들 (302) 을 조합하기로 선택할 수도 있다. 다른 양태에서, 실시간 멀티코어 전력 모델 (308) 은 그의 계산들에서 소정의 가정들을 행할 수도 있다. 그러한 가정들은 동일한 멀티코어 IC (300) 에 속하는 각각의 프로세서 코어 (302) 가 프로세서 코어 정적 정보와 같은 소정의 특징들을 공유할 수도 있다는 것응ㄹ 포함할 수도 있다. 다른 양태들은 프로세서 코어들 (302) 의 조합들을 생성하는데 있어서 소정의 규칙들을 고수하도록 실시간 멀티코어 전력 모델 (308) 에게 요청할 수도 있고, 그러한 프로세서 코어 조합들은 단지 인접한 프로세서 코어들 (302) 만을 포함해야하거나 (예를 들어, 코어 0 과 코어 1; 코어 1 과 코어 2; 코어 2 와 코어 3; 코어 3 과 코어 4; 코어 1, 코어 1 및 코어 2; 코어 1, 코어 2 및 코어 3 및 코어 2, 코어 3 및 코어 4), 단지 동일한 타입의 프로세서 코어들 (302) 만이 조합될 수도 있다. 인접한 프로세서 코어들 (302) 은 물리적으로 인접할 필요는 없고, 그들은 규칙에 의해 인접한 것으로서 지정될 수도 있다.
성능/와트 최적화 엔진 (310) 은 신호 (320) 로서 실시간 멀티코어 전력 모델 (308) 로부터 맵들 및 팩터들을, 및 또한 신호 (322) 로서 시스템 전력 예산 관리기 (314) 로부터 전력 예산을 수신할 수도 있다. 팩터들은 온도들 및 대표 작업부하 값들, 및 프로세서 코어 정보 (304) 의 일부 또는 전부와 같은 맵들을 결정하기 위해 사용되는 팩터들을 포함할 수도 있다. 최적화 엔진 (310) 은 현재의 작업부하에 대한 프로세서 코어들 (302) 의 최적의 구성을 결정하거나 식별하기 위해 다차원 공간에서 성능 최적화 알고리즘을 실행할 수도 있다. 그 구성은 활성 및/또는 비활성 프로세서 코어들 (302) 의 수, 및/또는 어느 프로세서 코어들 (302) 이 활성 및/또는 비활성이도록 지정되어야 하는지를 포함할 수도 있다. 활성으로 해야 하는 프로세서 코어들 (302) 의 수는 그 맵들, 및 일부 경우들에서 마찬가지로 팩터들을 사용하는 성능 최적화 알고리즘으로부터 도출될 수도 있다. 실시간 멀티코어 전력 모델 (308) 과 같이, 최적화 엔진 (310) 은 개개의 정보에 기초하여, 소정의 가정들에 기초하여, 또는 규칙들의 세트에 기초하여 프로세서 코어들 (302) 의 임의의 조합을 행할 수도 있다. 활성 및/또는 비활성 프로세서 코어들 (302) 을 선택하는 것은 개개의 프로세서 코어들 (302) 의 프로세서 코어 정보 (304) 의 임의의 단일의 부분 또는 조합에 기초할 수도 있다. 예를 들어, 최적화 엔진 (310) 은 주어진 주파수에 대해 최저 누설, 최저 온도, 및/또는 최저 전압 레벨을 갖는 활성 프로세서 코어들 (302) 을 선택할 수도 있다. 최적화 엔진 (310) 은 시간, 작업부하, 전력 소비량, 및/또는 온도 레벨과 같은 단위 측정에 대해 얼마나 많은 및/또는 어느 프로세서 코어들 (302) 이 활성 및/또는 비활성이 되어야 하는지를 식별할 수도 있다.
멀티코어 관리기 (312) 는 최적화 엔진 (310) 으로부터의 식별된 프로세서 코어 정보를 갖는 신호 (324) 를 수신할 수도 있다. 멀티코어 관리기 (312) 는 각 프로세서 코어 (302) 에 대한 활성 상태를 제어할 수도 있으며, 이것에 의해 단위 측정에 대해 얼마나 많은 및/또는 어느 프로세서 코어들 (302) 이 활성/비활성인지를 제어한다. 일 양태에서, 멀티코어 관리기 (312) 는 프로세서 코어들 (302) 의 특정의 것 또는 그룹 내에서 활성 상태 및/또는 비활성 상태를 유도하는 상태 신호 (326) 로 멀티코어 IC (300) 또는 개개의 프로세서 코어들 (302) 에게 시그널링할 수도 있다. 일 양태에서, 멀티코어 관리기 (312) 는 최적화 엔진 (310) 에 의해 활성인 것으로 간주되는 프로세서 코어들 (302) 에 대해서만 프로세스들을 스케쥴링하기 위해 스케쥴러 (도시하지 않음) 를 제어하거나 스케쥴러와 상호작용한다. 다른 양태에서, 멀티코어 관리기 (312) 는 활성 프로세서 코어들 (302) 에 대한 프로세스들을 스케쥴링하기 위해 및 최적화 엔진 (310) 에 의해 비활성인 것으로 간주되는 프로세서 코어들 (302) 에 대해 프로세스들을 스케쥴링하는 것을 피하기 위해 스케쥴러를 제어하거나 스케쥴러와 상호작용한다.
일 양태에서, 멀티코어 디바이스는 하나 이상의 멀티코어 IC (300) 들을 가질 수도 있다. 멀티코어 디바이스는 각각의 작업부하 분석기 (306), 실시간 멀티코어 전력 모델 (308), 최적화 엔진 (310), 및 멀티코어 관리기 (312) 중 하나 이상을 더 포함할 수도 있다. 이들 컴포넌트들 각각은 하나 이상의 멀티코어 IC 들 (300) 과 쌍을 이룰 수도 있다.
작업부하 분석기 (306), 실시간 멀티코어 전력 모델 (308), 최적화 엔진 (310), 및 멀티코어 관리기 (312) 는 각각 멀티코어 디바이스의 메모리 (도 8 참조) 상에 저장된 소프트웨어로서 구현되고 멀티코어 디바이스의 프로세서 (도 8 참조) 에 의해 실행될 수도 있다.
도 4 는 멀티코어 디바이스에 대한 지능형 멀티코어 제어에 대한 일 양태의 그래픽적 전력 맵들의 예들을 도시한다. 그래픽적 표현들 (400, 402, 404 및 406) 은 전력 맵들을 초래하는 4 개의 상황들을 묘사한다. 각 그래픽적 표현 (400, 402, 404 및 406) 은 소정 범위의 온드들에 대한 주어진 대표 작업부하 값에서 지정된 수의 프로세서 코어들에 대한 실시간 멀티코어 전력 모델에 의해 계산된 전력 소비를 나타내는 개개의 그래프들을 포함한다. 제 1 예시적 전력 맵 (400) 의 그래픽적 표현은 통상적인 타입의 멀티코어 IC 및 중간 작업부하 (예를 들어, 중간 MIPS 수) 에 대한 것이다. 이러한 제 1 예시적인 전력 맵의 생성에 수반된 예시적인 멀티코어 IC 의 경우, 1 개 내지 4 개의 프로세서 코어들이 작업부하를 다룰 수 있을 수도 있다. 화살표 (408) 는 대략 110 ℃ 에서 2 개의 활성 프로세서 코어들을 사용하는 것은 지정된 작업부하를 여전히 다룰 수 있으면서 최저 전력 소비를 야기한다는 것을 나타낸다.
제 2 예시적인 전력 맵 (402) 의 그래픽적 표현은 또한 통상적인 타입의 멀티코어 IC 에 대한 것이지만, 과중한 작업부하 (예를 들어, 높은 MIPS 수) 를 갖는다. 이러한 예에서, 이러한 제 2 의 예시적인 전력 맵을 생성하기 위해 사용되는 예시적인 멀티코어 IC 는 작업부하를 다루기 위해 2 개 내지 4 개의 프로세서 코어들을 필요로할 수도 있다. 이러한 경우에서의 화살표 (410) 는 대략 120 ℃ 에서 3 개의 활성 프로세서 코어들을 사용하는 것은 지정된 작업부하를 여전히 다룰 수 있으면서 최저 전력 소비를 야기한다는 것을 나타낸다.
제 3 예시적인 전력 맵 (404) 의 그래픽적 표현은 그것이 느린 타입의 멀티코어 IC 에 대한 것이기 때문에 이전의 2 개의 그리픽적 표현들 (400, 402) 과는 상이하지만, 제 1 예시적인 전력 맵 (400) 의 그래픽적 표현과 동일한 작업부하를 사용한다. 이러한 예에서, 1 개 내지 4 개의 프로세서 코어들이 작업부하를 다룰 수도 있고, 화살표 (412) 는 2 개의 활성 프로세서 코어들을 사용하는 것은 대략 110 ℃ 에서 작업부하를 다루는 것에 대해 최저 전력 소비를 야기한다는 것을 나타낸다.
제 4 예시적인 전력 맵 (406) 의 그래픽적 표현은 느린 타입의 멀티코어 IC 에 대한 것이지만 제 2 예시적인 전력 맵 (402) 의 그래픽적 표현과 동일한 과중한 작업부하를 사용한다. 이러한 예에서, 2 개 내지 4 개의 프로세서 코어들이 작업부하를 다룰 수도 있고, 화살표 (414) 는 4 개의 활성 프로세서 코어들을 사용하는 것은 대략 110 ℃ 에서 작업부하를 다루는 것에 대해 최저 전력 소비를 야기한다는 것을 나타낸다.
도 5a 및 도 5b 는 멀티코어 디바이스에 대한 지능형 멀티코어 제어를 위한 일 양태의 성능 맵들을 도시한다. 그래픽적 표현들 (500 및 502) 은 성능 맵들을 야기하는 2 개의 상황들을 묘사한다. 각각의 그래픽적 표현은 여러 작업부하들에 대한 프로세서 코어들의 지정된 수에 대한 실시간 멀티코어 전력 모델에 의해 계산된 전력 소비를 나타내는 그래프를 포함한다. 이들 계산들에서의 온도 (도시하지 않음) 는 일정할 수도 있다. 제 1 예시적인 성능 맵 (500) 의 그래픽적 표현은 통상적인 타입의 멀티코어 IC 에 대한 것이다. 이러한 성능 맵의 생성에서 수반되는 예시적인 멀티코어 IC 의 경우, 1 개 내지 4 개의 프로세서 코어들은 다양한 작업부하들을 다룰 수 있을 수도 있다. 화살표 (504) 는 2 개의 활성 프로세서 코어들을 사용하는 것은 P2 mW 의 전력 예산에서 X2 MIPS 의 최선의 성능을 야기하지만, 1 개의 활성 프로세서 코어는 더 적은 MIPS 를 다룰 수 있고, 3 개 또는 4 개의 활성 프로세서 코어들은 대략 동일한 전력 예산에서 훨씬 더 적은 MIPS 를 다룰 수 있다는 것을 나타낸다.
제 2 예시적인 성능 맵 (502) 의 그래픽적 표현은 또한 통상적인 타입의 멀티코어 IC 에 대한 것이지만, 다양한 작업부하들을 다룰 수 있는 2 개 내지 4 개의 프로세서 코어들을 가진다. 이러한 경우에서의 화살표 (506) 는 4 개의 활성 프로세서 코어들을 사용하는 것은 P5 mW 의 전력 예산에서 X4 MIPS 의 최선의 성능을 야기하지만, 3 개의 활성 프로세서 코어들은 더 적은 MIPS 를 다룰 수 있고, 2 개의 활성 프로세서 코어들은 대략 동일한 전력 예산에서 훨씬 더 적은 MIPS 를 다룰 수 있다는 것을 나타낸다.
도 6 은 멀티코어 디바이스에 대한 일 양태의 지능형 멀티코어 제어 방법 (600) 을 도시하는 프로세스 흐름도이다. 멀티코어 디바이스가 다수의 멀티코어 IC 들을 갖는 경우, 멀티코어 디바이스는 특정의 멀티코어 IC 들의 프로세서 코어들에 대해 여기에 기술된 블록들의 일부 또는 전부를 실행하기로 선택할 수도 있다. 예를 들어, 멀티코어 디바이스는 일반적 계산 태스크를 위한 멀티코어 IC 및 특히 멀티미디어 프로세싱 및 렌더링을 위한 다른 멀티코어 IC 를 포함할 수도 있다. 특정의 태스크들이 상이한 멀티코어 IC 들에 대해 지정될 수도 있다. 멀티코어 디바이스가 지능형 멀티코어 제어 방법 (600) 을 실행하는 경우, 그것은 특정의 멀티코어 IC 에 대한 특정의 태스크들의 작업부하에 대해 그렇게 할 수도 있다. 그러한 예들에서, 멀티코어 디바이스는 작업부하에 대한 적절한 멀티코어 IC 를 선택하고 그 선택된 멀티코어 IC 의 프로세서 코어들에 대해 지능형 멀티코어 제어 방법 (600) 의 블록들을 실행할 수도 있다.
블록 (602) 에서, 멀티코어 디바이스는 멀티코어 디바이스의 프로세서 코어들의 일부 또는 전부와 연관된 정적 정보를 판독할 수도 있다. 프로세서 코어들의 정적 정보는 누설, PVS (processor voltage scaling) 테이블, 및 부품 타입 또는 Si 속도와 같은, 일정한 프로세서 코어 정보일 수도 있다. 블록 (604) 에서, 멀티코어 디바이스는 멀티코어 디바이스의 프로세서 코어들과 연관된 동적 정보를 판독할 수도 있다. 동적 정보는 시간의 경과에 따라 변할 수도 있고, 프로세서 코어들의 온도 판독값들 및 작업부하들을 포함할 수도 있다. 블록 (606) 에서, 멀티코어 디바이스는 현재의 작업부하 판독값을 대표 작업부하 값으로 변환할 수도 있다. 예를 들어, 작업부하는 MIPS, 프로세서 활용도, 동작 클록 주파수, 또는 일부 성능 카운터 값에 의해 표현될 수도 있다.
결정 블록 (608) 에서, 멀티코어 디바이스는 온도 판독값들을 온도 임계값과 비교함으로써 온도 임계값에 대한 온도 판독값들의 관계를 결정할 수도 있다. 이러한 관계의 결정은 여러 방법으로 행해질 수도 있다. 멀티코어 디바이스는 각각의 프로세서 코어의 온도 판독값들과 온도 임계값을 비교할 수도 있다. 그 결정은 프로세서 코어 기반으로 프로세서 코어에 대해 행해질 수도 있고, 전체 결정은 다수결 원칙에 의해 행해질 수도 있다. 예를 들어, 대다수의 프로세서 코어 온도 판독값들이 온도 임계값보다 작은 경우, 프로세서 코어들의 전체 그룹은 결정 블록 (608) 에서의 결정의 목적들로 임계값 아래의 온도 판독값들을 갖는 것으로서 취급된다. 일 양태에서, 각각의 프로세서 코어는 결정 블록 (608) 에서의 결정의 목적으로 별개로 취급될 수도 있다. 다른 양태는 결정 블록 (608) 에서의 결정의 목적으로 온도 임계값과 비교하고 프로세서 코어들을 그룹으로서 취급하기 위해 프로세서 코어들의 그룹의 평균 또는 중간 온도를 사용할 수도 있다.
결정된 관계(들)에 따라, 멀티코어 디바이스는 전력 맵들 또는 성능 맵들을 계산할 수도 있다. 결정 블록 (608) 에서의 결정이 프로세서 코어들에 대한 온도 판독값들이 그룹으로 또는 개별적으로 온도 임계값보다 크다는 것인 경우, 블록 (610) 에서, 멀티코어 디바이스는 주어진 전력 예산에 대한 최적의 또는 최선의 성능을 달성하기 위해 사용될 성능 맵을 계산할 수도 있다. 일 양태에서, 온도 판독값들이 임계값과 동일한 경우, 멀티코어 디바이스는 블록 (610) 에서 성능 맵을 계산할 수도 있다. 블록 (612) 에서, 멀티코어 디바이스는 주어진 전력 예산에 대한 성능을 최적화할 수도 있는 프로세서 코어들의 구성을 식별할 수도 있다. 일 양태에서, 그 구성은 주어진 전력 예산에 대해 성능을 최적화할 수도 있는 활성/비활성 프로세서 코어들의 수 및/또는 어느 활성/비활성 프로세서 코어들이 주어진 전력 예산에 대해 성능을 최적화할 수도 있는지를 포함한다. 블록 (618) 에서, 멀티코어 디바이스는 프로세서 코어들의 활성 상태를 제어할 수도 있으며, 이것에 의해 주어진 전력 예산에 대해 최선의 성능을 달성하는 파라미터들 내에서 작업부하를 실행하기 위해 어느 프로세서 코어들이 활성 및/또는 비활성이어야하는지 및/또는 그 수를 제어한다.
결정 블록 (608) 에서의 결정이 프로세서 코어들에 대한 온도 판독값들이 그룹으로 또는 개별적으로 온도 임계값보다 작은 경우, 블록 (614) 에서, 멀티코어 디바이스는 주어진 작업부하에 대한 최적의 또는 최저의 전력을 달성하기 위해 사용될 전력 맵을 계산할 수도 있다. 일 양태에서, 온도 판독값들이 임계값과 동일한 경우, 멀티코어 디바이스는 블록 (614) 에서 전력 맵을 계산할 수도 있다. 블록 (616) 에서, 멀티코어 디바이스는 주어진 작업부하에 대해 전력을 최적화할 수도 있는 프로세서 코어들의 구성을 식별할 수도 있다. 일 양태에서, 그 구성은 주어진 작업부하에 대해 어느 활성/비활성 프로세서 코어들이 전력을 최적화할 수도 있는지 및/또는 그 활성/비활성 프로세서 코어들의 수를 포함할 수도 있다. 블록 (618) 에서, 멀티코어 디바이스는 프로세서 코어들의 활성 상태를 제어할 수도 있으며, 이것에 의해 주어진 작업부하에 대해 최저 전력을 달성하는 파라미터들 내에서 작업부하를 실행하기 위해 어느 프로세서 코어들이 활성 및/또는 비활성인지 및/또는 그 수를 제어한다.
멀티코어 디바이스는 실행될 프로세스들의 각 작업부하에 대해 지능형 멀티코어 제어 방법 (600) 을 반복적으로 수행할 수도 있다. 일 양태에서, 정적 정보는 변하고 있지 않을 수도 있기 때문에 블록 (602) 를 반복하는 것이 불필요할 수도 있다. 그러한 경우들에서, 멀티코어 디바이스는 프로세서 코어들의 동적 정보를 판독함으로써 블록 (604) 으로부터 지능형 멀티코어 제어 방법 (600) 을 반복할 수도 있다.
도 7 은 여기에 기술된 지능형 멀티코어 제어와 함께 사용하기에 적합한 멀티코어 IC (300) 아키텍텨의 단순화된 컴포넌트 블록도를 제공한다. 도 7 에 도시된 예에서의 멀티코어 IC (300) 들은, 하이 엔드 컴퓨팅 디바이스 (예를 들어, 데스크톱 컴퓨터) 에 적합할 수도 있는 바와 같이, 다수의 프로세서 코어들을 갖는 그래픽 프로세싱 유닛들 (GPUs) 이며, 그의 하나의 그룹은 셰이더 프로세서들 (SP) (700) 이고 그의 하나의 그룹은 텍스쳐 파이프들 (TP) (702) 이다. 셰이더 프로세서들 (700) 및 텍스쳐 파이프들 (702) 은 서로 병렬로 프로세스들을 실행하도록 배열될 수도 있다. 지능형 멀티코어 제어는 서로 병렬로 프로세스들을 실행하도록 배열된 프로세서 코어들의 임의의 세트에 대해 구현될 수도 있다. 프로세서 코어들은 모두 멀티코어 IC (300) 내에 있을 수도 있다. 일 양태에서, 지능형 멀티코어 제어는 유사한 멀티코어 IC (300) 들에 걸쳐 프로세서 코어들을 관리하기 위해 사용될 수도 있다. 예를 들어, 수개의 멀티미디어 멀티코어 IC (300) 들을 갖는 잠재적인 미래의 멀티코어 디바이스. 멀티미디어 멀티코어 IC (300) 들 각각은 그들이 멀티미디어 태스크들을 프로세싱하는 유사한 프로세싱 능력들을 가질 수도 있다. 멀티코어 디바이스는 주어진 작업부하를 실행하기 위해 2 개 이상의 멀티미디어 멀티코어 IC (300) 로부터 프로세서 코어들을 선택하기 위해 지능형 멀티코어 제어를 사용할 수도 있다. 다른 양태에서, 멀티코어 디바이스는 다른 유사한 멀티코어 IC (300) 에 대해 하나의 멀티코어 IC (300) 내의 프로세서 코어들의 그룹을 최적화하기 위해 지능형 멀티코어 제어를 사용할 수도 있다. 이전의 예에서 기술된 바와 같은, 수개의 멀티미디어 멀티코어 IC (300) 를 사용하는 예는 주어진 작업부하를 실행하기 위해 멀티미디어 멀티코어 IC (300) 들의 그룹 중 하나의 멀티미디어 멀티코어 IC (300) 로부터 프로세서 코어들을 선택하기 위해 지능형 멀티코어 제어를 사용하는 멀티코어 디바이스를 수반할 수도 있다.
도 7 은 또한 각각의 프로세스 코어, 셰이더 프로세서들 (700), 및 텍스쳐 파이프들 (702) 이 작업부하 분석기 (306) 및 멀티코어 관리기 (312) 에 연결될 수도 있는 것을 도시한다. 이러한 도시는 텍스쳐 파이프들 (702) 과 타이트하게 집적되는 셰이더 프로세서들 (700) 이 순수하게 셰이더 작업부하들의 분배를 달성하는 하드웨어 블록들에 의해 구동될 수도 있기 때문에 멀티코어 관리기 (312) 및 셰이더 프로세서들 (700), 및 텍스쳐 파이프들 (702) 사이의 관계의 단순화이다. 작업부하 분석기 (306) 는 멀티코어 관리기 (312) 에 연결될 수도 있는 성능/와트 최적화 엔진 (310) 에 연결될 수도 있는 실시간 멀티코어 전력 모델 (308) 에 연결될 수도 있다. 이와 같이, 도 7 에 도시된 컴포넌트들은 여기에 기술된 바와 같이 지능형 멀티코어 제어를 구현할 수도 있을 것이다.
여러 양태들은 모듈러 셰이더 프로세서들/텍스쳐 파이프 유닛들에서 구현될 수도 있다. 이러한 아키텍쳐는 셰이더 및 텍스쳐 프로세싱 능력들에서 변화할 수도 있는 GPU 변동들의 생성을 허용한다. 셰이더 프로세싱은 GPU 들에 의해 수행되는 그래픽 프로세싱에서의 많은 단계들 중 단지 하나의 단계이며, 따라서 셰이더 프로세서/텍스쳐 파이프 유닛들에 관한 위의 논의들은 완전한 작업 코어의 단지 일부만을 다룬다. 셰이더 프로세서/텍스쳐 파이프 유닛들은 순수하게 선행하는 하드웨어 블록들에 의해서만 구동될 수도 있고, 소프트웨어로부터 별도로 제어되지 않을 수도 있다. 그러나, 미래의 컴퓨팅 시스템 아키텍쳐들은 셰이더 프로세서/텍스쳐 파이프 유닛들이 소프트웨어로부터 제어되는 것을 허용할 수도 있다.
도 8 은 지능형 멀티코어 제어를 사용하는 일 양태의 멀티코어 디바이스 (800) 를 도시한다. 여러 실시형태들에서, 멀티코어 디바이스 (800) 는 터치스크린 제어기 (804) 및 내부 메모리 (806) 에 커플링된 프로세서 (802) 를 포함할 수도 있다. 프로세서 (802) 는 일반적인 또는 특정의 프로세싱 태스크들을 위해 설계된 하나 이상의 멀티코어 IC 들일 수도 있다. 내부 메모리 (806) 는 휘발성 또는 비휘발성 메모리일 수도 있고, 또한 보안 및/또는 암호화된 메모리, 또는 비보안 및/또는 암호화되지 않은 메모리, 또는 이들의 임의의 조합일 수도 있다. 터치스크린 제어기 (804) 및 프로세서 (802) 는 또한 저항-감지 터치스크린, 용량-감지 터치스크린, 적외선 감지 터치스크린 등과 같은 터치스크린 패널 (812) 에 커플링될 수도 있다. 멀티코어 디바이스 (800) 는 서로에 및/또는 프로세서 (802) 에 커플링되는, 전송 및 수신하는 하나 이상의 무선 신호 송수신기들 (808) (예를 들어, 피넛®, 블루투스®, 지그비®, Wi-Fi, RF 라디오) 및 안테나들 (810) 을 가질 수도 있다. 송수신기들 (808) 및 안테나들 (810) 은 여러 무선 송신 프로토콜 스택들 및 인터페이스들을 구현하기 위해 상술된 회로와 함께 사용될 수도 있다. 멀티코어 디바이스 (800) 는 셀룰러 네트워크를 통해 통신을 가능하게 하고 프로세서에 커플링되는 셀룰러 네트워크 무선 모뎀 칩 (816) 을 포함할 수도 있다. 멀티코어 디바이스 (800) 는 프로세서 (802) 에 커플링된 주변 디바이스 연결 인터페이스 (818) 을 포함할 수도 있다. 주변 디바이스 연결 인터페이스 (818) 는 하나의 타입의 연결을 수용하도록 단일하게 구성되거나, USB, 파이어와이어, 선더볼트, 또는 PCIe 와 같은 공통의 또는 사유의 여러 타입들의 물리적 및 통신 연결들을 수용하도록 복합적으로 구성될 수도 있다. 사유의 디바이스 연결 인터페이스 (818) 는 또한 유사하게 구성된 주변 디바이스 연결 포트 (도시하지 않음) 에 커플링될 수도 있다. 멀티코어 디바이스 (800) 는 또한 오디오 출력들을 제공하는 스피커들 (814) 을 포함할 수도 있다. 멀티코어 디바이스 (800) 는 또한 여기서 논의된 컴포넌트들의 전부 또는 일부를 포함하는 플라스틱, 금속, 또는 재료들의 조합으로 구성된 하우징 (820) 을 포함할 수도 있다. 멀티코어 디바이스 (800) 는 일회용 또는 충전가능한 배터리와 같은, 프로세서 (802) 에 커플링된 전원 (822) 을 포함할 수도 있다. 충전가능한 배터리는 또한 멀티코어 디바이스 (800) 외부의 소스로부터 충전 전류를 수신하기 위해 주변 디바이스 연결 포트에 커플링될 수도 있다.
상기한 방법 설명들 및 프로세스 흐름도들은 단지 설명적인 예들로서만 제공되고, 여러 양태들의 단계들이 제시된 순서로 수행되어야 한다는 것을 요구하거나 암시하는 것으로 의도되지 않는다. 본 기술에서 통상의 기술자에게 인정될 바와 같이, 상술된 양태들에서의 단계들의 순서는 임의의 순서로 수행될 수도 있다. "이후에", "그 후", "다음에" 등과 같은 단어들은 단계들의 순서를 제한하도록 의도되지 않는다; 이들 단어들은 단지 방법들의 설명을 통해 독자를 안내하기 위해 사용된다. 또한, 예를 들어 관사들 "a", "an" 또는 "the" 를 사용하여 단수로 청구항 엘리먼트들에 대한 임의의 참조는 그 엘리먼트를 단수로 제한하는 것으로 해석되지 않아야 한다.
본 출원에서 사용된 바와 같이, 용어들 "컴포넌트", "모듈", "시스템", "엔진", "생성기", "관리기" 등은 특정의 동작들 또는 기능들을 수행하도록 구성되는, 하드웨어, 펌웨어, 하드웨어 및 소프트웨어의 조합, 소프트웨어, 또는 실행중인 소프트웨어와 같은, 그러나 이들에 제한되지 않는 컴퓨터 관련 엔티티를 포함하도록 의도된다. 예를 들어, 컴포넌트는 프로세서상에서 실행중인 프로세스, 프로세서, 오브젝트, 실행가능물, 실행의 스레드, 프로그램, 및/또는 컴퓨터일 수도 있지만 이들에 제한되지 않는다. 예시로써, 컴퓨팅 디바이스 상에서 실행중인 애플리케이션 및 그 컴퓨팅 디바이스는 하나의 컴포넌트로서 지칭될 수도 있다. 하나 이상의 컴포넌트들이 프로세스 및/또는 실행의 스레드 내에 상주할 수도 있고, 하나의 컴포넌트가 하나의 프로세서 상에 국부화되거나 2 이상의 프로세서들 또는 코어들 사이에 분포될 수도 있다. 또한, 이들 컴포넌트들은 저장된 여러 명령들 및/또는 데이터 구조들을 갖는 여러 비일시적 컴퓨터 판독가능 매체들로부터 실행할 수도 있다. 컴포넌트들은 로컬 및/또는 원격 프로세스들, 기능 또는 절차 호출들, 전자 신호들, 데이터 패킷들, 메모리 판독/기입들, 및 다른 기지의 네트워크, 컴퓨터, 프로세서, 및/또는 프로세스 관련 통신 방법론들을 통해 통신할 수도 있다.
여기에 개시된 양태들과 관련하여 기술된 여러 예시적인 로직컬 블록들, 모듈들, 회로들 및 알고리즘 단계들은 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양자 모두의 조합들로서 구현될 수도 있다. 하드웨어 및 소프트웨어의 이러한 교환가능성을 명확히 도시하기 위해, 여러 도시된 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들은 일반적으로 그들의 기능성의 면에서 상술되었다. 그러한 기능성이 하드웨어로서 또는 소프트웨어로서 구현되는지 여부는 특정의 애플리케이션 및 전체 시스템에 부과된 설계 제약들에 달려 있다. 통상의 기술자들은 각각의 특정의 애플리케이션에 대해 다양한 방식들로 기술된 기능성을 구현할 수도 있지만, 그러한 구현 결정들은 본 개시의 범위로부터 일탈을 야기하는 것으로서 해석되지 않아야 한다.
여기에 개시된 양태들과 관련하여 기술된 여러 예시적인 로직들, 로지컬 블록들, 모듈들, 및 회로들을 구현하기 위해 사용되는 하드웨어는 범용 프로세서, 디지털 신호 프로세서 (DSP), 주문형 반도체 (ASIC), 필드 프로그래머블 게이트 어레이 (FPGA) 또는 다른 프로그래머블 로직 회로, 이산 게이트 또는 트랜지스터 로직, 이산 하드웨어 컴포넌트들, 또는 여기에 개시된 기능들을 수행하도록 설계된 이들의 임의의 조합으로 구현되거나 수행될 수도 있다. 범용 프로세서는 멀티프로세서일 수도 있지만, 대안적으로, 프로세서는 임의의 종래의 프로세서, 제어기, 마이크로제어기, 또는 상태 머신일 수도 있다. 프로세서는 또한 컴퓨팅 디바이스들의 조합, 예를 들어, DSP 와 멀티프로세서의 조합, 복수의 마이크로프로세서들, DSP 코어와 결합한 하나 이상의 마이크로프로세서들, 또는 임의의 다른 그러한 구성으로서 구현될 수도 있다. 대안적으로, 일부 단계들 및 방법들은 주어진 기능에 특정한 회로에 의해 수행될 수도 있다.
하나 이상의 예시적인 양태들에서, 설명된 기능들은 하드웨어, 소프트웨어, 펌웨어, 또는 그것들의 임의의 조합으로 구현될 수도 있다. 소프트웨어로 구현된다면, 그 기능들은 하나 이상의 명령들 또는 코드로서 비일시적 컴퓨터 판독가능 매체 또는 비일시적 프로세서 판독가능 매체상에 저장될 수도 있다. 여기에 개시된 방법 또는 알고리즘의 단계들은 비일시적 컴퓨터 판독가능 또는 프로세서 판독가능 저장 매체 상에 상주할 수도 있는 프로세서 실행가능 소프트웨어 모듈에서 구현될 수도 있다. 비일시적 컴퓨터 판독가능 또는 프로세서 판독가능 저장 매체들은 컴퓨터 또는 프로세서에 의해 액세스될 수도 있는 임의의 저장 매체들일 수도 있다. 비제한적인 예로, 이러한 비일시적 컴퓨터 판독가능 또는 프로세서 판독가능 매체들은 RAM, ROM, EEPROM, 플래시 메모리, CD-ROM 또는 다른 광 디스크 스토리지, 자기 디스크 스토리지 또는 다른 자기 저장 디바이스들, 또는 컴퓨터에 의해 액세스될 수도 있고, 소망의 프로그램 코드를 명령들 또는 데이터 구조들의 형태로 저장하는데 사용될 수도 있는 임의의 다른 매체를 포함할 수 있다. 디스크 (disk 및 disc) 는 본원에서 사용되는 바와 같이, 콤팩트 디스크 (compact disc, CD), 레이저 디스크, 광 디스크, 디지털 다용도 디스크 (DVD), 플로피 디스크 (floppy disk) 및 블루레이 디스크를 포함하는데, disk들은 보통 데이터를 자기적으로 재생하지만, disc들은 레이저들로써 광학적으로 데이터를 재생한다. 상기한 것들의 조합들은 또한 비일시적 컴퓨터 판독가능 및 프로세서 판독가능 매체들의 범위 내에 포함되어야 한다. 또한, 방법 또는 알고리즘의 동작들은 컴퓨터 프로그램 제품에 병합될 수도 있는 비일시적 컴퓨터 판독가능 및 프로세서 판독가능 매체 상에서 코드들 및/또는 명령들의 하나 또는 임의의 조합 또는 세트로서 상주할 수도 있다.
개시된 양태들에 대한 상기의 설명은 본 기술에서 통상의 기술자가 본 발명을 실시하거나 사용하는 것을 가능하게 하도록 제공된다. 이들 양태들에 대한 여러 변경들이 통상의 기술자들에게는 용이하게 분명할 것이며, 여기에 정의된 일반 원리들은 본 발명의 사상 또는 범위로부터 일탈하지 않고 다른 양태들에 적용될 수도 있다. 따라서, 본 발명은 여기에 도시된 양태들에 제한되는 것으로 의도되는 것이 아니라, 다음의 청구범위 및 여기에 개시된 원리들 및 신규한 특징들과 일관성 있는 가장 넓은 범위에 따라야 한다.

Claims (28)

  1. 멀티코어 집적회로의 복수의 프로세서 코어들의 멀티코어 제어를 위한 방법으로서,
    상기 복수의 프로세서 코어들의 온도 판독값들을 온도 임계값과 비교하는 단계;
    프로세서 코어 정보 및 복수의 가설적 케이스들에 기초하여 상기 복수의 프로세서 코어들에 대한 맵을 계산하는 단계;
    상기 온도 판독값들이 상기 온도 임계값보다 작은 경우 주어진 작업부하에 대해 전력 소비를 최적화하는 프로세서 코어들의 제 1 구성을 식별하는 단계;
    상기 온도 판독값들이 상기 온도 임계값보다 큰 경우 주어진 전력 예산에 대해 성능을 최적화하는 프로세서 코어들의 제 2 구성을 식별하는 단계; 및
    식별된 구성에 기초하여 상기 복수의 프로세서 코어들의 각각의 프로세서 코어에 대한 활동 상태를 제어하는 단계를 포함하는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 방법.
  2. 제 1 항에 있어서,
    상기 프로세서 코어 정보 및 복수의 가설적 케이스들에 기초하여 상기 복수의 프로세서 코어들에 대한 맵을 계산하는 단계는:
    상기 온도 판독값들이 상기 온도 임계값보다 작은 경우 상기 주어진 작업부하의 주어진 대표값에 대해 상기 복수의 프로세서 코어들의 조합들에 대한 전력 소비와 온도 사이의 관계들을 나타내는 전력 맵을 계산하는 단계; 및
    상기 온도 판독값들이 상기 온도 임계값보다 큰 경우 주어진 온도에 대해 상기 복수의 프로세서 코어들의 조합들에 대한 전력 소비와 작업부하 사이의 관계들을 나타내는 성능 맵을 계산하는 단계를 포함하는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 방법.
  3. 제 1 항에 있어서,
    프로세서 코어들의 상기 제 1 및 제 2 구성들은 활성 프로세서 코어들의 수를 나타내는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 방법.
  4. 제 1 항에 있어서,
    프로세서 코어들의 상기 제 1 및 제 2 구성들은 상기 복수의 프로세서 코어들 중 어느 프로세서 코어들이 활성 프로세서 코어들인지를 나타내는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 방법.
  5. 제 1 항에 있어서,
    프로세서 코어들의 상기 제 1 및 제 2 구성들은 주어진 주파수에 대한 가장 낮은 누설, 가장 낮은 온도, 또는 가장 낮은 전압 레벨을 갖는 상기 프로세서 코어들을 포함하는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 방법.
  6. 제 1 항에 있어서,
    각각의 프로세서 코어와 연관된 상기 프로세서 코어 정보를 판독하는 단계로서, 상기 프로세서 코어 정보는 누설 전류, 프로세서 코어 속도, 프로세서 전압 설정 테이블, 최대 클록 주파수, 온도 판독값, 및 현재의 작업부하를 포함하는, 상기 프로세서 코어 정보를 판독하는 단계; 및
    상기 현재의 작업부하를 상기 현재의 작업부하의 대표값으로 변환하는 단계를 더 포함하는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 방법.
  7. 제 6 항에 있어서,
    상기 프로세서 코어 정보는 상기 온도 판독값 및 상기 현재의 작업부하를 포함하는 동적 정보를 포함하고,
    상기 방법은 상기 동적 정보를 반복적으로 판독하는 단계를 더 포함하는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 방법.
  8. 제 1 항에 있어서,
    상기 멀티코어 집적회로의 상기 프로세서 코어들은 중앙 프로세싱 유닛, 그래픽 프로세싱 유닛의 셰이더 프로세서, 상기 그래픽 프로세싱 유닛의 텍스쳐 파이프, 또는 디지털 신호 프로세서를 포함하는 그룹으로부터 선택된 하나 이상의 프로세서 코어 타입들을 포함하는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 방법.
  9. 장치로서,
    복수의 프로세서 코어들을 갖는 멀티코어 집적회로를 포함하고,
    상기 멀티코어 집적회로는 동작들을 수행하기 위한 프로세서 실행가능 명령들로 구성되며,
    상기 동작들은,
    상기 복수의 프로세서 코어들의 온도 판독값들을 온도 임계값과 비교하는 것;
    프로세서 코어 정보 및 복수의 가설적 케이스들에 기초하여 상기 복수의 프로세서 코어들에 대한 맵을 계산하는 것;
    상기 온도 판독값들이 상기 온도 임계값보다 작은 경우 주어진 작업부하에 대해 전력 소비를 최적화하는 프로세서 코어들의 제 1 구성을 식별하는 것,
    상기 온도 판독값들이 상기 온도 임계값보다 큰 경우 주어진 전력 예산에 대해 성능을 최적화하는 프로세서 코어들의 제 2 구성을 식별하는 것; 및
    식별된 구성에 기초하여 상기 복수의 프로세서 코어들의 각각의 프로세서 코어에 대한 활동 상태를 제어하는 것을 포함하는, 장치.
  10. 제 9 항에 있어서,
    상기 멀티코어 집적회로는,
    상기 프로세서 코어 정보 및 복수의 가설적 케이스들에 기초하여 상기 복수의 프로세서 코어들에 대한 맵을 계산하는 것이:
    상기 온도 판독값들이 상기 온도 임계값보다 작은 경우 상기 주어진 작업부하의 주어진 대표값에 대해 상기 복수의 프로세서 코어들의 조합들에 대한 전력 소비와 온도 사이의 관계들을 나타내는 전력 맵을 계산하는 것; 및
    상기 온도 판독값들이 상기 온도 임계값보다 큰 경우 주어진 온도에 대해 상기 복수의 프로세서 코어들의 조합들에 대한 전력 소비와 작업부하 사이의 관계들을 나타내는 성능 맵을 계산하는 것
    을 포함하도록 하는 동작들을 수행하기 위한 프로세서 실행가능 명령들로 구성되는, 장치.
  11. 제 9 항에 있어서,
    프로세서 코어들의 상기 제 1 및 제 2 구성들은 활성 프로세서 코어들의 수를 나타내는, 장치.
  12. 제 9 항에 있어서,
    프로세서 코어들의 상기 제 1 및 제 2 구성들은 상기 복수의 프로세서 코어들 중 어느 프로세서 코어들이 활성 프로세서 코어들인지를 나타내는, 장치.
  13. 제 9 항에 있어서,
    프로세서 코어들의 상기 제 1 및 제 2 구성들은 주어진 주파수에 대한 가장 낮은 누설, 가장 낮은 온도, 또는 가장 낮은 전압 레벨을 갖는 상기 프로세서 코어들을 포함하는, 장치.
  14. 제 9 항에 있어서,
    상기 멀티코어 집적회로는,
    각각의 프로세서 코어와 연관된 상기 프로세서 코어 정보를 판독하는 것으로서, 상기 프로세서 코어 정보는 누설 전류, 프로세서 코어 속도, 프로세서 전압 설정 테이블, 최대 클록 주파수, 온도 판독값, 및 현재의 작업부하를 포함하는, 상기 프로세서 코어 정보를 판독하는 것; 및
    상기 현재의 작업부하를 상기 현재의 작업부하의 대표값으로 변환하는 것
    을 더 포함하는 동작들을 수행하기 위한 프로세서 실행가능 명령들로 구성되는, 장치.
  15. 제 14 항에 있어서,
    상기 프로세서 코어 정보는 상기 온도 판독값 및 상기 현재의 작업부하를 포함하는 동적 정보를 포함하고,
    상기 멀티코어 집적회로는 상기 동적 정보를 반복적으로 판독하는 것을 더 포함하는 동작들을 수행하기 위한 프로세서 실행가능 명령들로 구성되는, 장치.
  16. 제 9 항에 있어서,
    상기 멀티코어 집적회로의 상기 프로세서 코어들은 중앙 프로세싱 유닛, 그래픽 프로세싱 유닛의 셰이더 프로세서, 상기 그래픽 프로세싱 유닛의 텍스쳐 파이프, 또는 디지털 신호 프로세서를 포함하는 그룹으로부터 선택된 하나 이상의 프로세서 코어 타입들을 포함하는, 장치.
  17. 멀티코어 집적회로의 복수의 프로세서 코어들의 멀티코어 제어를 위한 장치로서,
    상기 복수의 프로세서 코어들의 온도 판독값들을 온도 임계값과 비교하는 수단;
    프로세서 코어 정보 및 복수의 가설적 케이스들에 기초하여 상기 복수의 프로세서 코어들에 대한 맵을 계산하는 수단;
    상기 온도 판독값들이 상기 온도 임계값보다 작은 경우 주어진 작업부하에 대해 전력 소비를 최적화하는 프로세서 코어들의 제 1 구성을 식별하는 수단;
    상기 온도 판독값들이 상기 온도 임계값보다 큰 경우 주어진 전력 예산에 대해 성능을 최적화하는 프로세서 코어들의 제 2 구성을 식별하는 수단; 및
    식별된 구성에 기초하여 상기 복수의 프로세서 코어들의 각각의 프로세서 코어에 대한 활동 상태를 제어하는 수단을 포함하는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 장치.
  18. 제 17 항에 있어서,
    상기 프로세서 코어 정보 및 복수의 가설적 케이스들에 기초하여 상기 복수의 프로세서 코어들에 대한 맵을 계산하는 수단은:
    상기 온도 판독값들이 상기 온도 임계값보다 작은 경우 상기 주어진 작업부하의 주어진 대표값에 대해 상기 복수의 프로세서 코어들의 조합들에 대한 전력 소비와 온도 사이의 관계들을 나타내는 전력 맵을 계산하는 수단; 및
    상기 온도 판독값들이 상기 온도 임계값보다 큰 경우 주어진 온도에 대해 상기 복수의 프로세서 코어들의 조합들에 대한 전력 소비와 작업부하 사이의 관계들을 나타내는 성능 맵을 계산하는 수단을 포함하는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 장치.
  19. 제 17 항에 있어서,
    프로세서 코어들의 상기 제 1 및 제 2 구성들은 활성 프로세서 코어들의 수를 나타내는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 장치.
  20. 제 17 항에 있어서,
    프로세서 코어들의 상기 제 1 및 제 2 구성들은 상기 복수의 프로세서 코어들 중 어느 프로세서 코어들이 활성 프로세서 코어들인지를 나타내는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 장치.
  21. 제 17 항에 있어서,
    프로세서 코어들의 상기 제 1 및 제 2 구성들은 주어진 주파수에 대한 가장 낮은 누설, 가장 낮은 온도, 또는 가장 낮은 전압 레벨을 갖는 상기 프로세서 코어들을 포함하는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 장치.
  22. 제 17 항에 있어서,
    각각의 프로세서 코어와 연관된 상기 프로세서 코어 정보를 판독하는 수단으로서, 상기 프로세서 코어 정보는 누설 전류, 프로세서 코어 속도, 프로세서 전압 설정 테이블, 최대 클록 주파수, 온도 판독값, 및 현재의 작업부하를 포함하는, 상기 프로세서 코어 정보를 판독하는 수단; 및
    상기 현재의 작업부하를 상기 현재의 작업부하의 대표값으로 변환하는 수단을 더 포함하는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 장치.
  23. 제 22 항에 있어서,
    상기 프로세서 코어 정보는 상기 온도 판독값 및 상기 현재의 작업부하를 포함하는 동적 정보를 포함하고,
    상기 장치는 상기 동적 정보를 반복적으로 판독하는 수단을 더 포함하는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 장치.
  24. 제 17 항에 있어서,
    상기 멀티코어 집적회로의 상기 프로세서 코어들은 중앙 프로세싱 유닛, 그래픽 프로세싱 유닛의 셰이더 프로세서, 상기 그래픽 프로세싱 유닛의 텍스쳐 파이프, 또는 디지털 신호 프로세서를 포함하는 그룹으로부터 선택된 하나 이상의 프로세서 코어 타입들을 포함하는, 복수의 프로세서 코어들의 멀티코어 제어를 위한 장치.
  25. 멀티코어 집적회로로 하여금 동작들을 수행하게 하도록 구성된 프로세서 실행가능 소프트웨어 명령들을 저장한 비일시적 프로세서 판독가능 매체로서,
    상기 동작들은,
    상기 복수의 프로세서 코어들의 온도 판독값들을 온도 임계값과 비교하는 것;
    프로세서 코어 정보 및 복수의 가설적 케이스들에 기초하여 상기 복수의 프로세서 코어들에 대한 맵을 계산하는 것;
    상기 온도 판독값들이 상기 온도 임계값보다 작은 경우 주어진 작업부하에 대해 전력 소비를 최적화하는 프로세서 코어들의 제 1 구성을 식별하는 것,
    상기 온도 판독값들이 상기 온도 임계값보다 큰 경우 주어진 전력 예산에 대해 성능을 최적화하는 프로세서 코어들의 제 2 구성을 식별하는 것; 및
    식별된 구성에 기초하여 상기 복수의 프로세서 코어들의 각각의 프로세서 코어에 대한 활동 상태를 제어하는 것을 포함하는, 비일시적 프로세서 판독가능 매체.
  26. 제 25 항에 있어서,
    상기 저장된 프로세서 실행가능 소프트웨어 명령들은, 상기 멀티코어 집적회로로 하여금,
    상기 프로세서 코어 정보 및 복수의 가설적 케이스들에 기초하여 상기 복수의 프로세서 코어들에 대한 맵을 계산하는 것이:
    상기 온도 판독값들이 상기 온도 임계값보다 작은 경우 상기 주어진 작업부하의 주어진 대표값에 대해 상기 복수의 프로세서 코어들의 조합들에 대한 전력 소비와 온도 사이의 관계들을 나타내는 전력 맵을 계산하는 것; 및
    상기 온도 판독값들이 상기 온도 임계값보다 큰 경우 주어진 온도에 대해 상기 복수의 프로세서 코어들의 조합들에 대한 전력 소비와 작업부하 사이의 관계들을 나타내는 성능 맵을 계산하는 것
    을 포함하도록 하는 동작들을 수행하게 하도록 구성되는, 비일시적 프로세서 판독가능 매체.
  27. 제 25 항에 있어서,
    상기 저장된 프로세서 실행가능 소프트웨어 명령들은, 상기 멀티코어 집적회로로 하여금,
    각각의 프로세서 코어와 연관된 상기 프로세서 코어 정보를 판독하는 것으로서, 상기 프로세서 코어 정보는 누설 전류, 프로세서 코어 속도, 프로세서 전압 설정 테이블, 최대 클록 주파수, 온도 판독값, 및 현재의 작업부하를 포함하는, 상기 프로세서 코어 정보를 판독하는 것; 및
    상기 현재의 작업부하를 상기 현재의 작업부하의 대표값으로 변환하는 것
    을 더 포함하는 동작들을 수행하게 하도록 구성되는, 비일시적 프로세서 판독가능 매체.
  28. 제 27 항에 있어서,
    상기 프로세서 코어 정보는 상기 온도 판독값 및 상기 현재의 작업부하를 포함하는 동적 정보를 포함하고,
    상기 저장된 프로세서 실행가능 소프트웨어 명령들은 상기 멀티코어 집적회로로 하여금 상기 동적 정보를 반복적으로 판독하는 것을 더 포함하는 동작들을 수행하게 하도록 구성되는, 비일시적 프로세서 판독가능 매체.
KR1020167005945A 2013-08-08 2014-08-07 와트당 최적 성능을 위한 지능형 멀티코어 제어 KR101700567B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361863554P 2013-08-08 2013-08-08
US61/863,554 2013-08-08
US14/074,908 2013-11-08
US14/074,908 US9292293B2 (en) 2013-08-08 2013-11-08 Intelligent multicore control for optimal performance per watt
PCT/US2014/050230 WO2015021329A1 (en) 2013-08-08 2014-08-07 Intelligent multicore control for optimal performance per watt

Publications (2)

Publication Number Publication Date
KR20160042003A true KR20160042003A (ko) 2016-04-18
KR101700567B1 KR101700567B1 (ko) 2017-02-13

Family

ID=52449650

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167005945A KR101700567B1 (ko) 2013-08-08 2014-08-07 와트당 최적 성능을 위한 지능형 멀티코어 제어

Country Status (6)

Country Link
US (1) US9292293B2 (ko)
EP (1) EP3030946B1 (ko)
JP (1) JP6005895B1 (ko)
KR (1) KR101700567B1 (ko)
CN (1) CN105492993B (ko)
WO (1) WO2015021329A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190068156A (ko) * 2017-12-08 2019-06-18 한국전자통신연구원 그래픽 처리 장치 및 이의 동작 방법

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10088891B2 (en) * 2013-09-23 2018-10-02 Cornell University Multi-core computer processor based on a dynamic core-level power management for enhanced overall power efficiency
US9582012B2 (en) * 2014-04-08 2017-02-28 Qualcomm Incorporated Energy efficiency aware thermal management in a multi-processor system on a chip
US20160041603A1 (en) * 2014-07-16 2016-02-11 New Concepts Development Corp. Power Management Apparatus, Systems, and Methods for Increased Power Loads
US10606642B1 (en) * 2014-09-16 2020-03-31 Amazon Technologies, Inc. Dynamic power budgets
US10606335B2 (en) * 2014-12-12 2020-03-31 Via Alliance Semiconductor Co., Ltd. System and method for dynamically adjusting voltage frequency
US10234930B2 (en) * 2015-02-13 2019-03-19 Intel Corporation Performing power management in a multicore processor
US9910481B2 (en) * 2015-02-13 2018-03-06 Intel Corporation Performing power management in a multicore processor
CN106325325A (zh) * 2015-06-15 2017-01-11 联想(北京)有限公司 电子设备及控制方法
CN110456900B (zh) * 2015-09-28 2021-06-29 华为终端有限公司 一种接口电路、显示驱动器、终端设备和显示控制方法
US9983966B2 (en) * 2015-11-30 2018-05-29 Oracle International Corporation Detecting degraded core performance in multicore processors
US10146286B2 (en) * 2016-01-14 2018-12-04 Intel Corporation Dynamically updating a power management policy of a processor
US10073718B2 (en) 2016-01-15 2018-09-11 Intel Corporation Systems, methods and devices for determining work placement on processor cores
US10346239B1 (en) * 2016-06-27 2019-07-09 Amazon Technologies, Inc. Predictive failure of hardware components
CN106155815A (zh) * 2016-07-21 2016-11-23 张升泽 电流在多个内核中的分配方法及系统
CN106294063A (zh) * 2016-07-26 2017-01-04 张升泽 基于芯片的温度控制方法及系统
CN106227604A (zh) * 2016-07-27 2016-12-14 李媛媛 芯片中温度降低方法及系统
CN106292995A (zh) * 2016-07-27 2017-01-04 李媛媛 电流限制在多核芯片中的应用方法及系统
WO2018018448A1 (zh) * 2016-07-27 2018-02-01 李媛媛 芯片中温度降低方法及系统
CN106293914B (zh) * 2016-08-01 2019-08-09 深圳市金立通信设备有限公司 一种任务调度的方法及终端
US9753773B1 (en) 2016-10-19 2017-09-05 International Business Machines Corporation Performance-based multi-mode task dispatching in a multi-processor core system for extreme temperature avoidance
US9747139B1 (en) * 2016-10-19 2017-08-29 International Business Machines Corporation Performance-based multi-mode task dispatching in a multi-processor core system for high temperature avoidance
JP2018106591A (ja) * 2016-12-28 2018-07-05 ルネサスエレクトロニクス株式会社 半導体装置、動作制御方法、及びプログラム
CN107193229B (zh) * 2017-04-06 2021-02-19 联想(北京)有限公司 一种控制方法及电子设备
US11054883B2 (en) * 2017-06-19 2021-07-06 Advanced Micro Devices, Inc. Power efficiency optimization in throughput-based workloads
JP6872440B2 (ja) * 2017-06-30 2021-05-19 ルネサスエレクトロニクス株式会社 半導体装置および半導体装置の制御方法
US10732698B2 (en) * 2017-11-15 2020-08-04 Nxp B.V. Event-based power manager
CN108037820A (zh) * 2018-01-02 2018-05-15 山东超越数控电子股份有限公司 一种动态控制频率的国产处理器及方法
US11216276B2 (en) * 2018-12-27 2022-01-04 Intel Corporation Controlling power state demotion in a processor
EP3908903A4 (en) * 2019-01-08 2022-08-17 Hewlett-Packard Development Company, L.P. PERFORMANCE STABILIZATION OF TREATMENT DEVICES
CN109947620A (zh) * 2019-03-11 2019-06-28 上海肇观电子科技有限公司 一种多核处理器的运行方法、装置及计算机可读存储介质
KR20200112439A (ko) * 2019-03-22 2020-10-05 삼성전자주식회사 멀티 코어를 포함하는 전자 장치 및 이의 패킷 처리를 위한 방법
US11073888B2 (en) * 2019-05-31 2021-07-27 Advanced Micro Devices, Inc. Platform power manager for rack level power and thermal constraints
KR102042494B1 (ko) 2019-05-31 2019-11-08 아주대학교산학협력단 멀티 코어 마이크로 프로세서의 열주기 안정성 향상 장치 및 방법
WO2021015721A1 (en) * 2019-07-19 2021-01-28 Hewlett-Packard Development Company, L.P. Processor thermal metric
CN112181124B (zh) * 2020-09-11 2023-09-01 华为技术有限公司 功耗管理的方法和相关设备
US11630694B2 (en) * 2021-01-13 2023-04-18 Qualcomm Incorporated Core voltage regulator energy-aware task scheduling
WO2023106636A1 (ko) * 2021-12-09 2023-06-15 삼성전자 주식회사 전자 장치 및 전자 장치에서 백그라운드 프로세스 제어 기반의 발열 제어 방법
DE102022207617B3 (de) 2022-07-26 2024-01-25 Volkswagen Aktiengesellschaft Verfahren und Überwachungseinrichtung zur Steuerung wenigstens einer Fahrzeugfunktion eines Fahrzeugs
CN115529298B (zh) * 2022-11-30 2023-10-13 湖南快乐阳光互动娱乐传媒有限公司 一种密集视音频传输系统、方法和装置
CN116301282B (zh) * 2023-05-16 2023-08-01 中诚华隆计算机技术有限公司 一种多核处理器芯片的低功耗控制方法和装置
CN117193502B (zh) * 2023-11-06 2024-03-26 惠州市鑫晖源科技有限公司 基于机器学习的电竞主机电源状态分析方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060134185A (ko) * 2004-03-29 2006-12-27 가부시키가이샤 소니 컴퓨터 엔터테인먼트 프로세싱 태스크 스케줄링을 이용하는 열 관리를 달성하기위한 방법들 및 장치
US20090309243A1 (en) * 2008-06-11 2009-12-17 Nvidia Corporation Multi-core integrated circuits having asymmetric performance between cores
US20130132972A1 (en) * 2011-11-21 2013-05-23 Qualcomm Incorporated Thermally driven workload scheduling in a heterogeneous multi-processor system on a chip
US20130155081A1 (en) * 2011-12-15 2013-06-20 Ati Technologies Ulc Power management in multiple processor system

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09138716A (ja) * 1995-11-14 1997-05-27 Toshiba Corp 電子計算機
US6804632B2 (en) 2001-12-06 2004-10-12 Intel Corporation Distribution of processing activity across processing hardware based on power consumption considerations
JP2004280378A (ja) * 2003-03-14 2004-10-07 Handotai Rikougaku Kenkyu Center:Kk 半導体装置
JP2005085164A (ja) * 2003-09-10 2005-03-31 Sharp Corp マルチプロセッサシステムの制御方法およびマルチプロセッサシステム
US9015501B2 (en) * 2006-07-13 2015-04-21 International Business Machines Corporation Structure for asymmetrical performance multi-processors
US8180997B2 (en) * 2007-07-05 2012-05-15 Board Of Regents, University Of Texas System Dynamically composing processor cores to form logical processors
US8775830B2 (en) * 2009-12-16 2014-07-08 Qualcomm Incorporated System and method for dynamically controlling a plurality of cores in a multicore central processing unit based on temperature
US8495395B2 (en) * 2010-09-14 2013-07-23 Advanced Micro Devices Mechanism for controlling power consumption in a processing node
US8910177B2 (en) * 2011-04-14 2014-12-09 Advanced Micro Devices, Inc. Dynamic mapping of logical cores
US8601300B2 (en) * 2011-09-21 2013-12-03 Qualcomm Incorporated System and method for managing thermal energy generation in a heterogeneous multi-core processor
US9372524B2 (en) 2011-12-15 2016-06-21 Intel Corporation Dynamically modifying a power/performance tradeoff based on processor utilization
US9436254B2 (en) * 2012-03-13 2016-09-06 Intel Corporation Method and apparatus for per core performance states

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060134185A (ko) * 2004-03-29 2006-12-27 가부시키가이샤 소니 컴퓨터 엔터테인먼트 프로세싱 태스크 스케줄링을 이용하는 열 관리를 달성하기위한 방법들 및 장치
US20090309243A1 (en) * 2008-06-11 2009-12-17 Nvidia Corporation Multi-core integrated circuits having asymmetric performance between cores
US20130132972A1 (en) * 2011-11-21 2013-05-23 Qualcomm Incorporated Thermally driven workload scheduling in a heterogeneous multi-processor system on a chip
US20130155081A1 (en) * 2011-12-15 2013-06-20 Ati Technologies Ulc Power management in multiple processor system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190068156A (ko) * 2017-12-08 2019-06-18 한국전자통신연구원 그래픽 처리 장치 및 이의 동작 방법

Also Published As

Publication number Publication date
US20150046685A1 (en) 2015-02-12
CN105492993A (zh) 2016-04-13
US9292293B2 (en) 2016-03-22
EP3030946B1 (en) 2019-09-18
KR101700567B1 (ko) 2017-02-13
CN105492993B (zh) 2017-05-17
JP2016534441A (ja) 2016-11-04
JP6005895B1 (ja) 2016-10-12
WO2015021329A1 (en) 2015-02-12
EP3030946A1 (en) 2016-06-15

Similar Documents

Publication Publication Date Title
KR101700567B1 (ko) 와트당 최적 성능을 위한 지능형 멀티코어 제어
TWI592802B (zh) 熱調適服務品質等級
JP6412162B2 (ja) グラフィックスフレーム処理において電力消費を低減させるためのcpu/gpu dcvs相互最適化
US10649518B2 (en) Adaptive power control loop
US9552046B2 (en) Performance management methods for electronic devices with multiple central processing units
CN107851042B (zh) 使用命令流提示来表征gpu工作负载和电力管理
TWI547811B (zh) 選擇性圖形處理單元(gpu)節流
US8397087B1 (en) Systems and methods for individually managing the power usage of software applications
CN110637271B (zh) 用于对便携式计算设备中的沉浸式多媒体工作负载的智能调整的系统和方法
US10372494B2 (en) Thread importance based processor core partitioning
TW201602908A (zh) 使用選擇性任務調變之熱減輕
US10503238B2 (en) Thread importance based processor core parking and frequency selection
TWI630610B (zh) 用於動態地調整記憶體狀態轉換計時器之系統及方法
US10064141B2 (en) Core frequency/count decision-based thermal mitigation optimization for a multi-core integrated circuit
KR101993916B1 (ko) 프로세서 코어 동작들 조절
Broyde et al. MobiCore: An adaptive hybrid approach for power-efficient CPU management on Android devices
CN107193362B (zh) 一种增强云计算环境节能装置
US11934248B2 (en) Performance and power tuning user interface
US20170357509A1 (en) Power management of instruction processors in a system-on-a-chip
CN107154979B (zh) 一种增强云计算环境节能方法
CN109478087A (zh) 用于为共享功率供给的系统维持节点功率预算的方法和装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant