KR102210355B1 - 적응적 전력 제어 루프 - Google Patents

적응적 전력 제어 루프 Download PDF

Info

Publication number
KR102210355B1
KR102210355B1 KR1020197020619A KR20197020619A KR102210355B1 KR 102210355 B1 KR102210355 B1 KR 102210355B1 KR 1020197020619 A KR1020197020619 A KR 1020197020619A KR 20197020619 A KR20197020619 A KR 20197020619A KR 102210355 B1 KR102210355 B1 KR 102210355B1
Authority
KR
South Korea
Prior art keywords
gpu
performance
power
power level
adjusting
Prior art date
Application number
KR1020197020619A
Other languages
English (en)
Other versions
KR20190109408A (ko
Inventor
권순규
준 후앙
샤흐리아 페제스기
알렉산더 사비노 두에나스
Original Assignee
에이티아이 테크놀로지스 유엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에이티아이 테크놀로지스 유엘씨 filed Critical 에이티아이 테크놀로지스 유엘씨
Publication of KR20190109408A publication Critical patent/KR20190109408A/ko
Application granted granted Critical
Publication of KR102210355B1 publication Critical patent/KR102210355B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/324Power saving characterised by the action undertaken by lowering clock frequency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3215Monitoring of peripheral devices
    • G06F1/3218Monitoring of peripheral devices of display devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/325Power saving in peripheral device
    • G06F1/3265Power saving in display device
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Power Sources (AREA)
  • Image Generation (AREA)
  • Image Processing (AREA)

Abstract

GPU는 별개의 클록 및 전압 레벨을 갖는 미리 정의된 전력 레벨간에 스위칭함으로써 동적 전력 레벨 관리를 수행한다. 동적 전력 레벨 관리는 연속적인 측정 사이클의 수 동안 프로세싱 워크로드와 관련된 제 1 성능 메트릭을 식별하는 단계를 포함한다. 일부 실시예에서, 연속적인 측정 사이클의 수는 현재 측정 사이클 및 적어도 하나의 이전 측정 사이클을 포함한다. 연속적인 측정 사이클의 수가 최소 히스테리시스 수를 초과한다는 결정에 기초하여, 추정된 최적화가 미래 측정 사이클 동안 GPU에 인가되도록 결정된다. 미래의 측정 사이클을 위한 GPU에서의 전력 레벨 설정은 추정된 최적화에 기초하여 조정된다. 예를 들어 상이한 프로세싱 워크로드 및 하드웨어 구성을 포함한 성능 메트릭을 고려하여, GPU는 현재 프로세싱 중인 특정 워크로드에 그것의 전력 설정을 동적으로 적응시킬 수 있다.

Description

적응적 전력 제어 루프
본 발명은 전반적으로 전력 관리에 관한 것으로, 보다 상세하게는 그래픽스 프로세싱 유닛 (GPU)에서의 전력 관리에 관한 것이다.
프로세서는 전력 소모를 최적화 하는 것이 바람직한 환경에서 점점 더 많이 사용되고 있다. 예를 들어, 프로세서는 컴퓨팅 인에이블 스마트 폰, 랩탑 컴퓨터, 휴대용 게임 디바이스들 등의 중요한 컴포넌트이고, 여기서, 전력 소모의 최소화는 배터리 수명을 연장하기 위해서 바람직하다. 또한 프로세서가 그래픽스 프로세싱 디바이스 (GPU)를 통합하여 프로세서의 그래픽 기능을 향상시키는 것이 일반적이다. GPU는 전자 디바이스가 비교적 빠른 속도로 복잡한 그래픽스를 디스플레이할 수 있게 하여 사용자 경험을 향상시킨다. 그러나, GPU는 프로세서의 전력 소모를 증가시킬 수도 있다.
본 개시는 첨부된 도면을 참조하여 당업자에게 보다 잘 이해될 수 있고, 많은 특징 및 이점이 명백해질 수 있다. 상이한 도면에서 동일한 참조 기호를 사용하는 것은 유사하거나 동일한 아이템을 나타낸다.
도 1의 일부 실시예에 따른 적응적 전력 제어를 이용하는 프로세싱 시스템의 블록도이다.
도 2는 일부 실시예에 따른 도 1의 프로세싱 시스템에서 동적 전력 레벨 관리를 수행하기 위한 전력 제어 루프를 예시하는 블록도이다.
도 3은 일부 실시예들에 따른 도 1의 전력 제어 루프에 의해 사용되는 다양한 전력 레벨 조정 인자들을 예시하는 다이어그램이다.
도 4는 일부 실시예에 따른 적응적 전력 제어를 수행하는 방법의 흐름도이다.
도면들 1 내지 4는 GPU가 현재 프로세싱하고 있는 특정 워크로드(workload)에 따라 클록 및 전압 레벨을 변화시키는 전력 관리 설정의 조정을 가능하게 함으로써 프로세싱 시스템의 GPU에서 동적 전력 레벨 관리를 위한 기술을 예시한다. 각각의 측정 사이클에서, GPU 드라이버는 다음 사이클에 사용될 전력 레벨 설정(클록 주파수 또는 동작 전압과 같은 GPU의 동작을 규정하는 동작 파라미터)를 계산하기 위해 측정된 하드웨어 성능 메트릭 (예를 들어, 평균 사용률, 온도 및 이전 사이클에 축적된 전력) 및 현재 컴퓨팅 환경을 나타내는 데이터 (예를 들어, 시스템에 의해 요청된 워크로드의 유형, 초 당 프레임 (FPS)과 같은 성능 측정량, 스루풋, 또는 단위 시간당 제출량) 둘 모두로부터 입력을 취한다. 일부 실시예에서, 계산된 설정들은 클록이 주파수 (업/다운 히스테리시스)를 변화시킬 수 있는 레이트(rate), 클록 주파수를 변경하기 위한 활동 임계치 등을 포함할 수 있다.
일부 실시예에서, 동적 전력 레벨 관리는 연속적인 측정 사이클의 수 동안 프로세싱 시스템에서 워크로드를 프로세싱하는 것과 관련된 제 1 성능 메트릭을 식별하는 것을 포함한다. 연속적인 측정 사이클의 수는 현재의 측정 사이클 및 적어도 하나의 이전 측정 사이클을 포함한다. 연속적인 측정 사이클의 수가 최소 히스테리시스 수를 초과한다는 결정에 기초하여, 미래의 측정 사이클을 위해 GPU에 추정된 최적화가 인가되도록 결정된다. 미래의 측정 사이클 위한 GPU에서의 전력 레벨 설정은 추정 최적화를 기반으로 조정된다. 예를 들어, 상이한 프로세싱 워크로드 및 하드웨어 구성을 포함한 성능 메트릭을 고려하여, GPU는 현재 프로세싱중인 특정 워크로드에 그것의 전력 설정을 동적으로 적응할 수 있다.
본 출원에 개시된 기술과는 대조적으로, 통상의 프로세서는 미리 정의된 메트릭 및 임계치를 사용하는 정적 설정을 기반으로 하여 GPU의 전력 설정을 변경할 수 있다. 그러나, 이러한 종래 기술은 상이한 동작 환경 (예를 들어, 운영 체제, 주위 온도, 상이한 애플리케이션에 대한 상이한 워크로드 및/또는 런타임 동안에 조우된 사용 사례, 상이한 하드웨어 구성 등)을 설명하지 않는다. 본 출원에 개시된 기술은 런타임 하드웨어 성능 및 특정 프로세싱 워크로드의 식별과 같은 입력을 포함하는 메트릭의 고려를 가능하게 함으로써, GPU가 전력 레벨 설정을 조정하여 절전 및 성능 향상을 더 양호하게 최적화하는 것을 허용한다.
본 출원에서 사용된 용어 "프로세싱 워크로드(processing workload)"는 주어진 시간 간격 동안 GPU에 의해 수행된 작업의 양 및 유형을 지칭하고, GPU가 주어진 시간량 동안에 더 많은 작업을 수행할 때, 프로세싱 워크로드는 증가한다. 일부 실시예에서, 프로세싱 워크로드는 현재의 프로세싱 워크로드 및 예상되는 미래의 프로세싱 워크로드 중 적어도 2 개의 컴포넌트를 포함한다. 현재 프로세싱 워크로드는 현재 프로세싱 워크로드를 측정될 때 GPU가 현재 경험하는 프로세싱 워크로드 또는 GPU가 비교적 최근 과거에 경험한 프로세싱 워크로드를 지칭한다. 일부 실시예에서, 현재의 프로세싱 워크로드가 GPU의 프로세서 코어의 주어진 시간의 양에 걸친 예컨대, 활동 대 유휴 컴퓨트 유닛의 퍼센티지에 기초하여 GPU의 하나 이상의 개별 모듈에서 활동의 양에 기초하여 식별된다. 예상되는 미래의 프로세싱 워크로드는 GPU가 비교적 가까운 미래에 경험할 것으로 예상되는 프로세싱 워크로드를 지칭한다. 일부 실시예에서, 예상된 미래 프로세싱 워크로드는 GPU에서의 실행을 위해 스케줄링된 스레드(thread)의 수에 기초하여 식별된다.
도 1은 일부 실시예에 따른 프로세싱 시스템 (100)의 블록도이다. 프로세싱 시스템은 다른 시스템 컴포넌트들 예컨대, 중앙 프로세싱 유닛(CPU) (104)에서의 하나 이상의 범용 프로세서 코어 (미도시), 컴퓨터 판독 가능 저장 매체 (106), 또는 캐시를 형성하도록 구성된 메모리 모듈과 같은 다른 메모리 디바이스들, 노스 브리지(northbridge) 또는 사우스 브리지(southbridge)와 같은 인터페이스 모듈 등의 도 1에 도시되지 않은 하나 이상의 다른 모듈들에 결합된 그래픽스 프로세싱 유닛(GPU)(102)를 포함한다. 예를 들어, 다양한 실시예에서, GPU (102)는 프레임 버퍼로서 동작하는 랜덤 액세스 메모리 (RAM)와 같은 GPU 메모리 (미도시)에 결합된다. GPU (102)는 컴퓨터, 서버, 계산 인에이블 휴대 전화, 게임 콘솔 등과 같은 임의의 다양한 전자 디바이스의 일부일 수 있다. 일반적으로, 컴퓨터 판독 가능 저장 매체 (106)는 프로세싱 시스템 (100)에 명령들 및/또는 데이터를 제공하는 사용 동안 프로세싱 시스템 (100)에 의해 액세스할 수 있는 임의의 저장 매체를 포함한다.
컴퓨터 판독 가능 저장 매체 (106)는 운영 체제 (OS) (108), GPU 드라이버 (110) 및 GPU 펌웨어 (112)를 저장한다. 운영 체제 (108), GPU 드라이버 (110)와 GPU (112)의 각각은 프로세싱 시스템 (100)에서 실행될 때, 본 출원에 설명된 동작을 구현하는 명령들을 포함한다. 일 실시예에서, OS (108)과 GPU 드라이버 (110)는 CPU (104)에서 실행되고, GPU 펌웨어는 GPU (102) (예를 들어, GPU (102)의 하나 이상의 프로세서 코어(미도시))에서 실행된다. 다른 실시예에서, OS (108)는 CPU (104)에서 실행되고, GPU 드라이버 (110) 및 GPU 펌웨어 (112)는 GPU (102) (예를 들어, GPU (102)의 하나 이상의 프로세서 코어상에서)에서 둘 모두 실행된다. 그러나, 당업자는 다양한 실시예에서, 운영 체제 (108), GPU 드라이버 (110) 및 GPU 펌웨어 (112) 중 어느 것이 본 발명의 범위를 벗어나지 않고 프로세싱 시스템 (100)의 다른 곳에서 구현된다는 것을 인식 할 것이다. 일부 실시예에서, GPU 드라이버 (110)는 GPU (102)가 프로세싱 시스템 (100) 내의 다른 컴포넌트 또는 모듈과 어떻게 상호 작용하는지를 제어하는 소프트웨어 모듈이다. 특별히, GPU 드라이버 (110)는 GPU (102)와 운영 체제 (108) 및/또는 GPU (102)를 포함하는 하드웨어 디바이스 (예를 들어, 프로세싱 시스템 (100)) 사이의 인터페이스를 제공할 수 있다.
그래픽스 워크로드의 프로세싱을 지원하기 위해, GPU (102)는 그래픽스 파이프 라인 (114), 스케줄러(116), 및 GPU 성능 모듈(118), 전력 및 클록 제어기 모듈(120)을 포함한다. 도시된 예에서, 그래픽스 파이프라인 (114)은 일반적으로 태스크 예컨대, 프로세싱 그래픽스 워크로드 등을 포함하는 그래픽스 관련 워크로드를 수행하는 명령들의 스레드를 실행하도록 구성된다. 적어도 하나의 실시예에서, GPU 드라이버 (110)는 프로세싱을 위해 그래픽스 워크로드를 그래픽스 파이프라인 (114)에 공급한다. 그래픽스 워크로드 (미도시)는 GPU (102)가 디스플레이하기 위해 하나 이상의 오브젝트를 생성하게 하는 그래픽스 명령들의 세트이다. 예를 들어, 그래픽스 워크로드는 비디오 또는 정적 그래픽스의 프레임 또는 프레임의 일부분을 렌더링하기 위한 명령들의 스레드일 수 있다.
스레드의 실행을 가능하게 하기 위해, 그래픽스 파이프라인 (114)은 컴퓨트 유닛 (CU) (122)을 포함한다. 일부 실시예에서, 그래픽스 파이프라인 (114)은 도 1에 구체적으로 예시되지 않은 추가 모듈 예컨대, 버퍼들, 메모리 디바이스들(예를 들어, 캐시 또는 스크래치 메모리로서 사용되는 메모리), GPU (102)의 다른 모듈들과의 통신을 가능하게 하는 인터페이스 디바이스들 등을 포함할 수 있다. CU가 (122)의 각각 (예를 들어, CU (122) (1) 및 122 (2))은 일반적으로 GPU (102) 대신에 파이프라인 방식으로 명령들을 실행하도록 구성된다. 추가하여, CU (122)의 각각은 도 1에 구체적으로 예시되지 않은 추가 모듈 예컨대, CU를 대신하여 명령을 페치(fetch) 및 디코딩하는 페치 및 디코딩 로직, 캐시 메모리 등을 포함할 수 있다.
스케줄러 (116)는 GPU (102)에서 스레드 실행을 위한 요청들을 수신하고, 그래픽스 파이프라인 (114)에서 실행을 위한 해당 스레드들을 스케줄링한다. 일부 실시예에서, 요청들은 CPU (104)내 프로세서 코어로부터 수신된다. 스케줄러 (116)는 하나 이상의 CU (122)가 스레드를 실행할 수 있을 때까지 각각의 수신된 요청을 버퍼링한다. 하나 이상의 CU (122)가 스레드를 실행할 수 있을 때, 스케줄러 (116)는 예를 들어, 하나 이상의 CU(예를 들어, CU 122 (1))의 페치 스테이지에 스레드의 초기 명령의 어드레스를 제공함으로써 스레드의 실행을 개시한다.
GPU 성능 모듈(118)은 GPU (102)에서의 프로세싱 워크로드들 식별하기 위해 그래픽스 파이프라인 (114) 및 스케줄러 (116)에서의 성능 특성의 모니터링을 포함하는 GPU (102)에서 성능 특성을 모니터링한다. 도 1에 예시된 것과 같은 일부 실시예에서, GPU 성능 모듈 (118)은 이용 모니터 (124), 하나 이상의 온도 센서 (126) 및 하나 이상의 전력 센서 (128)를 포함한다. 이용 모니터 (124)는 그것의 이용도(예를 들어, 그것이 얼마나 바쁜지)를 위해 그래픽스 파이프라인 (114)을 모니터링하고 예를 들어, 그래픽스 파이프라인 (114) 내의 CU (122)의 활동의 퍼센티지 레벨을 나타내는 비지 퍼센티지 메트릭(busy percentage metric)을 생성한다.
하나 이상의 온도 센서 (126)는 GPU (102)의 동작 온도를 측정한다. 하나 이상의 온도 센서 (126)는 임의의 유형의 온도 감지 회로부일 수 있다. 일부 실시예에서, 하나 초과의 온도 센서가 구현되는 경우, 온도 센서는 GPU의 표면에 물리적으로 분배될 수 있으며, GPU 성능 모듈 (118) 내에 물리적으로 분배되는 것으로 제한되지 않는다. 하나 이상의 전력 센서 (128)는 GPU(102)의 전력 소모를 측정한다. 일부 실시예에서, 하나 이상의 전력 센서 (128)는 전력 소모를 결정하기 위해 GPU (102)의 파워 서플라이의 전류 흐름을 측정하는 전력 측정 회로 (미도시)로부터 데이터를 수신한다. 다른 실시예들에서, 하나 이상의 전력 센서들 (128)은 GPU (102)의 활동 레벨(activity level)에 기초하여 전력 소모를 추정한다. 예를 들어, 하나 이상의 전력 센서들 (128)은 GPU (102) 내의 다양한 성능 카운터들을 판독하여 전력 소모의 추정을 도출하도록 구성될 수 있다.
GPU (102)의 성능은 한정되는 것은 아니지만 다음을 포함하는 복수의 동작 파라미터들에 의존한다 : GPU (102)의 GPU 프로세서 코어의 클록 속도, GPU 메모리의 메모리 클록 속도 (예를 들어, 프레임 버퍼) 및 클록 속도에 필요한 다른 관련 설정들 예컨대, 코어 클록 및 메모리 클록에 인가된 기준 전압들, 팬 속도 (예를 들어, 냉각을 제공하기 위해), 메모리 타이밍 등. 일반적으로, GPU (102)의 성능 (초당 프레임 (FPS)으로)은 코어 클록 속도의 증가 및 메모리 클록 속도의 증가와 함께 증가한다.
전력 및 클록 제어기 모듈 (120)은 GPU (102)의 전력 관리를 위한 파라미터를 제어하는 제어 엘리먼트를 포함한다. 일 실시예에서, 전력 및 클록 제어기 모듈 (120)는 코어 클록 및 전압 제어기 (130) 및 메모리 클록 및 전압 제어기 (132)를 포함한다. 코어 클록 및 전압 제어기 (130)는 GPU (102)에 대한 코어 클록 신호 및 코어 전압 신호를 생성한다. 유사하게, 메모리 클록 및 전압 제어기 (132)는 GPU (102)에 대한 메모리 클록 신호 및 메모리 전압 신호를 생성한다.
전력 및 클록 제어기 모듈 (120)을 미리 정의된 GPU 설정 세트간에 (예를 들어, 별개의 클록과 전압 레벨 각각) 스위칭하는 GPU 프로세서 코어와 GPU의 전압 및/또는 클록 레벨 적응하도록 전압 및 주파수 스케일링을 구현한다. 미리 정의된 GPU 설정의 세트는 적어도 복수의 성능 최적화된 GPU 설정 세트 및 복수의 전력 최적화된 GPU 설정 세트들을 포함하는 주어진 전력 소모에서 GPU 성능의 상이한 레벨들을 제공하는 GPU (102)에 대한 다양한 구성을 포함한다. 일 실시예에서, GPU 설정은 전압 크기 및 동작 주파수를 포함할 수 있다. 파워 서플라이 전압 크기 및 동작 주파수의 조합은 일반적으로 본 출원에서 "전력 레벨"로 지칭된다. 파워 서플라이 전압 크기는 GPU 프로세서 코어 및/또는 GPU 메모리에 공급되는 파워 서플라이 전압의 크기일 수 있다. 동작 주파수는 GPU 프로세서 코어 및/또는 GPU 메모리에 공급되는 클록 또는 클록의 주파수일 수 있다. 일반적으로, GPU에 공급되는 동작 주파수 및/또는 전압이 높을수록 성능과 전력 소모가 높아진다.
본 출원에서 더 상세하게 설명된 바와 같이, GPU 드라이버 (110)는 프로세싱 시스템 (100)의 과거 거동 및 현재 및/또는 예정된 워크로드에 기초하여 새로운 GPU 설정 (즉, 전력 레벨)을 주기적으로 결정함으로써 동적 전력 레벨 관리를 수행한다. 새로운 GPU 설정은 (본 출원에서 "측정 사이클(measurement cycle)"또는 "사이클(cycle)"로 지칭되는) 고정된 시간 간격을 사용하여, 과거의 거동에 기초하여 미래의 거동에 최적화된 설정의 예측에 기초하여 결정된다. 각각의 측정 사이클에서, GPU 드라이버 (110)는 GPU 성능 모듈 (118)로부터의 하드웨어 신호, 계산된 성능 메트릭, 및 GPU(102)에 의해 프로세싱되는 워크로드의 유형 중 적어도 하나를 포함하는 복수의 입력에 기초하여 다음 사이클을 위한 최적화된 설정을 예측한다.
예를 들어, 각각의 측정 사이클에서, GPU 성능 모듈 (118)로부터의 하드웨어 신호는 이용 모니터 (124)로부터의 평균 비지 퍼센티지 메트릭, 하나 이상의 온도 센서 (126)로부터의 평균 온도 메트릭, 및 하나 이상의 전력 센서들 (128)로부터의 측정 사이클 동안 소모된 평균 누적 전력 중 하나 이상을 계산하는데 사용된다. 다른 입력들 예컨대, 계산된 성능 측정치 (예를 들어, FPS, 스루풋, 단위 시간당 제출량) 및 GPU(102)에 의해 프로세싱되는 워크로드 유형/사용 경우 (예를 들어, 분석론, 시각화, 3D 이미지 렌더링, 인공 지능 프로세싱, 일반 컴퓨팅 기능 등)은 미래 사이클에 인가될 전력 레벨 설정을 예측할 때 또한 고려된다. 또한, 일부 실시예에서, GPU 드라이버 (110)는 미래 사이클에 인가될 전력 레벨 설정을 예측할 때 예상되는 미래 프로세싱 워크로드를 또한 고려한다.
도 2는 일부 실시예에 따른 도 1의 프로세싱 시스템에서 동적 전력 레벨 관리를 수행하기 위한 전력 제어 루프 (200)를 예시하는 블록도이다. 본 출원에서 현재 측정 사이클 및 다음 사이클의 맥락에서 기술되었지만, 기술 분야의 당업자는 설명된 전력 레벨 관리 동작이 임의의 개수의 사이클에 걸쳐 인가될 수 있다는 것을 인식할 것이다. 현재의 측정 사이클에서, 드라이버(202) (예컨대, 도 1의 GPU 드라이버 (110))는 GPU (예컨대, 도 1의 GPU (102))와 관련된 하드웨어 (206) 및 펌웨어 (204) 로부터 입력을 수신한다. 펌웨어 (204)는 평균 활동 퍼센티지 메트릭, 평균 온도 메트릭, 평균 전력 소모 메트릭 중 적어도 하나를 계산하기 위해 하드웨어 (206)로부터 하드웨어 신호 (예를 들어, GPU 성능 모듈 (118)로부터의 데이터)를 사용하도록 구성된다. 추가적으로, 드라이버(202)는 계산된 성능 측정치 (예를 들어, FPS, 스루풋, 단위 시간당 제출량) 및 GPU(102)에 의해 프로세싱되는 워크로드 유형/사용 경우 (예를 들어, 분석론, 시각화, 3D 이미지 렌더링, 인공 지능 프로세싱, 일반 컴퓨팅 기능 등)과 같은 다른 시스템 입력(208)을 또한 수신한다. 일부 실시예에서, 다른 시스템 입력 (208)은 운영 체제 (예컨대, 도 1의 OS (108)) 및/또는 CPU(예컨대, 도 1의 CPU (104))에 의해 드라이버에 제공될 수 있다.
일 실시예에서, 펌웨어 (204)는 현재의 측정 사이클에 대한 GPU의 이용 활동의 퍼센티지 레벨을 나타내는, 평균 활동 퍼센티지 메트릭을 계산한다. 평균 활동 퍼센티지 메트릭 (이는 0 - 100% 범위의 퍼센티지로 표현될 수 있다)는 예를 들어, GPU의 컴퓨트 유닛(예를 들어, 도 1의 그래픽스 파이프라인 (114)에서 CU(122))의 활동의 퍼센티지 레벨을 나타낸다. 드라이버 (202)는 펌웨어 (204)로부터 평균 활동 퍼센티지 메트릭을 수신하고 평균 활동 퍼센티지 메트릭을 미리 결정된 활동 임계치와 비교한다.
계산된 평균 활동 퍼센티지 메트릭이 미리 결정된 활동 임계치에 도달한 후 (즉, GPU에서 상위 레벨의 프로세싱 활동을 나타내는), 펌웨어 (204)는 GPU의 전력 레벨을 상이한 클록 및/또는 전압 설정으로 조정할지 여부를 결정한다. 일부 실시예에서, 펌웨어 (204)는 전력 레벨이 미리 결정된 업 히스테리 레벨 및 다운 히스테리 레벨에 기초하여 조정되어야 하는지 여부를 결정한다. 만약 평균 활동 퍼센티지 메트릭이 주어진 현재 측정 사이클에 대한 미리 결정된 활동 임계치 이상이면, 펌웨어 (204)는 GPU에 공급되는 동작 주파수 및/또는 전압을 증가시킴으로써 GPU의 전력 레벨을 조정하기 전에 평균 활동 퍼센티지 메트릭이 활동 임계치 이상으로 (즉, GPU에서 상위 레벨의 프로세싱 활동을 나타내는)계속 유지되어야 하는지 여부를 다수의 미래 사이클에 걸쳐 반복적으로 체크한다. 업 히스테리시스 및 다운 히스테리시스 레벨은 바람직하지 않은 빈번한 스위칭을 방지하기 위해 평균 활동 퍼센티지 메트릭이 활동 임계치를 교차할 때와 펌웨어 (204)가 전력 레벨을 조정할 때 사이에 동적 지연(dynamic lag)을 제공한다. 예를 들어, GPU 사용률이 50%의 가상 활동 임계치라고 가정하며, 활동 퍼센티지 메트릭이 한 측정 사이클 에서 다른 측정 사이클 사이에서 49%에서 51%로 변동할 때 전력 레벨을 변경하는 것은 비효율적이며 바람직하지 않다.
업 히스테리시스 레벨은 GPU에 공급되는 동작 주파수 및/또는 전압을 증가시켜 GPU의 전력 레벨을 조정하기 전에 활동 퍼센티지 메트릭이 활동 임계치 이상으로 유지되어야 하는 연속적인 사이클의 최소 수를 제공한다. 따라서, 업 히스테리시스 레벨이 더 높게 설정될수록, 펌웨어 (204)가 전력 레벨을 증가시킬 가능성이 더 낮아진다. 업 히스테리시스 레벨이 낮게 설정될수록, 펌웨어 (204)가 전력 레벨을 증가할 가능성이 더 높아진다. 유사하게, 활동 퍼센티지 메트릭이 활동 임계치보다 낮으면, 펌웨어 (204)는 GPU에 공급되는 동작 주파수 및/또는 전압을 감소시킴으로써 GPU의 전력 레벨을 조정하기 전에 평균 활동 퍼센티지 메트릭이 활동 임계치 아래에서 계속 유지되어야 하는지 (즉, GPU에서 더 낮은 레벨의 프로세싱 활동을 나타내는) 여부를 다수의 미래 사이클에 걸쳐 반복적으로 체크할 것이다. 다운 히스테리시스 레벨은 GPU의 전력 레벨을 감소시키기 전에 활동 퍼센티지 메트릭이 활동 임계치 아래에서 유지되어야 하는 연속적인 사이클의 최소 수를 제공한다. 따라서, 다운 히스테리시스 레벨이 더 높게 설정될수록, 펌웨어 (204)가 전력 레벨을 증가시킬 가능성이 더 낮아지고; 펌웨어 (204)는 더 긴 시간 기간 동안 상위 레벨의 전력 레벨을 보유할 것이다. 다운 히스테리시스 레벨이 낮게 설정될수록, 펌웨어 (204)가 전력 레벨을 떨어지게 할 가능성이 더 높아진다.
일부 실시예에서, 드라이버 (202)는 전력 레벨이 아래에 제공된 표 1에 기초하여 조정되어야 하는지 여부를 결정한다.
Figure 112019072318645-pct00001
표 1 : 활동 퍼센티지 메트릭 대 활동 임계치의 비교
표 1에 따르면, 활동 퍼센티지 메트릭이 활동 임계치 이상인 경우, 드라이버 (202)는 업 히스테리시스 레벨을 감소시키고 다운 히스테리시스 레벨을 증가시키고 및/또는 더 높은 전력 레벨 설정으로 조정하는데 요구된 활동 임계치를 감소시킴으로써 성능 최적화에 유리한 전력 레벨 설정을 선호한다. 활동 퍼센티지 메트릭 (즉, 비지 신호(busy signal))이 활동 임계치보다 낮으면, 드라이버 (202)는 업 히스테리시스 레벨을 증가시키고, 다운 히스테리시스 레벨을 감소시키고 및/또는 더 높은 전력 레벨 설정으로 조정하는데 요구된 활동 임계치를 증가시킴으로써 전력 최적화 및 보존에 유리한 전력 레벨 설정을 선호한다.
일부 실시예에서, 전력 레벨 설정이 하나의 사이클에서 다른 사이클로 조정될 수 있는 양은 활동 퍼센티지 메트릭 (즉, 비지 신호)를 활동 임계치를 초과하거나 아래에 얼마나 멀리 있는지에 기초하여 계산된다. 도 3은 일부 실시예에 따른 다양한 전력 레벨을 조정 인자들을 예시하는 표 다이어그램 (300)이다. 표 다이어그램(300)에서, 컬럼 (302)은 활동 퍼센티지 메트릭을 나타내고 전력 레벨 설정이 하나의 사이클에서 다른 사이클로 변화할 수 있는 최대량은 최대 조정 인자 (MAF : Maximum Adjustment Fator)로 지칭된다.
컬럼 (304)의 실시예에서, GPU 드라이버 (예를 들어, 도 2의 드라이버 (202))는 50%의 활동 임계치, 1-5 조정 인자의 범위, 5의 MAF를 갖도록 구성된다. 이 구성은 GPU에, 예를 들어, GPU에서 일반적인 계산 함수 프로세싱에 적용 될 수 있다. 업 히스테리스 레벨 및/또는 다운 히스테리 레벨이 충족된다고 가정하면, 컬럼(304)의 조정 인자 (즉, 전력 레벨 설정이 현재 측정 사이클에서 미래의 다음 측정 사이클로 얼마나 변화할 수 있는지의 양)은 현재 측정 사이클에 대한 활동 퍼센티지 메트릭 (즉, 비지 신호)과 활동 임계치 간의 차이 정도에 의존한다는 것을 보여준다. 예를 들어, 40-60% 범위의 비지 신호에는 조정 인자 "1"이 할당되는 반면, 0-10% 또는 90-10% 범위의 비지 신호에는 조정 인자 "5"가 할당되는데 이는 활동 임계치와 그것들의 상대 근접도 및 거리가 각각 50%이기 때문이다.
당업자는 본 출원에서 논의된 조정 인자가 임의의 특정 전력 레벨 (예를 들어, 특정 전압 또는 동작 주파수) 또는 전력 레벨 간의 비율과 연관되도록 의도되지 않는다는 것을 인식 할 것이다. 오히려, 조정 인자는 전력 레벨 조정의 크기에 상대적인 차이를 나타내기 위해 제공된다. 예를 들어, "2"의 조정 인자에 기초한 미래의 측정 사이클에 대한 전력 레벨 설정은 "1"의 조정 인자에 기초한 것보다 크기면에서 더 크다. 유사하게, "3"의 조정 인자에 기초한 미래의 측정 사이클에 대한 전력 레벨 설정은 "1"또는 "2"의 조정 인자에 기초한 것보다 크기가 더 클 것이다.
컬럼 (306)의 실시예에서, GPU 드라이버 (예를 들어, 도 2의 드라이버 (202))는 50%의 활동 임계치, 2-10 조정 인자의 범위, 10의 MAF를 갖도록 구성된다. 이 구성은 예를 들어 게이밍 애플리케이션이나 3D 렌더링과 같은 높은 활동 그래픽스 프로세싱 워크로드에 적용 할 수 있고, 여기서는 전력 레벨 및 GPU 성능을 더 빨리 향상시키는 것이 바람직하다(비록 전력 절감 대가이지만). 예를 들어, 컬럼 (306)의 실시예에서 비지 신호는 50-60%의 범위에 " 2"의 조정 인자가 할당된다 (그에 반해서, 컬럼 (304)의 실시예에 대해 60-70% 범위의 비지 신호에 "2"의 동일한 조정 인자가 할당됨). 따라서, 컬럼 (304)의 실시예는 동일한 전력 레벨 설정에 도달하기 위해 컬럼 (306)의 실시예보다 더 높게 측정된 활동 퍼센티지를 필요로 한다. 대안적으로, 조정 인자들 및 MAF의 차이는 컬럼 (306)의 실시예가 단일 사이클에 도달하는 전력 레벨에 도달하기 위해 컬럼 (304)의 실시예가 다수의 사이클을 취할 수 있음을 예시한다.
컬럼 (308)의 실시예에서, GPU 드라이버 (예를 들어, 도 2의 드라이버 (202))는 30%의 활동 임계치, 0-10 조정 인자의 범위, 10의 MAF를 갖도록 구성된다. 예를 들어, 보다 세분화된 전력 소모 (예를 들어, 배터리 전원으로 동작하는 랩탑)를 고려하는 것이 바람직한 프로세싱 시스템에 이런 구성이 적용될 수 있다. 업 히스테리시스 레벨 및/또는 다운 히스테리시스 레벨이 충족된다고 가정하면, 컬럼 (308)의 실시예는 30%의 더 낮은 활동 임계치가 전력 레벨은 그것들이 상승되도록 (즉, 30% 임계치 초과 측정 활동에서 7 퍼센티지 포인트 변화마다 "1"만큼씩 조정 인자를 변경) 허용된 것보다 2 배 더 빨리 감소하도록 (즉, 측정된 활동의 3 퍼센티지 포인트 변화마다 조정 인자를 "1" 만큼씩 변경) 허용되는 전력 절감 지향 설정을 허용한다는 것을 보여준다.
컬럼 (304 내지 308)의 실시예는 예를 들어, 상이한 프로세싱 워크로드 및 하드웨어 구성을 포함하는 성능 메트릭을 설명하기 위해 전력 설정이 어떻게 조정될 수 있는지의 예로서 제공된다는 것을 인식하여야 한다. 당업자는 이러한 실시예가 구체적으로 설명된 실시예로 본 출원에 제공된 교시의 범위를 제한하지 않는 것을 이해할 것이다.
도 4는 일부 실시예에 따른 적응적 전력 제어를 수행하는 방법 (400)의 흐름도이다. 블록 (402)에서, 방법 (400)은 GPU에서 현재 프로세싱중인 워크로드에 기초하여 현재 측정 사이클에 대한 성능 메트릭을 수신함으로써 시작한다. 일 실시예에서, 도 1 및 도 2 와 대하여 상술한 바와 같이, GPU 드라이버는 GPU 펌웨어 및 하드웨어로부터 입력을 수신한다. 펌웨어는 평균 활동 퍼센티지 메트릭, 평균 온도 메트릭, 평균 전력 소모 메트릭 중 적어도 하나를 포함하는 성능 메트릭을 계산하기 위해 하드웨어로부터 하드웨어 신호(예를 들어, 도 1에 관하여 설명된 GPU 성능 모듈(118)로부터의 데이터)를 취하도록 구성된다. 추가적으로, GPU 드라이버는 현재 측정 사이클에 대한 GPU (102)에 의해 프로세싱되는 워크로드의 유형/이용 경우의 식별 (예를 들어, 일반 컴퓨팅 기능과 같은 저 활동 워크로드 또는 분석론, 시각화, 3D 이미지 렌더링, 인공 지능 프로세싱 등과 같은 고 활동 워크로드), 프로세싱 시스템의 특정 하드웨어 구성 (예를 들어, RAM 메모리 양, CPU 유형 등) 및 계산된 성능 측정치 (예를 들어, FPS, 프로세싱량, 단위 시간)와 같은 다른 시스템 입력을 또한 수신한다. 따라서, GPU 드라이버는 GPU가 한 측정 사이클에서 다른 측정 사이클로 프로세싱하는 특정 워크로드의 개요를 가지며 뿐만 아니라 특정 하드웨어 구성이 해당 워크로드를 어떻게 수행하는지를 나타내는 성능 메트릭을 수신한다.
블록 (404)에서, 현재 측정 사이클에 대하여 수신된 성능 메트릭은 GPU 드라이버가 현재 측정 사이클의 현재 설정으로부터 GPU 전력 레벨을 다음 측정 사이클에서 다른 설정으로 조정해야 하는지 여부를 결정하기 위해 미리 결정된 메트릭 임계치와 비교된다. 예컨대, 도 2 및 도 3와 관련하여 설명된 일 실시예에서, 성능 메트릭은 GPU 하드웨어가 단위 시간당 (즉, 측정 사이클 당) 얼마나 많은 워크로드를 프로세싱 하는지를 나타내는 활동 퍼센티지 메트릭을 포함한다. 활동 퍼센티지 메트릭이 미리 결정된 활동 퍼센티지 임계치를 만족하거나 초과하면, GPU 드라이버는 블록 (406)으로 진행하여 GPU의 전력 레벨 (예를 들어, GPU에 인가된 동작 주파수 또는 전압)을 향상된 성능을 제공하는 다음 상위 레벨로 증가시키려고 시도한다.
당업자는 실시예들이 활동 퍼센티지의 맥락에서 구체적으로 설명되어 있음을 인식할 것이고, 본 출원에 설명된 동적 전력 레벨 관리 워크로드는 활동 퍼센티와 함께 또는 대안적으로 활동 퍼센티지를 제외하고 적용 가능하고 바람직하게는, 다른 성능 메트릭 예컨대, GPU의 평균 동작 온도, GPU에 의해 소모되는 평균 전력 또는 GPU 성능 모듈(예를 들어, 도 1의 GPU 성능 모듈(118))내 센서/ 모니터들에 의해 (그것들에 의해 캡처된 데이터로부터 도출가능한) 캡처된 다른 성능 관련 데이터가 적용 가능하다. 예를 들어, 일부 실시예에서, 방법 (400)은 만약 GPU 드라이버가 GPU가 과열인 것을 검출하면 비 집중적인 또는 저 활동 워크로드 동안 GPU가 전력 레벨을 감소시키고 더 빨리 냉각하도록 평균 활동 퍼센티지와 함께 평균 동작 온도를 고려할 수 있다.
블록 (406)에서, GPU 드라이버는 수신된 성능 메트릭이 최소 히스테리시스 수를 초과하는 연속적인 사이클의 수 동안 메트릭 임계치를 초과했는지 여부를 결정한다. 도 2 및 도 3과 관련하여 설명된 실시예에서, 히스테리시스 수는 GPU의 전력 레벨 설정에 대한 조정을 허용하기 위해 활동 퍼센티지 메트릭이 활동 임계치 이상으로 유지되어야 하는 연속적인 측정 사이클의 최소 수를 정의하는 업 히스테리스 레벨 및/또는 다운 히스테리시스 레벨을 포함한다. 예를 들어, 업 히스테리시스 레벨은 GPU의 전력 레벨을 증가시키기 전에 활동 임계치 이상으로 활동 퍼센티지 메트릭이 유지되어야 하는 연속 사이클 최소 수를 정의한다. 유사하게, 다운 히스테리시스 레벨은 GPU의 전력 레벨을 감소시키기 전에 활동 퍼센티지 메트릭이 활동 임계치 아래에서 유지되어야 하는 연속 사이클의 최소 수를 정의한다. 업 히스테리시스 레벨 및 다운 히스테리시스 레벨에 대한 정확한 값은 디자인 선택의 문제이므로 본 출원에서 설명하지 않는다는 것이 이해되어야 한다.
GPU 드라이버가 블록 (406)에서, 수신된 성능 메트릭이 최소 업 히스테리시스 수를 초과하는 연속적인 사이클의 수 동안 메트릭 임계치를 충족시키지 않았다고 결정하면, 방법 (400)은 블록 (402)으로 돌아간다. 만약 GPU 드라이버가 블록 (406)에서, 수신된 성능 메트릭이 최소 업 히스테리시스 수를 초과하는 연속적인 사이클의 수 동안 메트릭 임계치를 충족하였다고 결정하면, 방법 (400)은 블록 (408)로 진행한다.
블록 (408)에서, GPU 드라이버는 다음 측정 사이클 동안 GPU에 인가될 GPU 설정들의 추정된 최적화를 결정한다. 도 1에 대하여 설명된 것과 같은 일 실시예에서, GPU 설정의 추정된 최적화 (예를 들어, GPU의 메모리 클록 및 코어 클록에 대한 전압 및 주파수)는 적어도 복수의 성능 최적화된 GPU 설정 세트 및 복수의 전력 최적화된 GPU 설정 세트들을 포함하는 주어진 전력 소모에서 GPU 성능의 상이한 레벨들을 제공하는 GPU에 대한 다양한 구성을 포함하는 미리 정의된 GPU 설정의 세트로부터 결정될 수 있다. 미리 정의된 GPU 설정들의 세트는 예를 들어, 정적 전원 레벨 설정을 갖는 시스템의 데이터를 기반으로 선택되어 스펙트럼의 일단으로서 성능 최적화 설정 세트를 나타내는 설정 범위를 타단으로서 전력 최적화 설정 세트에 제공한다. 본 개시에서 설명된 바와 같이, 동적 전력 레벨 관리 동작은 정적, 미리 정의된 임계치를 초과하는 활동 퍼센티지 메트릭에 기초하여 전력 레벨을 증가시키지 않는다. 오히려, 본 출원에서 설명된 성능 메트릭을 초과하는 것은 GPU 드라이버가 현재 워크로드에 특별한 다른 인자 (예를 들어, OS에서 차이, 환경의 주위 온도의 차이, OS상에서 실행되는 애플리케이션에 대한 워크로드의 차이, RAM, CPU, 마더 보드, 칩셋 등과 같은 프로세싱 시스템의 하드웨어 구성 차이)를 고려하여 GPU 설정의 추정된 최적화를 결정하기 위한 전제 조건으로동작 한다. 더구나, 최적의 설정은 상이한 API들(DirextX® 9 (DX9), DX10, DX11, DX12 등)의 전형적인 거동에 대한 사전 설정된 설정들에 기초하여 추정될 수 있다. 추가적으로, 최적의 설정은 현재 및 이전 측정 사이클의 워크로드에 기초하여 추정될 수 있고 뿐만 아니라 GPU 스케줄러에 의해 실행되도록 스케줄링된 예상되는 미래 워크로드와 관련된 정보도 포함할 수 있다.
블록 (410)에서, GPU 드라이버는 추정된 최적화에 기초하여 미래 측정 사이클을 위해 GPU에서의 전력 레벨 설정을 조정하도록 GPU에 명령한다. 도 1과 관련하여 설명된 일 실시예에서, GPU 드라이버는 GPU (예를 들어, 도 1의 전력 및 클록 제어기 모듈 (120))에서 전력 및 클록 제어기 모듈에 각각이 주어진 전력 소모에서 서로 다른 레벨의 GPU 성능을 제공하는 미리 정의된 GPU 설정들(예를 들어, 각각이 별개의 클록 및 전압 레벨을 갖는) 간에 스위칭할 것을 명령한다. 일부 실시예들에서, 전력 및 클록 제어기 모듈은 GPU에 대한 클록 및 전압 신호들을 생성하기 위해 코어 클록 및 전압 제어기 및 메모리 클록 및 전압 제어기를 포함한다.
이제 블록 (404)으로 돌아가서, 활동 퍼센티지 메트릭이 미리 결정된 활동 퍼센티지 임계치보다 낮다고 결정되면, GPU 드라이버는 블록 (412)으로 진행하여 GPU의 전력 레벨 (예를 들어, GPU로 인가되는 동작 주파수 또는 전압)을 축소된 성능 및 개선된 전력 절감을 제공하는 다음 더 낮은 레벨로 감소시키려고 시도한다. 블록 (412)에서, GPU 드라이버는 수신된 성능 메트릭이 최소 히스테리시스 수를 초과하는 연속적인 사이클의 수 동안 메트릭 임계치를 초과했는지 여부를 결정한다. GPU 드라이버가 블록 (412)에서, 수신된 성능 메트릭이 최소 다운 히스테리시스 수를 초과하는 연속적인 사이클의 수 동안 메트릭 임계치를 충족시키지 않았다고 결정하면, 방법 (400)은 블록 (402)으로 돌아간다. 만약 GPU 드라이버가 블록 (412)에서, 수신된 성능 메트릭이 최소 다운 히스테리시스 수를 초과하는 연속적인 사이클의 수 동안 메트릭 임계치를 충족하였다고 결정하면, 방법 (400)은 블록 (414)로 진행한다.
블록 (414)에서, GPU 드라이버는 다음 측정 사이클 동안 GPU에 인가될 GPU 설정들의 추정된 최적화를 결정한다. 블록 (414)의 동작은 추정된 최적화가 블록 (408)의 개선된 성능을 제공하는 추정 대신에 축소된 성능 및 증가된 전력 절감을 제공하는 더 낮은 전력 레벨에 대한 것을 제외하고는 블록 (408)과 관련하여 앞에서 설명된 것과 유사하다. 블록 (416)에서, GPU 드라이버는 (블록 (410)의 동작과 유사하게) 추정된 최적화에 기초하여 미래의 측정 사이클을 위해 GPU에서의 전력 레벨 설정을 조정하도록 GPU에 명령한다.
동적 전력 관리 동작은 블록 (410 및/또는 416)에서 결론 지어지지 않는다는 것을 알아야 한다. 오히려, GPU는 임의의 주어진 시간에 프로세싱되는 워크로드에 기초하여 전력 절감 및 성능 증가를 최적화하기 위해 전력 레벨을 동적으로 적응시키기 위해 방법 (400)의 동작을 주기적으로 수행한다. 이것은 GPU가 전력 절감 지향 설정으로 유지되고 고 활동 워크로드가 프로세싱되기 시작한 후에, GPU는 성능 지향 설정으로 전환한 다음 GPU가 다시 유휴 상태가 되면 전력 절감 지향 설정으로 되돌아간다. 예를 들어, 도 4에 도시된 바와 같이, 현재 측정 사이클에 대한 블록 (410 및 416) 후에, 방법 (400)은 블록 (402)로 루프백하여, 현재 측정 사이클로부터의 수정된 전력 레벨 설정이 미래의 측정 사이클에 대한 전력 레벨 설정을 결정하기 위한 입력으로 제공될 수 있다.
측정 사이클의 정확한 사이클 기간이 명시적으로 본 출원에 정의되어 있지 않지만, 당업자는 GPU 드라이버가 사이클 기간을 변경하도록 구성될 수 있다는 것을 인식할 것이다 (여기서 사이클 기간을 감소시키는 것은 전력 레벨 관리 동작들의 세분화/정확성을 증가시키고, 전력 레벨들의 변화들 사이에서 시간의 양을 감소시킬 것이다 [GPU를 더 자주 동작시키기 위해 CPU 로드를 추가하는 대가로]; 사이클 기간을 증가시키는 것은 축소된 정확성의 대가로 동적 전력 레벨 관리 동작들에 기인하는 CPU 로드가 감소한다).
일부 실시예에서, 전술한 장치 및 기술은 하나 이상의 집적 회로 (IC) 디바이스(또한, 집적 회로 패키지 또는 마이크로 칩이라 칭함) 예컨대, 도면들 1-4를 참고로 하여 상기에서 설명된 GPU를 포함하는 시스템으로 구현된다. 이들 IC 디바이스의 디자인 및 제조에는 전자 디자인 자동화 (EDA) 및 컴퓨터 보조 디자인 (CAD) 소프트웨어 툴이 사용될 수 있다. 이들 디자인 툴은 전형적으로 하나 이상의 소프트웨어 프로그램으로 표현된다. 하나 이상의 소프트웨어 프로그램은 회로부를 제조하기 위해 제조 시스템을 디자인 또는 적응시키기 위한 프로세스의 적어도 일부를 수행하도록 하나 이상의 IC 디바이스의 회로부를 나타내는 코드상에서 동작하도록 컴퓨터 시스템을 조작하기 위해 컴퓨터 시스템에 의해 실행 가능한 코드를 포함한다. 이 코드는 명령어, 데이터 또는 명령어와 데이터의 조합이 포함될 수 있다. 디자인 툴 또는 제조 툴을 나타내는 소프트웨어 명령은 전형적으로 컴퓨팅 시스템에 액세스 가능한 컴퓨터 판독 가능 저장 매체에 저장된다. 마찬가지로, IC 디바이스의 디자인 또는 제조의 하나 이상의 단계를 나타내는 코드는 동일한 컴퓨터 판독 가능 저장 매체 또는 다른 컴퓨터 판독 가능 저장 매체에 저장되고 액세스될 수 있다.
컴퓨터 판독 가능 저장 매체는 명령 및/또는 데이터를 컴퓨터 시스템에 제공하기 위해 사용중에 컴퓨터 시스템에 의해 액세스 가능한 임의의 저장 매체 또는 저장 매체의 조합을 포함할 수 있다. 이러한 저장 매체는 광 매체(예를 들어, CD (Compact Disc), DVD (Digital Versatile Disc), 블루 레이 디스크), 자기 미디어(예를 들어, 플로피 디스크, 자기 테이프 또는 자기 하드 드라이브), 휘발성 메모리 (예를 들어, 램덤 액세스 메모리 (RAM) 또는 캐시), 비 휘발성 메모리 (예를 들어, 판독 전용 메모리 (ROM) 또는 플래시 메모리) 또는 MEMS (microelectromechanical systems) 기반 저장 매체를 포함할 수 있지만, 이에 제한되지는 않는다. 컴퓨터 판독 가능 저장 매체는 컴퓨팅 시스템 (예를 들어, 시스템 RAM 또는 ROM)에 내장되거나, 컴퓨팅 시스템 (예를 들어, 자기 하드 드라이브)에 고정적으로 부착되거나, 컴퓨팅 시스템 (예를 들어, 광 디스크 또는 범용 직렬 버스 (USB) 기반 플래시 메모리)에 착탈 가능하게 부착되거나 또는 유선 또는 무선 네트워크 (예를 들어, 네트워크 액세스 가능 스토리지 (NAS))를 통해 컴퓨터 시스템에 결합될 수 있다.
일부 실시예에서, 전술한 기술의 특정 양태는 소프트웨어를 실행하는 프로세싱 시스템의 하나 이상의 프로세서에 의해 구현될 수 있다. 소프트웨어는 비 일시적인 컴퓨터 판독 가능 저장 매체 상에 저장되거나 그렇지 않으면 유형의 구현된 하나 이상의 세트의 실행 가능 명령을 포함한다. 소프트웨어는 하나 이상의 프로세서에 의해 실행될 때 하나 이상의 프로세서를 조작하여 전술한 기술의 하나 이상의 양태를 수행하는 명령 및 특정 데이터를 포함할 수 있다. 비 일시적 컴퓨터 판독 가능 저장 매체는 예를 들어, 자기 또는 광 디스크 저장 디바이스, 플래시 메모리와 같은 고체 상태 저장 디바이스, 캐시, 랜덤 액세스 메모리 (RAM) 또는 다른 비 휘발성 메모리 디바이스 또는 디바이스들 등을 포함할 수 있다. 비 일시적 컴퓨터 판독 가능한 메모리 매체에 저장된 실행 가능한 명령은 소스 코드, 어셈블리 언어 코드, 객체 코드, 해석되거나 또는 하나 이상의 프로세서에 의해 실행 가능한 다른 명령 포맷일 수 있다.
전반적인 설명으로 상기에서 설명된 모든 활동 또는 엘리먼트가 요구되는 것은 아니며 특정 활동이나 디바이스의 일부가 필요하지 않을 수 있으며 하나 이상의 추가 활동이 수행되거나 설명된 것들에 추가하여 엘리먼트가 유도될 수 있다는 것에 유의한다. 더 나아가, 활동이 나열되는 순서가 반드시 수행되는 순서와 다를 수 있다. 또한, 개념들은 특정 실시예를 참조하여 설명되었다. 그러나, 당업자는 이하의 청구 범위에 설명된 바와 같이 본 개시의 범위를 벗어나지 않고 다양한 수정 및 변경이 이루어질 수 있음을 이해할 것이다. 따라서, 상세한 설명 및 도면은 제한적인 의미 라기보다는 예시적인 것으로 간주되어야 하며, 그러한 모든 수정은 본 발명의 범위 내에 포함되는 것으로 의도된다.
장점들, 다른 이점들 및 문제들에 대한 해결책이 특정 실시예들과 관련하여 상술되었다. 그러나 임의의 장점, 이점 또는 해결책을 더 명확하게 하거나 만들 수 있는 문제점 및 임의의 특징(들)에 대한 장점, 이점, 해결책은 임의의 또는 모든 청구항들의 중요하고 필수적이며 본질적인 특징으로 해석되어서는 안 된다. 또한, 개시된 주제가 본 출원의 교시의 장점을 갖는 당업자에게 명백한 상이하지만 동등한 방식으로 수정되고 실시될 수 있기 때문에, 개시된 특정 실시예는 단지 예시적인 것이다. 어떠한 제한도 이하의 청구 범위에 기재된 이외에 본 출원에 도시된 구성 또는 디자인의 세부 사항에 의도되지 않는다. 따라서, 상기 개시된 특정 실시예는 변경되거나 수정될 수 있으며 모든 그러한 변형은 개시된 주제의 범위 내에서 고려되는 것이 명백하다. 따라서, 본 출원에서 추구하는 보호는 이하의 청구 범위에 개시된 바와 같다.

Claims (20)

  1. 방법으로서,
    그래픽스 프로세싱 유닛(GPU)의 성능 모듈에 의해서, 상기 GPU에서의 현재 워크로드를 프로세싱하는 것과 관련된 제 1 성능 메트릭이 연속적인 측정 사이클들의 수 동안 임계값과 제 1 관련성을 가지는지를 식별하는 단계, 상기 연속적인 측정 사이클들의 수는 현재 측정 사이클 및 적어도 하나의 이전 측정 사이클을 포함하고, 상기 제 1 성능 메트릭은 상기 현재 워크로드를 프로세싱하는 동안의 GPU 성능을 나타내며;
    상기 성능 모듈에 의해서, 상기 연속적인 측정 사이클들의 수가 업-히스테리시스 레벨 및 다운-히스테리시스 레벨 중 하나를 초과함에 응답하여,
    상기 현재 워크로드를 프로세싱하는 현재 컴퓨팅 환경의 하드웨어 구성을 나타내는 데이터에 기초하여, 미래의 측정 사이클을 위해 상기 GPU에 적용될 추정된 최적화를 결정하는 단계; 및
    상기 GPU의 전력 및 클록 제어기 모듈에 의해서, 상기 추정된 최적화에 기초하여, 상기 미래의 측정 사이클을 위한 업-히스테리시스 레벨 및 다운-히스테리시스 레벨 중 하나를 조정함으로써, 상기 GPU에서의 전력 레벨 설정을 조정하는 단계
    를 포함하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서,
    상기 전력 레벨 설정을 조정하는 단계는 상기 GPU에서 코어 클록 주파수 및 메모리 클록 주파수 중 적어도 하나를 변경하는 단계를 포함하는 것을 특징으로 하는 방법.
  3. 제1항에 있어서,
    상기 제 1 성능 메트릭을 식별하는 단계는 상기 GPU의 평균 이용 퍼센티지, 상기 GPU의 평균 동작 온도, 및 상기 현재 측정 사이클 동안 소모된 평균 누적 전력 중 적어도 하나를 식별하는 단계를 포함하는 것을 특징으로 하는 방법.
  4. 제1항에 있어서,
    상기 제 1 성능 메트릭을 식별하는 단계는,
    상기 현재 측정 사이클에 대한 상기 GPU의 현재 프로세싱 워크로드에 기초하여 그리고 상기 미래의 측정 사이클에 대한 상기 GPU의 예측된 미래 프로세싱 워크로드에 기초하여 상기 제 1 성능 메트릭을 식별하는 것을 특징으로 하는 방법.
  5. 제1항에 있어서,
    상기 전력 레벨 설정을 조정하는 단계는 상기 업-히스테리시스 레벨을 조정하는 단계를 포함하는 것을 특징으로 하는 방법.
  6. 제1항에 있어서,
    상기 전력 레벨 설정을 조정하는 단계는 상기 다운-히스테리시스 레벨을 조정하는 단계를 포함하는 것을 특징으로 하는 방법.
  7. 제1항에 있어서,
    상기 GPU에서 전력 레벨 설정을 조정하는 단계는, 상기 식별된 제 1 성능 메트릭과 성능 메트릭 임계값 사이의 차이에 기초하여 상기 GPU에서의 현재 전력 레벨의 크기에 의해 상기 미래의 측정 사이클을 위한 전력 레벨 설정을 조정하는 단계를 포함하는 것을 특징으로 하는 방법.
  8. 실행가능한 명령들의 세트를 구현하는 비일시적 컴퓨터 판독가능한 매체에 있어서, 상기 실행가능한 명령들의 세트는,
    그래픽 프로세싱 유닛(GPU)에서 현재 워크로드를 프로세싱하는 것과 관련된 제 1 성능 메트릭이 연속적인 측정 사이클들의 수 동안 임계값과 제 1 관련성을 가지는지를 식별하게 하고, 상기 연속적인 측정 사이클들의 수는 현재 측정 사이클 및 적어도 하나의 이전 측정 사이클을 포함하고, 상기 제 1 성능 메트릭은 상기 현재 워크로드를 프로세싱하는 동안의 GPU 성능을 나타내며;
    상기 연속적인 측정 사이클들의 수가 업-히스테리시스 레벨 및 다운-히스테리시스 레벨 중 하나를 초과함에 응답하여,
    상기 현재 워크로드를 프로세싱하는 현재 컴퓨팅 환경의 하드웨어 구성을 나타내는 데이터에 기초하여, 미래의 측정 사이클을 위해 상기 GPU에 적용될 추정된 최적화를 결정하게 하고; 그리고
    상기 추정된 최적화에 기초하여, 상기 업-히스테리시스 레벨 및 다운-히스테리시스 레벨 중 하나를 조정함으로써, 상기 GPU에서의 전력 레벨 설정을 조정하게 하도록 프로세서를 조작하는 것을 특징으로 하는 비일시적 컴퓨터 판독가능한 매체.
  9. 제8항에 있어서,
    상기 전력 레벨 설정을 조정하는 것은, 상기 GPU에서 코어 클록 주파수 및 메모리 클록 주파수 중 적어도 하나를 변경하는 것을 포함하는 비일시적 컴퓨터 판독가능한 매체.
  10. 제8항에 있어서,
    상기 제 1 성능 메트릭을 식별하는 것은 상기 GPU의 평균 이용 퍼센티지, 상기 GPU의 평균 동작 온도, 및 상기 현재 측정 사이클 동안 소모된 평균 누적 전력 중 적어도 하나를 식별하는 것을 포함하는 비일시적 컴퓨터 판독가능한 매체.
  11. 제8항에 있어서,
    상기 전력 레벨 설정을 조정하는 것은 상기 업-히스테리시스 레벨을 조정하는 것을 포함하는 비일시적 컴퓨터 판독가능한 매체.
  12. 제8항에 있어서,
    상기 전력 레벨 설정을 조정하는 것은 상기 다운-히스테리시스 레벨을 조정하는 것을 포함하는 비일시적 컴퓨터 판독가능한 매체.
  13. 디바이스로서,
    그래픽스 프로세싱 유닛(GPU)을 포함하고, 상기 GPU는,
    복수의 컴퓨트 유닛(CU : compute unit)을 포함하는 그래픽 파이프라인;
    성능 모듈, 상기 성능 모듈은,
    상기 GPU에서 현재 워크로드를 프로세싱하는 것과 관련된 제 1 성능 메트릭이 연속적인 측정 사이클들의 수 동안 임계값과 제 1 관련성을 가지는지를 식별하고, 상기 연속적인 측정 사이클들의 수는 현재 측정 사이클 및 적어도 하나의 이전 측정 사이클을 포함하고, 상기 제 1 성능 메트릭은 상기 현재 워크로드를 프로세싱하는 동안의 GPU 성능을 나타내며;
    상기 연속적인 측정 사이클들의 수가 업-히스테리시스 레벨 및 다운-히스테리시스 레벨 중 하나를 초과함에 응답하여, 상기 현재 워크로드를 프로세싱하는 현재 컴퓨팅 환경의 하드웨어 구성을 나타내는 데이터에 기초하여, 미래의 측정 사이클을 위해 상기 GPU에 적용될 추정된 최적화를 결정하며; 그리고
    상기 추정된 최적화에 기초하여, 상기 업-히스테리시스 레벨 및 다운-히스테리시스 레벨 중 하나를 조정함으로써, 상기 GPU에서의 전력 레벨 설정을 조정하는 전력 및 클록 제어기 모듈
    을 포함하는 것을 특징으로 하는 디바이스.
  14. 제13항에 있어서,
    상기 추정된 최적화는, 복수의 성능 최적화된 설정 및 복수의 전력 절감 최적화된 설정을 포함하는 미리-정의된 전력 레벨 설정들의 세트로부터 선택되는 것을 특징으로 하는 디바이스.
  15. 제14항에 있어서,
    상기 전력 및 클록 제어기 모듈은 또한, 상기 추정된 최적화에 기초하여 상기 GPU에서 코어 클록 주파수 및 메모리 클록 주파수 중 적어도 하나를 변경하는 것을 특징으로 하는 디바이스.
  16. 제13항에 있어서,
    상기 성능 모듈은 또한, 상기 GPU의 평균 이용 퍼센티지, 상기 GPU의 평균 동작 온도, 및 상기 현재 측정 사이클 동안 소모된 평균 누적 전력 중 적어도 하나를 식별하는 것을 특징으로 하는 디바이스.
  17. 제13항에 있어서,
    상기 디바이스는 상기 성능 모듈에서 캡처된 센서 데이터에 기초하여 상기 제 1 성능 메트릭을 계산하도록 구성된 GPU 펌웨어를 더 포함하는 것을 특징으로 하는 디바이스.
  18. 삭제
  19. 삭제
  20. 삭제
KR1020197020619A 2017-01-26 2018-01-25 적응적 전력 제어 루프 KR102210355B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US15/416,955 US10649518B2 (en) 2017-01-26 2017-01-26 Adaptive power control loop
US15/416,955 2017-01-26
EP17154351.5A EP3355163B1 (en) 2017-01-26 2017-02-02 Adaptive power control loop
EP17154351.5 2017-02-02
PCT/IB2018/050467 WO2018138674A1 (en) 2017-01-26 2018-01-25 Adaptive power control loop

Publications (2)

Publication Number Publication Date
KR20190109408A KR20190109408A (ko) 2019-09-25
KR102210355B1 true KR102210355B1 (ko) 2021-02-01

Family

ID=57963065

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197020619A KR102210355B1 (ko) 2017-01-26 2018-01-25 적응적 전력 제어 루프

Country Status (6)

Country Link
US (1) US10649518B2 (ko)
EP (1) EP3355163B1 (ko)
JP (1) JP6817453B2 (ko)
KR (1) KR102210355B1 (ko)
CN (1) CN110199241B (ko)
WO (1) WO2018138674A1 (ko)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10579121B2 (en) 2017-04-01 2020-03-03 Intel Corporation Processor power management
US10304154B2 (en) * 2017-04-24 2019-05-28 Intel Corporation Coordination and increased utilization of graphics processors during inference
US10817041B2 (en) * 2017-11-17 2020-10-27 Philip Vaccaro Energy efficient computer process
US11106261B2 (en) * 2018-11-02 2021-08-31 Nvidia Corporation Optimal operating point estimator for hardware operating under a shared power/thermal constraint
US11410027B2 (en) * 2019-09-16 2022-08-09 SambaNova Systems, Inc. Performance estimation-based resource allocation for reconfigurable architectures
US11263044B2 (en) * 2019-11-22 2022-03-01 Advanced Micro Devices, Inc. Workload-based clock adjustment at a processing unit
CN111158454A (zh) * 2019-12-20 2020-05-15 青岛海尔科技有限公司 一种实时嵌入式操作系统低功耗方法及装置
US20210200255A1 (en) * 2019-12-30 2021-07-01 Qualcomm Incorporated Higher graphics processing unit clocks for low power consuming operations
US11709701B2 (en) * 2019-12-31 2023-07-25 Paypal, Inc. Iterative learning processes for executing code of self-optimizing computation graphs based on execution policies
US11736822B1 (en) 2020-02-28 2023-08-22 Apple Inc. Controlling an image sensor based on GPU temporal processing values
US11169841B2 (en) * 2020-03-17 2021-11-09 Internationl Business Machines Corporation Tunable power save loop for processor chips
US11847501B2 (en) 2020-06-12 2023-12-19 Baidu Usa Llc Method for data protection in a data processing cluster with partition
US11687376B2 (en) * 2020-06-12 2023-06-27 Baidu Usa Llc Method for data protection in a data processing cluster with dynamic partition
US11687629B2 (en) 2020-06-12 2023-06-27 Baidu Usa Llc Method for data protection in a data processing cluster with authentication
US11249540B2 (en) * 2020-07-15 2022-02-15 Dell Products L.P. System and method of configuring power consumption of a processor and a graphics processing unit
CN114510140B (zh) * 2020-11-16 2024-04-16 深圳市万普拉斯科技有限公司 一种调频方法、装置及电子设备
US20230024130A1 (en) * 2021-07-23 2023-01-26 Advanced Micro Devices, Inc. Workload aware virtual processing units
TWI785785B (zh) * 2021-09-09 2022-12-01 華碩電腦股份有限公司 電子裝置及其電源管理方法
KR102516412B1 (ko) * 2022-01-13 2023-03-31 성균관대학교산학협력단 기계학습 추론을 위한 gpu 클럭 조절 방법 및 장치
CN117528746A (zh) * 2022-07-29 2024-02-06 Oppo广东移动通信有限公司 一种发射功率调整方法、装置、芯片、设备和存储介质
CN116301662B (zh) * 2023-05-12 2023-08-01 合肥联宝信息技术有限公司 一种固态硬盘功耗管理方法及固态硬盘

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101666549B1 (ko) 2015-09-15 2016-10-17 인천대학교 산학협력단 컴퓨팅 디바이스의 중앙 프로세싱 유닛의 주파수를 동적으로 제어하는 방법

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6188206B1 (en) * 1999-12-08 2001-02-13 Intel Corporation Dynamic hysteresis voltage regulation
US6895520B1 (en) 2001-03-02 2005-05-17 Advanced Micro Devices, Inc. Performance and power optimization via block oriented performance measurement and control
US7017060B2 (en) 2001-03-19 2006-03-21 Intel Corporation Power management system that changes processor level if processor utilization crosses threshold over a period that is different for switching up or down
US7903116B1 (en) 2003-10-27 2011-03-08 Nvidia Corporation Method, apparatus, and system for adaptive performance level management of a graphics system
KR101533572B1 (ko) 2009-05-20 2015-07-03 삼성전자주식회사 전력 관리 방법
KR101617377B1 (ko) 2009-11-06 2016-05-02 삼성전자주식회사 동적 전압 주파수 스케일링 방법
WO2011074059A1 (ja) * 2009-12-14 2011-06-23 富士通株式会社 演算処理装置、情報処理装置及びその制御方法
US20120297232A1 (en) 2011-05-16 2012-11-22 Bircher William L Adjusting the clock frequency of a processing unit in real-time based on a frequency sensitivity value
EP2788834A4 (en) * 2011-12-09 2015-07-22 Intel Corp ADAPTIVE MANAGEMENT OF THE PERFORMANCE AND POWER OF A GRAPHIC SUBSYSTEM
US9304570B2 (en) * 2011-12-15 2016-04-05 Intel Corporation Method, apparatus, and system for energy efficiency and energy conservation including power and performance workload-based balancing between multiple processing elements
CN104205087B (zh) * 2012-02-04 2018-01-16 英派尔科技开发有限公司 芯片多处理器中的核心级动态电压和频率调节
US9170912B1 (en) * 2012-04-09 2015-10-27 Purdue Research Foundation System and methods for power and energy modeling in computing devices using system call tracing
US8943341B2 (en) * 2012-04-10 2015-01-27 International Business Machines Corporation Minimizing power consumption for fixed-frequency processing unit operation
US9250665B2 (en) 2012-06-07 2016-02-02 Apple Inc. GPU with dynamic performance adjustment
US9449359B2 (en) 2012-09-13 2016-09-20 Ati Technologies Ulc Rendering settings in a multi-graphics processing unit system
US20140089699A1 (en) 2012-09-27 2014-03-27 Advanced Micro Devices Power management system and method for a processor
KR101471303B1 (ko) * 2013-10-02 2014-12-10 포항공과대학교 산학협력단 그래픽 처리 장치를 위한 전력 관리 장치 및 방법
CN103809719B (zh) * 2012-11-09 2017-06-20 辉达公司 电路板及用于电路板的电源管理系统
KR20140088691A (ko) * 2013-01-03 2014-07-11 삼성전자주식회사 Dvfs 정책을 수행하는 시스템-온 칩 및 이의 동작 방법
US9310872B2 (en) * 2013-02-01 2016-04-12 Nvidia Corporation Processor frequency mainly depending on a target frame rate while processing a graphics application
KR101659705B1 (ko) * 2013-02-05 2016-09-26 퀄컴 인코포레이티드 보장된 과도 데드라인들로 중앙 프로세싱 유닛 전력을 제어하기 위한 시스템 및 방법
US9304573B2 (en) * 2013-06-21 2016-04-05 Apple Inc. Dynamic voltage and frequency management based on active processors
US8766953B1 (en) * 2013-06-27 2014-07-01 Elwha Llc Tactile display driven by surface acoustic waves
CN105637556B (zh) * 2013-10-14 2019-06-28 马维尔国际贸易有限公司 用于图形处理单元功率管理的系统和方法
US20150149800A1 (en) * 2013-11-27 2015-05-28 Alexander Gendler Performing an operating frequency change using a dynamic clock control technique
US9244747B2 (en) * 2014-03-13 2016-01-26 Qualcomm Incorporated System and method for providing dynamic clock and voltage scaling (DCVS) aware interprocessor communication
US20160116954A1 (en) 2014-10-28 2016-04-28 Linkedln Corporation Dynamic adjustment of cpu operating frequency
US9958921B2 (en) * 2015-03-09 2018-05-01 Advanced Micro Devices, Inc. Power management to change power limits based on device skin temperature
US10001856B2 (en) * 2015-04-22 2018-06-19 Mediatek Inc. Dynamic enablement, disablement and adjustment of offset of a periodic timing control signal
US9760160B2 (en) 2015-05-27 2017-09-12 Intel Corporation Controlling performance states of processing engines of a processor
US9904612B2 (en) * 2015-07-08 2018-02-27 Futurewei Technologies, Inc. Dynamic voltage/frequency scaling for multi-processors using end user experience metrics
CN104932659B (zh) * 2015-07-15 2020-01-07 京东方科技集团股份有限公司 图像显示方法及显示系统
US10007292B2 (en) * 2016-01-11 2018-06-26 Qualcomm Incorporated Energy aware dynamic adjustment algorithm
US20180018118A1 (en) * 2016-07-15 2018-01-18 Qualcomm Incorporated Power management in scenarios that handle asynchronous stimulus
US20180137668A1 (en) * 2016-11-12 2018-05-17 Intel Corporation Dynamically selecting optimum graphics frequency and graphics power gating configuration

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101666549B1 (ko) 2015-09-15 2016-10-17 인천대학교 산학협력단 컴퓨팅 디바이스의 중앙 프로세싱 유닛의 주파수를 동적으로 제어하는 방법

Also Published As

Publication number Publication date
JP6817453B2 (ja) 2021-01-20
CN110199241B (zh) 2021-10-15
US20180210530A1 (en) 2018-07-26
EP3355163A1 (en) 2018-08-01
JP2020505703A (ja) 2020-02-20
WO2018138674A1 (en) 2018-08-02
US10649518B2 (en) 2020-05-12
CN110199241A (zh) 2019-09-03
EP3355163B1 (en) 2019-09-11
KR20190109408A (ko) 2019-09-25

Similar Documents

Publication Publication Date Title
KR102210355B1 (ko) 적응적 전력 제어 루프
US20240029488A1 (en) Power management based on frame slicing
CN110637271B (zh) 用于对便携式计算设备中的沉浸式多媒体工作负载的智能调整的系统和方法
JP6005895B1 (ja) ワット当たりの最適パフォーマンスのためのインテリジェントマルチコア制御
US11157328B2 (en) Distributed processing QoS algorithm for system performance optimization under thermal constraints
JP5695766B2 (ja) マルチコアシステムエネルギー消費最適化
TWI496087B (zh) 具多重中央處理單元之電子裝置及其效能管理方法
US10372494B2 (en) Thread importance based processor core partitioning
US10459873B2 (en) Method for adaptively adjusting framerate of graphic processing unit and computer system using thereof
US11650650B2 (en) Modifying an operating state of a processing unit based on waiting statuses of blocks
US9377834B2 (en) Adjusting working frequency of a processor based on monitored idle time
US10281964B2 (en) Determining thermal time constants of processing systems
US10025372B2 (en) Techniques for managing system power using deferred graphics rendering
US20210068302A1 (en) Predictive fan control using workload profiles
JP6297748B2 (ja) プロデューサ/コンシューマワークロードシリアライゼーションの検出に基づいたプロセッサ状態制御
US20220179706A1 (en) Adaptive resource allocation system and method for a target application executed in an information handling system (ihs)
Kim et al. Application-aware scaling governor for wearable devices

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant