CN110245061A - 计算装置、其功耗预测方法及计算机可读存储介质 - Google Patents

计算装置、其功耗预测方法及计算机可读存储介质 Download PDF

Info

Publication number
CN110245061A
CN110245061A CN201910514681.6A CN201910514681A CN110245061A CN 110245061 A CN110245061 A CN 110245061A CN 201910514681 A CN201910514681 A CN 201910514681A CN 110245061 A CN110245061 A CN 110245061A
Authority
CN
China
Prior art keywords
switching power
power loss
graphics processor
processor
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910514681.6A
Other languages
English (en)
Other versions
CN110245061B (zh
Inventor
郭小尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhaoxin Semiconductor Co Ltd
Original Assignee
Shanghai Zhaoxin Integrated Circuit Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhaoxin Integrated Circuit Co Ltd filed Critical Shanghai Zhaoxin Integrated Circuit Co Ltd
Publication of CN110245061A publication Critical patent/CN110245061A/zh
Application granted granted Critical
Publication of CN110245061B publication Critical patent/CN110245061B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/324Power saving characterised by the action undertaken by lowering clock frequency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3296Power saving characterised by the action undertaken by lowering the supply or operating voltage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/003Load forecast, e.g. methods or systems for forecasting future load demand
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Power Sources (AREA)

Abstract

本发明提供一种计算装置、其功耗预测方法及计算机可读存储介质。在一实施例中,取得图形处理器的漏泄功耗。取得图形处理器运行一帧图像所对应的开关功耗数据。依据开关功耗数据估算开关功耗。依据漏泄功耗及开关功耗得出此图形处理器的整体功耗,基于该整体功耗评估图形处理器处理一帧图像所需要的整体功耗,实现对图形处理器整体功耗性能的实时预测,提升调整效率。

Description

计算装置、其功耗预测方法及计算机可读存储介质
技术领域
本发明涉及功耗及性能评估,且是涉及一种计算装置、其功耗预测方法及计算机可读存储介质。
背景技术
功耗是用于评估处理器(例如,中央处理器(Central Processing Unit,CPU)、图形处理器(Graphics Processing Unit,GPU)、数字信号处理器(Digital SignalProcessor,DSP)等)性能的其中一个重要因素。众所皆知,功率数据可以通过电压与电流相乘得到,但在当前的技术条件下,模拟信号的电流数据并不能被实时跟踪侦测,所以通过功率计测得的功率数据显然也并非实时数据。
图1是现有调整功耗及其他性能的流程图。例如被调整装置是智能手机,在步骤S110,在此智能手机上运行程序。在步骤S120,通过模拟测试方式取得该智能手机的其他性能数据。在步骤S130,连接功率表至智能手机,以取得该智能手机的功耗数据。在步骤S140,分析取得的其他性能数据及功耗数据。在步骤S150,判断该智能手机的性能数据,包括功耗数据以及其他性能数据,是否符合阈值要求或满足一定的标准等。若该智能手机的性能不符合预定阈值要求或不满足一定标准,则由工程人员须修改程序代码或参数以重复执行前述步骤S110至步骤S150,直到该智能手机的性能符合阈值要求或满足一定标准。
值得注意的是,由于不能得到实时电流大小,导致在实际运行过程中时,通过功率计回馈的功耗数据并非实时数据,工程人员需要更多次地执行前述步骤S110至步骤S150,以平衡功耗与其他性能间的关系,使整个调整功耗的流程相当冗长。另一方面,大部分被调整装置的制造商通常是根据应用间或场景间的切换来调整功耗,这样的调整则更加简单粗劣。
发明内容
有鉴于此,本发明是针对一种计算装置、其功耗预测方法及计算机可读存储、介质,基于单帧层面来估算整体功耗,从而提供更加弹性且实时的调整方式。
根据本发明的实施例,本发明的功耗预测方法适用于预测图形处理器的功耗,此功耗预测方法包括藉由处理器,取得所述图形处理器的漏泄功耗,藉由该处理器,取得所述图形处理器运行一帧图像所对应的开关功耗数据,藉由该处理器,依据所述开关功耗数据估算所述图形处理器的开关功耗,以及藉由该处理器,依据所述漏泄功耗及所述开关功耗得出所述图形处理器运行该帧图像的整体功耗。
根据本发明的实施例,本发明的计算装置适用于预测图形处理器的功耗,该计算装置包括处理器,以取得图形处理器的漏泄功耗以及该图形处理器运行一帧图像所对应的开关功耗数据,并依据所述开关功耗数据估算开关功耗,依据所述漏泄功耗及所述开关功耗得出该图形处理器的整体功耗。
根据本发明的实施例,本发明的计算机可读存储介质,存储有藉由处理器执行的计算机程序,该处理器执行该计算机程序时包括取得图形处理器的漏泄功耗,取得所述图形处理器运行一帧图像所对应的开关功耗数据,依据所述开关功耗数据估算开关功耗,以及依据所述漏泄功耗及所述开关功耗得出所述图形处理器的整体功耗。
综上所述,本发明实施例是以单帧的层面来评估整体功耗,从而能实时预测功耗,并有效提升调整程序的效率。而处理器的整体功耗包括漏泄功耗及开关功耗。针对开关功耗,本发明实施例综合考量翻转率、逻辑门数量、电压、频率、翻转次数、单位开关功耗等因素,以估测出较为接近实际情况的结果。
附图说明
本说明书包含附图以用于解释本发明的原理,本发明所示的附图构成本说明书的一部分。
图1为现有调整功耗及其他性能的流程图;
图2为依据本发明实施例的计算装置的元件方块图;
图3为依据本发明实施例的功耗预测方法的流程图;
图4为依据本发明实施例的估算开关功耗的流程图。
具体实施方式
现将详细地参考本发明的示范性实施例,示范性实施例的实例说明于附图中。只要有可能,相同元件符号在附图和描述中用来表示相同或相似部分。
图2为依据本发明实施例的计算装置100的元件方块图。请参照图2,计算装置100可以是智能手机、平板电脑、笔记本计算机、桌上型计算机等电子装置。计算装置100包括但不仅限于存储器110、及处理器130。
存储器110可以是任何方式的固定或可移动随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、快闪存储器(Flash Memory)或类似元件或上述元件的组合。存储器160记录程序码、装置配置、缓冲或永久的数据(例如,功耗数据、频率-电压对照表、硬件模块的总数、各硬件模块中的逻辑门数量等数据)、软件模块、应用程序等。
处理器130耦接存储器110,并具有多个硬件模块。处理器130经配置以处理信号且执行根据本发明的例示性实施例的程序,并可存取或载入存储器110所记录的数据及软件模块。处理器130的功能可通过使用诸如中央处理器(CPU)、图形处理器(GPU)、微处理器、微控制器、数字信号处理(Digital Signal Processing,DSP)芯片、现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)等可编程单元来实施。处理器130的功能亦可用独立电子装置或集成电路(Integrated Circuit,IC)实施,且处理器130的操作亦可用软件实现。在一实施例中,处理器130是用于预测图形处理器的功耗,而且图形处理器所具有的硬件模块可包括但不仅限于执行单元(Execution Unit,EU)、三角形设立单元(TriangleSet-up Unit,TSU)、存储器访问单元(Memory Access Unit,MXU)、纹理单元(TextureUnit,FF)、图元条带生成器(Tile Span Generator,TU)等其中一者或任意组合。需说明的是,在其他实施例中,图形处理器所具有的硬件模块还可能包括编译器、缓冲单元等,应用者可依据实际需求而自行调整。根据本发明一实施例,可以通过计算装置100中非图形处理器的处理器130执行计算,在其他实施例中,处理器130也可以是图形处理器,用于计算自身的整体功耗,本发明并不加以局限。
为了方便理解本发明实施例的操作流程,以下将举诸多实施例详细说明本发明实施例中计算装置100的操作。
图3是依据本发明一个实施例说明功耗预测方法的流程图。请参照图3,本实施例的方法适用于图2中的计算装置100。下文中,将搭配计算装置100的各项元件说明本发明实施例所述的方法。本方法的各个流程可依照实施情形而随之调整,且并不仅限于此。
在步骤S310,藉由处理器130取得图形处理器的漏泄功耗。在一实施例中,通过功率计取得一个操作电压及一个操作频率下图形处理器的漏泄功耗。此操作电压及此操作频率均可能具有一个或多个预设值,且一个操作电压以及一个操作频率对应至一个漏泄功耗。这些数据事先存储在存储器110中,或通过通信处理器,例如WiFi、以太网络等获取,或经由各类型传输接口,例如,USB等得到,或通过输入装置,例如,键盘、鼠标等输入,使处理器130可通过查表或是发出请求等方式取得上述操作电压、操作频率、以及对应的漏泄功耗的值。本说明书所述“漏泄功耗”、“开关功耗”“总功耗”是指图形处理器的漏泄功耗、开关功耗以及总功耗。
在另一个实施例中,由于这些操作电压及操作频率都是预先设定的,处理器130也可以直接自存储器110或外部来源(例如,网络、存储卡、功率计等)获得对应漏泄功耗。
值得注意的是,若上述一个操作频率对应的操作电压不止一个,或一个操作电压对应的操作频率不止一个,处理器130需依据实际上各操作电压以及各操作频率产生的所有组合获取不同的漏泄功耗。
处理器130依据不同操作电压以及不同的操作频率划分出多个时间区段,以下也称为区段,同一个区段内所用的操作电压以及操作频率是固定的,以分别计算每一个区段所对应的一个操作电压以及一个操作频率下的开关功耗,而当侦测到操作电压或操作频率发生变化,处理器130判断出进入下一区段,从而计算下一区段的开关功耗,并将所有的区段对应的开关功耗求和,以得出此处理器130所计算的图形处理器的总开关功耗,因此,若仅给定单一操作电压或单一操作频率,处理器130则计算此单一操作电压对应的开关功耗作为最终估算的总开关功耗,或计算此单一操作频率对应的开关功耗作为最终估算的总开关功耗。
具体地,在步骤S320,处理器130取得运行或处理单帧的影像或图像所对应的开关功耗数据。图形处理器的整体功耗包括漏泄功耗与开关功耗,开关功耗是指由于图形处理器中逻辑门(gate)在导通与关断间变化所形成的功耗,因而此开关功耗实际上会动态改变。本发明实施例是基于单一帧层面来估算此开关功耗,而开关功耗是用来估算总功耗的重要依据。基于单一帧层面来估算此开关功耗需要用到开关功耗数据,根据本发明的实施例,该开关功耗数据包括但不限于硬件模块上逻辑门的总数、翻转率(toggle rate),亦即单位时间间隔(Unit Interval)内,控制该硬件模块上逻辑门在导通与关断间变化的信号的翻转次数,其中,该翻转是指信号由高电平变为低电平或由低电平变为高电平、对该硬件模块上所有翻转的计数、单位开关功耗(Switching Power Per Gate Per Transition,SPPGT)、产生上述对翻转的计数所耗费的时钟周期数、产生上述单位开关功耗的操作电压,也称为单位电压、以及图形处理器所具有的硬件模块数量的数量等,这些开关功耗数据可以藉由处理器130对存储器110进行查表获得或通过其他外部来源取得,其详细内容待后续说明。
在步骤S330,处理器130依据该些开关功耗数据估算处理一帧图像需要的开关功耗。其具体数学表达式如下所示:
其中:
SPm是图形处理器所包含的所有硬件模块在对应操作电压V以及操作频率Freq的第i区段处理一帧图像所需的开关功耗,
n是图形处理器中硬件模块的总数,
m代表第m硬件模块,
Loadm是图形处理器处理该帧图像时第m硬件模块上信号翻转的计数,
Tm是产生上述计数Loadm所耗费的时钟周期数,也称为时间戳,
Aream是第m硬件模块上逻辑门的总数,
TRm是第m硬件模块上信号的翻转率,
V是前述操作电压,
Freq是前述操作频率,
Vg是用于获得单位开关功耗SPPGT时需要施加于图形处理器的操作电压,也称为单位电压,根据本发明一实施例,该单位电压的值可以但不局限于是1V,以及
SPPGT是该第m硬件模块上单个逻辑门操作在上述单位电压下,导通/关断一次所产生的开关功耗,也称为单位开关功耗。
在图形处理器处理一帧图像或影像时,第m硬件模块上信号的翻转率通常会快速变化,但对不同帧的图像或影像而言,该第m硬件模块上信号的翻转率相对稳定,因此可选择一帧或部分帧图像或影像作为样本图像,已近似得出一个平均翻转率作为第m硬件模块上信号的翻转率TRm。在一实施例中,处理器130通过在模拟机上运行一帧或少数帧图像或影像得到该第m硬件模块的平均翻转率。在另一实施例中,处理器130通过在特定操作电压及特定操作频率下的目标机上运行部分帧,并同时使用功率计取得或测量该图形处理器或该第m硬件模块的的总功耗,以计算该第m硬件模块的平均翻转率。根据本发明一实施例,该作为第m硬件模块上信号的平均翻转率TRm可以存储在一个表中供处理器130查用。根据本发明一实施例,其中,样本图像可以包括上述参与开关功耗计算的图像,也可以不同于上述参与开关功耗计算的图像。
处理器130依据这些开关功耗数据估算在一个区段运行一帧图像或影像产生的开关功耗,其中,该开关功耗是根据Aream个逻辑门以所述信号翻转率TRm进行Loadm次信号翻转所致的逻辑门翻转情形,以及根据单位开关功耗以及单位电压由处理器130计算得出。其中,信号翻转使得逻辑门在导通和关断之间的状态切换,例如逻辑门从导通状态切换到关断状态,或从关断状态切换到导通状态。
具体地,若给定的一个操作频率对应不止一个操作电压或给定的一个操作电压对应不止一个操作频率,则处理器130依据一个操作电压对应一个操作频率的方式区分出多个区段以进行计算。
具体地,如图4的详细流程图所示,在步骤S410,藉由处理器130连接到至少一个列表。
在步骤S420,藉由处理器130查询并获取该至少一个列表的数据,该数据包括但不局限于操作电压,操作频率,对应于操作电压与操作频率的图形处理器的漏泄功耗,单位开关功耗数据,硬件模块的数量,硬件模块的种类,图形处理器上每个硬件模块的逻辑门数量,每个硬件模块的信号翻转率,以及该图形处理器处理一帧图像或影像时,每一操作电压及对应的操作频率下每个硬件模块上逻辑门的翻转次数等。根据本发明一实施例,在该步骤S420,还可以藉由处理器130,依据图3的步骤S310,查询并获取图4所示S410步骤所述的至少一个列表中,每一个操作电压及每个操作频率下,图形处理器的漏泄功耗。
在步骤S430,藉由处理器130计算处理一帧图像时,图形处理器所包含的所有硬件模块在一操作电压以及对应的操作频率下的开关功耗,即计算一个区段内每一个硬件模块对应逻辑门翻转情形所产生的开关功耗,并将该区段内所有的硬件模块对应逻辑门翻转情形所产生的开关功耗加总。
在步骤S440,藉由处理器130判断是否已经查询到上述至少一个列表的结尾。当未查询到上述至少一个列表的结尾,则重复上述步骤S420以及步骤S430。当确认已查询到上述至少一个列表的结尾后,则进行到步骤S450。
在步骤S450,藉由处理器130计算所有区段的总开关功耗,作为图形处理器处理一帧图像所需的开关功耗。根据本发明一实施例,若仅给定单一电压以及单一频率,则处理器130将此单一电压与单一频率对应的开关功耗,作为最终估算的开关功耗。根据本发明另一实施例,在步骤S430,也可以将该实际翻转次数换算为标准化翻转计数再进行计算。
在步骤S460,藉由处理器130自上述至少一个列表中查询并获取每一区段下图形处理器的漏泄功耗,并将所有区段的总开关功耗与所有区段的总漏泄功耗进行求和以得出图形处理器处理一帧图像所需的整体功耗。
根据本发明一实施例,上述步骤S410~S460是为了说明整体功耗的计算方法,并不以此局限步骤的数量以及每一步骤所进行的操作,举例来说,步骤S440至步骤S460也可以合并为一步。
在一实施例中,整体功耗SPi是所有区间的漏泄功耗与开关功耗的加总,其数学表示式(2)如下所示:
其中,
LPi是第i区段的漏泄功耗,
N是区段的数量,
ti是第i区段所占的时间长度,
Time_total是总测量时间,即第1区段至第N区段的所占的时长的加总。
在其他实施例中,漏泄功耗及开关功耗可能被分别赋予权值,从而使整体功耗是加权求和所得,或者影响整体功耗的因素中可能还包括短路功耗、浪涌功耗等。
为全面阐述本发明实施例的精神,以下举一个范例进行说明,需注意该范例中所用数值仅用于说明该范例,对本发明不构成限缩。
该范例所示是藉由处理器130通过运行图形相关检测(benchmark)程序对图形处理器的总功耗进行的估测。假设该图形处理器包括五个硬件模块TSU、FF、EU、TU以及MXU,该图形处理器的开关功耗数据及漏泄功耗如下表(1)~(4)所示。其中,表(1)为该图形处理器所包含的各硬件模块对应的逻辑门数量及翻转率列表。表(2)为该图形处理器的操作电压、操作频率、该操作电压与该操作频率对应的漏泄功耗及单位开关功耗SPPGT值的列表。表(3)所示为该图形处理器处理各帧图像或影像样本时各硬件模块中信号的实际翻转次数以及最终计算出的总功耗,如表(3)所示,该范例具体选择了九帧图像或影像为样本图像进行计算。表(4)所示为该图形处理器处理各样本图像时各硬件模块中信号的实际翻转次数以及实际测试出的总功耗。
表(1)
硬件模块名称 TSG FF EU TU MXU
逻辑门数量Area<sub>m</sub> 736000 2172000 14496000 4352000 2065000
翻转率TR<sub>m</sub> 0.5 0.4 0.11 0.4 0.4
表(2)
表(3)
表(4)
根据公式(1)及表(1)~(3),以第51帧为例,表(3)所示对应各硬件模块的时间戳Tm相同,则处理器130首先估算处理该帧图像所产生的开关功耗,在操作电压为0.88V,操作频率为202.5MHz的区段下,开关功耗
根据公式(2),如该图形处理器一直处在对应操作电压0.88V以及操作频率202.5MHz的区段下,则该图形处理器处理一帧图像的整体功耗为该开关功耗加上上述操作电压0.88V以及操作频率202.5MHz下的漏泄功耗0.0468W,等于0.525W。
依此类推,可以藉由处理器130分别估算其他帧对应的整体功耗。
表(3)所示此范例估算的整体功耗与表(4)所示此范例的实际功耗之间误差的可以控制在10%左右,而根据本发明的实施例,该误差实际上可以小于4%。
根据本发明另一实施例,在计算表(3)中的估算功耗时,也可以先将表(3)所示的实际信号翻转次数标准化,即使用表(3)中的实际信号翻转次数Loadm对应除以时间戳的值Tm并乘以1000,得出标准化的信号翻转次数后再行换算。
例如,根据上述公式(1)及表(1)~(3),以第51帧为例,在操作电压为0.88V,操作频率为202.5MHz的区段下,开关功耗表(3)所示对应各硬件模块的时间戳Tm相同,则处理该帧图像所产生的开关功耗SPm为:
SPm=(415*736000*0.5+621*2172000*0.4+659*14496000*0.11+617*4352000*0.4+766*2065000*0.4)/1000*202.5*0.882/12*8.84*10-10
=0.4782W
此外,本发明另提供一种计算机可读存储介质(例如,硬盘、光盘、闪存储卡、固态硬盘(Solid State Disk,SSD)等储存介质),此计算机可读存储介质可储存多个计算机程序(例如漏泄功耗计算计算机程序、功耗数据取得计算机程序、开关功耗估算计算机程序、以及整体功耗计算机程序等),并且这些计算机程序或代码段可被计算装置100的处理器130载入并执行之后,即可完成上述功耗预测方法的步骤。
综上所述,本发明实施例能基于单一帧而实时取得功耗的回馈,让工程人员能基于回馈的功耗实时调整下一帧的功耗,从而形成自适应的系统。相关于以往调整方式需要工程人员全程参与调整程序,本发明实施例能提升整体效率。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (21)

1.一种功耗预测方法,适用于预测图形处理器的功耗,其特征在于,包括:
取得所述图形处理器的漏泄功耗;
取得所述图形处理器运行一帧图像所对应的开关功耗数据;
依据所述开关功耗数据估算所述图形处理器的开关功耗;以及
依据所述漏泄功耗及所述开关功耗得出所述图形处理器运行该帧图像的整体功耗。
2.根据权利要求1所述的功耗预测方法,其特征在于,依据所述开关功耗数据估算所述开关功耗包括:
依据对应于所述图形处理器在一个操作电压及一个操作频率下运行该帧图像的逻辑门翻转情形的开关功耗数据,估算所述开关功耗。
3.根据权利要求2所述的功耗预测方法,其特征在于,所述开关功耗数据包括信号翻转率、所述逻辑门数量、及信号翻转次数,且所述逻辑门翻转情形是所述逻辑门数量的逻辑门以所述信号翻转率进行所述信号翻转次数的导通或关断的情形。
4.根据权利要求2所述的功耗预测方法,其特征在于,该估算所述开关功耗包括:
依据多个操作电压及多个操作频率区分出多个区段;
分别计算每一该区段的逻辑门翻转情形产生的所述开关功耗;以及
将所有该区段的逻辑门翻转情形产生的所述开关功耗加总,得出所述图形处理器的总开关功耗,
其中,一个该操作电压以及一个该操作频率对应一个该区段。
5.根据权利要求4所述的功耗预测方法,其特征在于,取得所述图形处理器的漏泄功耗包括:
分别获取每一该区段的漏泄功耗;以及
将所有该区段的漏泄功耗加总,以得出所述图形处理器的总漏泄功耗。
6.根据权利要求2所述的预测方法,其特征在于,所述开关功耗数据包括单位开关功耗及单位电压,所述单位开关功耗是单一逻辑门操作在所述单位电压下导通或关断一次所产生的所述开关功耗,而依据所述开关功耗数据估算所述开关功耗包括:
利用所述单位开关功耗计算在所述逻辑门翻转情形下的所述开关功耗。
7.根据权利要求3所述的功耗预测方法,其特征在于,所述图形处理器包括多个硬件模块,而所述开关功耗数据包括每一所述硬件模块的所述开关功耗数据。
8.根据权利要求2所述的预测方法,其特征在于,依据所述开关功耗数据估算所述开关功耗包括:
依据开关功耗公式估算该图形处理器在一个区段下处理该帧图像需要的所述开关功耗,其中所述开关功耗公式是:
其中,SPm是该图形处理器所包含的所有硬件模块在该个区段下处理该帧图像所需的所述开关功耗,n是所述图形处理器中硬件模块的总数,m代表第m硬件模块,Loadm是该第m硬件模块上的信号翻转计数,Tm是所述处理器产生该信号翻转计数所耗费的时钟周期数,Aream是所述第m硬件模块的逻辑门数量,TRm是所述第m硬件模块的信号翻转率,Freq是该个区段的操作频率,V是该个区段的操作电压,Vg是单位电压,SPPGT是单位开关功耗,所述单位开关功耗是单一逻辑门操作在所述单位电压下导通或关断一次所产生的所述开关功耗。
9.根据权利要求8所述的功耗预测方法,其特征在于,依据所述开关功耗公式估算所述开关功耗包括:
通过功率表取得所述第m硬件模块在该个区段下运行样本图像的总功耗,得出所述第m硬件模块对应该个区段的信号翻转率。
10.根据权利要求2所述的功耗预测方法,其特征在于,取得所述图形处理器的漏泄功耗包括:
藉由功率表测得所述图形处理器在所述操作电压及所述操作频率下的漏泄功耗。
11.一种计算装置,其特征在于,包括:
处理器,取得图形处理器的漏泄功耗,取得该图形处理器运行一帧图像的开关功耗数据,依据所述开关功耗数据估算开关功耗,并依据所述漏泄功耗及所述开关功耗得出该图形处理器的整体功耗。
12.根据权利要求11所述的计算装置,其特征在于,所述处理器依据该图形处理器在一个操作电压及一个操作频率下处理该帧图像的逻辑门翻转情形的所述开关功耗数据,估算所述开关功耗。
13.根据权利要求12所述的计算装置,其特征在于,所述开关功耗数据包括所述图形处理器的信号翻转率、所述图形处理器的逻辑门数量、及所述图形处理器的信号翻转次数,且所述逻辑门翻转情形是所述逻辑门数量的逻辑门以所述信号翻转率进行所述信号翻转次数的翻转的情形。
14.根据权利要求12所述的计算装置,其特征在于,所述处理器依据不同的操作电压及不同的操作频率分成多个区段,分别计算每一所述区段内对应逻辑门翻转情形产生的所述开关功耗,并将所有所述区段对应逻辑门翻转情形所产生的所述开关功耗加总,以得出所述图形处理器的总开关功耗,其中,一个该操作电压以及一个该操作频率对应一个区段。
15.根据权利要求14所述的计算装置,其特征在于,所述处理器分别获取每一所述区段内的漏泄功耗,并将所有的所述区段对应的漏泄功耗加总,得出所述图形处理器的总漏泄功耗。
16.根据权利要求12所述的计算装置,其特征在于,所述开关功耗数据包括单位开关功耗及单位电压,所述单位开关功耗是单一逻辑门操作在所述单位电压下导通或关断一次产生的所述开关功耗,而所述处理器利用所述单位开关功耗计算在所述逻辑门翻转情形下的所述开关功耗。
17.根据权利要求13所述的计算装置,其特征在于,所述图形处理器包括多个硬件模块,而所述开关功耗数据包括每一所述硬件模块的所述开关功耗数据。
18.根据权利要求12所述的计算装置,其特征在于,所述处理器以开关功耗公式估算该图形处理器在一个区段下处理该帧图像需要的所述开关功耗,其中所述开关功耗公式是:
其中,SPi是该图形处理器所包含的所有硬件模块在一个区段下处理该帧图像所需的所述开关功耗,n是所述图形处理器中硬件模块的总数,m代表第m硬件模块,Loadm是该第m硬件模块上信号翻转次数,Tm是处理器产生该信号翻转次数所耗费的时钟周期数,Aream是所述第m硬件模块的逻辑门数量,TRm是所述第m硬件模块的信号翻转率,Freq是该区段的操作频率,V是该区段的操作电压,Vg是单位电压,SPPGT是单位开关功耗,所述单位开关功耗是单一逻辑门操作在所述单位电压下翻转一次所产生的所述开关功耗。
19.根据权利要求18所述的计算装置,其特征在于,所述处理器藉由功率表取得所述第m硬件模块在该个区段下运行样本图像的总功耗,以得出所述第m硬件模块对应该个区段的该信号翻转率。
20.根据权利要求12所述的计算装置,其特征在于,所述处理器藉由功率表取得在所述操作电压及所述操作频率下的漏泄功耗。
21.一种计算机可读存储介质,存储有计算机程序,所述计算机程序藉由处理器执行,该处理器执行该计算机程序时包括:
取得图形处理器的漏泄功耗;
取得所述图形处理器运行一帧图像的开关功耗数据;
依据所述开关功耗数据估算开关功耗;以及
依据所述漏泄功耗及所述开关功耗得出所述图形处理器的整体功耗。
CN201910514681.6A 2019-04-30 2019-06-14 计算装置、其功耗预测方法及计算机可读存储介质 Active CN110245061B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/398,267 US11287866B2 (en) 2019-04-30 2019-04-30 Computing device, power consumption prediction method thereof and non-transitory computer-readable storage medium
US16/398,267 2019-04-30

Publications (2)

Publication Number Publication Date
CN110245061A true CN110245061A (zh) 2019-09-17
CN110245061B CN110245061B (zh) 2023-05-26

Family

ID=67887211

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910514681.6A Active CN110245061B (zh) 2019-04-30 2019-06-14 计算装置、其功耗预测方法及计算机可读存储介质

Country Status (2)

Country Link
US (1) US11287866B2 (zh)
CN (1) CN110245061B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022000135A1 (zh) * 2020-06-28 2022-01-06 华为技术有限公司 处理器和变量的预测方法
CN115857655A (zh) * 2022-12-23 2023-03-28 摩尔线程智能科技(北京)有限责任公司 Gpu的功耗控制方法、装置、设备、介质和程序产品
CN116416115A (zh) * 2022-12-23 2023-07-11 摩尔线程智能科技(北京)有限责任公司 Gpu的控制方法、装置、设备、存储介质和程序产品

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113901748B (zh) * 2021-12-10 2022-03-01 飞腾信息技术有限公司 一种功耗评估方法、装置、存储介质及电子设备
CN115391124B (zh) * 2022-10-27 2023-03-21 瀚博半导体(上海)有限公司 一种面向图形芯片功耗测试的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWM492487U (zh) * 2014-09-10 2014-12-21 Nat Taichung University Science & Technology 電能側寫及預測系統
CN108664367A (zh) * 2017-03-28 2018-10-16 华为技术有限公司 一种基于处理器的功耗控制方法及装置
CN109032325A (zh) * 2018-07-17 2018-12-18 郑州云海信息技术有限公司 一种控制器功耗的获取方法、系统、装置及可读存储介质
CN109426599A (zh) * 2017-08-24 2019-03-05 财团法人工业技术研究院 功率估算方法与功率估算装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8924752B1 (en) * 2011-04-20 2014-12-30 Apple Inc. Power management for a graphics processing unit or other circuit
US10007292B2 (en) * 2016-01-11 2018-06-26 Qualcomm Incorporated Energy aware dynamic adjustment algorithm
US11474591B2 (en) * 2016-08-05 2022-10-18 Ati Technologies Ulc Fine-grain GPU power management and scheduling for virtual reality applications

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWM492487U (zh) * 2014-09-10 2014-12-21 Nat Taichung University Science & Technology 電能側寫及預測系統
CN108664367A (zh) * 2017-03-28 2018-10-16 华为技术有限公司 一种基于处理器的功耗控制方法及装置
CN109426599A (zh) * 2017-08-24 2019-03-05 财团法人工业技术研究院 功率估算方法与功率估算装置
CN109032325A (zh) * 2018-07-17 2018-12-18 郑州云海信息技术有限公司 一种控制器功耗的获取方法、系统、装置及可读存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022000135A1 (zh) * 2020-06-28 2022-01-06 华为技术有限公司 处理器和变量的预测方法
CN115857655A (zh) * 2022-12-23 2023-03-28 摩尔线程智能科技(北京)有限责任公司 Gpu的功耗控制方法、装置、设备、介质和程序产品
CN116416115A (zh) * 2022-12-23 2023-07-11 摩尔线程智能科技(北京)有限责任公司 Gpu的控制方法、装置、设备、存储介质和程序产品
CN115857655B (zh) * 2022-12-23 2024-01-23 摩尔线程智能科技(北京)有限责任公司 Gpu的功耗控制方法、装置、设备、介质和程序产品
CN116416115B (zh) * 2022-12-23 2024-01-30 摩尔线程智能科技(北京)有限责任公司 Gpu的控制方法、装置、设备、存储介质和程序产品

Also Published As

Publication number Publication date
US20200348739A1 (en) 2020-11-05
US11287866B2 (en) 2022-03-29
CN110245061B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
CN110245061A (zh) 计算装置、其功耗预测方法及计算机可读存储介质
Beloglazov et al. Optimal online deterministic algorithms and adaptive heuristics for energy and performance efficient dynamic consolidation of virtual machines in cloud data centers
Pearce et al. Quantifying the effectiveness of load balance algorithms
CN110245366B (zh) 动态功耗估计方法、装置及系统
Kurowski et al. DCworms–A tool for simulation of energy efficiency in distributed computing infrastructures
US20210081022A1 (en) Data Center Total Resource Utilization Efficiency (TRUE) System And Method
Huang et al. Optimal resource allocation for cost and reliability of modular software systems in the testing phase
JP2012521596A (ja) 電力分配装置・デバイス間の相関
Tan et al. Exploiting resource usage patterns for better utilization prediction
Ye et al. On-chip droop-induced circuit delay prediction based on support-vector machines
JP2024023443A (ja) 機械学習および処理された訓練データを用いた非侵入型負荷監視
Patel et al. MAG-D: A multivariate attention network based approach for cloud workload forecasting
Salinas-Hilburg et al. Unsupervised power modeling of co-allocated workloads for energy efficiency in data centers
Angius et al. Moments of accumulated reward and completion time in Markovian models with application to unreliable manufacturing systems
Ye et al. On-chip voltage-droop prediction using support-vector machines
Bao et al. Accuracy analysis and improvement of the state‐queuing model for the thermostatically controlled loads
Lewis et al. Chaotic attractor prediction for server run-time energy consumption
Klemme et al. Machine learning for circuit aging estimation under workload dependency
Schelasin Using static capacity modeling and queuing theory equations to predict factory cycle time performance in semiconductor manufacturing
Drew et al. Quas-monte carlo strategies for stochastic optimization
Zhu et al. Estimating power consumption of servers using gaussian mixture model
Stockman et al. A novel approach to memory power estimation using machine learning
Alfieri et al. Mathematical programming time-based decomposition algorithm for discrete event simulation
US10216606B1 (en) Data center management systems and methods for compute density efficiency measurements
Krampe et al. A hybrid markov chain model for workload on parallel computers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 301, 2537 Jinke Road, Zhangjiang High Tech Park, Pudong New Area, Shanghai 201203

Patentee after: Shanghai Zhaoxin Semiconductor Co.,Ltd.

Address before: Room 301, 2537 Jinke Road, Zhangjiang hi tech park, Shanghai 201203

Patentee before: VIA ALLIANCE SEMICONDUCTOR Co.,Ltd.