CN117632650A - 功耗分析方法、装置、电子设备和存储介质 - Google Patents
功耗分析方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN117632650A CN117632650A CN202311628663.3A CN202311628663A CN117632650A CN 117632650 A CN117632650 A CN 117632650A CN 202311628663 A CN202311628663 A CN 202311628663A CN 117632650 A CN117632650 A CN 117632650A
- Authority
- CN
- China
- Prior art keywords
- power consumption
- module
- gpu
- idle
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 155
- 238000003860 storage Methods 0.000 title claims abstract description 30
- 230000003068 static effect Effects 0.000 claims abstract description 93
- 230000004044 response Effects 0.000 claims abstract description 55
- 238000000034 method Methods 0.000 claims abstract description 48
- 238000012806 monitoring device Methods 0.000 claims description 60
- 230000002093 peripheral effect Effects 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 10
- 238000013461 design Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Power Sources (AREA)
Abstract
本公开涉及一种功耗分析方法、装置、电子设备和存储介质。所述方法应用于功耗分析系统,所述方法包括:响应于GPU处于空闲状态,读取所述GPU的第一功耗;对于所述GPU中的任一空闲模块,关闭所述空闲模块的时钟信号,并读取所述GPU的第二功耗,其中,所述第二功耗表示关闭所述空闲模块的时钟信号后所述GPU的总功耗;基于所述第一功耗与所述第二功耗得到所述空闲模块的动态功耗;关闭所述空闲模块的电源,并读取所述GPU的第三功耗,其中,所述第三功耗表示关闭所述空闲模块的时钟信号和电源后所述GPU的总功耗;基于所述第二功耗与所述第三功耗得到所述空闲模块的静态功耗。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种功耗分析方法、功耗分析装置、电子设备和存储介质。
背景技术
对GPU(Graphics Processing Unit,图形处理器)中的模块进行功耗分析,能够为GPU的功耗优化工作提供数据支撑,因此具有重要意义。
发明内容
本公开提供了一种功耗分析技术方案。
根据本公开的一方面,提供了一种功耗分析方法,应用于功耗分析系统,包括:
响应于GPU处于空闲状态,读取所述GPU的第一功耗;
对于所述GPU中的任一空闲模块,关闭所述空闲模块的时钟信号,并读取所述GPU的第二功耗,其中,所述第二功耗表示关闭所述空闲模块的时钟信号后所述GPU的总功耗;
基于所述第一功耗与所述第二功耗得到所述空闲模块的动态功耗;
关闭所述空闲模块的电源,并读取所述GPU的第三功耗,其中,所述第三功耗表示关闭所述空闲模块的时钟信号和电源后所述GPU的总功耗;
基于所述第二功耗与所述第三功耗得到所述空闲模块的静态功耗。
在一种可能的实现方式中,所述功耗分析系统包括功耗分析工具、GPU驱动和系统管理单元,其中,
所述功耗分析工具用于向所述GPU驱动发送预设指令;
所述GPU驱动用于向所述系统管理单元发送所述预设指令;
所述系统管理单元用于响应于所述预设指令,执行所述预设指令对应的预设操作。
在一种可能的实现方式中,所述预设指令为时钟关闭指令,所述功耗分析系统还包括时钟门控模块,所述关闭所述空闲模块的时钟信号,包括:
利用所述系统管理单元响应于所述空闲模块对应的时钟关闭命令,通过所述时钟门控模块关闭所述空闲模块的时钟信号。
在一种可能的实现方式中,所述预设指令为电源关闭指令,所述功耗分析系统还包括电源门控模块,所述关闭所述空闲模块的电源,包括:
利用所述系统管理单元响应于所述空闲模块对应的电源关闭命令,通过所述电源门控模块关闭所述空闲模块的电源。
在一种可能的实现方式中,所述预设指令为功耗读取指令,所述功耗分析系统还包括功耗监控器件,所述GPU的功耗读取过程,包括:
利用所述系统管理单元响应于功耗读取命令,从所述功耗监控器件读取所述GPU的目标功耗,其中,所述目标功耗包括所述第一功耗、所述第二功耗和所述第三功耗中的至少之一。
在一种可能的实现方式中,所述功耗分析系统还包括外设接口模块,所述利用系统管理单元响应于功耗读取命令,从所述功耗监控器件读取所述GPU的目标功耗,包括:
利用系统管理单元响应于功耗读取命令,通过所述外设接口模块,从所述功耗监控器件读取所述GPU的目标功耗。
在一种可能的实现方式中,所述方法还包括:
利用GPU驱动响应于所述GPU处于空闲状态,向功耗分析工具返回空闲模块的信息。
在一种可能的实现方式中,所述方法还包括:
根据所述GPU中的各个空闲模块的静态功耗,生成第一图表,其中,所述第一图表至少用于展示所述各个空闲模块的静态功耗在所有空闲模块的静态功耗中的占比;
和/或,
根据所述GPU中的各个空闲模块的动态功耗,生成第二图表,其中,所述第二图表至少用于展示所述各个空闲模块的动态功耗在所有空闲模块的动态功耗中的占比。
在一种可能的实现方式中,所述方法还包括:
响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗满足预设的低功耗条件,关闭所述空闲模块的时钟信号;
或者,
响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗不满足所述预设的低功耗条件,关闭所述空闲模块的时钟信号和电源。
在一种可能的实现方式中,所述预设的低功耗条件为:
所述空闲模块的静态功耗在所有空闲模块的静态功耗中的占比小于或等于预设比例;
或者,
所述空闲模块的静态功耗小于或等于预设功耗。
根据本公开的一方面,提供了一种功耗分析装置,应用于功耗分析系统,包括:
第一功耗读取模块,用于响应于GPU处于空闲状态,读取所述GPU的第一功耗;
第二功耗读取模块,用于对于所述GPU中的任一空闲模块,关闭所述空闲模块的时钟信号,并读取所述GPU的第二功耗,其中,所述第二功耗表示关闭所述空闲模块的时钟信号后所述GPU的总功耗;
动态功耗计算模块,用于基于所述第一功耗与所述第二功耗得到所述空闲模块的动态功耗;
第三功耗读取模块,用于关闭所述空闲模块的电源,并读取所述GPU的第三功耗,其中,所述第三功耗表示关闭所述空闲模块的时钟信号和电源后所述GPU的总功耗;
静态功耗计算模块,用于基于所述第二功耗与所述第三功耗得到所述空闲模块的静态功耗。
在一种可能的实现方式中,所述功耗分析系统包括功耗分析工具、GPU驱动和系统管理单元,其中,
所述功耗分析工具用于向所述GPU驱动发送预设指令;
所述GPU驱动用于向所述系统管理单元发送所述预设指令;
所述系统管理单元用于响应于所述预设指令,执行所述预设指令对应的预设操作。
在一种可能的实现方式中,所述预设指令为时钟关闭指令,所述功耗分析系统还包括时钟门控模块,所述第二功耗读取模块具体用于:
利用所述系统管理单元响应于所述空闲模块对应的时钟关闭命令,通过所述时钟门控模块关闭所述空闲模块的时钟信号。
在一种可能的实现方式中,所述预设指令为电源关闭指令,所述功耗分析系统还包括电源门控模块,所述第三功耗读取模块具体用于:
利用所述系统管理单元响应于所述空闲模块对应的电源关闭命令,通过所述电源门控模块关闭所述空闲模块的电源。
在一种可能的实现方式中,所述预设指令为功耗读取指令,所述功耗分析系统还包括功耗监控器件,所述第一功耗读取模块、所述第二功耗读取模块或者所述第三功耗读取模块具体用于:
利用所述系统管理单元响应于功耗读取命令,从所述功耗监控器件读取所述GPU的目标功耗,其中,所述目标功耗包括所述第一功耗、所述第二功耗和所述第三功耗中的至少之一。
在一种可能的实现方式中,所述功耗分析系统还包括外设接口模块,所述第一功耗读取模块、所述第二功耗读取模块或者所述第三功耗读取模块具体用于:
利用系统管理单元响应于功耗读取命令,通过所述外设接口模块,从所述功耗监控器件读取所述GPU的目标功耗。
在一种可能的实现方式中,所述装置还包括:
空闲模块查询模块,用于利用GPU驱动响应于所述GPU处于空闲状态,向功耗分析工具返回空闲模块的信息。
在一种可能的实现方式中,所述装置还包括:
第一图表生成模块,用于根据所述GPU中的各个空闲模块的静态功耗,生成第一图表,其中,所述第一图表至少用于展示所述各个空闲模块的静态功耗在所有空闲模块的静态功耗中的占比;
和/或,
第二图表生成模块,用于根据所述GPU中的各个空闲模块的动态功耗,生成第二图表,其中,所述第二图表至少用于展示所述各个空闲模块的动态功耗在所有空闲模块的动态功耗中的占比。
在一种可能的实现方式中,所述装置还包括:
第一低功耗状态处理模块,用于响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗满足预设的低功耗条件,关闭所述空闲模块的时钟信号;
或者,
第二低功耗状态处理模块,用于响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗不满足所述预设的低功耗条件,关闭所述空闲模块的时钟信号和电源。
在一种可能的实现方式中,所述预设的低功耗条件为:
所述空闲模块的静态功耗在所有空闲模块的静态功耗中的占比小于或等于预设比例;
或者,
所述空闲模块的静态功耗小于或等于预设功耗。
根据本公开的一方面,提供了一种电子设备,包括:
一个或多个处理器,其中,所述一个或多个处理器包括GPU;
用于存储可执行指令的存储器;
其中,所述一个或多个处理器被配置为调用所述存储器存储的可执行指令,以执行上述方法。
在一种可能的实现方式中,所述GPU包括系统管理单元、时钟门控模块、电源门控模块和外设接口模块,其中,所述系统管理单元分别与GPU驱动、所述时钟门控模块、所述电源门控模块和所述外设接口模块连接。
根据本公开的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。
根据本公开的一方面,提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备中运行时,所述电子设备中的处理器执行上述方法。
在本公开实施例中,通过响应于GPU处于空闲状态,读取所述GPU的第一功耗,对于所述GPU中的任一空闲模块,关闭所述空闲模块的时钟信号,并读取所述GPU的第二功耗,其中,所述第二功耗表示关闭所述空闲模块的时钟信号后所述GPU的总功耗,基于所述第一功耗与所述第二功耗得到所述空闲模块的动态功耗,关闭所述空闲模块的电源,并读取所述GPU的第三功耗,其中,所述第三功耗表示关闭所述空闲模块的时钟信号和电源后所述GPU的总功耗,并基于所述第二功耗与所述第三功耗得到所述空闲模块的静态功耗,由此能够在GPU处于空闲状态时,自动统计GPU中的各个空闲模块的动态功耗和静态功耗,从而能够提高空闲模块的功耗的统计效率。在本公开实施例中,仅需要一个功耗监控器件监控GPU的总功耗,而无需多个功耗监控器件分别监控不同模块的功耗,即,能够减少功耗监控器件的数量,因此能够降低芯片的硬件成本。另外,在本公开实施例中,无需在芯片中设计功耗计数器,因此能够降低芯片的设计成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出本公开实施例提供的功耗分析方法的流程图。
图2示出本公开实施例提供的功耗分析方法中的第一图表的示意图。
图3示出本公开实施例提供的功耗分析方法中的第二图表的示意图。
图4示出本公开实施例提供的用于执行功耗分析方法的电子设备的示意图。
图5示出本公开实施例提供的功耗分析装置的框图。
图6示出本公开实施例提供的电子设备1900的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
相关技术主要通过以下两种方案监控GPU(Graphics Processing Unit,图形处理器)中的模块的功耗:在第一种方案中,通过板级功耗监控器件监控模块的功耗;在第二种方案中,通过在芯片内部设计功耗计数器(power counter)监控模块的功耗。
其中,在第一种方案中,一个板级功耗监控器件监控的模块数量有限,芯片中的板级功耗监控器件的成本与所需监控的模块的数量正相关。并且,在第一种方案中,只能监控模块的总功耗,无法监控模块的动态功耗和静态功耗。
在第二种方案中,需要设计功耗计数器,导致芯片的设计成本增加。其次,需要拟合功耗计数器的计数值与功耗之间的关系。再者,第二种方案也只能监控模块的总功耗,无法监控模块的动态功耗和静态功耗。
本公开实施例提供了一种功耗分析方法,通过响应于GPU处于空闲状态,读取所述GPU的第一功耗,对于所述GPU中的任一空闲模块,关闭所述空闲模块的时钟信号,并读取所述GPU的第二功耗,其中,所述第二功耗表示关闭所述空闲模块的时钟信号后所述GPU的总功耗,基于所述第一功耗与所述第二功耗得到所述空闲模块的动态功耗,关闭所述空闲模块的电源,并读取所述GPU的第三功耗,其中,所述第三功耗表示关闭所述空闲模块的时钟信号和电源后所述GPU的总功耗,并基于所述第二功耗与所述第三功耗得到所述空闲模块的静态功耗,由此能够在GPU处于空闲状态时,自动统计GPU中的各个空闲模块的动态功耗和静态功耗,从而能够提高空闲模块的功耗的统计效率。在本公开实施例中,仅需要一个功耗监控器件监控GPU的总功耗,而无需多个功耗监控器件分别监控不同模块的功耗,即,能够减少功耗监控器件的数量,因此能够降低芯片的硬件成本。另外,在本公开实施例中,无需在芯片中设计功耗计数器,因此能够降低芯片的设计成本。
下面结合附图对本公开实施例提供的功耗分析方法进行详细的说明。
图1示出本公开实施例提供的功耗分析方法的流程图。在一种可能的实现方式中,所述功耗分析方法的执行主体可以是功耗分析装置,例如,所述功耗分析方法可以由终端设备或服务器或其它电子设备执行。其中,终端设备可以是用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal DigitalAssistant,PDA)、手持设备、计算设备、车载设备或者可穿戴设备等。在一些可能的实现方式中,所述功耗分析方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。所述功耗分析方法可以应用于功耗分析系统。如图1所示,所述功耗分析方法包括步骤S11至步骤S15。
在步骤S11中,响应于GPU处于空闲状态,读取所述GPU的第一功耗。
在步骤S12中,对于所述GPU中的任一空闲模块,关闭所述空闲模块的时钟信号,并读取所述GPU的第二功耗,其中,所述第二功耗表示关闭所述空闲模块的时钟信号后所述GPU的总功耗。
在步骤S13中,基于所述第一功耗与所述第二功耗得到所述空闲模块的动态功耗。
在步骤S14中,关闭所述空闲模块的电源,并读取所述GPU的第三功耗,其中,所述第三功耗表示关闭所述空闲模块的时钟信号和电源后所述GPU的总功耗。
在步骤S15中,基于所述第二功耗与所述第三功耗得到所述空闲模块的静态功耗。
在本公开实施例中,可以响应于GPU处于空闲状态,读取GPU的第一功耗。
其中,GPU处于空闲状态可以指GPU不处于任务处理状态。在一种可能的实现方式中,在GPU不处于空闲状态的情况下,可以响应于当前时间与GPU中的最后一个任务处理完成的时间之间的时间间隔达到预设时长,确定GPU进入空闲状态。在GPU处于空闲状态的情况下,可以响应于GPU接收到新的任务,确定GPU退出空闲状态。
在本公开实施例中,对于GPU中的各个空闲模块,可以分别执行步骤S11至步骤S15,从而可以分别确定GPU中的各个空闲模块的动态功耗和静态功耗。
在本公开实施例中,GPU中的空闲模块可以表示在GPU处于空闲状态时无需工作的模块。即,对于GPU中的任一模块,若在GPU处于空闲状态的情况下,所述模块也处于空闲状态,则可以确定所述模块为空闲模块;对于GPU中的任一模块,若在GPU处于空闲状态的情况下,所述模块不处于空闲状态,则可以确定所述模块不为空闲模块。在一些应用场景中,空闲模块还可以称为非工作单元、非工作单元模块等等,在此不做限定。
在一种可能的实现方式中,可以通过PMU(Power Management Unit,电源管理单元)监控GPU中的各个模块是否处于空闲状态。作为该实现方式的一个示例,对于GPU中的任一模块,所述模块可以响应于进入空闲状态,向PMU上报所述模块进入空闲状态的消息。作为该实现方式的另一个示例,PMU可以主动查询GPU中的各个模块是否处于空闲状态。
在一种可能的实现方式中,所述方法还包括:利用GPU驱动响应于所述GPU处于空闲状态,向功耗分析工具返回空闲模块的信息。
在该实现方式中,空闲模块的信息可以包括空闲模块的标识信息(ID)、空闲模块的数量等等,在此不做限定。
在该实现方式中,通过所述GPU驱动响应于所述GPU处于空闲状态,向所述功耗分析工具返回空闲模块的信息,由此功耗分析工具能够及时获得空闲模块的信息。
在一种可能的实现方式中,所述功耗分析系统包括功耗分析工具、GPU驱动和系统管理单元(System Management Unit,SMU),其中,所述功耗分析工具用于向所述GPU驱动发送预设指令;所述GPU驱动用于向所述系统管理单元发送所述预设指令;所述系统管理单元用于响应于所述预设指令,执行所述预设指令对应的预设操作。
其中,功耗分析工具可以是运行在GPU驱动(GPU driver)之上的应用软件,GPU驱动可以是用于驱动GPU硬件的软件。在一些应用场景中,功耗分析工具还可以称为自动化工具(automated tool)等等,在此不作限定。
在该实现方式中,预设指令可以包括功耗读取指令、时钟关闭指令、电源关闭指令等等。其中,功耗读取指令可以用于指示系统管理单元读取GPU的功耗,功耗读取指令对应的预设操作可以包括读取GPU的功耗。时钟关闭指令可以用于指示系统管理单元关闭空闲模块的时钟信号,时钟关闭指令对应的预设操作可以包括关闭空闲模块的时钟信号。电源关闭指令可以用于指示系统管理单元关闭空闲模块的电源,电源关闭指令对应的预设操作可以包括关闭空闲模块的电源。
在该实现方式中,通过功耗分析工具向GPU驱动发送预设指令,通过GPU驱动向系统管理单元发送所述预设指令,通过系统管理单元响应于所述预设指令,执行所述预设指令对应的预设操作,由此能够通过功耗分析工具、GPU驱动和系统管理单元三者的配合,实现GPU的空闲模块的功耗分析。
在一种可能的实现方式中,所述预设指令为时钟关闭指令,所述功耗分析系统还包括时钟门控模块,所述关闭所述空闲模块的时钟信号,包括:利用所述系统管理单元响应于所述空闲模块对应的时钟关闭命令,通过所述时钟门控模块关闭所述空闲模块的时钟信号。
在该实现方式中,功耗分析工具可以向GPU驱动发送所述空闲模块对应的时钟关闭命令;所述GPU驱动可以向系统管理单元发送所述空闲模块对应的时钟关闭命令;所述系统管理单元可以响应于所述空闲模块对应的时钟关闭命令,通过时钟门控模块关闭所述空闲模块的时钟。在该实现方式中,预设指令对应的预设操作可以包括通过所述时钟门控模块关闭所述空闲模块的时钟信号。
在该实现方式中,所述空闲模块对应的时钟关闭命令可以用于控制关闭所述空闲模块的时钟信号。在该实现方式中,功耗分析工具在获取第一功耗之后,可以向GPU驱动发送所述空闲模块对应的时钟关闭命令。GPU驱动可以向系统管理单元转发所述空闲模块对应的时钟关闭命令。
在该实现方式中,系统管理单元可以控制时钟门控(clock gating)模块开关模块的时钟信号。其中,时钟门控模块可以用于控制各模块的时钟的开关。在一些应用场景中,时钟门控模块还可以称为时钟开关控制模块等,在此不做限定。
在该实现方式中,通过功耗分析工具向GPU驱动发送所述空闲模块对应的时钟关闭命令,所述GPU驱动向系统管理单元发送所述空闲模块对应的时钟关闭命令,所述系统管理单元响应于所述空闲模块对应的时钟关闭命令,通过时钟门控模块关闭所述空闲模块的时钟信号,由此能够复用GPU芯片内部的时钟门控模块的控制逻辑来辅助实现各个空闲模块的功耗统计。
在一种可能的实现方式中,所述预设指令为电源关闭指令,所述功耗分析系统还包括电源门控模块,所述关闭所述空闲模块的电源,包括:利用所述系统管理单元响应于所述空闲模块对应的电源关闭命令,通过所述电源门控模块关闭所述空闲模块的电源。
在该实现方式中,功耗分析工具可以向GPU驱动发送所述空闲模块对应的电源关闭命令;所述GPU驱动可以向系统管理单元发送所述空闲模块对应的电源关闭命令;所述系统管理单元可以响应于所述空闲模块对应的电源关闭命令,通过电源门控模块关闭所述空闲模块的电源。在该实现方式中,预设指令对应的预设操作可以包括通过电源门控模块关闭所述空闲模块的电源。
在该实现方式中,所述空闲模块对应的电源关闭命令可以用于控制关闭所述空闲模块的电源。在该实现方式中,功耗分析工具在获取第二功耗之后,可以向GPU驱动发送所述空闲模块对应的电源关闭命令。GPU驱动可以向系统管理单元转发所述空闲模块对应的电源关闭命令。
在该实现方式中,系统管理单元可以控制电源门控(power gating)模块开关模块的电源。其中,电源门控模块可以用于控制各模块的电压的开关。在一些应用场景中,电源门控模块还可以称为电源开关控制模块等,在此不做限定。
在该实现方式中,通过功耗分析工具向GPU驱动发送所述空闲模块对应的电源关闭命令,所述GPU驱动向系统管理单元发送所述空闲模块对应的电源关闭命令,所述系统管理单元响应于所述空闲模块对应的电源关闭命令,通过电源门控模块关闭所述空闲模块的电源,由此能够复用GPU芯片内部的电源门控模块的控制逻辑来辅助实现各个空闲模块的功耗统计。
在一种可能的实现方式中,所述预设指令为功耗读取指令,所述功耗分析系统还包括功耗监控器件,所述GPU的功耗读取过程,包括:利用所述系统管理单元响应于功耗读取命令,从所述功耗监控器件读取所述GPU的目标功耗,其中,所述目标功耗包括所述第一功耗、所述第二功耗和所述第三功耗中的至少之一。
在该实现方式中,功耗监控器件(power monitor)设置于GPU外部,可以用于读取供电模块(power supply)的供电功耗,即GPU的总功耗。例如,功耗监控器件可以采用INA2331等器件,在此不做限定。供电模块可以用于给GPU供电。供电模块可以采用PCIE(Peripheral Component Interconnect Express,周边装置互连高速)插槽供电或者外部多引脚供电等,在此不做限定。
在该实现方式中,预设指令对应的预设操作可以包括从所述功耗监控器件读取所述GPU的目标功耗。
作为该实现方式的一个示例,功耗读取指令可以包括第一功耗读取指令,目标功耗可以包括第一功耗。所述响应于GPU处于空闲状态,读取所述GPU的第一功耗,可以包括:功耗分析工具向GPU驱动发送空闲状态查询消息;所述GPU驱动响应于所述GPU处于空闲状态,向所述功耗分析工具返回所述GPU处于空闲状态的消息;所述功耗分析工具响应于所述GPU处于空闲状态的消息,向所述GPU驱动发送第一功耗读取命令;所述GPU驱动向系统管理单元发送所述第一功耗读取命令;所述系统管理单元响应于所述第一功耗读取命令,从功耗监控器件读取所述GPU的第一功耗;所述系统管理单元向所述GPU驱动返回所述第一功耗;所述GPU驱动向所述功耗分析工具返回所述第一功耗。
在该示例中,功耗分析工具可以向GPU驱动发送空闲状态查询消息,其中,所述空闲状态查询消息可以用于查询GPU是否处于空闲状态。GPU驱动可以响应于GPU处于空闲状态,向功耗分析工具返回GPU处于空闲状态的消息;或者,GPU驱动可以响应于GPU不处于空闲状态,向功耗分析工具返回GPU不处于空闲状态的消息。
在一个例子中,在GPU不处于空闲状态的情况下,GPU驱动可以响应于当前时间与GPU中的最后一个任务处理完成的时间之间的时间间隔达到预设时长,确定GPU进入空闲状态。在GPU处于空闲状态的情况下,GPU驱动可以响应于GPU接收到新的任务,确定GPU退出空闲状态。
在该示例中,功耗分析工具可以响应于GPU处于空闲状态的消息,向GPU驱动发送第一功耗读取命令。其中,第一功耗读取命令可以用于读取GPU的总功耗。对于待进行功耗分析的空闲模块而言,由于此时所述空闲模块的时钟信号和电源处于开启状态,因此所读取的GPU的总功耗为所述空闲模块的时钟信号和电源处于开启状态时GPU的总功耗。
GPU驱动可以响应于接收到第一功耗读取命令,向系统管理单元转发第一功耗读取命令。系统管理单元可以响应于第一功耗读取命令,从功耗监控器件读取GPU的第一功耗,并向GPU驱动返回第一功耗。GPU驱动可以响应于接收到第一功耗,向功耗分析工具返回第一功耗。功耗分析工具可以记录第一功耗。
在该示例中,通过功耗分析工具向GPU驱动发送空闲状态查询消息,所述GPU驱动响应于所述GPU处于空闲状态,向所述功耗分析工具返回所述GPU处于空闲状态的消息,所述功耗分析工具响应于所述GPU处于空闲状态的消息,向所述GPU驱动发送第一功耗读取命令,所述GPU驱动向系统管理单元发送所述第一功耗读取命令,所述系统管理单元响应于所述第一功耗读取命令,从功耗监控器件读取所述GPU的第一功耗,所述系统管理单元向所述GPU驱动返回所述第一功耗,所述GPU驱动向所述功耗分析工具返回所述第一功耗,由此通过功耗分析工具、GPU驱动、系统管理单元和功耗监控器件的配合,完成第一功耗的读取。
作为该实现方式的一个示例,功耗读取指令可以包括第二功耗读取指令,目标功耗可以包括第二功耗。所述读取所述GPU的第二功耗,可以包括:功耗分析工具向GPU驱动发送第二功耗读取命令;所述GPU驱动向系统管理单元发送所述第二功耗读取命令;所述系统管理单元响应于所述第二功耗读取命令,从功耗监控器件读取所述GPU的第二功耗;所述系统管理单元向所述GPU驱动返回所述第二功耗;所述GPU驱动向所述功耗分析工具返回所述第二功耗。
在该示例中,功耗分析工具可以响应于所述空闲模块的时钟信号关闭,向GPU驱动发送第二功耗读取命令。其中,第二功耗读取命令可以用于读取GPU的总功耗。由于此时所述空闲模块的时钟信号处于关闭状态,因此所读取的GPU的第二功耗为关闭所述空闲模块的时钟信号后所述GPU的总功耗。
GPU驱动可以向系统管理单元转发第二功耗读取命令。系统管理单元可以响应于第二功耗读取命令,从功耗监控器件读取GPU的第二功耗,并向GPU驱动返回第二功耗。GPU驱动可以向功耗分析工具返回第二功耗。功耗分析工具可以记录第二功耗。
在该示例中,通过功耗分析工具向GPU驱动发送第二功耗读取命令,所述GPU驱动向系统管理单元发送所述第二功耗读取命令,所述系统管理单元响应于所述第二功耗读取命令,从功耗监控器件读取所述GPU的第二功耗,所述系统管理单元向所述GPU驱动返回所述第二功耗,所述GPU驱动向所述功耗分析工具返回所述第二功耗,由此通过功耗分析工具、GPU驱动、系统管理单元和功耗监控器件的配合,完成第二功耗的读取。
作为该实现方式的一个示例,功耗读取指令可以包括第三功耗读取指令,目标功耗可以包括第三功耗。在所述读取所述GPU的第三功耗,可以包括:功耗分析工具向GPU驱动发送第三功耗读取命令;所述GPU驱动向系统管理单元发送所述第三功耗读取命令;所述系统管理单元响应于所述第三功耗读取命令,从功耗监控器件读取所述GPU的第三功耗;所述系统管理单元向所述GPU驱动返回所述第三功耗;所述GPU驱动向所述功耗分析工具返回所述第三功耗。
在该示例中,功耗分析工具可以响应于所述空闲模块的电源关闭,向GPU驱动发送第三功耗读取命令。其中,第三功耗读取命令可以用于读取GPU的总功耗。由于此时所述空闲模块的时钟信号和电源均处于关闭状态,因此所读取的GPU的第三功耗为关闭所述空闲模块的时钟信号和电源后所述GPU的总功耗。
GPU驱动可以向系统管理单元转发第三功耗读取命令。系统管理单元可以响应于第三功耗读取命令,从功耗监控器件读取GPU的第三功耗,并向GPU驱动返回第三功耗。GPU驱动可以向功耗分析工具返回第三功耗。功耗分析工具可以记录第三功耗。
在该示例中,通过功耗分析工具向GPU驱动发送第三功耗读取命令,所述GPU驱动向系统管理单元发送所述第三功耗读取命令,所述系统管理单元响应于所述第三功耗读取命令,从功耗监控器件读取所述GPU的第三功耗,所述系统管理单元向所述GPU驱动返回所述第三功耗,所述GPU驱动向所述功耗分析工具返回所述第三功耗,由此通过功耗分析工具、GPU驱动、系统管理单元和功耗监控器件的配合,完成第三功耗的读取。
作为该实现方式的一个示例,所述功耗分析系统还包括外设接口模块,所述利用系统管理单元响应于功耗读取命令,从所述功耗监控器件读取所述GPU的目标功耗,包括:利用系统管理单元响应于功耗读取命令,通过所述外设接口模块,从所述功耗监控器件读取所述GPU的目标功耗。
在该示例中,系统管理单元可以控制外设接口(Peripheral InterFace,PIF)模块与GPU外部的功耗监控器件交互,以读取GPU的总功耗。外设接口模块可以用于与GPU外部的功耗监控器件交互,以读取GPU的总功耗。其中,外设接口模块可以采用I2C(Inter-Integrated Circuit,集成电路互连总线)接口等,在此不做限定。
在该示例中,系统管理单元通过外设接口模块,从功耗监控器件读取所述GPU的目标功耗,由此系统管理单元可以通过外设接口模块,完成与GPU外部的功耗监控器件的交互,从而读取GPU的目标功耗。
在一个例子中,所述系统管理单元响应于所述第一功耗读取命令,从功耗监控器件读取所述GPU的第一功耗,包括:所述系统管理单元响应于所述第一功耗读取命令,通过外设接口模块,从功耗监控器件读取所述GPU的第一功耗。
在一个例子中,所述系统管理单元响应于所述第二功耗读取命令,从功耗监控器件读取所述GPU的第二功耗,包括:所述系统管理单元响应于所述第二功耗读取命令,通过外设接口模块,从功耗监控器件读取所述GPU的第二功耗。
在一个例子中,所述系统管理单元响应于所述第三功耗读取命令,从功耗监控器件读取所述GPU的第三功耗,包括:所述系统管理单元响应于所述第三功耗读取命令,通过外设接口模块,从功耗监控器件读取所述GPU的第三功耗。
在本公开实施例中,对于GPU中的任一空闲模块,可以关闭所述空闲模块的时钟信号,并读取GPU的第二功耗。其中,第二功耗可以表示关闭所述空闲模块的时钟信号后GPU的总功耗。在读取所述GPU的第二功耗之后,可以计算第一功耗与第二功耗的差值,得到所述空闲模块的动态功耗。
在本公开实施例中,在读取所述GPU的第二功耗之后,可以关闭所述空闲模块的电源,并读取GPU的第三功耗。其中,第三功耗表示关闭所述空闲模块的时钟信号和电源后GPU的总功耗。在读取所述GPU的第三功耗之后,可以计算第二功耗与第三功耗的差值,得到所述空闲模块的动态功耗。
在一种可能的实现方式中,在确定所述空闲模块的静态功耗之后,在分析下一个空闲模块的功耗之前,无需开启所述空闲模块的电源。
在另一种可能的实现方式中,在确定所述空闲模块的静态功耗之后,在分析下一个空闲模块的功耗之前,所述方法还包括:启动所述空闲模块的电源,并启动所述空闲模块的时钟信号。
采用本公开实施例,能够统计得到GPU中的各个空闲模块的动态功耗和静态功耗,从而能够为后期的功耗优化工作提供数据支撑,且能够用于分析芯片的设计是否达到预设的功耗要求。
在一种可能的实现方式中,所述方法还包括:根据所述GPU中的各个空闲模块的静态功耗,生成第一图表,其中,所述第一图表至少用于展示所述各个空闲模块的静态功耗在所有空闲模块的静态功耗中的占比;和/或,根据所述GPU中的各个空闲模块的动态功耗,生成第二图表,其中,所述第二图表至少用于展示所述各个空闲模块的动态功耗在所有空闲模块的动态功耗中的占比。
作为该实现方式的一个示例,可以利用功耗分析工具根据所述GPU中的各个空闲模块的静态功耗,生成第一图表,可以利用功耗分析工具根据所述GPU中的各个空闲模块的动态功耗,生成第二图表。
在该实现方式中,第一图表和第二图表可以采用饼图、环形图、柱状图、堆积柱状图、条形图、堆积条形图等形式,在此不做限定。
作为该实现方式的一个示例,可以根据所述GPU中的各个空闲模块的静态功耗,生成第一图表,其中,所述第一图表至少用于展示所述各个空闲模块的静态功耗在所有空闲模块的静态功耗中的占比。
在一个例子中,可以通过功耗分析工具根据所述GPU中的各个空闲模块的静态功耗,生成第一图表。
在一个例子中,第一图表还可以用于展示所述各个空闲模块的静态功耗。
图2示出本公开实施例提供的功耗分析方法中的第一图表的示意图。图2所示的第一图表展示了5个空闲模块的静态功耗,5个空闲模块的静态功耗分别为3W、4W、2W、1W和0.5W。并且,图2所示的第一图表为饼图,展示了各个空闲模块的静态功耗在所有空闲模块的静态功耗中的占比。
作为该实现方式的一个示例,可以根据所述GPU中的各个空闲模块的动态功耗,生成第二图表,其中,所述第二图表至少用于展示所述各个空闲模块的动态功耗在所有空闲模块的动态功耗中的占比。
在一个例子中,可以通过功耗分析工具根据所述GPU中的各个空闲模块的动态功耗,生成第二图表。
在一个例子中,第二图表还可以用于展示所述各个空闲模块的动态功耗。
图3示出本公开实施例提供的功耗分析方法中的第二图表的示意图。图3所示的第二图表展示了5个空闲模块的动态功耗,5个空闲模块的动态功耗分别为7W、6W、8W、4W和3W。并且,图3所示的第二图表为饼图,展示了各个空闲模块的动态功耗在所有空闲模块的动态功耗中的占比。
在该实现方式中,通过根据所述GPU中的各个空闲模块的静态功耗,生成第一图表,其中,所述第一图表至少用于展示所述各个空闲模块的静态功耗在所有空闲模块的静态功耗中的占比,和/或,根据所述GPU中的各个空闲模块的动态功耗,生成第二图表,其中,所述第二图表至少用于展示所述各个空闲模块的动态功耗在所有空闲模块的动态功耗中的占比,由此能够实现空闲模块的动态功耗和静态功耗的自动分析,从而有助于用户比较不同空闲模块的动态功耗和静态功耗。
在一种可能的实现方式中,所述方法还包括:响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗满足预设的低功耗条件,关闭所述空闲模块的时钟信号;或者,响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗不满足所述预设的低功耗条件,关闭所述空闲模块的时钟信号和电源。
在该实现方式中,对于任一空闲模块,若所述空闲模块的静态功耗满足预设的低功耗条件,则在需要控制所述空闲模块进入预设的低功耗状态的情况下,可以仅关闭所述空闲模块的时钟信号,而无需关闭所述空闲模块的电源,由此能够使所述空闲模块更快速地从预设的低功耗状态恢复至正常工作状态。
在该实现方式,对于任一空闲模块,若所述空闲模块的静态功耗不满足预设的低功耗条件,则在需要控制所述空闲模块进入预设的低功耗状态的情况下,可以关闭所述空闲模块的时钟信号和电源,从而能够降低GPU的整体功耗。
作为该实现方式的一个示例,可以利用系统管理单元响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗满足预设的低功耗条件,通过时钟门控模块关闭所述空闲模块的时钟信号;可以利用系统管理单元响应于进入预设的低功耗状态的指令,且且所述空闲模块的静态功耗不满足所述预设的低功耗条件,通过时钟门控模块关闭所述空闲模块的时钟信号,并通过电源门控模块关闭所述空闲模块的电源。
作为该实现方式的一个示例,所述预设的低功耗条件为:所述空闲模块的静态功耗在所有空闲模块的静态功耗中的占比小于或等于预设比例;或者,所述空闲模块的静态功耗小于或等于预设功耗。
在一个例子中,所述预设的低功耗条件为:所述空闲模块的静态功耗在所有空闲模块的静态功耗中的占比小于或等于预设比例。在这个例子中,响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗在所有空闲模块的静态功耗中的占比小于或等于预设比例,关闭所述空闲模块的时钟信号;或者,响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗在所有空闲模块的静态功耗中的占比大于预设比例,关闭所述空闲模块的时钟信号和电源。
在另一个例子中,所述预设的低功耗条件为:所述空闲模块的静态功耗小于或等于预设功耗。在这个例子中,响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗小于或等于预设功耗,关闭所述空闲模块的时钟信号;或者,响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗大于预设功耗,关闭所述空闲模块的时钟信号和电源。
通过采用该示例,有助于权衡GPU的整体功耗和恢复至正常工作状态时的响应速度。
本公开实施例提供的功耗分析方法可以应用于GPU、功耗统计、功耗分析等技术领域,在此不做限定。
下面通过一个具体的应用场景说明本公开实施例提供的功耗分析方法。
图4示出本公开实施例提供的用于执行功耗分析方法的电子设备的示意图。如图4所示,电子设备可以包括软件和硬件。其中,软件可以包括互相连接的功耗分析工具和GPU驱动。硬件可以包括GPU、功耗监控器件和供电模块,其中,功耗监控器件与供电模块连接。GPU可以包括系统管理单元、时钟门控模块、电源门控模块和外设接口模块(即图4中的PIF),其中,系统管理单元与GPU驱动、时钟门控模块、电源门控模块和外设接口模块连接,外设接口模块与功耗监控器件连接,且时钟门控模块和电源门控模块均与各个模块连接。
其中,功耗分析工具可以是运行在GPU驱动之上的应用软件。功耗分析工具可以用于:发送命令至GPU驱动,其中,功耗分析工具向GPU驱动发送的命令可以包括功耗读取命令(例如第一功耗读取命令、第二功耗读取命令、第三功耗读取命令)、时钟关闭命令、电源关闭命令等;统计空闲模块的动态功耗和静态功耗;记录空闲模块的动态功耗和静态功耗,以及生成第一图表和第二图表。
GPU驱动可以是用于驱动GPU硬件的软件。GPU驱动可以用于:接收上层(包括功耗分析工具)的命令;通过与系统管理单元交互,完成上层的命令需求。
系统管理单元可以用于:与GPU驱动通信;控制时钟门控模块开关模块的时钟信号;控制电源门控模块开关模块的电源;控制外设接口模块与外部的功耗监控器件交互,以读取GPU的总功耗。
时钟门控模块可以用于:控制各模块的时钟信号的开关。
电源门控模块可以用于:控制各模块的电压的开关。
外设接口模块可以用于:与外部的功耗监控器件交互,以读取GPU的总功耗。
功耗监控器件可以用于:读取供电模块的供电功耗,即GPU的总功耗。
供电模块可以用于:给GPU供电。
下面结合图4对功耗分析方法的流程进行示例性的介绍:
在步骤一中,功耗分析工具可以向GPU驱动发送空闲状态查询消息。
在步骤二中,GPU驱动可以响应于GPU处于空闲状态,向功耗分析工具返回GPU处于空闲状态的消息以及空闲模块的信息,并进入步骤四。
在步骤三中,GPU驱动可以响应于GPU不处于空闲状态,向功耗分析工具返回GPU不处于空闲状态的消息,并返回步骤一。
在步骤四中,功耗分析工具可以向GPU驱动发送第一功耗读取命令,GPU驱动可以向系统管理单元发送转发第一功耗读取命令。系统管理单元可以响应于第一功耗读取命令,通过外设接口模块与功耗监控器件交互,以读取GPU的第一功耗。系统管理单元可以响应于读取到第一功耗,向GPU驱动返回第一功耗。GPU驱动可以向功耗分析工具返回第一功耗。功耗分析工具可以记录第一功耗。例如,第一功耗可以采用P1表示。
在步骤五中,对于GPU中的任一空闲模块,功耗分析工具可以向GPU驱动发送所述空闲模块对应的时钟关闭命令。GPU驱动可以向系统管理单元转发所述空闲模块对应的时钟关闭命令。系统管理单元可以响应于所述空闲模块对应的时钟关闭命令,通过时钟门控模块关闭所述空闲模块的时钟信号。
在步骤六中,功耗分析工具可以向GPU驱动发送第二功耗读取命令。GPU驱动可以向系统管理单元转发第二功耗读取命令。系统管理单元可以响应于第二功耗读取命令,从功耗监控器件读取GPU的第二功耗。系统管理单元可以向GPU驱动返回第二功耗。GPU驱动可以向功耗分析工具返回第二功耗。功耗分析工具可以记录第二功耗。功耗分析工具可以计算第一功耗与第二功耗的差值,得到所述空闲模块的动态功耗。例如,第二功耗可以采用P2表示,所述空闲模块的动态功耗Pdynamic=P1-P2。
在步骤七中,功耗分析工具可以向GPU驱动发送所述空闲模块对应的电源关闭命令。GPU驱动可以向系统管理单元转发所述空闲模块对应的电源关闭命令。系统管理单元可以响应于所述空闲模块对应的电源关闭命令,通过电源门控模块关闭所述空闲模块的电源。
在步骤八中,功耗分析工具可以向GPU驱动发送第三功耗读取命令。GPU驱动可以向系统管理单元转发第三功耗读取命令。系统管理单元可以响应于第三功耗读取命令,从功耗监控器件读取GPU的第三功耗。系统管理单元可以向GPU驱动返回第三功耗。GPU驱动可以向功耗分析工具返回第三功耗。功耗分析工具可以记录第三功耗。功耗分析工具可以计算第二功耗与第三功耗的差值,得到所述空闲模块的静态功耗。例如,第三功耗可以采用P3表示,所述空闲模块的静态功耗Pstatic=P2-P3。
在步骤九中,重复步骤四至步骤八,直至完成所有空闲模块的动态功耗和静态功耗的统计。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
此外,本公开还提供了功耗分析装置、电子设备、计算机可读存储介质、计算机程序产品,上述均可用来实现本公开提供的任一种功耗分析方法,相应技术方案和技术效果可参见方法部分的相应记载,不再赘述。
图5示出本公开实施例提供的功耗分析装置的框图。所述功耗分析装置应用于功耗分析系统。如图5所示,所述功耗分析装置包括:
第一功耗读取模块51,用于响应于GPU处于空闲状态,读取所述GPU的第一功耗;
第二功耗读取模块52,用于对于所述GPU中的任一空闲模块,关闭所述空闲模块的时钟信号,并读取所述GPU的第二功耗,其中,所述第二功耗表示关闭所述空闲模块的时钟信号后所述GPU的总功耗;
动态功耗计算模块53,用于基于所述第一功耗与所述第二功耗得到所述空闲模块的动态功耗;
第三功耗读取模块54,用于关闭所述空闲模块的电源,并读取所述GPU的第三功耗,其中,所述第三功耗表示关闭所述空闲模块的时钟信号和电源后所述GPU的总功耗;
静态功耗计算模块55,用于基于所述第二功耗与所述第三功耗得到所述空闲模块的静态功耗。
在一种可能的实现方式中,所述功耗分析系统包括功耗分析工具、GPU驱动和系统管理单元,其中,
所述功耗分析工具用于向所述GPU驱动发送预设指令;
所述GPU驱动用于向所述系统管理单元发送所述预设指令;
所述系统管理单元用于响应于所述预设指令,执行所述预设指令对应的预设操作。
在一种可能的实现方式中,所述预设指令为时钟关闭指令,所述功耗分析系统还包括时钟门控模块,所述第二功耗读取模块52具体用于:
利用所述系统管理单元响应于所述空闲模块对应的时钟关闭命令,通过所述时钟门控模块关闭所述空闲模块的时钟信号。
在一种可能的实现方式中,所述预设指令为电源关闭指令,所述功耗分析系统还包括电源门控模块,所述第三功耗读取模块54具体用于:
利用所述系统管理单元响应于所述空闲模块对应的电源关闭命令,通过所述电源门控模块关闭所述空闲模块的电源。
在一种可能的实现方式中,所述预设指令为功耗读取指令,所述功耗分析系统还包括功耗监控器件,所述第一功耗读取模块51、所述第二功耗读取模块52或者所述第三功耗读取模块54具体用于:
利用所述系统管理单元响应于功耗读取命令,从所述功耗监控器件读取所述GPU的目标功耗,其中,所述目标功耗包括所述第一功耗、所述第二功耗和所述第三功耗中的至少之一。
在一种可能的实现方式中,所述功耗分析系统还包括外设接口模块,所述第一功耗读取模块51、所述第二功耗读取模块52或者所述第三功耗读取模块54具体用于:
利用系统管理单元响应于功耗读取命令,通过所述外设接口模块,从所述功耗监控器件读取所述GPU的目标功耗。
在一种可能的实现方式中,所述装置还包括:
空闲模块查询模块,用于利用GPU驱动响应于所述GPU处于空闲状态,向功耗分析工具返回空闲模块的信息。
在一种可能的实现方式中,所述装置还包括:
第一图表生成模块,用于根据所述GPU中的各个空闲模块的静态功耗,生成第一图表,其中,所述第一图表至少用于展示所述各个空闲模块的静态功耗在所有空闲模块的静态功耗中的占比;
和/或,
第二图表生成模块,用于根据所述GPU中的各个空闲模块的动态功耗,生成第二图表,其中,所述第二图表至少用于展示所述各个空闲模块的动态功耗在所有空闲模块的动态功耗中的占比。
在一种可能的实现方式中,所述装置还包括:
第一低功耗状态处理模块,用于响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗满足预设的低功耗条件,关闭所述空闲模块的时钟信号;
或者,
第二低功耗状态处理模块,用于响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗不满足所述预设的低功耗条件,关闭所述空闲模块的时钟信号和电源。
在一种可能的实现方式中,所述预设的低功耗条件为:
所述空闲模块的静态功耗在所有空闲模块的静态功耗中的占比小于或等于预设比例;
或者,
所述空闲模块的静态功耗小于或等于预设功耗。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现和技术效果可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。其中,所述计算机可读存储介质可以是非易失性计算机可读存储介质,或者可以是易失性计算机可读存储介质。
本公开实施例还提出一种计算机程序,包括计算机可读代码,当所述计算机可读代码在电子设备中运行时,所述电子设备中的处理器执行上述方法。
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备中运行时,所述电子设备中的处理器执行上述方法。
本公开实施例还提供一种电子设备,包括:一个或多个处理器,其中,所述一个或多个处理器包括GPU;用于存储可执行指令的存储器;其中,所述一个或多个处理器被配置为调用所述存储器存储的可执行指令,以执行上述方法。
在一种可能的实现方式中,所述GPU包括系统管理单元、时钟门控模块、电源门控模块和外设接口模块,其中,所述系统管理单元分别与GPU驱动、所述时钟门控模块、所述电源门控模块和所述外设接口模块连接。
电子设备可以被提供为终端、服务器或其它形态的设备。
图6示出本公开实施例提供的电子设备1900的框图。例如,电子设备1900可以被提供为一服务器或一终端。参照图6,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入/输出接口1958(I/O接口)。电子设备1900可以操作基于存储在存储器1932的操作系统,例如微软服务器操作系统(Windows ServerTM),苹果公司推出的基于图形用户界面操作系统(MacOS XTM),多用户多进程的计算机操作系统(UnixTM),自由和开放原代码的类Unix操作系统(LinuxTM),开放原代码的类Unix操作系统(FreeBSDTM)或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
若本公开实施例的技术方案涉及个人信息,应用本公开实施例的技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本公开实施例的技术方案涉及敏感个人信息,应用本公开实施例的技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (14)
1.一种功耗分析方法,其特征在于,应用于功耗分析系统,包括:
响应于GPU处于空闲状态,读取所述GPU的第一功耗;
对于所述GPU中的任一空闲模块,关闭所述空闲模块的时钟信号,并读取所述GPU的第二功耗,其中,所述第二功耗表示关闭所述空闲模块的时钟信号后所述GPU的总功耗;
基于所述第一功耗与所述第二功耗得到所述空闲模块的动态功耗;
关闭所述空闲模块的电源,并读取所述GPU的第三功耗,其中,所述第三功耗表示关闭所述空闲模块的时钟信号和电源后所述GPU的总功耗;
基于所述第二功耗与所述第三功耗得到所述空闲模块的静态功耗。
2.根据权利要求1所述的方法,其特征在于,所述功耗分析系统包括功耗分析工具、GPU驱动和系统管理单元,其中,
所述功耗分析工具用于向所述GPU驱动发送预设指令;
所述GPU驱动用于向所述系统管理单元发送所述预设指令;
所述系统管理单元用于响应于所述预设指令,执行所述预设指令对应的预设操作。
3.根据权利要求2所述的方法,其特征在于,所述预设指令为时钟关闭指令,所述功耗分析系统还包括时钟门控模块,所述关闭所述空闲模块的时钟信号,包括:
利用所述系统管理单元响应于所述空闲模块对应的时钟关闭命令,通过所述时钟门控模块关闭所述空闲模块的时钟信号。
4.根据权利要求2所述的方法,其特征在于,所述预设指令为电源关闭指令,所述功耗分析系统还包括电源门控模块,所述关闭所述空闲模块的电源,包括:
利用所述系统管理单元响应于所述空闲模块对应的电源关闭命令,通过所述电源门控模块关闭所述空闲模块的电源。
5.根据权利要求2所述的方法,其特征在于,所述预设指令为功耗读取指令,所述功耗分析系统还包括功耗监控器件,所述GPU的功耗读取过程,包括:
利用所述系统管理单元响应于功耗读取命令,从所述功耗监控器件读取所述GPU的目标功耗,其中,所述目标功耗包括所述第一功耗、所述第二功耗和所述第三功耗中的至少之一。
6.根据权利要求5所述的方法,其特征在于,所述功耗分析系统还包括外设接口模块,所述利用系统管理单元响应于功耗读取命令,从所述功耗监控器件读取所述GPU的目标功耗,包括:
利用系统管理单元响应于功耗读取命令,通过所述外设接口模块,从所述功耗监控器件读取所述GPU的目标功耗。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用GPU驱动响应于所述GPU处于空闲状态,向功耗分析工具返回空闲模块的信息。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述GPU中的各个空闲模块的静态功耗,生成第一图表,其中,所述第一图表至少用于展示所述各个空闲模块的静态功耗在所有空闲模块的静态功耗中的占比;
和/或,
根据所述GPU中的各个空闲模块的动态功耗,生成第二图表,其中,所述第二图表至少用于展示所述各个空闲模块的动态功耗在所有空闲模块的动态功耗中的占比。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗满足预设的低功耗条件,关闭所述空闲模块的时钟信号;
或者,
响应于进入预设的低功耗状态的指令,且所述空闲模块的静态功耗不满足所述预设的低功耗条件,关闭所述空闲模块的时钟信号和电源。
10.根据权利要求9所述的方法,其特征在于,所述预设的低功耗条件为:
所述空闲模块的静态功耗在所有空闲模块的静态功耗中的占比小于或等于预设比例;
或者,
所述空闲模块的静态功耗小于或等于预设功耗。
11.一种功耗分析装置,其特征在于,应用于功耗分析系统,包括:
第一功耗读取模块,用于响应于GPU处于空闲状态,读取所述GPU的第一功耗;
第二功耗读取模块,用于对于所述GPU中的任一空闲模块,关闭所述空闲模块的时钟信号,并读取所述GPU的第二功耗,其中,所述第二功耗表示关闭所述空闲模块的时钟信号后所述GPU的总功耗;
动态功耗计算模块,用于基于所述第一功耗与所述第二功耗得到所述空闲模块的动态功耗;
第三功耗读取模块,用于关闭所述空闲模块的电源,并读取所述GPU的第三功耗,其中,所述第三功耗表示关闭所述空闲模块的时钟信号和电源后所述GPU的总功耗;
静态功耗计算模块,用于基于所述第二功耗与所述第三功耗得到所述空闲模块的静态功耗。
12.一种电子设备,其特征在于,包括:
一个或多个处理器,其中,所述一个或多个处理器包括GPU;
用于存储可执行指令的存储器;
其中,所述一个或多个处理器被配置为调用所述存储器存储的可执行指令,以执行权利要求1至10中任意一项所述的方法。
13.根据权利要求12所述的电子设备,其特征在于,所述GPU包括系统管理单元、时钟门控模块、电源门控模块和外设接口模块,其中,所述系统管理单元分别与GPU驱动、所述时钟门控模块、所述电源门控模块和所述外设接口模块连接。
14.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至10中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311628663.3A CN117632650A (zh) | 2023-11-30 | 2023-11-30 | 功耗分析方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311628663.3A CN117632650A (zh) | 2023-11-30 | 2023-11-30 | 功耗分析方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117632650A true CN117632650A (zh) | 2024-03-01 |
Family
ID=90028273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311628663.3A Pending CN117632650A (zh) | 2023-11-30 | 2023-11-30 | 功耗分析方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117632650A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114879829A (zh) * | 2022-07-08 | 2022-08-09 | 摩尔线程智能科技(北京)有限责任公司 | 功耗管理方法、装置、电子设备、图形处理器及存储介质 |
CN115757014A (zh) * | 2022-10-18 | 2023-03-07 | 鼎道智联(北京)科技有限公司 | 一种功耗测试方法及装置 |
CN115932544A (zh) * | 2022-12-07 | 2023-04-07 | 长沙景嘉微电子股份有限公司 | 一种gpu芯片功耗自动化测试的装置和方法 |
CN116974868A (zh) * | 2023-06-29 | 2023-10-31 | 上海登临科技有限公司 | 芯片功耗估计装置、方法、电子设备及存储介质 |
-
2023
- 2023-11-30 CN CN202311628663.3A patent/CN117632650A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114879829A (zh) * | 2022-07-08 | 2022-08-09 | 摩尔线程智能科技(北京)有限责任公司 | 功耗管理方法、装置、电子设备、图形处理器及存储介质 |
CN115757014A (zh) * | 2022-10-18 | 2023-03-07 | 鼎道智联(北京)科技有限公司 | 一种功耗测试方法及装置 |
CN115932544A (zh) * | 2022-12-07 | 2023-04-07 | 长沙景嘉微电子股份有限公司 | 一种gpu芯片功耗自动化测试的装置和方法 |
CN116974868A (zh) * | 2023-06-29 | 2023-10-31 | 上海登临科技有限公司 | 芯片功耗估计装置、方法、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11288102B2 (en) | Modifying resources for composed systems based on resource models | |
CN109740732B (zh) | 神经网络处理器、卷积神经网络数据复用方法及相关设备 | |
US10592207B2 (en) | Dynamic variable precision computation | |
JP6676126B2 (ja) | コンピュータシステム、プログラミング方法及び非一時的なコンピュータ読取可能な媒体 | |
US10067551B2 (en) | Power state transition analysis | |
CN109840142A (zh) | 基于云监控的线程控制方法、装置、电子设备及存储介质 | |
US10921870B2 (en) | System and method for hybrid power supply | |
CN107291950B (zh) | 表单数据更新方法、装置及计算机设备 | |
CN104503932A (zh) | 多主板服务器主基板管理控制器仲裁方法及系统 | |
CN107203425B (zh) | 轻应用的切换方法、设备及电子设备 | |
CN111142644A (zh) | 一种硬盘运行控制方法、装置及相关组件 | |
CN104424122A (zh) | 一种电子设备及内存划分方法 | |
CN108959139A (zh) | 一种cpld管脚复用方法与装置 | |
CN117370523A (zh) | 大语言模型应用服务方法及装置 | |
CN111625949A (zh) | 一种仿真引擎系统、仿真处理方法、设备和介质 | |
WO2024131784A1 (zh) | 图形处理器的功耗控制方法、装置、设备、介质和程序产品 | |
CN117632650A (zh) | 功耗分析方法、装置、电子设备和存储介质 | |
CN112817660A (zh) | 扩展小程序能力的方法、装置、设备以及存储介质 | |
CN112131160B (zh) | 工作模式切换电路、工作模式切换方法和机器人 | |
CN115618782A (zh) | 局部降电压的集成电路物理实现方法、装置和计算机设备 | |
US9654365B2 (en) | Selection of message passing collectives in presence of system noise | |
CN115061895A (zh) | 业务流程编排方法、装置、电子设备及存储介质 | |
KR102504939B1 (ko) | 클라우드 기반 딥러닝 작업의 수행시간 예측 시스템 및 방법 | |
US20130166939A1 (en) | Apparatus, system, and method for providing clock signal on demand | |
CN105138666A (zh) | 一种数据处理的方法及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |