CN115391124A - 一种面向图形芯片功耗测试的方法及装置 - Google Patents

一种面向图形芯片功耗测试的方法及装置 Download PDF

Info

Publication number
CN115391124A
CN115391124A CN202211321713.9A CN202211321713A CN115391124A CN 115391124 A CN115391124 A CN 115391124A CN 202211321713 A CN202211321713 A CN 202211321713A CN 115391124 A CN115391124 A CN 115391124A
Authority
CN
China
Prior art keywords
chip
test
graphics
power consumption
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211321713.9A
Other languages
English (en)
Other versions
CN115391124B (zh
Inventor
洪焱
贺秋丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hanbo Semiconductor Shanghai Co ltd
Original Assignee
Hanbo Semiconductor Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanbo Semiconductor Shanghai Co ltd filed Critical Hanbo Semiconductor Shanghai Co ltd
Priority to CN202211321713.9A priority Critical patent/CN115391124B/zh
Publication of CN115391124A publication Critical patent/CN115391124A/zh
Application granted granted Critical
Publication of CN115391124B publication Critical patent/CN115391124B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/2236Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test CPU or processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明提供一种面向图形芯片功耗测试的方法及装置,该方法包括:初始化图形处理器芯片的时钟、帧资源和固件以开始执行;配置图形内核的页表寄存器并使图形内核执行该测试帧;判断测试帧的执行次数是否满足预定次数,当测试帧的执行次数满足预定次数时,结束执行,当测试帧的执行次数不满足预定次数时,重置存放在图形处理器芯片存储单元中的最小数据集,该最小数据集包括环形缓冲区指针与Fence,然后返回测试,直至测试帧的执行次数达到预定次数。本发明所提供的技术方案用于对芯片进行批量筛选,以筛选出符合功耗要求的芯片。

Description

一种面向图形芯片功耗测试的方法及装置
技术领域
本发明涉及图形芯片功耗测试领域,特别涉及一种面向图形芯片功耗测试的方法及装置。
背景技术
图形处理器芯片(Graphic Process Unit,GPU)因其大规模并行计算能力以及图形渲染能力,在人工智能、大数据和游戏娱乐等领域得到了越来越广泛的应用。
然而,无论是个人设备还是服务器端,由GPU构成的系统均存在严格的功耗要求,因此GPU在设计之初便制定了功耗上限,在运行全过程中GPU均需贯彻这一限制,这就对量产芯片如何从功耗限制的角度进行筛片提出了更高的要求。
通常而言,对一般的量产芯片进行筛片主要有两种方式来限制功耗,一种方式是利用常温静态电流的上限来筛片,另一种方式是利用片上集成的监测进程(process)快慢的振荡电路环来筛片。但是,由于图形处理器芯片的功耗限制比一般芯片更加严格,因此对于图形处理器芯片而言仅采用上述两种方式是无法满足筛片需求的。
在前述情况下,为满足图形处理器芯片的筛片需求,需要在测试机台上测量芯片在给定电压频率下的真实功耗(power),并预测芯片在系统真实应用中的功耗。
进一步地,为满足功耗测试需求,对在测试机台上测试图形处理器芯片核心的功耗存在如下要求:
(1)GPU需执行尽可能重的工作负荷,以达成芯片内部大范围、高速率地翻转;
(2)电流测量窗口在2~10ms区间,对于以吉赫兹(109Hz)工作的GPU而言,该窗口意味着百万时钟周期的持续运行。
然而,上述利用测试机台进行筛片的方式还存在如下技术问题:
(1)测试机台和单芯片构成的环境,无外围的大规模存储器可用,也无驱动、操作系统等软件层面的支持,这使得GPU无法运行真实的应用;
(2)2~10ms的测试时间意味着GPU需要运行很多帧,而每个帧资源从准备、接收命令直至开始运行均需要比较长的时间,在这段时间内GPU核心处于空闲状态,无法得到有效利用;
(3)GPU的工作频率在吉赫兹(109Hz),而芯片JTAG口的工作频率在数十兆赫兹(106Hz),二者工作频率的巨大差异使得测试机台与GPU交互需花费大量时间。
发明内容
鉴于此,本发明提供了一种面向图形芯片功耗测试的方法及装置。
根据本发明的一个方面,提供了一种面向图形芯片功耗测试的方法,用于测试机台对图形处理器芯片进行功耗测试,该方法包括:初始化步骤,该测试机台初始化图形处理器芯片的时钟,将包括测试帧的测试资源下载至该图形处理器芯片中;配置步骤,该图形处理器芯片配置图形内核的页表寄存器;测试步骤,该图形内核执行该测试帧;判断步骤,判断该测试帧的执行次数是否达到预定次数,当该测试帧的执行次数达到预定次数时,结束执行;当该测试帧的执行次数未达到预定次数时,重置存放在该图形处理器芯片的存储单元中的最小数据集,然后重新依次执行该测试步骤和该判断步骤;其中,该最小数据集包括环形命令缓冲区指针以及Fence。
根据本发明的另一个方面,提供了一种面向图形芯片功耗测试的装置,用于测试机台对图形处理器芯片进行功耗测试,该装置包括:初始化模块,被配置用于使得该测试机台将包括测试帧的测试资源下载至该图形处理器芯片中;配置模块,被配置用于使得该图形处理器芯片对图形内核的页表寄存器进行配置;测试模块,被配置用于使得该图形内核执行该测试帧;判断模块,被配置用于判断该测试帧的执行次数是否达到预定次数,当该测试帧的执行次数达到预定次数时,结束执行;当该测试帧的执行次数未达到预定次数时,重置存放在该图形处理器芯片的存储单元中的最小数据集,然后重新依次执行该测试模块和该判断模块;其中,该最小数据集包括环形命令缓冲区指针以及Fence。
根据本发明的又另一方面,提供了一种电子设备,该电子设备包括一个或多个处理器,还包括用于存储可执行指令的存储器,该一个或多个处理器被配置为经由该可执行指令来实现上述方法的操作。
根据本发明的再另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,使处理器执行上述的方法。
根据本发明的再另一方面,提供了一种计算机程序产品,其包括计算机程序,该计算机程序被处理器执行时,使处理器执行上述的方法。
从以上技术方案可以看出,本发明所提供的技术方案至少存在以下优点:
仅在帧间重置最小数据集(环形命令缓冲区的指针和Fence),并重复运行该测试帧,减少了帧与帧之间GPU核心空闲等待的时间,显著地提升了GPU繁忙时间与空闲时间的比值,从而推高了GPU功耗,更有利于功耗的测试和筛选。
本发明的其它特征和优点将在随后的说明书中阐述,或者通过实施本发明的具体实施例而了解。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明的技术方案,但并不构成对本发明技术方案的限制。
图1示出了本发明所提供的面向图形芯片功耗测试的方法的流程图;
图2示出了本发明中预处理步骤的流程图;
图3示出了本发明所提供的面向图形芯片功耗测试的装置的模块图;
图4示出了本发明中预处理模块的模块图。
具体实施方式
下面将参照附图来详细描述本发明的各种示例性实施例。对示例性实施例的描述仅仅是说明性的,并不作为对本发明及其应用或使用的任何限制。本发明可以以许多不同的形式实现,不限于这里所述的实施例。提供这些实施例是为了使本发明透彻且完整,并且向本领域技术人员充分表达本发明的范围。
除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。如本说明书使用的,术语“多个”意指两个或更多,并且术语“基于”应解释为“至少部分地基于”。此外,术语“和/或”以及“……中的至少一个”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
另外,本说明书中有涉及“第一”、“第二”等的描述,该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。
本发明提出一种面向图形芯片功耗测试的方法,该方法能够应用于测试机台对图形处理器芯片(GPU)进行功耗测试,该方法能够实现对测试帧的快速重复,从而减少了帧间图形处理器芯片核心空闲等待的时间,有利于图形处理器芯片的功耗测量。
下面将结合附图详细描述本发明的实施例。
请参考图1,其示出了本发明所提供的面向图形芯片功耗测试的方法的流程图。
方法用于使用测试机台对图形处理器芯片进行功耗测试,该方法包括初始化步骤、配置步骤、测试步骤以及判断步骤。在一个实施例中,测试机台对所述图形处理器芯片的操作优选地由设置在图形处理器芯片的片上静态随机存取存储器(SRAM)以及片上微处理器(MCU)进行实现,此时将片上静态随机存取存储器作为存储单元,并且该片上静态随机存取存储器足以支持一帧(512×512分辨率)的帧资源;片上微处理器的功能由代码固件进行实现。
本领域技术人员应当知道,在一个512×512分辨率的图形处理器芯片单帧的激励下,图形处理器芯片内部的可编程着色器、纹理单元等硬件模块能够被充分调动,从而使得图形处理器芯片在接近满负荷的状态下工作。在芯片流片前的仿真/验证阶段,前述单帧激励能够使得图形处理器芯片工作的区间获得超过Graphic BenchMark的平均功耗,从而更有利于进行功耗测试。
在初始化步骤中,测试机台将包括测试帧的测试资源下载至图形处理器芯片中。
其中,该初始化步骤又进一步包括以下步骤:
首先,测试机台初始化图形处理器芯片的时钟并将所述测试资源下载至图形处理器芯片的片上静态随机存取存储器中。其中,测试资源包括用于测试的测试帧以及用于片上微处理器运行的代码固件。
然后,测试机台对片上微处理器解除复位以使得片上微处理器开始执行。
在配置步骤中,设置在图形处理器芯片的片上微处理器将对图形内核的页表寄存器进行配置。图形内核的页表寄存器配置完成后,配置步骤即完成。
在测试步骤中,图形内核将执行该测试帧。
在前述测试帧执行结束后则进入判断步骤,此时片上微处理器对测试帧的执行次数进行计数并判断当前的执行次数是否达到预定次数。若测试帧的执行次数达到预定次数时,结束执行;若测试帧的执行次数未达到预定次数时,重置存放在图形处理器芯片的片上静态随机存取存储器(SRAM)中的最小数据集,然后返回执行测试步骤并重新依次执行前述测试步骤和判断步骤。
其中,前述最小数据集包括环形命令缓冲区指针以及Fence,该最小数据集由图形处理器芯片的片上微处理器(MCU)进行重置。
本领域技术人员应当理解的是,由于在帧间仅重置了最小数据集,因此在重复执行时,每次执行所采用的测试帧均使用与最初的测试帧相同的SRAM地址,每次执行所采用的测试帧的图形也输出到相同的SRAM地址,并且使用相同的页表寄存器配置。
此外,本领域技术人员还应当知道,单帧测试帧在SRAM中运行时,图形处理器芯片运转约3万个时钟周期。以图形处理器芯片时钟频率吉赫兹(109Hz)计,图形处理器芯片在该单帧测试帧中的执行时间为数十微秒(μs)。而在功耗测试需求中,电流测量窗口的持续时长范围优选为2~10ms,因此优选地可以将执行测试帧的预定次数设置为100次,这样即能够满足功耗测试需求中对电流测量窗口持续时长的要求。
优选地,用于进行帧间重置的最小数据集可由预处理步骤确定。
以下部分将结合附图详细说明前述确定用于进行帧间重置的最小数据集的预处理步骤,该预处理步骤包括获取步骤、抽取步骤、统计步骤以及收集步骤。
请参考图2,其示出了本发明中预处理步骤的流程图。
获取步骤:在芯片的前仿/验证阶段,运行测试帧激励,以获取该测试帧激励的仿真波形;
抽取步骤:抽取所获取的仿真波形中存储单元的地址信号;
统计步骤:对存储单元的地址信号范围中每一页的资源项的读写记录进行统计;
收集步骤:从读写记录中收集被既读又写的资源项,前述被既读又写的资源项即构成帧间重置的最小数据集。
如下表1示出了前述统计步骤中部分资源项的访问统计结果:
Figure 65746DEST_PATH_IMAGE002
表1 各资源项访问统计表(部分)。
本领域技术人员应当理解,需要帧间重置的数据,是在帧内执行过程中被图形处理器芯片既读又写的资源项,因此由前述表1中每个资源项的访问属性(读、写、读或写、读和写)即可知道哪些数据需要被帧间重置。
其中,资源项MMU PC:Page Catalog、MMU PD:Page Directory以及MMU PT:PageTable表示第一至三级页表,各级页表分别占用4K空间,由于其仅被图形处理器芯片读取,因此在前后帧之间无需重置。
PMR 66:Frame Image表示由图形处理器芯片输出的像素构成的图形,由于其仅被图形处理器芯片写入,因此在前后帧之间也无需重置。
PMR 18:Kernel Ring Buffer Control、PMR81:Geometry Ring Buffer Control、PMR84:3D Ring Buffer Control分别表示三种环形命令缓冲区的指针,由于其在帧内的执行过程中被图形处理器芯片既读又写,从而在运行下一帧之前必须得到恢复,因此必须在前后帧之间重置。
PMR119:Firmware External Fence、PMR134:Firmware External Fence表示CPU和图形处理器芯片交互的状态变量,由于其在帧内的执行过程中被图形处理器芯片既读又写,因此也必须在前后帧之间重置。
由上述分析可知,需要进行帧间重置的数据集如下表2所示:
Figure DEST_PATH_IMAGE003
表2 需要帧间重置的数据集。
对表2中的项目进行归纳可知,帧间重置的最小数据集是环形命令缓冲区的指针和Fence, 该最小数据集共计仅64字节。
表3分别示出了背景技术中的技术方案与本发明所提供的技术方案的实验数据,在芯片仿真/验证时统计该两种技术方案的时钟周期数并进行比较,可以得到:
Figure 61515DEST_PATH_IMAGE004
表3 不同技术方案的时钟周期统计表。
由表3中的内容可知,本发明所提供的技术方案极大地减少了帧间间隔,显著地提升了图形处理器芯片繁忙时间与空闲时间的比值。由此使得本发明所提供的技术方案能够推高图形处理器芯片的功耗,从而利于图形芯片功耗的测试和筛选。
请参考图3至图4,其分别示出了本发明所提供的面向图形芯片功耗测试的装置以及预处理模块的模块图。
本发明所提供的面向图形芯片功耗测试的装置,用于测试机台对图形处理器芯片进行功耗测试,该测试装置包括初始化模块、配置模块、测试模块、判断模块以及帧间重置模块。
具体而言,初始化模块被配置用于使得测试机台将包括测试帧的测试资源下载至图形处理器芯片中,然后开始执行图形处理器芯片;配置模块被配置用于使得图形处理器芯片对图形内核的页表寄存器进行配置;测试模块被配置用于使得图形内核执行测试帧;判断模块被配置用于在测试帧执行结束后,判断测试帧的执行次数是否达到预定次数,当测试帧的执行次数达到预定次数时,结束执行,当测试帧的执行次数未达到预定次数时,重置存放在图形处理器芯片的存储单元中的最小数据集,该最小数据集包括环形命令缓冲区指针以及Fence,然后返回测试模块,并重新依次执行该测试模块与判断模块。
前述预定次数优选地可设置为100次,以使得执行测试帧执行进行测试的总时长持续2~10ms。
优选地,图形处理器芯片还设置有片上静态随机存取存储器以及片上微处理器,片上微处理器的功能由代码固件进行实现。
在前述情况下,配置模块被配置用于使得图形处理器芯片的片上微处理器对图形内核的页表寄存器进行配置;图形处理器芯片的片上微处理器重置最小数据集。
优选地,初始化模块可以执行以下操作:
首先,测试机台初始化图形处理器芯片的时钟并将所述测试资源下载至图形处理器芯片的片上静态随机存取存储器中。
测试资源包括用于测试的测试帧以及用于片上微处理器运行的代码固件。
然后,测试机台对片上微处理器解除复位以使得片上微处理器开始执行。
在一个优选实施例中,最小数据集由预处理模块确定,预处理模块包括获取模块、抽取模块、统计模块以及收集模块。进一步地,获取模块被配置用于获取测试帧的仿真波形,抽取模块被配置用于抽取仿真波形中存储单元的地址信号、统计模块被配置用于统计地址信号范围内的每一页的资源项的读写记录,以及收集模块被配置用于收集读写记录中被既读又写的资源项。
如前所述的,被既读又写的资源项为环形命令缓冲区指针和Fence,因此环形命令缓冲区指针和Fence构成最小数据集。
应当理解,图3-4中所示的装置的各个模块可以与参考图1-2描述的方法中的各个步骤相对应。由此,上面针对方法描述的操作、特征和优点同样适用于装置及其包括的模块。为了简洁起见,某些操作、特征和优点在此不再赘述。
虽然上面参考特定模块讨论了特定功能,但是应当注意,本发明讨论的各个模块的功能可以分为多个模块,和/或多个模块的至少一些功能可以组合成单个模块。本发明讨论的特定模块执行动作包括该特定模块本身执行该动作,或者由该特定模块调用或以其他方式访问执行该动作(或结合该特定模块一起执行该动作)的另一个组件或模块。因此,执行动作的特定模块可以包括执行动作的该特定模块本身和/或该特定模块调用或以其他方式访问的、执行动作的另一模块。
本发明还提供了一种电子设备,该电子设备包括一个或多个处理器以及用于存储可执行指令存储器。其中,该一个或多个处理器被配置为经由可执行指令来实现上述面向图形芯片功耗测试的方法。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,使得处理器执行上述面向图形芯片功耗测试的方法。
本发明还提供了一种计算机程序产品,其包括计算机程序,该计算机程序被处理器执行时,使得处理器执行上述面向图形芯片功耗测试的方法。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分也可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。
本领域技术人员应能理解,计算机程序指令在计算机可读介质中的存在形式包括但不限于源文件、可执行文件、安装包文件等。相应地,计算机程序指令被计算机执行的方式包括但不限于:该计算机直接执行该指令,或者该计算机编译该指令后再执行对应的编译后程序,或者该计算机读取并执行该指令,或者该计算机读取并安装该指令后再执行对应的安装后程序。在此,计算机可读介质可以是可供计算机访问的任意可用的计算机可读存储介质或通信介质。
作为示例而非限制,计算机可读存储介质可包括以用于存储例如计算机可读指令、数据结构、程序模块或其它数据的信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动的介质。例如,计算机可读存储介质包括但不限于,易失性存储器,例如随机存储器(RAM、DRAM、SRAM);以及非易失性存储器,例如闪存、各种只读存储器(ROM、PROM、EPROM、EEPROM)、磁性和铁磁/铁电存储器(MRAM、FeRAM);以及磁性和光学存储设备(硬盘、磁带、CD、DVD);或其它已知的介质或今后开发的能够存储供计算机系统使用的计算机可读信息/数据。
虽然在附图和前面的描述中已经详细地说明和描述了本发明,但是这样的说明和描述应当被认为是说明性的和示意性的,而非限制性的;对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,本发明所要求保护的范围由权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵盖在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。

Claims (21)

1.一种面向图形芯片功耗测试的方法,用于测试机台对图形处理器芯片进行功耗测试,其特征在于,所述方法包括:
初始化步骤,所述测试机台将包括测试帧的测试资源下载至所述图形处理器芯片中;
配置步骤,所述图形处理器芯片配置图形内核的页表寄存器;
测试步骤,所述图形内核执行所述测试帧;
判断步骤,判断所述测试帧的执行次数是否达到预定次数,当所述测试帧的执行次数达到预定次数时,结束执行;当所述测试帧的执行次数未达到预定次数时,重置存放在所述图形处理器芯片的存储单元中的最小数据集,然后重新依次执行所述测试步骤和所述判断步骤;
其中,所述最小数据集包括环形命令缓冲区指针以及Fence。
2.根据权利要求1所述的面向图形芯片功耗测试的方法,其特征在于,所述图形处理器芯片的存储单元为片上静态随机存取存储器,所述图形处理器芯片上还设置有片上微处理器,所述片上微处理器的功能由代码固件进行实现。
3.根据权利要求1所述的面向图形芯片功耗测试的方法,其特征在于,所述初始化步骤中,所述测试机台初始化所述图形处理器芯片的时钟并将所述测试资源下载至所述图形处理器芯片的片上静态随机存取存储器中,所述测试资源包括所述测试帧与所述代码固件,然后所述测试机台对所述片上微处理器解除复位以使得所述片上微处理器开始执行。
4.根据权利要求2所述的面向图形芯片功耗测试的方法,其特征在于,所述图形处理器芯片的片上微处理器对所述图形内核的页表寄存器进行配置。
5.根据权利要求1所述的面向图形芯片功耗测试的方法,其特征在于,所述测试帧的执行次数的预定次数为100次,以使得测试总时长的持续范围为2~10ms。
6.根据权利要求2所述的面向图形芯片功耗测试的方法,其特征在于,所述图形处理器芯片的片上微处理器重置所述最小数据集。
7.根据权利要求1所述的面向图形芯片功耗测试的方法,其特征在于,所述最小数据集由预处理步骤确定,所述预处理步骤包括获取步骤、抽取步骤、统计步骤以及收集步骤。
8.根据权利要求7所述的面向图形芯片功耗测试的方法,其特征在于,在所述获取步骤中,获取所述测试帧的仿真波形;在所述抽取步骤中,抽取仿真波形中存储单元的地址信号;在所述统计步骤中,统计地址信号范围内的每一页的资源项的读写记录;以及在所述收集步骤中,从读写记录中收集被既读又写的资源项。
9.根据权利要求8所述的面向图形芯片功耗测试的方法,其特征在于,所述被既读又写的资源项即构成所述最小数据集。
10.一种面向图形芯片功耗测试的装置,用于测试机台对图形处理器芯片进行功耗测试,其特征在于,所述装置包括:
初始化模块,被配置用于使得所述测试机台将包括测试帧的测试资源下载至所述图形处理器芯片中;
配置模块,被配置用于使得所述图形处理器芯片对图形内核的页表寄存器进行配置;
测试模块,被配置用于使得所述图形内核执行所述测试帧;
判断模块,被配置用于判断所述测试帧的执行次数是否达到预定次数,当所述测试帧的执行次数达到预定次数时,结束执行;当所述测试帧的执行次数未达到预定次数时,重置存放在所述图形处理器芯片的存储单元中的最小数据集,然后重新依次执行所述测试模块和所述判断模块;
其中,所述最小数据集包括环形命令缓冲区指针以及Fence。
11.根据权利要求10所述的面向图形芯片功耗测试的装置,其特征在于,所述图形处理器芯片的存储单元被设计为片上静态随机存取存储器,所述图形处理器芯片上还设计有片上微处理器,所述片上微处理器的功能由代码固件进行实现。
12.根据权利要求10所述的面向图形芯片功耗测试的装置,其特征在于,所述初始化模块被配置用于使得所述测试机台初始化所述图形处理器芯片的时钟并将所述测试资源下载至所述图形处理器芯片的片上静态随机存取存储器中,所述测试资源包括所述测试帧与所述代码固件,然后所述测试机台对所述片上微处理器解除复位以使得片上微处理器开始执行。
13.根据权利要求11所述的面向图形芯片功耗测试的装置,其特征在于,所述图形处理器芯片的片上微处理器被配置用于对所述图形内核的页表寄存器进行配置。
14.根据权利要求10所述的面向图形芯片功耗测试的装置,其特征在于,所述测试帧的执行次数的预定次数为100次,以使得测试总时长的持续范围为2~10ms。
15.根据权利要求14所述的面向图形芯片功耗测试的装置,其特征在于,所述图形处理器芯片的片上微处理器被配置用于重置所述最小数据集。
16.根据权利要求10所述的面向图形芯片功耗测试的装置,其特征在于,所述最小数据集由预处理模块确定,所述预处理模块包括获取模块、抽取模块、统计模块以及收集模块。
17.根据权利要求16所述的面向图形芯片功耗测试的装置,其特征在于,所述获取模块被配置用于获取所述测试帧的仿真波形,所述抽取模块被配置用于抽取仿真波形中存储单元的地址信号,所述统计模块被配置用于统计地址信号范围内的每一页的资源项的读写记录,以及所述收集模块被配置用于收集读写记录中被既读又写的资源项。
18.根据权利要求17所述的面向图形芯片功耗测试的装置,其特征在于,所述被既读又写的资源项即构成所述最小数据集。
19.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器,其用于存储可执行指令;
所述一个或多个处理器被配置为经由所述可执行指令来实现权利要求1至9中任一项所述的方法。
20.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,使所述处理器执行权利要求1至9中任一项所述的方法。
21.一种计算机程序产品,其包括计算机程序,所述计算机程序被处理器执行时,使所述处理器执行权利要求1至9中任一项所述的方法。
CN202211321713.9A 2022-10-27 2022-10-27 一种面向图形芯片功耗测试的方法及装置 Active CN115391124B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211321713.9A CN115391124B (zh) 2022-10-27 2022-10-27 一种面向图形芯片功耗测试的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211321713.9A CN115391124B (zh) 2022-10-27 2022-10-27 一种面向图形芯片功耗测试的方法及装置

Publications (2)

Publication Number Publication Date
CN115391124A true CN115391124A (zh) 2022-11-25
CN115391124B CN115391124B (zh) 2023-03-21

Family

ID=84127865

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211321713.9A Active CN115391124B (zh) 2022-10-27 2022-10-27 一种面向图形芯片功耗测试的方法及装置

Country Status (1)

Country Link
CN (1) CN115391124B (zh)

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005029329A2 (en) * 2003-09-15 2005-03-31 Nvidia Corporation A system and method for testing and configuring semiconductor functional circuits
US20150113526A1 (en) * 2013-10-22 2015-04-23 Citrix Systems, Inc. Method and system for displaying graphics for a local virtual machine
WO2017011794A1 (en) * 2015-07-16 2017-01-19 T-Mobile Usa, Inc. User device power consumption monitoring and analysis
EP3304249A1 (en) * 2015-07-16 2018-04-11 T-Mobile USA, Inc. User device power consumption monitoring and analysis
JP2018116365A (ja) * 2017-01-16 2018-07-26 富士通株式会社 試験装置、試験プログラム生成方法及び試験方法
CN109643291A (zh) * 2016-09-29 2019-04-16 英特尔公司 用于在虚拟化执行环境中高效使用图形处理资源的方法和设备
CN111258830A (zh) * 2020-01-18 2020-06-09 苏州浪潮智能科技有限公司 一种服务器功耗对比测试系统及方法
CN111782454A (zh) * 2020-08-05 2020-10-16 中国人民解放军国防科技大学 基于指令epi的细粒度gpdsp功耗测试方法、系统及介质
US20200348739A1 (en) * 2019-04-30 2020-11-05 Shanghai Zhaoxin Semiconductor Co., Ltd. Computing device, power consumption prediction method thereof and non-transitory computer-readable storage medium
US20210012747A1 (en) * 2018-03-26 2021-01-14 Huawei Technologies Co., Ltd. Frame rate adjustment method and terminal
CN112330806A (zh) * 2020-11-27 2021-02-05 成都紫瑞青云航空宇航技术有限公司 一种基于低功耗硬件平台的视景合成方法及系统
WO2021109105A1 (en) * 2019-12-06 2021-06-10 Qualcomm Incorporated Synchronization between graphical processing units and display processing units
US20210287631A1 (en) * 2018-11-27 2021-09-16 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Video Processing Method, Electronic Device and Storage Medium
CN113439265A (zh) * 2019-03-15 2021-09-24 英特尔公司 用于更新多gpu配置中的存储器侧高速缓存的系统和方法
CN114138579A (zh) * 2021-11-29 2022-03-04 苏州浪潮智能科技有限公司 基于Prometheus的GPU交互测试的方法、装置、设备及可读介质
CN114329292A (zh) * 2021-12-20 2022-04-12 北京达佳互联信息技术有限公司 资源信息的配置方法、装置、电子设备以及存储介质
CN114529444A (zh) * 2022-04-22 2022-05-24 南京砺算科技有限公司 图形处理模块、图形处理器以及图形处理方法
US20220206978A1 (en) * 2020-12-31 2022-06-30 Deepx Co., Ltd. System-on-chip and method for testing component in system during runtime

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005029329A2 (en) * 2003-09-15 2005-03-31 Nvidia Corporation A system and method for testing and configuring semiconductor functional circuits
US20150113526A1 (en) * 2013-10-22 2015-04-23 Citrix Systems, Inc. Method and system for displaying graphics for a local virtual machine
WO2017011794A1 (en) * 2015-07-16 2017-01-19 T-Mobile Usa, Inc. User device power consumption monitoring and analysis
EP3304249A1 (en) * 2015-07-16 2018-04-11 T-Mobile USA, Inc. User device power consumption monitoring and analysis
CN109643291A (zh) * 2016-09-29 2019-04-16 英特尔公司 用于在虚拟化执行环境中高效使用图形处理资源的方法和设备
JP2018116365A (ja) * 2017-01-16 2018-07-26 富士通株式会社 試験装置、試験プログラム生成方法及び試験方法
US20210012747A1 (en) * 2018-03-26 2021-01-14 Huawei Technologies Co., Ltd. Frame rate adjustment method and terminal
US20210287631A1 (en) * 2018-11-27 2021-09-16 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Video Processing Method, Electronic Device and Storage Medium
CN113439265A (zh) * 2019-03-15 2021-09-24 英特尔公司 用于更新多gpu配置中的存储器侧高速缓存的系统和方法
US20200348739A1 (en) * 2019-04-30 2020-11-05 Shanghai Zhaoxin Semiconductor Co., Ltd. Computing device, power consumption prediction method thereof and non-transitory computer-readable storage medium
WO2021109105A1 (en) * 2019-12-06 2021-06-10 Qualcomm Incorporated Synchronization between graphical processing units and display processing units
CN111258830A (zh) * 2020-01-18 2020-06-09 苏州浪潮智能科技有限公司 一种服务器功耗对比测试系统及方法
CN111782454A (zh) * 2020-08-05 2020-10-16 中国人民解放军国防科技大学 基于指令epi的细粒度gpdsp功耗测试方法、系统及介质
CN112330806A (zh) * 2020-11-27 2021-02-05 成都紫瑞青云航空宇航技术有限公司 一种基于低功耗硬件平台的视景合成方法及系统
US20220206978A1 (en) * 2020-12-31 2022-06-30 Deepx Co., Ltd. System-on-chip and method for testing component in system during runtime
CN114138579A (zh) * 2021-11-29 2022-03-04 苏州浪潮智能科技有限公司 基于Prometheus的GPU交互测试的方法、装置、设备及可读介质
CN114329292A (zh) * 2021-12-20 2022-04-12 北京达佳互联信息技术有限公司 资源信息的配置方法、装置、电子设备以及存储介质
CN114529444A (zh) * 2022-04-22 2022-05-24 南京砺算科技有限公司 图形处理模块、图形处理器以及图形处理方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
COROYI: "GPU散热的秘密 显卡功耗专题", 《电脑自做》 *
江慧芳等: "基于CPU-GPU异构环境的运算代价评估模型", 《计算机工程》 *
田泽等: "图形处理器低功耗设计技术研究", 《计算机科学》 *
魔之左手: "ATI和NVIDIA的巅峰对决 最高端CrossFire和SLI系统测试", 《大众硬件》 *

Also Published As

Publication number Publication date
CN115391124B (zh) 2023-03-21

Similar Documents

Publication Publication Date Title
US11625521B2 (en) Method, emulator, and storage media for debugging logic system design
US8339414B2 (en) Monitoring graphics processing
US6829751B1 (en) Diagnostic architecture using FPGA core in system on a chip design
US20160147587A1 (en) Method of analyzing a fault of an electronic system
US7890314B2 (en) Method for modeling performance of embedded processors having combined cache and memory hierarchy
CN103034577B (zh) 一种定位关机慢的方法及装置
US10540466B1 (en) Systems and methods for streaming waveform data during emulation run
CN112597064A (zh) 对程序进行仿真的方法、电子设备及存储介质
CN112100957A (zh) 用于调试逻辑系统设计的方法、仿真器、存储介质
US11163351B2 (en) Power estimation
WO2021109367A1 (zh) 数字产品的仿真信号查看方法及系统
US10949330B2 (en) Binary instrumentation to trace graphics processor code
CN115391124B (zh) 一种面向图形芯片功耗测试的方法及装置
CN107451038B (zh) 硬件事件采集方法、处理器和计算系统
Harutyunyan et al. Symmetry measure for memory test and its application in BIST optimization
CN116467975B (zh) 数据处理方法、装置、电子设备及存储介质
JPH0758320B2 (ja) 情報処理装置の自己診断回路および自己診断方法
CN108701091A (zh) 用于动态工作负荷的机会存储器微调
US11176018B1 (en) Inline hardware compression subsystem for emulation trace data
CN107301231A (zh) 页面开启耗时的测试方法及测试系统
CN109783347B (zh) 一种调试移动设备应用程序界面性能的方法及装置
CN114818598A (zh) 一种基于电路翻转行为的vcd矢量压缩方法及装置
WO2021109365A1 (zh) 数字产品的仿真信号查看方法及系统
US7606692B2 (en) Gate-level netlist reduction for simulating target modules of a design
CN110704260A (zh) 一种用于处理器io寄存器测试激励的可重用方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant