CN112069022B - 一种npu型服务器功耗测试方法及系统 - Google Patents

一种npu型服务器功耗测试方法及系统 Download PDF

Info

Publication number
CN112069022B
CN112069022B CN202010850428.0A CN202010850428A CN112069022B CN 112069022 B CN112069022 B CN 112069022B CN 202010850428 A CN202010850428 A CN 202010850428A CN 112069022 B CN112069022 B CN 112069022B
Authority
CN
China
Prior art keywords
cpu
npu
power consumption
pressure
cores
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010850428.0A
Other languages
English (en)
Other versions
CN112069022A (zh
Inventor
周保森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010850428.0A priority Critical patent/CN112069022B/zh
Publication of CN112069022A publication Critical patent/CN112069022A/zh
Application granted granted Critical
Publication of CN112069022B publication Critical patent/CN112069022B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • G06F11/3062Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明提供了一种NPU型服务器功耗测试方法及系统,本发明为了避免在整机功耗测试中NPU和CPU互抢资源,将NPU绑定一定数量的CPU逻辑核,并在CPU未绑定逻辑核中确定使用最少核数但CPU功耗最大的压力最大化点,根据CPU核数以及核地址信息调用压力测试脚本进行加压测试,分别进行不同等级的压力测试,从而完成整机的功耗测试,相比传统整机功耗测试中NPU与CPU互抢资源导致无法准确进行功耗测试,本发明可有效提升功耗测试准确性,进而提升服务器整体性能。

Description

一种NPU型服务器功耗测试方法及系统
技术领域
本发明涉及服务器功耗技术领域,特别是一种NPU型服务器功耗测试方法及系统。
背景技术
嵌入式神经网络处理器(NPU)采用数据驱动并行计算的架构,特别擅长处理视频、图像类的海量多媒体数据。NPU处理器专门为物联网人工智能而设计,用于加速神经网络的运算,解决传统芯片在神经网络运算时效率低下的问题。
NPU处理器包括了乘加、激活函数、二维数据运算、解压缩等模块,乘加模块用于计算矩阵乘加、卷积、点乘等功能,NPU内部有64个MAC,SNPU有32个。激活函数模块采用最高12阶参数拟合的方式实现神经网络中的激活函数,NPU内部有6个MAC,SNPU有3个。二维数据运算模块用于实现对一个平面的运算,如降采样、平面数据拷贝等,NPU内部有1个MAC,SNPU有1个。解压缩模块用于对权重数据的解压,为了解决物联网设备中内存带宽小的特点,在NPU编译器中会对神经网络中的权重进行压缩,在几乎不影响精度的情况下,可以实现6-10倍的压缩效果。因此,NPU较传统CPU、GPU有其独特的性能优势,NPU型服务器应运而生。
传统意义上的整机功耗测试,通过运行SPECpower软件,通过软件抓取CPU压力100%、90%、80%……0%时的整机功耗及性能参数数据,但是NPU机型出现NPU和CPU互抢资源现象,当CPU压力较大时NPU压力不稳定,无法正常工作,只有CPU压力较小时NPU压力才能加满,导致整机性能无法达到最优。
发明内容
本发明的目的是提供一种NPU型服务器功耗测试方法及系统,旨在解决现有技术中整机功耗测试中NPU与CPU互抢资源导致无法准确进行功耗测试的问题,实现有效提升功耗测试准确性,进而提升服务器整体性能。
为达到上述技术目的,本发明提供了一种NPU型服务器功耗测试方法,所述方法包括以下操作:
将服务器中每个NPU绑定CPU固定数量的逻辑核,计算NPU绑核数量以及记录需要绑定的具体核地址;
绑定完成后,对CPU中未绑定的逻辑核进行加压,找到使用最少核数但CPU功耗最大的压力最大化点,记录压力最大化点下的CPU核数并绑定核地址;
根据记录的CPU核数以及核地址信息调用对应压力脚本进行加压,NPU通过逐级递减压力等级,CPU通过对压力最大化点下的CPU核数逐级递减加压核数,分别对NPU和CPU进行不同压力等级的测试;
待系统稳定后,自动抓取系统功耗数据。
优选地,所述每个NPU绑定CPU固定数量的逻辑核具体为:
对于单NPU、双CPU配置,将NPU绑定到两个CPU上;
对于双NPU、双CPU配置,每个CPU各绑定1个NPU;
对于四NPU、双CPU配置,每个CPU绑定2个NPU。
优选地,所述分别对NPU和CPU进行不同压力等级的测试具体为:
对NPU进行S10压力测试,对CPU进行100%压力测试,对压力最大化点下的CPU核数进行加压;
对NPU进行S9压力测试,对CPU进行90%压力测试,对压力最大化点下的CPU核数*90%的CPU核数进行加压;
如此依次执行,直至对NPU进行S0压力测试,对CPU进行0%压力测试。
优选地,所述加压通过PTU工具进行。
本发明还提供了一种NPU型服务器功耗测试系统,所述系统包括:
绑核模块,用于将服务器中每个NPU绑定CPU固定数量的逻辑核,计算NPU绑核数量以及记录需要绑定的具体核地址;
压力最大点确定模块,用于绑定完成后,对CPU中未绑定的逻辑核进行加压,找到使用最少核数但CPU功耗最大的压力最大化点,记录压力最大化点下的CPU核数并绑定核地址;
加压测试模块,用于根据记录的CPU核数以及核地址信息调用对应压力脚本进行加压,NPU通过逐级递减压力等级,CPU通过对压力最大化点下的CPU核数逐级递减加压核数,分别对NPU和CPU进行不同压力等级的测试;
功耗抓取模块,用于待系统稳定后,自动抓取系统功耗数据。
优选地,所述每个NPU绑定CPU固定数量的逻辑核具体为:
对于单NPU、双CPU配置,将NPU绑定到两个CPU上;
对于双NPU、双CPU配置,每个CPU各绑定1个NPU;
对于四NPU、双CPU配置,每个CPU绑定2个NPU。
优选地,所述加压通过PTU工具进行。
本发明还提供了一种NPU型服务器功耗测试设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现所述的NPU型服务器功耗测试方法。
本发明还提供了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现所述的NPU型服务器功耗测试方法。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
与现有技术相比,本发明为了避免在整机功耗测试中NPU和CPU互抢资源,将NPU绑定一定数量的CPU逻辑核,并在CPU未绑定逻辑核中确定使用最少核数但CPU功耗最大的压力最大化点,根据CPU核数以及核地址信息调用压力测试脚本进行加压测试,分别进行不同等级的压力测试,从而完成整机的功耗测试,相比传统整机功耗测试中NPU与CPU互抢资源导致无法准确进行功耗测试,本发明可有效提升功耗测试准确性,进而提升服务器整体性能。
附图说明
图1为本发明实施例中所提供的一种NPU型服务器功耗测试方法流程图;
图2为本发明实施例中所提供的一种NPU型服务器功耗测试系统框图。
具体实施方式
为了能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
下面结合附图对本发明实施例所提供的一种NPU型服务器功耗测试方法及系统进行详细说明。
如图1所示,本发明公开了一种NPU型服务器功耗测试方法,所述方法包括以下操作:
将服务器中每个NPU绑定CPU固定数量的逻辑核,计算NPU绑核数量以及记录需要绑定的具体核地址;
绑定完成后,对CPU中未绑定的逻辑核进行加压,找到使用最少核数但CPU功耗最大的压力最大化点,记录压力最大化点下的CPU核数并绑定核地址;
根据记录的CPU核数以及核地址信息调用对应压力脚本进行加压,NPU通过逐级递减压力等级,CPU通过对压力最大化点下的CPU核数逐级递减加压核数,分别对NPU和CPU进行不同压力等级的测试;
待系统稳定后,自动抓取系统功耗数据。
在整机功耗测试中,为避免NPU和CPU互抢资源,将NPU绑定一定数量CPU核数后,进行S10、S9、…、S0压力测试,对应CPU也进行绑核方式进行加压测试,通过减少绑定核数模拟CPU压力变化,等每个等级压力稳定后系统自动抓取所需数据。
对于每个NPU,分别绑定CPU的16个逻辑核。对于单NPU、双CPU配置,将NPU绑定到两个CPU上,每个CPU有8个逻辑核与NPU绑定;对于双NPU、双CPU配置,每个CPU各绑定1个NPU;对于四NPU、双CPU配置,每个CPU绑定2个NPU,根据绑定预设规则计算NPU绑核数量以及记录需要绑定的具体核地址。
在绑定完成后,计算使用最少核数实现CPU、内存、硬盘等压力最大化点,使用PTU(Performance Tuning Utility,CPU压力测试工具)对CPU剩余核加压,找到使用最少CPU核数量、但CPU功耗最大的点,该点即为CPU 100%压力测试开始点,记录CPU核数以及核地址信息。
例如,CPU具有52个核,其中有16个核绑定NPU,剩余36个核,这时使用PTU对CPU未绑定的14个核加压,CPU功耗就已经最大,14个核即为要找的压力最大化点。
在压力测试过程中,根据记录的CPU核数以及核地址信息调用对应压力脚本对CPU、内存以及硬盘进行加压,分别对NPU和CPU分别进行不同压力等级的测试。
对NPU进行S10压力测试,对CPU进行100%压力测试(对14个核),系统自动抓取所需的系统功耗数据并保存,自动抓取需在系统稳定后进行;对NPU进行S9压力测试,对CPU进行90%压力测试(核数为:14*90%取整),系统自动抓取所需的系统功耗数据并保存;如此依次执行,直至对NPU进行S0压力测试,对CPU进行0%压力测试(核数为:14*0%取整),系统自动抓取所需的系统功耗数据并保存。其中NPU的S10-S0压力测试均为系统内设定的不同等级的压力测试,S10压力测试压力等级最高,逐级递减,S0压力测试压力等级最低。
本发明实施例为了避免在整机功耗测试中NPU和CPU互抢资源,将NPU绑定一定数量的CPU逻辑核,并在CPU未绑定逻辑核中确定使用最少核数但CPU功耗最大的压力最大化点,根据CPU核数以及核地址信息调用压力测试脚本进行加压测试,分别进行不同等级的压力测试,从而完成整机的功耗测试,相比传统整机功耗测试中NPU与CPU互抢资源导致无法准确进行功耗测试,本发明可有效提升功耗测试准确性,进而提升服务器整体性能。
如图2所示,本发明实施例还公开了一种NPU型服务器功耗测试系统,所述系统包括:
绑核模块,用于将服务器中每个NPU绑定CPU固定数量的逻辑核,计算NPU绑核数量以及记录需要绑定的具体核地址;
压力最大点确定模块,用于绑定完成后,对CPU中未绑定的逻辑核进行加压,找到使用最少核数但CPU功耗最大的压力最大化点,记录压力最大化点下的CPU核数并绑定核地址;
加压测试模块,用于根据记录的CPU核数以及核地址信息调用对应压力脚本进行加压,NPU通过逐级递减压力等级,CPU通过对压力最大化点下的CPU核数逐级递减加压核数,分别对NPU和CPU进行不同压力等级的测试;
功耗抓取模块,用于待系统稳定后,自动抓取系统功耗数据。
在整机功耗测试中,为避免NPU和CPU互抢资源,将NPU绑定一定数量CPU核数后,进行S10、S9、…、S0压力测试,对应CPU也进行绑核方式进行加压测试,通过减少绑定核数模拟CPU压力变化,等每个等级压力稳定后系统自动抓取所需数据。
对于每个NPU,分别绑定CPU的16个逻辑核。对于单NPU、双CPU配置,将NPU绑定到两个CPU上,每个CPU有8个逻辑核与NPU绑定;对于双NPU、双CPU配置,每个CPU各绑定1个NPU;对于四NPU、双CPU配置,每个CPU绑定2个NPU,根据绑定预设规则计算NPU绑核数量以及记录需要绑定的具体核地址。
在绑定完成后,计算使用最少核数实现CPU、内存、硬盘等压力最大化点,使用PTU(Performance Tuning Utility,CPU压力测试工具)对CPU剩余核加压,找到使用最少CPU核数量、但CPU功耗最大的点,该点即为CPU 100%压力测试开始点,记录CPU核数以及核地址信息。
例如,CPU具有52个核,其中有16个核绑定NPU,剩余36个核,这时使用PTU对CPU未绑定的14个核加压,CPU功耗就已经最大,14个核即为要找的压力最大化点。
在压力测试过程中,根据记录的CPU核数以及核地址信息调用对应压力脚本对CPU、内存以及硬盘进行加压,分别对NPU和CPU分别进行不同压力等级的测试。
对NPU进行S10压力测试,对CPU进行100%压力测试(对14个核),系统自动抓取所需的系统功耗数据并保存,自动抓取需在系统稳定后进行;对NPU进行S9压力测试,对CPU进行90%压力测试(核数为:14*90%取整),系统自动抓取所需的系统功耗数据并保存;如此依次执行,直至对NPU进行S0压力测试,对CPU进行0%压力测试(核数为:14*0%取整),系统自动抓取所需的系统功耗数据并保存。其中NPU的S10-S0压力测试均为系统内设定的不同等级的压力测试,S10压力测试压力等级最高,逐级递减,S0压力测试压力等级最低。
本发明实施例还公开了一种NPU型服务器功耗测试设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现所述的NPU型服务器功耗测试方法。
本发明实施例还公开了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现所述的NPU型服务器功耗测试方法。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种NPU型服务器功耗测试方法,其特征在于,所述方法包括以下操作:
将服务器中每个NPU绑定CPU固定数量的逻辑核,计算NPU绑核数量以及记录需要绑定的具体核地址;
绑定完成后,对CPU中未绑定的逻辑核进行加压,找到使用最少核数但CPU功耗最大的压力最大化点,记录压力最大化点下的CPU核数并绑定核地址;
根据记录的CPU核数以及核地址信息调用对应压力脚本进行加压,NPU通过逐级递减压力等级,CPU通过对压力最大化点下的CPU核数逐级递减加压核数,分别对NPU和CPU进行不同压力等级的测试;
待系统稳定后,自动抓取系统功耗数据。
2.根据权利要求1所述的一种NPU型服务器功耗测试方法,其特征在于,所述每个NPU绑定CPU固定数量的逻辑核具体为:
对于单NPU、双CPU配置,将NPU绑定到两个CPU上;
对于双NPU、双CPU配置,每个CPU各绑定1个NPU;
对于四NPU、双CPU配置,每个CPU绑定2个NPU。
3.根据权利要求1所述的一种NPU型服务器功耗测试方法,其特征在于,所述分别对NPU和CPU进行不同压力等级的测试具体为:
对NPU进行S10压力测试,对CPU进行100%压力测试,对压力最大化点下的CPU核数进行加压;
对NPU进行S9压力测试,对CPU进行90%压力测试,对压力最大化点下的CPU核数*90%的CPU核数进行加压;
如此依次执行,直至对NPU进行S0压力测试,对CPU进行0%压力测试。
4.根据权利要求1所述的一种NPU型服务器功耗测试方法,其特征在于,所述加压通过PTU工具进行。
5.一种NPU型服务器功耗测试系统,其特征在于,所述系统包括:
绑核模块,用于将服务器中每个NPU绑定CPU固定数量的逻辑核,计算NPU绑核数量以及记录需要绑定的具体核地址;
压力最大点确定模块,用于绑定完成后,对CPU中未绑定的逻辑核进行加压,找到使用最少核数但CPU功耗最大的压力最大化点,记录压力最大化点下的CPU核数并绑定核地址;
加压测试模块,用于根据记录的CPU核数以及核地址信息调用对应压力脚本进行加压,NPU通过逐级递减压力等级,CPU通过对压力最大化点下的CPU核数逐级递减加压核数,分别对NPU和CPU进行不同压力等级的测试;
功耗抓取模块,用于待系统稳定后,自动抓取系统功耗数据。
6.根据权利要求5所述的一种NPU型服务器功耗测试系统,其特征在于,所述每个NPU绑定CPU固定数量的逻辑核具体为:
对于单NPU、双CPU配置,将NPU绑定到两个CPU上;
对于双NPU、双CPU配置,每个CPU各绑定1个NPU;
对于四NPU、双CPU配置,每个CPU绑定2个NPU。
7.根据权利要求5所述的一种NPU型服务器功耗测试系统,其特征在于,所述加压通过PTU工具进行。
8.一种NPU型服务器功耗测试设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现根据权利要求1-4任意一项所述的NPU型服务器功耗测试方法。
9.一种可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现根据权利要求1-4任意一项所述的NPU型服务器功耗测试方法。
CN202010850428.0A 2020-08-21 2020-08-21 一种npu型服务器功耗测试方法及系统 Active CN112069022B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010850428.0A CN112069022B (zh) 2020-08-21 2020-08-21 一种npu型服务器功耗测试方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010850428.0A CN112069022B (zh) 2020-08-21 2020-08-21 一种npu型服务器功耗测试方法及系统

Publications (2)

Publication Number Publication Date
CN112069022A CN112069022A (zh) 2020-12-11
CN112069022B true CN112069022B (zh) 2022-07-22

Family

ID=73659486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010850428.0A Active CN112069022B (zh) 2020-08-21 2020-08-21 一种npu型服务器功耗测试方法及系统

Country Status (1)

Country Link
CN (1) CN112069022B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117033247B (zh) * 2023-10-07 2023-12-12 宜宾邦华智慧科技有限公司 一种手机、平板电脑搭载的验证方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111258830B (zh) * 2020-01-18 2023-01-10 苏州浪潮智能科技有限公司 一种服务器功耗对比测试系统及方法

Also Published As

Publication number Publication date
CN112069022A (zh) 2020-12-11

Similar Documents

Publication Publication Date Title
CN111178518A (zh) 一种基于fpga的软硬件协同的加速方法
CN113536081B (zh) 基于人工智能的数据中心数据管理方法及系统
CN114707650B (zh) 一种提高仿真效率的仿真实现方法
CN112069022B (zh) 一种npu型服务器功耗测试方法及系统
EP4044070A2 (en) Neural network processing unit, neural network processing method and device
CN111045912B (zh) 一种ai应用性能评估方法、装置及其相关设备
CN107704568A (zh) 一种测试数据添加的方法及装置
CN110569230A (zh) 数据库设计模型与设计文档互相转换方法、系统及设备
CN114819168B (zh) 一种矩阵特征值的量子比较方法及装置
CN109086819A (zh) caffemodel模型压缩方法、系统、设备及介质
CN108053034A (zh) 模型参数处理方法、装置、电子设备及存储介质
EP4357924A1 (en) Application performance testing method, method and apparatus for establishing performance testing model
US20220058530A1 (en) Method and device for optimizing deep learning model conversion, and storage medium
CN116227332A (zh) 一种transformer混合比特量化方法及系统
CN112433847B (zh) 一种OpenCL内核提交的方法及装置
EP4315168A1 (en) Sparse machine learning acceleration
CN113849484A (zh) 一种大数据组件升级方法、装置、电子设备及存储介质
CN109684144B (zh) 一种gpu-box系统测试的方法及装置
CN113992249A (zh) 信道状态信息的处理方法、装置、电子设备、存储介质
WO2023278044A1 (en) Selective data structure encoding for deep neural network training
US20230195536A1 (en) Data offloading processes and systems
CN113570034B (zh) 处理装置、神经网络的处理方法及其装置
CN115879559B (zh) 多个量子态之间的等值关系判断方法、装置及量子计算机
CN112123750B (zh) 晶格的三维打印方法、装置、系统及存储介质
US11573883B1 (en) Systems and methods for enhanced compression of trace data in an emulation system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant