CN109446004A - 一种自动测试gpu的方法 - Google Patents

一种自动测试gpu的方法 Download PDF

Info

Publication number
CN109446004A
CN109446004A CN201811237877.7A CN201811237877A CN109446004A CN 109446004 A CN109446004 A CN 109446004A CN 201811237877 A CN201811237877 A CN 201811237877A CN 109446004 A CN109446004 A CN 109446004A
Authority
CN
China
Prior art keywords
test
gpu
log
testing tool
automatic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201811237877.7A
Other languages
English (en)
Inventor
路勤良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811237877.7A priority Critical patent/CN109446004A/zh
Publication of CN109446004A publication Critical patent/CN109446004A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/2236Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test CPU or processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种自动测试GPU的方法,包括获取GPU测试所需的测试工具包;根据测试工具的运行需求,创建测试环境;根据GPU的产品名称,启动测试工具的相应测试项进行测试。本发明利用测试脚本实现GPU测试全过程的自动化,包括自动从服务器下载测试脚本,自动进行测试环境的搭建,自动识别GPU类型并匹配相对应的测试项,同时自动判断并输出测试结果,整个测试过程无需人为参与,节省测试成本,提高测试效率,且测试结果准确可靠。

Description

一种自动测试GPU的方法
技术领域
本发明涉及服务器测试技术领域,具体地说是一种自动测试GPU(GraphicsProcessing Unit,图形处理器)的方法。
背景技术
随着AI(Artificial Intelligence,人工智能)技术的发展,GPU的使用量与日俱增。在实际的PC(personal computer,个人电脑)/服务器的生产测试过程中GPU的测试也越来越重要。
现有的GPU测试过程需要进行环境的搭建,以及多次进行人工交互才能完成测试,而且测试完成之后还需要人工确认测试结果。测试过程既浪费时间又浪费人力而且认为失误的风险较大。
发明内容
本发明实施例中提供了一种自动测试GPU的方法,以解决现有技术中GPU测试需要大量人工交互过程,测试时间长、准确率低的问题。
为了解决上述技术问题,本发明实施例公开了如下技术方案:
本发明提供了一种自动测试GPU的方法,包括以下步骤:
获取GPU测试所需的测试工具包;
根据测试工具的运行需求,创建测试环境;
根据GPU的产品名称,启动测试工具的相应测试项进行测试。
进一步地,所述方法还包括:
测试完成后,根据GPU的类型,获取测试测试日志位置,并通过检测日志数量和日志中关键词的检测,判断测试结果。
进一步地,所述测试工具包按照GPU的产品名称命名。
进一步地,所述获取GPU测试所需的测试工具包的具体过程为:
将服务器存放测试工具的路径挂载到测试机目录下;
在测试机端,解压测试工具到任意目录。
进一步地,所述测试工具为NVQUAL。
进一步地,所述根据测试工具的运行需求,创建测试环境的具体过程为:
识别测试机上是否存在影响NVQUAL运行的驱动;
若是,则卸载所述影响NVQUAL运行的驱动,安装numactl和xlrd模块;
若否,则安装numactl和xlrd模块。
进一步地,所述影响NVQUAL运行的驱动包括nouveau和nvidia。
进一步地,所述根据GPU的产品名称,启动测试工具的相应测试项进行测试的具体过程为:
获取GPU的产品名称,查看产品名称中包含的字符;
若字符中包含SXM,则进行第8项、第9项和第10项的测试;
若字符中包含V100,则进行除第4项外其余项的测试。
进一步地,所述根据GPU的类型,获取测试测试日志位置,并通过检测日志数量和日志中关键词的检测,判断测试结果的具体过程为:
获取GPU的产品名称,查看产品名称中是否包含的字符V100;
若是,则获取第一日志目录下的日志关键词,判断测试结果;
若否,则获取第二日志目录下的日志关键词,判断测试结果。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
1、利用测试脚本实现GPU测试全过程的自动化,包括自动从服务器下载测试脚本,自动进行测试环境的搭建,自动识别GPU类型并匹配相对应的测试项,同时自动判断并输出测试结果,整个测试过程无需人为参与,节省测试成本,提高测试效率,且测试结果准确可靠。
2、存储在服务器上的测试工具按照GPU的产品名称命名,方便自动识别并判断GPU类型,从而下载与GPU相对应的测试工具,操作方便,提高测试效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明所述方法实施例1的流程示意图;
图2是本发明所述方法实施例2的流程示意图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
如图1所示,本发明测试GPU的方法包括以下步骤:
S1,获取GPU测试所需的测试工具包;
从服务器下载测试所需要的测试工具包。将服务器存放测试工具的路径自动挂载到测试机目录下,测试工具按照GPU的Product Name(产品名称)命名,方便自动判断GPU类型自动下载测试工具;在测试机端,将对应测试工具解压到测试机任意目录下。
S2,根据测试工具的运行需求,创建测试环境;
测试工具为NVQUAL,由于在使用NVQUAL测试时,需要卸载一些驱动,测试成功搭建测试环境。
首先识别测试机上是否存在影响NVQUAL运行的驱动,影响NVQUAL运行的驱动包括nouveau和nvidia。若有,在分别执行rmmod nouveau和rmmod nvidia,卸载nouveau和nvidia,然后安装numactl和xlrd模块;若不存在,则直接安装numactl和xlrd模块。
S3,根据GPU的产品名称,启动测试工具的相应测试项进行测试。
使用nvidia-smi命令获取GPU的产品名称,并根据GPU的产品名称区分不同类型的GPU。
如果GPU的产品名称中包含SXM,则表明是SXM系列的GPU,则利用测试工具,进行第8项、第9项和第10项的测试;如果GPU的产品名称中包含V100,则表明是V100系列的GPU,不可进行第4项的测试,即进行除第4项外其他项的测试。
如图2所示,在上述实施例的基础上,本发明测试GPU的方法还包括:
S4,测试完成后,根据GPU的类型,获取测试测试日志位置,并通过检测日志数量和日志中关键词的检测,判断测试结果。
使用nvidia-smi命令获取GPU的产品名称,并根据GPU的产品名称区分不同类型的GPU。
如果GPU是V100系列,则测试日志保存在第一日志目录下,如果是GPU是SXM系列,则测试日志保存在第二日志目录下。
本实施例中第一日志目录为./results/*/*.log,第二日志目录为./results/*.log。
获取第一日志目录或第二日志目录下的日志关键词,判断是否存在关键词“ErrorCode(ok)”,若存在,则测试通过,否则测试不通过。
获取测试文件的数量,判断测试文件的数量与测试项的数量是否相对应,若不对应,则说明存在测试项报错,则测试不通过。
对于测试项1的结果检查还包括对其对应目录下的excel结果文件进行检查,判断收存在关键词“Failed”,即检查在测试项1测试过程中是否有温度报错,如果存在,则测试不通过。
对于利用测试工具NVQUAL进行的GPU测试,测试项的内容为现有技术范畴。
以上所述只是本发明的优选实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也被视为本发明的保护范围。

Claims (9)

1.一种自动测试GPU的方法,其特征是,包括以下步骤:
获取GPU测试所需的测试工具包;
根据测试工具的运行需求,创建测试环境;
根据GPU的产品名称,启动测试工具的相应测试项进行测试。
2.根据权利要求1所述的一种自动测试GPU的方法,其特征是,所述方法还包括:
测试完成后,根据GPU的类型,获取测试测试日志位置,并通过检测日志数量和日志中关键词的检测,判断测试结果。
3.根据权利要求1或2所述的一种自动测试GPU的方法,其特征是,所述测试工具包按照GPU的产品名称命名。
4.根据权利要求1或2所述的一种自动测试GPU的方法,其特征是,所述获取GPU测试所需的测试工具包的具体过程为:
将服务器存放测试工具的路径挂载到测试机目录下;
在测试机端,解压测试工具到任意目录。
5.根据权利要求1或2所述的一种自动测试GPU的方法,其特征是,所述测试工具为NVQUAL。
6.根据权利要求5所述的一种自动测试GPU的方法,其特征是,所述根据测试工具的运行需求,创建测试环境的具体过程为:
识别测试机上是否存在影响NVQUAL运行的驱动;
若是,则卸载所述影响NVQUAL运行的驱动,安装numactl和xlrd模块;
若否,则安装numactl和xlrd模块。
7.根据权利要求6所述的一种自动测试GPU的方法,其特征是,所述影响NVQUAL运行的驱动包括nouveau和nvidia。
8.根据权利要求7所述的一种自动测试GPU的方法,其特征是,所述根据GPU的产品名称,启动测试工具的相应测试项进行测试的具体过程为:
获取GPU的产品名称,查看产品名称中包含的字符;
若字符中包含SXM,则进行第8项、第9项和第10项的测试;
若字符中包含V100,则进行除第4项外其余项的测试。
9.根据权利要求2所述的一种自动测试GPU的方法,其特征是,所述根据GPU的类型,获取测试测试日志位置,并通过检测日志数量和日志中关键词的检测,判断测试结果的具体过程为:
获取GPU的产品名称,查看产品名称中是否包含的字符V100;
若是,则获取第一日志目录下的日志关键词,判断测试结果;
若否,则获取第二日志目录下的日志关键词,判断测试结果。
CN201811237877.7A 2018-10-23 2018-10-23 一种自动测试gpu的方法 Withdrawn CN109446004A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811237877.7A CN109446004A (zh) 2018-10-23 2018-10-23 一种自动测试gpu的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811237877.7A CN109446004A (zh) 2018-10-23 2018-10-23 一种自动测试gpu的方法

Publications (1)

Publication Number Publication Date
CN109446004A true CN109446004A (zh) 2019-03-08

Family

ID=65547795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811237877.7A Withdrawn CN109446004A (zh) 2018-10-23 2018-10-23 一种自动测试gpu的方法

Country Status (1)

Country Link
CN (1) CN109446004A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918125A (zh) * 2019-03-20 2019-06-21 浪潮商用机器有限公司 基于OpenPOWER架构的GPU配置方法及装置
CN110968467A (zh) * 2019-12-16 2020-04-07 冀方 一种gpu和算法的远程自动测试方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918125A (zh) * 2019-03-20 2019-06-21 浪潮商用机器有限公司 基于OpenPOWER架构的GPU配置方法及装置
CN110968467A (zh) * 2019-12-16 2020-04-07 冀方 一种gpu和算法的远程自动测试方法

Similar Documents

Publication Publication Date Title
CN106909510B (zh) 一种获取测试用例的方法以及服务器
CN103235759A (zh) 测试用例生成方法和装置
CN108536593A (zh) 基于ui的cs架构软件自动化测试方法及系统
CN109446004A (zh) 一种自动测试gpu的方法
CN110096422A (zh) 一种基于容器的服务器计算性能测试方法与装置
CN111045927A (zh) 性能测试评估方法、装置、计算机设备及可读存储介质
CN114385480A (zh) 一种用于车辆fota功能自动验证的硬件在环测试系统
CN107357721B (zh) 测试系统的方法及装置
CN112506757A (zh) 自动测试方法、系统、计算机设备及其介质
CN106326112A (zh) 一种程序作业自动批改的方法和装置
CN111813653A (zh) 一种字段内容相关的数据异常测试方法及自动化测试工具
CN111813652B (zh) 一种数据缺失相关的数据异常值校验的自动化测试方法
CN106708742B (zh) 一种通讯规约模块测试架构的自动化测试方法及装置
CN112783769A (zh) 一种自定义的自动化软件测试方法
CN108614516A (zh) 一种虚拟plc仿真系统及方法
CN105320510A (zh) 一种自动追踪数据关系的方法及装置
CN111400191A (zh) 网页安全测试方法、装置及计算机可读存储介质
CN115827499A (zh) 一种ui自动化测试方法
CN107273293B (zh) 大数据系统性能测试方法、装置及电子设备
CN109977953A (zh) 基于yolov3的目标检测算法在嵌入式设备上的实现方法
CN115509913A (zh) 软件自动化测试方法、装置、机器可读介质及设备
CN110096292B (zh) 一种自适应刷新服务器bios固件的方法及系统
CN114647588A (zh) 接口测试方法及装置
CN112231158A (zh) 一种测试多卡gpgpu集群浮点运算性能的方法及装置
CN113961451A (zh) 一种用于工作平台软件开发类任务的自动测试系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20190308

WW01 Invention patent application withdrawn after publication