CN116560928A - 一种多图形处理器性能均衡性测试方法、装置及其介质 - Google Patents
一种多图形处理器性能均衡性测试方法、装置及其介质 Download PDFInfo
- Publication number
- CN116560928A CN116560928A CN202310576335.7A CN202310576335A CN116560928A CN 116560928 A CN116560928 A CN 116560928A CN 202310576335 A CN202310576335 A CN 202310576335A CN 116560928 A CN116560928 A CN 116560928A
- Authority
- CN
- China
- Prior art keywords
- test
- graphic
- processor
- performance balance
- processors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010998 test method Methods 0.000 title claims abstract description 17
- 238000012360 testing method Methods 0.000 claims abstract description 305
- 238000000034 method Methods 0.000 claims description 92
- 230000008569 process Effects 0.000 claims description 50
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 abstract description 20
- 238000013461 design Methods 0.000 abstract description 9
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 244000035744 Hura crepitans Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2205—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
- G06F11/2236—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test CPU or processors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2273—Test methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本申请公开一种多图形处理器性能均衡性测试方法、装置及其介质,涉及计算机技术领域,用于测试图形处理器之间的性能均衡性,针对目前没有一种成熟的性能均衡性测试方案的问题,提供一种多图形处理器性能均衡性测试方法,通过安装图形处理器驱动以满足多种图形处理器的运行环境需要,进而对混合异构计算系统中的各图形处理器进行识别;对识别到的图形处理器进行并行测试,并分别采集各图形处理器的测试结果;根据测试结果反馈的各项性能指标,即可掌握各图形处理器在并行使用时的运行状态,判断出混合异构计算系统中图形处理器运行性能均衡性的好坏,以发现主板硬件链路设计的不均衡问题,从而及时排除隐患,提高混合异构计算系统的图形处理能力。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种多图形处理器性能均衡性测试方法、装置及其介质。
背景技术
目前,在高性能计算领域中,基于图形处理器(Graphics Processing Unit,GPU)+中央处理器(Central Processing Unit,CPU)的混合异构计算系统已经逐渐成为热点研究方向,并且已经研究出可行的混合异构计算系统,计算机GPU+CPU的混合异构模型图1所示。
在实际的工作计算场景中,大部分基于GPU+CPU的混合异构计算机系统相较于传统的计算机系统都展现出了更好的性能。但是也由于混合异构计算机系统发展时日不长,各方面还在起步阶段,对于计算机的混合异构模式仍然有较多问题亟待解决,例如如何确保在多GPU的架构下,使各GPU的性能更佳均衡,尤其是到集群规模级别时,各GPU性能均衡的矛盾更为突出,目前也缺少一种测试混合异构计算系统中各GPU性能均衡性的方法。
所以,现在本领域的技术人员亟需要一种多图形处理器性能均衡性测试方法,解决目前在混合异构计算机系统中各GPU性能均衡矛盾的问题。
发明内容
本申请的目的是提供一种多图形处理器性能均衡性测试方法、装置及其介质,以解决目前在混合异构计算机系统中各GPU性能均衡矛盾的问题。
为解决上述技术问题,本申请提供一种多图形处理器性能均衡性测试方法,包括:
安装图形处理器驱动,并识别系统中所搭载的各图形处理器;
对识别到的各图形处理器进行并行测试,以获取并行测试结果;
根据各图形处理器的并行测试结果,确定各图形处理器之间的性能均衡性结果。
另一方面,对识别到的各图形处理器进行并行测试包括:
将识别到的各图形处理器放入预先建立的测试队列中,并调用预设的测试进程对测试队列中的各图形处理器进行测试。
另一方面,调用预设的测试进程对测试队列中的各图形处理器进行测试包括:
当测试队列中的测试进程数量等于所识别到的图形处理器的总数量时,开启测试进程。
另一方面,还包括:
当接收到由用户端发送的测试进度查询指令时,查看测试队列中各测试进程的状态,以返回相应的测试进度结果。
另一方面,并行测试结果包括:吞吐量和时延数据。
另一方面,根据各图形处理器的并行测试结果,确定各图形处理器之间的性能均衡性结果包括:
比较各图形处理器的吞吐量和时延数据;
若吞吐量和时延数据的最大差值均不大于预设的均衡阈值,则性能均衡性结果为良好,否则为较差。
另一方面,还包括:
根据并行测试结果和性能均衡性结果生成对应的测试报告,并存储在指定路径下的可拆卸存储介质中。
为解决上述技术问题,本申请还提供一种多图形处理器性能均衡性测试装置,包括:
识别模块,用于安装图形处理器驱动,并识别系统中所搭载的各图形处理器;
测试模块,用于对识别到的各图形处理器进行并行测试,以获取并行测试结果;
确定模块,用于根据各图形处理器的并行测试结果,确定各图形处理器之间的性能均衡性结果。
另一方面,上述的测试模块中的对识别到的各图形处理器进行并行测试包括:
将识别到的各图形处理器放入预先建立的测试队列中,并调用预设的测试进程对测试队列中的各图形处理器进行测试,以获取并行测试结果。
另一方面,上述的测试模块中的调用预设的测试进程对测试队列中的各图形处理器进行测试包括:
当测试队列中的测试进程数量等于所识别到的图形处理器的总数量时,开启测试进程。
另一方面,上述的多图形处理器性能均衡性测试装置还包括:
查询模块,用于当接收到由用户端发送的测试进度查询指令时,查看测试队列中各测试进程的状态,以返回相应的测试进度结果。
另一方面,上述的并行测试结果具体包括:吞吐量和时延数据。
另一方面,上述的确定模块中的根据各图形处理器的并行测试结果,确定各图形处理器之间的性能均衡性结果包括:
比较各图形处理器的吞吐量和时延数据;
若吞吐量和时延数据的最大差值均不大于预设的均衡阈值,则性能均衡性结果为良好,否则为较差。
另一方面,上述的多图形处理器性能均衡性测试装置还包括:
报告模块,用于根据并行测试结果和性能均衡性结果生成对应的测试报告,并存储在指定路径下的可拆卸存储介质中。
为解决上述技术问题,本申请还提供一种多图形处理器性能均衡性测试装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上述的多图形处理器性能均衡性测试方法的步骤。
为解决上述技术问题,本申请还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述的多图形处理器性能均衡性测试方法的步骤。
本申请提供的一种多图形处理器性能均衡性测试方法,通过安装图形处理器驱动以满足多种图形处理器的运行环境需要,进而对混合异构计算系统中的各图形处理器进行识别;进一步的,对上述步骤识别到的图形处理器进行并行测试,并分别采集各图形处理器的测试结果;根据测试结果反馈的各项性能指标,即可掌握各图形处理器在并行使用时的运行状态,进而判断出混合异构计算系统中图形处理器运行性能均衡性的好坏,以发现主板硬件链路设计的不均衡问题,从而及时排除隐患,提高混合异构计算系统的图形处理能力。
本申请提供的多图形处理器性能均衡性测试装置、及计算机可读存储介质,与上述方法对应,效果同上。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种混合异构计算系统的结构图;
图2为本发明提供的一种多图形处理器性能均衡性测试方法的流程图;
图3为本发明提供的一种多图形处理器性能均衡性测试装置的结构图;
图4为本发明提供的另一种多图形处理器性能均衡性测试装置的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。
本申请的核心是提供一种多图形处理器性能均衡性测试方法、装置及其介质。
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。
如图1所示,随着计算机技术的发展,目前已出现一种混合异构计算系统,以分布式的节点集群形式实现,每一节点皆可用于实现特定的计算任务,彼此之间通过建立数据通信协同进行计算,以带来更高的计算效率和性能。
图1所示的一种混合异构计算系统中包含N个节点,每一个节点下又包括多个图形处理器(Graphics Processing Unit,GPU)和一个中央控制器(Central Processing Unit,CPU),用于实现集群分配给该节点的计算任务。其中,图形处理器主要负责图像和图形相关的运算工作,而中央处理器则起到控制、通信以及其他方面的工作。
对于图形处理器的实施,目前已有较多成熟的技术方案,根据生产厂商的不同,不同种类、型号的图形处理器在制造工艺、应用以及性能上都有所不同。这就导致了在混合异构计算系统的应用中,如果仅仅是将图形处理器拿来直接应用,很容易出现性能上的差异,这种差异不仅仅会出现在采取不同制造工艺的不同图形处理器之间,甚至因为调度和实际应用问题在相同型号的图形处理器之间也有所体现。这种性能均衡性的差异会严重影响混合异构计算系统对图形、图像相关数据处理的效率和能力。
对于上述性能均衡性问题的解决方案,目前一般可通过调整混合异构计算系统主板硬件链路的设计实现,以均衡各图形处理器之间的性能差异。仅仅是通过使用相同型号的图形处理器并不能完全避免性能差异问题,并且还会带来更好的实施成本和应用难度,不利于混合异构协同计算集群的部署。
相应的,关于如何为混合异构计算系统主板硬件链路设计的调整提供数据支持,就成为了本领域技术人员所亟需解决的问题。目前,尚未有一种分析评价混合异构计算系统中多图形处理器之间性能均衡性的方案,所以当前的主板硬件链路设计的调整还依赖于设计人员的经验以及用户反馈,这为调整工作带来了极大的难度提升以及效率下降。
为解决上述问题,本申请提供一种多图形处理器性能均衡性测试方法,如图2所示,方法包括:
S11:安装图形处理器驱动,并识别系统中所搭载的各图形处理器。
本步骤的目的是为了后续的并行测试工作搭建其所需要的运行环境。考虑到在实际的混合异构计算系统的部署中,各节点所使用的图形处理器很可能不采用统一型号的图形处理器,为支持这些图形处理器的测试工作,需要预先安装其适配的图形处理器驱动。考虑到技术人员可以根据需要选择合适型号及种类的图形处理器进行应用,并有渠道获得所使用图形处理器对应的驱动(厂商附赠,或从其官网下载),故本实施例不再赘述如何在不同应用场景下实现图形处理器驱动的安装。
但容易理解的是,在后续混合异构计算系统的实际应用中,也需要图形处理器处理图形、图像相关的数据,同样需要安装对应的图形处理器驱动,所以本步骤也为混合异构计算系统正式应用的必要步骤。
另外,还需要说明的是,上述所述的图形处理器驱动的安装其目的是为了搭建性能均衡性的测试环境,但对于测试环境的搭建不仅仅包括图形处理器驱动的安装,还至少应包括docker(一种开源的应用容器引擎)环境以及推理测试环境的搭建。
对于上述环境的搭建,目前同样具有成熟的技术手段,通过应用容器建立一个可移植的镜像中,还可以实现虚拟化,利用沙箱机制运行测试程序(例如具有复杂图形处理需求的应用程序),并收集图形处理器在运行上述测试程序时的各项参数数据,从而获取到测试结果。
S12:对识别到的各图形处理器进行并行测试,以获取并行测试结果。
并行测试也即对各图形处理器以并行的方式同时进行测试,对于上述表征图形处理器测试结果的参数数据,可以包括但不限于:测试框架、模型、数据精度、吞吐量和时延数据。
其中,在并行测试中各图形处理器所使用的测试框架、模型以及数据精度均相同,所以上述用于反映图形处理器运行状态的参数数据还有吞吐量和时延数据可用于反映各图形处理器之间的性能差异。
吞吐量是指单位时间内系统能处理的请求数量,体现系统处理请求的能力,这是目前最常用的性能测试指标。而每秒查询数(QPS)、每秒事务数(TPS)则是吞吐量的常用量化指标,另外还有每秒超文本传输协议(Hyper Text Transfer Protocol,HTTP)请求数(HPS)也常常被用来作为吞吐量的量化指标。而在本申请所针对的多图形处理器的性能均衡性测试这一应用场景中,一般选择每秒查询数QPS作为上述吞吐量的量化指标。
对于时延数据,则是反映图形处理器处理数据的延时情况,一定程度上也可反映出图形处理器的性能。
S13:根据各图形处理器的并行测试结果,确定各图形处理器之间的性能均衡性结果。
本步骤通过上述步骤获得的吞吐量和时延数据,即可直观地判断出各图形处理器在并行应用时的性能差异,进而据此得到相应的性能均衡性结果。
进一步的,当如上述实施例所述,以图形处理器测试过程中的吞吐量和时延数据作为评判其性能的标准时,本实施例还提供一种评判各图形处理器之间性能均衡性好坏的量化方法,具体包括:
S131:比较各图形处理器的吞吐量和时延数据。
S132:若吞吐量和时延数据的最大差值均不大于预设的均衡阈值,则性能均衡性结果为良好,否则为较差。
也即,对所有参与并行测试的图形处理器所对应的吞吐量和时延数据进行比较,分别判断各图形处理器的吞吐量之间的最大相差值和时延数据的最大相差值是否均超过预设的均衡阈值(均衡阈值即为根据实际混合异构计算系统应用的历史运行数据中得到的一个具体数值,也可以是百分比的形式,根据实际需要的不同一般可设定均衡阈值为5%或10%),从而判断各图形处理器之间的性能是否均衡。
进一步的,也可以根据实际需要,为吞吐量和时延数据单独设置对应的均衡阈值,例如设置对应于吞吐量的第一均衡阈值和对应于时延数据的第二均衡阈值。此时,评定各图形处理器性能均衡性好坏的标准即为:
当各图形处理器的吞吐量之间的最大差值不大于第一均衡阈值,且各图形处理器的时延数据之间的最大差值不大于第二均衡阈值时,认为当前混合异构计算系统的性能均衡性较好,否则即为较差。
示例性的,以某一混合异构计算系统中包含4张图形处理器、且均衡阈值为5%为例,经过并行测试后也即获得分别对应于4张图形处理器的4组并行测试结果,每一组并行测试结果包括吞吐量和时延数据。分别判断4组吞吐量之间最大相差是否超过5%,以及4组时延数据的最大相差是否超过5%,若都未超过,则评定当前系统的性能均衡性良好,反之则为性能均衡性较差。
本申请提供一种多图形处理器性能均衡性测试方法,通过安装图形处理器驱动等形式搭建用于进行图形处理器测试的测试环境;进一步的,对在混合异构计算系统中被识别到的所有图形处理器进行并行测试,模拟混合异构计算系统在实际应用中各图形处理器的工作环境;进而监控、采集各图形处理器的性能参数指标,以得到并行测试结果,从而根据并行测试结果直观地判断出各图形处理器之间是否存在较为明显的性能差异,得到最终的性能均衡性结果。通过本方法填补目前在混合异构计算系统中对于多图形处理器之间性能均衡调整上的空缺,为其提供数据支持,指导技术人员该如何调整主板硬件链路设计的不均衡问题,从而及时排除隐患,并且提高整个混合异构计算系统的图形、图像数据的处理能力。
另一方面,对于上述实施例中各图形处理器并行测试的实现方案,本实施例同样提供一种可能的实施方式,也即上述的步骤S12:对识别到的各图形处理器进行并行测试具体包括:
将识别到的各图形处理器放入预先建立的测试队列中,并调用预设的测试进程对测试队列中的各图形处理器进行测试。
本实施例通过测试队列对图形处理器的并行测试进行管理,仅当图形处理器被放入测试队列后,才允许通过预先建立的测试进程对其进行测试。上述的测试进程也即上述实施例中所述的用于实现测试图形处理器流程的软件实现方式。
对于识别到的各图形处理器,需要依次放入到测试队列中以进行后续的并行测试。就以目前常用的由队列控制的进程方式而言,各图形处理器对应的测试进程需要一个一个地被添加到测试队列中,并不能实现完全同时开启的并行测试,但考虑到测试进程被添加到测试队列中的间隔很短,通常在1秒左右,而对于图形处理器的完整测试流程又通常需要10分钟左右的耗时,所以各图形处理器的测试进程被添加至测试队列中的间隔可以忽略不计,近似达到同时开始的并行测试效果。
又或者,在一种可能的实施方式中,测试队列中对应于不同图形处理器的测试进程不是在被添加至测试队列中即开始执行,而是通过统一的触发条件同时控制执行开始,具体的,可以包括:
在识别各图形处理器时,还获取图形处理器的数量;
当测试队列中的测试进程数量等于所识别到的图形处理器的总数量时,开启测试进程。
通过上述方法可以实现混合异构计算系统中各图形处理器测试进程的同一开启,那么相应的,上述的测试进程在测试时长相同的情况下可以实现同时关闭(执行完毕的测试进程被移出测试队列),使得据此获取的各图形处理器的测试结果都是基于完全相同时段的并行运行所得到的测试结果,可以更好地反映出各图形处理器之间的性能均衡性问题,从而在评定混合异构计算系统中各图形处理器之间的性能均衡性时,得到更为准确的评定结果。
进一步的,为更好地满足用户的使用体验和实际需求,本实施例在上述实施例的基础上,还提供一种可能的实施方案,上述的多图形处理器性能均衡性测试方法还包括:
S14:当接收到由用户端发送的测试进度查询指令时,查看测试队列中各测试进程的状态,以返回相应的测试进度结果。
相应的,上述的测试进度结果可以是以百分比的形式显示的。其中,百分比的具体含义可以是完成整个测试过程所需总时间与当前进行测试时间的百分比。上述的完成整个测试过程所需的总时间可根据历史测试进程数据进行确定,又或者根据测试环境搭建时为各图形处理器所设置的测试时长确定,本实施例对此不做限制。在另一种可能的实施方案中,也可以是已获取的结果数据的数量与待获取的结果数据的总数量之间的比值,以百分比的形式显示。
此外,返回的测试进度结果和各测试进程之间应有对应关系,也即,上述的测试进度结果可以是分别一一对应于各测试进程的进度具体数值,也可以是包括一一对应于不同测试进程的各个进度具体数值的结果,以报告等形式存在,本实施例同样对此不做限制,可根据实际需要选择合适的实施方案。
需要说明的是,上述实施例提供的查询测试进程进度的实施方案中,关于用户端发送的测试进度查询指令,可通过调用预留接口的方式实现,也即用户端通过访问测试系统中用于与外部设备通信的接口实现测试进度查询指令的输入,通过与测试进度查询指令唯一对应的接口还可以实现指令的简化,即调用对应接口即表明测试系统接收到对应的指令。
还需要说明的是,步骤S14为一种根据用户端输入的测试进度查询指令触发的步骤,所以其与上述测试方法中的其它步骤之间皆无前后顺序关系限制,但通常而言,仅当开始并行测试之后,测试进度查询才有意义(即能反馈正确的进度查询结果,并行测试完成也即进度结果为百分百,同样有意义),所以步骤S14一般在步骤S12之后触发,但步骤S14的触发判断应该是一个长期的、实时的过程。
另一方面,除去上述实施例所提供的测试进度查询方案之外,在混合异构计算系统的多图形处理器并行测试中,还需要输出相应的测试结果,具体的,本实施例提供一种可能的实施方案,上述方法还包括:
S15:根据并行测试结果和性能均衡性结果生成对应的测试报告,并存储在指定路径下的可拆卸存储介质中。
关于本实施例中的测试报告,至少包括但不限于:测试框架、模型;数据精度;吞吐量(主要以每秒查询数QPS作为量化指标);时延数据等。
其中,测试框架、模型用于表示本次图形处理器并行测试过程所采用的测试框架和测试模型,数据精度则表征本次测试过程中所设置的数据精度,同样在搭建测试环境过程中进行设置。
在上述各图形处理器对应的测试结果中,每一图形处理器所对应的测试框架、测试模型、数据精度等结果项应是完全一致的,表征本次并行测试进程中各图形处理器是基于相同的测试环境进行测试的,因而可以获得更准确的性能均衡性测试结果。至于吞吐量和时延数据的具体表征含义以及如何据此判断混合异构计算系统的多图形处理器的性能均衡性好坏,都于上述实施例中做出说明,故本实施例在此不再赘述。
更进一步的,上述的测试报告还可以包括测试时间、测试编号等等数据项,用于实现区分不同多图形处理器并行测试过程等目的。上述的测试进程可根据提前设置的存储路径被存放至指定的存储介质中。在一种可能的实施方案中,上述提前设置的存储路径指向测试系统外接存储介质的接口,也即,测试系统外设有连接存储介质的接口,且该接口为可拆卸式的,可连接U盘等外置可拆卸存储介质。上述方法中生成的测试报告被存储于可拆卸式存储介质中,方便测试人员获取并携带相应的测试结果,进而通过其他设备分析性能均衡性结果或使用该结果用于其他数据处理任务。
除此之外,若用于进行上述的多图形处理器性能均衡性测试方法的测试系统中包含显示装置,则上述的测试报告也可在显示装置中进行展示,方便测试人员直观地掌握并确定多图形处理器并行测试的性能均衡性测试结果,上述的测试结果可以是以文字、图像、表格等形式表示,本实施例对此不做限制,可根据显示装置所支持显示的内容形式以及实际测试所需确定。
还需要说明的是,步骤S15生成的测试报告同样需要在步骤S13之后才能生成有意义内容,故步骤S15一般需要在一次并行测试结束之后(即某一次步骤S13结束之后)触发实现。
本实施例所提供的实施方案给出了一种对多图形处理器进行并行测试的一种可能的管理方案,当图形管理器的驱动被安装好后,测试系统可以识别到其上搭载的图形处理器,进一步还可以根据图形处理器与测试系统物理连接时插放的槽位顺序为其进行区分;将每张图形处理器依次(例如按照插放的槽位顺序)放入到测试队列后,通过检测进程数量与识别到的图形处理器数量是否一致判断是否开始并行测试,当测试队列中的进程数为零时,结束整个并行测试流程,得到最终的性能均衡性结果。另一方面,本实施例还提供一种可能的实施方案,使得在混合异构计算系统的多图形处理器性能均衡性测试过程中,支持测试进度查询功能,可以利用测试系统的接口实现查询指令的输入,进而返回相应的测试进度结果;对于测试进度的具体量化,可以是基于当前测试时长与搭建测试环境时所设置的测试总时长之间的比值确定,以百分比的形式直观展示给测试人员,方便其及时掌握测试进度。另一方面,本实施例还在获取到性能均衡性结果之后,结合并行测试结果生成对应的测试报告,对结果数据进行整理、归纳,方便测试人员查看,并且将测试报告存储在指定路径下的可拆卸存储介质中,从而方便测试人员根据实际需要将测试结果数据进行携带、转移,以实现更灵活的性能均衡性分析。
在上述实施例中,对于一种多图形处理器性能均衡性测试方法进行了详细描述,本申请还提供一种多图形处理器性能均衡性测试装置对应的实施例。需要说明的是,本申请从两个角度对装置部分的实施例进行描述,一种是基于功能模块的角度,另一种是基于硬件的角度。
基于功能模块的角度,如图3所示,本实施例提供一种多图形处理器性能均衡性测试装置,包括:
识别模块21,用于安装图形处理器驱动,并识别系统中所搭载的各图形处理器;
测试模块22,用于对识别到的各图形处理器进行并行测试,以获取并行测试结果;
确定模块23,用于根据各图形处理器的并行测试结果,确定各图形处理器之间的性能均衡性结果。
另一方面,上述的测试模块中的对识别到的各图形处理器进行并行测试包括:
将识别到的各图形处理器放入预先建立的测试队列中,并调用预设的测试进程对测试队列中的各图形处理器进行测试,以获取并行测试结果。
另一方面,上述的测试模块中的调用预设的测试进程对测试队列中的各图形处理器进行测试包括:
当测试队列中的测试进程数量等于所识别到的图形处理器的总数量时,开启测试进程。
另一方面,上述的多图形处理器性能均衡性测试装置还包括:
查询模块,用于当接收到由用户端发送的测试进度查询指令时,查看测试队列中各测试进程的状态,以返回相应的测试进度结果。
另一方面,上述的并行测试结果具体包括:吞吐量和时延数据。
另一方面,上述的确定模块中的根据各图形处理器的并行测试结果,确定各图形处理器之间的性能均衡性结果包括:
比较各图形处理器的吞吐量和时延数据;
若吞吐量和时延数据的最大差值均不大于预设的均衡阈值,则性能均衡性结果为良好,否则为较差。
另一方面,上述的多图形处理器性能均衡性测试装置还包括:
报告模块,用于根据并行测试结果和性能均衡性结果生成对应的测试报告,并存储在指定路径下的可拆卸存储介质中。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本实施例提供一种多图形处理器性能均衡性测试装置,通过安装图形处理器驱动等形式搭建用于进行图形处理器测试的测试环境;进一步的,对在混合异构计算系统中被识别模块识别到的所有图形处理器利用测试模块进行并行测试,模拟混合异构计算系统在实际应用中各图形处理器的工作环境;进而监控、采集各图形处理器的性能参数指标,以得到并行测试结果,从而确定模块可以根据并行测试结果直观地判断出各图形处理器之间是否存在较为明显的性能差异,得到最终的性能均衡性结果。通过本装置填补目前在混合异构计算系统中对于多图形处理器之间性能均衡调整上的空缺,为其提供数据支持,指导技术人员该如何调整主板硬件链路设计的不均衡问题,从而及时排除隐患,并且提高整个混合异构计算系统的图形、图像数据的处理能力。
图4为本申请另一实施例提供的一种多图形处理器性能均衡性测试装置的结构图,如图4所示,一种多图形处理器性能均衡性测试装置包括:存储器30,用于存储计算机程序;
处理器31,用于执行计算机程序时实现如上述实施例一种多图形处理器性能均衡性测试方法的步骤。
本实施例提供的一种多图形处理器性能均衡性测试装置可以包括但不限于工作站、笔记本电脑或台式电脑等。
其中,处理器31可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器31可以采用数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器31也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(CentralProcessing Unit,CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器31可以集成有图像处理器(Graphics Processing Unit,GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器31还可以包括人工智能(Artificial Intelligence,AI)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器30可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器30还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器30至少用于存储以下计算机程序301,其中,该计算机程序被处理器31加载并执行之后,能够实现前述任一实施例公开的一种多图形处理器性能均衡性测试方法的相关步骤。另外,存储器30所存储的资源还可以包括操作系统302和数据303等,存储方式可以是短暂存储或者永久存储。其中,操作系统302可以包括Windows、Unix、Linux等。数据303可以包括但不限于一种多图形处理器性能均衡性测试方法等。
在一些实施例中,一种多图形处理器性能均衡性测试装置还可包括有显示屏32、输入输出接口33、通信接口34、电源35以及通信总线36。
本领域技术人员可以理解,图4中示出的结构并不构成对一种多图形处理器性能均衡性测试装置的限定,可以包括比图示更多或更少的组件。
本申请实施例提供的一种多图形处理器性能均衡性测试装置,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如下方法:一种多图形处理器性能均衡性测试方法。
本实施例所提供的一种多图形处理器性能均衡性测试装置,通过处理器执行保存在存储器中的计算机程序,以通过安装图形处理器驱动等形式搭建用于进行图形处理器测试的测试环境;进一步的,对在混合异构计算系统中被识别到的所有图形处理器进行并行测试,模拟混合异构计算系统在实际应用中各图形处理器的工作环境;进而监控、采集各图形处理器的性能参数指标,以得到并行测试结果,从而根据并行测试结果直观地判断出各图形处理器之间是否存在较为明显的性能差异,得到最终的性能均衡性结果。通过本方法填补目前在混合异构计算系统中对于多图形处理器之间性能均衡调整上的空缺,为其提供数据支持,指导技术人员该如何调整主板硬件链路设计的不均衡问题,从而及时排除隐患,并且提高整个混合异构计算系统的图形、图像数据的处理能力。
最后,本申请还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例所提供的一种计算机可读取存储介质,当其中存储的计算机程序被执行时,可以通过安装图形处理器驱动等形式搭建用于进行图形处理器测试的测试环境;进一步的,对在混合异构计算系统中被识别到的所有图形处理器进行并行测试,模拟混合异构计算系统在实际应用中各图形处理器的工作环境;进而监控、采集各图形处理器的性能参数指标,以得到并行测试结果,从而根据并行测试结果直观地判断出各图形处理器之间是否存在较为明显的性能差异,得到最终的性能均衡性结果。通过本实施例提供的测试方案可以填补目前在混合异构计算系统中对于多图形处理器之间性能均衡调整上的空缺,为其提供数据支持,指导技术人员该如何调整主板硬件链路设计的不均衡问题,从而及时排除隐患,并且提高整个混合异构计算系统的图形、图像数据的处理能力。
以上对本申请所提供的一种多图形处理器性能均衡性测试方法、装置及其介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (10)
1.一种多图形处理器性能均衡性测试方法,其特征在于,包括:
安装图形处理器驱动,并识别系统中所搭载的各图形处理器;
对识别到的各所述图形处理器进行并行测试,以获取并行测试结果;
根据各所述图形处理器的所述并行测试结果,确定各所述图形处理器之间的性能均衡性结果。
2.根据权利要求1所述的多图形处理器性能均衡性测试方法,其特征在于,所述对识别到的各所述图形处理器进行并行测试包括:
将识别到的各所述图形处理器放入预先建立的测试队列中,并调用预设的测试进程对所述测试队列中的各所述图形处理器进行测试。
3.根据权利要求2所述的多图形处理器性能均衡性测试方法,其特征在于,调用预设的测试进程对所述测试队列中的各所述图形处理器进行测试包括:
当所述测试队列中的所述测试进程数量等于所识别到的所述图形处理器的总数量时,开启所述测试进程。
4.根据权利要求2所述的多图形处理器性能均衡性测试方法,其特征在于,还包括:
当接收到由用户端发送的测试进度查询指令时,查看所述测试队列中各测试进程的状态,以返回相应的测试进度结果。
5.根据权利要求1至4任意一项所述的多图形处理器性能均衡性测试方法,其特征在于,所述并行测试结果包括:吞吐量和时延数据。
6.根据权利要求5所述的多图形处理器性能均衡性测试方法,其特征在于,根据各所述图形处理器的所述并行测试结果,确定各所述图形处理器之间的性能均衡性结果包括:
比较各所述图形处理器的吞吐量和时延数据;
若所述吞吐量和所述时延数据的最大差值均不大于预设的均衡阈值,则所述性能均衡性结果为良好,否则为较差。
7.根据权利要求6所述的多图形处理器性能均衡性测试方法,其特征在于,还包括:
根据所述并行测试结果和所述性能均衡性结果生成对应的测试报告,并存储在指定路径下的可拆卸存储介质中。
8.一种多图形处理器性能均衡性测试装置,其特征在于,包括:
识别模块,用于安装图形处理器驱动,并识别系统中所搭载的各图形处理器;
测试模块,用于对识别到的各所述图形处理器进行并行测试,以获取并行测试结果;
确定模块,用于根据各所述图形处理器的所述并行测试结果,确定各所述图形处理器之间的性能均衡性结果。
9.一种多图形处理器性能均衡性测试装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任意一项所述的多图形处理器性能均衡性测试方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的多图形处理器性能均衡性测试方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310576335.7A CN116560928A (zh) | 2023-05-19 | 2023-05-19 | 一种多图形处理器性能均衡性测试方法、装置及其介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310576335.7A CN116560928A (zh) | 2023-05-19 | 2023-05-19 | 一种多图形处理器性能均衡性测试方法、装置及其介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116560928A true CN116560928A (zh) | 2023-08-08 |
Family
ID=87501635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310576335.7A Pending CN116560928A (zh) | 2023-05-19 | 2023-05-19 | 一种多图形处理器性能均衡性测试方法、装置及其介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116560928A (zh) |
-
2023
- 2023-05-19 CN CN202310576335.7A patent/CN116560928A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8055493B2 (en) | Sizing an infrastructure configuration optimized for a workload mix using a predictive model | |
CN106294120B (zh) | 测试代码的方法、设备和计算机程序产品 | |
CN106354645B (zh) | 基于后台系统服务或接口的测试方法和测试平台 | |
CN110377520B (zh) | 交易场景的测试方法及装置、电子设备和可读存储介质 | |
CN106775968A (zh) | 一种服务器测试方法、装置及系统 | |
CN111563014A (zh) | 接口服务性能测试方法、装置、设备和存储介质 | |
CN114564374A (zh) | 算子性能评估方法、装置、电子设备及存储介质 | |
CN107038120A (zh) | 一种软件测试方法和设备 | |
CN109144846B (zh) | 用于测试服务器的测试方法和装置 | |
CN109857643A (zh) | 一种虚拟化平台性能自动测试的方法及装置 | |
CN113419941A (zh) | 评估方法及装置、电子设备和计算机可读存储介质 | |
CN117235527A (zh) | 端到端容器化的大数据模型构建方法、装置、设备及介质 | |
CN111782266A (zh) | 软件性能基准确定方法及装置 | |
CN116560928A (zh) | 一种多图形处理器性能均衡性测试方法、装置及其介质 | |
CN115952098A (zh) | 一种性能测试调优方案推荐方法及系统 | |
CN116450483A (zh) | 一种确定软件分配的负载的方法、装置、服务器及介质 | |
CN113590498B (zh) | 一种桌面操作系统应用启动时间的测试方法及系统 | |
US20040205730A1 (en) | System and method for building libraries and groups of computer programs | |
CN113806224A (zh) | 集成化的测试方法及装置 | |
Hauck et al. | Automatic derivation of performance prediction models for load-balancing properties based on goal-oriented measurements | |
CN114880203A (zh) | 用于量子计算云平台测评的装置、系统及方法 | |
CN106855840B (zh) | 一种系统cpu分析方法和装置 | |
CN115225548B (zh) | 一种服务器对云桌面承载能力的评估方法与存储介质 | |
CN109376081A (zh) | 测试策略的生成方法和装置 | |
KR102251743B1 (ko) | 정보 제공 장치의 보수 관리 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |