CN110413462B - 一种服务器压力测试方法与装置 - Google Patents
一种服务器压力测试方法与装置 Download PDFInfo
- Publication number
- CN110413462B CN110413462B CN201910580765.XA CN201910580765A CN110413462B CN 110413462 B CN110413462 B CN 110413462B CN 201910580765 A CN201910580765 A CN 201910580765A CN 110413462 B CN110413462 B CN 110413462B
- Authority
- CN
- China
- Prior art keywords
- server
- gpu
- mode
- test
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 121
- 230000015654 memory Effects 0.000 claims abstract description 83
- 238000000034 method Methods 0.000 claims abstract description 54
- 230000008569 process Effects 0.000 claims abstract description 16
- 238000012544 monitoring process Methods 0.000 claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims description 32
- 238000009662 stress testing Methods 0.000 claims description 29
- 238000012549 training Methods 0.000 claims description 13
- 229940050561 matrix product Drugs 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 3
- 230000001360 synchronised effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 6
- 238000001514 detection method Methods 0.000 abstract 1
- 238000004590 computer program Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2273—Test methods
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Investigating Strength Of Materials By Application Of Mechanical Stress (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
本发明公开了一种服务器压力测试方法与装置包括:为服务器提供压力测试环境;根据测试参数决定使用平稳加压方式或抖动加压方式测试服务器的GPU,或同时测试服务器的GPU、CPU、和内存;在测试过程中监控并显示服务器的工作参数,根据工作参数评价服务器的稳定性和可靠性。本发明能够针对不同服务器检测稳定性和可靠性,筛选出适于用作人工智能计算的服务器。
Description
技术领域
本发明涉及计算机领域,更具体地,特别是指一种服务器压力测试方法与装置。
背景技术
人工智能需要在AI服务器上使用各种深度学习框架进行模型训练。由于模型训练需要使用大量数据集进行长时间的训练,同时使用分布式集群实现单机多卡和多机多卡训练,导致要求AI服务器具有高稳定性和高可靠性。如果训练因AI服务器而中断,会造成金钱和时间上的损失,但是现有技术缺乏高水平的检测AI服务器稳定性和可靠性的方法。
针对现有技术中服务器难以检测稳定性和可靠性的问题,目前尚未有有效的解决方案。
发明内容
有鉴于此,本发明实施例的目的在于提出一种服务器压力测试方法与装置,能够针对不同服务器检测稳定性和可靠性,筛选出适于用作人工智能计算的服务器。
基于上述目的,本发明实施例的第一方面提供了一种服务器压力测试方法,包括执行以下步骤:
为服务器提供压力测试环境;
根据测试参数决定使用平稳加压方式或抖动加压方式测试服务器的GPU,或同时测试服务器的GPU、CPU、和内存;
在测试过程中监控并显示服务器的工作参数,根据工作参数评价服务器的稳定性和可靠性。
在一些实施方式中,测试参数包括测试模式信息;测试模式包括:使用平稳加压方式仅测试服务器的GPU的第一模式;使用抖动加压方式仅测试服务器的GPU的第二模式;使用平稳加压方式同时测试服务器的GPU、CPU、和内存的第三模式;和使用抖动加压方式同时测试服务器的GPU、CPU、和内存的第四模式。
在一些实施方式中,测试参数还包括运算参数;执行第一模式的压力测试包括以持续占用GPU的全部频率、显存和位宽的方式执行以下步骤:
基于运算参数确定被运算矩阵的形态,并执行被运算矩阵在其形态下的矩阵乘积;
基于运算参数累加矩阵乘积。
在一些实施方式中,执行第三模式的压力测试包括:在测试服务器的GPU的同时,还以相同的方式测试服务器的CPU和内存。
在一些实施方式中,测试参数还包括运算参数;执行第二模式的压力测试包括以在占用GPU的全部频率、显存和位宽,和不占用GPU的任何频率、显存和位宽之间进行多次突然切换的方式执行以下步骤:
基于运算参数确定被运算矩阵的形态,并执行被运算矩阵在其形态下的矩阵乘积;
基于运算参数累加矩阵乘积。
在一些实施方式中,执行第四模式的压力测试包括:在测试服务器的GPU的同时,还以相同的方式测试服务器的CPU和内存,其中服务器的GPU的压力抖动与服务器的CPU和内存的压力抖动同步。
在一些实施方式中,在占用GPU的全部频率、显存和位宽,和不占用GPU的任何频率、显存和位宽之间进行突然切换包括:使用神经网络框架训练数据集,根据神经网络框架的学习率和调整参数的更新速度而适应性地在占用GPU的全部频率、显存和位宽,和不占用GPU的任何频率、显存和位宽之间进行突然切换。
在一些实施方式中,工作参数包括以下至少之一:温度、功耗、频率;方法还包括:响应于存在超过相应的预设阈值的工作参数而以易于引起注意的方式显示超过相应的预设阈值的工作参数。
本发明实施例的第二方面提供了一种服务器压力测试装置,包括:
初始化模块,用于为服务器提供压力测试环境;
测试模块,用于根据测试参数使用平稳加压方式或抖动加压方式测试服务器的GPU,或同时测试服务器的GPU、CPU、和内存;
结果模块,用于在测试过程中监控并显示服务器的工作参数,根据工作参数评价服务器的性能。
本发明实施例的第三方面提供了一种服务器,包括:
多个GPU;
CPU和内存;
处理器;和
存储器,存储有处理器可运行的程序代码,程序代码在被运行时执行上述的服务器压力测试方法。
本发明具有以下有益技术效果:本发明实施例提供的服务器压力测试方法与装置,通过为服务器提供压力测试环境;根据测试参数使用平稳加压方式或抖动加压方式测试服务器的GPU,或同时测试服务器的GPU、CPU、和内存;在测试过程中监控并显示服务器的工作参数,根据工作参数评价服务器的稳定性和可靠性的技术方案,能够针对不同服务器检测稳定性和可靠性,筛选出适于用作人工智能计算的服务器。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的服务器压力测试方法的流程示意图;
图2为本发明提供的服务器压力测试方法的测试模式示意图;
图3为本发明提供的服务器压力测试方法的GPU抖动加压方法示意图;
图4为本发明提供的服务器压力测试方法的服务器物理部署示意图;
图5为本发明提供的服务器压力测试方法的详细流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
基于上述目的,本发明实施例的第一个方面,提出了一种能够针对不同服务器检测稳定性和可靠性的服务器压力测试方法的一个实施例。图1示出的是本发明提供的服务器压力测试方法的流程示意图。
所述服务器压力测试方法,如图1所示,包括执行以下步骤:
步骤S101:为服务器提供压力测试环境;
步骤S103:根据测试参数决定使用平稳加压方式或抖动加压方式测试服务器的GPU,或同时测试服务器的GPU、CPU、和内存;
步骤S105:在测试过程中监控并显示服务器的工作参数,根据工作参数评价服务器的稳定性和可靠性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。所述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
本发明实施例使用imagenet数据集和tesorflow、caffe、pytorch等深度学习框架和ResNet、VGGNet等网络模型对GPU持续满载平稳加压和抖动加压。为了进一步测试AI服务器性能,在对GPU进行加压时,同时对服务器的CPU进行加压,实现服务器的整机加压。整机加压也可以分为持续满载平稳整机加压和抖动整机加压,其逻辑视图如附图2所示。在图2中,持续平稳GPU加压为M1模式;抖动GPU加压为M2模式;持续平稳整机加压为M3模式;抖动整机加压为M4模式。
同时,监控GPU和CPU以及内存的温度、功耗、频率是否正常,还通过实时显示界面显示GPU、CPU的各项参数,以及系统总功耗,并根据设置的阈值,调整显示的颜色,超过设置的阈值,温度、频率和功耗等状态栏,都会显示红色,进行闪烁提示。
在一些实施方式中,测试参数包括测试模式信息;测试模式包括:使用平稳加压方式仅测试服务器的GPU的第一模式;使用抖动加压方式仅测试服务器的GPU的第二模式;使用平稳加压方式同时测试服务器的GPU、CPU、和内存的第三模式;和使用抖动加压方式同时测试服务器的GPU、CPU、和内存的第四模式。
在一些实施方式中,测试参数还包括运算参数;执行第一模式的压力测试包括以持续占用GPU的全部频率、显存和位宽的方式执行以下步骤:
基于运算参数确定被运算矩阵的形态,并执行被运算矩阵在其形态下的矩阵乘积;
基于运算参数累加矩阵乘积。
在一些实施方式中,执行第三模式的压力测试包括:在测试服务器的GPU的同时,还以相同的方式测试服务器的CPU和内存。
在一些实施方式中,测试参数还包括运算参数;执行第二模式的压力测试包括以在占用GPU的全部频率、显存和位宽,和不占用GPU的任何频率、显存和位宽之间进行多次突然切换的方式执行以下步骤:
基于运算参数确定被运算矩阵的形态,并执行被运算矩阵在其形态下的矩阵乘积;
基于运算参数累加矩阵乘积。
对GPU、CPU和内存进行持续平稳加压能够持续保持100%使用GPU的显存、核芯、以及内存空间,同时GPU的使用率始终保持100%,确保AI服务器能够保持长时间的极限压力。抖动模式可以对GPU显存和使用率、CPU核的使用率,内存的使用率进行抖动测试,达到瞬间显存和使用率为0,或瞬间显存和使用率满载。具体的抖动模式有矩形波、锯齿波、三角波、阶梯波、正弦波浪线和不规则随机波形抖动方式。
在一些实施方式中,执行第四模式的压力测试包括:在测试服务器的GPU的同时,还以相同的方式测试服务器的CPU和内存,其中服务器的GPU的压力抖动与服务器的CPU和内存的压力抖动同步或异步。
在一些实施方式中,在占用GPU的全部频率、显存和位宽,和不占用GPU的任何频率、显存和位宽之间进行突然切换包括:使用神经网络框架训练数据集时,根据神经网络框架的学习率和调整参数的更新速度而适应性地在占用GPU的全部频率、显存和位宽,和不占用GPU的任何频率、显存和位宽之间进行突然切换。
在一些实施方式中,工作参数包括以下至少之一:温度、功耗、频率;方法还包括:响应于存在超过相应的预设阈值的工作参数而以易于引起注意的方式显示超过相应的预设阈值的工作参数。
根据本发明实施例公开的方法还可以被实现为由CPU执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被CPU执行时,执行本发明实施例公开的方法中限定的上述功能。上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
下面根据图5所示的具体实施例进一步阐述本发明的详细实施方式。
启动服务器压力测试装置后首先检查服务器环境,是否具备运行条件。如果不具备,例如服务器驱动和工具版本不正确,则提示安装或直接自动安装所需驱动和工具。根据启动时输入的参数选择加压模式,进入相应的加压模块加压。
在M1模式中,启动设计的加压程序时输入参数,程序根据输入的参数进行判断启动相应的模式进行GPU加压,程序运行时,获取GPU显存总量,根据显存总量分配计算需要的显存以100%使用显存进行矩阵运算。运算时,GPU使用率始终达到100%,持续满载状态进行GPU加压,通过显示界面观察GPU状态。加压程序初始化时获取GPU的型号,数量以及显存空间,根据初始值,最大化的分配GPU资源,进行矩阵运算或者通过tensorflow、caffe等框架使用imagenet数据集进行训练,保证GPU能够稳定的持续满载运行。其矩阵运算公式为:
C=αop(A)op(B)+βC
其中AB是待运算矩阵,T是转置矩阵,H是共轭矩阵,是否使用转置矩阵或共轭矩阵取决于输入参数。
在M2模式中,根据幅值数值和时间数组,以及不同矩阵计算公式实现矩形波、锯齿波等不同波形的抖动方式。调节过程中,抖动的使用GPU显存和改变GPU使用率,使GPU的利用率和运算性能突然之间达到最高、突然之间降到最低,以充分测试GPU性能。M2模式可以使用与M1模式相同的矩阵运算公式。在程序进行矩阵运算时,除了随机的调整GPU卡数量和显存资源,也可以建立随机的调整时间或者时间数组,按照调整时间,根据随机矩阵幅值或者设置的矩阵幅值数组,调整矩阵运算,也可以调整矩阵的维度,实现抖动的利用GPU资源。
另一方面也可以在利用tensorflow、caffe等框架进行imagenet数据集进行模型训练时修改batch的值,随机选取部分训练数据,使用指数衰减的学习率,调整参数的更新速度,同时根据调整时间,随机的调整GPU卡的数量和显存资源,实现GPU抖动加压.其实现过程如附图4所示。在抖动调节过程中,为了更充分的验证GPU性能,还可以切换GPU加压运算方法,切换矩阵运算和框架的模型训练。
单一的进行GPU加压,不能够测试出AI服务器训练深度学习任务的稳定性和可靠性。在M3模式中,在对GPU进行加压测试时,同时对系统的CPU和内存进行压力测试,充分测试服务器在复杂环境下的性能。服务器的整机平稳加压是在GPU平稳加压的基础上,对CPU和内存也平稳加压,将CPU剩余的核和空闲的内存都利用起来,通过算法进行逻辑运算和判断,将CPU加热到所能承受的极限温度,同时不断检测CPU在超频时发生的运算错误,保证GPU加压正常运行的前提下,发挥CPU的最大效能,测试AI服务器的性能。
为了适应更加复杂的环境,在M4模式中,在对GPU进行抖动测试时,同时对CPU和内存也进行抖动测试,程序随机的改变CPU压力测试的核数和内存压力测试的大小,根据时间数组,随机的进行动态调整,使CPU和内存瞬时达到满载状态,进行最大压力测试,瞬时达到空载状态,进行最小压力测试,实现锯齿波、矩形波等波形状态的抖动,也能够进行随机的抖动测试,充分测试服务器的性能。服务器的整机抖动加压是在GPU抖动加压的基础上,对CPU和内存也进行抖动加压,通过调整时间,随机的调整CPU加压的核数和内存的加压大小,通过调整异或、加减乘除、与或等运算,以及调整内存加压次数等,实现GPU、CPU和内存的抖动加压,进而实现对整机的抖动加压。
在进行测试时,监控方每秒刷新一次显示数据,实时监测GPU、CPU、内存和服务器的状态信息,以便确定压力测试在正常运行,同时服务器性能指标也正常。
从上述实施例可以看出,本发明实施例提供的服务器压力测试方法,通过为服务器提供压力测试环境;根据测试参数决定使用平稳加压方式或抖动加压方式测试服务器的GPU,或同时测试服务器的GPU、CPU、和内存;在测试过程中监控并显示服务器的工作参数,根据工作参数评价服务器的稳定性和可靠性的技术方案,能够针对不同服务器检测稳定性和可靠性,筛选出适于用作人工智能计算的服务器。
需要特别指出的是,上述服务器压力测试方法的各个实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于服务器压力测试方法也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在所述实施例之上。
基于上述目的,本发明实施例的第二个方面,提出了一种能够针对不同服务器检测稳定性和可靠性的服务器压力测试装置的一个实施例。服务器压力测试装置包括:
初始化模块,用于为服务器提供压力测试环境;
测试模块,用于根据测试参数决定使用平稳加压方式或抖动加压方式测试服务器的GPU,或同时测试服务器的GPU、CPU、和内存;
结果模块,用于在测试过程中监控并显示服务器的工作参数,根据工作参数评价服务器的性能。
结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现所述的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
基于上述目的,本发明实施例的第三个方面,提出了一种能够针对不同服务器检测稳定性和可靠性的服务器的一个实施例。服务器包括:
多个GPU;
CPU和内存;
处理器;和
存储器,存储有处理器可运行的程序代码,程序代码在被运行时执行上述的服务器压力测试方法。
从上述实施例可以看出,本发明实施例提供的服务器压力测试装置和服务器,通过为服务器提供压力测试环境;根据测试参数决定使用平稳加压方式或抖动加压方式测试服务器的GPU,或同时测试服务器的GPU、CPU、和内存;在测试过程中监控并显示服务器的工作参数,根据工作参数评价服务器的稳定性和可靠性的技术方案,能够针对不同服务器检测稳定性和可靠性,筛选出适于用作人工智能计算的服务器。
需要特别指出的是,上述服务器压力测试装置和服务器的实施例采用了所述服务器压力测试方法的实施例来具体说明各模块的工作过程,本领域技术人员能够很容易想到,将这些模块应用到所述服务器压力测试方法的其他实施例中。当然,由于所述服务器压力测试方法实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于所述服务器压力测试装置和服务器也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在所述实施例之上。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上所述的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
Claims (9)
1.一种服务器压力测试方法,其特征在于,包括执行以下步骤:
为服务器提供压力测试环境;
根据测试参数决定使用平稳加压方式或抖动加压方式测试服务器的GPU,或同时测试服务器的GPU、CPU、和内存,其中,所述测试参数包括测试模式信息,所述测试模式包括:使用平稳加压方式仅测试服务器的GPU的第一模式,使用抖动加压方式仅测试服务器的GPU的第二模式,使用平稳加压方式同时测试服务器的GPU、CPU、和内存的第三模式,和使用抖动加压方式同时测试服务器的GPU、CPU、和内存的第四模式;
在测试过程中监控并显示服务器的工作参数,根据所述工作参数评价服务器的稳定性和可靠性。
2.根据权利要求1所述的方法,其特征在于,所述测试参数还包括运算参数;执行第一模式的压力测试包括以持续占用GPU的全部频率、显存和位宽的方式执行以下步骤:
基于所述运算参数确定被运算矩阵的形态,并执行所述被运算矩阵在其所述形态下的矩阵乘积;
基于所述运算参数累加所述矩阵乘积。
3.根据权利要求2所述的方法,其特征在于,执行第三模式的压力测试包括:在测试服务器的GPU的同时,还以相同的方式测试服务器的CPU和内存。
4.根据权利要求1所述的方法,其特征在于,所述测试参数还包括运算参数;
执行第二模式的压力测试包括以在占用GPU的全部频率、显存和位宽,和不占用GPU的任何频率、显存和位宽之间进行多次突然切换的方式执行以下步骤:
基于所述运算参数确定被运算矩阵的形态,并执行所述被运算矩阵在其所述形态下的矩阵乘积;
基于所述运算参数累加所述矩阵乘积。
5.根据权利要求4所述的方法,其特征在于,执行第四模式的压力测试包括:在测试服务器的GPU的同时,还以相同的方式测试服务器的CPU和内存,其中服务器的GPU的压力抖动与服务器的CPU和内存的压力抖动同步。
6.根据权利要求4所述的方法,其特征在于,在占用GPU的全部频率、显存和位宽,和不占用GPU的任何频率、显存和位宽之间进行突然切换包括:
使用神经网络框架训练数据集,根据神经网络框架的学习率和调整参数的更新速度而适应性地在占用GPU的全部频率、显存和位宽,和不占用GPU的任何频率、显存和位宽之间进行突然切换。
7.根据权利要求1所述的方法,其特征在于,所述工作参数包括以下至少之一:温度、功耗、频率;
方法还包括:响应于存在超过相应的预设阈值的工作参数而以易于引起注意的方式显示所述超过相应的预设阈值的工作参数。
8.一种服务器压力测试装置,其特征在于,包括:
初始化模块,用于为服务器提供压力测试环境;
测试模块,用于根据测试参数决定使用平稳加压方式或抖动加压方式测试服务器的GPU,或同时测试服务器的GPU、CPU、和内存,其中,所述测试参数包括测试模式信息,所述测试模式包括:使用平稳加压方式仅测试服务器的GPU的第一模式,使用抖动加压方式仅测试服务器的GPU的第二模式,使用平稳加压方式同时测试服务器的GPU、CPU、和内存的第三模式,和使用抖动加压方式同时测试服务器的GPU、CPU、和内存的第四模式;
结果模块,用于在测试过程中监控并显示服务器的工作参数,根据所述工作参数评价服务器的性能。
9.一种服务器,其特征在于,包括:
多个GPU;
CPU和内存;
处理器;和
存储器,存储有处理器可运行的程序代码,所述程序代码在被运行时执行如权利要求1-7中任意一项所述的服务器压力测试方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910580765.XA CN110413462B (zh) | 2019-06-29 | 2019-06-29 | 一种服务器压力测试方法与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910580765.XA CN110413462B (zh) | 2019-06-29 | 2019-06-29 | 一种服务器压力测试方法与装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110413462A CN110413462A (zh) | 2019-11-05 |
CN110413462B true CN110413462B (zh) | 2022-12-06 |
Family
ID=68360033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910580765.XA Active CN110413462B (zh) | 2019-06-29 | 2019-06-29 | 一种服务器压力测试方法与装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110413462B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800138B (zh) * | 2018-12-18 | 2022-07-08 | 平安科技(深圳)有限公司 | 一种cpu测试方法、电子装置及存储介质 |
CN114385426A (zh) * | 2020-10-16 | 2022-04-22 | 长鑫存储技术有限公司 | 存储器测试方法、装置、设备及存储介质 |
CN112650632A (zh) * | 2020-12-04 | 2021-04-13 | 苏州浪潮智能科技有限公司 | 一种运算卡测试方法、系统及介质 |
CN114138579A (zh) * | 2021-11-29 | 2022-03-04 | 苏州浪潮智能科技有限公司 | 基于Prometheus的GPU交互测试的方法、装置、设备及可读介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108984358A (zh) * | 2018-07-18 | 2018-12-11 | 郑州云海信息技术有限公司 | 一种服务器cpu压力测试的方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104079445A (zh) * | 2013-03-29 | 2014-10-01 | 英业达科技有限公司 | 分散式压力测试系统及其方法 |
-
2019
- 2019-06-29 CN CN201910580765.XA patent/CN110413462B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108984358A (zh) * | 2018-07-18 | 2018-12-11 | 郑州云海信息技术有限公司 | 一种服务器cpu压力测试的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110413462A (zh) | 2019-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110413462B (zh) | 一种服务器压力测试方法与装置 | |
US6088804A (en) | Adaptive system and method for responding to computer network security attacks | |
CN106161417A (zh) | 一种异构功能等价体调度装置及其方法 | |
CN106161418B (zh) | 一种异构功能等价体输出服务响应的装置及方法 | |
CN110889111A (zh) | 一种基于深度置信网络的电网虚拟数据注入攻击的检测方法 | |
CN106209856B (zh) | 基于可信计算的大数据安全态势地图生成方法 | |
US20230169320A1 (en) | Signal Processing System and Method | |
Sabbagh et al. | A novel GPU overdrive fault attack | |
JP2007156344A (ja) | プラントシミュレータ | |
CN111159029A (zh) | 自动化测试方法、装置、电子设备及计算机可读存储介质 | |
CN114357479A (zh) | 一种基于随机数的apuf改进方法、装置、系统及存储介质 | |
CN107368058A (zh) | 一种用于设备的故障监测方法、设备和计算机可读介质 | |
US20170141949A1 (en) | Method and apparatus for processing alarm information in cloud computing | |
CN109086819A (zh) | caffemodel模型压缩方法、系统、设备及介质 | |
CN111431561B (zh) | 一种考虑网络攻击的电力系统预想故障集生成方法和装置 | |
CN116228045B (zh) | 基于性能退化的产品可靠性薄弱环节评估方法和装置 | |
CN102970183A (zh) | 一种云监控系统及其数据回流方法 | |
CN114553765B (zh) | 一种ospf邻居震荡处理的方法、装置及介质 | |
CN110659183A (zh) | 一种系统功耗测试方法与装置 | |
CN111025178B (zh) | 一种电源模块主备切换的稳定性测试方法及相关组件 | |
CN112632604B (zh) | 基于多授权审计者的云数据审计方法、系统及装置 | |
CN104092589A (zh) | 一种网络模块及网络模块复位的监测方法 | |
Tomášek et al. | Intrusion detection system based on system behavior | |
CN114138642B (zh) | 一种根据环境状态自动选择适应函数的方法、装置、设备 | |
Albarakati et al. | Empirical electrical-based framework to judge the ability of centrality measures in predicting grid vulnerability |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |