CN104123452B - 基于模糊决策的gpu负载综合评判方法 - Google Patents

基于模糊决策的gpu负载综合评判方法 Download PDF

Info

Publication number
CN104123452B
CN104123452B CN201410341239.5A CN201410341239A CN104123452B CN 104123452 B CN104123452 B CN 104123452B CN 201410341239 A CN201410341239 A CN 201410341239A CN 104123452 B CN104123452 B CN 104123452B
Authority
CN
China
Prior art keywords
mrow
mtd
gpu
msub
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410341239.5A
Other languages
English (en)
Other versions
CN104123452A (zh
Inventor
杨刚
张策
周兴社
杜三盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201410341239.5A priority Critical patent/CN104123452B/zh
Publication of CN104123452A publication Critical patent/CN104123452A/zh
Application granted granted Critical
Publication of CN104123452B publication Critical patent/CN104123452B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种基于模糊决策的GPU的负载评价方法,涉及计算机技术领域,可以正确对GPU的负载进行评价。所述方法包括:针对一个GPU来说,获得n时刻所述GPU的负载向量,然后计算获得n时刻评价负载用的评价负载向量L,综合所述评价负载向量L中的元素utilization,memory,pstates,以及occupancy进行模糊评判,获得模糊判决矩阵R;根据用户给出的诸因素权重分配为:W=(w1,w2,w3,w4)以及模糊判决矩阵计算获得综合评价A,对所述综合评价A进行归一化处理获得A′,根据最大隶属度原则获得所述GPU的负载情况。

Description

基于模糊决策的GPU负载综合评判方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于模糊决策的GPU(GraphicProcessing Unit,图形处理器)的负载评价方法。
背景技术
Kepler GK110(专为英伟达Tesla产品打造CUDA计算架构)由71亿个晶体管组成,可以提供超过每秒1万亿次双精度浮点计算的吞吐量,Kepler架构在电源效率方面,比Fermi的性能/功率比提高了3倍。完整Kepler GK110实施包括15 SMX单元和六个64位内存控制器。拥有192个单精度CUDA(Compute Unified Device Architecture,统一计算设备架构)核,64个双精度单元。
C-RAN(新型无线接入网架构)白皮书指出传统的无线接入网面临的挑战有大量基站导致高额能耗、潮汐效应导致基站利用率低下。把GPU作为资源池,进行基带处理,刚好解决了这个问题。基带处理就要求GPU可以任务级别的并行处理每个用户的需求。
GPU虽然提供了非常强大的数据级并行计算能力,不过对于任务级别的并行有比较大的限制。最新的kepler架构支持同时并发32个核函数。因此为了满足多任务的需求就需要在一个主机上装备多块GPU。对于多GPU系统需要解决GPU之间的负载均衡,才能达到最佳性能,因此正确评价某一个GPU的负载信息至关重要。
发明内容
本发明的实施例提供一种基于模糊决策的GPU的负载评价方法,可以正确地对GPU的负载进行评价。
为达到上述目的,本发明的实施例采用如下技术方案:
一种基于模糊决策的GPU的负载评价方法,包括:
针对一个GPU来说,获得n时刻所述GPU的负载向量。
所述GPU的负载向量表示如下:
Ln=<utilization,memory,pstates,occupancy>
其中,utilization:过去一个样本时间内所述GPU运行一个或者多个核函数的时间占总时间的百分比;memory:所述GPU已用全局内存占总的全局内存的百分比;pstates:即performance state的16个等级,p0(maximum performance)-p15(minimumperformance);occupancy:即achieved occupancy:所述GPU的每个sm中有多个warp调度器,每个调度器有一个硬件性能计数器,用来计数每个时钟周期活跃warp数,每个调度器计数结果之和除以sm活跃的总周期数,就可以得到这个sm的活跃warp数,除以sm理论最大warp数就是kernel执行期间这个sm的occupancy,所有sm的平均值就是整体的occupancy;
获得n时刻评价负载用的评价负载向量L,所述L满足以下公式:
L=70%×Ln+30%×Ln-1
综合所述评价负载向量L中的元素utilization,memory,pstates,以及occupancy进行模糊评判,获得模糊判决矩阵:R=(rij)4×3
根据用户给出的诸因素权重分配为:W=(w1,w2,w3,w4)以及模糊判决矩阵计算获得综合评价A,所述A满足以下公式:
A=W·R=(a1,a2,a3);
对所述综合评价A进行归一化处理获得A′,所述A′满足以下公式:
A′=(a1/s,a2/s,a3/s);其中,
根据最大隶属度原则获得所述GPU的负载情况。
上述技术方案提供的GPU的负载评价方法,综合GPU的多个参数utilization,memory,patates,occupancy,与现有技术众对GPU负载的评价都是基于单一参数相比,更加客观的反映了GPU负载信息,对GPU的负载评价更正确。
附图说明
图1为本发明实施例提供的一种基于模糊决策的GPU的负载评价方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种基于模糊决策的GPU的负载评价方法,如图1所示,所述方法包括以下步骤:
101、针对一个GPU来说,获得n时刻所述GPU的负载向量。
所述GPU的负载向量表示如下:
Ln=<utilization,memory,pstates,occupancy>
其中,utilization:过去一个样本时间内所述GPU运行一个或者多个核函数的时间占总时间的百分比;memory:所述GPU已用全局内存占总的全局内存的百分比;pstates:即performance state的16个等级,p0(maximum performance)-p15(minimumperformance);occupancy:即整体achieved occupancy:所述GPU的每个sm中有多个warp调度器,每个调度器有一个硬件性能计数器,用来计数每个时钟周期活跃warp数,每个调度器计数结果之和除以sm活跃的总周期数,就可以得到这个sm这段时间平均活跃warp数,除以sm理论最大warp数就是kernel执行期间这个sm的occupancy,所有sm的平均值就是GPU整体的occupancy。
102、获得n时刻评价负载用的评价负载向量L。
所述L满足以下公式:
L=70%×Ln+30%×Ln-1
103、综合所述评价负载向量L中的元素utilization,memory,pstates,以及occupancy进行模糊评判,获得模糊判决矩阵:R=(rij)4×3
所述评价负载向量L中的元素构成了因素集:
U={utilization,memory,pstates,occupancy}
进行模糊评判的评判集为:V={轻载,适中,重载}
1)对于元素utilization来说,utilization对评判集中的轻载,适中,重载的隶属函数如下所述:
utilization对轻载的隶属函数为:
utilization对适中的隶属函数为:
utilization对重载的隶属函数为:
2)对于元素memory来说,memory对评判集中的轻载,适中,重载的隶属函数如下所述:
memory对轻载的隶属函数为:
memory对适中的隶属函数为:
M2(memory)=sin(πmemory)(0≤memory≤1)
memory对重载的隶属函数为:
3)对于元素pstates来说,pstates对评判集中的轻载,适中,重载的隶属函数可在下述表1中查找:
表1
4)对于元素occupancy来说,occupancy对评判集中的轻载,适中,重载的隶属函数如下所述:
occupancy对轻载的隶属函数为:
occupancy对适中的隶属函数为:
occupancy对重载的隶属函数为:
根据以上函数构造模糊判决矩阵,矩阵的每一行对应一个单因素决策
矩阵中的L、M、H为查找表1获得的pstates的轻载、适中、重载函数。
104,根据用户给出的诸因素权重分配以及模糊判决矩阵,计算获得综合评价A。
用户给出的诸因素权重分配为:W=(w1,w2,w3,w4)
所述A满足以下公式:A=W·R=(a1,a2,a3)
模糊矩阵的乘法定义为:
105、对所述综合评价A进行归一化处理获得A′。
所述A′满足以下公式:A′=(a1/s,a2/s,a3/s)其中,
106、根据最大隶属度原则获得所述GPU的负载情况。
最大隶属度原则:取得向量A′的最大元素,如果第一个元素最大,则所述GPU的负载情况就是轻载,如果第二个元素最大,则所述GPU的负载情况就是适中,如果第三个元素最大,则所述GPU的负载情况最大就是重载。
这样,通过综合分析每个GPU的负载参数得出负载最轻GPU。从而用户可以选择负载最轻的GPU进行任务处理。可以更好的满足用户的实时性需求。使得每个GPU负载均衡,提高整个系统的吞吐量。
现有技术与本发明相比:
1、现有技术对GPU负载的评价都是基于单一参数,本发明则综合GPU的多个参数utilization,memory,pstates,occupancy,更加客观的反映了GPU负载信息。
2、本发明可以根据给出的诸因素权重分配进行评估,使结果更加满足用户的需求。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (1)

1.一种基于模糊决策的图形处理器GPU负载评价方法,其特征在于,包括:
针对一个GPU来说,获得n时刻所述GPU的负载向量;
所述GPU的负载向量表示如下:
Ln=<utilization,memory,pstates,occupancy>
其中,utilization:过去一个样本时间内所述GPU运行一个或者多个核函数的时间占总时间的百分比;memory:所述GPU已用全局内存占总的全局内存的百分比;pstates:即performance state的16个等级,pO(maximum performance)-p15(minimum performance);occupancy:即整体achieved occupancy:所述GPU的每个sm中有多个warp调度器,每个调度器有一个硬件性能计数器,用来计数每个时钟周期活跃warp数,每个调度器计数结果之和除以sm活跃的总周期数,就可以得到这个sm的活跃warp数,除以sm理论最大warp数就是kernel执行期间这个sm的occupancy,所有sm的平均值就是整体的occupancy;
获得n时刻评价负载用的评价负载向量L,所述L满足以下公式:
L=70%×Ln+30%×Ln-1
综合所述评价负载向量L中的元素utilization,memory,pstates,以及occupancy进行模糊评判,获得模糊判决矩阵:R=(rij)4×3
根据用户给出的诸因素权重分配为:W=(w1,w2,w3,w4)以及模糊判决矩阵计算获得综合评价A,所述A满足以下公式:
A=W·R=(a1,a2,a3);
对所述综合评价A进行归一化处理获得A′,所述A′满足以下公式:A′=(a1/s,a2/s,a3/s);其中,
根据最大隶属度原则获得所述GPU的负载情况;
最大隶属度原则:取得向量A′的最大元素,如果第一个元素最大,则所述GPU的负载情况就是轻载,如果第二个元素最大,则所述GPU的负载情况就是适中,如果第三个元素最大,则所述GPU的负载情况最大就是重载;
所述综合所述评价负载向量L中的元素utilization,memory,pstates,以及occupancy进行模糊评判,获得模糊判决矩阵:R=(rij)4×3,包括:
utilization对轻载的隶属函数为:
utilization对适中的隶属函数为:
utilization对重载的隶属函数为:
memory对轻载的隶属函数为:
memory对适中的隶属函数为:
M2(memory)=sin(πmemory)(0≤memory≤1)
memory对重载的隶属函数为:
pstates对轻载,适中,重载的隶属函数可在下述表1中查找:
表1
occupancy对轻载的隶属函数为:
occupancy对适中的隶属函数为:
occupancy对重载的隶属函数为:
根据以上函数构造模糊判决矩阵R如下所示:
<mrow> <mi>R</mi> <mo>=</mo> <mfenced open = "(" close = ")"> <mtable> <mtr> <mtd> <mrow> <msub> <mi>L</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>u</mi> <mi>t</mi> <mi>i</mi> <mi>l</mi> <mi>i</mi> <mi>z</mi> <mi>a</mi> <mi>t</mi> <mi>i</mi> <mi>o</mi> <mi>n</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <msub> <mi>M</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>u</mi> <mi>t</mi> <mi>i</mi> <mi>l</mi> <mi>i</mi> <mi>z</mi> <mi>a</mi> <mi>t</mi> <mi>i</mi> <mi>o</mi> <mi>n</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <msub> <mi>H</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>u</mi> <mi>t</mi> <mi>i</mi> <mi>l</mi> <mi>i</mi> <mi>z</mi> <mi>a</mi> <mi>t</mi> <mi>i</mi> <mi>o</mi> <mi>n</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>L</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>m</mi> <mi>e</mi> <mi>m</mi> <mi>o</mi> <mi>r</mi> <mi>y</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <msub> <mi>M</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>m</mi> <mi>e</mi> <mi>m</mi> <mi>o</mi> <mi>r</mi> <mi>y</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <msub> <mi>H</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>m</mi> <mi>e</mi> <mi>m</mi> <mi>o</mi> <mi>r</mi> <mi>y</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mi>L</mi> </mtd> <mtd> <mi>M</mi> </mtd> <mtd> <mi>H</mi> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>L</mi> <mn>4</mn> </msub> <mrow> <mo>(</mo> <mi>o</mi> <mi>c</mi> <mi>c</mi> <mi>u</mi> <mi>p</mi> <mi>a</mi> <mi>n</mi> <mi>c</mi> <mi>y</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <msub> <mi>M</mi> <mn>4</mn> </msub> <mrow> <mo>(</mo> <mi>o</mi> <mi>c</mi> <mi>c</mi> <mi>u</mi> <mi>p</mi> <mi>a</mi> <mi>n</mi> <mi>c</mi> <mi>y</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <msub> <mi>H</mi> <mn>4</mn> </msub> <mrow> <mo>(</mo> <mi>o</mi> <mi>c</mi> <mi>c</mi> <mi>u</mi> <mi>p</mi> <mi>a</mi> <mi>n</mi> <mi>c</mi> <mi>y</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
矩阵中R的L、M、H为查找表1获得的pstates的轻载、适中、重载函数。
CN201410341239.5A 2014-07-18 2014-07-18 基于模糊决策的gpu负载综合评判方法 Active CN104123452B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410341239.5A CN104123452B (zh) 2014-07-18 2014-07-18 基于模糊决策的gpu负载综合评判方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410341239.5A CN104123452B (zh) 2014-07-18 2014-07-18 基于模糊决策的gpu负载综合评判方法

Publications (2)

Publication Number Publication Date
CN104123452A CN104123452A (zh) 2014-10-29
CN104123452B true CN104123452B (zh) 2017-10-10

Family

ID=51768861

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410341239.5A Active CN104123452B (zh) 2014-07-18 2014-07-18 基于模糊决策的gpu负载综合评判方法

Country Status (1)

Country Link
CN (1) CN104123452B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105843679B (zh) * 2016-03-18 2018-11-02 西北工业大学 自适应众核资源调度方法
CN106447070A (zh) * 2016-07-19 2017-02-22 东莞理工学院 基于模糊决策的输送车调度方法
US11494463B2 (en) 2020-04-14 2022-11-08 Microsoft Technology Licensing, Llc Set operations using multi-core processing unit

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7421604B1 (en) * 2005-07-25 2008-09-02 Nvidia Corporation Advanced voltage regulation using feed-forward load information
CN102402462A (zh) * 2010-09-30 2012-04-04 微软公司 用于对启用gpu的虚拟机进行负载平衡的技术
CN102692450A (zh) * 2012-05-02 2012-09-26 江苏大学 基于模糊综合评判的金属拉深件成形裂纹状态识别方法
CN103761690A (zh) * 2014-02-14 2014-04-30 国家电网公司 基于电网系统中电压无功控制系统的评估方法
CN103778591A (zh) * 2012-10-18 2014-05-07 纬创资通股份有限公司 处理图形运算负载平衡的方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7075541B2 (en) * 2003-08-18 2006-07-11 Nvidia Corporation Adaptive load balancing in a multi-processor graphics processing system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7421604B1 (en) * 2005-07-25 2008-09-02 Nvidia Corporation Advanced voltage regulation using feed-forward load information
CN102402462A (zh) * 2010-09-30 2012-04-04 微软公司 用于对启用gpu的虚拟机进行负载平衡的技术
CN102692450A (zh) * 2012-05-02 2012-09-26 江苏大学 基于模糊综合评判的金属拉深件成形裂纹状态识别方法
CN103778591A (zh) * 2012-10-18 2014-05-07 纬创资通股份有限公司 处理图形运算负载平衡的方法及系统
CN103761690A (zh) * 2014-02-14 2014-04-30 国家电网公司 基于电网系统中电压无功控制系统的评估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
单节点多GPU集群下HPL动态负载均衡优化;陈任之等;《计算机科学》;20130315;第40卷(第3期);全文 *
基于Matlab的铁路环境噪声模糊评价;严冬松等;《中国铁道科学》;20110515;第32卷(第3期);全文 *

Also Published As

Publication number Publication date
CN104123452A (zh) 2014-10-29

Similar Documents

Publication Publication Date Title
CN103401939B (zh) 一种采用混合调度策略的负载均衡方法
CN106844051A (zh) 一种边缘计算环境中功耗优化的负载任务迁移算法
CN101719081B (zh) 一种虚拟机调度方法
CN100576179C (zh) 一种基于能量优化的网格调度方法
CN107239336A (zh) 一种实现任务调度的方法及装置
Zidenberg et al. Multiamdahl: How should i divide my heterogenous chip?
CN104901898A (zh) 一种负载均衡方法及装置
CN104123452B (zh) 基于模糊决策的gpu负载综合评判方法
CN104182278B (zh) 一种判定计算机硬件资源繁忙程度的方法和装置
CN102789599A (zh) 一种基于聚类分析和多属性决策的作业车间瓶颈识别方法
CN104023042B (zh) 云平台资源调度方法
CN104778112B (zh) 自适应电压频率调整的系统和方法
CN103677960A (zh) 一种能耗约束的虚拟机博弈重放置方法
CN102360313A (zh) 片上异构多核计算平台的性能加速方法
CN103150215A (zh) 虚拟环境下细粒度的cpu资源使用预测方法
CN102012891A (zh) 计算机集群管理方法、装置和系统
CN104978610A (zh) 电网需求侧可调度容量预测方法及电力调度方法
CN102541622B (zh) 一种负载相关的虚拟机放置方法
CN110347602A (zh) 多任务脚本执行方法及装置、电子设备及可读存储介质
CN104793993A (zh) 基于Levy飞行的人工蜂群粒子群算法的云计算任务调度方法
CN108536528A (zh) 应用感知的大规模网格作业调度方法
CN109040193A (zh) 基于无依赖子任务的移动设备云资源分配方法
CN106022578A (zh) 基于数据高维化和K-means聚类的居民用电峰谷平时段划分方法
CN108769105A (zh) 一种云环境下的知识服务多任务调度优化方法及其构建的调度系统
CN105045667A (zh) 一种用于虚拟机vCPU调度的资源池管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
DD01 Delivery of document by public notice

Addressee: Shi Jiaming

Document name: payment instructions

DD01 Delivery of document by public notice