CN104123452B

CN104123452B - 基于模糊决策的gpu负载综合评判方法

Info

Publication number: CN104123452B
Application number: CN201410341239.5A
Authority: CN
Inventors: 杨刚; 张策; 周兴社; 杜三盛
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2014-07-18
Filing date: 2014-07-18
Publication date: 2017-10-10
Anticipated expiration: 2034-07-18
Also published as: CN104123452A

Abstract

本发明实施例提供了一种基于模糊决策的GPU的负载评价方法，涉及计算机技术领域，可以正确对GPU的负载进行评价。所述方法包括：针对一个GPU来说，获得n时刻所述GPU的负载向量，然后计算获得n时刻评价负载用的评价负载向量L，综合所述评价负载向量L中的元素utilization，memory，pstates，以及occupancy进行模糊评判，获得模糊判决矩阵R；根据用户给出的诸因素权重分配为：W＝(w₁，w₂，w₃，w₄)以及模糊判决矩阵计算获得综合评价A，对所述综合评价A进行归一化处理获得A′，根据最大隶属度原则获得所述GPU的负载情况。

Description

基于模糊决策的GPU负载综合评判方法

技术领域

本发明涉及计算机技术领域，尤其涉及一种基于模糊决策的GPU(GraphicProcessing Unit，图形处理器)的负载评价方法。

背景技术

Kepler GK110(专为英伟达Tesla产品打造CUDA计算架构)由71亿个晶体管组成，可以提供超过每秒1万亿次双精度浮点计算的吞吐量，Kepler架构在电源效率方面，比Fermi的性能/功率比提高了3倍。完整Kepler GK110实施包括15 SMX单元和六个64位内存控制器。拥有192个单精度CUDA(Compute Unified Device Architecture，统一计算设备架构)核，64个双精度单元。

C-RAN(新型无线接入网架构)白皮书指出传统的无线接入网面临的挑战有大量基站导致高额能耗、潮汐效应导致基站利用率低下。把GPU作为资源池，进行基带处理，刚好解决了这个问题。基带处理就要求GPU可以任务级别的并行处理每个用户的需求。

GPU虽然提供了非常强大的数据级并行计算能力，不过对于任务级别的并行有比较大的限制。最新的kepler架构支持同时并发32个核函数。因此为了满足多任务的需求就需要在一个主机上装备多块GPU。对于多GPU系统需要解决GPU之间的负载均衡，才能达到最佳性能，因此正确评价某一个GPU的负载信息至关重要。

发明内容

本发明的实施例提供一种基于模糊决策的GPU的负载评价方法，可以正确地对GPU的负载进行评价。

为达到上述目的，本发明的实施例采用如下技术方案：

一种基于模糊决策的GPU的负载评价方法，包括：

针对一个GPU来说，获得n时刻所述GPU的负载向量。

所述GPU的负载向量表示如下：

L_n＝＜utilization，memory，pstates，occupancy＞

其中，utilization：过去一个样本时间内所述GPU运行一个或者多个核函数的时间占总时间的百分比；memory：所述GPU已用全局内存占总的全局内存的百分比；pstates：即performance state的16个等级，p0(maximum performance)-p15(minimumperformance)；occupancy：即achieved occupancy：所述GPU的每个sm中有多个warp调度器，每个调度器有一个硬件性能计数器，用来计数每个时钟周期活跃warp数，每个调度器计数结果之和除以sm活跃的总周期数，就可以得到这个sm的活跃warp数，除以sm理论最大warp数就是kernel执行期间这个sm的occupancy，所有sm的平均值就是整体的occupancy；

获得n时刻评价负载用的评价负载向量L，所述L满足以下公式：

L＝70％×L_n+30％×L_n-1；

综合所述评价负载向量L中的元素utilization，memory，pstates，以及occupancy进行模糊评判，获得模糊判决矩阵：R＝(r_ij)_4×3；

根据用户给出的诸因素权重分配为：W＝(w₁，w₂，w₃，w₄)以及模糊判决矩阵计算获得综合评价A，所述A满足以下公式：

A＝W·R＝(a₁，a₂，a₃)；

对所述综合评价A进行归一化处理获得A′，所述A′满足以下公式：

A′＝(a₁/s，a₂/s，a₃/s)；其中，

根据最大隶属度原则获得所述GPU的负载情况。

上述技术方案提供的GPU的负载评价方法，综合GPU的多个参数utilization，memory，patates，occupancy，与现有技术众对GPU负载的评价都是基于单一参数相比，更加客观的反映了GPU负载信息，对GPU的负载评价更正确。

附图说明

图1为本发明实施例提供的一种基于模糊决策的GPU的负载评价方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种基于模糊决策的GPU的负载评价方法，如图1所示，所述方法包括以下步骤：

101、针对一个GPU来说，获得n时刻所述GPU的负载向量。

所述GPU的负载向量表示如下：

L_n＝＜utilization，memory，pstates，occupancy＞

其中，utilization：过去一个样本时间内所述GPU运行一个或者多个核函数的时间占总时间的百分比；memory：所述GPU已用全局内存占总的全局内存的百分比；pstates：即performance state的16个等级，p0(maximum performance)-p15(minimumperformance)；occupancy：即整体achieved occupancy：所述GPU的每个sm中有多个warp调度器，每个调度器有一个硬件性能计数器，用来计数每个时钟周期活跃warp数，每个调度器计数结果之和除以sm活跃的总周期数，就可以得到这个sm这段时间平均活跃warp数，除以sm理论最大warp数就是kernel执行期间这个sm的occupancy，所有sm的平均值就是GPU整体的occupancy。

102、获得n时刻评价负载用的评价负载向量L。

所述L满足以下公式：

L＝70％×L_n+30％×L_n-1。

103、综合所述评价负载向量L中的元素utilization，memory，pstates，以及occupancy进行模糊评判，获得模糊判决矩阵：R＝(r_ij)_4×3。

所述评价负载向量L中的元素构成了因素集：

U＝{utilization，memory，pstates，occupancy}

进行模糊评判的评判集为：V＝{轻载，适中，重载}

1)对于元素utilization来说，utilization对评判集中的轻载，适中，重载的隶属函数如下所述：

utilization对轻载的隶属函数为：

utilization对适中的隶属函数为：

utilization对重载的隶属函数为：

2)对于元素memory来说，memory对评判集中的轻载，适中，重载的隶属函数如下所述：

memory对轻载的隶属函数为：

memory对适中的隶属函数为：

M₂(memory)＝sin(πmemory)(0≤memory≤1)

memory对重载的隶属函数为：

3)对于元素pstates来说，pstates对评判集中的轻载，适中，重载的隶属函数可在下述表1中查找：

表1

4)对于元素occupancy来说，occupancy对评判集中的轻载，适中，重载的隶属函数如下所述：

occupancy对轻载的隶属函数为：

occupancy对适中的隶属函数为：

occupancy对重载的隶属函数为：

根据以上函数构造模糊判决矩阵，矩阵的每一行对应一个单因素决策

矩阵中的L、M、H为查找表1获得的pstates的轻载、适中、重载函数。

104，根据用户给出的诸因素权重分配以及模糊判决矩阵，计算获得综合评价A。

用户给出的诸因素权重分配为：W＝(w₁，w₂，w₃，w₄)

所述A满足以下公式：A＝W·R＝(a₁，a₂，a₃)

模糊矩阵的乘法定义为：

105、对所述综合评价A进行归一化处理获得A′。

所述A′满足以下公式：A′＝(a₁/s，a₂/s，a₃/s)其中，

106、根据最大隶属度原则获得所述GPU的负载情况。

最大隶属度原则：取得向量A′的最大元素，如果第一个元素最大，则所述GPU的负载情况就是轻载，如果第二个元素最大，则所述GPU的负载情况就是适中，如果第三个元素最大，则所述GPU的负载情况最大就是重载。

这样，通过综合分析每个GPU的负载参数得出负载最轻GPU。从而用户可以选择负载最轻的GPU进行任务处理。可以更好的满足用户的实时性需求。使得每个GPU负载均衡，提高整个系统的吞吐量。

现有技术与本发明相比：

1、现有技术对GPU负载的评价都是基于单一参数，本发明则综合GPU的多个参数utilization，memory，pstates，occupancy，更加客观的反映了GPU负载信息。

2、本发明可以根据给出的诸因素权重分配进行评估，使结果更加满足用户的需求。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种基于模糊决策的图形处理器GPU负载评价方法，其特征在于，包括：

针对一个GPU来说，获得n时刻所述GPU的负载向量；

所述GPU的负载向量表示如下：

L_n＝<utilization，memory，pstates，occupancy>

其中，utilization：过去一个样本时间内所述GPU运行一个或者多个核函数的时间占总时间的百分比；memory：所述GPU已用全局内存占总的全局内存的百分比；pstates：即performance state的16个等级，pO(maximum performance)-p15(minimum performance)；occupancy：即整体achieved occupancy：所述GPU的每个sm中有多个warp调度器，每个调度器有一个硬件性能计数器，用来计数每个时钟周期活跃warp数，每个调度器计数结果之和除以sm活跃的总周期数，就可以得到这个sm的活跃warp数，除以sm理论最大warp数就是kernel执行期间这个sm的occupancy，所有sm的平均值就是整体的occupancy；

L＝70％×L_n+30％×L_n-1；

A＝W·R＝(a₁，a₂，a₃)；

对所述综合评价A进行归一化处理获得A′，所述A′满足以下公式：A′＝(a₁/s，a₂/s，a₃/s)；其中，

根据最大隶属度原则获得所述GPU的负载情况；

最大隶属度原则：取得向量A′的最大元素，如果第一个元素最大，则所述GPU的负载情况就是轻载，如果第二个元素最大，则所述GPU的负载情况就是适中，如果第三个元素最大，则所述GPU的负载情况最大就是重载；

所述综合所述评价负载向量L中的元素utilization，memory，pstates，以及occupancy进行模糊评判，获得模糊判决矩阵：R＝(r_ij)_4×3，包括：

utilization对轻载的隶属函数为：

utilization对适中的隶属函数为：

utilization对重载的隶属函数为：

memory对轻载的隶属函数为：

memory对适中的隶属函数为：

M₂(memory)＝sin(πmemory)(0≤memory≤1)

memory对重载的隶属函数为：

，

pstates对轻载，适中，重载的隶属函数可在下述表1中查找：

表1

occupancy对轻载的隶属函数为：

occupancy对适中的隶属函数为：

occupancy对重载的隶属函数为：

根据以上函数构造模糊判决矩阵R如下所示：

矩阵中R的L、M、H为查找表1获得的pstates的轻载、适中、重载函数。