CN106708499B

CN106708499B - 绘图处理程序的分析方法与分析系统

Info

Publication number: CN106708499B
Application number: CN201510888257.XA
Authority: CN
Inventors: 马明达; 赖俊宏; 黄迅伦; 卢俊铭
Original assignee: Industrial Technology Research Institute ITRI
Current assignee: Industrial Technology Research Institute ITRI
Priority date: 2015-11-13
Filing date: 2015-12-07
Publication date: 2020-10-27
Anticipated expiration: 2035-12-07
Also published as: US20170140495A1; CN106708499A; TW201717013A; TWI613545B; US9953393B2

Abstract

本发明公开了一种绘图处理程序的分析方法与分析系统。绘图处理程序的分析方法包括以下步骤。提供一待估算绘图程序，并获得此待估算绘图程序的多个待估算绘图参数。依据此些待估算绘图参数，分析出此待估算绘图程序属于数个集合(group)的至少其中之一，并获得多个加权系数。依据此些加权系数及此些待估算绘图参数，计算绘图处理器执行此待估算绘图程序的负载总值。

Description

绘图处理程序的分析方法与分析系统

技术领域

本发明是有关于一种绘图处理程序的分析方法与分析系统。

背景技术

随着对行动装置上昼面显示的细致度及华丽度的追求，因此绘图处理器已被广泛的用于加速应用程序上3D场景的绘制，然而受限于行动装置上有限的电池容量，因此行动装置上的绘图应用程序开发者必须能在开发阶段很快的了解到3D场景的复杂度是如何影响处理功耗，以取得效能、3D场景表现、及功耗之间的平衡，并藉由修改绘图应用程序来进行单位功耗的效能的优化。

针对绘图处理器的功耗预估，一般主要是于程序执行过程中实际存取硬件元件(或硬件仿真器)以获得硬件讯号/状态变动信息，并藉此来估算功耗值，然而这种硬件讯号/状态变动信息是相依于硬件架构且绘图处理器供货商并不一定有提供方法来取得这些讯号/状态变动信息；此外，绘图应用程序开发者很难直接从这些硬件变动信息了解到是哪一段程序代码或哪一个3D场景会造成大量的功率消耗，进一步限制了优化的进行。

此外，除了功耗预估以外，处理时间的预估同样也面临上述一样的问题，绘图应用程序开发者很难直接从这些硬件变动信息了解到是哪一段程序代码或哪一个3D场景会花费大量的处理时间，进一步限制了优化的进行。

发明内容

本发明有关于一种绘图处理程序的分析方法与分析系统。

根据本发明的一实施例，提出一种绘图处理程序的分析方法。绘图处理程序的分析方法包括以下步骤。提供数个参考绘图程序及各个参考绘图程序的数个参考绘图参数。将此些参考绘图程序分类为数个集合(group)。依据此些参考绘图参数，训练出此些参考绘图程序对应于此些集合的归类关系(classifying relationship)。分析绘图处理器的数个硬件元件分别对应的负载分值与此些参考绘图参数的相对关系。

根据本发明的一实施例，提出一种绘图处理程序的分析方法。绘图处理程序的分析方法包括以下步骤。提供一待估算绘图程序，并获得此待估算绘图程序的多个待估算绘图参数。依据此些待估算绘图参数，分析出此待估算绘图程序属于数个集合(group)的至少其中之一，并获得数个加权系数。依据此些加权系数及此些待估算绘图参数，计算绘图处理器执行此待估算绘图程序的负载总值。

根据本发明的一实施例，提出一种绘图处理程序的分析系统。绘图处理程序的分析系统包括参数撷取单元、分组单元、归类单元(classifier)及相对信息单元。参数撷取单元对数个参考绘图程序个别分析出数个参考绘图参数。分组单元将此些参考绘图程序分类为数个集合(group)。归类单元依据此些参考绘图参数，训练出此些参考绘图程序对应于此些集合的归类关系(classifying relationship)。相对信息单元分析绘图处理器的数个硬件元件分别对应的负载分值与此些参考绘图参数的相对关系(relative relationship)。

根据本发明的一实施例，提出一种绘图处理程序的分析系统。绘图处理程序的分析系统包括参数撷取单元、归类单元及计算单元。参数撷取单元对待估算绘图程序分析出数个待估算绘图参数。归类单元依据此些待估算绘图参数分析出此待估算绘图程序属于数个集合(group)的至少其中之一，并获得多个加权系数。计算单元依据此些加权系数及此些待估算绘图参数，计算绘图处理器执行此待估算绘图程序的负载总值。

为了对本发明的上述及其他方面有更佳的了解，下文特举较佳实施例，并配合所附图式，作详细说明如下：

附图说明

图1绘示绘图处理程序的分析统示意图。

图2A绘示另一绘图处理程序的分析系统示意图。

图2B绘示另一绘图处理程序的分析系统示意图。

图3绘示负载总值的估算模型的示意图。

图4绘示绘图处理程序的分析方法于脱机模式的流程图。

图5绘示图4的各步骤的示意图。

图6绘示绘图处理程序的分析方法于线上模式的流程图。

图7绘示图6的各步骤的示意图。

符号说明：

100：绘图处理程序的分析系统

110：参数撷取单元

120：分组单元

130：归类单元

140：相对信息单元

150：计算单元

CR：归类关系

LR：相对关系

R_i、R_n，i：参考绘图参数

R_i’：待估算绘图参数

RP_n：参考绘图程序

RP’：待估算绘图程序

S110、S120、S130、S140、S210、S220、S230：流程步骤

α_j，i：斜率系数

β_j：平移系数

P_j、P_n，i、P_j’：负载分值

PT、PT’、PT_n：负载总值

W_k，j、W_k′，j：加权系数

具体实施方式

请参照图1，其绘示绘图处理程序的分析系统100的示意图。绘图处理程序的分析系统100对各种绘图程序进行分析，以估算出绘图处理器(Graphics Processing Unit，GPU)执行各种绘图程序所需的处理负载。绘图处理器例如是OpenGL ES 2.0API为基础的嵌入式绘图处理器(Embedded GPU)，此绘图处理器常用于便携设备的砖墙式延缓描绘(Tile-Based Deferred Rendering，TBDR)绘图处理器架构。绘图处理器又例如是DirectX。处理负载例如是处理功耗或处理时间。如此一来，程序开发者能够针对高处理负载的绘图程序进行改善。

绘图处理程序的分析系统100包括参数撷取单元110、分组单元120、归类单元130、相对信息单元140及计算单元150。绘图处理程序的分析系统100在脱机模式(offlinemode)时，参数撷取单元110、分组单元120、归类单元130及相对信息单元140根据数个参考绘图应用程序建立估算模型。绘图处理程序的分析系统100在线上模式(online mode)时，参数撷取单元110、归类单元130、相对信息单元140及计算单元150根据上述估算模型对待估算绘图程序进行估算，以获得绘图处理器执行此待估算绘图程序的负载总值。

请参照图2A，其绘示另一绘图处理程序的分析系统100A的示意图。在一实施例中，绘图处理程序的分析系统10OA可以仅执行脱机模式的工作，而仅包括参数撷取单元110、分组单元120、归类单元130及相对信息单元140。请参照图2B，其绘示另一绘图处理程序的分析系统100B的示意图。在另一实施例中，绘图处理程序的分析系统10OB可以仅执行线上模式的工作，而仅包括参数撷取单元110、归类单元130、相对信息单元140及计算单元150。

参数撷取单元110、分组单元120、归类单元130、相对信息单元140及计算单元150例如分别是或组合成芯片、电路、电路板、或储存数组程序代码的记录媒体。

请参照图3，其绘示负载总值PT的估算模型的示意图。负载总值PT例如是处理功耗或处理时间。以砖墙式延缓描绘(TBDR)绘图处理器架构为例，绘图处理器包括J个硬件元件，例如是顶点数据管理器(Verrex Data Master，VDM)、画素数据管理器(Pixel DataMaster，PDM)元件、通用可扩展着色引擎(Unified Scalable Shader Engine，USSE)、拼贴共处理器(tiling coprocessor)、画素共处理器(pixel coprocessor)、纹理共处理器(texturing coprocessor)、纹理高速缓存(texture cache)、主存储器(main memory)。

依据下式(1)，负载总值PT为加权系数W_k，i，(1≤j≤J)与硬件元件的负载分值P_j，(1≤j≤J)的乘积的总和。下标k表示第k个集合，下标j表示第j个硬件元件。每一集合均对应于J个加权系数W_k，j°

请参照下表一，其表示参考绘图程序的参考绘图参数与绘图处理器的各项硬件元件的关系。参考绘图参数可至少包括一般参数(generalparameter)、几何相关参数(geometry parameter)、分割相关参数(fragment parameter)、贴图相关参数(textureparameter)。

一般参数包括帧速率(frame rate)。几何参数可至少包括顶点数目(number oftriangles/number of vertices)、批数(number of batches)、照光模式(lightingmodel)、细节的级别(level-of-detail)、原始组合形式(primitive assembly type)、交错的属性(interleaving attributes)、实例(instancing)。分割参数包括分辨率(resolution)、剪裁测试/板缓冲(scissortest/stencil buffer)、阿尔发测试(alphatest)、抗锯齿(anti-aliasing)。纹理参数包括纹里元素数量(number of texels)、纹理贴图(texture mapping)、纹理过滤(texture filtering)、纹理压缩(texturecompression)、POT/NPOT。

表一

表一中的「X」表示对应的参考绘图参数与硬件元件具有高度相关性。如下式(2)所示，各个负载分值P_j与I个参考绘图参数R_i，(1≤i≤I)具有相对关系，后续以线性关系为例说明。下标i表示第i个参考绘图参数。

也就是说，上式(1)可以转换为下式(3)，下述式(3)即为负载总值PT的估算模型。

如图3所示，根据上述负载总值PT的估算模型，欲估算某一待估算绘图程序的负载总值PT’时，可以撷取出待估算绘图参数R_i’，(1≤i≤I)。依据待估算绘图参数R_i’，(1≤i≤I)，配合相对信息单元140所事先训练出来的斜率系数α_j，i(1≤j≤J且1≤i≤I)及平移系数β_j，(1≤j≤J)，以计算出负载分值P_j’，(1≤j≤J)。再依据估算绘图参数R_i’，(1≤i≤I)，归类出此待估算绘图程序所属的集合后(例如是第k’集合)，可以得知此集合的加权系数W_k′，j，(1≤j≤J)，并求出负载总值PT’。

请参照第4及5图，图4绘示绘图处理程序的分析方法于脱机模式的流程图，图5绘示图4的各步骤的示意图。绘图处理程序的分析方法于脱机模式中，可以将数个参考绘图程序分为K个集合，并建立出各集合的绘图处理器的负载总值PT的估算模型。以下以绘图处理程序的分析系统100B分析处理功耗为例作说明。在步骤S110中，提供数个参考绘图程序RP_n，(1≤n≤N)，并通过参数撷取单元110对此些参考绘图程序RP_n，(1≤n≤N)个别分析出数个参考绘图参数R_n，i，(1≤n≤N且1≤i≤I)。此步骤是通过API追踪档(API Trace)导出的参考绘图参数R_n，j，(1≤n≤N且1≤i≤I)。

在步骤S120中，分组单元120将此些参考绘图程序RP_n，(1≤n≤N)分类为数个集合(例如是K个集合)。在此步骤中，集合的数量可以预先决定。对每个参考绘图程序RP_n，(1≤n≤N)而言，需量测出其相对应的负载总值PT_n，(1≤n≤N)，并建立出其对应的各硬件元件的加权系数W_n，j，(1≤n≤N且1≤j≤J)。再使用各种分群算法，例如可以是K平均算法(K-meansalgorithm)来进行分组。参考绘图程序RP_n，(1≤n≤N)的加权系数W_n，j，(1≤n≤N且1≤j≤J)对应于负载总值PT_n的成长趋势相近者被归类为同一集合，并平均出各集合的加权系数W_k，j，(1≤k≤K且1≤j≤J)。举例来说，30个参考绘图程序RP_n，(1≤n≤N)中，第1～10个参考绘图程序RP_n(1≤n≤10)的加权系数W_n，j，(1≤n≤10且1≤j≤J)对应于负载总值PT_n的成长趋势相近，而被归类为同一集合，并平均出第一集合的加权系数W_1，j，(1≤j≤J)(未绘示)；第11～30个参考绘图程序RP_n，(11≤n≤30)的加权系数W_n，j，(11≤n≤30且1≤j≤J)对应于负载总值PT_n的成长趋势相近，而被归类为同一集合，并平均出第二集合的加权系数W_2，j，(1≤j≤J)(未绘示)。分群算法另外又可以为，例如：最大期望算法(Expectation-maximization algorithm)、高连通子图分群算法(Highly Connected Subgraphsclustering algorithm)、基于连通性分群法/层次聚类法(Connectivity basedclustering /hierarchical clustering)等。

完成分组后，再来要对已分组的参考绘图程序RP_n，(1≤n≤N)进行分析。在步骤S130中，归类单元130依据此些参考绘图参数R_n，i，(1≤n≤N且1≤i≤I)，训练出此些参考绘图程序对应于此些集合的归类关系(classifying relationship)CR。此步骤是根据机器学习算法(Machine Learning Algorithm)来执行，例如是人工神经网络(artificial neuralnetwork algorithm，ANN algorithm)或支持向量机算法(Support Vector Machinealgorithm，SVM algorithm)来进行训练。此步骤并非依据硬件元件来训练，而是依据参考绘图程序RP_n，(1≤n≤N)的参考绘图参数R_n，i，(1≤n≤N且1≤i≤I)进行训练。也就是说，后续于线上模式欲判断待估算绘图程序RP’(绘示于图7)属于哪一集合时，可以不分析硬件元件，而是依据待估算绘图程序RP’的待估算绘图参数R_i’，(1≤i≤I)(绘示于图7)即可。

在一实施例，在步骤S140，相对信息单元140分析负载分值P_n，j，(1≤n≤N且1≤j≤J)与参考绘图参数R_n，i，(1≤n≤N且1≤i≤I)的相对关系，例如线性关系(linearrelationship)LR，以获得斜率数α_j，i，(1≤j≤J且1≤i≤I)及平移数β_j，(1≤j≤J)。相对关系除了前述举例的线性关系，另外又如：正交多项式回归(Polynomial regression)、罗吉斯回归(Logarithmic regression)、指数回归(Exponential regression)等关系。

上述步骤S140可执行于步骤S110～S130之前，或者同时进行。步骤S140与步骤S110～S130并不会互相干扰。

请参照第6～7图，图6绘示绘图处理程序的分析方法于线上模式的流程图，图7绘示图6的各步骤的示意图。绘图处理程序的分析方法于线上模式中，可以分析出待估算绘图程序RP’属于哪一集合，并依据估算模型计算出绘图处理器的负载总值PT’。在步骤S210中，提供待估算绘图程序RP’，并且经由参数撷取单元110获得此待估算绘图程序RP’的待估算绘图参数R_i’，(1≤i≤I)。

在步骤S220中，归类单元130依据待估算绘图参数R_i’，(1≤i≤I)，分析出待估算绘图程序属于哪一集合(例如是第k’集合)，并获得加权系数W_k′，i，(1≤j≤J)。此步骤的输入是待估算绘图参数R_i’，(1≤i≤I)，而其输出为此待估算绘图程序RP’最接近的集合或是多个接近的集合。如果是获得最接近的集合，则取得此集合的加权系数。如果是获得多个最接近的集合，则对这些集合的加权系数进行线性内插。

在步骤S230中，计算单元150依据加权系数W_k′，j，(1≤j≤J)、待估算绘图参数R_i’，(1≤i≤I)、斜率系数α_j，i，(1≤j≤J且1≤i≤I)及平移系数β_j，(1≤j≤J)，以上述式(3)的估算模型，计算绘图处理器执行待估算绘图程序RP’的负载总值PT’。

于一实施例中，上述所采用的相对关系，是依据于脱机模式时训练分析所得。

于一实施例中，绘图处理器所包括的多个硬件元件以其各对应的负载分值执行该待估算绘图程序。

根据上述实施例，本案是藉由分析程序原始码或API追踪档(API Trace)获得的绘图参数，来预估其于绘图处理器上执行时的负载总值，是一种较贴近于绘图程序开发者的绘图处理器的负载总值的估算方式。如此一来，能够让程序开发者快速察觉到负载瓶颈是落于程序代码的哪一段并进行改善。这些绘图参数可以不需实际存取硬件元件(或硬件仿真器)来获得，且不相依于绘图处理器的硬件架构，因此上述估算模型可以移转至各种不同的绘图处理器的硬件架构，针对每一种硬件架构，重新进行一次估算模型的脱机模式的训练即可，提供了相当大的弹性与扩充性。

此外，上述估算模型可以根据待估算绘图程序的特性，动态选用最合适的加权系数，以适应绘图处理器中各硬件元件与绘图管线的负载不平衡情况，进一步提高负载估算的准确度。

综上所述，虽然本发明已以各种实施例公开如上，然其并非用以限定本发明。本发明所属技术领域中具有通常知识者，在不脱离本发明的精神和范围内，当可作各种的更动与润饰。因此，本发明的保护范围当以权利要求保护范围为准。

Claims

1.一种绘图处理程序的分析方法，包括：

提供多个参考绘图程序及各该参考绘图程序的多个参考绘图参数；

依据该些参考绘图参数，将该些参考绘图程序分类为多个集合；

依据该些参考绘图参数，训练出该些参考绘图程序对应于该些集合的归类关系；以及

计算各该些集合和多个硬件元件的多个加权系数，依据该些加权系数分析绘图处理器的该些硬件元件分别对应的负载分值与该些参考绘图参数的相对关系；

其中，该些参考绘图参数包含一般参数、几何参数及分割参数，一般参数与几何参数和分割参数不相同。

2.如权利要求1所述的绘图处理程序的分析方法，其中将该些参考绘图程序分类为该些集合的步骤通过K平均算法、最大期望算法、高连通子图分群算法或基于连通性分群法/层次聚类法进行。

3.如权利要求1所述的绘图处理程序的分析方法，其中训练出该些参考绘图程序对应于该些集合的该归类关系的步骤通过人工神经网络或支持向量机算法进行。

4.一种绘图处理程序的分析方法，包括：

提供待估算绘图程序，并获得该待估算绘图程序的多个待估算绘图参数；

依据该些待估算绘图参数，分析出该待估算绘图程序属于多个集合(group)的至少其中之一，并依据该些集合的至少其中之一和一绘图处理器的多个硬件元件获得多个加权系数；以及

依据该些加权系数及该些待估算绘图参数，计算绘图处理器执行该待估算绘图程序的一负载总值；

其中，该些待估算绘图参数包含一般参数、几何参数及分割参数，一般参数与几何参数和分割参数不相同。

5.如权利要求4所述的绘图处理程序的分析方法，更包括：

将该些参考绘图程序分类为该些集合；以及

依据该些参考绘图参数，训练出该些参考绘图程序对应于该些集合的归类关系。

6.如权利要求5所述的绘图处理程序的分析方法，其中将该些参考绘图程序分类为该些集合的步骤通过K平均算法、最大期望算法、高连通子图分群算法或基于连通性分群法/层次聚类法进行。

7.如权利要求5所述的绘图处理程序的分析方法，其中训练出该些参考绘图程序对应于该些集合的该归类关系的步骤通过人工神经网络或支持向量机算法进行。

8.如权利要求4所述的绘图处理程序的分析方法，其中，该绘图处理器的各该硬件元件以各对应的负载分值执行该待估算绘图程序，该些硬件元件的该些负载分值以该些加权系数进行加权系总和，而获得该负载总值。

9.如权利要求8所述的绘图处理程序的分析方法，其中各该负载分值与该些待估算绘图参数具有相对关系，该相对关系为线性关系、正交多项式回归关系、罗吉斯回归关系、或指数回归关系。

10.如权利要求4所述的绘图处理程序的分析方法，其中该负载总值为处理功耗或处理时间。

11.一种绘图处理程序的分析系统，包括：

参数撷取单元，对多个参考绘图程序个别分析出多个参考绘图参数；

分组单元，依据该些参考绘图参数，将该些参考绘图程序分类为多个集合；以及

归类单元，依据该些参考绘图参数，训练出该些参考绘图程序对应于该些集合的归类关系；以及

相对信息单元，计算各该些集合和多个硬件元件的多个加权系数，依据该些加权系数分析绘图处理器的该些硬件元件分别对应的负载分值与该些参考绘图参数的相对关系；

12.如权利要求11所述的绘图处理程序的分析系统，其中该分组单元通过K平均算法、最大期望算法、高连通子图分群算法或基于连通性分群法/层次聚类法将该些参考绘图程序分类为该些集合。

13.如权利要求11所述的绘图处理程序的分析系统，其中该归类单元通过人工神经网络或支持向量机算法训练出该些参考绘图程序对应于该些集合的该归类关系。

14.一种绘图处理程序的分析系统，包括：

参数撷取单元，对待估算绘图程序分析出多个待估算绘图参数；

归类单元，依据该些待估算绘图参数分析出该待估算绘图程序属于多个集合的至少其中之一，并依据该些集合的至少其中之一和一绘图处理器的多个硬件元件获得多个加权系数；以及

计算单元，依据该些加权系数及该些待估算绘图参数，计算绘图处理器执行该待估算绘图程序的负载总值；

15.如权利要求14所述的绘图处理程序的分析系统，其中该参数撷取单元更对多个参考绘图程序个别分析出多个参考绘图参数，该分析系统更包括：

分组单元，将该些参考绘图程序分类为该些集合，该归类单元更依据该些参考绘图参数训练出该些参考绘图程序对应于该些集合的归类关系。

16.如权利要求15所述的绘图处理程序的分析系统，其中该分组单元通过K平均算法、最大期望算法、高连通子图分群算法或基于连通性分群法/层次聚类法将该些参考绘图程序分类为该些集合。

17.如权利要求15所述的绘图处理程序的分析系统，其中该归类单元通过人工神经网络或支持向量机算法训练出该些参考绘图程序对应于该些集合的该归类关系。

18.如权利要求14所述的绘图处理程序的分析系统，其中该绘图处理器的各该硬件元件以各对应的负载分值执行该待估算绘图程序，该些硬件元件的该些负载分值以该些加权系数进行加权总和，而获得该负载总值。

19.如权利要求18所述的绘图处理程序的分析系统，更包括：

相对信息单元，分析各该负载分值与该些待估算绘图参数的相对关系，该相对关系为线性关系、正交多项式回归关系、罗吉斯回归关系、或指数回归关系。

20.如权利要求14所述的绘图处理程序的分析系统，其中该负载总值为处理功耗或处理时间。