CN106708499B - 绘图处理程序的分析方法与分析系统 - Google Patents
绘图处理程序的分析方法与分析系统 Download PDFInfo
- Publication number
- CN106708499B CN106708499B CN201510888257.XA CN201510888257A CN106708499B CN 106708499 B CN106708499 B CN 106708499B CN 201510888257 A CN201510888257 A CN 201510888257A CN 106708499 B CN106708499 B CN 106708499B
- Authority
- CN
- China
- Prior art keywords
- parameters
- estimated
- programs
- analyzing
- sets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 34
- 238000012545 processing Methods 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 29
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000012706 support-vector machine Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 12
- 238000013519 translation Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229920000433 Lyocell Polymers 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/75—Structural analysis for program understanding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3664—Environments for testing or debugging software
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/245—Classification techniques relating to the decision surface
- G06F18/2453—Classification techniques relating to the decision surface non-linear, e.g. polynomial classifier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
- G06F8/44—Encoding
- G06F8/443—Optimisation
- G06F8/4432—Reducing the energy consumption
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
Abstract
本发明公开了一种绘图处理程序的分析方法与分析系统。绘图处理程序的分析方法包括以下步骤。提供一待估算绘图程序,并获得此待估算绘图程序的多个待估算绘图参数。依据此些待估算绘图参数,分析出此待估算绘图程序属于数个集合(group)的至少其中之一,并获得多个加权系数。依据此些加权系数及此些待估算绘图参数,计算绘图处理器执行此待估算绘图程序的负载总值。
Description
技术领域
本发明是有关于一种绘图处理程序的分析方法与分析系统。
背景技术
随着对行动装置上昼面显示的细致度及华丽度的追求,因此绘图处理器已被广泛的用于加速应用程序上3D场景的绘制,然而受限于行动装置上有限的电池容量,因此行动装置上的绘图应用程序开发者必须能在开发阶段很快的了解到3D场景的复杂度是如何影响处理功耗,以取得效能、3D场景表现、及功耗之间的平衡,并藉由修改绘图应用程序来进行单位功耗的效能的优化。
针对绘图处理器的功耗预估,一般主要是于程序执行过程中实际存取硬件元件(或硬件仿真器)以获得硬件讯号/状态变动信息,并藉此来估算功耗值,然而这种硬件讯号/状态变动信息是相依于硬件架构且绘图处理器供货商并不一定有提供方法来取得这些讯号/状态变动信息;此外,绘图应用程序开发者很难直接从这些硬件变动信息了解到是哪一段程序代码或哪一个3D场景会造成大量的功率消耗,进一步限制了优化的进行。
此外,除了功耗预估以外,处理时间的预估同样也面临上述一样的问题,绘图应用程序开发者很难直接从这些硬件变动信息了解到是哪一段程序代码或哪一个3D场景会花费大量的处理时间,进一步限制了优化的进行。
发明内容
本发明有关于一种绘图处理程序的分析方法与分析系统。
根据本发明的一实施例,提出一种绘图处理程序的分析方法。绘图处理程序的分析方法包括以下步骤。提供数个参考绘图程序及各个参考绘图程序的数个参考绘图参数。将此些参考绘图程序分类为数个集合(group)。依据此些参考绘图参数,训练出此些参考绘图程序对应于此些集合的归类关系(classifying relationship)。分析绘图处理器的数个硬件元件分别对应的负载分值与此些参考绘图参数的相对关系。
根据本发明的一实施例,提出一种绘图处理程序的分析方法。绘图处理程序的分析方法包括以下步骤。提供一待估算绘图程序,并获得此待估算绘图程序的多个待估算绘图参数。依据此些待估算绘图参数,分析出此待估算绘图程序属于数个集合(group)的至少其中之一,并获得数个加权系数。依据此些加权系数及此些待估算绘图参数,计算绘图处理器执行此待估算绘图程序的负载总值。
根据本发明的一实施例,提出一种绘图处理程序的分析系统。绘图处理程序的分析系统包括参数撷取单元、分组单元、归类单元(classifier)及相对信息单元。参数撷取单元对数个参考绘图程序个别分析出数个参考绘图参数。分组单元将此些参考绘图程序分类为数个集合(group)。归类单元依据此些参考绘图参数,训练出此些参考绘图程序对应于此些集合的归类关系(classifying relationship)。相对信息单元分析绘图处理器的数个硬件元件分别对应的负载分值与此些参考绘图参数的相对关系(relative relationship)。
根据本发明的一实施例,提出一种绘图处理程序的分析系统。绘图处理程序的分析系统包括参数撷取单元、归类单元及计算单元。参数撷取单元对待估算绘图程序分析出数个待估算绘图参数。归类单元依据此些待估算绘图参数分析出此待估算绘图程序属于数个集合(group)的至少其中之一,并获得多个加权系数。计算单元依据此些加权系数及此些待估算绘图参数,计算绘图处理器执行此待估算绘图程序的负载总值。
为了对本发明的上述及其他方面有更佳的了解,下文特举较佳实施例,并配合所附图式,作详细说明如下:
附图说明
图1绘示绘图处理程序的分析统示意图。
图2A绘示另一绘图处理程序的分析系统示意图。
图2B绘示另一绘图处理程序的分析系统示意图。
图3绘示负载总值的估算模型的示意图。
图4绘示绘图处理程序的分析方法于脱机模式的流程图。
图5绘示图4的各步骤的示意图。
图6绘示绘图处理程序的分析方法于线上模式的流程图。
图7绘示图6的各步骤的示意图。
符号说明:
100:绘图处理程序的分析系统
110:参数撷取单元
120:分组单元
130:归类单元
140:相对信息单元
150:计算单元
CR:归类关系
LR:相对关系
Ri、Rn,i:参考绘图参数
Ri’:待估算绘图参数
RPn:参考绘图程序
RP’:待估算绘图程序
S110、S120、S130、S140、S210、S220、S230:流程步骤
αj,i:斜率系数
βj:平移系数
Pj、Pn,i、Pj’:负载分值
PT、PT’、PTn:负载总值
Wk,j、Wk′,j:加权系数
具体实施方式
请参照图1,其绘示绘图处理程序的分析系统100的示意图。绘图处理程序的分析系统100对各种绘图程序进行分析,以估算出绘图处理器(Graphics Processing Unit,GPU)执行各种绘图程序所需的处理负载。绘图处理器例如是OpenGL ES 2.0API为基础的嵌入式绘图处理器(Embedded GPU),此绘图处理器常用于便携设备的砖墙式延缓描绘(Tile-Based Deferred Rendering,TBDR)绘图处理器架构。绘图处理器又例如是DirectX。处理负载例如是处理功耗或处理时间。如此一来,程序开发者能够针对高处理负载的绘图程序进行改善。
绘图处理程序的分析系统100包括参数撷取单元110、分组单元120、归类单元130、相对信息单元140及计算单元150。绘图处理程序的分析系统100在脱机模式(offlinemode)时,参数撷取单元110、分组单元120、归类单元130及相对信息单元140根据数个参考绘图应用程序建立估算模型。绘图处理程序的分析系统100在线上模式(online mode)时,参数撷取单元110、归类单元130、相对信息单元140及计算单元150根据上述估算模型对待估算绘图程序进行估算,以获得绘图处理器执行此待估算绘图程序的负载总值。
请参照图2A,其绘示另一绘图处理程序的分析系统100A的示意图。在一实施例中,绘图处理程序的分析系统10OA可以仅执行脱机模式的工作,而仅包括参数撷取单元110、分组单元120、归类单元130及相对信息单元140。请参照图2B,其绘示另一绘图处理程序的分析系统100B的示意图。在另一实施例中,绘图处理程序的分析系统10OB可以仅执行线上模式的工作,而仅包括参数撷取单元110、归类单元130、相对信息单元140及计算单元150。
参数撷取单元110、分组单元120、归类单元130、相对信息单元140及计算单元150例如分别是或组合成芯片、电路、电路板、或储存数组程序代码的记录媒体。
请参照图3,其绘示负载总值PT的估算模型的示意图。负载总值PT例如是处理功耗或处理时间。以砖墙式延缓描绘(TBDR)绘图处理器架构为例,绘图处理器包括J个硬件元件,例如是顶点数据管理器(Verrex Data Master,VDM)、画素数据管理器(Pixel DataMaster,PDM)元件、通用可扩展着色引擎(Unified Scalable Shader Engine,USSE)、拼贴共处理器(tiling coprocessor)、画素共处理器(pixel coprocessor)、纹理共处理器(texturing coprocessor)、纹理高速缓存(texture cache)、主存储器(main memory)。
依据下式(1),负载总值PT为加权系数Wk,i,(1≤j≤J)与硬件元件的负载分值Pj,(1≤j≤J)的乘积的总和。下标k表示第k个集合,下标j表示第j个硬件元件。每一集合均对应于J个加权系数Wk,j°
请参照下表一,其表示参考绘图程序的参考绘图参数与绘图处理器的各项硬件元件的关系。参考绘图参数可至少包括一般参数(generalparameter)、几何相关参数(geometry parameter)、分割相关参数(fragment parameter)、贴图相关参数(textureparameter)。
一般参数包括帧速率(frame rate)。几何参数可至少包括顶点数目(number oftriangles/number of vertices)、批数(number of batches)、照光模式(lightingmodel)、细节的级别(level-of-detail)、原始组合形式(primitive assembly type)、交错的属性(interleaving attributes)、实例(instancing)。分割参数包括分辨率(resolution)、剪裁测试/板缓冲(scissortest/stencil buffer)、阿尔发测试(alphatest)、抗锯齿(anti-aliasing)。纹理参数包括纹里元素数量(number of texels)、纹理贴图(texture mapping)、纹理过滤(texture filtering)、纹理压缩(texturecompression)、POT/NPOT。
表一
表一中的「X」表示对应的参考绘图参数与硬件元件具有高度相关性。如下式(2)所示,各个负载分值Pj与I个参考绘图参数Ri,(1≤i≤I)具有相对关系,后续以线性关系为例说明。下标i表示第i个参考绘图参数。
也就是说,上式(1)可以转换为下式(3),下述式(3)即为负载总值PT的估算模型。
如图3所示,根据上述负载总值PT的估算模型,欲估算某一待估算绘图程序的负载总值PT’时,可以撷取出待估算绘图参数Ri’,(1≤i≤I)。依据待估算绘图参数Ri’,(1≤i≤I),配合相对信息单元140所事先训练出来的斜率系数αj,i(1≤j≤J且1≤i≤I)及平移系数βj,(1≤j≤J),以计算出负载分值Pj’,(1≤j≤J)。再依据估算绘图参数Ri’,(1≤i≤I),归类出此待估算绘图程序所属的集合后(例如是第k’集合),可以得知此集合的加权系数Wk′,j,(1≤j≤J),并求出负载总值PT’。
请参照第4及5图,图4绘示绘图处理程序的分析方法于脱机模式的流程图,图5绘示图4的各步骤的示意图。绘图处理程序的分析方法于脱机模式中,可以将数个参考绘图程序分为K个集合,并建立出各集合的绘图处理器的负载总值PT的估算模型。以下以绘图处理程序的分析系统100B分析处理功耗为例作说明。在步骤S110中,提供数个参考绘图程序RPn,(1≤n≤N),并通过参数撷取单元110对此些参考绘图程序RPn,(1≤n≤N)个别分析出数个参考绘图参数Rn,i,(1≤n≤N且1≤i≤I)。此步骤是通过API追踪档(API Trace)导出的参考绘图参数Rn,j,(1≤n≤N且1≤i≤I)。
在步骤S120中,分组单元120将此些参考绘图程序RPn,(1≤n≤N)分类为数个集合(例如是K个集合)。在此步骤中,集合的数量可以预先决定。对每个参考绘图程序RPn,(1≤n≤N)而言,需量测出其相对应的负载总值PTn,(1≤n≤N),并建立出其对应的各硬件元件的加权系数Wn,j,(1≤n≤N且1≤j≤J)。再使用各种分群算法,例如可以是K平均算法(K-meansalgorithm)来进行分组。参考绘图程序RPn,(1≤n≤N)的加权系数Wn,j,(1≤n≤N且1≤j≤J)对应于负载总值PTn的成长趋势相近者被归类为同一集合,并平均出各集合的加权系数Wk,j,(1≤k≤K且1≤j≤J)。举例来说,30个参考绘图程序RPn,(1≤n≤N)中,第1~10个参考绘图程序RPn(1≤n≤10)的加权系数Wn,j,(1≤n≤10且1≤j≤J)对应于负载总值PTn的成长趋势相近,而被归类为同一集合,并平均出第一集合的加权系数W1,j,(1≤j≤J)(未绘示);第11~30个参考绘图程序RPn,(11≤n≤30)的加权系数Wn,j,(11≤n≤30且1≤j≤J)对应于负载总值PTn的成长趋势相近,而被归类为同一集合,并平均出第二集合的加权系数W2,j,(1≤j≤J)(未绘示)。分群算法另外又可以为,例如:最大期望算法(Expectation-maximization algorithm)、高连通子图分群算法(Highly Connected Subgraphsclustering algorithm)、基于连通性分群法/层次聚类法(Connectivity basedclustering /hierarchical clustering)等。
完成分组后,再来要对已分组的参考绘图程序RPn,(1≤n≤N)进行分析。在步骤S130中,归类单元130依据此些参考绘图参数Rn,i,(1≤n≤N且1≤i≤I),训练出此些参考绘图程序对应于此些集合的归类关系(classifying relationship)CR。此步骤是根据机器学习算法(Machine Learning Algorithm)来执行,例如是人工神经网络(artificial neuralnetwork algorithm,ANN algorithm)或支持向量机算法(Support Vector Machinealgorithm,SVM algorithm)来进行训练。此步骤并非依据硬件元件来训练,而是依据参考绘图程序RPn,(1≤n≤N)的参考绘图参数Rn,i,(1≤n≤N且1≤i≤I)进行训练。也就是说,后续于线上模式欲判断待估算绘图程序RP’(绘示于图7)属于哪一集合时,可以不分析硬件元件,而是依据待估算绘图程序RP’的待估算绘图参数Ri’,(1≤i≤I)(绘示于图7)即可。
在一实施例,在步骤S140,相对信息单元140分析负载分值Pn,j,(1≤n≤N且1≤j≤J)与参考绘图参数Rn,i,(1≤n≤N且1≤i≤I)的相对关系,例如线性关系(linearrelationship)LR,以获得斜率数αj,i,(1≤j≤J且1≤i≤I)及平移数βj,(1≤j≤J)。相对关系除了前述举例的线性关系,另外又如:正交多项式回归(Polynomial regression)、罗吉斯回归(Logarithmic regression)、指数回归(Exponential regression)等关系。
上述步骤S140可执行于步骤S110~S130之前,或者同时进行。步骤S140与步骤S110~S130并不会互相干扰。
请参照第6~7图,图6绘示绘图处理程序的分析方法于线上模式的流程图,图7绘示图6的各步骤的示意图。绘图处理程序的分析方法于线上模式中,可以分析出待估算绘图程序RP’属于哪一集合,并依据估算模型计算出绘图处理器的负载总值PT’。在步骤S210中,提供待估算绘图程序RP’,并且经由参数撷取单元110获得此待估算绘图程序RP’的待估算绘图参数Ri’,(1≤i≤I)。
在步骤S220中,归类单元130依据待估算绘图参数Ri’,(1≤i≤I),分析出待估算绘图程序属于哪一集合(例如是第k’集合),并获得加权系数Wk′,i,(1≤j≤J)。此步骤的输入是待估算绘图参数Ri’,(1≤i≤I),而其输出为此待估算绘图程序RP’最接近的集合或是多个接近的集合。如果是获得最接近的集合,则取得此集合的加权系数。如果是获得多个最接近的集合,则对这些集合的加权系数进行线性内插。
在步骤S230中,计算单元150依据加权系数Wk′,j,(1≤j≤J)、待估算绘图参数Ri’,(1≤i≤I)、斜率系数αj,i,(1≤j≤J且1≤i≤I)及平移系数βj,(1≤j≤J),以上述式(3)的估算模型,计算绘图处理器执行待估算绘图程序RP’的负载总值PT’。
于一实施例中,上述所采用的相对关系,是依据于脱机模式时训练分析所得。
于一实施例中,绘图处理器所包括的多个硬件元件以其各对应的负载分值执行该待估算绘图程序。
根据上述实施例,本案是藉由分析程序原始码或API追踪档(API Trace)获得的绘图参数,来预估其于绘图处理器上执行时的负载总值,是一种较贴近于绘图程序开发者的绘图处理器的负载总值的估算方式。如此一来,能够让程序开发者快速察觉到负载瓶颈是落于程序代码的哪一段并进行改善。这些绘图参数可以不需实际存取硬件元件(或硬件仿真器)来获得,且不相依于绘图处理器的硬件架构,因此上述估算模型可以移转至各种不同的绘图处理器的硬件架构,针对每一种硬件架构,重新进行一次估算模型的脱机模式的训练即可,提供了相当大的弹性与扩充性。
此外,上述估算模型可以根据待估算绘图程序的特性,动态选用最合适的加权系数,以适应绘图处理器中各硬件元件与绘图管线的负载不平衡情况,进一步提高负载估算的准确度。
综上所述,虽然本发明已以各种实施例公开如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当以权利要求保护范围为准。
Claims (20)
1.一种绘图处理程序的分析方法,包括:
提供多个参考绘图程序及各该参考绘图程序的多个参考绘图参数;
依据该些参考绘图参数,将该些参考绘图程序分类为多个集合;
依据该些参考绘图参数,训练出该些参考绘图程序对应于该些集合的归类关系;以及
计算各该些集合和多个硬件元件的多个加权系数,依据该些加权系数分析绘图处理器的该些硬件元件分别对应的负载分值与该些参考绘图参数的相对关系;
其中,该些参考绘图参数包含一般参数、几何参数及分割参数,一般参数与几何参数和分割参数不相同。
2.如权利要求1所述的绘图处理程序的分析方法,其中将该些参考绘图程序分类为该些集合的步骤通过K平均算法、最大期望算法、高连通子图分群算法或基于连通性分群法/层次聚类法进行。
3.如权利要求1所述的绘图处理程序的分析方法,其中训练出该些参考绘图程序对应于该些集合的该归类关系的步骤通过人工神经网络或支持向量机算法进行。
4.一种绘图处理程序的分析方法,包括:
提供待估算绘图程序,并获得该待估算绘图程序的多个待估算绘图参数;
依据该些待估算绘图参数,分析出该待估算绘图程序属于多个集合(group)的至少其中之一,并依据该些集合的至少其中之一和一绘图处理器的多个硬件元件获得多个加权系数;以及
依据该些加权系数及该些待估算绘图参数,计算绘图处理器执行该待估算绘图程序的一负载总值;
其中,该些待估算绘图参数包含一般参数、几何参数及分割参数,一般参数与几何参数和分割参数不相同。
5.如权利要求4所述的绘图处理程序的分析方法,更包括:
提供多个参考绘图程序及各该参考绘图程序的多个参考绘图参数;
将该些参考绘图程序分类为该些集合;以及
依据该些参考绘图参数,训练出该些参考绘图程序对应于该些集合的归类关系。
6.如权利要求5所述的绘图处理程序的分析方法,其中将该些参考绘图程序分类为该些集合的步骤通过K平均算法、最大期望算法、高连通子图分群算法或基于连通性分群法/层次聚类法进行。
7.如权利要求5所述的绘图处理程序的分析方法,其中训练出该些参考绘图程序对应于该些集合的该归类关系的步骤通过人工神经网络或支持向量机算法进行。
8.如权利要求4所述的绘图处理程序的分析方法,其中,该绘图处理器的各该硬件元件以各对应的负载分值执行该待估算绘图程序,该些硬件元件的该些负载分值以该些加权系数进行加权系总和,而获得该负载总值。
9.如权利要求8所述的绘图处理程序的分析方法,其中各该负载分值与该些待估算绘图参数具有相对关系,该相对关系为线性关系、正交多项式回归关系、罗吉斯回归关系、或指数回归关系。
10.如权利要求4所述的绘图处理程序的分析方法,其中该负载总值为处理功耗或处理时间。
11.一种绘图处理程序的分析系统,包括:
参数撷取单元,对多个参考绘图程序个别分析出多个参考绘图参数;
分组单元,依据该些参考绘图参数,将该些参考绘图程序分类为多个集合;以及
归类单元,依据该些参考绘图参数,训练出该些参考绘图程序对应于该些集合的归类关系;以及
相对信息单元,计算各该些集合和多个硬件元件的多个加权系数,依据该些加权系数分析绘图处理器的该些硬件元件分别对应的负载分值与该些参考绘图参数的相对关系;
其中,该些参考绘图参数包含一般参数、几何参数及分割参数,一般参数与几何参数和分割参数不相同。
12.如权利要求11所述的绘图处理程序的分析系统,其中该分组单元通过K平均算法、最大期望算法、高连通子图分群算法或基于连通性分群法/层次聚类法将该些参考绘图程序分类为该些集合。
13.如权利要求11所述的绘图处理程序的分析系统,其中该归类单元通过人工神经网络或支持向量机算法训练出该些参考绘图程序对应于该些集合的该归类关系。
14.一种绘图处理程序的分析系统,包括:
参数撷取单元,对待估算绘图程序分析出多个待估算绘图参数;
归类单元,依据该些待估算绘图参数分析出该待估算绘图程序属于多个集合的至少其中之一,并依据该些集合的至少其中之一和一绘图处理器的多个硬件元件获得多个加权系数;以及
计算单元,依据该些加权系数及该些待估算绘图参数,计算绘图处理器执行该待估算绘图程序的负载总值;
其中,该些待估算绘图参数包含一般参数、几何参数及分割参数,一般参数与几何参数和分割参数不相同。
15.如权利要求14所述的绘图处理程序的分析系统,其中该参数撷取单元更对多个参考绘图程序个别分析出多个参考绘图参数,该分析系统更包括:
分组单元,将该些参考绘图程序分类为该些集合,该归类单元更依据该些参考绘图参数训练出该些参考绘图程序对应于该些集合的归类关系。
16.如权利要求15所述的绘图处理程序的分析系统,其中该分组单元通过K平均算法、最大期望算法、高连通子图分群算法或基于连通性分群法/层次聚类法将该些参考绘图程序分类为该些集合。
17.如权利要求15所述的绘图处理程序的分析系统,其中该归类单元通过人工神经网络或支持向量机算法训练出该些参考绘图程序对应于该些集合的该归类关系。
18.如权利要求14所述的绘图处理程序的分析系统,其中该绘图处理器的各该硬件元件以各对应的负载分值执行该待估算绘图程序,该些硬件元件的该些负载分值以该些加权系数进行加权总和,而获得该负载总值。
19.如权利要求18所述的绘图处理程序的分析系统,更包括:
相对信息单元,分析各该负载分值与该些待估算绘图参数的相对关系,该相对关系为线性关系、正交多项式回归关系、罗吉斯回归关系、或指数回归关系。
20.如权利要求14所述的绘图处理程序的分析系统,其中该负载总值为处理功耗或处理时间。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW104137577 | 2015-11-13 | ||
TW104137577 | 2015-11-13 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106708499A CN106708499A (zh) | 2017-05-24 |
CN106708499B true CN106708499B (zh) | 2020-10-27 |
Family
ID=58692014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510888257.XA Active CN106708499B (zh) | 2015-11-13 | 2015-12-07 | 绘图处理程序的分析方法与分析系统 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9953393B2 (zh) |
CN (1) | CN106708499B (zh) |
TW (1) | TWI613545B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112702737A (zh) * | 2020-06-19 | 2021-04-23 | 张仕红 | 基于云计算和5g互联的信息解析方法及信息解析系统 |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8914590B2 (en) | 2002-08-07 | 2014-12-16 | Pact Xpp Technologies Ag | Data processing method and device |
US20040012600A1 (en) | 2002-03-22 | 2004-01-22 | Deering Michael F. | Scalable high performance 3d graphics |
AU2003286131A1 (en) | 2002-08-07 | 2004-03-19 | Pact Xpp Technologies Ag | Method and device for processing data |
US7362892B2 (en) * | 2003-07-02 | 2008-04-22 | Lockheed Martin Corporation | Self-optimizing classifier |
GB2406184B (en) | 2003-09-17 | 2006-03-15 | Advanced Risc Mach Ltd | Data processing system |
US7418606B2 (en) | 2003-09-18 | 2008-08-26 | Nvidia Corporation | High quality and high performance three-dimensional graphics architecture for portable handheld devices |
US7567252B2 (en) * | 2003-12-09 | 2009-07-28 | Microsoft Corporation | Optimizing performance of a graphics processing unit for efficient execution of general matrix operations |
US20060080076A1 (en) | 2004-10-12 | 2006-04-13 | Nec Laboratories America, Inc. | System-level power estimation using heteregeneous power models |
US7747070B2 (en) * | 2005-08-31 | 2010-06-29 | Microsoft Corporation | Training convolutional neural networks on graphics processing units |
US7868893B2 (en) * | 2006-03-07 | 2011-01-11 | Graphics Properties Holdings, Inc. | Integration of graphical application content into the graphical scene of another application |
US7549069B2 (en) | 2006-03-15 | 2009-06-16 | Fujitsu Limited | Estimating software power consumption |
US8436864B2 (en) * | 2006-08-01 | 2013-05-07 | Nvidia Corporation | Method and user interface for enhanced graphical operation organization |
US9648325B2 (en) | 2007-06-30 | 2017-05-09 | Microsoft Technology Licensing, Llc | Video decoding implementations for a graphics processing unit |
US8199158B2 (en) | 2008-06-11 | 2012-06-12 | Intel Corporation | Performance allocation method and apparatus |
US8180604B2 (en) * | 2008-09-30 | 2012-05-15 | Hewlett-Packard Development Company, L.P. | Optimizing a prediction of resource usage of multiple applications in a virtual environment |
US9256514B2 (en) | 2009-02-19 | 2016-02-09 | Nvidia Corporation | Debugging and perfomance analysis of applications |
US20130127858A1 (en) * | 2009-05-29 | 2013-05-23 | Luc Leroy | Interception of Graphics API Calls for Optimization of Rendering |
US20110016455A1 (en) | 2009-07-20 | 2011-01-20 | Glenn Perry | Power Profiling for Embedded System Design |
US8645732B2 (en) | 2010-02-19 | 2014-02-04 | Qualcomm, Incorporated | Protocol stack power optimization for wireless communications devices |
US8803892B2 (en) * | 2010-06-10 | 2014-08-12 | Otoy, Inc. | Allocation of GPU resources across multiple clients |
US8643656B2 (en) | 2010-09-30 | 2014-02-04 | Nec Laboratories America, Inc. | Energy-aware task consolidation on graphics processing unit (GPU) |
US8527239B2 (en) | 2010-10-01 | 2013-09-03 | Apple Inc. | Automatic detection of performance bottlenecks in a graphics system |
US8620985B2 (en) * | 2010-10-14 | 2013-12-31 | Hewlett-Packard Development Company, L.P. | Method, system, and product for performing uniformly fine-grain data parallel computing |
US8650428B2 (en) | 2011-07-19 | 2014-02-11 | Ati Technologies Ulc | Dynamic weight calculation in a digital power estimation and management system |
CN103092837A (zh) * | 2011-10-28 | 2013-05-08 | 鸿富锦精密工业(深圳)有限公司 | 量测图形文件解析系统及方法 |
US9141166B2 (en) | 2011-12-13 | 2015-09-22 | Intel Corporation | Method, apparatus, and system for energy efficiency and energy conservation including dynamic control of energy consumption in power domains |
US9310875B2 (en) | 2011-12-22 | 2016-04-12 | Intel Corporation | Instruction that specifies an application thread performance state |
US9135741B2 (en) * | 2012-01-23 | 2015-09-15 | Nec Laboratories America, Inc. | Interference-driven resource management for GPU-based heterogeneous clusters |
US20130211752A1 (en) | 2012-02-14 | 2013-08-15 | Wayne State University | Software power analysis |
CN103294716B (zh) * | 2012-02-29 | 2016-08-10 | 佳能株式会社 | 用于分类器的在线半监督学习方法和装置及处理设备 |
US20140082383A1 (en) | 2012-09-20 | 2014-03-20 | Apple Inc. | Predicting user intent and future interaction from application activities |
CN103778267B (zh) * | 2012-10-19 | 2017-03-29 | 英业达科技有限公司 | 计算机绘图的公差检测系统及其方法 |
US9195291B2 (en) | 2013-06-21 | 2015-11-24 | Apple Inc. | Digital power estimator to control processor power consumption |
US10084869B2 (en) | 2013-10-04 | 2018-09-25 | Verto Analytics Oy | Metering user behaviour and engagement with user interface in terminal devices |
CN103645908B (zh) * | 2013-12-29 | 2016-09-14 | 中国科学院软件研究所 | 网构软件全生命周期开发实现系统 |
US9715663B2 (en) * | 2014-05-01 | 2017-07-25 | International Business Machines Corporation | Predicting application performance on hardware accelerators |
KR101927233B1 (ko) * | 2015-03-16 | 2018-12-12 | 한국전자통신연구원 | 이기종 멀티-코어 시스템의 gpu 전력 측정 방법 |
US9747659B2 (en) * | 2015-06-07 | 2017-08-29 | Apple Inc. | Starvation free scheduling of prioritized workloads on the GPU |
-
2015
- 2015-12-07 CN CN201510888257.XA patent/CN106708499B/zh active Active
- 2015-12-29 US US14/983,494 patent/US9953393B2/en active Active
-
2016
- 2016-10-05 TW TW105132243A patent/TWI613545B/zh active
Non-Patent Citations (2)
Title |
---|
<Adaptive Configuration Selection for Power-Constrained Heterogeneous Systems>;Bailey et al.;<IEEE 2014 43nd International Conference on Parallel Processing>;20140912;第5页左侧最后一段 * |
<GPGPU Performance and Power Estimation Using Machine Learning>;Gene Wu et al.;<High Performance Computer Architecture,2015 IEEE 21st International Symposium>;20150207;abstract以及section III. D. Classifier on page 7 of 13,section III. C. Clustering on page 6 of 13 * |
Also Published As
Publication number | Publication date |
---|---|
US20170140495A1 (en) | 2017-05-18 |
CN106708499A (zh) | 2017-05-24 |
TW201717013A (zh) | 2017-05-16 |
TWI613545B (zh) | 2018-02-01 |
US9953393B2 (en) | 2018-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10600167B2 (en) | Performing spatiotemporal filtering | |
US11315018B2 (en) | Systems and methods for pruning neural networks for resource efficient inference | |
US20200027198A1 (en) | Kernel-predicting convolutional neural networks for denoising | |
US11068781B2 (en) | Temporal ensembling for semi-supervised learning | |
US20220405582A1 (en) | Systems and methods for training neural networks with sparse data | |
US7765500B2 (en) | Automated generation of theoretical performance analysis based upon workload and design configuration | |
US11836597B2 (en) | Detecting visual artifacts in image sequences using a neural network model | |
US20180336464A1 (en) | Machine learning technique for automatic modeling of multiple-valued outputs | |
US11244493B2 (en) | Global illumination using shared lighting contributions for interactions in path tracing | |
US11165848B1 (en) | Evaluating qualitative streaming experience using session performance metadata | |
CN114092963A (zh) | 关键点检测及模型训练方法、装置、设备和存储介质 | |
US20230419590A1 (en) | Light importance caching using spatial hashing in real-time ray tracing applications | |
US11145110B2 (en) | Adaptive ray tracing suitable for shadow rendering | |
CN114424239A (zh) | 用于光线追踪应用中的循环模糊的去噪技术 | |
US11875478B2 (en) | Dynamic image smoothing based on network conditions | |
CN106708499B (zh) | 绘图处理程序的分析方法与分析系统 | |
US11069095B1 (en) | Techniques for efficiently sampling an image | |
WO2021120577A1 (zh) | 神经网络模型中的数据计算方法、图像处理方法及装置 | |
US7830386B1 (en) | Register transfer level simulation using a graphics processor | |
CN117556273B (zh) | 一种通过多图形处理器计算对比损失的方法和装置 | |
US11961176B2 (en) | Global illumination using shared lighting contributions for interactions in path tracing | |
US20230229916A1 (en) | Scalable tensor network contraction using reinforcement learning | |
US11966765B2 (en) | Memory bandwidth throttling for virtual machines | |
CN116109627B (zh) | 基于迁移学习和小样本学习缺陷检测方法、装置及介质 | |
Galea et al. | Gpu-based selective sparse sampling for interactive high-fidelity rendering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |