CN111048156A - 一种大规模染色阵列性能检测评价方法 - Google Patents
一种大规模染色阵列性能检测评价方法 Download PDFInfo
- Publication number
- CN111048156A CN111048156A CN201911147107.8A CN201911147107A CN111048156A CN 111048156 A CN111048156 A CN 111048156A CN 201911147107 A CN201911147107 A CN 201911147107A CN 111048156 A CN111048156 A CN 111048156A
- Authority
- CN
- China
- Prior art keywords
- performance
- processing performance
- dyeing
- task block
- array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004043 dyeing Methods 0.000 title claims abstract description 61
- 238000001514 detection method Methods 0.000 title claims abstract description 39
- 238000011156 evaluation Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 22
- 238000010186 staining Methods 0.000 claims description 9
- 238000007620 mathematical function Methods 0.000 claims description 3
- 238000003491 array Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B99/00—Subject matter not provided for in other groups of this subclass
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Sampling And Sample Adjustment (AREA)
Abstract
本发明属于计算机图形领域,具体涉及一种大规模染色阵列性能检测评价方法。本方法提出染色阵列总体性能评价、硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,分别通过染色阵列总体性能评价任务快、硬件处理性能检测任务块、软件接口性能检测任务块、并行处理性能检测任务块和典型应用处理性能检测任务块实现。创造性地提出染色阵列总体性能评价,通过硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四个维度,来检测评价大规模染色阵列的处理性能。
Description
技术领域
本发明属于计算机软件领域,尤其涉及一种大规模染色阵列性能检测评价方法。
背景技术
大规模染色阵列作为图形处理器的重要组成部分,其性能直接影响图形处理器的性能。目前公开资料中,大规模染色阵列的性能没有有效的评价方法,所以,提出染色阵列总体性能评价,通过硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四个维度,来检测评价大规模染色阵列的处理性能。
发明内容
本发明的目的是:
本发明主要提供一种大规模染色阵列性能检测评价方法,从四个维度来检测评价大规模染色阵列的处理性能。
本发明的解决方案是:
一种大规模染色阵列性能检测评价方法,其特征在于:根据检测硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,通过染色阵列总体性能评价来评价大规模染色阵列的处理性能。
优选的,所述染色阵列总体性能评价、硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,分别通过染色阵列总体性能评价任务快、硬件处理性能检测任务块、软件接口性能检测任务块、并行处理性能检测任务块和典型应用处理性能检测任务块实现。
优选的,所述硬件处理性能检测任务块用于检测染色阵列的硬件处理性能,包括单指令运算性能和硬件资源数量;其中,单指令运算性能包括指令的运算性能、访问存储空间的性能,均由每单位时间执行的指令数评价;硬件资源数量包括染色阵列内核的数量、寄存器数量、内部存储空间和外部存储空间的容量。
优选的,所述软件接口性能检测任务块用于检测软件接口性能,所述软件接口是在染色阵列中由汇编实现的函数接口,包括内建函数和典型接口;内建函数为染色阵列中常用的数学函数,典型接口为实现特定染色功能的函数接口,内建函数运算性能和典型接口运算性能均由完成特定功能所使用的指令数量、访存次数、分支数量和指令并行度评价。
优选的,所述并行处理性能检测任务块用于检测并行处理性能;所述并行处理性能由大规模染色阵列的线程数量和可并行线程数量和线程切换性能共同组成。
优选的,典型应用根据实现阶段不同,将应用分为顶点染色应用和像素染色应用,其中顶点染色应用运算性能由顶点处理性能评价,像素染色应用运算性能由像素处理性能评价;所述典型应用处理性能检测任务块用于检测顶点染色应用和像素染色应用。
本发明的优点是:本发明提供的一种大规模染色阵列性能检测评价方法,根据大规模染色阵列的架构特征和功能,分别从硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能这四个维度,来检测评价大规模染色阵列的处理性能,使得检测和评价大规模染色阵列有了统一和高效的方法,并且为进一步优化大规模染色阵列提供指导方向。
附图说明
图1为本发明的方法任务块图;
其中:1、染色阵列总体性能评价任务快;2、硬件处理性能检测任务块;3、软件接口性能检测任务块;4、并行处理性能检测任务块;5、典型应用处理性能检测任务块。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面结合说明书附图和具体实施例对本发明的技术方案做进一步详细描述。
一种大规模染色阵列性能检测评价方法,其特征在于:根据检测硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,通过染色阵列总体性能评价来评价大规模染色阵列的处理性能。
优选的,所述染色阵列总体性能评价、硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,分别通过染色阵列总体性能评价任务快1、硬件处理性能检测任务块2、软件接口性能检测任务块3、并行处理性能检测任务块4和典型应用处理性能检测任务块5实现。
优选的,所述硬件处理性能检测任务块2用于检测染色阵列的硬件处理性能,包括单指令运算性能和硬件资源数量;其中,单指令运算性能包括指令的运算性能、访问存储空间的性能,均由每单位时间执行的指令数评价;硬件资源数量包括染色阵列内核的数量、寄存器数量、内部存储空间和外部存储空间的容量。
优选的,所述软件接口性能检测任务块3用于检测软件接口性能,所述软件接口是在染色阵列中由汇编实现的函数接口,包括内建函数和典型接口;内建函数为染色阵列中常用的数学函数,典型接口为实现特定染色功能的函数接口,内建函数运算性能和典型接口运算性能均由完成特定功能所使用的指令数量、访存次数、分支数量和指令并行度评价。
优选的,所述并行处理性能检测任务块4用于检测并行处理性能;所述并行处理性能由大规模染色阵列的线程数量和可并行线程数量和线程切换性能共同组成。
优选的,典型应用根据实现阶段不同,将应用分为顶点染色应用和像素染色应用,其中顶点染色应用运算性能由顶点处理性能评价,像素染色应用运算性能由像素处理性能评价;所述典型应用处理性能检测任务块5用于检测顶点染色应用和像素染色应用。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细地说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (5)
1.一种大规模染色阵列性能检测评价方法,其特征在于:根据检测硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,通过染色阵列总体性能评价来评价大规模染色阵列的处理性能;所述染色阵列总体性能评价、硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,分别通过染色阵列总体性能评价任务快(1)、硬件处理性能检测任务块(2)、软件接口性能检测任务块(3)、并行处理性能检测任务块(4)和典型应用处理性能检测任务块(5)实现。
2.根据权利要求1所述的一种大规模染色阵列性能检测评价方法,其特征在于:所述硬件处理性能检测任务块(2)用于检测染色阵列的硬件处理性能,包括单指令运算性能和硬件资源数量;其中,单指令运算性能包括指令的运算性能、访问存储空间的性能,均由每单位时间执行的指令数评价;硬件资源数量包括染色阵列内核的数量、寄存器数量、内部存储空间和外部存储空间的容量。
3.根据权利要求2所述的一种大规模染色阵列性能检测评价方法,其特征在于:所述软件接口性能检测任务块(3)用于检测软件接口性能,所述软件接口是在染色阵列中由汇编实现的函数接口,包括内建函数和典型接口;内建函数为染色阵列中常用的数学函数,典型接口为实现特定染色功能的函数接口,内建函数运算性能和典型接口运算性能均由完成特定功能所使用的指令数量、访存次数、分支数量和指令并行度评价。
4.根据权利要求3所述的一种大规模染色阵列性能检测评价方法,其特征在于:所述并行处理性能检测任务块(4)用于检测并行处理性能;所述并行处理性能由大规模染色阵列的线程数量和可并行线程数量和线程切换性能共同组成。
5.根据权利要求4所述的一种大规模染色阵列性能检测评价方法,其特征在于:典型应用根据实现阶段不同,将应用分为顶点染色应用和像素染色应用,其中顶点染色应用运算性能由顶点处理性能评价,像素染色应用运算性能由像素处理性能评价;所述典型应用处理性能检测任务块(5)用于检测顶点染色应用和像素染色应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911147107.8A CN111048156A (zh) | 2019-11-21 | 2019-11-21 | 一种大规模染色阵列性能检测评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911147107.8A CN111048156A (zh) | 2019-11-21 | 2019-11-21 | 一种大规模染色阵列性能检测评价方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111048156A true CN111048156A (zh) | 2020-04-21 |
Family
ID=70231835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911147107.8A Pending CN111048156A (zh) | 2019-11-21 | 2019-11-21 | 一种大规模染色阵列性能检测评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111048156A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112579410A (zh) * | 2020-12-05 | 2021-03-30 | 西安翔腾微电子科技有限公司 | 一种命令处理器性能分析与评价方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140098117A1 (en) * | 2012-10-09 | 2014-04-10 | Qualcomm Incorporated | Multi-primitive graphics rendering pipeline |
CN105513003A (zh) * | 2015-12-11 | 2016-04-20 | 中国航空工业集团公司西安航空计算技术研究所 | 一种图形处理器统一染色器阵列体系结构 |
CN109800138A (zh) * | 2018-12-18 | 2019-05-24 | 平安科技(深圳)有限公司 | 一种cpu测试方法、电子装置及存储介质 |
CN110246210A (zh) * | 2014-04-03 | 2019-09-17 | 英特尔公司 | 映射多速率着色到单片程序 |
-
2019
- 2019-11-21 CN CN201911147107.8A patent/CN111048156A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140098117A1 (en) * | 2012-10-09 | 2014-04-10 | Qualcomm Incorporated | Multi-primitive graphics rendering pipeline |
CN110246210A (zh) * | 2014-04-03 | 2019-09-17 | 英特尔公司 | 映射多速率着色到单片程序 |
CN105513003A (zh) * | 2015-12-11 | 2016-04-20 | 中国航空工业集团公司西安航空计算技术研究所 | 一种图形处理器统一染色器阵列体系结构 |
CN109800138A (zh) * | 2018-12-18 | 2019-05-24 | 平安科技(深圳)有限公司 | 一种cpu测试方法、电子装置及存储介质 |
Non-Patent Citations (2)
Title |
---|
周兴航: "ARM移动GPU图形渲染性能分析方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
马城城: "统一渲染架构GPU图形处理量化性能模型研究", 《电子技术应用》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112579410A (zh) * | 2020-12-05 | 2021-03-30 | 西安翔腾微电子科技有限公司 | 一种命令处理器性能分析与评价方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Performance analysis and characterization of training deep learning models on mobile device | |
US20190080429A1 (en) | Adaptive scheduling for task assignment among heterogeneous processor cores | |
Landaverde et al. | An investigation of unified memory access performance in cuda | |
Fang et al. | Frequent itemset mining on graphics processors | |
US9189519B2 (en) | Executing database queries using multiple processors | |
CN108664367B (zh) | 一种基于处理器的功耗控制方法及装置 | |
EP3846036B1 (en) | Matrix storage method, matrix access method, apparatus and electronic device | |
Jin et al. | Analyzing deep learning model inferences for image classification using OpenVINO | |
CN111026444A (zh) | 一种gpu并行阵列simt指令处理模型 | |
Oden et al. | Energy-efficient collective reduce and allreduce operations on distributed GPUs | |
US20180225150A1 (en) | Scheduling heterogenous processors | |
Huang et al. | GPU computing performance analysis on matrix multiplication | |
CN111048156A (zh) | 一种大规模染色阵列性能检测评价方法 | |
US10684834B2 (en) | Method and apparatus for detecting inter-instruction data dependency | |
Parimalarangan et al. | Fast parallel graph triad census and triangle counting on shared-memory platforms | |
Su et al. | Accelerating inclusion-based pointer analysis on heterogeneous CPU-GPU systems | |
CN114153494B (zh) | 一种基于热力图的热点代码优化方法及装置 | |
Usui et al. | A challenge of portable and high-speed fpga accelerator | |
Radaideh et al. | Exploiting zero data to reduce register file and execution unit dynamic power consumption in GPGPUs | |
Haseljic et al. | Opencl superpixel implementation on a general purpose multi-core cpu | |
JP6439623B2 (ja) | 計算機、動作周波数決定プログラム及び動作周波数決定方法 | |
CN105607991A (zh) | 一种基于异步线程的测试方法和装置 | |
Bethel et al. | Improving performance of structured-memory, data-intensive applications on multi-core platforms via a space-filling curve memory layout | |
CN118502964B (zh) | 托卡马克新经典环向粘滞力矩cuda模拟实现方法 | |
CN112579299B (zh) | 资源调度方法、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200421 |