CN111048156A - 一种大规模染色阵列性能检测评价方法 - Google Patents

一种大规模染色阵列性能检测评价方法 Download PDF

Info

Publication number
CN111048156A
CN111048156A CN201911147107.8A CN201911147107A CN111048156A CN 111048156 A CN111048156 A CN 111048156A CN 201911147107 A CN201911147107 A CN 201911147107A CN 111048156 A CN111048156 A CN 111048156A
Authority
CN
China
Prior art keywords
performance
processing performance
dyeing
task block
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911147107.8A
Other languages
English (en)
Inventor
聂曌
田泽
马城城
秦翔
刘晖
张琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Aeronautics Computing Technique Research Institute of AVIC
Original Assignee
Xian Aeronautics Computing Technique Research Institute of AVIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Aeronautics Computing Technique Research Institute of AVIC filed Critical Xian Aeronautics Computing Technique Research Institute of AVIC
Priority to CN201911147107.8A priority Critical patent/CN111048156A/zh
Publication of CN111048156A publication Critical patent/CN111048156A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Sampling And Sample Adjustment (AREA)

Abstract

本发明属于计算机图形领域,具体涉及一种大规模染色阵列性能检测评价方法。本方法提出染色阵列总体性能评价、硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,分别通过染色阵列总体性能评价任务快、硬件处理性能检测任务块、软件接口性能检测任务块、并行处理性能检测任务块和典型应用处理性能检测任务块实现。创造性地提出染色阵列总体性能评价,通过硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四个维度,来检测评价大规模染色阵列的处理性能。

Description

一种大规模染色阵列性能检测评价方法
技术领域
本发明属于计算机软件领域,尤其涉及一种大规模染色阵列性能检测评价方法。
背景技术
大规模染色阵列作为图形处理器的重要组成部分,其性能直接影响图形处理器的性能。目前公开资料中,大规模染色阵列的性能没有有效的评价方法,所以,提出染色阵列总体性能评价,通过硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四个维度,来检测评价大规模染色阵列的处理性能。
发明内容
本发明的目的是:
本发明主要提供一种大规模染色阵列性能检测评价方法,从四个维度来检测评价大规模染色阵列的处理性能。
本发明的解决方案是:
一种大规模染色阵列性能检测评价方法,其特征在于:根据检测硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,通过染色阵列总体性能评价来评价大规模染色阵列的处理性能。
优选的,所述染色阵列总体性能评价、硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,分别通过染色阵列总体性能评价任务快、硬件处理性能检测任务块、软件接口性能检测任务块、并行处理性能检测任务块和典型应用处理性能检测任务块实现。
优选的,所述硬件处理性能检测任务块用于检测染色阵列的硬件处理性能,包括单指令运算性能和硬件资源数量;其中,单指令运算性能包括指令的运算性能、访问存储空间的性能,均由每单位时间执行的指令数评价;硬件资源数量包括染色阵列内核的数量、寄存器数量、内部存储空间和外部存储空间的容量。
优选的,所述软件接口性能检测任务块用于检测软件接口性能,所述软件接口是在染色阵列中由汇编实现的函数接口,包括内建函数和典型接口;内建函数为染色阵列中常用的数学函数,典型接口为实现特定染色功能的函数接口,内建函数运算性能和典型接口运算性能均由完成特定功能所使用的指令数量、访存次数、分支数量和指令并行度评价。
优选的,所述并行处理性能检测任务块用于检测并行处理性能;所述并行处理性能由大规模染色阵列的线程数量和可并行线程数量和线程切换性能共同组成。
优选的,典型应用根据实现阶段不同,将应用分为顶点染色应用和像素染色应用,其中顶点染色应用运算性能由顶点处理性能评价,像素染色应用运算性能由像素处理性能评价;所述典型应用处理性能检测任务块用于检测顶点染色应用和像素染色应用。
本发明的优点是:本发明提供的一种大规模染色阵列性能检测评价方法,根据大规模染色阵列的架构特征和功能,分别从硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能这四个维度,来检测评价大规模染色阵列的处理性能,使得检测和评价大规模染色阵列有了统一和高效的方法,并且为进一步优化大规模染色阵列提供指导方向。
附图说明
图1为本发明的方法任务块图;
其中:1、染色阵列总体性能评价任务快;2、硬件处理性能检测任务块;3、软件接口性能检测任务块;4、并行处理性能检测任务块;5、典型应用处理性能检测任务块。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面结合说明书附图和具体实施例对本发明的技术方案做进一步详细描述。
一种大规模染色阵列性能检测评价方法,其特征在于:根据检测硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,通过染色阵列总体性能评价来评价大规模染色阵列的处理性能。
优选的,所述染色阵列总体性能评价、硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,分别通过染色阵列总体性能评价任务快1、硬件处理性能检测任务块2、软件接口性能检测任务块3、并行处理性能检测任务块4和典型应用处理性能检测任务块5实现。
优选的,所述硬件处理性能检测任务块2用于检测染色阵列的硬件处理性能,包括单指令运算性能和硬件资源数量;其中,单指令运算性能包括指令的运算性能、访问存储空间的性能,均由每单位时间执行的指令数评价;硬件资源数量包括染色阵列内核的数量、寄存器数量、内部存储空间和外部存储空间的容量。
优选的,所述软件接口性能检测任务块3用于检测软件接口性能,所述软件接口是在染色阵列中由汇编实现的函数接口,包括内建函数和典型接口;内建函数为染色阵列中常用的数学函数,典型接口为实现特定染色功能的函数接口,内建函数运算性能和典型接口运算性能均由完成特定功能所使用的指令数量、访存次数、分支数量和指令并行度评价。
优选的,所述并行处理性能检测任务块4用于检测并行处理性能;所述并行处理性能由大规模染色阵列的线程数量和可并行线程数量和线程切换性能共同组成。
优选的,典型应用根据实现阶段不同,将应用分为顶点染色应用和像素染色应用,其中顶点染色应用运算性能由顶点处理性能评价,像素染色应用运算性能由像素处理性能评价;所述典型应用处理性能检测任务块5用于检测顶点染色应用和像素染色应用。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细地说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (5)

1.一种大规模染色阵列性能检测评价方法,其特征在于:根据检测硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,通过染色阵列总体性能评价来评价大规模染色阵列的处理性能;所述染色阵列总体性能评价、硬件处理性能、软件接口性能、并行处理性能和典型应用处理性能四种维度的性能指标,分别通过染色阵列总体性能评价任务快(1)、硬件处理性能检测任务块(2)、软件接口性能检测任务块(3)、并行处理性能检测任务块(4)和典型应用处理性能检测任务块(5)实现。
2.根据权利要求1所述的一种大规模染色阵列性能检测评价方法,其特征在于:所述硬件处理性能检测任务块(2)用于检测染色阵列的硬件处理性能,包括单指令运算性能和硬件资源数量;其中,单指令运算性能包括指令的运算性能、访问存储空间的性能,均由每单位时间执行的指令数评价;硬件资源数量包括染色阵列内核的数量、寄存器数量、内部存储空间和外部存储空间的容量。
3.根据权利要求2所述的一种大规模染色阵列性能检测评价方法,其特征在于:所述软件接口性能检测任务块(3)用于检测软件接口性能,所述软件接口是在染色阵列中由汇编实现的函数接口,包括内建函数和典型接口;内建函数为染色阵列中常用的数学函数,典型接口为实现特定染色功能的函数接口,内建函数运算性能和典型接口运算性能均由完成特定功能所使用的指令数量、访存次数、分支数量和指令并行度评价。
4.根据权利要求3所述的一种大规模染色阵列性能检测评价方法,其特征在于:所述并行处理性能检测任务块(4)用于检测并行处理性能;所述并行处理性能由大规模染色阵列的线程数量和可并行线程数量和线程切换性能共同组成。
5.根据权利要求4所述的一种大规模染色阵列性能检测评价方法,其特征在于:典型应用根据实现阶段不同,将应用分为顶点染色应用和像素染色应用,其中顶点染色应用运算性能由顶点处理性能评价,像素染色应用运算性能由像素处理性能评价;所述典型应用处理性能检测任务块(5)用于检测顶点染色应用和像素染色应用。
CN201911147107.8A 2019-11-21 2019-11-21 一种大规模染色阵列性能检测评价方法 Pending CN111048156A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911147107.8A CN111048156A (zh) 2019-11-21 2019-11-21 一种大规模染色阵列性能检测评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911147107.8A CN111048156A (zh) 2019-11-21 2019-11-21 一种大规模染色阵列性能检测评价方法

Publications (1)

Publication Number Publication Date
CN111048156A true CN111048156A (zh) 2020-04-21

Family

ID=70231835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911147107.8A Pending CN111048156A (zh) 2019-11-21 2019-11-21 一种大规模染色阵列性能检测评价方法

Country Status (1)

Country Link
CN (1) CN111048156A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579410A (zh) * 2020-12-05 2021-03-30 西安翔腾微电子科技有限公司 一种命令处理器性能分析与评价方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140098117A1 (en) * 2012-10-09 2014-04-10 Qualcomm Incorporated Multi-primitive graphics rendering pipeline
CN105513003A (zh) * 2015-12-11 2016-04-20 中国航空工业集团公司西安航空计算技术研究所 一种图形处理器统一染色器阵列体系结构
CN109800138A (zh) * 2018-12-18 2019-05-24 平安科技(深圳)有限公司 一种cpu测试方法、电子装置及存储介质
CN110246210A (zh) * 2014-04-03 2019-09-17 英特尔公司 映射多速率着色到单片程序

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140098117A1 (en) * 2012-10-09 2014-04-10 Qualcomm Incorporated Multi-primitive graphics rendering pipeline
CN110246210A (zh) * 2014-04-03 2019-09-17 英特尔公司 映射多速率着色到单片程序
CN105513003A (zh) * 2015-12-11 2016-04-20 中国航空工业集团公司西安航空计算技术研究所 一种图形处理器统一染色器阵列体系结构
CN109800138A (zh) * 2018-12-18 2019-05-24 平安科技(深圳)有限公司 一种cpu测试方法、电子装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周兴航: "ARM移动GPU图形渲染性能分析方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
马城城: "统一渲染架构GPU图形处理量化性能模型研究", 《电子技术应用》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579410A (zh) * 2020-12-05 2021-03-30 西安翔腾微电子科技有限公司 一种命令处理器性能分析与评价方法

Similar Documents

Publication Publication Date Title
Liu et al. Performance analysis and characterization of training deep learning models on mobile device
US20190080429A1 (en) Adaptive scheduling for task assignment among heterogeneous processor cores
Landaverde et al. An investigation of unified memory access performance in cuda
Fang et al. Frequent itemset mining on graphics processors
US9189519B2 (en) Executing database queries using multiple processors
CN108664367B (zh) 一种基于处理器的功耗控制方法及装置
EP3846036B1 (en) Matrix storage method, matrix access method, apparatus and electronic device
Jin et al. Analyzing deep learning model inferences for image classification using OpenVINO
CN111026444A (zh) 一种gpu并行阵列simt指令处理模型
Oden et al. Energy-efficient collective reduce and allreduce operations on distributed GPUs
US20180225150A1 (en) Scheduling heterogenous processors
Huang et al. GPU computing performance analysis on matrix multiplication
CN111048156A (zh) 一种大规模染色阵列性能检测评价方法
US10684834B2 (en) Method and apparatus for detecting inter-instruction data dependency
Parimalarangan et al. Fast parallel graph triad census and triangle counting on shared-memory platforms
Su et al. Accelerating inclusion-based pointer analysis on heterogeneous CPU-GPU systems
CN114153494B (zh) 一种基于热力图的热点代码优化方法及装置
Usui et al. A challenge of portable and high-speed fpga accelerator
Radaideh et al. Exploiting zero data to reduce register file and execution unit dynamic power consumption in GPGPUs
Haseljic et al. Opencl superpixel implementation on a general purpose multi-core cpu
JP6439623B2 (ja) 計算機、動作周波数決定プログラム及び動作周波数決定方法
CN105607991A (zh) 一种基于异步线程的测试方法和装置
Bethel et al. Improving performance of structured-memory, data-intensive applications on multi-core platforms via a space-filling curve memory layout
CN118502964B (zh) 托卡马克新经典环向粘滞力矩cuda模拟实现方法
CN112579299B (zh) 资源调度方法、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200421