CN111062855A - 一种图形流水线性能分析方法 - Google Patents

一种图形流水线性能分析方法 Download PDF

Info

Publication number
CN111062855A
CN111062855A CN201911125549.2A CN201911125549A CN111062855A CN 111062855 A CN111062855 A CN 111062855A CN 201911125549 A CN201911125549 A CN 201911125549A CN 111062855 A CN111062855 A CN 111062855A
Authority
CN
China
Prior art keywords
performance
processing
data
function
pipeline
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911125549.2A
Other languages
English (en)
Other versions
CN111062855B (zh
Inventor
刘晖
田泽
马城城
秦翔
聂曌
张琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Aeronautics Computing Technique Research Institute of AVIC
Original Assignee
Xian Aeronautics Computing Technique Research Institute of AVIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Aeronautics Computing Technique Research Institute of AVIC filed Critical Xian Aeronautics Computing Technique Research Institute of AVIC
Priority to CN201911125549.2A priority Critical patent/CN111062855B/zh
Publication of CN111062855A publication Critical patent/CN111062855A/zh
Application granted granted Critical
Publication of CN111062855B publication Critical patent/CN111062855B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Image Processing (AREA)
  • Image Generation (AREA)

Abstract

本发明属于计算机图形处理领域,尤其涉及一种图形流水线性能分析方法。该方法包括以下步骤,(1)对单一功能性能的分析;(2)对竞争资源访存性能的分析;(3)对单元负载性能的均衡分析;(4)对图形流水线性能的分析。本发明加速了图形流水线的性能分析,实现了由单一功能点到整体图形流水线逐层递进的性能分析方法,为复杂功能超长流水线性能分析提供参考。

Description

一种图形流水线性能分析方法
技术领域
本发明属于计算机图形学领域,尤其涉及一种图形流水线性能分析方法。
背景技术
图形流水线的性能分析是图形流水线设计的核心和关键技术,其体现了图形流水线的功能性能,单元性能及流水线整体性能,为图形流水线的设计及优化提供了具体的参考标准。OpenGL、DirectX等标准3D图形绘制接口规定了接口的参数类型,实现功能等,但未涉及图形流水线的性能分析与评价,英伟达、AMD等图形处理器芯片厂家也未对外公开相关资料。目前在公开资料或者专利中没有图形流水线的性能分析方法。
发明内容
本发明的目的是:
提供一种图形流水线性能分析方法,通过对功能点、功能单元、整体流水线的性能分析,准确定位图形流水线的性能瓶颈,任务负载处理性能,为图形流水线的优化指明方向。
本发明的解决方案是:
一种图形流水线性能分析方法,该方法包括如下步骤:
(1)对单一功能性能的分析;
(2)对竞争资源访存性能的分析;
(3)对单元负载性能的均衡分析;
(4)对图形流水线性能的分析。
进一步的,所述步骤(1)包括:
首先分析流水线中各个功能的处理性能,得到《功能处理性能分析表》,分析相关功能间处理性能是否均衡,若不均衡则性能处理较慢的功能将会成为性能瓶颈,并且浪费了高性能功能的处理能力;
其次分析单点功能的最优最差性能是否满足整体流水线的最优最差性能指标,若不满足则应优化单点功能的处理性能。
进一步的,所述步骤(2)包括:
首先分析功能访存性能与处理性能的均衡,若不均衡则会造成处理性能的浪费或数据阻塞,
其次分析多路访存数据带宽分配,符合图形数据处理的数据量要求,完善步骤(1)中得到的《功能处理性能分析表》中与访存竞争资源相关的性能,并确认相关功能间处理性能是否均衡。
进一步的,所述步骤(3)包括:
通过典型功能的单元运行周期和单元处理任务的平均性能,首先分析流水线中相关单元的整体性能是否匹配,若不匹配则性能处理较慢的单元将会成为性能瓶颈,并且制约了高性能的单元的处理能力,
其次分析同一单元内多种功能的处理性能,若性能不均衡,则应提高性能较低的功能处理性能,最后分析单元的最优最差性能是否满足流水线典型性能指标。
进一步的,所述步骤(4)包括:
首先根据流水线的典型数据特征将流水线数据分为顶点数据、图元数据、像素数据,每一种特征数据的处理性能与数据量相匹配,
其次每一种数据流在流水线中按照处理流程复杂度不同,分析在简单模式和复杂模式下不同类型数据流的处理性能是否满足流水线典型性能指标;
其中,简单模式指图形流水线中数据流必须经过的处理流程,复杂模式指图形流水线中数据流经过所有功能的处理流程。
本发明的优点是:
本发明以逐层递进的方式,从单一功能性能,访存仲裁对性能的影响、单元功能性能、图形流水线整体性能四方面分析评价图形流水线性能,该方法能够准确定位图形流水线的性能瓶颈,分析任务负载均衡处理性能,提取图形流水线典型性能指标,为图形流水线的优化指明方向。
附图说明
图1是本发明的图形流水线性能分析方法的功能框图。
具体实施方式
下面结合附图和具体实施例,对本发明的技术方案进行清楚、完整地表述。显然,所表述的实施例仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提所获得的所有其他实施例,都属于本发明的保护范围。
如图1所示,一种图形流水线性能分析方法,该方法包括如下步骤:
(1)对单一功能性能的分析;
首先分析流水线中各个功能的处理性能,得到《功能处理性能分析表》,分析相关功能间处理性能是否均衡,若不均衡则性能处理较慢的功能将会成为性能瓶颈,并且浪费了高性能功能的处理能力;
其次分析单点功能的最优最差性能是否满足整体流水线的最优最差性能指标,若不满足则应优化单点功能的处理性能。
(2)对竞争资源访存性能的分析;
首先分析功能访存性能与处理性能的均衡,若不均衡则会造成处理性能的浪费或数据阻塞,
其次分析多路访存数据带宽分配,符合图形数据处理的数据量要求,完善步骤(1)中得到的《功能处理性能分析表》中与访存竞争资源相关的性能,并确认相关功能间处理性能是否均衡。
(3)对单元负载性能的均衡分析;
通过典型功能的单元运行周期和单元处理任务的平均性能,首先分析流水线中相关单元的整体性能是否匹配,若不匹配则性能处理较慢的单元将会成为性能瓶颈,并且制约了高性能的单元的处理能力,
其次分析同一单元内多种功能的处理性能,若性能不均衡,则应提高性能较低的功能处理性能,最后分析单元的最优最差性能是否满足流水线典型性能指标。
(4)对图形流水线性能的分析:
首先根据流水线的典型数据特征将流水线数据分为顶点数据、图元数据、像素数据,每一种特征数据的处理性能与数据量相匹配,
其次每一种数据流在流水线中按照处理流程复杂度不同,分析在简单模式和复杂模式下不同类型数据流的处理性能是否满足流水线典型性能指标;
其中,简单模式指图形流水线中数据流必须经过的处理流程,复杂模式指图形流水线中数据流经过所有功能的处理流程。
最后应说明的是,以上事实例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (5)

1.一种图形流水线性能分析方法,其特征在于,所述方法包括如下步骤:
(1)对单一功能性能的分析;
(2)对竞争资源访存性能的分析;
(3)对单元负载性能的均衡分析;
(4)对图形流水线性能的分析。
2.根据权利要求1所述的图形流水线性能分析方法,其特征在于,所述步骤(1)包括:
首先分析流水线中各个功能的处理性能,得到《功能处理性能分析表》,分析相关功能间处理性能是否均衡,若不均衡则性能处理较慢的功能将会成为性能瓶颈,并且浪费了高性能功能的处理能力;
其次分析单点功能的最优最差性能是否满足整体流水线的最优最差性能指标,若不满足则应优化单点功能的处理性能。
3.根据权利要求2所述的图形流水线性能分析方法,其特征在于,所述步骤(2)包括:
首先分析功能访存性能与处理性能的均衡,若不均衡则会造成处理性能的浪费或数据阻塞,
其次分析多路访存数据带宽分配,符合图形数据处理的数据量要求,完善步骤(1)中得到的《功能处理性能分析表》中与访存竞争资源相关的性能,并确认相关功能间处理性能是否均衡。
4.根据权利要求1所述的图形流水线性能分析方法,其特征在于,所述步骤(3)包括:
通过典型功能的单元运行周期和单元处理任务的平均性能,首先分析流水线中相关单元的整体性能是否匹配,若不匹配则性能处理较慢的单元将会成为性能瓶颈,并且制约了高性能的单元的处理能力,
其次分析同一单元内多种功能的处理性能,若性能不均衡,则应提高性能较低的功能处理性能,最后分析单元的最优最差性能是否满足流水线典型性能指标。
5.根据权利要求1所述的图形流水线性能分析方法,其特征在于,所述步骤(4)包括:
首先根据流水线的典型数据特征将流水线数据分为顶点数据、图元数据、像素数据,每一种特征数据的处理性能与数据量相匹配,
其次每一种数据流在流水线中按照处理流程复杂度不同,分析在简单模式和复杂模式下不同类型数据流的处理性能是否满足流水线典型性能指标;
其中,简单模式指图形流水线中数据流必须经过的处理流程,复杂模式指图形流水线中数据流经过所有功能的处理流程。
CN201911125549.2A 2019-11-18 2019-11-18 一种图形流水线性能分析方法 Active CN111062855B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911125549.2A CN111062855B (zh) 2019-11-18 2019-11-18 一种图形流水线性能分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911125549.2A CN111062855B (zh) 2019-11-18 2019-11-18 一种图形流水线性能分析方法

Publications (2)

Publication Number Publication Date
CN111062855A true CN111062855A (zh) 2020-04-24
CN111062855B CN111062855B (zh) 2023-09-05

Family

ID=70298373

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911125549.2A Active CN111062855B (zh) 2019-11-18 2019-11-18 一种图形流水线性能分析方法

Country Status (1)

Country Link
CN (1) CN111062855B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579411A (zh) * 2020-12-05 2021-03-30 西安翔腾微电子科技有限公司 一种图形流水同步控制评价方法
CN112579410A (zh) * 2020-12-05 2021-03-30 西安翔腾微电子科技有限公司 一种命令处理器性能分析与评价方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1702692A (zh) * 2004-05-03 2005-11-30 微软公司 提供增强的图形流水线的系统和方法
CN101308568A (zh) * 2007-05-17 2008-11-19 北京展讯高科通信技术有限公司 基于fifo的流水线实时处理的方法和装置
US20090125854A1 (en) * 2007-11-08 2009-05-14 Nvidia Corporation Automated generation of theoretical performance analysis based upon workload and design configuration
CN103049245A (zh) * 2012-10-25 2013-04-17 浪潮电子信息产业股份有限公司 一种基于cpu多核平台的软件性能优化方法
US8436870B1 (en) * 2006-08-01 2013-05-07 Nvidia Corporation User interface and method for graphical processing analysis
CN105868000A (zh) * 2016-06-14 2016-08-17 上海交通大学 一种针对网络i/o虚拟化的并行化可扩展数据处理方法
CN107958436A (zh) * 2017-11-24 2018-04-24 中国航空工业集团公司西安航空计算技术研究所 一种面向OpenGL的图形负载量化检测方法
CN108021487A (zh) * 2017-11-24 2018-05-11 中国航空工业集团公司西安航空计算技术研究所 一种gpu图形处理性能监测与分析方法
US20180284872A1 (en) * 2017-04-01 2018-10-04 Intel Corporation Adaptive multi-resolution for graphics
CN109213601A (zh) * 2018-09-12 2019-01-15 华东师范大学 一种基于cpu-gpu的负载均衡方法及设备
CN109697157A (zh) * 2018-12-12 2019-04-30 中国航空工业集团公司西安航空计算技术研究所 一种基于数据流模型的gpu性能统计分析方法
CN110333945A (zh) * 2019-05-09 2019-10-15 成都信息工程大学 一种动态负载均衡方法、系统及终端
CN110458354A (zh) * 2019-08-08 2019-11-15 宁夏隆基宁光仪表股份有限公司 一种基于等值算法分析下的智能仪表流水线检测优化分配方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1702692A (zh) * 2004-05-03 2005-11-30 微软公司 提供增强的图形流水线的系统和方法
US8436870B1 (en) * 2006-08-01 2013-05-07 Nvidia Corporation User interface and method for graphical processing analysis
CN101308568A (zh) * 2007-05-17 2008-11-19 北京展讯高科通信技术有限公司 基于fifo的流水线实时处理的方法和装置
US20090125854A1 (en) * 2007-11-08 2009-05-14 Nvidia Corporation Automated generation of theoretical performance analysis based upon workload and design configuration
CN103049245A (zh) * 2012-10-25 2013-04-17 浪潮电子信息产业股份有限公司 一种基于cpu多核平台的软件性能优化方法
CN105868000A (zh) * 2016-06-14 2016-08-17 上海交通大学 一种针对网络i/o虚拟化的并行化可扩展数据处理方法
US20180284872A1 (en) * 2017-04-01 2018-10-04 Intel Corporation Adaptive multi-resolution for graphics
CN107958436A (zh) * 2017-11-24 2018-04-24 中国航空工业集团公司西安航空计算技术研究所 一种面向OpenGL的图形负载量化检测方法
CN108021487A (zh) * 2017-11-24 2018-05-11 中国航空工业集团公司西安航空计算技术研究所 一种gpu图形处理性能监测与分析方法
CN109213601A (zh) * 2018-09-12 2019-01-15 华东师范大学 一种基于cpu-gpu的负载均衡方法及设备
CN109697157A (zh) * 2018-12-12 2019-04-30 中国航空工业集团公司西安航空计算技术研究所 一种基于数据流模型的gpu性能统计分析方法
CN110333945A (zh) * 2019-05-09 2019-10-15 成都信息工程大学 一种动态负载均衡方法、系统及终端
CN110458354A (zh) * 2019-08-08 2019-11-15 宁夏隆基宁光仪表股份有限公司 一种基于等值算法分析下的智能仪表流水线检测优化分配方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
周宽久;刘晓艳;邱铁;: "基于排队网络的SPARC模拟器流水线建模研究", 计算机工程与应用, no. 25, pages 68 - 71 *
张浩;林伟;周永彬;叶笑春;范东睿;: "通用处理器的高带宽访存流水线研究", 计算机学报, no. 01, pages 142 - 151 *
邓艺;田泽;韩立敏;: "一种基于负载均衡的3D引擎任务调度策略", no. 05, pages 55 - 59 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579411A (zh) * 2020-12-05 2021-03-30 西安翔腾微电子科技有限公司 一种图形流水同步控制评价方法
CN112579410A (zh) * 2020-12-05 2021-03-30 西安翔腾微电子科技有限公司 一种命令处理器性能分析与评价方法

Also Published As

Publication number Publication date
CN111062855B (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
KR101653157B1 (ko) 모놀리식 프로그램에 다중 비율 쉐이딩의 매핑
EP2695325B1 (en) Traffic scheduling device
US20160054782A1 (en) Dynamic scaling of graphics processor execution resources
CN104951263B (zh) 避免向显示器发送未改变的区域
CN111062855A (zh) 一种图形流水线性能分析方法
US10366468B2 (en) Ray compression for efficient processing of graphics data at computing devices
US9984475B2 (en) Compression using index bits in MSAA
US10249079B2 (en) Relaxed sorting in a position-only pipeline
US20160210721A1 (en) Graph-based application programming interface architectures with equivalency classes for enhanced image processing parallelism
JP6595101B2 (ja) 後期深度試験と保守的深度試験との間の動的切替え
US20150379762A1 (en) Facilitating dynamic and efficient pre-launch clipping for partially-obscured graphics images on computing devices
US9576384B2 (en) Hierarchical index bits for multi-sampling anti-aliasing
JP2017526045A (ja) ドローコールにわたる共有リソースデータコヒーレンシを確実にするための効率的なハードウェアメカニズム
CN102368329A (zh) 图形系统中纹理图像透明度通道处理系统与装置和方法
WO2016153686A1 (en) Clustered palette compression
CN105574808A (zh) 一种流水线纹理贴图单元体系结构
US9569882B2 (en) Four corner high performance depth test
KR20150041101A (ko) 감소된 비트카운트의 다각형 래스터화
RU2656683C1 (ru) Ускоренное отсечение одной плоскостью многоугольников при графической обработке
CN109087381B (zh) 一种基于双发射vliw的统一架构渲染着色器
US20220138894A1 (en) Dedicated hardware unit to offload blending of values from memory
CN109379629A (zh) 视频处理方法、装置、电子设备及存储介质
CN106385385B (zh) 资源分配方法及装置
CN109697157A (zh) 一种基于数据流模型的gpu性能统计分析方法
Zhang Design and implementation of real-time high-definition stereo matching SoC on FPGA

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant