CN111062855B - 一种图形流水线性能分析方法 - Google Patents
一种图形流水线性能分析方法 Download PDFInfo
- Publication number
- CN111062855B CN111062855B CN201911125549.2A CN201911125549A CN111062855B CN 111062855 B CN111062855 B CN 111062855B CN 201911125549 A CN201911125549 A CN 201911125549A CN 111062855 B CN111062855 B CN 111062855B
- Authority
- CN
- China
- Prior art keywords
- performance
- processing
- data
- pipeline
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/26—Functional testing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Image Processing (AREA)
- Image Generation (AREA)
Abstract
本发明属于计算机图形处理领域,尤其涉及一种图形流水线性能分析方法。该方法包括以下步骤,(1)对单一功能性能的分析;(2)对竞争资源访存性能的分析;(3)对单元负载性能的均衡分析;(4)对图形流水线性能的分析。本发明加速了图形流水线的性能分析,实现了由单一功能点到整体图形流水线逐层递进的性能分析方法,为复杂功能超长流水线性能分析提供参考。
Description
技术领域
本发明属于计算机图形学领域,尤其涉及一种图形流水线性能分析方法。
背景技术
图形流水线的性能分析是图形流水线设计的核心和关键技术,其体现了图形流水线的功能性能,单元性能及流水线整体性能,为图形流水线的设计及优化提供了具体的参考标准。OpenGL、DirectX等标准3D图形绘制接口规定了接口的参数类型,实现功能等,但未涉及图形流水线的性能分析与评价,英伟达、AMD等图形处理器芯片厂家也未对外公开相关资料。目前在公开资料或者专利中没有图形流水线的性能分析方法。
发明内容
本发明的目的是:
提供一种图形流水线性能分析方法,通过对功能点、功能单元、整体流水线的性能分析,准确定位图形流水线的性能瓶颈,任务负载处理性能,为图形流水线的优化指明方向。
本发明的解决方案是:
一种图形流水线性能分析方法,该方法包括如下步骤:
(1)对单一功能性能的分析;
(2)对竞争资源访存性能的分析;
(3)对单元负载性能的均衡分析;
(4)对图形流水线性能的分析。
进一步的,所述步骤(1)包括:
首先分析流水线中各个功能的处理性能,得到《功能处理性能分析表》,分析相关功能间处理性能是否均衡,若不均衡则性能处理较慢的功能将会成为性能瓶颈,并且浪费了高性能功能的处理能力;
其次分析单点功能的最优最差性能是否满足整体流水线的最优最差性能指标,若不满足则应优化单点功能的处理性能。
进一步的,所述步骤(2)包括:
首先分析功能访存性能与处理性能的均衡,若不均衡则会造成处理性能的浪费或数据阻塞,
其次分析多路访存数据带宽分配,符合图形数据处理的数据量要求,完善步骤(1)中得到的《功能处理性能分析表》中与访存竞争资源相关的性能,并确认相关功能间处理性能是否均衡。
进一步的,所述步骤(3)包括:
通过典型功能的单元运行周期和单元处理任务的平均性能,首先分析流水线中相关单元的整体性能是否匹配,若不匹配则性能处理较慢的单元将会成为性能瓶颈,并且制约了高性能的单元的处理能力,
其次分析同一单元内多种功能的处理性能,若性能不均衡,则应提高性能较低的功能处理性能,最后分析单元的最优最差性能是否满足流水线典型性能指标。
进一步的,所述步骤(4)包括:
首先根据流水线的典型数据特征将流水线数据分为顶点数据、图元数据、像素数据,每一种特征数据的处理性能与数据量相匹配,
其次每一种数据流在流水线中按照处理流程复杂度不同,分析在简单模式和复杂模式下不同类型数据流的处理性能是否满足流水线典型性能指标;
其中,简单模式指图形流水线中数据流必须经过的处理流程,复杂模式指图形流水线中数据流经过所有功能的处理流程。
本发明的优点是:
本发明以逐层递进的方式,从单一功能性能,访存仲裁对性能的影响、单元功能性能、图形流水线整体性能四方面分析评价图形流水线性能,该方法能够准确定位图形流水线的性能瓶颈,分析任务负载均衡处理性能,提取图形流水线典型性能指标,为图形流水线的优化指明方向。
附图说明
图1是本发明的图形流水线性能分析方法的功能框图。
具体实施方式
下面结合附图和具体实施例,对本发明的技术方案进行清楚、完整地表述。显然,所表述的实施例仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提所获得的所有其他实施例,都属于本发明的保护范围。
如图1所示,一种图形流水线性能分析方法,该方法包括如下步骤:
(1)对单一功能性能的分析;
首先分析流水线中各个功能的处理性能,得到《功能处理性能分析表》,分析相关功能间处理性能是否均衡,若不均衡则性能处理较慢的功能将会成为性能瓶颈,并且浪费了高性能功能的处理能力;
其次分析单点功能的最优最差性能是否满足整体流水线的最优最差性能指标,若不满足则应优化单点功能的处理性能。
(2)对竞争资源访存性能的分析;
首先分析功能访存性能与处理性能的均衡,若不均衡则会造成处理性能的浪费或数据阻塞,
其次分析多路访存数据带宽分配,符合图形数据处理的数据量要求,完善步骤(1)中得到的《功能处理性能分析表》中与访存竞争资源相关的性能,并确认相关功能间处理性能是否均衡。
(3)对单元负载性能的均衡分析;
通过典型功能的单元运行周期和单元处理任务的平均性能,首先分析流水线中相关单元的整体性能是否匹配,若不匹配则性能处理较慢的单元将会成为性能瓶颈,并且制约了高性能的单元的处理能力,
其次分析同一单元内多种功能的处理性能,若性能不均衡,则应提高性能较低的功能处理性能,最后分析单元的最优最差性能是否满足流水线典型性能指标。
(4)对图形流水线性能的分析:
首先根据流水线的典型数据特征将流水线数据分为顶点数据、图元数据、像素数据,每一种特征数据的处理性能与数据量相匹配,
其次每一种数据流在流水线中按照处理流程复杂度不同,分析在简单模式和复杂模式下不同类型数据流的处理性能是否满足流水线典型性能指标;
其中,简单模式指图形流水线中数据流必须经过的处理流程,复杂模式指图形流水线中数据流经过所有功能的处理流程。
最后应说明的是,以上事实例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (1)
1.一种图形流水线性能分析方法,其特征在于,所述方法包括如下步骤:
(1)对单一功能性能的分析;
(2)对竞争资源访存性能的分析;
(3)对单元负载性能的均衡分析;
(4)对图形流水线性能的分析,
所述步骤(1)包括:
首先分析流水线中各个功能的处理性能,得到《功能处理性能分析表》,分析相关功能间处理性能是否均衡,若不均衡则性能处理较慢的功能将会成为性能瓶颈,并且浪费了高性能功能的处理能力;
其次分析单点功能的最优最差性能是否满足整体流水线的最优最差性能指标,若不满足则应优化单点功能的处理性能,
所述步骤(2)包括:
首先分析功能访存性能与处理性能的均衡,若不均衡则会造成处理性能的浪费或数据阻塞,
其次分析多路访存数据带宽分配,符合图形数据处理的数据量要求,完善步骤(1)中得到的《功能处理性能分析表》中与访存竞争资源相关的性能,并确认相关功能间处理性能是否均衡,
所述步骤(3)包括:
通过典型功能的单元运行周期和单元处理任务的平均性能,首先分析流水线中相关单元的整体性能是否匹配,若不匹配则性能处理较慢的单元将会成为性能瓶颈,并且制约了高性能的单元的处理能力,
其次分析同一单元内多种功能的处理性能,若性能不均衡,则应提高性能较低的功能处理性能,最后分析单元的最优最差性能是否满足流水线典型性能指标,
所述步骤(4)包括:
首先根据流水线的典型数据特征将流水线数据分为顶点数据、图元数据、像素数据,每一种特征数据的处理性能与数据量相匹配,
其次每一种数据流在流水线中按照处理流程复杂度不同,分析在简单模式和复杂模式下不同类型数据流的处理性能是否满足流水线典型性能指标;
其中,简单模式指图形流水线中数据流必须经过的处理流程,复杂模式指图形流水线中数据流经过所有功能的处理流程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911125549.2A CN111062855B (zh) | 2019-11-18 | 2019-11-18 | 一种图形流水线性能分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911125549.2A CN111062855B (zh) | 2019-11-18 | 2019-11-18 | 一种图形流水线性能分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111062855A CN111062855A (zh) | 2020-04-24 |
CN111062855B true CN111062855B (zh) | 2023-09-05 |
Family
ID=70298373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911125549.2A Active CN111062855B (zh) | 2019-11-18 | 2019-11-18 | 一种图形流水线性能分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111062855B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112579411A (zh) * | 2020-12-05 | 2021-03-30 | 西安翔腾微电子科技有限公司 | 一种图形流水同步控制评价方法 |
CN112579410A (zh) * | 2020-12-05 | 2021-03-30 | 西安翔腾微电子科技有限公司 | 一种命令处理器性能分析与评价方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1702692A (zh) * | 2004-05-03 | 2005-11-30 | 微软公司 | 提供增强的图形流水线的系统和方法 |
CN101308568A (zh) * | 2007-05-17 | 2008-11-19 | 北京展讯高科通信技术有限公司 | 基于fifo的流水线实时处理的方法和装置 |
CN103049245A (zh) * | 2012-10-25 | 2013-04-17 | 浪潮电子信息产业股份有限公司 | 一种基于cpu多核平台的软件性能优化方法 |
US8436870B1 (en) * | 2006-08-01 | 2013-05-07 | Nvidia Corporation | User interface and method for graphical processing analysis |
CN105868000A (zh) * | 2016-06-14 | 2016-08-17 | 上海交通大学 | 一种针对网络i/o虚拟化的并行化可扩展数据处理方法 |
CN107958436A (zh) * | 2017-11-24 | 2018-04-24 | 中国航空工业集团公司西安航空计算技术研究所 | 一种面向OpenGL的图形负载量化检测方法 |
CN108021487A (zh) * | 2017-11-24 | 2018-05-11 | 中国航空工业集团公司西安航空计算技术研究所 | 一种gpu图形处理性能监测与分析方法 |
CN109213601A (zh) * | 2018-09-12 | 2019-01-15 | 华东师范大学 | 一种基于cpu-gpu的负载均衡方法及设备 |
CN109697157A (zh) * | 2018-12-12 | 2019-04-30 | 中国航空工业集团公司西安航空计算技术研究所 | 一种基于数据流模型的gpu性能统计分析方法 |
CN110333945A (zh) * | 2019-05-09 | 2019-10-15 | 成都信息工程大学 | 一种动态负载均衡方法、系统及终端 |
CN110458354A (zh) * | 2019-08-08 | 2019-11-15 | 宁夏隆基宁光仪表股份有限公司 | 一种基于等值算法分析下的智能仪表流水线检测优化分配方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7765500B2 (en) * | 2007-11-08 | 2010-07-27 | Nvidia Corporation | Automated generation of theoretical performance analysis based upon workload and design configuration |
US10591971B2 (en) * | 2017-04-01 | 2020-03-17 | Intel Corporation | Adaptive multi-resolution for graphics |
-
2019
- 2019-11-18 CN CN201911125549.2A patent/CN111062855B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1702692A (zh) * | 2004-05-03 | 2005-11-30 | 微软公司 | 提供增强的图形流水线的系统和方法 |
US8436870B1 (en) * | 2006-08-01 | 2013-05-07 | Nvidia Corporation | User interface and method for graphical processing analysis |
CN101308568A (zh) * | 2007-05-17 | 2008-11-19 | 北京展讯高科通信技术有限公司 | 基于fifo的流水线实时处理的方法和装置 |
CN103049245A (zh) * | 2012-10-25 | 2013-04-17 | 浪潮电子信息产业股份有限公司 | 一种基于cpu多核平台的软件性能优化方法 |
CN105868000A (zh) * | 2016-06-14 | 2016-08-17 | 上海交通大学 | 一种针对网络i/o虚拟化的并行化可扩展数据处理方法 |
CN107958436A (zh) * | 2017-11-24 | 2018-04-24 | 中国航空工业集团公司西安航空计算技术研究所 | 一种面向OpenGL的图形负载量化检测方法 |
CN108021487A (zh) * | 2017-11-24 | 2018-05-11 | 中国航空工业集团公司西安航空计算技术研究所 | 一种gpu图形处理性能监测与分析方法 |
CN109213601A (zh) * | 2018-09-12 | 2019-01-15 | 华东师范大学 | 一种基于cpu-gpu的负载均衡方法及设备 |
CN109697157A (zh) * | 2018-12-12 | 2019-04-30 | 中国航空工业集团公司西安航空计算技术研究所 | 一种基于数据流模型的gpu性能统计分析方法 |
CN110333945A (zh) * | 2019-05-09 | 2019-10-15 | 成都信息工程大学 | 一种动态负载均衡方法、系统及终端 |
CN110458354A (zh) * | 2019-08-08 | 2019-11-15 | 宁夏隆基宁光仪表股份有限公司 | 一种基于等值算法分析下的智能仪表流水线检测优化分配方法 |
Non-Patent Citations (1)
Title |
---|
通用处理器的高带宽访存流水线研究;张浩;林伟;周永彬;叶笑春;范东睿;;计算机学报(01);142-151 * |
Also Published As
Publication number | Publication date |
---|---|
CN111062855A (zh) | 2020-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111062855B (zh) | 一种图形流水线性能分析方法 | |
US9095772B2 (en) | Online gaming | |
CN104461551A (zh) | 基于数据并行处理的大数据处理系统 | |
US10394609B2 (en) | Data processing | |
US20190147562A1 (en) | Disaggregated graphics asset management for virtualized graphics | |
EP4083776A1 (en) | Systems, methods, devices, and apparatuses for adaptive near storage computation | |
US11381506B1 (en) | Adaptive load balancing for distributed systems | |
CN105574808A (zh) | 一种流水线纹理贴图单元体系结构 | |
CN108170535A (zh) | 一种基于MapReduce模型的提升表连接效率的方法 | |
CN105637482A (zh) | 基于gpu的数据流处理方法和装置 | |
CN109087381B (zh) | 一种基于双发射vliw的统一架构渲染着色器 | |
US11625273B1 (en) | Changing throughput capacity to sustain throughput for accessing individual items in a database | |
CN114742000A (zh) | 基于FPGA集群的SoC芯片验证系统、验证方法、装置 | |
CN109685375A (zh) | 一种基于半结构化文本数据的企业风险规则引擎运算方法 | |
CN109992432A (zh) | 一种基于消息队列的数据处理系统及方法 | |
CN106775942B (zh) | 一种云应用导向的固态盘缓存管理系统及方法 | |
WO2021102216A9 (en) | Managed data export to a remote network from edge devices | |
Tang et al. | gRemote: Cloud rendering on GPU resource pool based on API-forwarding | |
CN105677784A (zh) | 基于并行处理的集成网络信息分析系统 | |
CN109710884B (zh) | 一种支持多种复杂计算方式的实时指标配置方法及系统 | |
CN110703677A (zh) | 一种集成在工控机上的plc控制系统 | |
CN115495250B (zh) | 一种流量均衡方法、电子设备及计算机程序产品 | |
CN108733769A (zh) | 一种基于行车电脑数据的实时油耗和智能查询算法 | |
CN109670980A (zh) | 一种充电业务数据的处理方法、系统及设备 | |
KR102651127B1 (ko) | 처리 장치 및 데이터를 처리하는 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |