CN108021487B - 一种gpu图形处理性能监测与分析方法 - Google Patents
一种gpu图形处理性能监测与分析方法 Download PDFInfo
- Publication number
- CN108021487B CN108021487B CN201711202374.1A CN201711202374A CN108021487B CN 108021487 B CN108021487 B CN 108021487B CN 201711202374 A CN201711202374 A CN 201711202374A CN 108021487 B CN108021487 B CN 108021487B
- Authority
- CN
- China
- Prior art keywords
- data
- performance
- gpu
- processing
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3024—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3452—Performance evaluation by statistical analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Hardware Design (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明属于计算机图形领域,尤其涉及一种GPU图形处理性能监测与分析方法。本方法包括(1)GPU资源统计、(2)数据中转、(3)图形处理器性能数据生成、(4)数据筛选、(5)在线查看、(6)数据保存、(7)离线查看。本方法通过检测应用执行过程中GPU性能数据,对用户关心的性能数据进行在线即时查看或离线回放,为GPU设计和应用优化提供工具支持。
Description
技术领域
本发明属于计算机图形领域,尤其涉及一种GPU图形处理性能监测与分析方法。
背景技术
图形处理器流水线设计复杂模块繁多,监测和分析图形处理器性能有助于开发人员对均衡图形处理器性能提供支持,目前公开的资料中均是对性能监测的使用方法,未发现有对于性能监测设计方法的研究。
发明内容
本发明的目的是:
本发明主要提供一种图形处理器性能监测与分析方法,对处理器性能进行监测,为均衡图形处理器性能提供支持。
本发明的技术方案是:
一种GPU图形处理性能监测与分析方法,包括以下步骤:
步骤一,GPU资源统计:统计GPU各模块的资源使用情况以及任务处理情况,统计数据包括各单元的任务处理周期、处理单元资源占用率、数据带宽占用率、处理单元空忙周期比、cache缺页率指标;
步骤二,数据中转:获取步骤一所提供的GPU各模块的资源统计数据,从各模块资源统计数据中提取模块对当前任务的处理特征,包括任务处理速率、访存特性、任务流水特性,分析任务处理瓶颈,并按照规定的数据结构处理成步骤三图形处理器性能数据生成所能够解析的数据;
步骤三,图形处理器性能数据生成:获取步骤二解析后的GPU各模块资源统计数据,包括硬件在任务处理时的资源使用率以及任务的处理能力;同时对驱动软件性能进行统计,包括图形指令生成速率、图形指令传输速率、单帧性能、单帧任务特性、周期性能及任务特性以及故障状态,用于统计驱动软件在执行应用程序时的特性,最终将生成的图形处理器软硬件性能统计数据提供给步骤四;
步骤四,数据筛选:获取步骤三图形处理器性能数据生成所提供的性能统计数据,并根据步骤五中在线查看配置的性能指标将相关性能数据进行数据筛选,筛选后提供给步骤五和步骤六;
步骤五,在线查看:设置性能数据查看的配置信息,并接收步骤四数据筛选后的性能统计数据进行在线可视查看;
步骤六,数据保存:接收步骤四数据筛选后的性能统计数据,对正常性能数据按照步骤四数据筛选的配置要求进行覆盖存储,对异常性能数据进行不覆盖存储,存储的数据可提供给步骤七;
步骤七,离线查看:获取步骤六数据保存所存储的性能统计数据,用于离线回放查看。
本发明的优点是:本发明提供的一种GPU图形处理器性能监测与分析方法,通过检测应用执行过程中GPU性能数据,对用户关心的性能数据进行在线可视查看或离线回放,提供一种快速高效了解图形处理器性能的方法,为GPU设计和应用优化提供工具支持。
附图说明
图1为本发明GPU图形处理器性能监测与分析方法的模块及流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面结合附图和具体实施例对本发明的技术方案做进一步详细描述。
如图1所示,一种GPU图形处理性能监测与分析方法,本方法的实现可设计为以下七个模块:GPU资源统计1、数据中转2、图形处理器性能数据生成3、数据筛选4、在线查看5、数据保存6、离线查看7。其中:
GPU资源统计模块1,统计GPU各模块的资源使用情况以及任务处理情况,统计的数据提供给2数据中转模块,统计数据主要包括各单元的任务处理周期,处理单元资源占用率,数据带宽占用率,处理单元空忙周期比,cache缺页率等指标;
数据中转模块2,其特征在于,获取GPU资源统计模块1提供的GPU各模块的资源统计数据,从各模块资源统计数据中提取模块对当前任务的处理特征,包括任务处理速率、访存特性、任务流水特性,分析任务处理瓶颈等,并按照规定的数据结构处理成图形处理器性能数据生成模块3能够解析的数据,并发送至图形处理器性能数据生成模块3生成GPU资源性能数据;
图形处理器性能数据生成模块3,获取数据中转模块2处理后的GPU各模块资源数据,生成图形处理器各模块资源统计数据,包括硬件在任务处理时的资源使用率以及任务的处理能力;同时对驱动软件性能进行统计,包括图形指令生成速率、图形指令传输速率、单帧性能、单帧任务特性、周期性能及任务特性以及故障状态,用于统计驱动软件在执行应用程序时的特性,最终将生成的图形处理器软硬件性能统计数据提供给数据筛选模块4;
数据筛选模块4,获取图形处理器性能数据生成模块3的性能统计数据,并根据在线查看模块5配置的性能指标将相关性能数据从数据筛选模块4中筛选后提供给在线查看模块5和数据保存模块6;
在线查看模块5,设置性能数据查看的配置信息,并接收数据筛选模块4筛选后的性能统计数据进行在线可视查看;
数据保存模块6,接收数据筛选模块4筛选后的性能统计数据,对正常性能数据按照数据筛选模块4的配置要求进行覆盖存储,对异常性能数据进行不覆盖存储,存储的数据可提供给离线查看模块7;
离线查看模块7,获取数据保存模块6所存储的性能统计数据,用于离线回放查看。
Claims (1)
1.一种GPU图形处理性能监测与分析方法,其特征为所述方法包括以下步骤:
步骤一,GPU资源统计:统计GPU各模块的资源使用情况以及任务处理情况,统计数据包括各单元的任务处理周期、处理单元资源占用率、数据带宽占用率、处理单元空忙周期比、cache缺页率指标;
步骤二,数据中转:获取步骤一所提供的GPU各模块的资源统计数据,从各模块资源统计数据中提取模块对当前任务的处理特征,包括任务处理速率、访存特性、任务流水特性,分析任务处理瓶颈,并按照规定的数据结构处理成步骤三图形处理器性能数据生成所能够解析的数据;
步骤三,图形处理器性能数据生成:获取步骤二解析后的GPU各模块资源统计数据,包括硬件在任务处理时的资源使用率以及任务的处理能力;同时对驱动软件性能进行统计,包括图形指令生成速率、图形指令传输速率、单帧性能、单帧任务特性、周期性能及任务特性以及故障状态,用于统计驱动软件在执行应用程序时的特性,最终将生成的图形处理器软硬件性能统计数据提供给步骤四;
步骤四,数据筛选:获取步骤三图形处理器性能数据生成所提供的性能统计数据,并根据步骤五中在线查看配置的性能指标将相关性能数据进行数据筛选,筛选后提供给步骤五和步骤六;
步骤五,在线查看:设置性能数据查看的配置信息,并接收步骤四数据筛选后的性能统计数据进行在线可视查看;
步骤六,数据保存:接收步骤四数据筛选后的性能统计数据,对正常性能数据按照步骤四数据筛选的配置要求进行覆盖存储,对异常性能数据进行不覆盖存储,存储的数据可提供给步骤七;
步骤七,离线查看:获取步骤六数据保存所存储的性能统计数据,用于离线回放查看。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711202374.1A CN108021487B (zh) | 2017-11-24 | 2017-11-24 | 一种gpu图形处理性能监测与分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711202374.1A CN108021487B (zh) | 2017-11-24 | 2017-11-24 | 一种gpu图形处理性能监测与分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108021487A CN108021487A (zh) | 2018-05-11 |
CN108021487B true CN108021487B (zh) | 2021-03-26 |
Family
ID=62077228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711202374.1A Active CN108021487B (zh) | 2017-11-24 | 2017-11-24 | 一种gpu图形处理性能监测与分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108021487B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109032892A (zh) * | 2018-07-25 | 2018-12-18 | 浪潮(北京)电子信息产业有限公司 | 一种性能曲线图的绘制方法、装置、设备及介质 |
CN109712061A (zh) * | 2018-12-11 | 2019-05-03 | 中国航空工业集团公司西安航空计算技术研究所 | 一种gpu命令处理器健壮性运行管理方法 |
CN111062855B (zh) * | 2019-11-18 | 2023-09-05 | 中国航空工业集团公司西安航空计算技术研究所 | 一种图形流水线性能分析方法 |
CN111047500A (zh) * | 2019-11-18 | 2020-04-21 | 中国航空工业集团公司西安航空计算技术研究所 | 一种超长图形流水线的测试方法 |
CN111008926B (zh) * | 2019-11-18 | 2023-06-09 | 中国航空工业集团公司西安航空计算技术研究所 | 一种面向应用的gpu调优结构 |
CN111736989B (zh) * | 2020-06-05 | 2022-10-14 | 南京邮电大学 | 多模式分布式集群gpu指标检测方法及系统 |
CN113238914B (zh) * | 2021-05-13 | 2022-08-19 | 浪潮商用机器有限公司 | 处理器使用量的获取方法、系统、设备及可读存储介质 |
CN117011444B (zh) * | 2023-10-07 | 2024-01-02 | 芯动微电子科技(武汉)有限公司 | 一种gpu分块渲染的性能分析方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101681289A (zh) * | 2007-06-27 | 2010-03-24 | 国际商业机器公司 | 处理器性能监测 |
US9529661B1 (en) * | 2015-06-18 | 2016-12-27 | Rockwell Collins, Inc. | Optimal multi-core health monitor architecture |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4944518B2 (ja) * | 2006-05-26 | 2012-06-06 | 富士通セミコンダクター株式会社 | タスク遷移図表示方法及び表示装置 |
-
2017
- 2017-11-24 CN CN201711202374.1A patent/CN108021487B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101681289A (zh) * | 2007-06-27 | 2010-03-24 | 国际商业机器公司 | 处理器性能监测 |
US9529661B1 (en) * | 2015-06-18 | 2016-12-27 | Rockwell Collins, Inc. | Optimal multi-core health monitor architecture |
Non-Patent Citations (1)
Title |
---|
Adreno GPU Profiler工具使用总结;daijy0111;《https://blog.csdn.net/daijy0111/article/details/50427758?utm_source=blogxgwz2》;20151229;1-11页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108021487A (zh) | 2018-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108021487B (zh) | 一种gpu图形处理性能监测与分析方法 | |
CN110502494B (zh) | 日志处理方法、装置、计算机设备及存储介质 | |
CN109032914A (zh) | 资源占用数据预测方法、电子设备、存储介质 | |
US20130080502A1 (en) | User interface responsiveness monitor | |
WO2010126805A2 (en) | Application efficiency engine | |
CN104714785A (zh) | 任务调度装置、方法及并行处理数据的设备 | |
CN109308170B (zh) | 一种数据处理方法及装置 | |
EP2960797A1 (en) | Identification of software phases using machine learning | |
CN110969198A (zh) | 深度学习模型的分布式训练方法、装置、设备及存储介质 | |
CN110365942B (zh) | 一种实时视频智能分析方法和系统 | |
CN112749013B (zh) | 线程负载的检测方法、装置、电子设备及存储介质 | |
CN105069029B (zh) | 一种实时etl系统及方法 | |
CN112463432A (zh) | 基于指标数据的巡检方法、装置及系统 | |
CN115269289A (zh) | 一种慢盘检测方法、装置、电子设备及存储介质 | |
CN111240936A (zh) | 一种数据完整性校验的方法及设备 | |
CN101341471B (zh) | 动态高速缓存管理的设备和方法 | |
US12106151B2 (en) | Dynamic client/server selection for machine learning execution based on current performance characteristics | |
CN110096339A (zh) | 一种基于系统负载实现的扩缩容配置推荐系统及方法 | |
KR20220113710A (ko) | Gpu 패킷 집계 시스템 | |
CN105022833A (zh) | 一种数据处理的方法、节点及监控系统 | |
CN107678781B (zh) | 处理器以及用于在处理器上执行指令的方法 | |
CN109871302A (zh) | 基于资源开销统计的云计算应用识别装置及方法 | |
CN108109104B (zh) | 一种面向统一染色架构gpu的三级任务调度电路 | |
CN103955422B (zh) | 一种虚拟化环境中共存应用i/o性能干扰的分析方法及其系统 | |
CN106874215B (zh) | 一种基于Spark算子的序列化存储优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |