CN108492242A - 基于gpgpu中的2d桌面混合操作的实现 - Google Patents
基于gpgpu中的2d桌面混合操作的实现 Download PDFInfo
- Publication number
- CN108492242A CN108492242A CN201810340795.9A CN201810340795A CN108492242A CN 108492242 A CN108492242 A CN 108492242A CN 201810340795 A CN201810340795 A CN 201810340795A CN 108492242 A CN108492242 A CN 108492242A
- Authority
- CN
- China
- Prior art keywords
- desktop
- gpgpu
- hybrid
- ram
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Generation (AREA)
Abstract
本发明公开了一种GPGPU的2D桌面融合实现方式,包括读取帧存源数据以及目标数据对象,将数据存入双口RAM,再从RAM取数据进行字节对齐再送入混合操作引擎,混合引擎输出对应的融合写入FIFO,再启动Burst写回帧存操作。整个融合操作过程简单,高效,极大的加速了复杂3D应用场景下2D桌面流畅度。
Description
技术领域
本发明主要涉及到基于GPGPU中的2D桌面设计领域,特指基于GPGPU中的2D桌面混合操作的实现。
背景技术
操作系统按应用领域分为桌面操作系统,服务器操作系统,嵌入式操作系统。桌面操作系统应用最为普遍,桌面操作系统基本功能是实现人机交互,人机交互过程中追求流畅的桌面窗口显示效果从而带来友好的体验,目前主流桌面系统有MAC OS,LINUX,WINDOWS,桌面系统主要操作对象为像素操作,而像素操作的特点在于数据量庞大,操作次数极其频繁。
实现2D桌面硬件加速通常由软件直接实现,2D桌面性能极大的依赖CPU性能,为了摆脱对CPU的完全依赖,通过GPGPU实现硬件加速。然而在某些应用情景下,GPGPU绘图引擎被负责的3D绘图占据时,2D桌面使用时会造成卡顿,而独立2D桌面混合操作实现2D桌面的全加速,不占用3D绘图引擎资源。
发明内容
本发明要解决的问题就在于:针对现有应用的需求,本发明提供一种相对简单、硬件资源占比很小、性能极高的混合操作的实现,为2D桌面实现加速,不受限于复杂的3D应用场景,达到流畅的2D桌面显示效果
与现有技术相比,本发明的优点就在于:1、性能极高:本发明提出的混合操作的实现采用流水方式实现以及高效率Burst方式写回帧存,Burst操作可达到128x256bit,相比1024x768显示分辨率,一次可连续操作一行像素,若运行1Ghz的时钟频率,像素操作效率极高;2、逻辑资源少,本发明支持的5种模式16种因子操作可直接由逻辑并行实现,电路结构相对简单;3、可复用性强:本发明采用独立的2D混合逻辑实现,采用标准的本地总线配置接口接收2D操作命令,采用标准的内部存储总线接口访问帧存,可重用性强,能在GPGPU高性能通用型图形芯片设计重复使用。
附图说明
图1混合操作流水线结构框图。
具体实施方式
以下将结合附图和具体实线对本发明做进一步详细说明。
如表1所示,本发明中光栅化引擎包括5种模式,以及源和目标的各15种因子。混合因子为0,1,源颜色,源颜色取反,源alpha,源alpha取反,目标alpha,目标alpha取反,目标颜色,目标颜色取反,源alpha饱和值,全局alpha,全局alpha取反。
表1 光栅化操作模式
如图1所示,本发明的2D桌面融合操作的实现分为四个阶段,第一阶段:读取帧存源数据以及目标数据对象,将数据存入双口RAM。第二阶段:取双口RAM的数据,进行字节对齐再送入混合操作引擎,字节对齐采用了全流水方式,数据两级缓存器后根据起始地址获取128bit像素值,流水送入混合引擎单元。第三阶段:先将格式统一转换为RGBA8888格式,分两拍进行操作,第一拍完成各模式的混合因子与源、目标的乘操作,第二拍完成混合模式操作,再转换成目标颜色格式。混合操作后由控制单元产生相应字节掩码信息以及缓存两拍依据起始地址进行对齐,一并写入FIFO。第四阶段,FIFO非空状态可直接启动写帧存Burst操作,此处Burst操作若存储带宽足够的情况下,也可以达到全流水操作性能。整个混合操作过程简单,高效,极大的加速了复杂3D应用场景下2D桌面流畅度。
Claims (1)
1.GPGPU芯片设计中2D桌面混合操作的实现方法,包括5种混合模式方式,其特征在于采用了128bit全流水操作,依据读取帧存源数据以及目标数据对象,实现单周期4个像素(RGBA,32bit)的混合操作,流水操作包括从RAM读取像素,两级缓存对齐,六级流水执行融合操作,流水写回。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810340795.9A CN108492242B (zh) | 2018-04-17 | 2018-04-17 | 基于gpgpu中的2d桌面混合操作的实现 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810340795.9A CN108492242B (zh) | 2018-04-17 | 2018-04-17 | 基于gpgpu中的2d桌面混合操作的实现 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108492242A true CN108492242A (zh) | 2018-09-04 |
CN108492242B CN108492242B (zh) | 2023-04-14 |
Family
ID=63316077
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810340795.9A Active CN108492242B (zh) | 2018-04-17 | 2018-04-17 | 基于gpgpu中的2d桌面混合操作的实现 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108492242B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111813483A (zh) * | 2020-07-09 | 2020-10-23 | 长沙景嘉微电子股份有限公司 | Gpgpu中的2d桌面旋转方法、装置及图形处理器 |
CN111813481A (zh) * | 2020-07-09 | 2020-10-23 | 长沙景嘉微电子股份有限公司 | Gpgpu中2d桌面位图扩展方法、装置及图形处理器 |
CN111857918A (zh) * | 2020-07-09 | 2020-10-30 | 长沙景嘉微电子股份有限公司 | 2D桌面PorterDuff实现方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040140978A1 (en) * | 2003-01-20 | 2004-07-22 | Samsung Electronics Co.,Ltd. | Method and apparatus for accelerating 2-D graphic data |
CN103888771A (zh) * | 2013-12-30 | 2014-06-25 | 中山大学深圳研究院 | 基于gpgpu技术的并行视频图像处理方法 |
US20170263040A1 (en) * | 2016-03-11 | 2017-09-14 | Intel Corporation | Hybrid mechanism for efficient rendering of graphics images in computing environments |
-
2018
- 2018-04-17 CN CN201810340795.9A patent/CN108492242B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040140978A1 (en) * | 2003-01-20 | 2004-07-22 | Samsung Electronics Co.,Ltd. | Method and apparatus for accelerating 2-D graphic data |
CN103888771A (zh) * | 2013-12-30 | 2014-06-25 | 中山大学深圳研究院 | 基于gpgpu技术的并行视频图像处理方法 |
US20170263040A1 (en) * | 2016-03-11 | 2017-09-14 | Intel Corporation | Hybrid mechanism for efficient rendering of graphics images in computing environments |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111813483A (zh) * | 2020-07-09 | 2020-10-23 | 长沙景嘉微电子股份有限公司 | Gpgpu中的2d桌面旋转方法、装置及图形处理器 |
CN111813481A (zh) * | 2020-07-09 | 2020-10-23 | 长沙景嘉微电子股份有限公司 | Gpgpu中2d桌面位图扩展方法、装置及图形处理器 |
CN111857918A (zh) * | 2020-07-09 | 2020-10-30 | 长沙景嘉微电子股份有限公司 | 2D桌面PorterDuff实现方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108492242B (zh) | 2023-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101697910B1 (ko) | 그래픽 프로세싱을 위한 임의적 제어 지점들에서의 결함-허용 선점 메커니즘 | |
TWI326830B (en) | Packet processing systems and methods | |
CN108492242A (zh) | 基于gpgpu中的2d桌面混合操作的实现 | |
US11037358B1 (en) | Methods and apparatus for reducing memory bandwidth in multi-pass tessellation | |
CN108563519A (zh) | 基于gpgpu中的2d桌面块拷贝填充操作的实现 | |
WO2022093462A1 (en) | Fast incremental shared constants | |
TW202141417A (zh) | 用於高效多視圖光柵化的方法和裝置 | |
KR102645239B1 (ko) | Gpu 캐시를 활용한 다운스케일링을 위한 simo 접근 방식으로의 gpu 커널 최적화 | |
TW202240539A (zh) | 注視點渲染中的內容移動 | |
US11080928B2 (en) | Methods and apparatus for visibility stream management | |
CN108520490A (zh) | 基于gpgpu中的2d桌面光栅化操作的实现 | |
US20220172695A1 (en) | Methods and apparatus for plane planning for overlay composition | |
US11373267B2 (en) | Methods and apparatus for reducing the transfer of rendering information | |
US11657471B2 (en) | Methods and apparatus for constant data storage | |
US11893654B2 (en) | Optimization of depth and shadow pass rendering in tile based architectures | |
WO2023164792A1 (en) | Checkerboard mask optimization in occlusion culling | |
WO2023087827A1 (zh) | 渲染方法及装置 | |
TW202318332A (zh) | 動態可變速率著色 | |
TW202307783A (zh) | Gpu作用域的效能管理負擔最佳化 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |