CN111179151A - 一种提高图形渲染效率的方法、装置及计算机存储介质 - Google Patents

一种提高图形渲染效率的方法、装置及计算机存储介质 Download PDF

Info

Publication number
CN111179151A
CN111179151A CN202010287634.5A CN202010287634A CN111179151A CN 111179151 A CN111179151 A CN 111179151A CN 202010287634 A CN202010287634 A CN 202010287634A CN 111179151 A CN111179151 A CN 111179151A
Authority
CN
China
Prior art keywords
test
fragment data
color mixing
test result
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010287634.5A
Other languages
English (en)
Other versions
CN111179151B (zh
Inventor
樊良辉
张竞丹
李亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Sietium Semiconductor Co ltd
Original Assignee
Nanjing Xintong Semiconductor Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Xintong Semiconductor Technology Co Ltd filed Critical Nanjing Xintong Semiconductor Technology Co Ltd
Priority to CN202010287634.5A priority Critical patent/CN111179151B/zh
Publication of CN111179151A publication Critical patent/CN111179151A/zh
Application granted granted Critical
Publication of CN111179151B publication Critical patent/CN111179151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/001Texturing; Colouring; Generation of texture or colour

Abstract

本发明实施例公开了一种提高图形渲染效率的方法、装置及计算机存储介质,该装置包括剪裁测试单元、深度模板测试单元、颜色混合单元和颜色抖动单元;其中,剪裁测试单元,经配置为将完成剪裁测试的片段数据分别传入深度模板测试单元和颜色混合单元;深度模板测试单元,经配置为测试剪裁测试单元当前传入的片段数据的可见性,并生成第一测试结果;颜色混合单元,经配置为针对剪裁测试单元当前传入的片段数据进行颜色混合,并将颜色混合完成的片段数据传入颜色抖动单元;以及,在进行颜色混合过程中监听第一测试结果;以及,相应于第一测试结果为测试未通过,停止颜色混合并读取剪裁测试单元下一个传入的片段数据进行颜色混合。

Description

一种提高图形渲染效率的方法、装置及计算机存储介质
技术领域
本发明实施例涉及图形处理器(GPU,Graphics Processing Unit)技术领域,尤其涉及一种提高图形渲染效率的方法、装置及计算机存储介质。
背景技术
对于目前常规的GPU来说,图形渲染管线会在完成片段着色之后且在最后更新帧缓存之前,执行一系列的针对每个片段的串行操作,比如依次会进行剪裁测试、深度模板测试、透明(Alpha)测试等,并且当片段通过以上测试之后,还会进行颜色混合操作,甚至在颜色混合操作之后还可能进行颜色抖动操作。上述串行操作按照次序先后对片段进行处理,会造成图形渲染管线变长,当遇到需要进行复杂计算的时候,导致出现阻塞流水线的现象,从而造成GPU处理的效率的降低。
发明内容
有鉴于此,本发明实施例期望提供一种提高图形渲染效率的方法、装置及计算机存储介质;能够缩短渲染流水线长度,从而提高GPU的渲染效率。
本发明实施例的技术方案是这样实现的:
第一方面,本发明实施例提供了一种提高图形渲染效率的装置,所述装置应用于图形渲染管线中的混合测试阶段,所述装置包括:剪裁测试单元、深度模板测试单元、颜色混合单元和颜色抖动单元;其中,
所述剪裁测试单元,经配置为将完成剪裁测试的片段数据分别传入所述深度模板测试单元和所述颜色混合单元;
所述深度模板测试单元,经配置为测试所述剪裁测试单元当前传入的所述片段数据的可见性,并生成第一测试结果;
所述颜色混合单元,经配置为针对所述剪裁测试单元当前传入的所述片段数据进行颜色混合,并将颜色混合完成的片段数据传入所述颜色抖动单元;
以及,在进行颜色混合过程中监听所述第一测试结果;
以及,相应于所述第一测试结果为测试未通过,停止颜色混合并读取所述剪裁测试单元下一个传入的片段数据进行颜色混合。
在上述方案中,所述深度模板测试单元,还经配置为:相应于所述第一测试结果为测试未通过,读取所述剪裁测试单元下一个传入的片段数据进行可见性测试。
在上述方案中,所述装置还包括:透明测试单元,相应地,所述深度模板测试单元,还经配置为:相应于第一测试结果为测试通过,将所述测试通过的片段数据属性值传入所述透明测试单元;
所述透明测试单元,经配置为根据设定的参考值与通过条件对所述片段数据的属性值进行透明测试,生成第二测试结果,
相应于所述第二测试结果为测试未通过,对下一个传入的片段数据的属性值进行透明测试。
在上述方案中,所述颜色混合单元,还经配置为:在进行颜色混合过程中监听所述第二测试结果;
以及,相应于所述第二测试结果为测试未通过,停止颜色混合并读取所述剪裁测试单元下一个传入的片段数据进行颜色混合。
在上述方案中,所述颜色抖动单元,经配置为:检测当前传入的片段数据的第一测试结果以及第二测试结果是否均为测试通过;
相应于第一测试结果以及第二测试结果中的任一项为测试未通过,则对当前传入的片段数据不进行颜色抖动操作,并对下一个完成颜色混合的片段数据的第一测试结果以及第二测试结果进行检测;
相应于第一测试结果以及第二测试结果均为测试通过,则对当前传入的片段数据进行颜色抖动操作。
第二方面,本发明实施例提供了一种提高图形渲染效率的方法,其特征在于,所述方法包括:
将完成剪裁测试的片段数据分别传入以进行深度模板测试操作以及颜色混合操作;
根据所述深度模板测试操作测试当前传入的所述片段数据的可见性,并生成第一测试结果;
在所述进行颜色混合操作过程中监听所述第一测试结果;
相应于所述第一测试结果为测试未通过,停止颜色混合并读取下一个传入的片段数据进行所述颜色混合操作;
将颜色混合完成的片段数据传入以进行颜色抖动操作。
在上述方案中,所述方法还包括:相应于第一测试结果为未通过,取下一个传入的片段数据进行可见性测试。
在上述方案中,所述方法还可以包括:相应于第一测试结果为测试通过,根据设定的参考值与通过条件对所述测试通过的片段数据的属性值进行透明测试,生成第二测试结果;相应于所述第二测试结果为测试未通过,对所述下一个传入的片段数据的属性值进行透明测试。
在上述方案中,所述方法还包括:在进行颜色混合过程中监听所述第二测试结果;以及,相应于所述第二测试结果为测试未通过,停止颜色混合并读取下一个传入的片段数据进行颜色混合。
在上述方案中,在进行颜色混合操作之前,所述方法还包括:检测当前传入的片段数据的第一测试结果以及第二测试结果是否均为测试通过;相应于第一测试结果以及第二测试结果中的任一项为测试未通过,则对当前传入的片段数据不进行颜色抖动操作,并对下一个完成颜色混合的片段数据的第一测试结果以及第二测试结果进行检测;相应于第一测试结果以及第二测试结果均为测试通过,则对当前传入的片段数据进行颜色抖动操作。
第三方面,本发明实施例提供了一种GPU,所述GPU包括第一方面任一项所述的提高图形渲染效率的装置。
第四方面,本发明实施例提供了一种计算机存储介质,所述计算机存储介质存储有提高图形渲染效率的程序,所述提高图形渲染效率的程序被至少一个处理器执行时实现第二方面任一项所述的提高图形渲染效率的方法的步骤。
本发明实施例提供了一种提高图形渲染效率的方法、装置及计算机存储介质;从常规的串行流水线中将颜色混合操作提前,并与深度模板测试并行开始执行,缩短了混合测试阶段中的流水线长度,加快GPU中图形渲染管线的渲染速度,提高GPU的渲染效率。
附图说明
图1为本发明实施例提供的一种计算设备的组成示意图。
图2为本发明实施例提供的一种图形渲染管线的结构示意图。
图3为本发明实施例提供的一种混合测试阶段流程的各操作部分示意图。
图4为本发明实施例提供的另一种混合测试阶段流程的各操作部分示意图。
图5为本发明实施例提供的一种提高图形渲染效率的装置组成示意图。
图6为本发明实施例提供的另一种提高图形渲染效率的装置组成示意图。
图7为本发明实施例提供的一种提高图形渲染效率的方法的流程示意图。
图8为本发明实施例提供的一种提高图形渲染效率的方法具体实施流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
参见图1,其示出了本发明实施例提供的一种计算设备1,该计算设备1可以作为实现本发明实施例的具体示例,该计算设备1可以包括但不限于:无线装置、移动或蜂窝电话(包含所谓的智能电话)、个人数字助理(PDA)、视频游戏控制台(包含视频显示器、移动视频游戏装置、移动视频会议单元)、膝上型计算机、桌上型计算机、电视机顶盒、平板计算设备、电子书阅读器、固定或移动媒体播放器,等。在图1的实例中,该计算设备1可以包括:处理器6、系统存储器10和GPU 12。计算设备1还可包含显示处理器14、收发器模块3、用户接口4和显示器8。收发器模块3和显示处理器14两者可为与处理器6和/或GPU 12相同的集成电路(IC)的模块,两者可在包含处理器6和/或GPU 12的一或多个IC的外部,或可形成于在包含处理器6和/或GPU 12的IC外部的IC中。
为清楚起见,计算设备1可包含图1中未图示的额外模块或单元。举例来说,计算设备1可在其为移动无线电话的实例中包含扬声器和麦克风(两者均未在图1中示出),或在计算设备1为媒体播放器的情况下包含扬声器。计算设备1还可包含摄像机。此外,计算设备1中所示的各种模块和单元可能不是在计算设备1的每个实例中都是必需的。举例来说,在计算设备1为桌上型计算机或经装备以与外部用户接口或显示器介接的其它装置的实例中,用户接口4和显示器8可在计算设备1外部。
用户接口4的实例包含但不限于轨迹球、鼠标、键盘和其它类型的输入装置。用户接口4还可为触摸屏,并且可作为显示器8的模块并入。收发器模块3可包含电路以允许计算设备1与另一装置或网络之间的无线或有线通信。收发器模块3可包含调制器、解调器、放大器和用于有线或无线通信的其它此类电路。
处理器6可为微处理器,例如如图1所示的中央处理单元(CPU),其经配置以处理供执行的计算机程序的指令。处理器6可包括控制计算设备1的运算的通用或专用处理器。用户可将输入提供到计算设备1,以使得处理器6执行一或多个软件应用程序。在处理器6上执行的软件应用程序可包含(例如)操作系统、文字处理器应用程序、电子邮件应用程序、电子表格应用程序、媒体播放器应用程序、视频游戏应用程序、图形用户接口应用程序或另一程序。另外,处理器6可执行用于控制GPU 12的运算的GPU驱动程序22。用户可经由一或多个输入装置(未图示)(例如,键盘、鼠标、麦克风、触摸垫或经由用户输入接口4耦合到计算设备1的另一输入装置)将输入提供到计算设备1。
在处理器6上执行的软件应用程序可包含一或多个图形渲染指令,其指令处理器6来使得将图形数据渲染到显示器8。在一些实例中,所述软件指令可符合图形应用程序编程接口(API),例如开放式图形库API、开放式图形库嵌入系统(OpenGL ES)API、Direct3DAPI、X3D API、RenderMan API、WebGL API、开放式计算语言(OpenCLT M)、RenderScript或任何其它异构计算API,或任何其它公用或专有标准图形或计算API。所述软件指令还可为针对无渲染算法(例如计算摄影、卷积神经网络、视频处理、科学应用程序等)的指令。为了处理图形渲染指令,处理器6可向GPU 12发出一或多个图形渲染命令发(例如,通过GPU驱动程序22发出),以使得GPU 12执行图形数据的渲染中的一些或全部。在一些实例中,待渲染的图形数据可包含例如点、线、三角形、四边形、三角形带等图形图元的列表。
GPU 12可经配置以执行图形运算,从而将一或多个图形图元渲染到显示器8。因此,当在处理器6上执行的软件应用中的一者需要图形处理时,处理器6可将图形命令和图形数据提供到GPU 12以用于渲染到显示器8。图形数据可包含(例如)绘制命令、状态信息、图元信息、纹理信息等。在一些情况下,GPU 12可内置有高度并行结构,其提供比处理器6高效的对复杂图形相关运算的处理。举例来说,GPU 12可包含经配置来以并行方式对多个顶点或像素进行运算的多个处理元件,例如着色器单元。在一些情况下,GPU 12的高度并行性质允许GPU 12比使用处理器6直接将场景绘制到显示器8更快速地将图形图像(例如,GUI和二维(2D)和/或三维(3D)图形场景)绘制到显示器8上。
在一些情况下,可将GPU 12集成到计算设备1的母板中。在其它情况下,GPU 12可存在于图形卡上,所述图形卡安装在计算设备1的母板中的端口中,或可以其它方式并入在经配置以与计算设备1互操作的外围装置内。GPU 12可包含一或多个处理器,例如一或多个微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)或其它等效的集成或离散逻辑电路。GPU 12还可包含一或多个处理器核心,使得GPU 12可被称作多核处理器。
图形存储器40可为GPU 12的一模块。因此,GPU 12可在不使用总线的情况下从图形存储器40读取数据且将数据写入到图形存储器40。换句话说,GPU 12可使用本地存储装置而不是芯片外存储器在本地处理数据。此类图形存储器40可被称作芯片上存储器。这允许GPU 12通过消除GPU 12经由总线读取和写入数据的需要来以更高效的方式操作,其中经由总线操作可经历繁重的总线业务。然而,在一些情况下,GPU 12可不包含单独的存储器,而是经由总线利用系统存储器10。图形存储器40可包含一或多个易失性或非易失性存储器或存储装置,例如,随机存取存储器(RAM)、静态RAM(SRAM)、动态RAM(DRAM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、快闪存储器、磁性数据媒体或光学存储媒体。
在一些实例中,GPU 12可将完全形成的图像存储在系统存储器10中。显示处理器14可从系统存储器10检索图像,且输出使得显示器8的像素照亮以显示所述图像的值。显示器8可为计算设备1的显示器,其显示由GPU 12产生的图像内容。显示器8可为液晶显示器(LCD)、有机发光二极管显示器(OLED)、阴极射线管(CRT)显示器、等离子显示器或另一类型的显示装置。
基于上述计算设备,参见图2,其示出了本发明实施例提供的一种由GPU 12中的渲染核所形成的图形渲染管线2,需要说明的是,该图形渲染管线2利用GPU 12中的多个通用渲染核以及多个固定功能渲染核通过级联形成的逻辑结构,在本发明实施例中,各级也可称为各渲染阶段。具体来说,通用渲染核均可被编程以能够执行与种类繁多的程序相关的处理任务,包括但不限于,线性与非线性数据变换,视频和/或音频数据过滤、建模操作(例如,应用物理定律以确定对象的位置、速率和其他属性)、图形渲染操作(例如,曲面细分着色器、顶点着色器、几何着色器、和/或片元着色器程序)等等;固定功能渲染核则包含经硬连线以执行某些功能的硬件其可经由例如一或多个控制信号而配置以执行不同功能,例如顶点抓取、图元装配、裁剪、光栅化以及混合测试等操作。如图2所示,在图形渲染管线2中,由通用渲染核实现的渲染阶段采用圆角框示意,由固定功能渲染核实现的渲染阶段采用方框示意,上述图形渲染管线2所包括的各级(或称为各渲染阶段)依次为:
顶点获取阶段201,在图2的实例中展示为由固定功能渲染核实现且通常负责从显存中抓取图形数据(三角形、线和点)并供应到图形渲染管线2。举例来说,顶点获取阶段201可从显存中收集高阶表面、图元等的顶点数据,且将顶点数据和属性输出到顶点着色阶段202。
顶点着色阶段202,在图2中展示为由通用渲染核实现,且负责处理所接收顶点数据和属性,并通过每次针对每个顶点实施一组操作来处理顶点数据。
图元装配阶段203,在图2中展示为由固定功能渲染核实现,负责收集顶点并将所述顶点组成几何图元。例如,图元装配阶段203可以配置为将每三个连续的顶点组成为几何图元(即三角形)。在一些实施例中,特定的顶点可以被重复用于连续的几何图元(例如,三角形带中的两个连续的三角形可以共享两个顶点)。
几何着色阶段204,在图2中展示为由通用渲染核实现,接收顶点着色阶段202的输出作为输入,通过高效的几何运算来增删顶点,并输出顶点数据。
剪切阶段205,在图2中展示为由固定功能渲染核实现,负责保留处于视景体内的图元同时剔除处于视景体外的图元,以减轻后续各阶段的计算负担。
光栅化阶段206,在图2中展示为由固定功能渲染核实现,负责准备片段着色阶段207的图元。举例来说,光栅化阶段206可产生若干碎片以供片段着色阶段207进行阴影处理。
片段着色阶段207,在图2中展示为由通用渲染核实现,负责由光栅化阶段206接收碎片且产生例如颜色等每像素数据。此外,片段着色阶段207还可执行例如纹理混合和照明模型计算等每像素处理。
混合测试阶段208,在图2中展示为由固定功能渲染核实现,通常负责对像素数据实施多种操作,例如实施透明测试(Alpha test)、模板测试(stencil test)、以及将像素数据与对应于与该像素相关的其他片段的其他像素数据混合等操作。当混合测试阶段208已经完成处理像素数据(即输出数据)时,可以将处理完成的以图像为例的像素数据写入到以显存为例的渲染目标,以产生最终结果。
在图2所示的混合测试阶段208,参见图3所示,通常利用诸如串行流水线式的流程对片段着色阶段207所输出的每个片段进行操作,依次包括测试和合并两个部分的操作,对于测试部分操作,如图3中方形框所示,依次包括剪裁测试、深度模板测试和透明测试(即Alpha 测试)等,通过以上测试部分操作后的片段就会进行接下来的合并部分操作,以计算片段的最终所呈现的颜色,如图3中圆角框所示,而没有通过以上测试部分操作的片段则会被丢弃,合并部分操作则依次包括颜色混合和颜色抖动等。对于图3所示的混合测试阶段208流程的各操作部分,在通过常规的串行流水线进行处理的过程中,由于需要按照顺序依次进行处理,会致使混合测试阶段208中的流水线过长,当遇到复杂计算时,会造成混合测试阶段208中的流水线形成阻塞,从而导致GPU 12的处理效率降低。为了解决上述问题,本发明实施例期望能够通过缩短混合测试阶段208中的流水线长度,以尽可能地提高GPU 12的渲染效率。举例来说,通常情况下,深度模板测试是针对片段的深度值和指定的模板进行的操作,而颜色混合则是对片段的颜色值进行的操作,两种操作所需数据的来源不同,不存在相互依赖的关系,并且颜色混合的计算量一般大于深度模板测试和Alpha测试的计算量,基于此,本发明实施例从常规的串行流水线中将颜色混合提前,并与深度模板测试并行开始执行,通过如图4所示的流水线,缩短混合测试阶段208中的流水线长度,加快GPU 12中图形渲染管线2的渲染速度,提高渲染效率。因此,本发明实施例提供了一种提高图形渲染效率的装置50,该装置可以应用于前述图2所示的GPU 12所形成的图形渲染管线2中的混合测试阶段208,参见图5,该装置50可以包括:剪裁测试单元501、深度模板测试单元502、颜色混合单元503和颜色抖动单元504;其中,
剪裁测试单元501,经配置为将完成剪裁测试的片段数据分别传入深度模板测试单元502和颜色混合单元503;
所述深度模板测试单元502,经配置为测试所述剪裁测试单元501当前传入的所述片段数据的可见性,并生成第一测试结果;
所述颜色混合单元503,经配置为针对所述剪裁测试单元501当前传入的所述片段数据进行颜色混合,并将颜色混合完成的片段数据传入所述颜色抖动单元504;以及在进行颜色混合过程中监听所述第一测试结果;以及,相应于所述第一测试结果为测试未通过,停止颜色混合并读取所述剪裁测试单元501下一个传入的片段数据进行颜色混合。
通过图5所示的装置50,将完成剪裁测试的片段数据分别进行深度模板测试操作以及颜色混合操作,并且可以根据深度模板测试的结果决定是否终止颜色混合操作,从而实现了深度模板测试操作以及颜色混合操作的并行执行,缩短了混合测试阶段208中的流水线长度,加快GPU 12中图形渲染管线2的渲染速度,提高渲染效率。
对于图5所示的方案,在一些示例中,剪裁测试单元501所执行的剪裁测试通常用于限制绘制区域。比如可以首先指定一个矩形的剪裁窗口,当启用剪裁测试单元501后,只有在上述窗口之内的像素才能被绘制,而其它像素则会被丢弃。也就是说,经过剪裁测试之后,能够去除一部分窗口之外的片段,从而能够减少后续深度模板测试单元502进行深度模板测试以及颜色混合单元503执行颜色混合操作时的数据处理量,提升后续的处理效率。也正因如此,本发明实施例并没有选择将颜色混合单元503提前至与剪裁测试单元501并行实施,而是将颜色混合单元503提前至与深度模板测试单元502并行实施。
对于图5所示的技术方案,在一些示例中,所述深度模板测试单元502,可以读取剪裁测试单元501传入的完成剪裁测试的片段数据,并且还能够读取模板缓冲区内预先存放的模板值以及深度缓冲区内预先存放的深度值,需要说明的是,以OPENGL为例,模板缓冲区会为每一个像素预先设定并保存一个对应的模板值,而深度缓冲区内,预先存放的深度值并非设定形成,而是通过根据顶点的空间坐标计算得到;随后,基于该片段数据的深度值和模板值,以及缓冲区内预存放的模板值和深度值进行测试,以判断片段数据的可见性,需要说明的是,具体测试方式可以将片段数据的深度值和模板值与缓冲区内相应预存放的模板值和深度值进行比较,根据比较结果以确定是否通过测试,举例来说,比较结果可以根据具体的实际需求优选为大于、小于、等于、不小于、不大于、不等于等,本发明实施例不做赘述。基于上述描述,深度模板测试单元502进行测试的结果为第一测试结果,那么相应于所述第一测试结果为测试未通过,则所述深度模板测试单元502,还经配置为:读取所述剪裁测试单元501下一个传入的片段数据进行可见性测试。
对于图5所示的技术方案,在一些示例中,还可以对完成深度模板测试的片段数据进行透明测试,即Alpha测试,该测试可以根据需要进行选择开启或关闭。仍然以OPENGL为例,片段像素的Alpha值可以用于混合操作。那么,当每个片段像素即将绘制时,如果开启了Alpha测试,根据OpenGL的规定,会检查片段像素的Alpha值,并且与设定的参考值进行比较,只有Alpha值满足比较条件的片段像素才会进行绘制,不满足比较条件的则不进行绘制。这个“比较条件”也同样可以根据具体的实际需求优选为:始终通过(默认情况)、始终不通过、大于设定值则通过、小于设定值则通过、等于设定值则通过、大于等于设定值则通过、小于等于设定值则通过、不等于设定值则通过等,本发明实施例对此不做赘述,而Alpha测试的结果则为第二测试结果。基于上述Alpha测试的可选性,参见图6,所述装置50还可以包括:透明测试单元505,相应地,由于透明测试通常在深度模板测试之后,因此,透明测试单元505可以设置于深度模板测试单元502的后级,所述深度模板测试单元502,还经配置为:相应于第一测试结果为测试通过,将所述测试通过的片段数据属性值传入所述透明测试单元505;所述透明测试单元505,经配置为根据设定的参考值与通过条件对所述片段数据的属性值进行透明测试,生成第二测试结果,相应于所述第二测试结果为测试未通过,对下一个传入的片段数据的属性值进行透明测试。可以理解地,透明测试单元505同样是可以依据Alpha测试的开启与否以相应地启动和关闭。
在常规的图形渲染管线中,只有深度模板测试以及Alpha测试都通过,才能进行颜色混合操作,也就是说,只要以上两个测试中的任一个没有通过,那么就不会进行后续的颜色混合操作。但是,在本发明实施例中,由于将颜色混合操作提前至与深度模板测试并行执行,那么为了能够所述颜色混合单元503及时获知测试结果,以使得及时终止对测试不通过的片段数据进行颜色混合操作,本发明实施例优选地为颜色混合单元503实现针对测试结果的监听,除了图5所述的在进行颜色混合过程中,颜色混合单元503可以经配置以在进行颜色混合过程中监听所述第一测试结果。根据Alpha测试的可选性,当Alpha测试开启时,即透明测试单元505被启用时,所述颜色混合单元503,还经配置为:在进行颜色混合过程中监听所述第二测试结果;以及,相应于所述第二测试结果为测试未通过,停止颜色混合并读取所述剪裁测试单元501下一个传入的片段数据进行颜色混合。
对于以上示例,在具体实施过程中,可以针对第一测试结果设置一指示数据test_zs_res,存放于深度模板测试单元502对应的高速缓存中,针对第二测试结果设置另一指示数据test_alpha_res,存放于透明测试单元505对应的高速缓存中,由此,颜色混合单元503可以通过对深度模板测试单元502对应的高速缓存以及透明测试单元505对应的高速缓存进行按照设定的周期进行实时监测,通过test_zs_res和test_alpha_res以获知当前片段数据是否通过测试,如果有任一数据指示未通过,则颜色混合单元503就可以终止对当前片段数据进行颜色混合操作,并读取下一个传入的片段数据进行颜色混合。
另外,在常规的图形渲染管线中,颜色抖动单元504通常仅针对通过测试且完成颜色混合操作的片段数据进行颜色抖动操作。而在本发明实施例中,由于将颜色混合操作提前至与深度模板测试并行执行,那么根据以上进行颜色抖动操作的前提条件,在进行颜色抖动操作之前,会对待进行颜色抖动操作的片段数据进行检测,以确定该片段数据是否能够被进行颜色抖动操作。可以理解地,大部分无法进行颜色抖动操作的片段数据都在通过颜色混合单元503进行颜色混合操作过程中,根据监听的第一测试结果或第二测试结果为测试未通过以停止颜色混合从而不会被传入颜色抖动单元504,但是,对于小部分片段数据,在颜色混合单元503完成颜色混合操作之后,仍旧还未监听到第一测试结果或第二测试结果为测试未通过,那么,就需要在颜色抖动单元504在进行颜色抖动操作之前对这一小部分片段数据再次进行检测,若此时检测到当前完成颜色混合的片段数据通过测试,则对当前完成颜色混合的片段数据进行颜色抖动操作,若此时检测到当前完成颜色混合的片段数据没有通过测试,则对当前完成颜色混合的片段数据不进行颜色抖动操作,转而继续对下一个完成颜色混合的片段数据进行检测。基于此,所述颜色抖动单元504,经配置为:检测当前传入的片段数据的第一测试结果以及第二测试结果是否均为测试通过;相应于第一测试结果以及第二测试结果中的任一项为测试未通过,则对当前传入的片段数据不进行颜色抖动操作,并对下一个完成颜色混合的片段数据的第一测试结果以及第二测试结果进行检测;相应于第一测试结果以及第二测试结果均为测试通过,则对当前传入的片段数据进行颜色抖动操作。
通过以上图5所示的技术方案,由于将颜色混合操作提前至与深度模板测试并行执行,并且在进行颜色混合操作过程中,可以根据测试结果进行提前终止,那么并行化操作能够缩短混合测试阶段的流水线长度,加快了图形渲染管线2的渲染速度,提高了GPU 12的渲染效率。
基于前述技术方案相同的发明构思,参见图7,其示出了本发明实施例提供的一种提高图形渲染效率的方法,该方法可以应用于前述图2所示的GPU 12所形成的图形渲染管线2中的混合测试阶段208,在一些示例中,该方法还可以通过前述图5或图6所示的提高图形渲染效率的装置50进行实施,该方法可以包括:
S701:将完成剪裁测试的片段数据分别传入以进行深度模板测试操作以及颜色混合操作;
S702:根据所述深度模板测试操作测试当前传入的所述片段数据的可见性,并生成第一测试结果;
S703:在进行颜色混合操作过程中监听所述第一测试结果;
S704:相应于所述第一测试结果为测试未通过,停止颜色混合并读取下一个传入的片段数据进行颜色混合操作;
S705:将颜色混合完成的片段数据传入以进行颜色抖动操作。
对于图7所示的技术方案,结合前述图5或图6所述的技术方案,需要说明的是,剪裁测试通常用于限制绘制区域。比如可以首先指定一个矩形的剪裁窗口,当开启剪裁测试后,只有在上述窗口之内的像素才能被绘制,而其它像素则会被丢弃。也就是说,经过剪裁测试之后,能够去除一部分窗口之外的片段,从而能够减少后续进行深度模板测试以及颜色混合操作时的数据处理量,提升后续的处理效率。也正因如此,本发明实施例并没有选择将颜色混合操作提前至与剪裁测试操作并行实施,而是将颜色混合操作提前至与深度模板测试操作并行实施。
对于图7所示的技术方案,结合前述图5或图6所述的技术方案,需要说明的是,第一测试结果可以用于指示深度模板测试结果,在一些示例中,相应于第一测试结果为未通过,所述方法还包括:读取下一个传入的片段数据进行可见性测试。
对于图7所示的技术方案,结合前述图5或图6所述的技术方案,需要说明的是,除了深度模板测试之外,还可以针对完成深度模板测试的片段数据进行透明测试,即Alpha测试,而Alpha测试的结果则为第二测试结果。基于前述Alpha测试的可选性,当Alpha测试被选择开启,那么Alpha测试通常实施于深度模板测试之后,在一些示例中,所述方法还可以包括:相应于第一测试结果为测试通过,根据设定的参考值与通过条件对所述测试通过的片段数据的属性值进行透明测试,生成第二测试结果;相应于所述第二测试结果为测试未通过,对所述下一个传入的片段数据的属性值进行透明测试。
在常规的图形渲染管线中,只有深度模板测试以及Alpha测试都通过,才能进行颜色混合操作,也就是说,只要以上两个测试中的任一个没有通过,那么就不会进行后续的颜色混合操作。但是,在本发明实施例中,由于将颜色混合操作提前至与深度模板测试并行执行,那么为了能够在进行颜色混合操作过程中及时获知测试结果,以使得及时终止对测试不通过的片段数据进行颜色混合操作,本发明实施例优选地为在颜色混合过程中实现针对测试结果的监听,如图7所述的在进行颜色混合过程中监听所述第一测试结果。根据Alpha测试的可选性,当Alpha测试开启时,所述方法还包括:在进行颜色混合过程中监听所述第二测试结果;以及,相应于所述第二测试结果为测试未通过,停止颜色混合并读取下一个传入的片段数据进行颜色混合。
对于以上示例,在具体实施过程中,可以针对第一测试结果设置一指示数据test_zs_res,存放于高速缓存中,针对第二测试结果设置另一指示数据test_alpha_res,同样可以存放于高速缓存中,由此,在进行颜色混合操作过程中,可以通过对高速缓存进行按照设定的周期进行实时监测读取,通过test_zs_res和test_alpha_res以获知当前片段数据是否通过测试,如果有任一数据指示未通过,则可以终止对当前片段数据进行颜色混合操作,并读取下一个传入的片段数据进行颜色混合。
另外,在常规的图形渲染管线中,通常仅针对通过测试且完成颜色混合操作的片段数据进行颜色抖动操作。而在本发明实施例中,由于将颜色混合操作提前至与深度模板测试并行执行,那么根据以上进行颜色抖动操作的前提条件,在进行颜色抖动操作之前,会对待进行颜色抖动操作的片段数据进行检测,以确定该片段数据是否能够被进行颜色抖动操作。可以理解地,大部分无法进行颜色抖动操作的片段数据都在进行颜色混合操作过程中,根据监听的第一测试结果或第二测试结果为测试未通过以停止颜色混合从而不会被执行颜色抖动操作,但是,对于小部分片段数据,在完成颜色混合操作之后,仍旧还未监听到第一测试结果或第二测试结果为测试未通过,那么,就需要在进行颜色抖动操作之前对这一小部分片段数据再次进行检测,若此时检测到当前完成颜色混合的片段数据通过测试,则对当前完成颜色混合的片段数据进行颜色抖动操作,若此时检测到当前完成颜色混合的片段数据没有通过测试,则对当前完成颜色混合的片段数据不进行颜色抖动操作,转而继续对下一个完成颜色混合的片段数据进行检测。基于此,在进行颜色混合操作之前,所述方法还包括:检测当前传入的片段数据的第一测试结果以及第二测试结果是否均为测试通过;相应于第一测试结果以及第二测试结果中的任一项为测试未通过,则对当前传入的片段数据不进行颜色抖动操作,并对下一个完成颜色混合的片段数据的第一测试结果以及第二测试结果进行检测;相应于第一测试结果以及第二测试结果均为测试通过,则对当前传入的片段数据进行颜色抖动操作。
通过以上图7所示的技术方案,由于将颜色混合操作提前至与深度模板测试并行执行,并且在进行颜色混合操作过程中,可以根据测试结果进行提前终止,那么并行化操作能够缩短混合测试阶段的流水线长度,加快了图形渲染管线2的渲染速度,提高了GPU 12的渲染效率。可以理解地,通过图7所述的技术方案就能够实现图4所示的流水线的具体工作流程,该流程可以通过图5或图6所示的装置50实现,参见图8,该具体流程可以包括:
S801:剪裁测试单元将完成剪裁的片段数据分别传入深度模板测试单元和颜色混合单元;
S802:深度模板测试单元接收当前传入的片段数据;
S803:深度模板测试单元对当前传入的片段数据进行测试,并生成第一测试结果;
S804:判断第一测试结果是否表示通过测试;若是,则继续执行S805:将测试通过的片段数据传入透明测试单元;否则,转入S802以接收下一次传入的片段数据;
S806:透明测试单元根据设定的参考值与通过条件对接收的片段数据的属性值进行Alpha测试,生成第二测试结果;
S807:判断第二测试结果是否表示通过测试;若是,则继续执行S808:将测试通过的片段数据传入颜色抖动单元;否则,转入S802以通过深度模板测试单元接收下一次传入的片段数据;
S808:颜色混合单元接收当前传入的片段数据;
S809:颜色混合单元对当前传入的片段数据进行颜色混合操作,并监听第一测试结果和第二测试结果;
S810:判断监听到的第一测试结果和第二测试结果是否均表示测试通过;若是,则执行S811:将完成颜色混合操作的片段数据传入颜色抖动单元;否则,终止对当前传入的片段数据的颜色混合操作,并转入S808以接收下一次传入的片段数据;
S812:颜色抖动单元接收片段数据;
S813:颜色抖动单元检测当前接收到的片段数据对应的第一测试结果和第二测试结果是否均表示测试通过:若是,则继续执行S814:对当前接收到的片段数据进行颜色抖动操作;否则,丢弃当前接收到的片段数据,转至S812接收下一次传入的片段数据。
针对上述具体工作流程的阐述可以获知,基于图4所示的流水线的工作流程,通过并行化操作能够缩短混合测试阶段的流水线长度,加快了图形渲染管线2的渲染速度,提高了GPU 12的渲染效率。
可以理解地,在本发明实施例中,术语“单元”可以是单元电路、单元处理器、单元程序或软件等等,当然也可以是部分,还可以是模块也可以是非模块化的。
在上述一或多个实例或示例中,所描述的功能可实施于,所描述功能可实施于硬件、软件、固件或其任何组合中。如果实施于软件中,那么可将功能作为一或多个指令或代码存储在计算机可读媒体上或经由计算机可读媒体传输。计算机可读媒体可包含计算机数据存储媒体或通信媒体,通信媒体包含促进将计算机程序从一处传递到另一处的任何媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。举例来说且非限制,此类计算机可读媒体可包括U盘、移动硬盘、RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用于运载或存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。并且,任何连接被恰当地称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输软件,那么同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电和微波等无线技术包含于媒体的定义中。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。
代码可由一或多个处理器执行,所述一或多个处理器例如是一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效的可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。因此,如本文中所使用的术语“处理器”和“处理单元”可指前述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可在经配置用于编码和解码的专用硬件和/或软件模块内提供,或者并入在组合式编解码器中。而且,所述技术可完全实施于一或多个电路或逻辑元件中。
本发明实施例的技术可实施于各种各样的装置或设备中,所述装置或设备包含无线手持机、集成电路(IC)或一组IC(即,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所公开的技术的装置的功能方面,但未必需要由不同硬件单元实现。实际上,如上文所描述,各种单元可结合合适的软件和/或固件组合在编码解码器硬件单元中,或者通过互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
已描述了本发明的各种方面。这些和其它实施例在所附权利要求书的范围内。需要说明的是:本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (12)

1.一种提高图形渲染效率的装置,其特征在于,所述装置应用于图形渲染管线中的混合测试阶段,所述装置包括:剪裁测试单元、深度模板测试单元、颜色混合单元和颜色抖动单元;其中,
所述剪裁测试单元,经配置为将完成剪裁测试的片段数据分别传入所述深度模板测试单元和所述颜色混合单元;
所述深度模板测试单元,经配置为测试所述剪裁测试单元当前传入的所述片段数据的可见性,并生成第一测试结果;
所述颜色混合单元,经配置为针对所述剪裁测试单元当前传入的所述片段数据进行颜色混合,并将颜色混合完成的片段数据传入所述颜色抖动单元;
以及,在进行颜色混合过程中监听所述第一测试结果;
以及,相应于所述第一测试结果为测试未通过,停止颜色混合并读取所述剪裁测试单元下一个传入的片段数据进行颜色混合。
2.根据权利要求1所述的装置,其特征在于,所述深度模板测试单元,还经配置为:相应于所述第一测试结果为测试未通过,读取所述剪裁测试单元下一个传入的片段数据进行可见性测试。
3.根据权利要求1所述的装置,其特征在于,所述装置还包括:透明测试单元,相应地,所述深度模板测试单元,还经配置为:相应于第一测试结果为测试通过,将所述测试通过的片段数据属性值传入所述透明测试单元;
所述透明测试单元,经配置为根据设定的参考值与通过条件对所述片段数据的属性值进行透明测试,生成第二测试结果,
相应于所述第二测试结果为测试未通过,对下一个传入的片段数据的属性值进行透明测试。
4.根据权利要求3所述的装置,其特征在于,所述颜色混合单元,还经配置为:在进行颜色混合过程中监听所述第二测试结果;
以及,相应于所述第二测试结果为测试未通过,停止颜色混合并读取所述剪裁测试单元下一个传入的片段数据进行颜色混合。
5.根据权利要求1至4任一项所述的装置,其特征在于,所述颜色抖动单元,经配置为:检测当前传入的片段数据的第一测试结果以及第二测试结果是否均为测试通过;
相应于第一测试结果以及第二测试结果中的任一项为测试未通过,则对当前传入的片段数据不进行颜色抖动操作,并对下一个完成颜色混合的片段数据的第一测试结果以及第二测试结果进行检测;
相应于第一测试结果以及第二测试结果均为测试通过,则对当前传入的片段数据进行颜色抖动操作。
6.一种提高图形渲染效率的方法,其特征在于,所述方法包括:
将完成剪裁测试的片段数据分别传入以进行深度模板测试操作以及颜色混合操作;
根据所述深度模板测试操作测试当前传入的所述片段数据的可见性,并生成第一测试结果;
在所述进行颜色混合操作过程中监听所述第一测试结果;
相应于所述第一测试结果为测试未通过,停止颜色混合并读取下一个传入的片段数据进行所述颜色混合操作;
将颜色混合完成的片段数据传入以进行颜色抖动操作。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:相应于第一测试结果为未通过,取下一个传入的片段数据进行可见性测试。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:相应于第一测试结果为测试通过,根据设定的参考值与通过条件对所述测试通过的片段数据的属性值进行透明测试,生成第二测试结果;相应于所述第二测试结果为测试未通过,对所述下一个传入的片段数据的属性值进行透明测试。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:在进行颜色混合过程中监听所述第二测试结果;以及,相应于所述第二测试结果为测试未通过,停止颜色混合并读取下一个传入的片段数据进行颜色混合。
10.根据权利要求6至9任一项所述的方法,其特征在于,在进行颜色混合操作之前,所述方法还包括:检测当前传入的片段数据的第一测试结果以及第二测试结果是否均为测试通过;相应于第一测试结果以及第二测试结果中的任一项为测试未通过,则对当前传入的片段数据不进行颜色抖动操作,并对下一个完成颜色混合的片段数据的第一测试结果以及第二测试结果进行检测;相应于第一测试结果以及第二测试结果均为测试通过,则对当前传入的片段数据进行颜色抖动操作。
11.一种GPU,其特征在于,所述GPU包括权利要求1至5任一项所述的提高图形渲染效率的装置。
12.一种计算机存储介质,所述计算机存储介质存储有提高图形渲染效率的程序,所述提高图形渲染效率的程序被至少一个处理器执行时实现权利要求6至10任一项所述的提高图形渲染效率的方法的步骤。
CN202010287634.5A 2020-04-13 2020-04-13 一种提高图形渲染效率的方法、装置及计算机存储介质 Active CN111179151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010287634.5A CN111179151B (zh) 2020-04-13 2020-04-13 一种提高图形渲染效率的方法、装置及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010287634.5A CN111179151B (zh) 2020-04-13 2020-04-13 一种提高图形渲染效率的方法、装置及计算机存储介质

Publications (2)

Publication Number Publication Date
CN111179151A true CN111179151A (zh) 2020-05-19
CN111179151B CN111179151B (zh) 2020-07-10

Family

ID=70655201

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010287634.5A Active CN111179151B (zh) 2020-04-13 2020-04-13 一种提高图形渲染效率的方法、装置及计算机存储介质

Country Status (1)

Country Link
CN (1) CN111179151B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113419913A (zh) * 2021-06-29 2021-09-21 华夏芯(北京)通用处理器技术有限公司 图形片段的后处理方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060284883A1 (en) * 2005-06-16 2006-12-21 Core Logic Inc. Device for processing pixel rasterization and method for processing the same
CN101118644A (zh) * 2006-08-01 2008-02-06 深圳安凯微电子技术有限公司 一种图形加速器及图形处理方法
CN104835191A (zh) * 2014-02-06 2015-08-12 想象技术有限公司 3d图形处理系统中用于处理图元的不透明度测试
CN106575228A (zh) * 2014-08-21 2017-04-19 高通股份有限公司 图形处理中的渲染目标命令重新排序
CN107481307A (zh) * 2017-07-05 2017-12-15 国网山东省电力公司泰安供电公司 一种快速渲染三维场景的方法
CN109191362A (zh) * 2018-07-30 2019-01-11 芯视图(常州)微电子有限公司 多个rop的并行调度以及rop的流水设计
CN111080761A (zh) * 2019-12-27 2020-04-28 西安芯瞳半导体技术有限公司 一种渲染任务的调度方法、装置及计算机存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060284883A1 (en) * 2005-06-16 2006-12-21 Core Logic Inc. Device for processing pixel rasterization and method for processing the same
CN101118644A (zh) * 2006-08-01 2008-02-06 深圳安凯微电子技术有限公司 一种图形加速器及图形处理方法
CN104835191A (zh) * 2014-02-06 2015-08-12 想象技术有限公司 3d图形处理系统中用于处理图元的不透明度测试
CN106575228A (zh) * 2014-08-21 2017-04-19 高通股份有限公司 图形处理中的渲染目标命令重新排序
CN107481307A (zh) * 2017-07-05 2017-12-15 国网山东省电力公司泰安供电公司 一种快速渲染三维场景的方法
CN109191362A (zh) * 2018-07-30 2019-01-11 芯视图(常州)微电子有限公司 多个rop的并行调度以及rop的流水设计
CN111080761A (zh) * 2019-12-27 2020-04-28 西安芯瞳半导体技术有限公司 一种渲染任务的调度方法、装置及计算机存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CJNEO: "opengl渲染管线 不能再详细了", 《HTTPS://BLOG.CSDN.NET/CJNEO/ARTICLE/DETAILS/50538033?UTM_SOURCE=BLOGKPCL11》 *
JAVAEAR: "Is it possible to use blending and depth test simultaneously?", 《HTTP://WWW.JAVAEAR.COM/QUESTION/42374150.HTML》 *
王烁: "OpenGL ES 2.0 知识串讲 (12) ——OpenGL ES 详解VI(Depth/Stencil/Blend)", 《GEEKFANER.COM/SHINEENGINE/BLOG13_OPENGLESV2_12.HTML》 *
饶志恒: "图形处理器图形管线的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113419913A (zh) * 2021-06-29 2021-09-21 华夏芯(北京)通用处理器技术有限公司 图形片段的后处理方法及装置

Also Published As

Publication number Publication date
CN111179151B (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
US9626313B2 (en) Trace buffer based replay for context switching
EP3353746B1 (en) Dynamically switching between late depth testing and conservative depth testing
US9280956B2 (en) Graphics memory load mask for graphics processing
WO2017052746A1 (en) Efficient saving and restoring of context information for context switches
CN113342703B (zh) 一种渲染效果实时调试方法、装置、开发设备及存储介质
US20170083997A1 (en) Storing bandwidth-compressed graphics data
JP6325756B2 (ja) 単一パスの表面スプラッティング
CN111209116B (zh) 一种分配显存空间的方法、装置及计算机存储介质
EP3427229B1 (en) Visibility information modification
CN116391205A (zh) 用于图形处理单元混合渲染的装置和方法
CN113393585B (zh) 一种渲染问题定位方法、装置、定位设备及存储介质
CN111179151B (zh) 一种提高图形渲染效率的方法、装置及计算机存储介质
CN111161391B (zh) 一种生成追踪路径的方法、装置及计算机存储介质
US10346943B2 (en) Prefetching for a graphics shader
US11481967B2 (en) Shader core instruction to invoke depth culling
US10089708B2 (en) Constant multiplication with texture unit of graphics processing unit
US20220058476A1 (en) Methods and apparatus for dynamic shader selection for machine learning
CN116457830A (zh) 基于区域不连续性的运动估计
CN111179403A (zh) 并行生成纹理映射Mipmap图像的方法、装置及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 265503 No. 402, No. 7, No. 300, Changjiang Road, economic and Technological Development Zone, Yantai City, Shandong Province

Patentee after: Yantai Xintong Semiconductor Technology Co.,Ltd.

Address before: 211800 b403, No. 320, pubin Road, Jiangpu street, Pukou District, Nanjing City, Jiangsu Province

Patentee before: Nanjing Xintong Semiconductor Technology Co.,Ltd.

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room T1 301, Taiwei Smart Chain Center, No. 8 Tangyan South Road, High tech Zone, Xi'an City, Shaanxi Province

Patentee after: Nanjing Sietium Semiconductor Co.,Ltd.

Address before: 265503 No. 402, No. 7, No. 300, Changjiang Road, economic and Technological Development Zone, Yantai City, Shandong Province

Patentee before: Yantai Xintong Semiconductor Technology Co.,Ltd.

CP03 Change of name, title or address