CN116664735B - 一种虚拟对象的大规模动画渲染方法、装置、设备及介质 - Google Patents
一种虚拟对象的大规模动画渲染方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116664735B CN116664735B CN202310656706.2A CN202310656706A CN116664735B CN 116664735 B CN116664735 B CN 116664735B CN 202310656706 A CN202310656706 A CN 202310656706A CN 116664735 B CN116664735 B CN 116664735B
- Authority
- CN
- China
- Prior art keywords
- animation
- virtual object
- frame
- index
- vertex
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000009877 rendering Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012545 processing Methods 0.000 claims abstract description 37
- 238000004364 calculation method Methods 0.000 claims abstract description 29
- 230000006870 function Effects 0.000 claims description 43
- 239000011159 matrix material Substances 0.000 claims description 28
- 239000000872 buffer Substances 0.000 claims description 25
- 239000012634 fragment Substances 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 9
- 238000004040 coloring Methods 0.000 claims description 8
- 230000001131 transforming effect Effects 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 7
- 238000003491 array Methods 0.000 claims description 6
- 239000003086 colorant Substances 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003139 buffering effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/80—2D [Two Dimensional] animation, e.g. using sprites
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/001—Texturing; Colouring; Generation of texture or colour
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明涉及动画渲染技术领域,尤其涉及一种虚拟对象的大规模动画渲染方法、装置、设备及介质,所述方法具体包括:为每个虚拟对象创建动画概要数据结构体和动画播放器结构体,将所有虚拟对象的所述动画概要数据结构体存储至第一数组,将所有虚拟对象的所述动画播放器结构体存储至第二数组;基于SIMD指令,根据动画播放计算函数通过所述第一数组确定每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引,并将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引分别存储至各自的所述动画播放器结构体。本发明利用SIMD指令和动画播放计算函数批量计算多个虚拟对象的当前播放动画、帧,并在GPU中进行渲染处理。
Description
技术领域
本发明涉及动画渲染技术领域,尤其涉及一种虚拟对象的大规模动画渲染方法、装置、设备及介质。
背景技术
在大量虚拟对象同屏时,由于虚拟对象数量众多,渲染压力会很大,会产生数量庞大的DrawCal。为了降低DrawCall的数量,通常会使用动态合批和GPU Instance等技术来优化渲染性能。然而,在某些情况下,由于每个虚拟对象在同一时刻的状态是不一样的,导致它们的材质或纹理不同,就无法进行动态合批等技术,这意味着无法利用动态合批等技术来优化渲染性能,而需要逐个绘制每个对象,无法有效减少DrawCall的数量。
发明内容
本发明的目的在于提供一种虚拟对象的大规模动画渲染方法、装置、设备及介质,利用SIMD指令和动画播放计算函数批量计算多个虚拟对象的当前播放动画、帧,并在GPU中进行渲染处理,以解决上述现有问题的至少之一。
本发明提供了一种虚拟对象的大规模动画渲染方法,所述方法具体包括:
为每个虚拟对象创建动画概要数据结构体和动画播放器结构体,将所有虚拟对象的所述动画概要数据结构体存储至第一数组,将所有虚拟对象的所述动画播放器结构体存储至第二数组;
基于SIMD指令,根据动画播放计算函数通过所述第一数组确定每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引,并将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引分别存储至各自的所述动画播放器结构体;
将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标加载到GPU中进行渲染处理。
进一步的,所述为每个虚拟对象创建动画概要数据结构和动画播放器结构,将所有虚拟对象的所述动画概要数据结构体存储至第一数组,将所有虚拟对象的所述动画播放器结构体存储至第二数组,具体包括:
为每个虚拟对象创建动画概要数据结构体,所述动画概要数据结构体用于存储每个虚拟对象的动画数量、每个动画的所有关键帧的时间点;
为每个虚拟对象创建动画播放器结构体,所述动画播放器结构体用于存储当前播放动画的动画索引和当前播放帧的帧索引;
创建第一数组,所述第一数组用于存储所有虚拟对象的动画概要数据结构体;
创建第二数组,所述第二数组用于存储所有虚拟对象的动画播放器结构体。
进一步的,所述基于SIMD指令,根据动画播放计算函数通过所述第一数组确定每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引,并将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引分别存储至各自的所述动画播放器结构体,具体包括:
创建动画播放计算函数;
在所述动画播放计算函数中,通过所述第一数组获取当前屏幕中每个虚拟对象的当前播放动画的关键帧的时间点,然后加载到SIMD寄存器中;
在所述SIMD寄存器中,使用SIMD指令对当前屏幕中每个虚拟对象的当前播放动画的关键帧的时间点进行计算操作,获得当前屏幕中每个虚拟对象的当前播放动画的动画索引和当前播放帧的帧索引并分别存储至各自的所述动画播放器结构体进行更新;
判定当前帧不是当前动画的最后一帧,切换到下一帧,或者,判定当前帧是当前动画的最后一帧,切换到下一个动画,继续调用所述动画播放计算函数和所述SIMD指令确定新的动画索引和帧索引。
进一步的,所述将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标加载到GPU中进行渲染处理,具体包括:
遍历每个虚拟对象,并将相同种类的虚拟对象存储到同一个数组中;
获取每个相同种类的虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标,将所述顶点位置坐标和所述顶点UV纹理坐标转换为GPU处理格式的动画数据并传输到GPU中;
在所述GPU中设置顶点着色器和片段着色器,根据所述顶点着色器和所述片段着色器处理所述动画数据,获得着色数据;
根据所述着色数据对每个相同种类的虚拟对象进行渲染处理。
更进一步的,所述遍历每个虚拟对象,并将相同种类的虚拟对象存储到同一个数组中,具体包括:
采集相同种类的虚拟对象的角色参数,并为每个相同种类的虚拟对象创建一个用于存储角色参数的结构体;
创建第三数组集合,所述第三数组集合包含若干个第三数组;
遍历每个相同种类的虚拟对象的结构体,将每个结构体分别存储至一个所述第三数组中。
更进一步的,所述获取每个相同种类的虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标,将所述顶点位置坐标和所述顶点UV纹理坐标转换为GPU处理格式的动画数据并传输到GPU中,具体包括:
根据每个相同种类的虚拟对象的骨骼动画数据的大小,在GPU中创建一个尺寸对应的纹理贴图对象或缓冲区对象;
获取每个相同种类的虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标,然后存储到所述纹理贴图对象或所述缓冲区对象中;
使用OpenGL库设置所述纹理贴图对象或所述缓冲区对象的参数,然后将所述纹理贴图对象或所述缓冲区对象传输到所述GPU中。
更进一步的,所述根据所述顶点着色器和所述片段着色器处理所述动画数据,获得着色数据,具体包括:
在所述顶点着色器中设置模型矩阵和骨骼矩阵数组,所述模型矩阵用于将每个虚拟对象的模型从局部空间变换为观察空间,所述骨骼矩阵用于计算每个虚拟对象的骨骼动画变换;
根据所述模型矩阵和所述骨骼矩阵数组,对所述动画数据中转换格式后的顶点位置坐标和顶点UV纹理坐标进行变换,获得目标顶点位置;
将所述目标顶点位置中的片段UV纹理坐标传输至所述片段着色器,根据所述片段着色器对所述片段UV纹理坐标进行颜色采样并输出目标片段颜色;
将所述目标顶点位置和所述目标片段颜色合并为着色数据。
本发明还提供了一种虚拟对象的大规模动画渲染装置,所述装置具体包括:
第一处理模块,用于为每个虚拟对象创建动画概要数据结构体和动画播放器结构体,将所有虚拟对象的所述动画概要数据结构体存储至第一数组,将所有虚拟对象的所述动画播放器结构体存储至第二数组;
第二处理模块,用于基于SIMD指令,根据动画播放计算函数通过所述第一数组确定每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引,并将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引分别存储至各自的所述动画播放器结构体;
渲染处理模块,用于将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标加载到GPU中进行渲染处理。
本发明还提供了一种计算机设备,包括:存储器和处理器及存储在存储器上的计算机程序,当所述计算机程序在处理器上被执行时,实现如上述方法中任一项所述的虚拟对象的大规模动画渲染方法。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,实现如上述方法中任一项所述的虚拟对象的大规模动画渲染方法。
与现有技术相比,本发明具有以下技术效果的至少之一:
1、通过将骨骼顶点坐标和UV纹理贴图信息打包成纹理贴图或者存储到缓冲区的方式,可以将多个虚拟对象的数据合并到一张大的纹理或缓冲区中,可以减少每个虚拟对象的独立绘制和状态切换的开销,从而降低了DrawCall的数量。
2、使用顶点着色器中的骨骼矩阵数组对顶点坐标进行动画变换。这种方式允许每个虚拟对象在同一时刻具有不同的状态,因为骨骼矩阵可以根据每个对象的骨骼动画数据进行个别计算,这使得可以在同一次绘制调用中处理多个虚拟对象的动画变换,而无需进行状态切换或独立绘制,进一步减少了DrawCall的数量。
3、本发明的动画计算和变换操作是在GPU上进行的,通过使用纹理贴图和着色器程序,可以充分利用GPU的并行计算能力,可以在一次绘制调用中同时处理多个虚拟对象的动画变换,从而提高渲染性能。
4、通过设置动画概要数据结构体和动画播放器结构体,利用SIMD指令和动画播放计算函数批量计算多个虚拟对象的当前播放动画、帧,提高了执行效率。
附图说明
是为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种虚拟对象的大规模动画渲染方法的流程示意图;
图2是本发明实施例提供的一种虚拟对象的大规模动画渲染装置的结构示意图;
图3是本发明实施例提供的一种计算机设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
在大量虚拟对象同屏时,由于虚拟对象数量众多,渲染压力会很大,会产生数量庞大的DrawCal。为了降低DrawCall的数量,通常会使用动态合批和GPU Instance等技术来优化渲染性能。然而,在某些情况下,由于每个虚拟对象在同一时刻的状态是不一样的,导致它们的材质或纹理不同,就无法进行动态合批等技术,这意味着无法利用动态合批等技术来优化渲染性能,而需要逐个绘制每个对象,无法有效减少DrawCall的数量。
参照图1,本发明实施例提供了一种虚拟对象的大规模动画渲染方法,所述方法具体包括:
S101:为每个虚拟对象创建动画概要数据结构体和动画播放器结构体,将所有虚拟对象的所述动画概要数据结构体存储至第一数组,将所有虚拟对象的所述动画播放器结构体存储至第二数组;
基于SIMD指令,根据动画播放计算函数通过所述第一数组确定每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引,并将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引分别存储至各自的所述动画播放器结构体。
在一些实施例中,所述为每个虚拟对象创建动画概要数据结构和动画播放器结构,将所有虚拟对象的所述动画概要数据结构体存储至第一数组,将所有虚拟对象的所述动画播放器结构体存储至第二数组,具体包括:
为每个虚拟对象创建动画概要数据结构体,所述动画概要数据结构体用于存储每个虚拟对象的动画数量、每个动画的所有关键帧的时间点;
为每个虚拟对象创建动画播放器结构体,所述动画播放器结构体用于存储当前播放动画的动画索引和当前播放帧的帧索引;
创建第一数组,所述第一数组用于存储所有虚拟对象的动画概要数据结构体;
创建第二数组,所述第二数组用于存储所有虚拟对象的动画播放器结构体。
在一些实施例中,所述基于SIMD指令,根据动画播放计算函数通过所述第一数组确定每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引,并将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引分别存储至各自的所述动画播放器结构体,具体包括:
创建动画播放计算函数;
在所述动画播放计算函数中,通过所述第一数组获取当前屏幕中每个虚拟对象的当前播放动画的关键帧的时间点,然后加载到SIMD寄存器中;
在所述SIMD寄存器中,使用SIMD指令对当前屏幕中每个虚拟对象的当前播放动画的关键帧的时间点进行计算操作,获得当前屏幕中每个虚拟对象的当前播放动画的动画索引和当前播放帧的帧索引并分别存储至各自的所述动画播放器结构体进行更新;
判定当前帧不是当前动画的最后一帧,切换到下一帧,或者,判定当前帧是当前动画的最后一帧,切换到下一个动画,继续调用所述动画播放计算函数和所述SIMD指令确定新的动画索引和帧索引。
该实施例中,当虚拟对象的数量过于庞大时,GPU端计算所有角色正在播第几个动画、播放到第几帧也是一个庞大的计算量,为了解决这个问题,使用SIMD指令来批量处理这些计算。首先,将虚拟对象的动画概要数据(一个角色有几个动画,每个动画所有关键帧的时间点)设计成一个结构体Struct(AnimationData),再设计一个动画播放器结构体Struct(Player),用于存储动画播放计算函数的计算结果,以及两个数组(AnimationData[],Player[]),分别用来装所有虚拟对象的动画概要数据结构体Struct(AnimationData)与动画播放器结构体Struct(Player),还要设计一个动画播放计算函数(PlayAnimation)用来计算“角色正在播第几个动画、播放到第几帧”。PlayAnimation函数可以用SIMD指令执行,操作数分别为AnimationData[]、Player[],操作数设计成大数组目的是为了增加内存命中率,增加指令的执行效率,提高同屏单位的承载能力。
该实施例的代码示例如下。
上述代码中,AnimationData结构体用于存储角色的动画数量和每个动画的关键帧的时间点。Player结构体用于控制角色的动画播放,包含当前播放动画的动画索引和当前播放帧的帧索引。AnimationData数组用于存储所有角色的动画概要数据,Player数组用于存储所有角色的动画播放器。
PlayAnimation函数接受角色索引作为输入,并根据角色的当前动画索引和帧索引执行相应的逻辑。根据当前的动画索引和帧索引,可以在函数中执行相关操作,如更新角色的顶点坐标和UV等。然后,根据当前帧索引判断是否需要切换到下一帧或下一个动画。
使用_mm_loadu_si128函数加载当前动画的关键帧时间点到keyframe_times变量中,然后使用SIMD指令_mm_add_epi32对关键帧的时间点进行加法计算,将结果存储回帧索引数组。这样,通过一次SIMD指令操作,同时对多个角色的帧索引进行计算,实现了批量处理和并行计算的优化效果。
在示例代码的main函数中,创建了一个AnimationData对象和一个Player对象,并将它们添加到对应的数组中。然后,调用PlayAnimation函数播放动画,并获取当前的动画索引和帧索引,最后将其输出到控制台。
S102:将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标加载到GPU中进行渲染处理。
在一些实施例中,所述将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标加载到GPU中进行渲染处理,具体包括:
遍历每个虚拟对象,并将相同种类的虚拟对象存储到同一个数组中;
获取每个相同种类的虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标,将所述顶点位置坐标和所述顶点UV纹理坐标转换为GPU处理格式的动画数据并传输到GPU中;
在所述GPU中设置顶点着色器和片段着色器,根据所述顶点着色器和所述片段着色器处理所述动画数据,获得着色数据;
根据所述着色数据对每个相同种类的虚拟对象进行渲染处理。
在一些实施例中,所述遍历每个虚拟对象,并将相同种类的虚拟对象存储到同一个数组中,具体包括:
采集相同种类的虚拟对象的角色参数,并为每个相同种类的虚拟对象创建一个用于存储角色参数的结构体;
创建第三数组集合,所述第三数组集合包含若干个第三数组;
遍历每个相同种类的虚拟对象的结构体,将每个结构体分别存储至一个所述第三数组中。
该实施例中,由于使用了GPU动画,CPU端只需传两个参数给GPU:“角色正在播第几个动画、播放到第几帧”,故可以把相同种类的角色参数组装成数组传给GPU,利用GPUInstance加快绘制效率。假设有6000个单位,这6000个单位由60种小兵组成,使用了GPUInstance后只需绘制60次,相比6000次降低了100倍的绘制次数。
创建一个数组来存储相同种类角色参数的数据结构的代码示例如下。
//定义数据结构来存储角色参数
在一些实施例中,所述获取每个相同种类的虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标,将所述顶点位置坐标和所述顶点UV纹理坐标转换为GPU处理格式的动画数据并传输到GPU中,具体包括:
根据每个相同种类的虚拟对象的骨骼动画数据的大小,在GPU中创建一个尺寸对应的纹理贴图对象或缓冲区对象;
获取每个相同种类的虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标,然后存储到所述纹理贴图对象或所述缓冲区对象中;
使用OpenGL库设置所述纹理贴图对象或所述缓冲区对象的参数,然后将所述纹理贴图对象或所述缓冲区对象传输到所述GPU中。
该实施例中,可以使用纹理贴图(Texture Maps)或者存储在缓冲区的方法将每个虚拟对象的骨骼动画数据转换为适合GPU处理的格式。
使用OpenGL库设置所述纹理贴图对象或所述缓冲区对象的参数,然后将所述纹理贴图对象或所述缓冲区对象传输到所述GPU中,具体步骤如下:
第一步,绑定纹理对象或缓冲对象:使用glBindTexture函数将纹理对象绑定为当前操作的纹理,或使用glBindBuffer函数将缓冲对象绑定为当前操作的缓冲区。
第二步,设置纹理参数或缓冲参数:使用glTexParameteri函数(对于纹理对象)或glBufferStorage函数(对于缓冲对象)设置纹理参数或缓冲参数,例如过滤模式、包装模式等。
第三步,传输数据到GPU:使用glTexImage2D函数(对于纹理对象)或glBufferData函数(对于缓冲对象)指定数据的格式、大小和内存布局等参数,这些函数接受参数,例如数据的宽度、高度、像素格式、数据类型等;提供要传输的数据,可以是指针指向的CPU内存中的数据,或者使用glMapBuffer函数将数据映射到CPU内存中,然后进行修改;调用glTexImage2D函数(对于纹理对象)或glBufferData函数(对于缓冲对象)传输数据到GPU中。
第四步,解绑纹理对象或缓冲对象:使用glBindTexture函数将纹理对象解绑,或使用glBindBuffer函数将缓冲对象解绑,以确保后续操作不会影响到这些对象。
通过以上步骤,可以将纹理数据或缓冲数据传输到GPU中,以供后续的渲染操作使用。
在一些实施例中,所述根据所述顶点着色器和所述片段着色器处理所述动画数据,获得着色数据,具体包括:
在所述顶点着色器中设置模型矩阵和骨骼矩阵数组,所述模型矩阵用于将每个虚拟对象的模型从局部空间变换为观察空间,所述骨骼矩阵用于计算每个虚拟对象的骨骼动画变换;
根据所述模型矩阵和所述骨骼矩阵数组,对所述动画数据中转换格式后的顶点位置坐标和顶点UV纹理坐标进行变换,获得目标顶点位置;
将所述目标顶点位置中的片段UV纹理坐标传输至所述片段着色器,根据所述片段着色器对所述片段UV纹理坐标进行颜色采样并输出目标片段颜色;
将所述目标顶点位置和所述目标片段颜色合并为着色数据。
该实施例中,在顶点着色器中,使用角色的动画数据(例如骨骼矩阵)来计算变换后的顶点坐标;在片段着色器中,使用角色的动画数据(例如UV贴图坐标)来计算纹理采样。
具体的代码示例如下。
上述代码中,顶点着色器接受角色的顶点坐标和UV作为输入,并使用骨骼矩阵数组对顶点坐标进行变换。在每个顶点上进行骨骼动画的计算,并将变换后的顶点位置传递给片段着色器。片段着色器接收变换后的顶点位置,使用UV坐标从纹理贴图中采样颜色,并输出最终的片段颜色。
参照图2,本发明实施例还提供了一种虚拟对象的大规模动画渲染装置,所述装置具体包括:
第一处理模块201,用于为每个虚拟对象创建动画概要数据结构体和动画播放器结构体,将所有虚拟对象的所述动画概要数据结构体存储至第一数组,将所有虚拟对象的所述动画播放器结构体存储至第二数组;
第二处理模块202,用于基于SIMD指令,根据动画播放计算函数通过所述第一数组确定每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引,并将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引分别存储至各自的所述动画播放器结构体;
渲染处理模块203,用于将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标加载到GPU中进行渲染处理。
可以理解的是,如图1所示的虚拟对象的大规模动画渲染方法实施例中的内容均适用于本虚拟对象的大规模动画渲染装置实施例中,本虚拟对象的大规模动画渲染装置实施例所具体实现的功能与如图1所示的虚拟对象的大规模动画渲染方法实施例相同,并且达到的有益效果与如图1所示的虚拟对象的大规模动画渲染方法实施例所达到的有益效果也相同。
需要说明的是,上述装置之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
参照图3,本发明实施例还提供了一种计算机设备3,包括:存储器302和处理器301及存储在存储器302上的计算机程序303,当所述计算机程序303在处理器301上被执行时,实现如上述方法中任一项所述的虚拟对象的大规模动画渲染方法。
所述计算机设备3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该计算机设备3可包括,但不仅限于,处理器301、存储器302。本领域技术人员可以理解,图3仅仅是计算机设备3的举例,并不构成对计算机设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器301可以是中央处理单元(Central Processing Unit,CPU),该处理器301还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器302在一些实施例中可以是所述计算机设备3的内部存储单元,例如计算机设备3的硬盘或内存。所述存储器302在另一些实施例中也可以是所述计算机设备3的外部存储设备,例如所述计算机设备3上配备的插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器302还可以既包括所述计算机设备3的内部存储单元也包括外部存储设备。所述存储器302用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器302还可以用于暂时地存储已经输出或者将要输出的数据。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,实现如上述方法中任一项所述的虚拟对象的大规模动画渲染方法。
该实施例中,所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所公开的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
Claims (8)
1.一种虚拟对象的大规模动画渲染方法,其特征在于,所述方法具体包括:
为每个虚拟对象创建动画概要数据结构体和动画播放器结构体,将所有虚拟对象的所述动画概要数据结构体存储至第一数组,将所有虚拟对象的所述动画播放器结构体存储至第二数组;
基于SIMD指令,根据动画播放计算函数通过所述第一数组确定每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引,并将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引分别存储至各自的所述动画播放器结构体;
将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标加载到GPU中进行渲染处理;
其中,所述将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标加载到GPU中进行渲染处理,具体包括:
遍历每个虚拟对象,并将相同种类的虚拟对象存储到同一个数组中;
获取每个相同种类的虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标,将所述顶点位置坐标和所述顶点UV纹理坐标转换为GPU处理格式的动画数据并传输到GPU中;
在所述GPU中设置顶点着色器和片段着色器,根据所述顶点着色器和所述片段着色器处理所述动画数据,获得着色数据;
根据所述着色数据对每个相同种类的虚拟对象进行渲染处理;
其中,所述根据所述顶点着色器和所述片段着色器处理所述动画数据,获得着色数据,具体包括:
在所述顶点着色器中设置模型矩阵和骨骼矩阵数组,所述模型矩阵用于将每个虚拟对象的模型从局部空间变换为观察空间,所述骨骼矩阵用于计算每个虚拟对象的骨骼动画变换;
根据所述模型矩阵和所述骨骼矩阵数组,对所述动画数据中转换格式后的顶点位置坐标和顶点UV纹理坐标进行变换,获得目标顶点位置;
将所述目标顶点位置中的片段UV纹理坐标传输至所述片段着色器,根据所述片段着色器对所述片段UV纹理坐标进行颜色采样并输出目标片段颜色;
将所述目标顶点位置和所述目标片段颜色合并为着色数据。
2.根据权利要求1所述的方法,其特征在于,所述为每个虚拟对象创建动画概要数据结构和动画播放器结构,将所有虚拟对象的所述动画概要数据结构体存储至第一数组,将所有虚拟对象的所述动画播放器结构体存储至第二数组,具体包括:
为每个虚拟对象创建动画概要数据结构体,所述动画概要数据结构体用于存储每个虚拟对象的动画数量、每个动画的所有关键帧的时间点;
为每个虚拟对象创建动画播放器结构体,所述动画播放器结构体用于存储当前播放动画的动画索引和当前播放帧的帧索引;
创建第一数组,所述第一数组用于存储所有虚拟对象的动画概要数据结构体;
创建第二数组,所述第二数组用于存储所有虚拟对象的动画播放器结构体。
3.根据权利要求1所述的方法,其特征在于,所述基于SIMD指令,根据动画播放计算函数通过所述第一数组确定每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引,并将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引分别存储至各自的所述动画播放器结构体,具体包括:
创建动画播放计算函数;
在所述动画播放计算函数中,通过所述第一数组获取当前屏幕中每个虚拟对象的当前播放动画的关键帧的时间点,然后加载到SIMD寄存器中;
在所述SIMD寄存器中,使用SIMD指令对当前屏幕中每个虚拟对象的当前播放动画的关键帧的时间点进行计算操作,获得当前屏幕中每个虚拟对象的当前播放动画的动画索引和当前播放帧的帧索引并分别存储至各自的所述动画播放器结构体进行更新;
判定当前帧不是当前动画的最后一帧,切换到下一帧,或者,判定当前帧是当前动画的最后一帧,切换到下一个动画,继续调用所述动画播放计算函数和所述SIMD指令确定新的动画索引和帧索引。
4.根据权利要求1所述的方法,其特征在于,所述遍历每个虚拟对象,并将相同种类的虚拟对象存储到同一个数组中,具体包括:
采集相同种类的虚拟对象的角色参数,并为每个相同种类的虚拟对象创建一个用于存储角色参数的结构体;
创建第三数组集合,所述第三数组集合包含若干个第三数组;
遍历每个相同种类的虚拟对象的结构体,将每个结构体分别存储至一个所述第三数组中。
5.根据权利要求1所述的方法,其特征在于,所述获取每个相同种类的虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标,将所述顶点位置坐标和所述顶点UV纹理坐标转换为GPU处理格式的动画数据并传输到GPU中,具体包括:
根据每个相同种类的虚拟对象的骨骼动画数据的大小,在GPU中创建一个尺寸对应的纹理贴图对象或缓冲区对象;
获取每个相同种类的虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标,然后存储到所述纹理贴图对象或所述缓冲区对象中;
使用OpenGL库设置所述纹理贴图对象或所述缓冲区对象的参数,然后将所述纹理贴图对象或所述缓冲区对象传输到所述GPU中。
6.一种虚拟对象的大规模动画渲染装置,其特征在于,所述装置具体包括:
第一处理模块,用于为每个虚拟对象创建动画概要数据结构体和动画播放器结构体,将所有虚拟对象的所述动画概要数据结构体存储至第一数组,将所有虚拟对象的所述动画播放器结构体存储至第二数组;
第二处理模块,用于基于SIMD指令,根据动画播放计算函数通过所述第一数组确定每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引,并将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引分别存储至各自的所述动画播放器结构体;
渲染处理模块,用于将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标加载到GPU中进行渲染处理;
其中,所述将每个虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标加载到GPU中进行渲染处理,具体包括:
遍历每个虚拟对象,并将相同种类的虚拟对象存储到同一个数组中;
获取每个相同种类的虚拟对象当前播放动画的动画索引和当前播放帧的帧索引对应的顶点位置坐标和顶点UV纹理坐标,将所述顶点位置坐标和所述顶点UV纹理坐标转换为GPU处理格式的动画数据并传输到GPU中;
在所述GPU中设置顶点着色器和片段着色器,根据所述顶点着色器和所述片段着色器处理所述动画数据,获得着色数据;
根据所述着色数据对每个相同种类的虚拟对象进行渲染处理;
其中,所述根据所述顶点着色器和所述片段着色器处理所述动画数据,获得着色数据,具体包括:
在所述顶点着色器中设置模型矩阵和骨骼矩阵数组,所述模型矩阵用于将每个虚拟对象的模型从局部空间变换为观察空间,所述骨骼矩阵用于计算每个虚拟对象的骨骼动画变换;
根据所述模型矩阵和所述骨骼矩阵数组,对所述动画数据中转换格式后的顶点位置坐标和顶点UV纹理坐标进行变换,获得目标顶点位置;
将所述目标顶点位置中的片段UV纹理坐标传输至所述片段着色器,根据所述片段着色器对所述片段UV纹理坐标进行颜色采样并输出目标片段颜色;
将所述目标顶点位置和所述目标片段颜色合并为着色数据。
7.一种计算机设备,其特征在于,包括:存储器和处理器及存储在存储器上的计算机程序,当所述计算机程序在处理器上被执行时,实现如权利要求1至5中任一项所述的虚拟对象的大规模动画渲染方法。
8.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器运行时,实现如权利要求1至5中任一项所述的虚拟对象的大规模动画渲染方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310656706.2A CN116664735B (zh) | 2023-06-05 | 2023-06-05 | 一种虚拟对象的大规模动画渲染方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310656706.2A CN116664735B (zh) | 2023-06-05 | 2023-06-05 | 一种虚拟对象的大规模动画渲染方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116664735A CN116664735A (zh) | 2023-08-29 |
CN116664735B true CN116664735B (zh) | 2024-02-06 |
Family
ID=87720324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310656706.2A Active CN116664735B (zh) | 2023-06-05 | 2023-06-05 | 一种虚拟对象的大规模动画渲染方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116664735B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106687924A (zh) * | 2014-07-10 | 2017-05-17 | 英特尔公司 | 用于基于当前状态来更新着色器程序的方法和装置 |
CN111462283A (zh) * | 2020-03-27 | 2020-07-28 | 厦门梦加网络科技股份有限公司 | 大量相同角色动画播放方法、介质、设备及装置 |
CN111833429A (zh) * | 2019-04-04 | 2020-10-27 | 厦门雅基软件有限公司 | 三维游戏渲染方法、三维引擎、电子设备及可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8643659B1 (en) * | 2003-12-31 | 2014-02-04 | 3Dlabs Inc., Ltd. | Shader with global and instruction caches |
-
2023
- 2023-06-05 CN CN202310656706.2A patent/CN116664735B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106687924A (zh) * | 2014-07-10 | 2017-05-17 | 英特尔公司 | 用于基于当前状态来更新着色器程序的方法和装置 |
CN111833429A (zh) * | 2019-04-04 | 2020-10-27 | 厦门雅基软件有限公司 | 三维游戏渲染方法、三维引擎、电子设备及可读存储介质 |
CN111462283A (zh) * | 2020-03-27 | 2020-07-28 | 厦门梦加网络科技股份有限公司 | 大量相同角色动画播放方法、介质、设备及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116664735A (zh) | 2023-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6807620B1 (en) | Game system with graphics processor | |
KR100325902B1 (ko) | 고성능3차원그래픽가속기를위한부동소숫점처리기및그처리기능수행방법 | |
EP1789927B1 (en) | Increased scalability in the fragment shading pipeline | |
EP1725989B1 (en) | Register based queuing for texture requests | |
US7298375B1 (en) | Arithmetic logic units in series in a graphics pipeline | |
US7710427B1 (en) | Arithmetic logic unit and method for processing data in a graphics pipeline | |
CN106095588B (zh) | 基于gpgpu平台的cdvs提取过程加速方法 | |
CN101647044B (zh) | 图像生成装置以及图像生成方法 | |
CN102648450A (zh) | 用于并行命令列表生成的硬件 | |
JP4430678B2 (ja) | 3次元グラフィック・サブシステムにおけるテクスチャマップデータのプログラム可能なフィルタ処理方法及び装置 | |
US7616202B1 (en) | Compaction of z-only samples | |
EP1255227A1 (en) | Vertices index processor | |
US11763513B2 (en) | DGPU assist using DSP pre-processor system and method | |
CN114529658A (zh) | 一种图形渲染方法及其相关设备 | |
US20220036106A1 (en) | Method and apparatus for data calculation in neural network model, and image processing method and apparatus | |
CN108010113B (zh) | 一种基于像素着色器的深度学习模型执行方法 | |
US6677953B1 (en) | Hardware viewport system and method for use in a graphics pipeline | |
CN116664735B (zh) | 一种虚拟对象的大规模动画渲染方法、装置、设备及介质 | |
JP2023525725A (ja) | データ圧縮の方法及び装置 | |
US10417815B2 (en) | Out of order pixel shader exports | |
CN111127590B (zh) | 一种二阶贝塞尔曲线绘制方法及装置 | |
CN117292039A (zh) | 顶点坐标生成方法、装置、电子设备及计算机存储介质 | |
US8826294B2 (en) | Efficient state management system | |
US7324112B1 (en) | System and method for processing divergent samples in a programmable graphics processing unit | |
EP2089847B1 (en) | Graphics processor pipelined reduction operations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |