WO2020237460A1

WO2020237460A1 - 一种图形处理方法和装置

Info

Publication number: WO2020237460A1
Application number: PCT/CN2019/088565
Authority: WO
Inventors: 姚刚; 陈平; 汪明; 吴刚; 罗志强
Original assignee: 华为技术有限公司
Priority date: 2019-05-27
Filing date: 2019-05-27
Publication date: 2020-12-03
Also published as: EP3964949A1; US20220083367A1; CN113168322A; EP3964949A4; EP3964949B1

Abstract

本申请公开了一种图形处理方法和装置，涉及芯片技术领域，能够解决GPU采样或需渲染到非本地格式的图形数据时成本高的问题。其方法为：获取图形处理器GPU待访问的第一虚拟地址，第一虚拟地址属于第一虚拟地址空间；根据第一虚拟地址得到第二虚拟地址，第二虚拟地址属于第二虚拟地址空间。其中，第二虚拟地址空间不同于第一虚拟地址空间，第二虚拟地址空间和第一虚拟地址空间映射到相同的物理地址空间，第一虚拟地址所映射的物理地址对应第一格式的图像数据，第二虚拟地址所映射的物理地址对应第二格式的图像数据。本申请实施例用于GPU采样或渲染到非本地格式。

Description

一种图形处理方法和装置

技术领域

本申请涉及芯片技术领域，尤其涉及一种图形处理方法和装置。

背景技术

图形处理器(Graphics Processing Unit，GPU)可用于执行复杂的数学和几何计算，这些计算是图形渲染所必需的。其基本工作原理是基于一个三维端点模型，并根据透视原理做出相应的变换，同时采样这些端点对应的材质(texture)，渲染出的结果写到帧缓存(frame buffer)中。GPU采样材质的缓存通常称为材质缓存区(texture buffer)。对于GPU来说，只能支持采样一定格式的texture buffer。类似的，GPU也只能支持一定格式的渲染目标的缓存区。某些场景下，缓存区中保存的数据格式往往不是GPU本地支持的，GPU需要采样这种数据格式时，目前常用的方法是将GPU非本地格式显示转换成GPU本地格式存储于中间缓存区中，以供GPU采样。或者，GPU需要渲染成这种数据格式时，GPU先根据采样结果渲染成本地格式，而后将本地格式的数据显示转换成非本地格式的数据存储于中间缓存区中。这种方法需要申请额外的缓存区，消耗内存，且会产生额外的延迟，浪费带宽，也浪费功耗，成本开销大。

发明内容

本申请实施例提供一种图形处理方法和装置，能够解决GPU采样非本地格式的图形数据或需渲染成非本地格式的图形数据时，内存消耗大，带宽成本高的问题。

第一方面，提供一种图形处理方法，包括：获取图形处理器GPU待访问的第一虚拟地址，第一虚拟地址属于第一虚拟地址空间；根据第一虚拟地址得到第二虚拟地址，第二虚拟地址属于第二虚拟地址空间。其中，第二虚拟地址空间不同于第一虚拟地址空间，第二虚拟地址空间和第一虚拟地址空间映射到相同的第一物理地址空间，第一虚拟地址所映射的物理地址对应第一格式的图像数据，第二虚拟地址所映射的物理地址对应第二格式的图像数据。

可以理解，本申请实施例重新构建了一个第二虚拟地址空间，该第二虚拟地址空间区别于第一虚拟地址空间。本申请可以将第一虚拟地址空间中的地址映射为该新增的第二虚拟地址空间中的一个地址，新增的第二虚拟地址空间中的第二虚拟地址所映射的物理地址对应第二格式的图形数据，该第二格式的图像数据区别于第一格式的图像数据，示例性的，如果第一格式的图像数据为GPU不能直接访问的图像数据，第二格式的图像数据为GPU可以访问的图像数据，本申请实施例通过将地址映射到一个新增的虚拟地址空间中实现了图像格式的转换，而无需图像格式处理器进行格式转换，GPU就可以访问非本地格式的图像，避免申请额外的本地GPU缓存，避免格式转换处理器和缓存之间的多次迁移，减少了内存消耗，避免延迟，并节省了带宽和功耗。

在一种可能的设计中，根据第一虚拟地址得到第二虚拟地址，具体包括：将第一虚拟地址翻译成中间虚拟地址，中间虚拟地址为第二虚拟地址空间中的一个虚拟地址；在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址。在第一虚拟地址为非本地格式的第一虚拟地址时，中间虚拟地址可以理解为非本地格式的中间虚拟地址，第二虚拟地址可以理解为本地格式的第二虚拟地址。也就是说，在得到第二虚拟地址时，需要进行一次第一虚拟地址到中间虚拟地址的地址翻译，和一次中间虚拟地址到第二虚拟地址的地址映射，一次中间虚拟地址到第二虚拟地址的地址映射可以理解为在新增的第二虚拟地址空间中完成像素级别的地址映射，从而可以使得GPU根据第二虚拟地址访问物理地址对应的图像数据，得到本地格式这种第二格式的图像数据。

本申请实施例在现有的第一虚拟地址空间和第一物理地址空间之间新增了一个第二虚拟地址空间，并在这个新增的第二虚拟地址空间中完成像素级别的地址映射，将非本地格式的图像的地址映射为GPU可以访问的本地格式的图像的地址，进一步的，本申请实施例将现有技术中的第一虚拟地址到第一物理地址的一次地址翻译拆分成两次地址翻译和一次像素级别的地址映射：第一虚拟地址到中间虚拟地址的翻译，中间虚拟地址到第二虚拟地址的像素级别的地址映射，以及第二虚拟地址到第一物理地址的翻译，从而GPU可以读取或渲染非本地格式的图像，而不需要显性的格式转换，避免申请额外的本地GPU缓存，避免格式转换处理器和缓存之间的多次迁移，减少了内存消耗，避免延迟，并节省了带宽和功耗。

在一种可能的设计中，将第一虚拟地址翻译成中间虚拟地址，具体包括：根据第一映射关系得到第一虚拟地址在第二虚拟地址空间中对应的中间虚拟地址，第一映射关系为第一虚拟地址空间和第二虚拟地址空间的映射关系。第一映射关系可以存储在GPU的存储器管理单元MMU中。在本申请实施例中，MMU可以集成在GPU内部，也可以位于GPU外部，本申请不做限定。

在一种可能的设计中，根据第一虚拟地址得到第二虚拟地址之后，方法还包括：根据第二映射关系得到第二虚拟地址在第一物理地址空间中对应的第一物理地址，第二映射关系为第二虚拟地址空间和第一物理地址空间的映射关系。

可以理解，本申请在经过第一次地址翻译，将第一虚拟地址翻译为中间虚拟地址，再经过一次地址映射，即将中间虚拟地址映射为第二虚拟地址，再经过一次地址翻译，将第二虚拟地址翻译为第一物理地址。格式映射前的非本地格式的中间虚拟地址和格式映射后的本地格式的第二虚拟地址都属于这片连续的第二虚拟地址空间，只是排布方式发生了变化。第二虚拟地址空间在GPU根据该本地格式的第二虚拟地址的顺序访问非本地格式的真实的物理地址时，访问的是本地格式的图形数据，也即GPU是按照转换后的本地格式的图形数据的顺序去读取或写入图像数据的，因此，本申请这种通过虚拟化的方式可以使得GPU采样过程不需要额外的格式转换缓冲区，也省略了实际的进行格式转换的过程，实现了GPU以低成本方式采样非本地格式的图形数据。类似的，在根据该第二虚拟地址空间得到真实渲染数据时的非本地格式的物理地址时，根据该非本地格式的物理地址渲染图形数据的顺序对于GPU来说是按照本地格式的图形数据的顺序进行渲染的，因此，本申请这种通过虚拟化的方式可以使得GPU渲染过程不需要额外的格式转换缓冲区，也省略了实际的进行格式转换的过程，实现了GPU以低成本方式渲染本地格式的图形数据到非本地格式的内存。

在一种可能的设计中，在根据第一虚拟地址得到第二虚拟地址之前，该方法还包括：获取发送给GPU的图形处理请求，图形处理请求包括第一虚拟地址空间和第一物理地址空间；根据第一虚拟地址空间和第一物理地址空间构建第二虚拟地址空间。

也就是说，应用程序在向GPU发送图形处理请求时，本申请实施例可以通过虚拟化软件代理拦截到该图形处理请求，从而根据该请求构建出第二虚拟地址空间。应当理解，本申请实施例将离散的第一物理地址空间和第一虚拟地址空间先映射到一片连续的第二虚拟地址空间中，然后在这个虚拟出来的连续空间中将非本地格式的图形数据转换为本地格式的图形数据，本申请实施例的格式转换是通过在虚拟的空间中改变地址的排布方式实现的。

在一种可能的设计中，该方法还包括：根据第一虚拟地址空间和第一物理地址空间得到第一映射关系和第二映射关系。

在一种可能的设计中，根据第一虚拟地址空间和第一物理地址空间构建第二虚拟地址空间，具体包括：获取第一物理地址空间对应的物理内存页PP的大小以及第一虚拟地址空间对应的虚拟内存页VP的大小；将第一物理地址空间映射到连续的虚拟内存空间中，得到第二虚拟地址空间，第二虚拟地址空间对应的虚拟物理内存页VPP的大小大于PP的大小以及VP的大小。

这样做的目的是，要将本申请构建的第二虚拟地址空间覆盖第一虚拟地址空间和真实物理地址的第一物理地址空间，才能建立第一虚拟地址空间和第二虚拟地址空间之间的第一映射关系，和第二虚拟地址空间与第一物理地址空间之间的第二映射关系。

在一种可能的设计中，根据第一虚拟地址得到第二虚拟地址，包括：

将第一虚拟地址翻译成中间虚拟地址；判断中间虚拟地址是否属于第二虚拟地址空间；当中间虚拟地址属于第二虚拟地址空间时，在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址。因GPU的MMU中维护了多个映射关系，所以MMU中翻译出的虚拟地址有可能是其他缓存区的实际的物理地址，而不是第二虚拟地址空间中的虚拟地址，所以这里要进行判断过滤。也就是说，MMU获取的中间虚拟地址并不一定是第一映射关系中的虚拟地址。

在一种可能的设计中，在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址，具体包括：获取中间虚拟地址对应的像素坐标；根据像素坐标获取第二虚拟地址。这里即为上述进行像素级别的地址映射的一种实现过程，通过像素坐标可以得到本地格式的第二虚拟地址，从而通过本地格式的第二虚拟地址访问真实的物理地址的图像数据，得到本地格式的图像数据。

在一种可能的设计中，第一格式的图像数据为GPU需读取的压缩数据，压缩数据包括多个压缩图形块，在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址，包括：获取中间虚拟地址对应的像素坐标；根据像素坐标获取中间虚拟地址对应的目标压缩图形块的压缩偏移信息；根据压缩偏移信息计算得到第二虚拟地址；方法还包括：对读取的目标压缩图形块进行解压缩。这里是考虑到在进行像素级别的地址转换时，内存中存储的非本地格式的图像数据可能是压缩格式的图像数据。相应的，在采样得到图像数据时，还需要进行图像数据的解压缩。

在一种可能的设计中，第一格式的图像数据为GPU待写入的压缩数据，在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址，包括获取中间虚拟地址对应的像素坐标；根据像素坐标获取待写入的压缩数据的头数据的地址；根据头数据的地址获取第二虚拟地址。即，写入数据时，考虑到内存中存放的是压缩数据，因此，在将本地格式的图像数据存放进非本地格式的内存中时，要得到压缩格式的数据的第二虚拟地址，以根据第二虚拟地址将数据村放入物理地址的内存中。

在一种可能的设计中，在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址，包括：获取中间虚拟地址对应的像素坐标；获取像素坐标对应的像素的签名；根据签名获取与签名对应的第二虚拟地址；若第一格式的图像数据为GPU需读取的加密数据，则方法还包括：对读取的图像数据进行解密，将解密后的图像数据发送给GPU。这种情况是考虑到，内存中存放的图像数据为加密格式，因此在进行像素级别的地址映射时，要得到加密格式下的第二虚拟地址。

第二方面，提供一种图形处理装置，其特征在于，装置包括图形处理器GPU和硬件虚拟化管理器，其中：

GPU，用于获取待访问的第一虚拟地址，第一虚拟地址属于第一虚拟地址空间；硬件虚拟化管理器，用于根据第一虚拟地址得到第二虚拟地址，第二虚拟地址属于第二虚拟地址空间；其中，第二虚拟地址空间不同于第一虚拟地址空间，第二虚拟地址空间和第一虚拟地址空间映射到相同的第一物理地址空间，第一虚拟地址所映射的物理地址对应第一格式的图像数据，第二虚拟地址所映射的物理地址对应第二格式的图像数据。

在一种可能的设计中，GPU包括第一存储器管理单元MMU，所述硬件虚拟化管理器包括格式转换处理器；第一MMU，用于将第一虚拟地址翻译成中间虚拟地址，中间虚拟地址为第二虚拟地址空间中的一个虚拟地址；格式转换处理器，用于在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址。

在一种可能的设计中，第一MMU用于：根据第一映射关系得到第一虚拟地址在第二虚拟地址空间中对应的中间虚拟地址，第一映射关系为第一虚拟地址空间和第二虚拟地址空间的映射关系。

在一种可能的设计中，第一MMU用于：硬件虚拟化管理器包括第二MMU，第二MMU用于：根据第二映射关系得到第二虚拟地址在第一物理地址空间中对应的第一物理地址，第二映射关系为第二虚拟地址空间和第一物理地址空间的映射关系。

在一种可能的设计中，装置还包括中央处理器CPU，CPU上运行有虚拟化软件代理，虚拟化软件代理，用于：获取发送给GPU的图形处理请求，图形处理请求包括第一虚拟地址空间和第一物理地址空间；根据第一虚拟地址空间和第一物理地址空间构建第二虚拟地址空间。

在一种可能的设计中，虚拟化软件代理，还用于：根据第一虚拟地址空间和第一物理地址空间得到第一映射关系和第二映射关系。

在一种可能的设计中，虚拟化软件代理，具体用于：获取第一物理地址空间对应的物理内存页PP的大小以及第一虚拟地址空间对应的虚拟内存页VP的大小；将第一物理地址空间映射到连续的虚拟内存空间中，得到第二虚拟地址空间，第二虚拟地址空间对应的虚拟物理内存页VPP的大小大于PP的大小以及VP的大小。

在一种可能的设计中，GPU包括第一MMU，硬件虚拟化管理器包括探听过滤器和格式转换处理器；第一MMU，用于：将第一虚拟地址翻译成中间虚拟地址；探听过滤器，用于：判断中间虚拟地址是否属于第二虚拟地址空间；当中间虚拟地址属于第二虚拟地址空间时，将中间虚拟地址发送给格式转换处理器；格式转换处理器用于：在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址。

在一种可能的设计中，格式转换处理器具体用于：获取中间虚拟地址对应的像素坐标；根据像素坐标获取第二虚拟地址。

在一种可能的设计中，第一格式的图像数据为GPU需读取的压缩数据，压缩数据包括多个压缩图形块；格式转换处理器具体用于：获取中间虚拟地址对应的像素坐标；根据像素坐标获取中间虚拟地址对应的目标压缩图形块的压缩偏移信息；根据压缩偏移信息计算得到第二虚拟地址；格式转换处理器还用于：对读取的目标压缩图形块进行解压缩。

在一种可能的设计中，第一格式的图像数据为GPU待写入的压缩数据；格式转换处理器具体用于：获取中间虚拟地址对应的像素坐标；根据像素坐标获取待写入的压缩数据的头数据的地址；根据头数据的地址获取第二虚拟地址。

在一种可能的设计中，格式转换处理器具体用于：获取中间虚拟地址对应的像素坐标；获取像素坐标对应的像素的签名；根据签名获取与签名对应的第二虚拟地址；若第一格式的图像数据为GPU需读取的加密数据，格式转换处理器还用于：对读取的图像数据进行解密，将解密后的图像数据发送给GPU。

上述第一方面和第二方面中提到的第一虚拟地址可以相当于下面即将介绍的第三方面和第四方面提到的虚拟地址空间中的目标虚拟地址；上述第一方面和第二方面中提到的第一虚拟地址空间相当于第三方面和第四方面提到的虚拟地址空间；上述第一方面和第二方面中提到的第二虚拟地址空间相当于第三方面和第四方面提到的虚拟物理地址空间；上述第一方面和第二方面中提到的第一物理地址空间相当于第三方面和第四方面提到的物理地址空间；上述第一方面和第二方面中提到的中间虚拟地址相当于第三方面和第四方面提到的中间物理地址；上述第一方面和第二方面中提到的第二虚拟地址相当于第三方面和第四方面提到的目标虚拟物理地址；上述第一方面和第二方面中提到的第一物理地址相当于第三方面和第四方面提到的目标物理地址；当第三方面和第四方面中的中间物理地址属于第二虚拟地址空间时，第三方面和第四方面提到的中间物理地址为第一虚拟物理地址，那么第一虚拟物理地址就相当于第一方面和第二方面提到的中间虚拟地址。

第三方面，提供一种图形处理方法，包括：虚拟化软件代理构建虚拟物理地址空间，虚拟物理地址空间为虚拟地址空间和物理地址空间之外的内存空间；硬件虚拟化管理器在虚拟物理地址空间中对待访问的非本地格式图像数据的地址进行映射，得到本地格式图像数据的目标虚拟物理地址；获取目标虚拟物理地址对应的目标物理地址，并访问目标物理地址中的图像数据。虚拟地址空间中的虚拟地址所映射的物理地址对应第一格式的图像数据，虚拟物理地址空间中的目标虚拟物理地址所映射的物理地址对应第二格式的图像数据。

本申请实施例在现有的虚拟地址空间和物理地址空间之间新增了一个虚拟物理地址空间，并在这个新增的虚拟物理地址空间中完成像素级别的地址映射，将非本地格式的图像的地址映射为GPU可以访问的本地格式的图像的地址，进一步的，本申请实施例将现有技术中的虚拟地址到物理地址的一次地址映射拆分成两次地址映射：虚拟地址到虚拟物理地址，虚拟物理地址到物理地址的映射，从而GPU可以读取或渲染非本地格式的图像，而不需要显性的格式转换，避免申请额外的本地GPU缓存，避免格式转换处理器和缓存之间的多次迁移，减少了内存消耗，避免延迟，并节省了带宽和功耗。

应当理解，本申请实施例将离散的物理地址先映射到一片连续的虚拟物理内存页VPP地址空间(虚拟物理地址空间)中，然后在这个虚拟出来的连续空间中改变了地址的排列方式，按照改变之后的虚拟地址所映射的物理地址对应第二格式的图像数据，具体的，按照改变之后的虚拟地址的顺序访问物理地址空间中的图像数据得到的是第二格式的图像数据，本申请实施例的格式转换是通过在虚拟的空间中改变地址的排布方式实现的，格式映射前的非本地格式的VPP地址和格式映射后的本地格式的VPP地址都属于这片连续的VPP地址空间，只是排布方式发生了变化。在GPU根据该映射后的虚拟物理地址的顺序访问非本地格式的真实的物理地址时，访问的是本地格式的图形数据，也即GPU是按照转换后的本地格式的图形数据的顺序去读取或写入图像数据的，因此，本申请这种通过虚拟化的方式可以使得GPU采样过程不需要额外的格式转换缓冲区，也省略了实际的进行格式转换的过程，实现了GPU以低成本方式采样非本地格式的图形数据。类似的，在根据该虚拟物理地址得到真实渲染数据时的非本地格式的物理地址时，根据该非本地格式的物理地址渲染图形数据的顺序对于GPU来说是按照本地格式的图形数据的顺序进行渲染的，因此，本申请这种通过虚拟化的方式可以使得GPU渲染过程不需要额外的格式转换缓冲区，也省略了实际的进行格式转换的过程，实现了GPU以低成本方式渲染本地格式的图形数据到非本地格式的内存。

在一种可能的设计中，在硬件虚拟化管理器在虚拟物理地址空间中对待访问的非本地格式图像数据的地址进行映射之前，该方法还包括：获取图形处理器GPU待访问的目标虚拟地址；GPU的存储器管理单元MMU根据第一映射关系得到目标虚拟地址对应的虚拟物理地址空间中的第一虚拟物理地址，第一映射关系为虚拟地址空间和虚拟物理地址空间的映射关系；硬件虚拟化管理器在虚拟物理地址空间中对待访问的非本地格式图像数据的地址进行映射，得到本地格式图像数据的目标虚拟物理地址，具体包括：硬件虚拟化管理器在虚拟物理地址空间中对第一虚拟物理地址进行映射得到目标虚拟物理地址。

在一种可能的设计中，获取目标虚拟物理地址对应的目标物理地址，具体包括：硬件虚拟化管理器中的第二MMU根据第二映射关系获取目标虚拟物理地址对应的目标物理地址，第二映射关系为虚拟物理地址空间和物理地址空间的映射关系。

在一种可能的设计中，在虚拟化软件代理构建虚拟物理地址空间之前，方法还包括：获取发送给GPU的图形处理请求，图形处理请求包括非本地格式图像的虚拟地址空间和物理地址空间；虚拟化软件代理构建虚拟物理地址空间，具体包括：虚拟化软件代理根据虚拟地址空间和物理地址空间构建得到虚拟物理地址空间。

在一种可能的设计中，在虚拟化软件代理根据虚拟地址空间和物理地址空间构建得到虚拟物理地址空间时，还得到第一映射关系和第二映射关系。

在一种可能的设计中，虚拟化软件代理构建虚拟物理地址空间，具体包括：

获取物理地址空间对应的物理内存页PP的大小和虚拟内存页VP的大小；根据PP的大小和VP的大小构建虚拟物理地址空间，虚拟物理地址空间对应的虚拟物理内存页VPP的大小大于PP的大小和VP的大小。

在一种可能的设计中，硬件虚拟化管理器包括过滤器和格式转换处理器，在硬件虚拟化管理器在虚拟物理地址空间中对待访问的非本地格式图像数据的地址进行映射之前，方法还包括：获取图形处理器GPU待访问的目标虚拟地址；GPU的存储器管理单元MMU将目标虚拟地址映射为中间物理地址；过滤器判断中间物理地址是否属于虚拟物理地址空间；当中间物理地址属于虚拟物理地址空间时，过滤器将中间物理地址确定为第一虚拟物理地址，并发送给格式转换处理器；格式转换处理器在虚拟物理地址空间中将第一虚拟物理地址进行像素级格式映射得到目标虚拟物理地址。

在一种可能的设计中，硬件虚拟化管理器在虚拟物理地址空间中对第一虚拟物理地址进行映射得到目标虚拟物理地址，包括：获取第一虚拟物理地址对应的像素坐标；根据像素坐标获取与像素坐标对应的目标虚拟物理地址。

在一种可能的设计中，待访问的非本地格式图像数据为GPU需读取的压缩数据，压缩数据包括多个压缩图形块，硬件虚拟化管理器在虚拟物理地址空间中对第一虚拟物理地址进行映射得到目标虚拟物理地址，包括：获取第一虚拟物理地址对应的像素坐标；根据像素坐标获取第一虚拟物理地址对应的目标压缩图形块的压缩偏移信息；根据压缩偏移信息计算得到目标虚拟物理地址；方法还包括：对读取的目标压缩图形块进行解压缩。

在一种可能的设计中，待访问的非本地格式图像数据为GPU待写入的压缩数据，包括：获取第一虚拟物理地址对应的像素坐标；硬件虚拟化管理器在虚拟物理地址空间中对第一虚拟物理地址进行映射得到目标虚拟物理地址根据像素坐标获取待写入的压缩数据的头数据的地址；根据头数据的地址获取目标虚拟物理地址。

在一种可能的设计中，硬件虚拟化管理器在虚拟物理地址空间中对第一虚拟物理地址进行映射得到目标虚拟物理地址，包括：获取第一虚拟物理地址对应的像素坐标；获取像素坐标对应的像素的签名；根据签名获取与签名对应的目标虚拟物理地址；若待访问的非本地格式图像数据为GPU需读取的加密数据，则方法还包括：对读取的图像数据进行解密，将解密后的图像数据发送给GPU。

第四方面，提供一种图形处理装置，该装置包括图形处理器GPU、中央处理器CPU和硬件虚拟化管理器，CPU上运行有虚拟化软件代理，其中：虚拟化软件代理，用于构建虚拟物理地址空间，虚拟物理地址空间为虚拟地址空间和物理地址空间之外的内存空间；硬件虚拟化管理器，用于在虚拟物理地址空间中对待访问的非本地格式图像数据的地址进行映射，得到本地格式图像数据的目标虚拟物理地址；硬件虚拟化管理器，还用于获取目标虚拟物理地址对应的目标物理地址，并访问目标物理地址中的图像数据。

在一种可能的设计中，虚拟化软件代理，还用于：获取图形处理器GPU待访问的目标虚拟地址；GPU还包括存储器管理单元MMU，MMU用于根据第一映射关系得到目标虚拟地址对应的虚拟物理地址空间中的第一虚拟物理地址，第一映射关系为虚拟地址空间和虚拟物理地址空间的映射关系；硬件虚拟化管理器，用于在虚拟物理地址空间中对第一虚拟物理地址进行映射得到目标虚拟物理地址。

在一种可能的设计中，硬件虚拟化管理器包括第二MMU，第二MMU用于根据第二映射关系获取目标虚拟物理地址对应的目标物理地址，第二映射关系为虚拟物理地址空间和物理地址空间的映射关系。

在一种可能的设计中，虚拟化软件代理，还用于：获取发送给GPU的图形处理请求，图形处理请求包括非本地格式图像的虚拟地址空间和物理地址空间；虚拟化软件代理，用于：根据虚拟地址空间和物理地址空间构建得到虚拟物理地址空间。

在一种可能的设计中，虚拟化软件代理，还用于在根据虚拟地址空间和物理地址空间构建得到虚拟物理地址空间时，还得到第一映射关系和第二映射关系。

在一种可能的设计中，虚拟化软件代理，用于获取物理地址空间对应的物理内存页PP的大小和虚拟内存VP的大小；根据PP的大小和VP的大小构建虚拟物理地址空间，虚拟物理地址空间对应的虚拟物理内存页VPP的大小大于PP的大小和VP的大小。

在一种可能的设计中，硬件虚拟化管理器包括探听过滤器和格式转换处理器；探听过滤器，用于获取图形处理器GPU待访问的目标虚拟地址；GPU的MMU，用于将目标虚拟地址映射为中间物理地址；探听过滤器，用于判断中间物理地址是否属于虚拟物理地址空间；当中间物理地址属于虚拟物理地址空间时，将中间物理地址确定为第一虚拟物理地址，并发送给格式转换处理器；格式转换处理器，用于在虚拟物理地址空间中将第一虚拟物理地址进行像素级格式映射得到目标虚拟物理地址。

在一种可能的设计中，硬件虚拟化管理器，用于获取第一虚拟物理地址对应的像素坐标；根据像素坐标获取与像素坐标对应的目标虚拟物理地址。

在一种可能的设计中，待访问的非本地格式图像数据为GPU需读取的压缩数据，压缩数据包括多个压缩图形块，硬件虚拟化管理器，用于获取第一虚拟物理地址对应的像素坐标；根据像素坐标获取第一虚拟物理地址对应的目标压缩图形块的压缩偏移信息；根据压缩偏移信息计算得到目标虚拟物理地址；硬件虚拟化管理器，还用于对读取的目标压缩图形块进行解压缩。

在一种可能的设计中，待访问的非本地格式图像数据为GPU待写入的压缩数据，硬件虚拟化管理器，用于获取第一虚拟物理地址对应的像素坐标；硬件虚拟化管理器在虚拟物理地址空间中对第一虚拟物理地址进行映射得到目标虚拟物理地址；根据像素坐标获取待写入的压缩数据的头数据的地址；根据头数据的地址获取目标虚拟物理地址。

在一种可能的设计中，硬件虚拟化管理器，用于获取第一虚拟物理地址对应的像素坐标；获取像素坐标对应的像素的签名；根据签名获取与签名对应的目标虚拟物理地址；硬件虚拟化管理器，还用于对读取的图像数据进行解密，将解密后的图像数据发送给GPU。

第五方面，提供一种图形处理方法，包括：获取待访问的第一虚拟地址，第一虚拟地址属于第一虚拟地址空间；将第一虚拟地址翻译成中间虚拟地址，中间虚拟地址属于第二虚拟地址空间，中间虚拟地址在第二虚拟地址空间中能够被映射为第二虚拟地址；其中，第二虚拟地址空间不同于第一虚拟地址空间，第二虚拟地址空间和第一虚拟地址空间映射到相同的第一物理地址空间，第一虚拟地址所映射的物理地址对应第一格式的图像数据，第二虚拟地址所映射的物理地址对应第二格式的图像数据。

因此，本申请实施例可以实现在这个新增的第二虚拟地址空间中完成像素级别的地址映射，将第一格式这种非本地格式的图像的地址映射为GPU可以访问的第二格式这种本地格式的图像的地址，从而GPU可以读取或渲染非本地格式的图像，而不需要显性的格式转换，避免申请额外的本地GPU缓存，避免格式转换处理器和缓存之间的多次迁移，减少了内存消耗，避免延迟，并节省了带宽和功耗。

在一种可能的设计中，将第一虚拟地址翻译成中间虚拟地址，具体包括：根据第一映射关系得到第一虚拟地址在第二虚拟地址空间中对应的中间虚拟地址，第一映射关系为第一虚拟地址空间和第二虚拟地址空间的映射关系。

在一种可能的设计中，在生成待访问的第一虚拟地址之前，方法还包括:接收第一虚拟地址空间和第二虚拟地址空间；建立第一映射关系。

第六方面，提供一种GPU，GPU包括传输接口和存储器管理单元MMU，其中：传输接口，用于获取待访问的第一虚拟地址，第一虚拟地址属于第一虚拟地址空间；MMU，用于将第一虚拟地址翻译成中间虚拟地址，中间虚拟地址属于第二虚拟地址空间，中间虚拟地址在第二虚拟地址空间中能够被映射为第二虚拟地址；其中，第二虚拟地址空间不同于第一虚拟地址空间，第二虚拟地址空间和第一虚拟地址空间映射到相同的第一物理地址空间，第一虚拟地址所映射的物理地址对应第一格式的图像数据，第二虚拟地址所映射的物理地址对应第二格式的图像数据。

在一种可能的设计中，MMU，用于：根据第一映射关系得到第一虚拟地址在第二虚拟地址空间中对应的中间虚拟地址，第一映射关系为第一虚拟地址空间和第二虚拟地址空间的映射关系。

在一种可能的设计中，MMU，用于：接收第一虚拟地址空间和第二虚拟地址空间；建立第一映射关系。

由此按照该非本地格式的PP地址采样图形数据的顺序对于GPU来说实际是按照本地格式的地址顺序采样的，那么对于采样过程来说，可使得GPU最终采样图形数据时的采样顺序与GPU实际按照真实的物理地址采样图形数据时的采样顺序不同，采样顺序改变时采样得到的图形数据对于GPU来说为GPU能够识别并处理的本地格式的图形数据，因此，最终按照非本地格式的物理地址从内存中读取的图形数据的顺序为GPU能够识别的图形格式。类似的，对于渲染过程来说，GPU渲染本地格式的图形数据时，可先按照本申请虚拟的本地格式的物理地址VPP对应本地格式的图形数据，再将VPP对应到非本地格式的物理地址，这样，GPU要将本地格式的图形数据写入非本地格式的内存中时，最终写到内存中的图形数据还是按照非本地格式的物理地址写入的，写入到内存中的图形数据对于GPU来说为GPU不能识别的非本地格式的图形数据。

附图说明

图1为一种现有技术采样和渲染到非本地格式的场景示意图；

图2为本一种GPU内部的功能模块示意图；

图2A为一种现有技术采样或渲染数据时的地址映射关系的示意图；

图2B为本申请实施例提供的一种地址空间结构与现有技术的地址空间结构的对比示意图；

图2C为本申请实施例提供的一种地址映射关系示意图；

图2D为本申请实施例提供的一种地址映射关系示意图；

图2E为本申请实施例提供的一种地址映射关系示意图；

图2F为本申请实施例提供的一种采样或渲染非本地格式数据时的地址映射关系示意图；

图2G为本本身实施例提供的一种采样或和渲染非本地格式数据时的过程示意图；

图3为本申请实施例提供的一种终端设备的结构示意图；

图4为本申请实施例提供的一种SoC的结构示意图；

图5为本申请实施例提供的一种图形处理方法的流程示意图；

图6为本申请实施例提供的一种采样非本地格式的图形数据的软硬件架构图；

图7为本申请实施例提供的一种图形处理方法的流程示意图；

图8为本申请实施例提供的一种终端设备的结构示意图；

图9为本申请实施例提供的一种终端设备的结构示意图。

具体实施方式

为了便于理解，示例地给出了部分与本申请相关概念的说明以供参考。如下所示：

GPU:又称显示核心、视觉处理器或显示芯片，是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上进行图像运算工作的微处理器，示例性的，GPU的用途包括：将计算机系统所需要的显示信息进行转换驱动，并向显示器提供行扫描信号，控制显示器的正确显示等，GPU是连接显示器和个人电脑主板的重要元件，也是"人机对话"的重要设备之一。

虚拟地址(virtual address)：程序访问存储器所使用的逻辑地址。

物理地址(physical address)：放在寻址总线上的地址。如果中央处理单元(Central Processing Unit，CPU)进行读操作，电路可根据物理地址每位的值将相应地址的物理内存中的数据读取到数据总线中传输。如果CPU进行写操作，电路可根据物理地址每位的值在相应地址的物理内存中写入数据总线上的内容。

存储器映射管理单元(Memory Management Unit，MMU)：是CPU中用来管理虚拟存储器和物理存储器的控制线路，同时也负责虚拟地址映射为物理地址，以及提供硬件机制的内存访问授权，多用户多进程操作系统。

一种典型的场景中，如图1所示，该场景用于后处理并渲染监控摄像头100捕获的视频流，渲染的结果由编码处理器105二次编码后输出。具体来讲，监控摄像头100的原始视频流在编码器101中完成编码，编码结果以非GPU本地格式写入非本地格式缓存106，其中，集成在系统级芯片(System on Chip，SoC)上的编码器101通常是与供应商绑定的特定私有格式，包含有变换、压缩以及知识产权保护的各种信息，GPU103无法直接采样这种私有格式，可通过格式转换处理器102将私有格式转换成GPU本地格式，将转换后的GPU本地格式的图形数据存储于本地GPU缓存107中。这样，GPU103可以从本地GPU缓存107中采样图形数据进行GPU渲染，渲染的结果以GPU本地格式写入本地GPU缓存108中。但是，编码处理器105无法直接接受本地GPU缓存108中GPU本地格式的图形数据，就还需要另一个格式转换处理器104通过总线读取本地GPU缓存108中的图形数据，再将该图形数据的格式转换成编码器105可接受的格式，将该可接受的格式的图形数据通过总线写入非本地格式缓存109。这样看来，该场景中数据的每一次迁移都包含该数据在缓存和处理器之间的迁移，需要申请额外的缓存空间，这样既消耗内存，也会产生延迟并浪费带宽和功耗，成本较高。

针对上述GPU采样或渲染非本地格式的图形数据的场景，本申请可以用于GPU对图形进行采样或渲染的过程中，能够以低成本开销采样或渲染对于GPU来说为非本地格式的图形。

这里首先对本申请中的GPU内部的功能单元进行介绍。如图2所示为GPU内部的功能单元结构示意图。

目前，GPU架构已经从固定功能流水线逐步演进到可编程的着色器(shader)处理器架构。参考图2，shader处理器可以至少分为三类：顶点着色器(vertex shader)、像素着色器(fragment shader)和几何着色器(geometry shader)。其中，顶点处理器的程序包含对一个顶点实例进行操作的指令。像素处理器程序包含对一个像素进行处理的指令，通常包括从材质采样缓冲区(texture sample buffer)采样该像素的材质，计算光源对该像素的反射，以得到最终的着色结果。几何处理器的程序用于指示GPU内部分工做几何处理。虽然不同类型的shader运行不同类型的程序，但在硬件结构上，通常是一个归一化的架构运行一个归一化的指令集。指令集包括和通用标量处理器类似的算术，存储器load/store和移位等。这些shader处理器前端每一条指令都运行在多个数据实例上，也就是通常的单一指令多数据结构。这些shader处理器还需要和固定功能流水线通信完成图形功能。该图形功能包括光栅化处理器(rasterizer)和材质映射器(texture mapper)。rasterizer用于计算生成每个着色片段对应的像素。texture mapper用于计算经过透视变换后最终要取的材质点(texel)的地址。shader处理器和固定流水线都会被映射到虚拟地址上。在内存管理时，页是地址空间的最小单位。一个应用程序所能使用的所有的虚拟地址称为虚拟地址空间。虚拟地址空间通常被划分为更小的粒度，虚拟内存页(Virtual page，VP)。一个虚拟地址空间由一系列虚拟地址组成。虚拟地址空间会被映射到真实的双倍数据速率(Double Data Rate，DDR)空间中，即物理地址空间。物理地址空间也会被划分成一系列物理内存页(Physical Page，PP)。VP和PP的大小通常可以是一样的，例如可以为4KB。对于进程来说，使用的都是虚拟地址。每个进程维护一个单独的页表。页表是一种数组结构，存放着各VP的状态，包括是否映射，是否缓存。进程执行时，当需要访问虚拟地址中存放的值时：CPU会先找到虚拟地址所在的VP，再根据页表，找出页表中VP的页号对应的值，再根据该值对应的物理页号，获取虚拟地址对应的PP中的物理地址，这一过程可以称为虚拟地址到物理地址的地址翻译。简单来说，地址翻译是指在缓存命中时，由虚拟地址找到物理地址的过程。

通常，图形的存储器管理单元(Memory Management Unit，MMU)用于管理虚拟地址空间和物理地址空间之间的映射关系。将虚拟地址翻译为物理地址是由MMU完成的，或者说基于存储在MMU中的虚拟地址空间和物理地址空间的映射关系得到虚拟地址对应的物理地址。例如，一个材质缓冲区(存储图形数据的区域)在texture mapper中映射到的是一片连续的虚拟地址空间，在DDR空间中映射的是一堆分散的物理页面。

以渲染过程举例来说，一个像素处理器在渲染像素时，发送材质采样指令给texture mapper，texture mapper将计算得到的texel的虚拟地址发送到总线接口单元(Bus Interface Unit，BIU)，通过BIU上连接的MMU查找到与虚拟地址对应的物理地址。对于当前系统使用的tile based架构，渲染是以片状材料(tile)为粒度进行的，可根据物理地址将渲染的中间结果存入渲染目标缓冲区(render target buffer)。在一些实例中，系统会存在L2缓存。对于采样过程，在一些实例中，系统会存在L2缓存(level2cache)，如果当前采样的texel在L2缓存中未查找到，该texel读取操作会通过总线操作读取材质缓冲区(texture buffer)中的内容。

上述过程中提到，MMU中管理有应用程序申请到的虚拟地址空间和物理地址空间之间的映射关系，也就是说，MMU中存储有将虚拟地址翻译为物理地址的映射关系表。该表的内容由操作系统进行管理。如图2A所示为现有技术利用虚拟地址在MMU中进行地址翻译得到物理地址后，利用物理地址去访问主存中的数据的示意图。而在本申请实施例中，参见图2B，与图2B中的(1)所示的现有技术不同的是，本申请在第一虚拟地址空间(相当于现有技术中的虚拟地址空间)和第一物理地址空间(相当于现有技术中的物理地址空间)之间添加一个第二虚拟地址空间，参见图2B中的(2)，该第二虚拟地址空间可以被划分为一系列的虚拟物理内存页(Virtual Physical Page，VPP)，该第二虚拟地址空间是区别于第一虚拟地址空间和第一物理地址空间的一个空间，第二虚拟地址空间和第一虚拟地址空间映射到相同的物理地址空间，第一虚拟地址所映射的物理地址对应第一格式的图像数据，第二虚拟地址所映射的物理地址对应第二格式的图像数据。本申请实施例的方法涉及一个虚拟化软件代理(virtualization software agent)和一个硬件虚拟化管理器(hardware virtualization hypervisor)，该第二虚拟地址空间是虚拟化软件代理构建出来的，如果第一格式的图像数据为GPU不能直接访问的非本地格式的图像数据，第二格式的图像数据为GPU可以访问的本地格式的图像数据，后续硬件虚拟化管理器可以在这个构建出的第二虚拟地址空间中对待访问的数据完成本地格式和非本地格式之间像素级别的地址映射。对应的，本申请实施例将第一虚拟地址空间中的第一虚拟地址和第一物理地址空间中的第一物理地址的映射关系拆分成第一映射关系和第二映射关系，其中第一映射关系为第一虚拟地址和第二虚拟地址空间中的第二虚拟地址的映射关系，第二映射关系为第二虚拟地址和第一物理地址的映射关系，第一映射关系存储在GPU的第一MMU中，第二映射关系存储在硬件虚拟化管理器的第二MMU中。在执行进程时，当需要访问第一虚拟地址中存放的值时，先根据MMU中的第一映射关系将第一虚拟地址翻译成第二虚拟地址空间中的第二虚拟地址，再根据第二MMU中的第二映射关系将第二虚拟地址翻译成第一物理地址，也即，本申请实施例通过两次地址翻译实现对实际的物理地址的访问。由于本申请实施例中，新增了一个第二虚拟地址空间，并在这个第二虚拟地址空间中完成图像格式的像素级别的地址映射，GPU不需要进行显性的格式转换，就可以访问非本地格式的图像，也即不需要格式转换处理器102将私有格式转换成本地格式，以及格式处理器104将本地格式转换成编码器可以接受的格式，也不需要申请额外的本地GPU缓存107和本地GPU缓存108，避免了数据在处理器和缓存之间的多次迁移，减少了内存消耗，避免延迟，并节省了带宽和功耗。

示例性的，参考图2C，以采样过程为例，若GPU依次发送多个访问请求，每个访问请求访问一个第一虚拟地址，在GPU发送访问请求之前，需要先根据第一映射关系进行地址映射，这时，上述根据GPU的MMU中的第一映射关系将第一虚拟地址翻译成第二虚拟地址空间中的第二虚拟地址可以按照如下举例理解：如果GPU访问的第一虚拟地址的顺序为VP1-VP2-VP3-…，按照第一虚拟地址的顺序为VP1-VP2-VP3-…所映射的物理地址PP1-PP2-PP3-…对应第一格式的图像数据。根据第一映射关系，可以得到第一虚拟地址对应的中间虚拟地址VPP1-VPP2-VPP3-…，那么GPU发送的多个访问请求中实际上分别携带一个中间虚拟地址，中间虚拟地址被发送的顺序就为VPP1-VPP2-VPP3-…。而后，要在这个虚拟的第二虚拟地址空间中完成图像格式的像素级别的地址映射，将非本地格式的中间虚拟地址映射为本地格式的第二虚拟地址，示例性的，VPP1被映射为VPP4，VPP2被映射为VPP2，VPP3被映射为VPP1，以便GPU按照本地格式的第二虚拟地址和第二映射关系获取到第二虚拟地址对应的实际访问非本地格式数据时用到的第一物理地址，这样，就实现了GPU按照本地格式的第二虚拟地址访问非本地格式的图形数据。按照图2C，进行像素级别的地址映射后的第二虚拟地址的顺序为VPP4-VPP2-VPP1-…，根据第二虚拟地址的顺序为VPP4-VPP2-VPP1-…所映射的物理地址对应第二格式的图像数据，上述根据第二MMU中的第二映射关系将第二虚拟地址翻译成第一物理地址，就可以理解为，根据第二虚拟地址的顺序VPP4-VPP2-VPP1-…以及第二映射关得到第二次地址翻译后的第一物理地址，该第一物理地址的顺序为PP4-PP2-PP1-…，进而按照第一物理地址的顺序为PP4-PP2-PP1-…去访问内存中的图形数据，第一物理地址的顺序PP4-PP2-PP1-…对应第二格式的图像数据，如果第一格式的图像数据为GPU不能直接访问的非本地格式的图像数据，第二格式的图像数据为GPU可以访问的本地格式的图像数据，从而可使得GPU从非本地格式的图像数据中采样到本地格式的图形格式。

如图2D所示，为本申请实施例提供的示例性的地址映射前读取到的图像格式的示意图，如图2E所示，为示例性的地址映射后读取到的图像格式的示意图。

根据第一物理地址空间和第一虚拟地址空间构建出第二虚拟地址空间，也即根据第一物理地址空间和第一虚拟地址空间的大小开辟一片连续的虚拟内存空间，并将该连续的虚拟内存空间作为第二虚拟地址空间，该空间的内存页为虚拟物理内存页VPP，第一虚拟地址空间(图2D中示意的虚拟地址空间)的内存页为虚拟内存页VP，第一物理地址空间(图2D中示意的物理地址空间)的内存页为物理内存页PP，应当理解，构建出的虚拟物理地址的VPP的大小要大于VP的大小和PP的大小。在进行地址映射之前，访问第一物理地址空间中存储的像素的顺序为PP1中的X1Y1，PP2中的X2Y2，PP3中的X3Y3，PP4中的X4Y4，PP5中的X5Y5，此时，读出的图像数据为第一格式的图像数据(格式1)。本申请实施例在新构建的第二虚拟地址空间(图2D中示意的虚拟物理地址空间)中对地址进行映射，改变了访问的地址顺序，相当于改变了图像像素的排布方式，如图2E所示，在第二虚拟地址空间(图2E中示意的虚拟物理地址空间)中进行地址映射之后，VPP1映射到VPP2，VPP2映射到VPP4，VPP3映射到VPP1，VPP4映射到VPP5，VPP5映射到VPP5，访问第一物理地址空间(图2E中示意的物理地址空间)中存储的像素的顺序变为PP2中的X2Y2，PP4中的X4Y4，PP1中的X1Y1，PP5中的X5Y5，PP3中的X3Y3，读出的图像数据的像素排布顺序发生了变化，此时读出的图像数据为第二格式的图像数据(格式2)。

本申请实施例在新构建的第二虚拟地址空间中对地址进行映射，改变了读取像素的地址的顺序，相当于改变了读出的图像数据的像素的排布方式，可选的，第一格式的图像为GPU不能访问的非本地格式的图像，第二格式的图像为GPU可以直接访问的本地格式的图像，因此可以不需要显性的格式转换，GPU就可以访问非本地格式的图像数据得到本地格式的图像数据。

示例性的，本申请实施例提出的第二虚拟地址空间可以是根据进程对应的第一物理地址空间的大小和第一虚拟地址空间的大小确定的一段连续的地址。举例来说，第一虚拟地址空间的大小为396KB，第一物理地址空间被划分为100个离散的VP，每个VP的大小是4KB，那么第二虚拟地址空间的大小需要大于400KB，这样第二虚拟地址空间才可以替换第一物理地址空间，建立第一虚拟地址空间和第二虚拟地址空间之间的第一映射关系，以及第二虚拟地址空间和第一物理地址空间之间的第二映射关系。

这样，在本申请提出的第二虚拟地址空间的基础上，如图2F所示，如果GPU采样或者渲染非本地格式的图形数据，GPU的MMU中存储的是应用程序申请到的非本地格式的VP地址范围(第一虚拟地址空间)与本申请提出的非本地格式的VPP地址范围(第二虚拟地址空间)之间的映射关系，也就是说，GPU的MMU中存储有将第一虚拟地址翻译为第二虚拟地址的第一映射关系查询表。例如现有的GPU的MMU中的查询表包括地址为第一虚拟地址空间0x8000与第一物理地址空间0x6453之间的映射，本申请中，GPU访问非本地格式的内存时，在获取到第一虚拟地址空间0x8000与第一物理地址空间0x6453的映射关系时，可以将该映射关系拆分成第一虚拟地址空间0x8000与第二虚拟地址空间0x0之间的第一映射关系，以及第二虚拟地址空间0x0与第一物理地址空间0x6453之间的第二映射关系，再重载GPU的MMU中的查询表，使得GPU的MMU中的查询表包括第一虚拟地址空间0x8000与第二虚拟地址空间0x0之间的第一映射关系，对应的，将第二虚拟地址空间0x0与第一物理地址空间0x6453之间的第二映射关系存储在虚拟化硬件处理器的第二MMU中。通过虚拟地址获取物理地址时，可以先对第一虚拟地址0x8000进行地址翻译得到第二虚拟地址0x0，再对第二虚拟地址0x0进行地址翻译得到真实的访问数据的第一物理地址0x6453。基于此，本申请采用一种虚拟化的方法可使得GPU采样或渲染非本地格式图形数据。这种虚拟化方法不需要离线显式的转换阶段，可以在线完成采样和渲染非本地格式的图形。虚拟化软件代理可以拦截到应用程序对GPU的图形应用程序接口(Application Programming Interface，API)调用，基于此调用，虚拟化软件代理可以虚拟出GPU可以直接访问的采样缓冲区或者渲染的目标缓冲区，这些虚拟出的缓冲区可以称为本地格式的VPP对应的缓冲区。在这个虚拟出来的VPP对应的缓冲区中将非本地格式的图形数据转换为本地格式的图形数据，本申请实施例的格式转换是通过在虚拟的空间中改变地址的排布方式实现的。一种示例中，虚拟化软件代理可根据应用程序对GPU进行图形API调用时申请到的VP地址空间(第一虚拟地址空间)和PP地址空间(第一物理地址空间)构建出VPP地址空间(第二虚拟地址空间)，VP地址空间所映射的PP地址对应第一格式的图像数据，即非本地格式的图像数据。示例性的，根据VP地址空间和PP地址空间得到VP地址空间与VPP地址空间的第一映射关系，以及VPP地址空间与PP地址空间的第二映射关系，其中第一映射关系存储于GPU的MMU中，第二映射关系存储与硬件虚拟化管理器的第二MMU中，VPP地址空间为一片连续的虚拟地址空间，而后，硬件虚拟化管理器获取GPU要访问的目标VPP地址，并在VPP地址空间中完成图像数据格式的像素级别的地址映射，按照本地格式的目标VPP地址所映射的PP地址访问的图形数据为第二格式的图像数据，即为GPU能够访问的本地格式的图形数据。而后，硬件虚拟化管理器根据格式映射后的本地格式的目标VPP地址和存储在第二MMU中的第二映射关系得到目标PP地址，使得GPU从目标PP地址中读取图形数据或者向目标PP地址中写入图形数据。由于采样过程中得到的非本地格式的PP地址的排布方式是按照本地格式的目标VPP地址计算得到的，按照该非本地格式的PP地址采样图形数据的顺序实际是按照本地格式的目标VPP地址顺序采样的，那么对于采样过程来说，可使得GPU最终采样图形数据时的采样顺序与GPU实际按照真实的物理地址采样图形数据时的采样顺序不同，采样顺序改变时采样得到的图形数据对于GPU来说为GPU能够识别并处理的本地格式的图形数据，因此，最终按照非本地格式的PP地址从内存中读取的图形数据的顺序为GPU能够识别的图形格式。类似的，对于渲染过程来说，GPU渲染本地格式的图形数据时，可先按照本申请虚拟的物理地址VPP地址获取本地格式的图形数据，再根据VPP地址得到非本地格式的PP地址，这样，GPU要将本地格式的图形数据写入非本地格式的内存中时，最终写到内存中的图形数据还是按照非本地格式的PP地址写入的，写入到内存中的图形数据对于GPU来说为GPU不能识别的非本地格式的图形数据。这样一来，本申请在采样或渲染非本地格式图形时，不需要显示的格式转换阶段，例如不需要图1中的将格式转换处理器102将私有格式转换成GPU本地格式的过程，以及不需要图1中的将格式转换处理器104通过总线读取本地GPU缓存108中的图形数据，再将该图形数据的格式转换成编码器105可接受的格式的过程。另外，不需要格式转换的缓冲区，例如不需要图1中的本地GPU缓存107以及本地GPU缓存108。相比而言，本申请的采样和渲染过程可以如图2G所示，通过虚拟化的方式，可以使得GPU103通过第二虚拟地址空间这一构建出的中间层去采样非本地格式缓存106，以及使得GPU103通过第二虚拟地址空间这一中间层渲染数据到非本地格式缓存109，极大的降低了系统的处理时延和带宽，降低了系统内存的使用量，和降低了显示转换处理器的成本。

上述过程中提到的虚拟化软件代理可以是以软件的形式实现，其对应的软件的程序代码可存储于终端设备的内存中，由CPU执行；硬件虚拟化管理器可以是以硬件和软件结合的方式实现，其硬件结构可以与GPU均设置在设备内的总线上，其对应的软件的程序代码可存储于终端设备的内存中。在一种可选的情况中，虚拟化软件代理、硬件虚拟化管理器和GPU集成在同一个SOC上。

本申请实施例可以用于可显示图形的终端设备处理图形的过程中，该终端设备可以为移动终端或不可移动的终端，例如移动终端可以为手机、平板电脑以及具有显示功能的其他移动设备等，不可移动的终端例如可以为个人电脑以及具有显示功能的其他备等。参考图3示出的终端设备的结构，该终端设备包括显示器、处理器、存储器、收发器以及总线，存储器包括上述内存。该处理器可包括SoC，在该SoC中，参考图4，可布局有GPU、硬件虚拟化管理器、向量排列单元(Vector Permutate Unit，VPU)、CPU、图像信号处理(Image Signal Processing，ISP)、缓存、动态随机存取存储器(Dynamic Random Access Memory，DRAM)控制器以及总线等，GPU、VPU、CPU、ISP、缓存以及DRAM控制器可通过连接器相耦合，应当理解，本申请的各个实施例中，耦合是指通过特定方式的相互联系，包括直接相连或者通过其他设备间接相连，例如可以通过各类接口、传输线或总线等相连，这些接口通常是电性通信接口，但是也不排除可能是机械接口或其它形式的接口，本实施例对此不做限定。本申请实施例具体可以应用于SoC对于图形采样和渲染的过程。

根据以上阐述，本申请实施例提供一种图形处理方法，该方法包括以下步骤：

1)终端设备获取图形处理器GPU待访问的第一虚拟地址，第一虚拟地址属于第一虚拟地址空间。

第一虚拟地址所映射的物理地址对应第一格式的图像数据。

2)终端设备根据第一虚拟地址得到第二虚拟地址，第二虚拟地址属于第二虚拟地址空间。

其中，第二虚拟地址空间不同于第一虚拟地址空间，第二虚拟地址空间和第一虚拟地址空间映射到相同的第一物理地址空间，第二虚拟地址所映射的物理地址对应第二格式的图像数据。

可以知道，本申请实施例重新构建了一个第二虚拟地址空间，该第二虚拟地址空间区别于第一虚拟地址空间。本申请可以将第一虚拟地址空间中的地址映射为该新增的第二虚拟地址空间中的一个地址，新增的第二虚拟地址空间中的第二虚拟地址所映射的物理地址对应第二格式的图形数据，该第二格式的图像数据区别于第一格式的图像数据，示例性的，如果第一格式的图像数据为GPU不能直接访问的图像数据，第二格式的图像数据为GPU可以访问的图像数据，本申请实施例通过将地址映射到一个新增的虚拟地址空间中实现了图像格式的转换，而无需图像格式处理器进行格式转换，GPU就可以访问非本地格式的图像，避免申请额外的本地GPU缓存，避免格式转换处理器和缓存之间的多次迁移，减少了内存消耗，避免延迟，并节省了带宽和功耗。

上述根据第一虚拟地址得到第二虚拟地址，可以包括：通过GPU中的第一MMU将第一虚拟地址翻译成中间虚拟地址，中间虚拟地址为第二虚拟地址空间中的一个虚拟地址；通过硬件虚拟化管理器在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址。在第一虚拟地址为非本地格式的第一虚拟地址时，中间虚拟地址可以理解为非本地格式的中间虚拟地址，第二虚拟地址可以理解为本地格式的第二虚拟地址。也就是说，在得到第二虚拟地址时，需要进行一次第一虚拟地址到中间虚拟地址的地址翻译，和一次中间虚拟地址到第二虚拟地址的地址映射，一次中间虚拟地址到第二虚拟地址的地址映射可以理解为在新增的第二虚拟地址空间中完成像素级别的地址映射，从而可以使得GPU根据第二虚拟地址访问物理地址对应的图像数据，得到本地格式这种第二格式的图像数据。

上述将第一虚拟地址翻译成中间虚拟地址，可以包括：GPU中的第一MMU可以根据第一映射关系得到第一虚拟地址在第二虚拟地址空间中对应的中间虚拟地址，第一映射关系为第一虚拟地址空间和第二虚拟地址空间的映射关系。第一映射关系可以存储在GPU的存储器管理单元MMU中。在本申请实施例中，第一MMU可以集成在GPU内部，也可以位于GPU外部，本申请不做限定。

在根据第一虚拟地址得到第二虚拟地址之后，该方法还可以包括：通过硬件虚拟化管理器根据第二映射关系得到第二虚拟地址在第一物理地址空间中对应的第一物理地址，第二映射关系为第二虚拟地址空间和第一物理地址空间的映射关系。可以理解，本申请在经过第一次地址翻译，将第一虚拟地址翻译为中间虚拟地址，再经过一次地址映射，即将中间虚拟地址映射为第二虚拟地址，再经过一次地址翻译，将第二虚拟地址翻译为第一物理地址。格式映射前的非本地格式的中间虚拟地址和格式映射后的本地格式的第二虚拟地址都属于这片连续的第二虚拟地址空间，只是排布方式发生了变化。第二虚拟地址空间在GPU根据该本地格式的第二虚拟地址的顺序访问非本地格式的真实的物理地址时，访问的是本地格式的图形数据，也即GPU是按照转换后的本地格式的图形数据的顺序去读取或写入图像数据的，因此，本申请这种通过虚拟化的方式可以使得GPU采样过程不需要额外的格式转换缓冲区，也省略了实际的进行格式转换的过程，实现了GPU以低成本方式采样非本地格式的图形数据。类似的，在根据该第二虚拟地址空间得到真实渲染数据时的非本地格式的物理地址时，根据该非本地格式的物理地址渲染图形数据的顺序对于GPU来说是按照本地格式的图形数据的顺序进行渲染的，因此，本申请这种通过虚拟化的方式可以使得GPU渲染过程不需要额外的格式转换缓冲区，也省略了实际的进行格式转换的过程，实现了GPU以低成本方式渲染本地格式的图形数据到非本地格式的内存。

由于本申请重新需要构建了一个第二虚拟地址空间，那么在根据第一虚拟地址得到第二虚拟地址之前，该方法还可以包括：通过虚拟化软件代理获取发送给GPU的图形处理请求，图形处理请求包括第一虚拟地址空间和第一物理地址空间，从而可以根据第一虚拟地址空间和第一物理地址空间构建第二虚拟地址空间。也就是说，应用程序在向GPU发送图形处理请求时，本申请实施例可以通过虚拟化软件代理拦截到该图形处理请求，从而根据该请求构建出第二虚拟地址空间。应当理解，本申请实施例将离散的第一物理地址空间和第一虚拟地址空间先映射到一片连续的第二虚拟地址空间中，然后在这个虚拟出来的连续空间中将非本地格式的图形数据转换为本地格式的图形数据，本申请实施例的格式转换是通过在虚拟的空间中改变地址的排布方式实现的。

这样在构建出第二虚拟地址空间后，就可以根据第一虚拟地址空间和第一物理地址空间得到第一映射关系和第二映射关系。

对于第二虚拟地址空间是如何得到的，本申请提供一种可能的设计可以为：虚拟化软件代理获取第一物理地址空间对应的物理内存页PP的大小以及第一虚拟地址空间对应的虚拟内存页VP的大小，将第一物理地址空间映射到连续的虚拟内存空间中，得到第二虚拟地址空间，第二虚拟地址空间对应的虚拟物理内存页VPP的大小大于PP 的大小以及VP的大小。这样做的目的是，要将本申请构建的第二虚拟地址空间覆盖第一虚拟地址空间和真实物理地址的第一物理地址空间，才能建立第一虚拟地址空间和第二虚拟地址空间之间的第一映射关系，和第二虚拟地址空间与第一物理地址空间之间的第二映射关系。

上述根据第一虚拟地址得到第二虚拟地址，可以包括：将第一虚拟地址翻译成中间虚拟地址；判断中间虚拟地址是否属于第二虚拟地址空间；当中间虚拟地址属于第二虚拟地址空间时，在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址。因GPU的MMU中维护了多个映射关系，所以MMU中翻译出的虚拟地址有可能是其他缓存区的实际的物理地址，而不是第二虚拟地址空间中的虚拟地址，所以这里要进行判断过滤。也就是说，MMU获取的中间虚拟地址并不一定是第一映射关系中的虚拟地址。

上述在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址，可以包括：获取中间虚拟地址对应的像素坐标；根据像素坐标获取第二虚拟地址。这里即为上述进行像素级别的地址映射的一种实现过程，通过像素坐标可以得到本地格式的第二虚拟地址，从而通过本地格式的第二虚拟地址访问真实的物理地址的图像数据，得到本地格式的图像数据。

如果第一格式的图像数据为GPU需读取的压缩数据，压缩数据包括多个压缩图形块，在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址，可以包括：获取中间虚拟地址对应的像素坐标；根据像素坐标获取中间虚拟地址对应的目标压缩图形块的压缩偏移信息；根据压缩偏移信息计算得到第二虚拟地址；方法还包括：对读取的目标压缩图形块进行解压缩。这里是考虑到在进行像素级别的地址转换时，内存中存储的非本地格式的图像数据可能是压缩格式的图像数据。相应的，在采样得到图像数据时，还需要进行图像数据的解压缩。

如果第一格式的图像数据为GPU待写入的压缩数据，在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址，包括获取中间虚拟地址对应的像素坐标；根据像素坐标获取待写入的压缩数据的头数据的地址；根据头数据的地址获取第二虚拟地址。即，写入数据时，考虑到内存中存放的是压缩数据，因此，在将本地格式的图像数据存放进非本地格式的内存中时，要得到压缩格式的数据的第二虚拟地址，以根据第二虚拟地址将数据村放入物理地址的内存中。

如果内存中存储的第一格式的图像数据为加密格式，那么在第二虚拟地址空间中将中间虚拟地址映射为第二虚拟地址，可以包括：获取中间虚拟地址对应的像素坐标；获取像素坐标对应的像素的签名；根据签名获取与签名对应的第二虚拟地址；若第一格式的图像数据为GPU需读取的加密数据，则方法还包括：对读取的图像数据进行解密，将解密后的图像数据发送给GPU。这种情况是考虑到，内存中存放的图像数据为加密格式，因此在进行像素级别的地址映射时，要得到加密格式下的第二虚拟地址。

通过以上说明，本申请实施例可以通过新增一个第二虚拟地址空间实现GPU直接访问非本地格式的图像数据。

下面以本申请如何对非本地格式的图形数据进行采样和渲染为例进行说明。参考图5，本申请实施例提供一种图形处理方法，以采样过程为例，该方法包括：

501、虚拟化软件代理拦截应用程序发送给GPU的图形处理请求，图形处理请求包括应用程序申请的非本地格式的VP地址空间和非本地格式的PP地址空间。

参考图6，图6示出了本申请采样非本地格式的图形数据的软硬件架构图。当某一应用程序指示GPU采样图形数据时，该应用程序可以向GPU发送图形处理请求，该图形处理请求中携带有采样所需的资源，该资源包括应用程序申请到的材质缓冲区。由于GPU采样的内存中存储的是对于GPU来说是非本地格式的图形数据，因此该材质缓冲区包括非本地格式的VP地址空间和非本地格式的PP地址空间，这时，虚拟软件代理可以拦截到应用程序发送给GPU的图形处理请求，以对图形处理请求进行解析。

502、虚拟化软件代理根据VP地址空间和PP地址空间构建出VPP地址空间，VPP地址空间为一片连续的虚拟地址空间。

示例性的，虚拟化软件代理可对拦截到的图形处理请求进行解析，以得到图形处理请求中的非本地格式的VP地址空间和非本地格式的PP地址空间，进一步的，根据VP地址空间和PP地址空间的映射关系得到VP地址空间与VPP地址空间的第一映射关系，以及VPP地址空间与PP地址空间的第二映射关系构建VPP地址空间。这里可通过PP的大小和VP的大小计算得到VPP地址空间，在上文中已经阐述，这里不再赘述。GPU按照VPP地址可以读取本地格式的图形数据，对应的，GPU也可以将渲染之后的本地格式的图像写入VPP地址中。换句话说，第二虚拟地址是虚拟得到的，并不是真实存在的一段物理地址，GPU从这段虚拟出来的物理地址中读取或写入的数据为GPU可以访问的本地格式的图形数据。或者说，在对非本地格式的PP地址转换为第二虚拟地址时，图形数据的像素排布格式发生了变化，按照映射之后的VPP得到的缓冲的图像是以本地格式排布像素格式的，这种本地格式的图形数据是GPU可以直接访问的。

其中，本地格式是指GPU native format，是指GPU硬件本身支持(intrinsically support)的图像格式，GPU可以天然进行读写操作的格式。常用的本地格式由图形API定义。比如图形API为开放图形库(Open Graphics Library，OpenGL),OpenGL ES(OpenGL for Embedded Systems)以及3D规格界面的Direct3D时，常用的本地格式有：RGBA8888、RGBA16F、RGB10A2、SRGB8_A8_ASTC_3x3x3等。

非本地格式是指GPU不能直接进行读写操作的格式，示例性的，非本地格式包括所有非图形API支持的格式。这些格式一般都是由图形社区以外的应用场景产生。例如非本地格式包括Y10U10V10LPacked、Y10U10V10压缩格式、ICE以及Y10U10V10等。

由于内存中存储的是非本地格式的物理地址对应的图形数据，因此，下面的步骤还需要根据VPP地址空间对应得到真正采样数据时用到的非本地格式的PP地址。因此，该方法还包括：

503、虚拟化软件代理将第一映射关系发送给GPU，以及将第二映射关系和VPP地址空间发送给硬件虚拟化管理器。

VPP地址空间中的VPP地址用于替换GPU的MMU中PP地址空间中的PP地址，在GPU的MMU中建立VP地址空间中的VP地址与VPP地址空间中的VPP地址之间的第一映射关系。需要说明的是，本申请实施例中，GPU的硬件结构和软件程序并没有改动，VPP地址空间存储在GPU的MMU中，对于GPU来说是不感知的，是被动接收的，现有技术中GPU在读写数据时最终发送给内存的是真实的物理地址，而由于本申请中的MMU未存储真实的物理地址，存储的是非本地格式的VP地址与VPP地址范围中的VPP地址之间的映射关系，因此，GPU在读写非本地格式的数据时发送给内存的是将非本地格式的VP地址进行地址翻译得到的非本地格式的VPP地址。

参考图6，硬件虚拟化管理器可以包括探听过滤器(snoop filter)、格式转换处理器(format conversion processor)以及第二MMU。探听过滤器用于确定GPU读取的图形数据的物理地址是否在VPP地址范围内。格式转换处理器用于在第二虚拟空间进行像素级的地址映射，将GPU读取图形数据时发送的VPP地址(中间虚拟地址)转换为本地格式的目标VPP地址(第二虚拟地址)，以及对要读取图形数据进行解压缩或解密等。第二MMU存储有第二映射关系，第二映射关系为VPP地址空间与PP地址空间的映射关系。这里的第二映射关系可以是虚拟化软件代理在构建VPP地址空间时，将第二映射关系配置到第二MMU中的。其实现方式可以为：虚拟化软件代理向第二MMU发送配置信息，该配置信息包括第二映射关系。

基于此，将VPP地址空间和第二映射关系发送给硬件虚拟化管理器可以包括：将VPP地址空间发送给探听过滤器，将第二映射关系发送给第二MMU。这样，探听过滤器存储有VPP地址空间时，GPU在采样图形数据时，每读取一个图形数据时，一个图形数据对应一个VP地址和一个PP地址，同样地，也对应一个VPP地址。如果GPU要读取图形数据时，GPU的MMU中维护有多个映射表，如果GPU要采样的内存中存储的是本地格式的图形数据，GPU的MMU中存储的是真实的物理地址，那么GPU发送给内存的就是真实的物理地址，硬件虚拟化管理器的过探听过滤器中探听到的真实的物理地址就不在VPP地址空间内，硬件虚拟化管理器可丢弃接收到的真实的物理地址。也就是说，探听过滤器会过滤掉不在VPP地址空间内的物理地址。

504、硬件虚拟化管理器解析GPU的访问命令，得到访问命令中携带的中间虚拟地址。

这里具体为硬件虚拟化管理器中的探听过滤器解析GPU的访问命令。

505、硬件虚拟化管理器确定中间虚拟地址是否在VPP地址空间内。

上述已经提到，GPU在采样本地格式的图形数据时，GPU的访问命令中携带的中间虚拟地址为采样数据时真实的PP地址，探听过滤器会探听到该PP地址不在VPP地址范围内；如果GPU采样非本地格式的图形数据时，探听过滤器会探听到GPU的访问命令中携带的中间虚拟地址在本申请虚拟的VPP地址空间内。

506、若中间虚拟地址在VPP地址空间内，则硬件虚拟化管理器确定中间虚拟地址为VPP空间中的一个第一VPP地址。

也即，探听过滤器确定中间虚拟地址为VPP空间中的一个VPP地址。

507、硬件虚拟化管理器将第一VPP地址经过格式映射得到本地格式的目标VPP地址。

具体来说，探听过滤器将第一VPP地址发送给格式转换处理器；以便格式转换处理器将第一VPP地址转换为目标VPP地址。这里需要将第一VPP地址转换为目标VPP 地址是考虑到内存中存储的像素格式有多种情况，例如该像素格式为压缩格式或加密格式。也就是说，目标VPP地址为经过地址转换为内存中的像素格式对应的VPP地址。

因此，格式转换处理器将第一VPP地址转换为目标VPP地址可以适应于多种场景，本申请实施例对该场景进行以下3种情况的举例说明。

1)格式转换处理器根据第一VPP地址获取与第一VPP地址对应的像素坐标(x，y)，再根据像素坐标(x，y)获取与像素坐标(x，y)对应的目标VPP地址。

根据像素坐标(x，y)获取与像素坐标(x，y)对应的目标VPP地址的样例可以如下；

const uint TileW；//32

const uint TileH；//32

const uint WidthInTile＝(ImageWidth+TileW-1)/TileW；

//Tiling Address Transform

uint TileX＝x/TileW；

uint TileY＝y/TileH；

uint TileOffsetX＝x％TileW；

uint TileOffsetY＝y％TileH；

PixelAddress＝(TileY*WidthInTile+TileX)*(TileW*TileH)+TileOffsetY*TileW+TileX

采样和渲染是以tile为粒度进行的时，TileW和TileH表示与非本地格式的第一VPP地址绑定的像素tile的宽和高，WidthInTile表示tile的序列，这样可以根据非本地格式的第一VPP地址像素坐标(x，y)和像素tile的宽和高计算出像素tile的坐标(TileX，TileY)，以及像素tlie的偏差坐标(TileOffsetX，TileOffsetY)，最后根据像素tile的宽和高：TileW和TileH、像素tile的坐标(TileX，TileY)、像素tlie的偏差坐标(TileOffsetX，TileOffsetY)计算出本地格式的目标VPP地址PixelAddress。

这种情况下，在根据最终获取的非本地格式的物理地址读取了图形数据之后，要将图形数据传输回给GPU时，可以从内存中将该数据直接反馈给GPU。

2)在内存中存储的图形数据的格式为压缩格式的情况下，为了在内存中的任何位置随机访问，这些压缩格式通常是基于块的，即每帧图形被分成不同的图形块，这些图形块可以是无损格式或无损格式。本申请实施例以基于图形块的无损压缩为例进行说明。

基于此，要实现格式转换处理器将第一VPP地址转换为目标VPP地址时，格式转换处理器可首先根据第一VPP地址获取与第一VPP地址对应的像素坐标(x，y)，根据像素坐标(x，y)获取第一VPP地址要获取的图形块的索引，再根据索引获取格式转换处理器预先存储的与该索引对应的图形块的头数据，读取头数据中存储的头数据的压缩偏移信息，而后根据头数据的压缩偏移信息获取图形块对应的目标VPP地址。头数据的压缩偏移信息可以理解为该头数据的地址。

3)一些GPU中的纹理采样器受数字版权管理的保护，因此，不仅有普通的图形数据，还有额外的签名被编码到内存中，即内存中存储的图形数据为加密数据，要采样图形数据时还需要多层认证才能获取数据，这种情况下，要实现格式转换处理器将第一VPP地址转换为目标VPP地址，首先可控制格式转换处理器根据第一VPP地址获取与第一VPP地址对应的像素坐标(x，y)，再解码签名，即根据像素坐标(x，y)获取像素坐标(x，y)对应像素的签名，而后根据像素的签名获取格式转换处理器中预先存储的与该签名对应的目标VPP地址。

这种情况下，在根据非本地格式的物理地址读取了图形数据之后，要将该图形数据传输回给GPU时，由于内存中存储的图形数据为加密数据，因此该方法还包括：格式转换处理器对读取的图形数据进行解密，将解密后的图形数据发送给GPU。

508、硬件虚拟化管理器根据目标VPP地址和第二映射关系得到目标PP地址(第一物理地址)，以使得GPU从目标PP地址中读取图形数据。

当格式转换处理器得到目标VPP地址后，可以将目标VPP地址传输给第二MMU。由于第二MMU中存储有第二映射关系，那么第二MMU就可以根据第二映射关系，查找与目标VPP地址对应的非本地格式的PP地址，第二MMU再将查找到的非本地格式的PP地址发送给内存，以从内存中读取该非本地格式的PP地址对应的非本地格式的图形数据。

因此，在本申请实施例中，GPU中的MMU中存储的为VPP地址范围这种虚拟的物理地址范围与VP地址范围的对应关系，由于地址的排布方式可反映采样图形数据时的排布方式，本申请提出的第二虚拟地址的排布方式为GPU本地格式的图形数据对应的物理地址的排布方式，因此，在根据该第二虚拟地址得到真实采样数据时的非本地格式的物理地址时，根据该非本地格式的物理地址采样图形数据的顺序对于GPU来说是转换后的本地格式的图形数据的顺序，因此，本申请这种通过虚拟化的方式可以使得GPU采样过程不需要额外的格式转换缓冲区，也省略了实际的进行格式转换的过程，实现了GPU以低成本方式采样非本地格式的图形数据。

与采样过程类似的，本申请还提供一种图形处理方法，以使能GPU渲染到非本地格式缓冲区的过程为例，如图7所示，该方法包括：

701、虚拟化软件代理拦截应用程序发送给GPU的图形处理请求和图形数据，图形处理请求包括应用程序申请的非本地格式的VP地址空间和非本地格式的PP地址空间。

步骤701的实现方式与步骤501的实现方式类似，不同的是，虚拟化软件代理在拦截图形处理请求时，还拦截到将要写入内存的图形数据。该图形数据为GPU本地格式的图形数据，本申请实施例是要将GPU本地格式的图形数据写入非本地格式的内存中。

可以理解的是，该图形数据也可以是应用程序直接发送给GPU而不被虚拟化软件代理拦截到。

702、虚拟化软件代理根据VP地址空间和PP地址空间构建出VPP地址空间，VPP地址空间为一片连续的虚拟地址空间。

该步骤702的实现方式与步骤502的实现方式类似。不同的是，该VPP地址空间用于使得GPU按照本地格式的地址顺序渲染本地格式的图形数据。同样地，由于地址顺序不同，按照该地址渲染得到的图形数据的格式也不同。这样一来，虽然内存中存的图形数据为非本地格式的图形数据，应用程序申请到的是也是非本地格式的VP地址空间和非本地格式的PP地址空间，但是GPU要将本地格式的图形数据渲染到非本地格式的内存中去时，GPU可先按照本申请提出的VPP地址这种本地格式的地址顺序获取本地格式的图形数据，以便于后续将VPP地址反映射到非本地格式的PP地址，在将本地格式的图形数据存入内存中时，可以按照非本地格式的PP地址将本地格式的图形数据写入内存，使得内存中存入的最终为非本地格式的图形数据。

703、虚拟化软件代理将第一映射关系发送给GPU，以及将第二映射关系和VPP地址空间发送给硬件虚拟化管理器。

该步骤703的实现方式与步骤503的实现方式类似，不同的是，如果虚拟化软件代理还拦截到图形数据，那么虚拟化软件代理还需要将图形数据发送给GPU，以便GPU将拦截到的图形数据通过硬件虚拟化管理器写入内存。其中的探听过滤器用于确定GPU渲染的图形数据的物理地址是否在VPP地址范围内。格式转换处理器用于将GPU渲染图形数据时发送的第一VPP地址转换为目标VPP地址，以及对要写入的图形数据进行压缩或加密等。

704、硬件虚拟化管理器解析GPU的访问命令，得到访问命令中携带的中间虚拟地址。

705、硬件虚拟化管理器确定中间虚拟地址是否在VPP地址空间内。

步骤705的实现方式可以参考上述步骤505。

706、若中间虚拟地址在VPP地址空间内，则硬件虚拟化管理器确定中间虚拟地址为VPP空间中的一个第一VPP地址。

707、硬件虚拟化管理器将第一VPP地址经过格式映射得到本地格式的目标VPP地址。

具体来说，探听过滤器将第一VPP地址和从GPU接收到的图形数据发送给格式转换处理器；控制格式转换处理器将第一VPP地址转换为目标VPP地址。与步骤507类似的，格式转换处理器进行地址转换也是考虑到内存中的像素格式不同。

类似的，GPU渲染过程中，控制格式转换处理器将第一VPP地址转换为目标VPP地址也可以适用于多种场景：

一种场景可以参考步骤508中的1)情况中的说明。

再一种场景与步骤508中的2)情况类似，不同的是，地址转换过程中还需要对待渲染的图形数据进行压缩。具体来说，若内存中存储的像素格式为压缩格式，且GPU需向内存中写入图形数据，则要实现格式转换处理器将第一VPP地址转换为目标VPP地址时，可先控制格式转换处理器根据第一VPP地址获取与第一VPP地址对应的像素坐标(x，y)；根据像素坐标(x，y)计算图形数据对应的图形块的索引，根据索引获取图形块的头数据，并将头数据和图形数据进行压缩；在格式转换器中存储压缩后的头数据与索引的对应关系，以便后续采样过程中使用到该对应关系。再根据头数据的地址计算得到图形块对应的目标VPP地址。

又一种场景与步骤508中的3)情况类似，不同的是，在将第一VPP地址转换为目标VPP地址时，如果内存中存的像素格式为加密格式，格式转换处理器还需要对待写入的图形数据进行加密。具体的加密方式可以采用简单的流密码实现或者采用相对复杂的分组密码的私有密码进行加密，本申请不做限定。

708、硬件虚拟化管理器根据目标VPP地址和第二映射关系得到目标PP地址(第一物理地址)，以使得GPU向目标PP地址中写入图形数据。

当格式转换处理器得到目标VPP地址后，将目标VPP地址和压缩或加密后的图形数据发送给第二MMU；第二MMU根据存储的第二映射关系，查找与目标VPP地址对应的非本地格式的PP地址，第二MMU再根据查找到的PP地址将图形数据发送给内存，以根据PP地址将图形数据按照非本地格式写入内存。

因此，在本申请实施例中，GPU中的MMU中存储的为VPP地址这种虚拟的物理地址，即第二虚拟地址空间，由于地址的排布方式可反映渲染图形数据时的排布方式，本申请提出的虚拟的物理地址的排布方式为GPU本地格式的图形数据对应的物理地址的排布方式，因此，在根据该虚拟的物理地址得到对应的真实渲染数据时的非本地格式的物理地址时，根据该非本地格式的物理地址渲染图形数据的顺序对于GPU来说是按照本地格式的图形数据的顺序进行渲染的，因此，本申请这种通过虚拟化的方式可以使得GPU渲染过程不需要额外的格式转换缓冲区，也省略了实际的进行格式转换的过程，实现了GPU以低成本方式渲染本地格式的图形数据到非本地格式的内存。

上述主要从终端设备的角度对本申请实施例提供的方案进行了介绍。可以理解的是，终端设备为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对终端设备进行功能模块的划分，例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。需要说明的是，本申请实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

在采用对应各个功能划分各个功能模块的情况下，图8示出了上述实施例中所涉及的终端设备的一种可能的结构示意图，该终端设备可以包括图形处理的装置，图形处理的装置可以用于执行图5对应的方法步骤和图7对应的方法步骤。终端设备80包括：获取单元801、传输单元802以及确定单元803。获取单元801用于支持终端设备执行图5中的过程501、502、504、507以及508，图7中的过程701、702、704、707以及708；传输单元802用于执行图5中的过程503，图7中的过程703；确定单元803用于支持终端设备80执行图5中的过程505和506，图7中的过程705和706。其中，上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述，在此不再赘述。

在采用集成的单元的情况下，图9示出了上述实施例中所涉及的终端设备的一种可能的结构示意图。终端设备90包括：处理模块902和通信模块903。处理模块902 用于对终端设备的动作进行控制管理，例如，处理模块902用于支持终端设备执行图5中的过程501-508，图7中的过程701-708，和/或用于本文所描述的技术的其它过程。通信模块903用于支持终端设备与其他网络实体的通信。终端设备还可以包括存储模块901，用于存储终端设备的程序代码和数据，该程序代码和数据包括本申请的虚拟化软件代理以及硬件虚拟化管理器的程序代码和数据。

其中，处理模块902可以是处理器或控制器，例如可以是中央处理器(Central Processing Unit，CPU)，通用处理器，数字信号处理器(Digital Signal Processor，DSP)，专用集成电路(Application-Specific Integrated Circuit，ASIC)，现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。所述处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。通信模块903可以是收发器、收发电路或通信接口等。存储模块901可以是存储器。存储器中包括本申请的虚拟化软件代理以及硬件虚拟化管理器的程序代码和数据。处理器包括本申请的硬件虚拟化管理器的硬件结构。

当处理模块902为处理器，通信模块903为收发器，存储模块901为存储器时，本申请实施例所涉及的终端设备可以为图3所示的终端设备。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何在本发明揭露的技术范围内的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

一种图形处理方法，其特征在于，包括：

获取图形处理器GPU待访问的第一虚拟地址，所述第一虚拟地址属于第一虚拟地址空间；

根据所述第一虚拟地址得到第二虚拟地址，所述第二虚拟地址属于第二虚拟地址空间；

其中，所述第二虚拟地址空间不同于所述第一虚拟地址空间，所述第二虚拟地址空间和所述第一虚拟地址空间映射到相同的第一物理地址空间，所述第一虚拟地址所映射的物理地址对应第一格式的图像数据，所述第二虚拟地址所映射的物理地址对应第二格式的图像数据。
根据权利要求1所述的方法，其特征在于，所述根据所述第一虚拟地址得到第二虚拟地址，具体包括：

将所述第一虚拟地址翻译成中间虚拟地址，所述中间虚拟地址为所述第二虚拟地址空间中的一个虚拟地址；

在所述第二虚拟地址空间中将所述中间虚拟地址映射为所述第二虚拟地址。
根据权利要求2所述的方法，其特征在于，所述将所述第一虚拟地址翻译成中间虚拟地址，具体包括：

根据第一映射关系得到所述第一虚拟地址在所述第二虚拟地址空间中对应的所述中间虚拟地址，所述第一映射关系为所述第一虚拟地址空间和所述第二虚拟地址空间的映射关系。
根据权利要求3所述的方法，其特征在于，根据所述第一虚拟地址得到第二虚拟地址之后，所述方法还包括：

根据第二映射关系得到所述第二虚拟地址在所述第一物理地址空间中对应的第一物理地址，所述第二映射关系为所述第二虚拟地址空间和所述第一物理地址空间的映射关系。
根据权利要求4所述的方法，其特征在于，在根据所述第一虚拟地址得到第二虚拟地址之前，所述方法还包括：

获取发送给所述GPU的图形处理请求，所述图形处理请求包括所述第一虚拟地址空间和所述第一物理地址空间；

根据所述第一虚拟地址空间和所述第一物理地址空间构建所述第二虚拟地址空间。
根据权利要求5所述的方法，其特征在于，所述方法还包括：

根据所述第一虚拟地址空间和所述第一物理地址空间得到所述第一映射关系和所述第二映射关系。
根据权利要求5或6所述的方法，其特征在于，所述根据所述第一虚拟地址空间和所述第一物理地址空间构建所述第二虚拟地址空间，具体包括：

获取所述第一物理地址空间对应的物理内存页PP的大小以及所述第一虚拟地址空间对应的虚拟内存页VP的大小；

将所述第一物理地址空间映射到连续的虚拟内存空间中，得到所述第二虚拟地址空间，所述第二虚拟地址空间对应的虚拟物理内存页VPP的大小大于所述PP的大小以及所述VP的大小。
根据权利要求1所述的方法，其特征在于，所述根据所述第一虚拟地址得到第二虚拟地址，包括：

将所述第一虚拟地址翻译成中间虚拟地址；

判断所述中间虚拟地址是否属于所述第二虚拟地址空间；

当所述中间虚拟地址属于所述第二虚拟地址空间时，在所述第二虚拟地址空间中将所述中间虚拟地址映射为所述第二虚拟地址。
根据权利要求2至8任一项所述的方法，其特征在于，所述在所述第二虚拟地址空间中将所述中间虚拟地址映射为所述第二虚拟地址，具体包括：

获取所述中间虚拟地址对应的像素坐标；

根据所述像素坐标获取所述第二虚拟地址。
根据权利要求2至8任一项所述的方法，其特征在于，

所述第一格式的图像数据为所述GPU需读取的压缩数据，所述压缩数据包括多个压缩图形块，所述在所述第二虚拟地址空间中将所述中间虚拟地址映射为所述第二虚拟地址，包括：

获取所述中间虚拟地址对应的像素坐标；

根据所述像素坐标获取所述中间虚拟地址对应的目标压缩图形块的压缩偏移信息；

根据所述压缩偏移信息计算得到所述第二虚拟地址；

所述方法还包括：

对读取的所述目标压缩图形块进行解压缩。
根据权利要求2至8任一项所述的方法，其特征在于，所述第一格式的图像数据为所述GPU待写入的压缩数据，所述在所述第二虚拟地址空间中将所述中间虚拟地址映射为所述第二虚拟地址，包括：

获取所述中间虚拟地址对应的像素坐标；

根据所述像素坐标获取所述待写入的压缩数据的头数据的地址；

根据所述头数据的地址获取所述第二虚拟地址。
根据权利要求2至8任一项所述的方法，其特征在于，所述在所述第二虚拟地址空间中将所述中间虚拟地址映射为所述第二虚拟地址，包括：

获取所述中间虚拟地址对应的像素坐标；

获取所述像素坐标对应的像素的签名；

根据所述签名获取与所述签名对应的所述第二虚拟地址；

若所述第一格式的图像数据为所述GPU需读取的加密数据，则所述方法还包括：

对读取的图像数据进行解密，将解密后的图像数据发送给所述GPU。
一种图形处理装置，其特征在于，所述装置包括图形处理器GPU和硬件虚拟化管理器，其中：

所述GPU，用于获取待访问的第一虚拟地址，所述第一虚拟地址属于第一虚拟地址空间；

硬件虚拟化管理器，用于根据所述第一虚拟地址得到第二虚拟地址，所述第二虚拟地址属于第二虚拟地址空间；

其中，所述第二虚拟地址空间不同于所述第一虚拟地址空间，所述第二虚拟地址空间和所述第一虚拟地址空间映射到相同的第一物理地址空间，所述第一虚拟地址所映射的物理地址对应第一格式的图像数据，所述第二虚拟地址所映射的物理地址对应第二格式的图像数据。
根据权利要求13所述的装置，其特征在于，所述GPU包括第一存储器管理单元MMU，所述硬件虚拟化管理器包括格式转换处理器；

所述第一MMU，用于将所述第一虚拟地址翻译成中间虚拟地址，所述中间虚拟地址为所述第二虚拟地址空间中的一个虚拟地址；

所述格式转换处理器，用于在所述第二虚拟地址空间中将所述中间虚拟地址映射为所述第二虚拟地址。
根据权利要求14所述的装置，其特征在于，所述第一MMU用于：

根据第一映射关系得到所述第一虚拟地址在所述第二虚拟地址空间中对应的所述中间虚拟地址，所述第一映射关系为所述第一虚拟地址空间和所述第二虚拟地址空间的映射关系。
根据权利要求15所述的装置，其特征在于，所述硬件虚拟化管理器包括第二MMU，所述第二MMU用于：

根据第二映射关系得到所述第二虚拟地址在所述第一物理地址空间中对应的第一物理地址，所述第二映射关系为所述第二虚拟地址空间和所述第一物理地址空间的映射关系。
根据权利要求16所述的装置，其特征在于，所述装置还包括中央处理器CPU，所述CPU上运行有虚拟化软件代理，所述虚拟化软件代理，用于：

获取发送给所述GPU的图形处理请求，所述图形处理请求包括所述第一虚拟地址空间和所述第一物理地址空间；

根据所述第一虚拟地址空间和所述第一物理地址空间构建所述第二虚拟地址空间。
根据权利要求17所述的装置，其特征在于，所述虚拟化软件代理，还用于：

根据所述第一虚拟地址空间和所述第一物理地址空间得到所述第一映射关系和所述第二映射关系。
根据权利要求17或18所述的装置，其特征在于，所述虚拟化软件代理，具体用于：

获取所述第一物理地址空间对应的物理内存页PP的大小以及所述第一虚拟地址空间对应的虚拟内存页VP的大小；

将所述第一物理地址空间映射到连续的虚拟内存空间中，得到所述第二虚拟地址空间，所述第二虚拟地址空间对应的虚拟物理内存页VPP的大小大于所述PP的大小以及所述VP的大小。
根据权利要求13所述的装置，其特征在于，所述GPU包括第一MMU，所述硬件虚拟化管理器包括探听过滤器和格式转换处理器；

所述第一MMU，用于：将所述第一虚拟地址翻译成中间虚拟地址；

所述探听过滤器，用于：

判断所述中间虚拟地址是否属于所述第二虚拟地址空间；

当所述中间虚拟地址属于所述第二虚拟地址空间时，将所述中间虚拟地址发送给所述格式转换处理器；

所述格式转换处理器用于：在所述第二虚拟地址空间中将所述中间虚拟地址映射为所述第二虚拟地址。
根据权利要求14至20任一项所述的装置，其特征在于，所述格式转换处理器具体用于：

获取所述中间虚拟地址对应的像素坐标；

根据所述像素坐标获取所述第二虚拟地址。
根据权利要求14至20任一项所述的装置，其特征在于，所述第一格式的图像数据为所述GPU需读取的压缩数据，所述压缩数据包括多个压缩图形块；

所述格式转换处理器具体用于：

获取所述中间虚拟地址对应的像素坐标；

根据所述像素坐标获取所述中间虚拟地址对应的目标压缩图形块的压缩偏移信息；

根据所述压缩偏移信息计算得到所述第二虚拟地址；

所述格式转换处理器还用于：

对读取的所述目标压缩图形块进行解压缩。
根据权利要求14至20任一项所述的装置，其特征在于，所述第一格式的图像数据为所述GPU待写入的压缩数据；所述格式转换处理器用于：

获取所述中间虚拟地址对应的像素坐标；

根据所述像素坐标获取所述待写入的压缩数据的头数据的地址；

根据所述头数据的地址获取所述第二虚拟地址。
根据权利要求14至20任一项所述的装置，其特征在于，所述格式转换处理器用于：

获取所述中间虚拟地址对应的像素坐标；

获取所述像素坐标对应的像素的签名；

根据所述签名获取与所述签名对应的所述第二虚拟地址；

若所述第一格式的图像数据为所述GPU需读取的加密数据，所述格式转换处理器还用于：

对读取的图像数据进行解密，将解密后的图像数据发送给所述GPU。
一种图形处理方法，其特征在于，包括：

获取待访问的第一虚拟地址，所述第一虚拟地址属于第一虚拟地址空间；

将所述第一虚拟地址翻译成中间虚拟地址，所述中间虚拟地址属于第二虚拟地址空间，所述中间虚拟地址在所述第二虚拟地址空间中能够被映射为第二虚拟地址；

其中，所述第二虚拟地址空间不同于所述第一虚拟地址空间，所述第二虚拟地址空间和所述第一虚拟地址空间映射到相同的第一物理地址空间，所述第一虚拟地址所映射的物理地址对应第一格式的图像数据，所述第二虚拟地址所映射的物理地址对应第二格式的图像数据。
根据权利要求25所述的方法，其特征在于，所述将所述第一虚拟地址翻译成中间虚拟地址，具体包括：

根据第一映射关系得到所述第一虚拟地址在所述第二虚拟地址空间中对应的所述中间虚拟地址，所述第一映射关系为所述第一虚拟地址空间和所述第二虚拟地址空间的映射关系。
一种图形处理器GPU，其特征在于，所述GPU包括传输接口和存储器管理单元MMU，其中：

所述传输接口，用于获取待访问的第一虚拟地址，所述第一虚拟地址属于第一虚拟地址空间；

所述MMU，用于将所述第一虚拟地址翻译成中间虚拟地址，所述中间虚拟地址属于第二虚拟地址空间，所述中间虚拟地址在所述第二虚拟地址空间中能够被映射为第二虚拟地址；

其中，所述第二虚拟地址空间不同于所述第一虚拟地址空间，所述第二虚拟地址空间和所述第一虚拟地址空间映射到相同的第一物理地址空间，所述第一虚拟地址所映射的物理地址对应第一格式的图像数据，所述第二虚拟地址所映射的物理地址对应第二格式的图像数据。
根据权利要求27所述的GPU，其特征在于，所述MMU，具体用于：

根据第一映射关系得到所述第一虚拟地址在所述第二虚拟地址空间中对应的所述中间虚拟地址，所述第一映射关系为所述第一虚拟地址空间和所述第二虚拟地址空间的映射关系。