CN117678219A

CN117678219A - 基于时间预测的顶点位置压缩

Info

Publication number: CN117678219A
Application number: CN202380011075.7A
Authority: CN
Inventors: 田军; 黄超; 张翔; 许晓中; 刘杉
Original assignee: Tencent America LLC
Current assignee: Tencent America LLC
Priority date: 2022-05-25
Filing date: 2023-04-04
Publication date: 2024-03-08
Also published as: WO2023229727A1; KR20240065141A; JP2024533458A; US20230388543A1

Abstract

确定网格的当前帧中的当前顶点的多个相邻顶点。当前帧对应于第一个时刻处的网格。多个相邻顶点中的每一个通过网格中的相应边连接到当前顶点。确定多个相邻顶点的多个相邻估计误差。多个相邻估计误差中的每一个指示多个相邻顶点中的一个对应相邻顶点在参考帧中的参考顶点与当前帧中的所述多个相邻顶点中的一个对应相邻顶点之间的差。参考帧对应于第二时刻处的网格。基于多个相邻估计误差来确定当前顶点的预测残差。基于确定的预测残差来生成当前顶点的预测信息。

Description

基于时间预测的顶点位置压缩

引用并入

本申请要求于2023年3月28日提交的美国专利申请第18/127,487号“基于时间预测的顶点位置压缩”的优先权，该申请要求于2022年5月25日提交的美国临时申请第63/345,824号“基于时间预测的顶点位置压缩”的优先权。在先申请的公开内容通过引用整体并入本文。

技术领域

本申请的公开包括涉及网格处理的实施例。

背景技术

本文所提供的背景描述旨在整体呈现本申请的背景。在背景技术部分以及本说明书的各个方面中所描述的目前已署名的发明人的工作所进行的程度，并不表明其在本申请提交时作为现有技术，且从未明示或暗示其被承认为本申请的现有技术。

三维(3D)采集、建模和渲染的进步促进了3D内容在各种平台和设备上的普遍存在。如今，可以采集到婴儿在一个大陆的第一步，让婴儿的祖父母看到(在某些情况下互动)，并在另一个大陆与孩子一起享受完全身临其境的体验。为了实现这种真实感，模型变得越来越复杂，大量数据与这些模型的创建和使用相关联。3D网格被广泛用于表示这种沉浸式内容。

发明内容

本公开的各方面提供了网格处理的方法和装置。在一些示例中，网格处理的装置包括处理电路。

根据本公开的一个方面，提供了一种网格处理的方法，在视频编码器中。在该方法中，在二维模型和三维模型之一的网格的当前帧中，确定当前顶点的多个相邻顶点。所述多个相邻顶点和所述当前顶点被包括在所述当前帧中并且对应于第一时刻处的所述网格。所述多个相邻顶点中的每一个通过所述网格中的相应边连接到所述当前顶点。确定所述当前顶点的所述多个相邻顶点的多个相邻估计误差。所述多个相邻估计误差中的每一个，指示所述多个相邻顶点中的一个对应相邻顶点在所述网格的参考帧中的参考顶点与所述当前帧中的所述多个相邻顶点中的所述一个对应相邻顶点之间的差。所述参考帧对应于第二时刻处的所述网格。基于所述多个相邻顶点的所述多个相邻估计误差，确定所述当前顶点的预测残差。基于所述当前顶点的确定的所述预测残差，生成所述当前顶点的预测信息。

在一些实施例中，所述多个相邻顶点中的所述一个对应相邻顶点的所述参考顶点被定位在所述参考帧中与所述当前帧中的所述当前顶点相同的相对位置处，所述参考帧和所述当前帧在不同的时刻生成。

在一个示例中，确定多个相邻估计误差的平均相邻估计误差。基于平均相邻估计误差确定当前顶点的预测残差。

在一个示例中，为了确定当前顶点的预测残差，基于所述当前顶点的参考顶点与所述当前顶点之间的差来确定所述当前顶点的估计误差。确定所述当前顶点的预测列表。所述预测列表的预测因子包括所述当前顶点的所述估计误差、在所述当前顶点的所述估计误差之后的所述平均相邻估计误差，以及在所述平均相邻估计误差之后的所述多个相邻估计误差。各个预测索引与所述预测列表中的每个预测因子相关联。

在一些实施例中，基于边缘断路器Edgebreaker算法对所述多个相邻顶点进行排序，在所述Edgebreaker算法中，以螺旋三角形生成树顺序遍历所述多个相邻顶点。

在一个示例中，为了确定当前顶点的预测残差，确定平均相邻估计误差与当前顶点的估计误差之间的差。还确定多个相邻估计误差中的每一个与当前顶点的估计误差之间的差。从平均相邻估计误差和多个相邻估计误差中选择相邻估计误差。选择的相邻估计误差具有最小差。将当前顶点的预测残差确定为(i)当前顶点的估计误差和(ii)所选择的相邻估计误差之一。

在一个示例中，为了确定当前顶点的预测残差，根据帧间预测，基于所述当前顶点的所述多个相邻顶点中的一者确定预测误差。将预测误差与预测列表中的每个预测因子进行比较。响应于预测误差小于预测列表中的预测因子，将预测残差确定为预测误差。

在一个示例中，为了确定当前顶点的预测残差，将预测残差确定为混合估计误差。混合估计误差包括(i)选择的相邻估计误差和预测误差的平均值和(ii)当前顶点的估计误差与预测误差的平均值之一。

在一个实施例中，帧间预测还包括增量预测中的一个，该增量预测基于第一预测顶点和当前顶点之间的差，其中第一预测顶点包括当前顶点的多个相邻顶点之一。帧间预测还可以包括平行四边形预测，其中基于网格的多个三角形中的预测三角形来确定第二预测顶点。预测三角形与包括当前顶点的多个三角形中的一个三角形共享边。所述第二预测顶点与所述共享边相对，所述第三预测顶点与预测三角形形成平行四边形。

在一个实施例中，当前顶点的预测信息还包括标志。该标志指示所述预测残差是以下中的一者：(i)基于所述标志的第一值的所述当前顶点的所述估计误差或所述选择的相邻估计误差，(ii)基于所述标志的第二值的所述预测误差，以及(iii)基于所述标志的第三值的所述混合估计误差。

在一个实施例中，当前顶点的预测信息还包括索引信息，该索引信息基于所述标志为所述第一值，指示所述预测列表中的哪个预测因子是所述预测残差。预测信息还包括预测残差信息。在一个示例中，基于所述标志为所述第一值，预测残差信息指示(i)所述当前顶点的所述估计误差，响应于所述索引信息指示所述预测残差是所述当前顶点的所述估计误差，以及(ii)所述选择的相邻估计误差，响应于所述索引信息指示所述预测残差是所述选择的相邻估计误差。基于作为第二值的标志，预测残差信息指示所述当前顶点与由所述预测误差指示的预测顶点之间的差。基于作为第三值的标志，预测残差信息指示当前顶点与由混合估计误差指示的预测顶点之间的差。

根据本公开的另一个方面，提供了一种装置。该装置包括处理电路。处理电路可以被配置为执行网格处理的任何所描述的方法。

本公开的各方面还提供了一种存储指令的非瞬态计算机可读介质，当由计算机执行用于视频解码时，该指令使计算机执行网格处理的任何所述方法。

附图说明

从以下详细描述和附图中，所公开的主题的其它特征、性质以及各种优点将更加明显。

图1是通信系统(100)的示例性框图。

图2是解码器的示例性框图。

图3是编码器的示例性框图。

图4是根据本公开的一些实施例的网格中的顶点的示意图。

图5是根据本公开的一些实施例的示例性顶点位置压缩的示意图。

图6A示出了边缘断路器(Edgebreaker)算法的五个面片配置的示例。

图6B示出了根据边缘断路器算法的示例性网格遍历。

图7示出了概述根据本公开的一些实施例的方法的流程图。

图8示出了概述根据本公开的一些实施例的另一方法的流程图。

图9是根据一个实施例的计算机系统的示意图。

具体实施方式

图1示出了一些实施例的视频处理系统(100)的框图。视频处理系统(100)是所公开的主题(流式环境中的视频编码器和视频解码器)的应用的示例。本申请所公开主题可同等地适用于其它支持图像和视频的应用，包括例如视频会议、数字TV、流服务、在包括CD、DVD、存储棒等的数字介质上存储压缩视频等等。

视频处理系统(100)可包括采集子系统(113)，所述采集子系统可包括视频源(101)。视频源(101)包括一个或多个图像，所述图像由相机采集或者由计算机生成。例如，数码相机创建未压缩的视频图片流(102)。在实施例中，视频图片流(102)包括由数码相机拍摄的样本。相较于已编码的视频数据(104)(或已编码的视频码流)，视频图片流(102)被描绘为粗线以强调高数据量的视频图片流，视频图片流(102)可由电子装置(120)处理，所述电子装置(120)包括耦接到视频源(101)的视频编码器(103)。视频编码器(103)可包括硬件、软件或软硬件组合以实现或实施如下文更详细地描述的所公开主题的各方面。相较于视频图片流(102)，已编码的视频数据(104)(或已编码的视频码流)被描绘为细线以强调较低数据量的已编码的视频数据(104)(或已编码的视频码流(104))，其可存储在流式传输服务器(105)上以供将来使用。一个或多个流式传输客户端子系统，例如图1中的客户端子系统(106)和客户端子系统(108)，可访问流式传输服务器(105)以检索已编码的视频数据(104)的副本(107)和副本(109)。客户端子系统(106)可包括例如电子装置(130)中的视频解码器(110)。视频解码器(110)对已编码的视频数据的传入副本(107)进行解码，且产生可在显示器(112)(例如显示屏)或另一呈现装置(未描绘)上呈现的输出视频图片流(111)。在一些流式传输系统中，可根据某些视频编码/压缩标准对已编码的视频数据(104)、视频数据(107)和视频数据(109)(例如视频码流)进行编码。该些标准的实施例包括ITU-T H.265。在实施例中，正在开发的视频编码标准非正式地称为下一代视频编码(Versatile VideoCoding，VVC)，本申请可用于VVC标准的上下文中。

应注意，电子装置(120)和电子装置(130)可包括其它组件(未示出)。举例来说，电子装置(120)可包括视频解码器(未示出)，且电子装置(130)还可包括视频编码器(未示出)。

图2是视频解码器(210)的框图。视频解码器(210)可设置在电子装置(230)中。电子装置(230)可包括接收器(231)。接收器(231)可包括接收电路，例如网络接口电路。视频解码器(210)可用于代替图1实施例中的视频解码器(110)。

接收器(231)可接收将由视频解码器(210)解码的一个或多个已编码视频序列；在实施例中，一次接收一个已编码视频序列，其中每个已编码视频序列的解码独立于其它已编码视频序列的解码。可从信道(201)接收已编码视频序列，所述信道可以是通向存储已编码的视频数据的存储装置的硬件/软件链路。接收器(231)可接收已编码的视频数据以及其它数据，例如，可转发到它们各自的使用实体(未标示)的已编码音频数据和/或辅助数据流。接收器(231)可将已编码视频序列与其它数据分开。为了防止网络抖动，缓冲存储器(215)可耦接在接收器(231)与熵解码器/解析器(220)(此后称为“解析器(220)”)之间。在某些应用中，缓冲存储器(215)是视频解码器(210)的一部分。在其它情况下，所述缓冲存储器(215)可设置在视频解码器(210)外部(未标示)。而在其它情况下，视频解码器(210)的外部设置缓冲存储器(未标示)以例如防止网络抖动，且在视频解码器(210)的内部可配置另一缓冲存储器(215)以例如处理播出定时。而当接收器(231)从具有足够带宽和可控性的存储/转发装置或从等时同步网络接收数据时，也可能不需要配置缓冲存储器(215)，或可以将所述缓冲存储器做得较小。当然，为了在互联网等业务分组网络上使用，也可能需要缓冲存储器(215)，所述缓冲存储器可相对较大且可具有自适应性大小，且可至少部分地实施于操作系统或视频解码器(210)外部的类似元件(未标示)中。

视频解码器(210)可包括解析器(220)以根据已编码视频序列重建符号(221)。这些符号的类别包括用于管理视频解码器(210)的操作的信息，以及用以控制显示装置(212)(例如，显示屏)等显示装置的潜在信息，所述显示装置不是电子装置(230)的组成部分，但可耦接到电子装置(230)，如图2中所示。用于显示装置的控制信息可以是辅助增强信息(Supplemental Enhancement Information，SEI消息)或视频可用性信息(VideoUsability Information，VUI)的参数集片段(未标示)。解析器(220)可对接收到的已编码视频序列进行解析/熵解码。已编码视频序列的编码可根据视频编码技术或标准进行，且可遵循各种原理，包括可变长度编码、霍夫曼编码(Huffman coding)、具有或不具有上下文灵敏度的算术编码等等。解析器(220)可基于对应于群组的至少一个参数，从已编码视频序列提取用于视频解码器中的像素的子群中的至少一个子群的子群参数集。子群可包括图片群组(Group of Pictures，GOP)、图片、图块、切片、宏块、编码单元(Coding Unit，CU)、块、变换单元(Transform Unit，TU)、预测单元(Prediction Unit，PU)等等。解析器(220)还可从已编码视频序列提取信息，例如变换系数、量化器参数值、运动矢量等等。

解析器(220)可对从缓冲存储器(215)接收的视频序列执行熵解码/解析操作，从而创建符号(221)。

取决于已编码视频图片或一部分已编码视频图片(例如：帧间图片和帧内图片、帧间块和帧内块)的类型以及其它因素，符号(221)的重建可涉及多个不同单元。涉及哪些单元以及涉及方式可由解析器(220)从已编码视频序列解析的子群控制信息控制。为了简洁起见，未描述解析器(220)与下文的多个单元之间的此类子群控制信息流。

除已经提及的功能块以外，视频解码器(210)可在概念上细分成如下文所描述的数个功能单元。在商业约束下运行的实际实施例中，这些单元中的许多单元彼此紧密交互并且可以彼此集成。然而，出于描述所公开主题的目的，概念上细分成下文的功能单元是适当的。

第一单元是缩放器/逆变换单元(251)。缩放器/逆变换单元(251)从解析器(220)接收作为符号(221)的量化变换系数以及控制信息，包括使用哪种变换方式、块大小、量化因子、量化缩放矩阵等。缩放器/逆变换单元(251)可输出包括样本值的块，所述样本值可输入到聚合器(255)中。

在一些情况下，缩放器/逆变换单元(251)的输出样本可属于帧内编码块。帧内编码块为不使用来自先前重建的图片的预测性信息，但可使用来自当前图片的先前重建部分的预测性信息的块。此类预测性信息可由帧内图片预测单元(252)提供。在一些情况下，帧内图片预测单元(252)采用从当前图片缓冲器(258)提取的已重建信息生成大小和形状与正在重建的块相同的周围块。举例来说，当前图片缓冲器(258)缓冲部分重建的当前图片和/或完全重建的当前图片。在一些情况下，聚合器(255)基于每个样本，将帧内预测单元(252)生成的预测信息添加到由缩放器/逆变换单元(251)提供的输出样本信息中。

在其它情况下，缩放器/逆变换单元(251)的输出样本可属于帧间编码和潜在运动补偿块。在此情况下，运动补偿预测单元(253)可访问参考图片存储器(257)以提取用于预测的样本。在根据符号(221)对提取的样本进行运动补偿之后，这些样本可由聚合器(255)添加到缩放器/逆变换单元(251)的输出(在这种情况下被称作残差样本或残差信号)，从而生成输出样本信息。运动补偿预测单元(253)从参考图片存储器(257)内的地址获取预测样本可受到运动矢量控制，且所述运动矢量以所述符号(221)的形式而供运动补偿预测单元(253)使用，所述符号(221)例如是包括X、Y和参考图片分量。运动补偿还可包括在使用子样本精确运动矢量时，从参考图片存储器(257)提取的样本值的内插、运动矢量预测机制等等。

聚合器(255)的输出样本可在环路滤波器单元(256)中被各种环路滤波技术采用。视频压缩技术可包括环路内滤波器技术，所述环路内滤波器技术受控于包括在已编码视频序列(也称作已编码视频码流)中的参数，且所述参数作为来自解析器(220)的符号(221)可用于环路滤波器单元(256)。视频压缩还可响应于在解码已编码图片或已编码视频序列的先前(按解码次序)部分期间获得的元信息，以及响应于先前重建且经过环路滤波的样本值。

环路滤波器单元(256)的输出可以是样本流，所述样本流可输出到显示装置(212)以及存储在参考图片存储器(257)，以用于后续的帧间图片预测。

一旦完全重建，某些已编码图片就可用作参考图片以用于将来预测。举例来说，一旦对应于当前图片的已编码图片被完全重建，且已编码图片(通过例如解析器(220))被识别为参考图片，则当前图片缓冲器(258)可变为参考图片存储器(257)的一部分，且可在开始重建后续已编码图片之前重新分配新的当前图片缓冲器。

视频解码器(210)可根据预定视频压缩技术或者例如ITU-T H.265的标准执行解码操作。在已编码视频序列遵循视频压缩技术或标准的语法以及视频压缩技术或标准中记录的配置文件的意义上，已编码视频序列可符合所使用的视频压缩技术或标准指定的语法。具体地说，配置文件可从视频压缩技术或标准中可用的所有工具中选择某些工具作为在所述配置文件下可供使用的仅有工具。对于合规性，还要求已编码视频序列的复杂度处于视频压缩技术或标准的层级所限定的范围内。在一些情况下，层级限制最大图片大小、最大帧率、最大重建取样率(以例如每秒兆(mega)个样本为单位进行测量)、最大参考图片大小等。在一些情况下，由层级设定的限制可通过假想参考解码器(Hypothetical ReferenceDecoder，HRD)规范和在已编码视频序列中用信号表示的HRD缓冲器管理的元数据来进一步限定。

在实施例中，接收器(231)可连同已编码视频一起接收附加(冗余)数据。所述附加数据可以是已编码视频序列的一部分。所述附加数据可由视频解码器(210)用以对数据进行适当解码和/或较准确地重建原始视频数据。附加数据可呈例如时间、空间或信噪比(signal noise ratio，SNR)增强层、冗余切片、冗余图片、前向纠错码等形式。

图3是视频编码器(303)的框图。视频编码器(303)设置于电子装置(320)中。电子装置(320)包括传输器(340)(例如传输电路)。视频编码器(303)可用于代替图1实施例中的视频编码器(403)。

视频编码器(303)可从视频源(301)(并非图3实施例中的电子装置(320)的一部分)接收视频样本，所述视频源可采集将由视频编码器(303)编码的视频图像。在另一实施例中，视频源(301)是电子装置(320)的一部分。

视频源(301)可提供将由视频编码器(303)编码的呈数字视频样本流形式的源视频序列，所述数字视频样本流可具有任何合适位深度(例如：8位、10位、12位……)、任何色彩空间(例如BT.601Y CrCB、RGB……)和任何合适取样结构(例如Y CrCb4:2:0、Y CrCb 4:4:4)。在媒体服务系统中，视频源(301)可以是存储先前已准备的视频的存储装置。在视频会议系统中，视频源(301)可以是采集本地图像信息作为视频序列的相机。可将视频数据提供为多个单独的图片，当按顺序观看时，这些图片被赋予运动。图片自身可构建为空间像素阵列，其中取决于所用的取样结构、色彩空间等，每个像素可包括一个或多个样本。下文侧重于描述样本。

根据实施例，视频编码器(303)可实时或在所要求的任何其它时间约束下，将源视频序列的图片编码且压缩成已编码视频序列(343)。施行适当的编码速度是控制器(350)的一个功能。在一些实施例中，控制器(350)控制如下文所描述的其它功能单元且在功能上耦接到这些单元。为了简洁起见，图中未标示耦接。由控制器(350)设置的参数可包括速率控制相关参数(图片跳过、量化器、率失真优化技术的λ值等)、图片大小、图片群组(group ofpictures，GOP)布局，最大运动矢量搜索范围等。控制器(350)可用于具有其它合适的功能，这些功能涉及针对某一系统设计优化的视频编码器(303)。

在一些实施例中，视频编码器(303)在编码环路中进行操作。作为简单的描述，在实施例中，编码环路可包括源编码器(330)(例如，负责基于待编码的输入图片和参考图片创建符号，例如符号流)和嵌入于视频编码器(303)中的(本地)解码器(333)。解码器(333)以类似于(远程)解码器创建样本数据的方式重建符号以创建样本数据。将重建的样本流(样本数据)输入到参考图片存储器(334)。由于符号流的解码产生与解码器位置(本地或远程)无关的位精确结果，因此参考图片存储器(334)中的内容在本地编码器与远程编码器之间也是按比特位精确对应的。换句话说，编码器的预测部分“看到”的参考图片样本与解码器将在解码期间使用预测时所“看到”的样本值完全相同。这种参考图片同步性基本原理(以及在例如因信道误差而无法维持同步性的情况下产生的漂移)也用于一些相关技术。

“本地”解码器(333)的操作可与例如已在上文结合图2详细描述视频解码器(210)的“远程”解码器相同。然而，另外简要参考图2，当符号可用且熵编码器(345)和解析器(220)能够无损地将符号编码/解码为已编码视频序列时，包括缓冲存储器(215)和解析器(220)在内的视频解码器(210)的熵解码部分，可能无法完全在本地解码器(333)中实施。

在一个实施例中，除存在于解码器中的解析/熵解码之外，解码器技术以相同或者基本上相同的功能形式存在于对应的编码器中。出于此原因，本申请侧重于解码器操作。可简化编码器技术的描述，因为编码器技术与全面地描述的解码器技术互逆。在某些领域，下文提供了更详细的描述。

在操作期间，在一些实施例中，源编码器(330)可执行运动补偿预测编码。参考来自视频序列中被指定为“参考图片”的一个或多个先前已编码图片，所述运动补偿预测编码对输入图片进行预测性编码。以此方式，编码引擎(332)对输入图片的像素块与参考图片的像素块之间的差异进行编码，所述参考图片可被选作所述输入图片的预测参考。

本地视频解码器(333)可基于源编码器(330)创建的符号，对可指定为参考图片的图片的已编码视频数据进行解码。编码引擎(332)的操作可为有损过程。当已编码视频数据可在视频解码器(图3中未示)处被解码时，重建的视频序列通常可以是带有一些误差的源视频序列的副本。本地视频解码器(333)复制解码过程，所述解码过程可由视频解码器对参考图片执行，且可使重建的参考图片存储在参考图片高速缓存(334)中。以此方式，视频编码器(303)可在本地存储重建的参考图片的副本，所述副本与将由远端视频解码器获得的重建参考图片具有共同内容(不存在传输误差)。

预测器(335)可针对编码引擎(332)执行预测搜索。即，对于将要编码的新图片，预测器(335)可在参考图片存储器(334)中搜索可作为所述新图片的适当预测参考的样本数据(作为候选参考像素块)或某些元数据，例如参考图片运动矢量、块形状等。预测器(335)可基于样本块逐像素块操作，以找到合适的预测参考。在一些情况下，根据预测器(335)获得的搜索结果，可确定输入图片可具有从参考图片存储器(334)中存储的多个参考图片取得的预测参考。

控制器(350)可管理源编码器(330)的编码操作，包括例如设置用于对视频数据进行编码的参数和子群参数。

可在熵编码器(345)中对所有上述功能单元的输出进行熵编码。熵编码器(345)根据例如霍夫曼编码、可变长度编码、算术编码等技术对各种功能单元生成的符号进行无损压缩，从而将所述符号转换成已编码视频序列。

传输器(340)可缓冲由熵编码器(345)创建的已编码视频序列，从而为通过通信信道(360)进行传输做准备，所述通信信道可以是通向将存储已编码的视频数据的存储装置的硬件/软件链路。传输器(340)可将来自视频编码器(303)的已编码视频数据与要传输的其它数据合并，所述其它数据例如是已编码音频数据和/或辅助数据流(未示出来源)。

控制器(350)可管理视频编码器(303)的操作。在编码期间，控制器(350)可以为每个已编码图片分配某一已编码图片类型，但这可能影响可应用于相应的图片的编码技术。例如，通常可将图片分配为以下任一种图片类型：

帧内图片(I图片)，其可以是不将序列中的任何其它图片用作预测源就可被编码和解码的图片。一些视频编解码器容许不同类型的帧内图片，包括例如独立解码器刷新(Independent Decoder Refresh，“IDR”)图片。所属领域的技术人员了解I图片的变体及其相应的应用和特征。

预测性图片(P图片)，其可以是可使用帧内预测或帧间预测进行编码和解码的图片，所述帧内预测或帧间预测使用至多一个运动矢量和参考索引来预测每个块的样本值。

双向预测性图片(B图片)，其可以是可使用帧内预测或帧间预测进行编码和解码的图片，所述帧内预测或帧间预测使用至多两个运动矢量和参考索引来预测每个块的样本值。类似地，多个预测性图片可使用多于两个参考图片和相关联元数据以用于重建单个块。

源图片通常可在空间上细分成多个样本块(例如，4×4、8×8、4×8或16×16个样本的块)，且逐块进行编码。这些块可参考其它(已编码)块进行预测编码，根据应用于块的相应图片的编码分配来确定所述其它块。举例来说，I图片的块可进行非预测编码，或所述块可参考同一图片的已经编码的块来进行预测编码(空间预测或帧内预测)。P图片的像素块可参考一个先前编码的参考图片通过空间预测或通过时域预测进行预测编码。B图片的块可参考一个或两个先前编码的参考图片通过空间预测或通过时域预测进行预测编码。

视频编码器(303)可根据例如ITU-T H.265建议书的预定视频编码技术或标准执行编码操作。在操作中，视频编码器(303)可执行各种压缩操作，包括利用输入视频序列中的时间和空间冗余的预测编码操作。因此，已编码视频数据可符合所用视频编码技术或标准指定的语法。

在实施例中，传输器(340)可在传输已编码的视频时传输附加数据。源编码器(330)可将此类数据作为已编码视频序列的一部分。附加数据可包括时间/空间/SNR增强层、冗余图片和切片等其它形式的冗余数据、SEI消息、VUI参数集片段等。

采集到的视频可作为呈时间序列的多个源图片(视频图片)。帧内图片预测(常常简化为帧内预测)利用给定图片中的空间相关性，而帧间图片预测则利用图片之间的(时间或其它)相关性。在实施例中，将正在编码/解码的特定图片分割成块，正在编码/解码的特定图片被称作当前图片。在当前图片中的块类似于视频中先前已编码且仍被缓冲的参考图片中的参考块时，可通过称作运动矢量的矢量对当前图片中的块进行编码。所述运动矢量指向参考图片中的参考块，且在使用多个参考图片的情况下，所述运动矢量可具有识别参考图片的第三维度。

在一些实施例中，双向预测技术可用于帧间图片预测中。根据双向预测技术，使用两个参考图片，例如按解码次序都在视频中的当前图片之前(但按显示次序可能分别是过去和将来)第一参考图片和第二参考图片。可通过指向第一参考图片中的第一参考块的第一运动矢量和指向第二参考图片中的第二参考块的第二运动矢量对当前图片中的块进行编码。具体来说，可通过第一参考块和第二参考块的组合来预测所述块。

此外，合并模式技术可用于帧间图片预测中以改善编码效率。

根据本申请公开的一些实施例，帧间图片预测和帧内图片预测等预测的执行以例如多边形或者三角形的块为单位。举例来说，根据HEVC标准，将视频图片序列中的图片分割成编码树单元(coding tree unit，CTU)以用于压缩，图片中的CTU具有相同大小，例如64×64像素、32×32像素或16×16像素。一般来说，CTU包括三个编码树块(coding tree block，CTB)，所述三个编码树块是一个亮度CTB和两个色度CTB。更进一步的，还可将每个CTU以四叉树拆分为一个或多个编码单元(coding unit，CU)。举例来说，可将64×64像素的CTU拆分为一个64×64像素的CU，或4个32×32像素的CU，或16个16×16像素的CU。在实施例中，分析每个CU以确定用于CU的预测类型，例如帧间预测类型或帧内预测类型。此外，取决于时间和/或空间可预测性，将CU拆分为一个或多个预测单元(prediction unit，PU)。通常，每个PU包括亮度预测块(prediction block，PB)和两个色度PB。在实施例中，编码(编码/解码)中的预测操作以预测块为单位来执行。以亮度预测块作为预测块为例，预测块包括像素值(例如，亮度值)的矩阵，例如8×8像素、16×16像素、8×16像素、16×8像素等等。

可使用任何合适的技术来实施视频编码器(103)和视频编码器(303)，以及视频解码器(110)和视频解码器(210)。在实施例中，可使用一个或多个集成电路来实施视频编码器(103)和视频编码器(303)，以及视频解码器(110)和视频解码器(210)。在另一实施例中，可使用执行软件指令的一个或多个处理器来实施视频编码器(103)和视频编码器(303)，以及视频解码器(110)和视频解码器(210)。

本公开包括涉及使用时间预测的网格顶点位置压缩的方法和系统的实施例。

网格可以包括描述体积对象表面的若干多边形。网格的每个多边形可以由三维(3D)空间中对应多边形的顶点以及顶点如何连接的信息来定义，这些信息可以被称为连接性信息。在一些实施例中，诸如颜色、法线等顶点属性可以与网格顶点相关联。属性(或顶点属性)也可以通过利用映射信息而与网格的表面相关联，这些映射信息用二维(2D)属性图对网格进行参数化。这种映射通常可以通过与网格顶点相关联的一组参数坐标(称为UV坐标或纹理坐标)来描述。2D属性图可用于存储高分辨率属性信息，诸如纹理、法线、位移等。此类信息可用于诸如纹理映射和着色等各种目的。

动态网格序列可能需要大量数据，因为动态网格可能包括随时间变化的大量信息。因此，需要高效的压缩技术来存储和传输这些内容。诸如IC、MESHGRID和FAMC等网格压缩标准先前由MPEG开发，用于解决具有恒定连接性、时变几何形状和顶点属性的动态网格。然而，这些标准可能不考虑时变属性图和连接性信息。DCC(数字内容创建)工具通常生成这种动态网格。然而，对于体积采集技术来说，生成恒定连接性动态网格可能具有挑战性，尤其是在实时性约束的情况下。现有标准可能不支持这种类型的内容(例如，恒定连接性动态网格)。MPEG正计划制定一项新的网格压缩标准，以直接处理具有时变连接性信息和任选的时变属性图的动态网格。新的网格压缩标准针对诸如实时通信、存储、自由视点视频、增强现实(AR)和虚拟现实(VR)等各种应用的有损和无损压缩。也可以考虑诸如随机存取和可缩放/渐进编解码等功能。

网格几何信息可以包括顶点连接性信息、3D坐标和2D纹理坐标等。顶点3D坐标(其也可以称为顶点位置)的压缩可能是重要的，因为在许多情况下，顶点3D坐标的压缩可能会消耗整个几何相关数据的相当大部分。

在时刻t处的动态网格序列M可以表示为M(t)。如果存在从M(t)的顶点位置到另一时刻M(t₀)处的顶点位置的映射(或映射操作)f，则M(t)可以被称为位置循迹帧，其中t和t₀是不同的时刻。因此，M(t₀)可以被称为帧M(t)的参考帧，并且参考帧中的对应顶点可以被称为M(t)中的顶点的参考顶点。M(t)可以对应于第一时刻(如当前时刻)处的网格，且M(t₀)可以对应于第二时刻(如先前时刻)处的网格。

在本公开中，提出了用于顶点位置压缩的方法和/或系统。注意，这些方法和/或系统可以单独应用或以各种组合应用。此外，所公开的方法和系统不限于顶点位置压缩。所公开的方法和系统也可以应用于(例如)二维(2D)纹理坐标压缩或更通用的基于时间预测的方案。

对于位置循迹帧M(t)中的顶点V，顶点的邻居也可以是通过边连接到V的顶点，并且这些顶点被称为V的邻居顶点(或相邻顶点)。例如，如图4所示，顶点A可以具有四个邻居顶点，它们是C、D、E和B。顶点E可以具有五个邻居顶点，它们是A、B、F、H和D。

图5是根据本公开的一些实施例的示例性顶点位置压缩装置(500)的示意图。如图5所示，顶点位置压缩装置(500)可以包括：顶点排序模块(502)，其被配置为对网格的顶点进行排序；位置预测模块(504)，其被配置为计算顶点的预测位置；预测索引编码模块(506)，其被配置为对位置预测索引(或位置预测模式，如果需要的话)进行编码(或确定)；以及预测残差编码模块(508)，其被配置为对位置预测残差进行编码。应当注意，在顶点位置压缩装置(500)中处理的网格可以是3D网格或2D网格。例如，网格可以在3D坐标系(例如，x、y和z)或2D坐标系(例如，U和V)中表示。

本公开中的术语模块可以指软件模块、硬件模块或其组合。可以使用计算机编程语言来开发软件模块(例如，计算机程序)。可以使用处理电路和/或存储器来实现硬件模块。每个模块可以使用一个或多个处理器(或处理器和存储器)来实现。同样，处理器(或多个处理器和存储器)可用于实现一个或多个模块。此外，每个模块可以是包括模块功能的整个模块的一部分。

在本公开中，可以对位置循迹帧(或帧)M(t)的顶点进行排序。可以根据Edgebreaker算法或其他分区算法来遍历M(t)中的顶点的顺序。

图6A和图6B示出了基于Edgebreaker算法的帧M(t)中的三角形和顶点的示例性排序。图6A示出了Edgebreaker算法的五种示例性面片配置。如图6A所示，V是面片中心顶点，且T是当前三角形。每个面片中的活动门(或当前三角形)可以表示为T。在面片C中，可以提供围绕V扇形展开(或旋转)的完整三角形。在面片L中，可以将一个或多个缺失的三角形定位在活动门T的左侧。在面片R中，可以将一个或多个缺失的三角形定位在活动门T的右侧。在面片E中，V仅与T相邻。在面片S中，可以将一个或多个缺失的三角形定位在除了活动门T的左侧或右侧之外的位置。图6B示出了帧(600)的示例性遍历，其中可以基于Edgebreaker算法的遍历对帧(600)的三角形进行排序。如图6B所示，帧(600)中的三角形可以沿着螺旋三角形生成树(spanning－tree)遍历。例如，遍历可以从类型C(或面片C)的三角形(602)开始。然后，遍历可以沿着与三角形(例如，(602))的右边相邻的分支进行。当到达类型E(例如，(604))的三角形时，遍历可以停止。根据Edgebreaker算法，帧(600)的三角形可以按照CRSRLECRRRLE的顺序遍历(或排序)，如图6B所示。帧(600)的每个三角形中的顶点也可以基于三角形的顺序进行排序。

在本公开中，时间预测可以应用于基于参考帧中的参考顶点预测当前帧中的顶点。当前帧可以对应于第一时刻(诸如当前时刻)处的网格。参考帧可以对应于第二时刻(诸如先前时刻)处的网格。在一些实施例中，当前帧中的网格的顶点的连接性可以不同于参考帧中的网格的顶点的连接性。对于位置循迹帧(或当前帧)M(t)中的顶点V，顶点V的位置可以通过参考顶点f(V)在参考帧(例如，M(t₀)，t₀是与时刻t不同的时刻)中的位置来估计，其中f是M(t)与参考帧之间的映射操作。在一些实施例中，顶点V和参考帧中的参考顶点f(V)是同位的。因此，参考顶点在参考帧中可以具有与当前帧M(t)中的顶点相同的相对位置。当通过参考顶点f(V)预测顶点V时，估计误差E可以被确定为等式(1)中V的位置和f(V)的位置之间的差。

E＝V–f(V) 等式(1)

由于帧M(t)中的每个顶点都可以具有3D坐标，因此可以基于等式(1)提供估计误差E的3D坐标分量。例如，假设下标x、y、z表示xyz空间中的3D坐标，则可以在等式(2)至(4)中提供估计误差E的3D坐标分量。

E_x＝V_x–(f(V))_x 等式(2)

E_y＝V_y–(f(V))_y 等式(3)

E_z＝V_z–(f(V))_z 等式(4)

顶点V的估计误差E可以根据顶点V的邻居(或相邻顶点)预测或以其他方式确定。对于V的邻居顶点(或相邻顶点)，如果相邻顶点已被编码并可用于预测，则可以应用相邻顶点的估计误差来预测E。

假设V具有N个邻居顶点(或相邻顶点)V₁、V₂、……、V_N，这些顶点已被编码并可用于预测。在示例中，可以基于Edgebreaker算法或其他分区算法确定相邻顶点V₁、V₂、……、V_N的顺序。对于邻居顶点V_i，可以将邻居顶点V_i的估计误差确定为E_i＝V_i–f(V_i)，其中i＝1，2，……，N。f(V_i)可以是邻居顶点V_i在参考帧中的参考顶点。E_i也可以被称为与顶点V相关联的相邻估计误差，并且每个E_i可以是E的预测候选。如果在预测值(或预测候选)E_i中确定重复，则可以从列表E₁、E₂、……、E_N中去除这种重复。

如果N>＝2，则多于一个预测候选(或预测值)E_i是可用的。在实施例中，可以使用预测值E_i的平均值作为额外的预测因子，并将其设置为E₀。例如，E₀可以在等式(5)中定义如下：

E₀＝(E₁+E₂+…+E_N)/N 等式(5)

如果平均值E₀等于预测值E₁、E₂、……、E_N中的一者，则可以去除平均值或重复的预测值。

在编码器侧，可以将每个E_i与E进行比较，其中0<＝i<＝N。可以从E₀、E₁、E₂、……、E_N中选择估计误差。所选择的估计误差可以具有E与预测值(或预测的值或预测候选)E₀、E₁、E₂、……、E_N中的每一个之间的最小误差(或最小差)。在一些实施例中，最小误差可以通过L⁰范数、L¹范数、L²范数或一些其他范数来测量。例如，L⁰范数可以在等式(6)中确定如下：

其中E_x、E_y和E_z是E在xyz空间中的坐标，并且E_0x、E_0y和E_0z是E₀在xyz空间中的坐标。在示例中，所选择的估计误差可以是E_i中的对应于最小误差的一个。在示例中，所选择的估计误差可以是E本身。为方便起见，可以使用索引-1来表示E，诸如E_-1＝E。因此，可以将所选择的估计误差存储(或识别)为值在-1至N之间的索引。在解码器侧，可以对指示所选择的估计误差的选择索引进行解码，并且可以从预测因子E_-1、E₀、E₁、E₂、……、E_N的列表中恢复所选择的预测因子(或所选择的估计误差)。

在实施例中，可以设置上限M。上限M可以指示在预测列表中可以考虑(或应用)多少个预测候选。在示例中，如果N>M，则仅考虑前M个预测候选E₁、E₂、……、E_M来预测E。因此，E₀可以在等式(7)中定义如下：

E₀＝(E₁+E₂+…+E_M)/M 等式(7)

M可以是整数，如4。因此，可以考虑多达M(例如，4)个预测候选。注意，平均预测E₀可以放在候选列表中的不同位置。例如，平均预测E₀'可以是预测候选列表中的第一预测因子。在示例中，平均预测E₀'可以是预测候选列表中的最后一个预测因子。在示例中，平均预测E₀'可以位于预测值E₁'、E₂、……、E_M中。

可以应用帧内预测来预测顶点位置V。帧内预测可以是增量预测、平行四边形预测等。在增量预测中，预测因子可以被确定为顶点V的相邻顶点。在平行四边形预测中，可以基于网格的多个三角形中的预测三角形来确定预测顶点。预测三角形与包括顶点V的多个三角形中的一个三角形共享边。预测顶点可以与共享边相对。预测顶点和预测三角形可以形成平行四边形。

可以将来自帧内预测的预测误差与所选择的估计误差E_i进行比较，其中-1<＝i<＝N。帧内预测的预测误差可以指示顶点V的真实位置和基于帧内预测的预测位置值。当帧内预测提供较小的误差(例如，预测误差小于所选择的估计误差)时，则使用帧内预测，并且可以发信号通知帧内预测模式。否则，当帧内预测提供的误差大于所选择的估计误差E_i时，可以使用时间预测，并且可以发信号通知帧间预测模式(例如，时间预测)。

可以应用混合预测来预测顶点V的位置。例如，可以应用帧内预测和时间预测的平均值作为顶点位置V的预测。

在本公开中，仅当存在多于一个预测候选时，才需要对预测索引进行编码。例如，当两个或更多个预测候选可用于当前顶点时，可以在编码器侧对指示所选择的预测候选的索引进行编码。在解码器侧，解码器可以按照与编码器相同的顺序确定两个或更多个预测候选。解码器可以对已编码的预测索引进行解码，并且基于来自两个或更多个预测候选的预测索引来重建所选择的预测候选。

在实施例中，如果没有确定预测候选，或者仅确定一个预测候选，则可能不需要对预测索引进行编码。因此，预测值可以是当前顶点本身，也可以是唯一的预测候选。在实施例中，可以总是对预测索引进行编码，而不管有多少候选预测因子可用。当没有预测因子可用时，发信号通知的索引的值可能不会影响解码器侧的解码过程。

当针对当前顶点确定多于一个预测候选时，如N>＝1，可以使用固定长度编解码对预测索引进行编码。例如，如果针对当前顶点确定3个预测候选，则可能需要4个可能的预测索引0、1、2和3(0：指示候选1、2和3的平均值)。因此，可以应用两位二进制数来表示四个预测索引中的每一个。应当注意，三角形网格的不同顶点可以使用不同的固定长度。例如，如果另一顶点具有7个预测候选，则另一顶点可以使用三位二进制数用于预测索引表示。来自固定长度编解码的输出可以通过熵编解码(如算术编解码)进一步压缩。

替代地，可以使用可变长度编解码对预测索引进行编码。例如，如果针对当前顶点确定4个预测候选，则可能需要5个可能的预测索引0、1、2、3和4。可以分配可变长度码0、100、101、110和111来分别表示5个预测索引0、1、2、3和4。替代地，可以应用可变长度码1、01、001、0001和00001来分别表示0，1，2，3和4的5个预测索引。注意，三角形网格的不同顶点可以使用不同的可变长度。来自可变长度编码的输出可以通过熵编码(如算术编码)进一步压缩。

当上限M被设置为限制预测候选的最大数量时，并且如果多于M个预测候选可用于顶点V，则只有前M个预测候选可用于预测顶点V。因此，可以对(M+1)个可能的预测索引进行编码，其中M表示前M个预测候选，且1表示前M个预测候选的平均值。如果在预测值中确定出重复项，则可以去除重复项。因此，还可以降低预测索引的可能性。预测索引可以通过固定长度编码、可变长度编码、差分编码等进行编码。

当帧内预测也是预测候选时，可以使用一位二进制标志来发信号通知位置预测模式。位置预测模式可以指示是应用帧间预测(例如，时间预测)还是应用帧内预测。

当帧内预测和帧间预测的平均值也是预测候选时，可以使用3符号标志来发信号通知位置预测模式。位置预测模式可以指示是应用帧间预测、帧内预测还是应用帧内预测和帧间预测的平均值。

在本公开中，可以对顶点位置的预测残差进行编码(或确定)。当应用时间预测时，如果预测索引j是-1(-1：意味着E本身)，则预测残差可以被确定为E(例如，V－f(V))。因此，顶点V可以被重建为V＝f(V)+E。否则(例如，索引是0，或者1、2、……N中的一者)，预测残差可以被确定为E－E_j，其中j是预测索引。因此，E可以恢复为E＝E_j+预测残差(例如，E－E_j)，且顶点V可以进一步被重建为V＝f(V)+(E_j+(E－E_j))。

当应用帧内预测时，预测残差可以被确定为顶点V的真实位置值与预测位置值之间的差。

当应用帧内预测和帧间预测的平均值时，预测残差可以被确定为顶点V的真实位置值与预测位置值之间的差。

在一些实施例中，可以使用诸如固定长度编解码、指数哥伦布编解码(exponential-Golomb coding)、算术编解码等编解码算法来对预测残差进行编码。在一些实施例中，预测残差可以经过压缩变换，如快速傅立叶变换(FFT)、离散余弦变换(DCT)、离散正弦变换(DST)、离散小波变换(DWT)等。可以使用诸如固定长度编解码、指数哥伦布编解码、算术编解码等编解码算法来对来自压缩变换的输出进行编码。

图7示出了概述根据本公开的实施例的方法(700)的流程图。方法(700)可以在诸如视频编码器等编码器中使用。在各种实施例中，方法(700)由处理电路执行，诸如执行视频编码器(103)的功能的处理电路、执行视频编码器(303)的功能的处理电路等。在一些实施例中，方法(700)以软件指令实现，因此当处理电路执行软件指令时，处理电路执行方法(700)。该方法开始于(S701)并进行到(S710)。

在(S710)处，在二维模型和三维模型之一的网格的当前帧中确定当前顶点的多个相邻顶点。当前顶点和多个相邻顶点被包括在当前帧中并且对应于第一时刻处的网格。多个相邻顶点中的每一个通过网格中的相应边连接到当前顶点。

在(S720)处，确定当前顶点的多个相邻顶点的多个相邻估计误差。多个相邻估计误差中的每一个指示网格的参考帧中的多个相邻顶点中的一个对应相邻顶点的参考顶点与当前帧中的多个相邻顶点中的一个对应相邻顶点之间的差。参考帧对应于第二时刻处的网格。

在(S730)处，基于多个相邻顶点的多个相邻估计误差确定当前顶点的预测残差。

在(S740)处，基于当前顶点的确定的预测残差生成当前顶点的预测信息。

在一些实施例中，多个相邻顶点中的一个对应相邻顶点的参考顶点被定位在参考帧中与当前帧中的当前顶点相同的相对位置处，其中参考帧和当前帧在不同的时刻生成。

在示例中，确定多个相邻估计误差的平均相邻估计误差。基于平均相邻估计误差确定当前顶点的预测残差。

在示例中，为了确定当前顶点的预测残差，基于当前顶点的参考顶点与当前顶点之间的差来确定当前顶点的估计误差。确定当前顶点的预测列表。预测列表的预测因子包括当前顶点的估计误差、在当前顶点的估计误差之后的平均相邻估计误差，以及在平均相邻估计误差之后的多个相邻估计误差。各个预测索引与预测列表中的预测因子中的每一个相关联。

在一些实施例中，基于Edgebreaker算法对多个相邻顶点进行排序，在Edgebreaker算法中，以螺旋三角形生成树顺序遍历多个相邻顶点。

在示例中，为了确定当前顶点的预测残差，确定平均相邻估计误差与当前顶点的估计误差之间的差。还确定多个相邻估计误差中的每一个与当前顶点的估计误差之间的差。从平均相邻估计误差和多个相邻估计误差中选择相邻估计误差。所选择的相邻估计误差具有最小差。当前顶点的预测残差被确定为(i)当前顶点的估计误差和(ii)选择的相邻估计误差之一。

在示例中，为了确定当前顶点的预测残差，根据帧间预测，基于当前顶点的多个相邻顶点中的一者确定预测误差。将预测误差与预测列表中的预测因子中的每一个进行比较。响应于预测误差小于预测列表中的预测因子，将预测残差确定为预测误差。

在示例中，为了确定当前顶点的预测残差，将预测残差确定为混合估计误差。混合估计误差包括(i)所选择的相邻估计误差和预测误差的平均值和(ii)当前顶点的估计误差和预测误差的平均值中的一者。

在实施例中，帧间预测进一步包括基于第一预测顶点与当前顶点之间的差的增量预测中的一者，其中第一预测顶点包括当前顶点的多个相邻顶点中的一者。帧间预测还可以包括平行四边形预测，其中基于网格的多个三角形中的预测三角形确定第二预测顶点。预测三角形与包括当前顶点的多个三角形中的一个三角形共享边。第二预测顶点与共享边相对，并且第二预测顶点和预测三角形形成平行四边形。

在实施例中，当前顶点的预测信息进一步包括标志。该标志指示预测残差是以下中的一者：(i)基于标志的第一值的当前顶点的估计误差或所选择的相邻估计误差，(ii)基于标志的第二值的预测误差，以及(iii)基于标志的第三值的混合估计误差。

在实施例中，当前顶点的预测信息进一步包括索引信息，其基于标志为第一值指示预测列表中的哪个预测因子是预测残差。预测信息还包括预测残差信息。在示例中，基于标志为第一值，预测残差信息指示(i)当前顶点的估计误差，响应于索引信息指示预测残差是当前顶点的估计误差，以及(ii)所选择的相邻估计误差，响应于索引信息指示预测残差是选择的相邻估计误差。基于标志为第二值，预测残差信息指示当前顶点与由预测误差指示的预测顶点之间的差。基于标志为第三值，预测残差信息指示当前顶点与由混合估计误差指示的预测顶点之间的差。

然后，方法进行到(S799)并终止。

方法(700)可以适当地进行调整。可以修改和/或省略方法(700)中的一个或多个步骤。可以增加一个或多个额外的步骤。可以使用任何合适的实现顺序。

图8示出了概述根据本公开的实施例的方法(800)的流程图。方法(800)可以在诸如视频解码器等解码器中使用。在各种实施例中，方法(800)由处理电路执行，诸如执行视频解码器(110)的功能的处理电路、执行视频解码器(210)的功能的处理电路等。在一些实施例中，方法(800)以软件指令实现，因此当处理电路执行软件指令时，处理电路执行方法(800)。该方法开始于(S801)并进行到(S810)。

在(S810)处，接收二维模型和三维模型之一的网格的当前帧的编解码信息。当前帧包括多个顶点并且对应于第一时刻处的网格。编解码信息包括多个顶点中的当前顶点的索引信息。索引信息指示当前顶点的预测残差。

在(S820)处，从多个顶点确定当前顶点的多个相邻顶点，其中多个相邻顶点中的每一个通过相应的边连接到当前顶点。

在(S830)处，确定当前顶点的多个相邻顶点的多个相邻估计误差。多个相邻估计误差中的每一个指示网格的参考帧中的多个相邻顶点中的一个对应相邻顶点的参考顶点与当前帧中的多个相邻顶点中的一个对应相邻顶点之间的差。参考帧对应于第二时刻处的网格。

在(S840)处，基于(i)索引信息和(ii)多个相邻顶点的多个相邻估计误差确定当前顶点的预测残差。

在(S850)处，基于当前顶点的所确定的预测残差重建当前顶点。

然后，方法进行到(S899)并终止。

方法(800)可以适当地进行调整。可以修改和/或省略方法(800)中的一个或多个步骤。可以增加一个或多个额外的步骤。可以使用任何合适的实现顺序。

上述技术可以通过计算机可读指令实现为计算机软件，并且物理地存储在一个或多个计算机可读介质中，计算机可读介质例如非仪式性计算机可读存储介质。例如，图9示出了计算机系统(900)，其适于实现所公开主题的某些实施例。

所述计算机软件可通过任何合适的机器代码或计算机语言进行编码，通过汇编、编译、链接等机制创建包括指令的代码，所述指令可由例如一个或多个计算机中央处理单元(CPU)，图形处理单元(GPU)等处理电路直接执行或通过译码、微代码等方式执行。

所述指令可以在各种类型的计算机或其组件上执行，包括例如个人计算机、平板电脑、服务器、智能手机、游戏设备、物联网设备等。

图9所示的用于计算机系统(900)的组件本质上是示例性的，并不用于对实现本申请实施例的计算机软件的使用范围或功能进行任何限制。也不应将组件的配置解释为与计算机系统(900)的示例性实施例中所示的任一组件或其组合具有任何依赖性或要求。

计算机系统(900)可以包括某些人机界面输入设备。这种人机界面输入设备可以通过触觉输入(如：键盘输入、滑动、数据手套移动)、音频输入(如：声音、掌声)、视觉输入(如：手势)、嗅觉输入(未示出)，对一个或多个人类用户的输入做出响应。所述人机界面设备还可用于捕获某些媒体，气与人类有意识的输入不必直接相关，如音频(例如：语音、音乐、环境声音)、图像(例如：扫描图像、从静止影像相机获得的摄影图像)、视频(例如二维视频、包括立体视频的三维视频)。

人机界面输入设备可包括以下中的一个或多个(仅绘出其中一个)：键盘(901)、鼠标(902)、触控板(903)、触摸屏(910)、数据手套(未示出)、操纵杆(905)、麦克风(906)、扫描仪(907)、照相机(908)。

计算机系统(900)还可以包括某些人机界面输出设备。这种人机界面输出设备可以通过例如触觉输出、声音、光和嗅觉/味觉来刺激一个或多个人类用户的感觉。这样的人机界面输出设备可包括触觉输出设备(例如通过触摸屏(910)、数据手套(未示出)或操纵杆(905)的触觉反馈，但也可以有不用作输入设备的触觉反馈设备)、音频输出设备(例如，扬声器(909)、耳机(未示出))、视觉输出设备(例如，包括阴极射线管屏幕、液晶屏幕、等离子屏幕、有机发光二极管屏的屏幕(910)，其中每一个都具有或没有触摸屏输入功能、每一个都具有或没有触觉反馈功能——其中一些可通过诸如立体画面输出的手段输出二维视觉输出或三维以上的输出；虚拟现实眼镜(未示出)、全息显示器和放烟箱(未示出))以及打印机(未示出)。

计算机系统(900)还可以包括人可访问的存储设备及其相关介质，如包括具有CD/DVD的高密度只读/可重写式光盘(CD/DVD ROM/RW)(920)或类似介质(921)的光学介质、拇指驱动器(922)、可移动硬盘驱动器或固体状态驱动器(923)，诸如磁带和软盘(未示出)的传统磁介质，诸如安全软件保护器(未示出)等的基于ROM/ASIC/PLD的专用设备，等等。

本领域技术人员还应当理解，结合所公开的主题使用的术语“计算机可读介质”不包括传输介质、载波或其它瞬时信号。

计算机系统(900)还可以包括通往一个或多个通信网络的接口。例如，网络可以是无线的、有线的、光学的。网络还可为局域网、广域网、城域网、车载网络和工业网络、实时网络、延迟容忍网络等等。网络还包括以太网、无线局域网、蜂窝网络(GSM、3G、4G、5G、LTE等)等局域网、电视有线或无线广域数字网络(包括有线电视、卫星电视、和地面广播电视)、车载和工业网络(包括CANBus)等等。某些网络通常需要外部网络接口适配器，用于连接到某些通用数据端口或外围总线(949)(例如，计算机系统(900)的USB端口)；其它系统通常通过连接到如下所述的系统总线集成到计算机系统(900)的核心(例如，以太网接口集成到PC计算机系统或蜂窝网络接口集成到智能电话计算机系统)。通过使用这些网络中的任何一个，计算机系统(900)可以与其它实体进行通信。所述通信可以是单向的，仅用于接收(例如，无线电视)，单向的仅用于发送(例如CAN总线到某些CAN总线设备)，或双向的，例如通过局域或广域数字网络到其它计算机系统。上述的每个网络和网络接口可使用某些协议和协议栈。

上述的人机界面设备、人可访问的存储设备以及网络接口可以连接到计算机系统(900)的核心(940)。

核心(940)可包括一个或多个中央处理单元(CPU)(941)、图形处理单元(GPU)(942)、以现场可编程门阵列(FPGA)(943)形式的专用可编程处理单元、用于特定任务的硬件加速器(944)等。这些设备以及只读存储器(ROM)(945)、随机存取存储器(946)、内部大容量存储器(例如内部非用户可存取硬盘驱动器、固态硬盘等)(947)等可通过系统总线(948)进行连接。在某些计算机系统中，可以以一个或多个物理插头的形式访问系统总线(948)，以便可通过额外的中央处理单元、图形处理单元等进行扩展。外围装置可直接附接到核心的系统总线(948)，或通过外围总线(949)进行连接。外围总线的体系结构包括外部控制器接口PCI、通用串行总线USB等。

CPU(941)、GPU(942)、FPGA(943)和加速器(944)可以执行某些指令，这些指令组合起来可以构成上述计算机代码。该计算机代码可以存储在ROM(945)或RAM(946)中。过渡数据也可以存储在RAM(946)中，而永久数据可以存储在例如内部大容量存储器(947)中。通过使用高速缓冲存储器可实现对任何存储器设备的快速存储和检索，高速缓冲存储器可与一个或多个CPU(941)、GPU(942)、大容量存储器(947)、ROM(945)、RAM(946)等紧密关联。

所述计算机可读介质上可具有计算机代码，用于执行各种计算机实现的操作。介质和计算机代码可以是为本申请的目的而特别设计和构造的，也可以是计算机软件领域的技术人员所熟知和可用的介质和代码。

作为实施例而非限制，具有体系结构(900)的计算机系统，特别是核心(940)，可以作为处理器(包括CPU、GPU、FPGA、加速器等)提供执行包含在一个或多个有形的计算机可读介质中的软件的功能。这种计算机可读介质可以是与上述的用户可访问的大容量存储器相关联的介质，以及具有非易失性的核心(940)的特定存储器，例如核心内部大容量存储器(947)或ROM(945)。实现本申请的各种实施例的软件可以存储在这种设备中并且由核心(940)执行。根据特定需要，计算机可读介质可包括一个或一个以上存储设备或芯片。该软件可以使得核心(940)特别是其中的处理器(包括CPU、GPU、FPGA等)执行本文所述的特定过程或特定过程的特定部分，包括定义存储在RAM(946)中的数据结构以及根据软件定义的过程来修改这种数据结构。另外或作为替代，计算机系统可以提供逻辑硬连线或以其它方式包含在电路(例如，加速器(944))中的功能，该电路可以代替软件或与软件一起运行以执行本文所述的特定过程或特定过程的特定部分。在适当的情况下，对软件的引用可以包括逻辑，反之亦然。在适当的情况下，对计算机可读介质的引用可包括存储执行软件的电路(如集成电路(IC))，包含执行逻辑的电路，或两者兼备。本申请包括任何合适的硬件和软件组合。

虽然本申请已对多个示例性实施例进行了描述，但实施例的各种变更、排列和各种等同替换均属于本申请的范围内。因此应理解，本领域技术人员能够设计多种系统和方法，所述系统和方法虽然未在本文中明确示出或描述，但其体现了本申请的原则，因此属于本申请的精神和范围之内。

Claims

1.一种网格处理的方法，其特征在于，在视频编码器中执行，所述方法包括：

在二维模型和三维模型之一的网格的当前帧中，确定当前顶点的多个相邻顶点，所述多个相邻顶点和所述当前顶点被包括在所述当前帧中并且对应于第一时刻处的所述网格，所述多个相邻顶点中的每一个通过所述网格中的相应边连接到所述当前顶点；

确定所述当前顶点的所述多个相邻顶点的多个相邻估计误差，所述多个相邻估计误差中的每一个，指示所述多个相邻顶点中的一个对应相邻顶点在所述网格的参考帧中的参考顶点与所述当前帧中的所述多个相邻顶点中的所述一个对应相邻顶点之间的差，所述参考帧对应于第二时刻处的所述网格；

基于所述多个相邻顶点的所述多个相邻估计误差，确定所述当前顶点的预测残差；以及

基于所述当前顶点的确定的所述预测残差，生成所述当前顶点的预测信息。

2.根据权利要求1所述的方法，其特征在于，所述多个相邻顶点中的所述一个对应相邻顶点的所述参考顶点被定位在所述参考帧中与所述当前帧中的所述当前顶点相同的相对位置处，所述参考帧和所述当前帧在不同的时刻生成。

3.根据权利要求2所述的方法，其特征在于，进一步包括：

确定所述多个相邻估计误差的平均相邻估计误差，

其中所述确定所述预测残差包括基于所述平均相邻估计误差确定所述当前顶点的所述预测残差。

4.根据权利要求3所述的方法，其特征在于，所述确定所述当前顶点的所述预测残差进一步包括：

基于所述当前顶点的参考顶点与所述当前顶点之间的差来确定所述当前顶点的估计误差；以及

确定所述当前顶点的预测列表，所述预测列表的预测因子包括所述当前顶点的所述估计误差、在所述当前顶点的所述估计误差之后的所述平均相邻估计误差，以及在所述平均相邻估计误差之后的所述多个相邻估计误差，各个预测索引与所述预测列表中的每个预测因子相关联。

5.根据权利要求4所述的方法，其特征在于，基于边缘断路器Edgebreaker算法对所述多个相邻顶点进行排序，在所述Edgebreaker算法中，以螺旋三角形生成树顺序遍历所述多个相邻顶点。

6.根据权利要求4所述的方法，其特征在于，所述确定所述当前顶点的所述预测残差进一步包括：

确定(i)所述平均相邻估计误差与所述当前顶点的所述估计误差之间的差，以及(ii)所述多个相邻估计误差中的每一个与所述当前顶点的所述估计误差之间的差；

从所述平均相邻估计误差和所述多个相邻估计误差中选择相邻估计误差，所述选择的相邻估计误差具有最小差；以及

将所述当前顶点的所述预测残差确定为(i)所述当前顶点的所述估计误差和(ii)所述选择的相邻估计误差之一。

7.根据权利要求6所述的方法，其特征在于，所述确定所述当前顶点的所述预测残差进一步包括：

根据帧间预测，基于所述当前顶点的所述多个相邻顶点中的一者确定预测误差；

将所述预测误差与所述预测列表中的每个预测因子进行比较；以及

响应于所述预测误差小于所述预测列表中的预测因子，将所述预测残差确定为所述预测误差。

8.根据权利要求7所述的方法，其特征在于，所述确定所述当前顶点的所述预测残差进一步包括：

将所述预测残差确定为混合估计误差，所述混合估计误差包括(i)所述选择的相邻估计误差和所述预测误差的平均值和(ii)所述当前顶点的估计误差和所述预测误差的平均值之一。

9.根据权利要求7所述的方法，其特征在于，所述帧间预测进一步包括以下中的一者：

增量预测，所述增量预测基于第一预测顶点与所述当前顶点之间的差，所述第一预测顶点包括所述当前顶点的所述多个相邻顶点之一，以及

平行四边形预测，其中基于所述网格的多个三角形中的预测三角形确定第二预测顶点，所述预测三角形与包括所述当前顶点的所述多个三角形中的一个三角形共享边，所述第二预测顶点与所述共享边相对，所述第二预测顶点和所述预测三角形形成平行四边形。

10.根据权利要求8所述的方法，其特征在于，所述当前顶点的所述预测信息进一步包括：

标志，所述标志指示所述预测残差是以下中的一者：(i)基于所述标志的第一值的所述当前顶点的所述估计误差或所述选择的相邻估计误差，(ii)基于所述标志的第二值的所述预测误差，以及(iii)基于所述标志的第三值的所述混合估计误差。

11.根据权利要求10所述的方法，其特征在于，所述当前顶点的所述预测信息进一步包括：

索引信息，所述索引信息基于所述标志为所述第一值指示所述预测列表中的哪个预测因子是所述预测残差，以及

预测残差信息，其指示：

(i)基于所述标志为所述第一值，

所述当前顶点的所述估计误差，响应于所述索引信息指示所述预测残差是所述当前顶点的所述估计误差，以及

所述选择的相邻估计误差，响应于所述索引信息指示所述预测残差是所述选择的相邻估计误差，以及

(ii)基于所述标志为所述第二值，所述当前顶点与由所述预测误差指示的预测顶点之间的差，以及

(iii)基于所述标志为所述第三值，所述当前顶点与由所述混合估计误差指示的预测顶点之间的差。

12.一种网格处理的装置，其特征在于，所述装置包括：

处理电路，被配置为：

13.根据权利要求12所述的装置，其特征在于，所述多个相邻顶点中的所述一个对应相邻顶点的所述参考顶点被定位在所述参考帧中与所述当前帧中的所述当前顶点相同的相对位置处，所述参考帧和所述当前帧在不同的时刻生成。

14.根据权利要求13所述的装置，其特征在于，所述处理电路进一步被配置为：

确定所述多个相邻估计误差的平均相邻估计误差；以及

基于所述平均相邻估计误差确定所述当前顶点的所述预测残差。

15.根据权利要求14所述的装置，其特征在于，所述处理电路进一步被配置为：

16.根据权利要求15所述的装置，其特征在于，所述处理电路进一步被配置为：

17.根据权利要求16所述的装置，其特征在于，所述处理电路进一步被配置为：

18.根据权利要求17所述的装置，其特征在于，所述处理电路进一步被配置为：

19.根据权利要求18所述的装置，其特征在于，所述当前顶点的预测信息进一步包括：

20.根据权利要求19所述的装置，其特征在于，所述当前顶点的预测信息进一步包括：

预测残差信息，其指示：

(i)基于所述标志为所述第一值，