CN119856485A - 编解码方法、装置、设备、及存储介质 - Google Patents

编解码方法、装置、设备、及存储介质 Download PDF

Info

Publication number
CN119856485A
CN119856485A CN202280100094.2A CN202280100094A CN119856485A CN 119856485 A CN119856485 A CN 119856485A CN 202280100094 A CN202280100094 A CN 202280100094A CN 119856485 A CN119856485 A CN 119856485A
Authority
CN
China
Prior art keywords
level
sub
view
array
viewpoint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280100094.2A
Other languages
English (en)
Inventor
杨铀
刘琼
吴科君
叶杰栋
罗景洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Publication of CN119856485A publication Critical patent/CN119856485A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请提供一种编解码方法、装置、设备、及存储介质,能够根据多视点阵列的分层预测结构,在帧编码过程中首先对第一层级的至少一个视点进行预测编码得到参考帧,然后根据该参考帧对第二层级的视点进行预测编码得到重建图像,使得第二层级和第一层级的不同位置视点(比如不同行或不同列)之间能够建立参考关系,能够更好地利用呈二维分布的视点之间的空间位置相关性,有助于提高多视点阵列的视频压缩效率。

Description

编解码方法、装置、设备、及存储介质 技术领域
本申请涉及图像处理技术领域,尤其涉及一种编解码方法、装置、设备、及存储介质。
背景技术
在三维应用场景中,例如虚拟现实(Virtual Reality,VR)、增强现实(Augmented Reality,AR)、混合现实(Mix Reality,MR)等应用场景中,可以采用多视点视频作为的视觉媒体对象。多视点视频是由多个摄像机采集的,包含不同视角的,支持用户交互的沉浸式媒体视频。
一种多视点视频编解码技术,采用二维分层编码结构(2-D hierarchical coding structure)将多视点图像组成一个视频序列,利用现有的视频压缩工具对该视频序列进行压缩,得到压缩视频码流。但是,该方法视频压缩效率较低。
发明内容
本申请实施例提供了一种编解码方法、装置、设备、及存储介质,能够更好地利用呈二维分布的视点之间的空间位置相关性,有助于提高多视点阵列的视频压缩效率。
第一方面,本申请提供了一种编码方法,包括:
确定多视点阵列的分层预测结构;其中,所述分层预测结构包括第一层级和第二层级,所述第一层级包括所述多视点阵列的至少一个视点,所述第二层级包括除所述第一层级之外的其他视点;
对所述第一层级的至少一个视点进行预测编码,得到参考帧;
根据所述参考帧,对所述第二层级的视点进行预测编码,得到重建图像。
第二方面,本申请实施例提供一种解码方法,包括:
确定多视点阵列的分层预测结构;其中,所述分层预测结构包括第一层级和第二层级,所述第一层级包括所述多视点阵列的至少一个视点,所述第二层级包括除所述第一层级之外的其他视点;
对所述第一层级的至少一个视点进行预测解码,得到参考帧;
根据所述参考帧,对所述第二层级的视点进行预测解码,得到重建图像。
第三方面,本申请提供了一种编码装置,用于执行上述第一方面或其各实现方式中的方法。具体地,该预测装置包括用于执行上述第一方面或其各实现方式中的方法的功能单元。
第四方面,本申请提供了一种解码装置,用于执行上述第二方面或其各实现方式中的方法。具体地,该预测装置包括用于执行上述第二方面或其各实现方式中的方法的功能单元。
第五方面,提供了一种编码器,包括处理器和存储器。该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,以执行上述第一方面或其各实现方式中的方法。
第六方面,提供了一种解码器,包括处理器和存储器。该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,以执行上述第二方面或其各实现方式中的方法。
第七方面,提供了一种编解码系统,包括编码器和解码器。编码器用于执行上述第一方面或其各实现方式中的方法,解码器用于执行上述第二方面或其各实现方式中的方法。
第八方面,提供了一种芯片,用于实现上述第一方面至第二方面中的任一方面或其各实现方式中的方法。具体地,该芯片包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有该芯片的设备执行如上述第一方面至第二方面中的任一方面或其各实现方式中的方法。
第九方面,提供了一种计算机可读存储介质,用于存储计算机程序,该计算机程序使得计算机执行上述第一方面至第二方面中的任一方面或其各实现方式中的方法。
第十方面,提供了一种计算机程序产品,包括计算机程序指令,该计算机程序指令使得计算机执行上述第一方面至第二方面中的任一方面或其各实现方式中的方法。
第十一方面,提供了一种计算机程序,当其在计算机上运行时,使得计算机执行上述第一方面至第二方面中的任一方面或其各实现方式中的方法。
第十二方面,提供了一种码流,码流是基于上述第一方面的方法生成的。
基于以上技术方案,本申请实施例能够根据多视点阵列的分层预测结构,在帧编码过程中首先对第一层级的至少一个视点进行预测编码得到参考帧,然后根据该参考帧对第二层级的视点进行预测编码得到重建图像,使得第二层级和第一层级的不同位置视点(比如不同行或不同列)之间能够建立参考关系,能够更好地利用呈二维分布的视点之间的空间位置相关性,有助于提高多视点阵列的视频压 缩效率。
另外,由于分层预测结构能够包含多视图之间的空间位置信息,因此本申请实施例的分层预测结构能够包含视点的在多视点阵列中的参考位置,不需要额外的手段,比如建立位置查找表来补充各视点的参考位置,有助于进一步提高多视点阵列的压缩效率。
附图说明
图1为本申请实施例涉及的一种视频编解码系统的示意性框图;
图2A是本申请实施例涉及的视频编码器的示意性框图;
图2B是本申请实施例涉及的视频解码器的示意性框图;
图3A是多视点阵列的一个示意图;
图3B是多视点阵列的编码顺序的一个示意图;
图4为本申请一实施例提供的编码方法流程示意图;
图5A为本申请一实施例提供的多视点阵列的DO示意图;
图5B为本申请一实施例提供的多视点阵列的分层预测结构的示意图;
图6为本申请另一实施例提供的编码过程示意图;
图7为本申请一实施例提供的多视点阵列的EO的示意图;
图8为本申请另一实施例提供的多视点阵列的EO的示意图;
图9为本申请实一施例提供的解码方法流程示意图;
图10是本申请一实施例提供的编码装置的示意性框图;
图11是本申请一实施例提供的解码装置的示意性框图;
图12本申请实施例提供的电子设备的示意性框图。
具体实施方式
本申请可应用于图像编解码领域、视频编解码领域、硬件视频编解码领域、专用电路视频编解码领域、实时视频编解码领域等。例如,本申请的方案可结合至音视频编码标准(audio video coding standard,简称AVS),例如,H.264/高级视频编码(advancedvideo coding,简称AVC)标准,H.265/高效视频编码(high efficiency video coding,简称HEVC)标准以及H.266/多功能视频编码(versatile video coding,简称VVC)标准。或者,本申请的方案可结合至其它专属或行业标准而操作,所述标准包含ITU-TH.261、ISO/IECMPEG-1Visual、ITU-TH.262或ISO/IECMPEG-2Visual、ITU-TH.263、ISO/IECMPEG-4Visual,ITU-TH.264(还称为ISO/IECMPEG-4AVC),包含可分级视频编解码(SVC)及多视图视频编解码(MVC)扩展。应理解,本申请的技术不限于任何特定编解码标准或技术。
本申请实施例涉及的编码主要为视频编解码,为了便于理解,首先结合图1对本申请实施例涉及的视频编解码系统进行介绍。
图1为本申请实施例涉及的一种视频编解码系统的示意性框图。需要说明的是,图1只是一种示例,本申请实施例的视频编解码系统包括但不限于图1所示。如图1所示,该视频编解码系统100包含编码设备110和解码设备120。其中编码设备用于对视频数据进行编码(可以理解成压缩)产生码流,并将码流传输给解码设备。解码设备对编码设备编码产生的码流进行解码,得到解码后的视频数据。
本申请实施例的编码设备110可以理解为具有视频编码功能的设备,解码设备120可以理解为具有视频解码功能的设备,即本申请实施例对编码设备110和解码设备120包括更广泛的装置,例如包含智能手机、台式计算机、移动计算装置、笔记本(例如,膝上型)计算机、平板计算机、机顶盒、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、车载计算机等。
在一些实施例中,编码设备110可以经由信道130将编码后的视频数据(如码流)传输给解码设备120。信道130可以包括能够将编码后的视频数据从编码设备110传输到解码设备120的一个或多个媒体和/或装置。
在一个实例中,信道130包括使编码设备110能够实时地将编码后的视频数据直接发射到解码设备120的一个或多个通信媒体。在此实例中,编码设备110可根据通信标准来调制编码后的视频数据,且将调制后的视频数据发射到解码设备120。其中通信媒体包含无线通信媒体,例如射频频谱,可选的,通信媒体还可以包含有线通信媒体,例如一根或多根物理传输线。
在另一实例中,信道130包括存储介质,该存储介质可以存储编码设备110编码后的视频数据。存储介质包含多种本地存取式数据存储介质,例如光盘、DVD、快闪存储器等。在该实例中,解码设 备120可从该存储介质中获取编码后的视频数据。
在另一实例中,信道130可包含存储服务器,该存储服务器可以存储编码设备110编码后的视频数据。在此实例中,解码设备120可以从该存储服务器中下载存储的编码后的视频数据。可选的,该存储服务器可以存储编码后的视频数据且可以将该编码后的视频数据发射到解码设备120,例如web服务器(例如,用于网站)、文件传送协议(FTP)服务器等。
一些实施例中,编码设备110包含视频编码器112及输出接口113。其中,输出接口113可以包含调制器/解调器(调制解调器)和/或发射器。
在一些实施例中,编码设备110除了包括视频编码器112和输入接口113外,还可以包括视频源111。
视频源111可包含视频采集装置(例如,摄像机)、视频存档、视频输入接口、计算机图形系统中的至少一个,其中,视频输入接口用于从视频内容提供者处接收视频数据,计算机图形系统用于产生视频数据。
视频编码器112对来自视频源111的视频数据进行编码,产生码流。视频数据可包括一个或多个图像(picture)或图像序列(sequence of pictures)。码流以比特流的形式包含了图像或图像序列的编码信息。
视频编码器112经由输出接口113将编码后的视频数据直接传输到解码设备120。编码后的视频数据还可存储于存储介质或存储服务器上,以供解码设备120后续读取。
在一些实施例中,解码设备120包含输入接口121和视频解码器122。
在一些实施例中,解码设备120除包括输入接口121和视频解码器122外,还可以包括显示装置123。
其中,输入接口121包含接收器及/或调制解调器。输入接口121可通过信道130接收编码后的视频数据。
视频解码器122用于对编码后的视频数据进行解码,得到解码后的视频数据,并将解码后的视频数据传输至显示装置123。
显示装置123显示解码后的视频数据。显示装置123可与解码设备120整合或在解码设备120外部。显示装置123可包括多种显示装置,例如液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或其它类型的显示装置。
此外,图1仅为实例,本申请实施例的技术方案不限于图1,例如本申请的技术还可以应用于单侧的视频编码或单侧的视频解码。
下面对本申请实施例涉及的视频编码框架进行介绍。
图2A是本申请实施例涉及的视频编码器的示意性框图。
如图2A所示,该视频编码器200可包括:预测单元210、残差单元220、变换/量化单元230、反变换/量化单元240、重建单元250、环路滤波单元260、解码图像缓存270和熵编码单元280。需要说明的是,视频编码器200可包含更多、更少或不同的功能组件。
在一些实施例中,预测单元210包括帧间预测单元211和帧内估计单元212。由于视频的一个帧中的相邻像素之间存在很强的相关性,在视频编解码技术中使用帧内预测的方法消除相邻像素之间的空间冗余。由于视频中的相邻帧之间存在着很强的相似性,在视频编解码技术中使用帧间预测方法消除相邻帧之间的时间冗余,从而提高编码效率。
帧间预测单元211可用于帧间预测,帧间预测可以包括运动估计(motion estimation)和运动补偿(motion compensation),可以参考不同帧的图像信息,帧间预测使用运动信息从参考帧中找到参考块,根据参考块生成预测块,用于消除时间冗余;帧间预测所使用的帧可以为P帧和/或B帧,P帧指的是向前预测帧,B帧指的是双向预测帧。
帧内估计单元212只参考同一帧图像的信息,预测当前图像块内的像素信息,用于消除空间冗余。帧内预测所使用的帧可以为I帧。
图2B是本申请实施例涉及的视频解码器的示意性框图。
如图2B所示,视频解码器300包含:熵解码单元310、预测单元320、反量化/变换单元330、重建单元340、环路滤波单元350及解码图像缓存360。预测单元320包括帧间预测单元321和帧内估计单元322。需要说明的是,视频解码器300可包含更多、更少或不同的功能组件。
视频解码器300可接收码流。熵解码单元310可解析码流以从码流提取语法元素。作为解析码流的一部分,熵解码单元310可解析码流中的经熵编码后的语法元素。预测单元320、反量化/变换单元330、重建单元340及环路滤波单元350可根据从码流中提取的语法元素来解码视频数据,即产生解码后的视频数据。
视频编解码的基本流程如下:在编码端,将一帧图像划分成块,针对当前块,预测单元210使用帧内预测或帧间预测产生当前块的预测块。残差单元220可基于预测块与当前块的原始块计算残差块,即预测块和当前块的原始块的差值,该残差块也可称为残差信息。该残差块经由变换/量化单元230变换与量化等过程,可以去除人眼不敏感的信息,以消除视觉冗余。可选的,经过变换/量化单元230变换与量化之前的残差块可称为时域残差块,经过变换/量化单元230变换与量化之后的时域残差块可称为频率残差块或频域残差块。熵编码单元280接收到变化量化单元230输出的量化后的变化系数,可对该量化后的变化系数进行熵编码,输出码流。例如,熵编码单元280可根据目标上下文模型以及二进制码流的概率信息消除字符冗余。
在解码端,熵解码单元310可解析码流得到当前块的预测信息、量化系数矩阵等,预测单元320基于预测信息对当前块使用帧内预测或帧间预测产生当前块的预测块。反量化/变换单元330使用从码流得到的量化系数矩阵,对量化系数矩阵进行反量化、反变换得到残差块。重建单元340将预测块和残差块相加得到重建块。重建块组成重建图像,环路滤波单元350基于图像或基于块对重建图像进行环路滤波,得到解码图像。编码端同样需要和解码端类似的操作获得解码图像。该解码图像也可以称为重建图像,重建图像可以为后续的帧作为帧间预测的参考帧。
需要说明的是,编码端确定的块划分信息,以及预测、变换、量化、熵编码、环路滤波等模式信息或者参数信息等在必要时携带在码流中。解码端通过解析码流及根据已有信息进行分析确定与编码端相同的块划分信息,预测、变换、量化、熵编码、环路滤波等模式信息或者参数信息,从而保证编码端获得的解码图像和解码端获得的解码图像相同。
上述是基于块的混合编码框架下的视频编解码器的基本流程,随着技术的发展,该框架或流程的一些模块或步骤可能会被优化,本申请适用于该基于块的混合编码框架下的视频编解码器的基本流程,但不限于该框架及流程。
在一些应用场景中,在三维场景中可以出现多视点视频。多视点视频由多个摄像机采集的,包含不同视角的,支持用户交互的沉浸式媒体视频。也被称为多视角视频、自由视角视频等。
多视点视频通常由摄像机阵列从多个角度对同一三维场景进行拍摄得到。其中,摄像机阵列中的多台摄像机在拍摄过程中被合理置位,以使每台摄像机都能从一个视点(viewpoint)抓取场景。多台摄像机获取的图像称为多视点图像。多视点图像可以按照空间位置关系,形成多视点图像阵列,也可以称为多视点阵列。
相应地,多台摄像机将会抓取对应于多个视点的多个视频序列。为了提供更多的视点,更多的摄像机被使用以生成具有与视点相关的大量视频序列的多视点视频。多视点视频在采集完成后,需要对视频进行压缩编码。例如,在现有的多视点视频的技术中,视频压缩算法可以由AVS3编码技术、HEVC编码技术等完成。
一种多视点视频编解码技术,采用二维分层编码结构(2-D hierarchical coding structure)将多视点阵列组成一个视频序列(或图像序列)。然后,利用现有的视频压缩工具对该视频序列进行压缩,得到压缩视频码流。例如,在图1的编码设备110中,视频源111可以对视频采集装置获取的多视点图像阵列组成视频序列,然后将该视频序列作为视频数据输入视频编码器112,由视频编码器112对该视频序列进行编码,产生码流。
上述方案的关键是确定多视点阵列中的各多视点图像的帧编码顺序,该顺序即对应于视频序列的顺序。具体而言,在帧编码过程中,该方案将用于普通视频编码的一维分层编码结构(1-D hierarchical coding structure)扩展至二维情况。
例如,对于普通的视频编码,以16帧序列为例,一种经典的编码顺序是0,16,8,4,2,1,3,6,5,7,12,10,9,11,14,13,15。具体的,第0帧图像可以为I帧,其每个编码单元只能使用本帧图像的信息进行预测;第16帧可以为P帧,可以利用前向帧间信息进行预测;其余第1至15帧可以支持双向预测。这种编码顺序可以降低参考帧对缓冲区的存储占用。
图3A示出了多视点阵列的一个具体例子。如图3A所示,该多视点阵列包括165个视点,每个视点的编号如图1所示,其中中心视点编号为0,其余视点从1到164逐行编号。这些编号称为视点顺序编号(picture order count,POC)。以该多视点阵列为例,现有的采用二维分层编码结构方案将所有的视点(即多视点阵列)分为四部分进行编码,如图1中虚线所示。如图3B所示,以左上部分为例,在水平和竖直方向上分别以前述的一维分层编码结构进行编码。具体的,先对第0行进行编码,接着是第6行,然后是第3行,以此类推。对于每行内部编码,同理先编码第0列,然后是第6列,然后是第3列,以此类推。
上述方案在帧编码过程将用于普通视频编码的一维分层编码结构扩展至二维情况,是对一维分层编码结构的简单模仿和扩展,忽略了多视图阵列中各个视点在二维平面上的空间位置相关性,这会降 低多视点阵列的视频压缩效率。同时,该方案需要通过额外的手段,比如建立位置查找表来补充各视点的参考位置。
为了解决上述技术问题,本申请实施例通过确定多视点阵列的分层预测结构,并在帧编码过程中首先对第一层级的至少一个视点进行预测编码得到参考帧,然后根据该参考帧对第二层级的视点进行预测编码得到重建图像,使得第二层级和第一层级的不同位置视点(比如不同行或不同列)之间能够建立参考关系,能够更好地利用呈二维分布的视点之间的空间位置相关性,有助于提高多视点阵列的视频压缩效率。
下面结合图4,以编码端为例,对本申请实施例提供的视频编码方法进行介绍。
图4为本申请一实施例提供的编码方法400流程示意图,如图4所示,本申请实施例的方法400包括:
S401,确定多视点阵列的分层预测结构,该分层预测结构包括第一层级和第二层级,第一层级包括多视点阵列的至少一个视点,第二层级包括除第一层级之外的其他视点。
在三维应用场景中,例如虚拟现实(Virtual Reality,VR)、增强现实(Augmented Reality,AR)、混合现实(Mix Reality,MR)等应用场景中,可以采用多视点视频作为的视觉媒体对象。
多视点视频通过多台摄像机(如摄像机阵列)从多个角度对同一三维场景进行拍摄得到。多台摄像机获取的图像称为多视点图像。多视点图像可以按照空间位置关系,形成多视点阵列。多视点阵列中各视点具有水平和垂直视差。
作为一个实例,多视点阵列可以为密集多视点图像按照空间位置关系排列得到,其中各多视点图像高密度排列。
作为一个实例,多视点阵列可以包括中心对称多视点阵列,比如方形多视点阵列。
作为一个实例,多视点阵列可以包括相同时刻或不同时刻的多台摄像机获取的多视点图像,本申请对此不做限定。
本申请实施例中,可以确定多视点阵列的分层预测结构(hierarchy prediction structure,HPS)。由于多视点阵列是根据多视点图像的空间位置关系形成,因此分层预测结构中各层级的空间位置关系不同。例如,上述第一层级的视点与第二层级的视点的空间位置不同。换言之,分层预测结构能够包含多视图之间的空间位置信息。
其中,第一层级的视点可以为多视点阵列中的基础视点,比如相对比较重要的视点,可以为第二层级的视点提供参考信息,作为第二层级的视点的参考。
另外,多视点阵列中每个图像对应的摄像机的拍摄角度不同,而每个视点位置与对应摄像机拍摄的角度相关,因此对多视点阵列得到的分层预测结构与摄像机的拍摄角度相关。在一些实施例中,该分层预测结构也可以称为角度分层预测结构(angular hierarchy prediction structure,AHPS),本申请对此不做限定。
在一些实施例中,多视点阵列也可以称为多视点图像阵列、多视图阵列等,本申请对此不做限定。
本申请实施例中,多视点阵列中多视点图像可以重新排成视频序列(或图像序列)。显示顺序(displayorder,DO),也称为视点顺序编号(picture order count,POC),指各视点图像在视频序列中的顺序索引。
作为示例,中心视点图像(即中心视点图像)被指定为视频序列中的第一帧,编号为0(即DO#0)。其余视点(即视点图像)按照从左到右和从上到下的规则依次分配DO。图5A示出了9×9的多视点阵列的DO的一个具体例子。图5A中每个方形代表一个视点,方形中的数字为对应视点的DO。
在一些实施例中,上述第一层级包括第一子层级。其中,该第一子层级包括中心视点。中心视点因为位于多视点阵列的中心位置,与多视点阵列中所有视点的平均视差最小,可提供较多、较精确的参考信息,可以作为后续帧的参考。
在一些实施例中,第一层级还可以包括第二子层级。其中,该第二子层级包括均匀分布在多视点阵列中的至少两个视点。示例性的,第二子层级可以包括呈稀疏状均匀分布在多视点阵列中的至少两个视点。
本申请实施例中,第一层级,比如第一子层级和第二子层级,是分层预测结构的最基本的构成元素,可以为多视点阵列中的基础视点,作为后续帧(比如第二层级视点对应的帧)的参考,从而能够在帧编码过程中利用呈二维分布的视点之间的空间位置相关性。
作为一种可能的实现方式,第二子层级可以包括位于多视点阵列的边缘线(即边缘位置)上均匀分布的多个视点,和位于多视点阵列的对角线(即对角线位置)上的中心视点和顶点视点的中间位置的视点中的至少一种。需要说明的是,第二子层级不包括中心视点。
示例性的,多视点阵列的边缘线,可以包括多视点最左侧列(如第一列)、最右侧的列(最后一 列)、最上边的行(第一行)和最下边的行(最后一行)中的至少一种。多视点阵列的对角线,可以包括多视点阵列的左上顶点视点与右下顶点视点的第一连线、右上顶点视点与左下顶点视点的第二连线中的至少一种。中心视点位于第一连线和第二连线的交点上。
图5B示出了9×9的多视点阵列的分层预测结构的一个具体例子。如图所示,第一层级包括第一子层级H0和第二子层级H1。其中,第一子层级H0包括位于多视点阵列中心位置的中心视点,DO#0。第二子层级H1包括在多视点阵列的边缘线上均匀分布的8个视点,DO#1、DO#5、DO#9、DO#37、DO#44、DO#72、DO#76、DO#80、,以及位于多视点阵列的两条对角线上,中心视点分别与4个顶点视点的均匀分布的4个视点,如中心视点DO#0与顶点视点DO#1的中间位置上的视点DO#21,中心视点DO#0与顶点视点DO#9的中间位置上的视点DO#25、中心视点DO#0与顶点视点DO#72的中间位置上的视点DO#56、中心视点DO#0与顶点视点DO#80的中间位置上的视点DO#60,总共12个视点。第二子层级H1中的该12个视点呈稀疏状且均匀分布在视图之中。
在一些实施例中,上述第二层级包括第三子层级,第三子层级包括位于多视点阵列的水平中轴线和竖直中轴线上的第一子层级和第二子层级之间的至少两个视点。第三子层级的视点具有连接第一子层级和第二子层级的作用。
继续参见图5B,第二层级包括第三子层级H2,第三子层级H2包括在多视点阵列的水平中轴线上的第一子层级H0的视点DO#0和第二子层级H1的视点DO#37之间的视点DO#39,第一子层级H0的视点DO#0和第二子层级H1的视点DO#44之间的视点DO#42,竖直中轴线上的第一子层级H0的视点DO#0和第二子层级H1的视点DO#5之间的视点DO#23,第一子层级H0的视点DO#0和第二子层级H1的视点DO#76之间的视点DO#58,共四个视点。
在一些实施例中,上述第二层级还包括第四子层级,第四子层级包括位于多视点阵列的边缘线上的第一子层级的视点之间的视点,以及多视点阵列的水平中轴线和竖直中轴线上的第三子层级和第一子层级之间、第三子层级和第二子层级之间的至少两个视点。第四子层级的视点具有填补第三子层级和第二子层级之间的空白的作用。
继续参见图5B,第二层级还包括第四子层级H3,第四子层级H3包括16个视点,分别为:
在多视点阵列的边缘线上的第二子层级H1的视点DO#1和DO#5之间的视点DO#3,视点DO#5和DO#9之间的视点DO#7,视点DO#9和DO#44之间的视点DO#27,视点DO#44和DO#80之间的视点DO#62,视点DO#80和DO#76之间的视点DO#78,视点DO#76和DO#72之间的视点DO#74,视点DO#72和DO#37之间的视点DO#54,视点DO#37和DO#1之间的视点DO#19,共8个视点;以及
水平中轴线上第三子层级H2的视点DO#39和第一子层级H1的视点DO#0之间的视点DO#40,第三子层级H2的视点DO#42和第一子层级H1的视点DO#0之间的视点DO#41,第三子层级H2的视点DO#39和第二子层级H1的视点DO#37之间的视点DO#38,第三子层级H2的视点DO#42和第二子层级H1的视点DO#44之间的视点DO#43,共4个视点;以及
竖直中轴线上第三子层级H2的视点DO#23和第一子层级H1的视点DO#0之间的视点DO#32,第三子层级H2的视点DO#58和第一子层级H1的视点DO#0之间的视点DO#49,第三子层级H2的视点DO#23和第二子层级H1的视点DO#5之间的视点DO#14,第三子层级H2的视点DO#58和第二子层级H1的视点DO#76之间的视点DO#67,共4个视点。
在一些实施例中,第二层级还包括第五子层级,第五子层级包括位于多视点阵列的边缘线上的第二子层级和第四子层级之间的至少两个视点、在多视点阵列的除边缘线和水平中轴线之外的行上的第三子层级和第二子层级之间、第二子层级和第四子层级之间的至少两个视点。
继续参见图5B,第二层级还包括第五子层级H4,第五子层级H4包括24个视点,分别为:
在多视点阵列的边缘线上第二子层级H1的视点和第四子层级H3的视点之间的视点,如DO#2、DO#4、DO#6、DO#8、DO#18、DO#36、DO#53、DO#71、DO#79、DO#77、DO#75、DO#73、DO#63、DO#45、DO#28、DO#10等,共16个视点;以及
第三行上的第三子层级H2的视点和第二子层级H1的视点之间的视点,如DO#22、DO#24,第二子层级H1的视点和第四子层级H3的视点之间的视点,如DO#20、DO#26,共4个视点;以及
第七行上的第三子层级H2的视点和第二子层级H1的视点之间的视点,如DO#57、DO#59,第二子层级H1的视点和第四子层级H3的视点之间的视点,如DO#55、DO#61,共4个视点。
如图5B所示,第四子层级H3和第五子层级H4的视点覆盖了多视点阵列近一半的密集多视点图像。因此,当第四子层级H3和第五子层级H4的视点以第一子层级或第二子层级的视点为参考进行帧间预测编码,能够有助于节省码率。换句话说,第四子层级H3和第五子层级H4是码率节省的主要来源。
在一些实施例中,第二层级还包括第六子层级,第六子层级包括位于多视点阵列的除边缘线和竖直中轴线之外的列上的第三子层级和第二子层级之间、第二子层级和第四子层级之间的至少两个视点。
继续参见图5B,第二层级还包括第六子层级H5,第六子层级H5包括8个视点,分别为:
第三列上的第三子层级H2的视点和第二子层级H1的视点之间的视点,如DO#30、DO#47,第二子层级H1的视点和第四子层级H3的视点之间的至少两个视点,如DO#12、DO#65,共4个视点;
第七列上的第三子层级H2的视点和第二子层级H1的视点之间的视点,如DO#34、DO#51,第二子层级H1的视点和第四子层级H3的视点之间的至少两个视点,如DO#16、DO#69,共4个视点。
在一些实施例中,第二层级还包括第七子层级,第七子层级包括位于多视点阵列的除边缘线之外的行中的与第六子层级相同行的至少两个视点。
继续参见图5B,第二层级还包括第七子层级H6,第七子层级H6包括16个视点,分别为:第二行中的视点DO#11、DO#13、DO#15、DO#17,第四行中的视点DO#29、DO#31、DO#33、DO#35,第六行中的视点DO#46、DO#48、DO#50、DO#52,第八行中的视点DO#64、DO#66、DO#68、DO#70。
在一些实施例中,可以根据分层预测结构,将多视点阵列中的多视点图像重新排成视频序列,该视频序列中图像按照低到高层级(子层级)依次排序。此时,视频序列按编码顺序(encoder order,EO)排列,EO即指各视点图像进行编码的实际顺序。因此,多视点阵列中的多视点图像可以按照从低到高层级(子层级)依次进行编码。可选的,在特定层级内还可以涉及精确的编码顺序。
如下步骤S402和S403描述了根据分层预测结构的编码顺序过程。
S402,对第一层级的至少一个视点进行预测编码,得到参考帧。
具体而言,首先对分层预测结构的第一层级的至少一个视点进行压缩编码。
在一些实施例中,如图6所示,当第一层级包括第一子层级时,步骤S402具体可以包括S4021:
S4021,对第一子层级的中心视点进行帧内预测编码,得到第一参考帧。
具体而言,第一子层级的中心视点被指定为编码顺序EO的第一帧,编号为0(EO#0)。如图7所示,第一子层级H0的中心视点(DO#0)的编码顺序为EO#0。由于没有已编码的视点图像作为参考,中心视点采用帧内预测模式进行编码,得到第一参考帧。第一参考帧可以作为后续视频序列中任一视点的参考帧。
在一些实施例中,继续参见图6,当第一层级还包括第二子层级时,步骤S402进一步还可以包括S4022:
S4022,对第二子层级的至少两个视点分别进行预测编码,得到第二参考帧。
其中,上述参考帧包括第一参考帧和第二参考帧。
具体而言,在第一子层级的中心视点编码完成之后,对第二子层级的至少两个视点分别进行预测编码,得到至少两个第二参考帧。
在一些实施例中,可以对第二子层级的至少两个视点进行帧内预测编码或帧间预测编码,得到第二参考帧。当对第二子层级的视点进行帧间预测编码时,可以自适应地在邻近(包括最邻近或次邻近)的视点中选择参考帧,比如可以将已编码的第一子层级的中心视点的第一参考帧作为参考帧,或者将第二子层级中的已经编码完成的视点的第二参考帧作为参考帧,本申请对此不做限定。
可选的,可以将第一子层级的视点分为上半部分和下半部分,分别独立的进行压缩编码。通过对上半部分和下半部分分别独立的进行压缩编码,能够在上半部分编码完成后对上半部分的部分编码图像(如除上半部分与下半部分交界处的视点之外的视点对应的编码图像)进行删除,从而实现节省编码缓存。
示例性的,继续参见图7,在第一子层级的中心视点(DO#0)编码完成后,可以将第二子层级H1的视点分为上半部分和下半部分,首先可以对第二子层级H1的上半部分按照编码顺序从EO#1到EO#7依次编码压缩。作为一个具体的例子,可以由右至左,依次将第二子层级H1的上半部分的视点DO#44、DO#9、DO#25、DO#5、DO#21、DO#1、DO#37按照编码顺序从EO#1到EO#7依次编码压缩。
可选的,在多视点阵列的上半部分的所有视点编码完成之后,可以对第二子层级的下半部分进行压缩编码。具体的压缩顺序与上半部分类似,可以参考上半部分的描述,不再赘述。
S403,根据参考帧,对第二层级的视点进行预测编码,得到重建图像。
在第一层级的视点编码完成后,第一层级的视点可以为第二层级的视点提供参考信息,作为第二层级的视点的参考。具体而言,可以根据对第一层级的视点编码得到的参考帧,对第二层级的视点进行帧间预测编码,得到重建图像。
因此,本申请实施例通过确定多视点阵列的分层预测结构,并在帧编码过程中首先对第一层级的至少一个视点进行预测编码得到参考帧,然后根据该参考帧对第二层级的视点进行预测编码得到重建 图像,使得第二层级和第一层级的不同位置视点(比如不同行或不同列)之间能够建立参考关系,能够更好地利用呈二维分布的视点之间的空间位置相关性,有助于提高多视点阵列的视频压缩效率。
另外,由于分层预测结构能够包含多视图之间的空间位置信息,因此本申请实施例的分层预测结构能够包含视点的在多视点阵列中的参考位置,不需要额外的手段,比如建立位置查找表来补充各视点的参考位置,有助于进一步提高多视点阵列的压缩效率。
在一些实施例中,当第二层级进一步包括多个子层级时,步骤403具体可以实现为:
根据第一层级对应的参考帧,按照从低子层级向高子层级的顺序对第二层级中各子层级中的视点依次编码得到重建图像,其中,第二层级中各子层级中每个子层级的视点参考与每个子层级相同或更低子层级的视点进行预测编码。
在一些实施例中,继续参见图6,当第一层级进一步包括第一子层级和第二子层级时,步骤403具体可以为以下步骤S4031:
S4031,根据第一参考帧和第二参考帧,按照从低子层级向高子层级的顺序对第二层级中各子层级中的视点依次编码,其中,各子层级中每个子层级的视点参考与每个子层级相同或更低子层级的视点进行预测编码。
例如,第二层级中第三子层级的视点可以将第一子层级、第二子层级和第三子层级中的至少一个子层级中的已编码视点作为参考帧进行帧间预测编码;第四子层级的视点可以将第一子层级至第四子层级中的至少一个子层级中的已编码视点作为参考帧进行帧间预测编码,以此类推。
在一些实施例中,每个子层级编码时可以自适应地在邻近(包括最邻近或次邻近)的视点中选择参考帧,本申请对此不做限定。
因此,本申请实施例通过在帧编码过程中首先对低子层级视点进行预测编码得到参考帧,然后根据该参考帧对更高子层级的视点进行预测编码得到重建图像,即某个子层级中的视点只能参考相同子层级或更低子层级中的视点进行编码,使得不同子层级的不同位置视点(比如不同行或不同列)之间能够建立参考关系,能够更大程度地利用呈二维分布的视点之间的空间位置相关性,有助于提高多视点阵列的视频压缩效率。
在一些实施例中,在上述步骤4031中,可以按照一维分层编码结构的编码顺序,对多视点阵列的至少两个行逐行编码,其中,对多视点阵列的每行内除第一子层级和第二子层级之外的视点,根据按照从低子层级向高子层级的顺序依次编码。
例如,参见图7,当多视点阵列包括9行视点时,可以按照经典的编码顺序1,9,5,3,2,4,7,6,8逐行进行编码。对于每行内的视点,除已编码的第一子层级和第二子层级的视点之外,根据按照从低子层级向高子层级的顺序依次编码。
在一些实施例中,当一行内包括相同子层级的至少两个视点时,对该至少两个视点可以按照一维分层编码结构的编码顺序逐个进行编码。
例如,继续参见图7,对于第1行中的多个视点进行编码时,第二子层级H1的视点DO#1、DO#5、DO#9已经完成编码,并得到对应的第二参考帧,此时可以首先对第四子层级H3的视点DO#3和DO#7进行帧间预测编码,然后对第五子层级H4的视点DO#2、DO#4、DO#6、DO#8进行帧间预测编码。示例性的,对DO#3和DO#7按照一维分层编码结构的编码顺序可以依次对DO#3和DO#7进行编码,对DO#2、DO#4、DO#6、DO#8按照一维分层编码结构的编码顺序可以依次对DO#2、DO#4、DO#6、DO#8进行编码。
在一些实施例中,还可以在多视点阵列中确定第一部分多视点阵列,其中,该第一部分多视点阵列包括中心视点。然后,可以按照一维分层编码结构的编码顺序,对第一部分多视点阵列的至少两个行逐行编码。
本申请实施例中,可以对第一部分多视点阵列进行独立编码,从而在第一部分多视点阵列编码完成后可以对第一部分多视点阵列的部分编码图像(如除第一部分多视点阵列与其余部分多视点阵列交界处的视点之外的视点对应的编码图像)进行删除,从而实现节省编码缓存。
示例性的,第一部分多视点阵列可以包括多视点阵列的上半部分多视点阵列、下半部分多视点阵列、右上部分多视点阵列、左上部分多视点阵列、左下部分多视点阵列或右下部分多视点阵列,本申请对此不做限定。
如图8所示,以第一部分多视点阵列为多视点阵列的右上部分多视点阵列为例,当完成对第一子层级H0,以及第二子层级H1的上半部分视点的预测编码后,继续将上半部分剩余的第三子层级H2至第七子层级H6的视点进一步划分为左右两部分,这两部分也分别独立的压缩,以实现节省编码缓存。
继续参见图8,以右上部分多视点阵列为例,此时可以按照一维分层编码结构的编码顺序,对该 部分多视点阵列的至少两个行逐行编码,比如按照5,1,3,4,2的顺序逐行编码。在该部分多视点阵列的每行内则按照层级顺序进行编码,优先编码低子层级的视点。
例如,首先对第5行的视点进行编码,具体可以先对第三子层级H2的视点DO#42进行编码,其编码顺序为EO#8,然后对第四子层级H3的视点DO#43、DO#41进行编码,其编码顺序分别为EO#9、EO#10;
然后对第1行的视点进行编码,具体可以先对第四子层级H3的视点DO#7进行编码,其编码顺序为EO#11,然后对第五子层级H4的视点DO#8、DO#6进行编码,其编码顺序分别为EO#12、EO#13;
然后对第3行的视点进行编码,具体可以先对第三子层级H2的视点DO#23进行编码,其编码顺序为EO#14,然后对第四子层级H3的视点DO#27进行编码,其编码顺序为EO#15,然后对第五子层级H4的视点DO#26、DO#24进行编码,其编码顺序分别为EO#16、EO#17;
然后对第4行的视点进行编码,具体可以先对第四子层级H3的视点DO#32进行编码,其编码顺序为EO#18,然后对第五子层级H4的视点DO#36进行编码,其编码顺序为EO#19,然后对第六子层级H5的视点DO#34进行编码,其编码顺序为EO#20,然后对第七子层级H6的视点DO#35、DO#33进行编码,其编码顺序分别为EO#21、EO#22;
然后对第2行的视点进行编码,具体可以先对第四子层级H3的视点DO#14进行编码,其编码顺序为EO#23,然后对第五子层级H4的视点DO#18进行编码,其编码顺序为EO#24,然后对第六子层级H5的视点DO#16进行编码,其编码顺序为EO#25,然后对第七子层级H6的视点DO#17、DO#15进行编码,其编码顺序分别为EO#26、EO#27。
可选的,在对行内视点进行编码时,可以自适应地在邻近(包括最邻近或次邻近)的视点中选择参考帧,例如可以在同行、同列、不同行或不同列中自适应选择已编码视点作为参考帧,本申请对此不做限定。
在一些实施例中,继续参见图8,当右上部分多视点阵列编码完成之后,可以继续对左上部分多视点阵列进行编码。左上部分多视点阵列编码顺序与右上部分类似,可以参考上文中的描述。当右上部分多视点阵列编码完成之后,即完成了上半部分多视点阵列的编码。
进一步的,在上半部分多视点阵列编码完成之后,可以继续对下半部分多视点阵列进行编码。下半部分多视点阵列编码顺序与上半部分类似,可以参考上文中的描述。当下半部分多视点阵列编码完成之后,即完成了整个多视点阵列的编码。图8还示出了多视点阵列中所有视点的编码顺序。
在一些实施例中,不同部分多视点阵列在交界处共有至少两个视点。比如,以第一部分多视点阵列为右上部分多视点阵列,第二部分多视点阵列为左上部分多视点阵列,那么第一部分多视点阵列和第二部分多视点阵列的交界处共有视点DO#5、DO#14、DO#23、DO#32、DO#0。
可选的,在第一部分多视点阵列中的视点都编码完成,且第二部分多视点阵列中的视点还没有编码时,可以删除第一部分多视点阵列中除交界处共有的至少两个视点之外的其他视点对应的重建图像,以节省编码缓存,保持轻量的编码缓存区。
例如,继续参见图8,当完成右上部分多视点阵列中所有视点的编码时,可以删除除与左上部分多视点阵列的交界处共有的视点DO#5、DO#14、DO#23、DO#32、DO#0,以及与右下部分多视点阵列的交界处共有的视点DO#41、DO#42、DO#43、DO#44等视点之外的其他视点的重建图像。由于多视点阵列的各部分分别独立编码,因此删除第一部分多视点阵列中除交界处共有的至少两个视点之外的其他视点对应的重建图像,并不会对其他部分多视点阵列的编码产生影响,从而视点节省编码缓存,保持轻量的编码缓存区的目的。
另外,本申请实施例中,在每个独立编码区域中,最后编码的视点其编码图像不会作为其他视点的参考帧,该类视点可以称为非参考视点,比如本申请实施例中的第七子层级H6的视点,又例如图3A中多视点阵列的第2列、第5列、第7列、图10列。相比于现有技术整列视点为非参考视点而言,本申请实施例能够显著降低非参考视点的数量,从而进一步提高视频压缩效率。
上文以编码端为例对本申请的编码方法进行介绍,下面以解码端为例对本申请实施例提供的视频解码方法进行说明。
图9为本申请实施例提供的一种解码方法500的示意性流程图。如图9所示,本申请实施例的解码方法包括:
S501,确定多视点阵列的分层预测结构,该分层预测结构包括第一层级和第二层级,第一层级包括多视点阵列的至少一个视点,第二层级包括除第一层级之外的其他视点。
S502,对第一层级的至少一个视点进行预测解码,得到参考帧。
S503,根据所参考帧,对第二层级的视点进行预测解码,得到重建图像。
具体而言,解码端获取码流后,可以根据码流确定多视点阵列的分层预测结构。然后,解码端根 据多视点阵列的第一层级和第二层级各视点图像的编码顺序逆向解码获取视频帧后,根据多视点阵列的分层预测结构,即可得到多视点阵列。
在一些实施例中,所述多视点阵列通过多台摄像机从多个角度对同一三维场景进行拍摄得到。
在一些实施例中,其特征在于,所述多视点阵列包括中心对称多视点阵列。
在一些实施例中,所述第一层级包括第一子层级,所述第一子层级包括中心视点。
在一些实施例中,所述对所述第一层级的至少一个视点进行预测解码,得到参考帧,包括:
对所述第一子层级的所述中心视点进行帧内预测解码,得到第一参考帧。
在一些实施例中,所述第一层级还包括第二子层级,所述第二子层级包括均匀分布在所述多视点阵列中的至少两个视点。
在一些实施例中,所述第二子层级包括位于所述多视点阵列的边缘线上均匀分布的多个视点,以及位于所述多视点阵列的对角线上的中心视点和顶点视点的中间位置的视点中的至少一种。
在一些实施例中,所述对所述第一层级的至少一个视点进行预测解码,得到参考帧,包括:
对所述第二子层级的至少两个视点进行帧内预测解码或帧间预测解码,得到第二参考帧。
在一些实施例中,所述第二层级包括第三子层级,所述第三子层级包括位于所述多视点阵列的水平中轴线和竖直中轴线上的所述第一子层级和所述第二子层级之间的至少两个视点。
在一些实施例中,所述第二层级还包括第四子层级,所述第四子层级包括位于所述多视点阵列的边缘线上的所述第一子层级的视点之间的视点,以及所述多视点阵列的水平中轴线和竖直中轴线上的所述第三子层级和所述第一子层级之间、所述第三子层级和所述第二子层级之间的至少两个视点。
在一些实施例中,所述第二层级还包括第五子层级,所述第五子层级包括位于所述多视点阵列的边缘线上的所述第二子层级和所述第四子层级之间的至少两个视点、在所述多视点阵列的除边缘线和水平中轴线之外的行上的所述第三子层级和所述第二子层级之间、所述第二子层级和所述第四子层级之间的至少两个视点。
在一些实施例中,所述第二层级还包括第六子层级,所述第六子层级包括位于所述多视点阵列的除边缘线和竖直中轴线之外的列上的所述第三子层级和所述第二子层级之间、所述第二子层级和所述第四子层级之间的至少两个视点。
在一些实施例中,所述第二层级还包括第七子层级,所述第七子层级包括位于所述多视点阵列的除边缘线之外的行中的与所述第六子层级相同行的至少两个视点。
在一些实施例中,所述根据所述参考帧,对所述第二层级的视点进行预测解码,得到重建图像,包括:
根据所述参考帧,按照从低子层级向高子层级的顺序对所述第二层级中各子层级中的视点依次解码,其中,所述各子层级中每个子层级的视点参考与所述每个子层级相同或更低子层级的视点进行预测解码。
在一些实施例中,所述根据所述参考帧,按照从低子层级向高子层级的顺序对所述第二层级中各子层级中的视点依次解码,包括:
按照一维分层解码结构的解码顺序,对所述多视点阵列的至少两个行逐行解码,其中,对所述多视点阵列的每行内除所述第一子层级和所述第二子层级之外的视点,按照从低子层级向高子层级的顺序依次解码。
在一些实施例中,还包括:
在所述多视点阵列中确定第一部分多视点阵列,其中,所述第一部分多视点阵列包括所述中心视点;
其中,所述按照一维分层解码结构的解码顺序,对所述多视点阵列的至少两个行逐行解码,包括:
按照一维分层解码结构的解码顺序,对所述第一部分多视点阵列的至少两个行逐行解码。
在一些实施例中,所述第一部分多视点阵列包括所述多视点阵列的上半部分多视点阵列、下半部分多视点阵列、右上部分多视点阵列、左上部分多视点阵列、左下部分多视点阵列或右下部分多视点阵列。
在一些实施例中,所述多视点阵列还包括第二部分多视点阵列,所述第二部分多视点阵列包括所述中心视点,所述第一部分多视点阵列与所述第二部分多视点阵列在交界处共有至少两个视点;
所述方法还包括:
删除所述第一部分多视点阵列中除所述交界处共有的至少两个视点之外的其他视点对应的重建图像。
需要说明的是,本申请实施例中,解码方法具体流程可以参见编码方法的流程,这里不再赘述。通过本申请实施例提供的编码的方法在编码端能够得到一个较好的编码效果,提高编码压缩效率,并 且相应的,在解码器也能够相应的提高解码性能。
以上结合附图详细描述了本申请的优选实施方式,但是,本申请并不限于上述实施方式中的具体细节,在本申请的技术构思范围内,可以对本申请的技术方案进行多种简单变型,这些简单变型均属于本申请的保护范围。例如,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本申请对各种可能的组合方式不再另行说明。又例如,本申请的各种不同的实施方式之间也可以进行任意组合,只要其不违背本申请的思想,其同样应当视为本申请所公开的内容。
还应理解,在本申请的各种方法实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。另外,本申请实施例中,术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。具体地,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本申请中字符“/”,一般表示前后关联对象是一种“或”的关系。
上文结合图4至图9,详细描述了本申请的方法实施例,下文结合图10至图12详细描述本申请的装置实施例。
图10为本申请一实施例提供的编码装置10的示意性框图,该编码装置10应用于上述视频解码端。
如图10所示,编码装置10包括:
确定单元11,用于确定多视点阵列的分层预测结构;其中,所述分层预测结构包括第一层级和第二层级,所述第一层级包括所述多视点阵列的至少一个视点,所述第二层级包括除所述第一层级之外的其他视点;
编码单元12,用于对所述第一层级的至少一个视点进行预测编码,得到参考帧;
所述编码单元12还用于根据所述参考帧,对所述第二层级的视点进行预测编码,得到重建图像。
在一些实施例中,所述第一层级包括第一子层级,所述第一子层级包括中心视点。
在一些实施例中,所述编码单元12具体用于:
对所述第一子层级的所述中心视点进行帧内预测编码,得到第一参考帧。
在一些实施例中,所述第一层级还包括第二子层级,所述第二子层级包括均匀分布在所述多视点阵列中的至少两个视点。
在一些实施例中,所述第二子层级包括位于所述多视点阵列的边缘线上均匀分布的多个视点,以及位于所述多视点阵列的对角线上的中心视点和顶点视点的中间位置的视点中的至少一种。
在一些实施例中,所述编码单元12具体用于:
对所述第二子层级的至少两个视点进行帧内预测编码或帧间预测编码,得到第二参考帧。
在一些实施例中,所述第二层级包括第三子层级,所述第三子层级包括位于所述多视点阵列的水平中轴线和竖直中轴线上的所述第一子层级和所述第二子层级之间的至少两个视点。
在一些实施例中,所述第二层级还包括第四子层级,所述第四子层级包括位于所述多视点阵列的边缘线上的所述第一子层级的视点之间的视点,以及所述多视点阵列的水平中轴线和竖直中轴线上的所述第三子层级和所述第一子层级之间、所述第三子层级和所述第二子层级之间的至少两个视点。
在一些实施例中,所述第二层级还包括第五子层级,所述第五子层级包括位于所述多视点阵列的边缘线上的所述第二子层级和所述第四子层级之间的至少两个视点、在所述多视点阵列的除边缘线和水平中轴线之外的行上的所述第三子层级和所述第二子层级之间、所述第二子层级和所述第四子层级之间的至少两个视点。
在一些实施例中,所述第二层级还包括第六子层级,所述第六子层级包括位于所述多视点阵列的除边缘线和竖直中轴线之外的列上的所述第三子层级和所述第二子层级之间、所述第二子层级和所述第四子层级之间的至少两个视点。
在一些实施例中,所述第二层级还包括第七子层级,所述第七子层级包括位于所述多视点阵列的除边缘线之外的行中的与所述第六子层级相同行的至少两个视点。
在一些实施例中,所述编码单元12具体用于:
根据所述参考帧,按照从低子层级向高子层级的顺序对所述第二层级中各子层级中的视点依次编码,其中,所述各子层级中每个子层级的视点参考与所述每个子层级相同或更低子层级的视点进行预测编码。
在一些实施例中,所述编码单元12具体用于:
按照一维分层编码结构的编码顺序,对所述多视点阵列的至少两个行逐行编码,其中,对所述多视点阵列的每行内除所述第一子层级和所述第二子层级之外的视点,按照从低子层级向高子层级的顺 序依次编码。
在一些实施例中,所述编码单元12具体用于:
在所述多视点阵列中确定第一部分多视点阵列,其中,所述第一部分多视点阵列包括所述中心视点;
按照一维分层编码结构的编码顺序,对所述第一部分多视点阵列的至少两个行逐行编码。
在一些实施例中,所述第一部分多视点阵列包括所述多视点阵列的上半部分多视点阵列、下半部分多视点阵列、右上部分多视点阵列、左上部分多视点阵列、左下部分多视点阵列或右下部分多视点阵列。
在一些实施例中,,所述多视点阵列还包括第二部分多视点阵列,所述第二部分多视点阵列包括所述中心视点,所述第一部分多视点阵列与所述第二部分多视点阵列在交界处共有至少两个视点;
所述编码单元12还用于:删除所述第一部分多视点阵列中除所述交界处共有的至少两个视点之外的其他视点对应的重建图像。
在一些实施例中,所述多视点阵列通过多台摄像机从多个角度对同一三维场景进行拍摄得到。
应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图10所示的装置10可以执行本申请实施例的编码端的编码方法,并且装置10中的各个单元的前述和其它操作和/或功能分别为了实现上述编码端的编码方法等各个方法中的相应流程,为了简洁,在此不再赘述。
图11是本申请一实施例提供的解码装置的示意性框图,该解码装置应用于上述解码端。
如图11所示,该解码装置20可以包括:
确定单元21,用于确定多视点阵列的分层预测结构;其中,所述分层预测结构包括第一层级和第二层级,所述第一层级包括所述多视点阵列的至少一个视点,所述第二层级包括除所述第一层级之外的其他视点;
解码单元22,用于对所述第一层级的至少一个视点进行预测解码,得到参考帧;
所述解码单元22还用于根据所述参考帧,对所述第二层级的视点进行预测解码,得到重建图像。
在一些实施例中,所述第一层级包括第一子层级,所述第一子层级包括中心视点。
在一些实施例中,所述解码单元22具体用于:
对所述第一子层级的所述中心视点进行帧内预测解码,得到第一参考帧。
在一些实施例中,所述第一层级还包括第二子层级,所述第二子层级包括均匀分布在所述多视点阵列中的至少两个视点。
在一些实施例中,所述第二子层级包括位于所述多视点阵列的边缘线上均匀分布的多个视点,以及位于所述多视点阵列的对角线上的中心视点和顶点视点的中间位置的视点中的至少一种。
在一些实施例中,所述解码单元22具体用于:
对所述第二子层级的至少两个视点进行帧内预测解码或帧间预测解码,得到第二参考帧。
在一些实施例中,所述第二层级包括第三子层级,所述第三子层级包括位于所述多视点阵列的水平中轴线和竖直中轴线上的所述第一子层级和所述第二子层级之间的至少两个视点。
在一些实施例中,所述第二层级还包括第四子层级,所述第四子层级包括位于所述多视点阵列的边缘线上的所述第一子层级的视点之间的视点,以及所述多视点阵列的水平中轴线和竖直中轴线上的所述第三子层级和所述第一子层级之间、所述第三子层级和所述第二子层级之间的至少两个视点。
在一些实施例中,所述第二层级还包括第五子层级,所述第五子层级包括位于所述多视点阵列的边缘线上的所述第二子层级和所述第四子层级之间的至少两个视点、在所述多视点阵列的除边缘线和水平中轴线之外的行上的所述第三子层级和所述第二子层级之间、所述第二子层级和所述第四子层级之间的至少两个视点。
在一些实施例中,所述第二层级还包括第六子层级,所述第六子层级包括位于所述多视点阵列的除边缘线和竖直中轴线之外的列上的所述第三子层级和所述第二子层级之间、所述第二子层级和所述第四子层级之间的至少两个视点。
在一些实施例中,所述第二层级还包括第七子层级,所述第七子层级包括位于所述多视点阵列的除边缘线之外的行中的与所述第六子层级相同行的至少两个视点。
在一些实施例中,所述根据所述参考帧,对所述第二层级的视点进行帧间预测解码,得到重建图像,包括:
根据所述参考帧,按照从低子层级向高子层级的顺序对所述第二层级中各子层级中的视点依次解码,其中,所述各子层级中每个子层级的视点参考与所述每个子层级相同或更低子层级的视点进行预测解码。
在一些实施例中,所述解码单元22具体用于:
按照一维分层解码结构的解码顺序,对所述多视点阵列的至少两个行逐行解码,其中,对所述多视点阵列的每行内除所述第一子层级和所述第二子层级之外的视点,按照从低子层级向高子层级的顺序依次解码。
在一些实施例中,所述解码单元22具体用于:
在所述多视点阵列中确定第一部分多视点阵列,其中,所述第一部分多视点阵列包括所述中心视点;
按照一维分层解码结构的解码顺序,对所述第一部分多视点阵列的至少两个行逐行解码。
在一些实施例中,所述第一部分多视点阵列包括所述多视点阵列的上半部分多视点阵列、下半部分多视点阵列、右上部分多视点阵列、左上部分多视点阵列、左下部分多视点阵列或右下部分多视点阵列。
在一些实施例中,所述多视点阵列还包括第二部分多视点阵列,所述第二部分多视点阵列包括所述中心视点,所述第一部分多视点阵列与所述第二部分多视点阵列在交界处共有至少两个视点;
所述解码单元22还用于:删除所述第一部分多视点阵列中除所述交界处共有的至少两个视点之外的其他视点对应的重建图像。
在一些实施例中,所述多视点阵列通过多台摄像机从多个角度对同一三维场景进行拍摄得到。
应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图11所示的装置20可以对应于执行本申请实施例的解码端的预测方法中的相应主体,并且装置20中的各个单元的前述和其它操作和/或功能分别为了实现解码端的解码方法等各个方法中的相应流程,为了简洁,在此不再赘述。
上文中结合附图从功能单元的角度描述了本申请实施例的装置和系统。应理解,该功能单元可以通过硬件形式实现,也可以通过软件形式的指令实现,还可以通过硬件和软件单元组合实现。具体地,本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成,结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。可选地,软件单元可以位于随机存储器,闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法实施例中的步骤。
图12是本申请实施例提供的电子设备的示意性框图。
如图12所示,该电子设备30可以为本申请实施例所述的视频编码器,或者视频解码器,该电子设备30可包括:
存储器33和处理器32,该存储器33用于存储计算机程序34,并将该程序代码34传输给该处理器32。换言之,该处理器32可以从存储器33中调用并运行计算机程序34,以实现本申请实施例中的方法。
例如,该处理器32可用于根据该计算机程序34中的指令执行上述方法400或500中的步骤。
在本申请的一些实施例中,该处理器32可以包括但不限于:
通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。
在本申请的一些实施例中,该存储器33包括但不限于:
易失性存储器和/或非易失性存储器。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DR RAM)。
在本申请的一些实施例中,该计算机程序34可以被分割成一个或多个单元,该一个或者多个单元被存储在该存储器33中,并由该处理器32执行,以完成本申请提供的方法。该一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述该计算机程序34在该电子设备30中的执行过程。
如图12所示,该电子设备30还可包括:
收发器33,该收发器33可连接至该处理器32或存储器33。
其中,处理器32可以控制该收发器33与其他设备进行通信,具体地,可以向其他设备发送信息或数据,或接收其他设备发送的信息或数据。收发器33可以包括发射机和接收机。收发器33还可以进一步包括天线,天线的数量可以为一个或多个。
应当理解,该电子设备30中的各个组件通过总线系统相连,其中,总线系统除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。
本申请还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被计算机执行时使得该计算机能够执行上述方法实施例的方法。或者说,本申请实施例还提供一种包含指令的计算机程序产品,该指令被计算机执行时使得计算机执行上述方法实施例的方法。
本申请还提供了一种码流,该码流是根据上述编码方法生成的,可选的,该码流中包括上述第一标志,或者包括第一标志和第二标志。
当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
本领域普通技术人员可以意识到,结合本申请中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。例如,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
以上内容,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以该权利要求的保护范围为准。

Claims (39)

  1. 一种编码方法,其特征在于,包括:
    确定多视点阵列的分层预测结构;其中,所述分层预测结构包括第一层级和第二层级,所述第一层级包括所述多视点阵列的至少一个视点,所述第二层级包括除所述第一层级之外的其他视点;
    对所述第一层级的至少一个视点进行预测编码,得到参考帧;
    根据所述参考帧,对所述第二层级的视点进行预测编码,得到重建图像。
  2. 根据权利要求1所述的方法,其特征在于,所述第一层级包括第一子层级,所述第一子层级包括中心视点。
  3. 根据权利要求2所述的方法,其特征在于,所述对所述第一层级的至少一个视点进行预测编码,得到参考帧,包括:
    对所述第一子层级的所述中心视点进行帧内预测编码,得到第一参考帧。
  4. 根据权利要求2所述的方法,其特征在于,所述第一层级还包括第二子层级,所述第二子层级包括均匀分布在所述多视点阵列中的至少两个视点。
  5. 根据权利要求4所述的方法,其特征在于,所述第二子层级包括位于所述多视点阵列的边缘线上均匀分布的多个视点,以及位于所述多视点阵列的对角线上的中心视点和顶点视点的中间位置的视点中的至少一种。
  6. 根据权利要求4所述的方法,其特征在于,所述对所述第一层级的至少一个视点进行预测编码,得到参考帧,包括:
    对所述第二子层级的至少两个视点进行帧内预测编码或帧间预测编码,得到第二参考帧。
  7. 根据权利要求4所述的方法,其特征在于,所述第二层级包括第三子层级,所述第三子层级包括位于所述多视点阵列的水平中轴线和竖直中轴线上的所述第一子层级和所述第二子层级之间的至少两个视点。
  8. 根据权利要求7所述的方法,其特征在于,所述第二层级还包括第四子层级,所述第四子层级包括位于所述多视点阵列的边缘线上的所述第一子层级的视点之间的视点,以及所述多视点阵列的水平中轴线和竖直中轴线上的所述第三子层级和所述第一子层级之间、所述第三子层级和所述第二子层级之间的至少两个视点。
  9. 根据权利要求8所述的方法,其特征在于,所述第二层级还包括第五子层级,所述第五子层级包括位于所述多视点阵列的边缘线上的所述第二子层级和所述第四子层级之间的至少两个视点、在所述多视点阵列的除边缘线和水平中轴线之外的行上的所述第三子层级和所述第二子层级之间、所述第二子层级和所述第四子层级之间的至少两个视点。
  10. 根据权利要求9所述的方法,其特征在于,所述第二层级还包括第六子层级,所述第六子层级包括位于所述多视点阵列的除边缘线和竖直中轴线之外的列上的所述第三子层级和所述第二子层级之间、所述第二子层级和所述第四子层级之间的至少两个视点。
  11. 根据权利要求10所述的方法,其特征在于,所述第二层级还包括第七子层级,所述第七子层级包括位于所述多视点阵列的除边缘线之外的行中的与所述第六子层级相同行的至少两个视点。
  12. 根据权利要求7-11任一项所述的方法,其特征在于,所述根据所述参考帧,对所述第二层级的视点进行预测编码,得到重建图像,包括:
    根据所述参考帧,按照从低子层级向高子层级的顺序对所述第二层级中各子层级中的视点依次编码,其中,所述各子层级中每个子层级的视点参考与所述每个子层级相同或更低子层级的视点进行预测编码。
  13. 根据权利要求12所述的方法,其特征在于,所述根据所述参考帧,按照从低子层级向高子层级的顺序对所述第二层级中各子层级中的视点依次编码,包括:
    按照一维分层编码结构的编码顺序,对所述多视点阵列的至少两个行逐行编码,其中,对所述多视点阵列的每行内除所述第一子层级和所述第二子层级之外的视点,按照从低子层级向高子层级的顺序依次编码。
  14. 根据权利要求13所述的方法,其特征在于,还包括:
    在所述多视点阵列中确定第一部分多视点阵列,其中,所述第一部分多视点阵列包括所述中心视点;
    其中,所述按照一维分层编码结构的编码顺序,对所述多视点阵列的至少两个行逐行编码,包括:
    按照一维分层编码结构的编码顺序,对所述第一部分多视点阵列的至少两个行逐行编码。
  15. 根据权利要求14所述的方法,其特征在于,所述第一部分多视点阵列包括所述多视点阵列的上半部分多视点阵列、下半部分多视点阵列、右上部分多视点阵列、左上部分多视点阵列、左下部 分多视点阵列或右下部分多视点阵列。
  16. 根据权利要求14或15所述的方法,其特征在于,所述多视点阵列还包括第二部分多视点阵列,所述第二部分多视点阵列包括所述中心视点,所述第一部分多视点阵列与所述第二部分多视点阵列在交界处共有至少两个视点;
    所述方法还包括:
    删除所述第一部分多视点阵列中除所述交界处共有的至少两个视点之外的其他视点对应的重建图像。
  17. 根据权利要求1-16任一项所述的方法,其特征在于,所述多视点阵列通过多台摄像机从多个角度对同一三维场景进行拍摄得到。
  18. 一种解码方法,其特征在于,包括:
    确定多视点阵列的分层预测结构;其中,所述分层预测结构包括第一层级和第二层级,所述第一层级包括所述多视点阵列的至少一个视点,所述第二层级包括除所述第一层级之外的其他视点;
    对所述第一层级的至少一个视点进行预测解码,得到参考帧;
    根据所述参考帧,对所述第二层级的视点进行预测解码,得到重建图像。
  19. 根据权利要求18所述的方法,其特征在于,所述第一层级包括第一子层级,所述第一子层级包括中心视点。
  20. 根据权利要求19所述的方法,其特征在于,所述对所述第一层级的至少一个视点进行预测解码,得到参考帧,包括:
    对所述第一子层级的所述中心视点进行帧内预测解码,得到第一参考帧。
  21. 根据权利要求19所述的方法,其特征在于,所述第一层级还包括第二子层级,所述第二子层级包括均匀分布在所述多视点阵列中的至少两个视点。
  22. 根据权利要求21所述的方法,其特征在于,所所述第二子层级包括位于所述多视点阵列的边缘线上均匀分布的多个视点,以及位于所述多视点阵列的对角线上的中心视点和顶点视点的中间位置的视点中的至少一种。
  23. 根据权利要求21所述的方法,其特征在于,所述对所述第一层级的至少一个视点进行预测解码,得到参考帧,包括:
    对所述第二子层级的至少两个视点进行帧内预测解码或帧间预测解码,得到第二参考帧。
  24. 根据权利要求21所述的方法,其特征在于,所述第二层级包括第三子层级,所述第三子层级包括位于所述多视点阵列的水平中轴线和竖直中轴线上的所述第一子层级和所述第二子层级之间的至少两个视点。
  25. 根据权利要求24所述的方法,其特征在于,所述第二层级还包括第四子层级,所述第四子层级包括位于所述多视点阵列的边缘线上的所述第一子层级的视点之间的视点,以及所述多视点阵列的水平中轴线和竖直中轴线上的所述第三子层级和所述第一子层级之间、所述第三子层级和所述第二子层级之间的至少两个视点。
  26. 根据权利要求25所述的方法,其特征在于,所述第二层级还包括第五子层级,所述第五子层级包括位于所述多视点阵列的边缘线上的所述第二子层级和所述第四子层级之间的至少两个视点、在所述多视点阵列的除边缘线和水平中轴线之外的行上的所述第三子层级和所述第二子层级之间、所述第二子层级和所述第四子层级之间的至少两个视点。
  27. 根据权利要求26所述的方法,其特征在于,所述第二层级还包括第六子层级,所述第六子层级包括位于所述多视点阵列的除边缘线和竖直中轴线之外的列上的所述第三子层级和所述第二子层级之间、所述第二子层级和所述第四子层级之间的至少两个视点。
  28. 根据权利要求27所述的方法,其特征在于,所述第二层级还包括第七子层级,所述第七子层级包括位于所述多视点阵列的除边缘线之外的行中的与所述第六子层级相同行的至少两个视点。
  29. 根据权利要求24-28任一项所述的方法,其特征在于,所述根据所述参考帧,对所述第二层级的视点进行预测解码,得到重建图像,包括:
    根据所述参考帧,按照从低子层级向高子层级的顺序对所述第二层级中各子层级中的视点依次解码,其中,所述各子层级中每个子层级的视点参考与所述每个子层级相同或更低子层级的视点进行预测解码。
  30. 根据权利要求29所述的方法,其特征在于,所述根据所述参考帧,按照从低子层级向高子层级的顺序对所述第二层级中各子层级中的视点依次解码,包括:
    按照一维分层解码结构的解码顺序,对所述多视点阵列的至少两个行逐行解码,其中,对所述多视点阵列的每行内除所述第一子层级和所述第二子层级之外的视点,按照从低子层级向高子层级的顺 序依次解码。
  31. 根据权利要求30所述的方法,其特征在于,还包括:
    在所述多视点阵列中确定第一部分多视点阵列,其中,所述第一部分多视点阵列包括所述中心视点;
    其中,所述按照一维分层解码结构的解码顺序,对所述多视点阵列的至少两个行逐行解码,包括:
    按照一维分层解码结构的解码顺序,对所述第一部分多视点阵列的至少两个行逐行解码。
  32. 根据权利要求31所述的方法,其特征在于,所述第一部分多视点阵列包括所述多视点阵列的上半部分多视点阵列、下半部分多视点阵列、右上部分多视点阵列、左上部分多视点阵列、左下部分多视点阵列或右下部分多视点阵列。
  33. 根据权利要求31或32所述的方法,其特征在于,所述多视点阵列还包括第二部分多视点阵列,所述第二部分多视点阵列包括所述中心视点,所述第一部分多视点阵列与所述第二部分多视点阵列在交界处共有至少两个视点;
    所述方法还包括:
    删除所述第一部分多视点阵列中除所述交界处共有的至少两个视点之外的其他视点对应的重建图像。
  34. 根据权利要求18-33任一项所述的方法,其特征在于,所述多视点阵列通过多台摄像机从多个角度对同一三维场景进行拍摄得到。
  35. 一种编码装置,其特征在于,包括:
    确定单元,用于确定多视点阵列的分层预测结构;其中,所述分层预测结构包括第一层级和第二层级,所述第一层级包括所述多视点阵列的至少一个视点,所述第二层级包括除所述第一层级之外的其他视点;
    编码单元,用于对所述第一层级的至少一个视点进行预测编码,得到参考帧;
    所述编码单元还用于根据所述参考帧,对所述第二层级的视点进行帧间预测编码,得到重建图像。
  36. 一种解码装置,其特征在于,包括:
    确定单元,用于确定多视点阵列的分层预测结构;其中,所述分层预测结构包括第一层级和第二层级,所述第一层级包括所述多视点阵列的至少一个视点,所述第二层级包括除所述第一层级之外的其他视点;
    解码单元,对所述第一层级的至少一个视点进行预测解码,得到参考帧;
    所述解码单元还用于根据所述参考帧,对所述第二层级的视点进行帧间预测解码,得到重建图像。
  37. 一种电子设备,其特征在于,包括处理器和存储器;
    所示存储器用于存储计算机程序;
    所述处理器用于调用并运行所述存储器中存储的计算机程序,以实现上述权利要求1至34任一项所述的方法。
  38. 一种计算机可读存储介质,其特征在于,用于存储计算机程序;
    所述计算机程序使得计算机执行如上述权利要求1至34任一项所述的方法。
  39. 一种码流,其特征在于,所述码流是基于如上述权利要求1至16任一项所述的方法生成的。
CN202280100094.2A 2022-10-14 2022-10-14 编解码方法、装置、设备、及存储介质 Pending CN119856485A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2022/125490 WO2024077616A1 (zh) 2022-10-14 2022-10-14 编解码方法、装置、设备、及存储介质

Publications (1)

Publication Number Publication Date
CN119856485A true CN119856485A (zh) 2025-04-18

Family

ID=90668583

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280100094.2A Pending CN119856485A (zh) 2022-10-14 2022-10-14 编解码方法、装置、设备、及存储介质

Country Status (2)

Country Link
CN (1) CN119856485A (zh)
WO (1) WO2024077616A1 (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101012760B1 (ko) * 2008-09-05 2011-02-08 에스케이 텔레콤주식회사 다시점 비디오의 송수신 시스템 및 방법
CN101867813B (zh) * 2010-04-23 2012-05-09 南京邮电大学 面向交互式应用的多视点视频编码方法
KR20120118781A (ko) * 2011-04-19 2012-10-29 삼성전자주식회사 다시점 비디오를 위한 단일화된 스케일러블 비디오 부호화 방법 및 그 장치, 다시점 비디오를 위한 단일화된 스케일러블 비디오 복호화 방법 및 그 장치
US20150124877A1 (en) * 2012-04-25 2015-05-07 Samsung Electronics Co., Ltd. Multiview video encoding method using reference picture set for multiview video prediction and device therefor, and multiview video decoding method using reference picture set for multiview video prediction and device therefor
CN105472367A (zh) * 2015-11-23 2016-04-06 浙江大学 基于gop片划分的支持空域随机访问的自适应多视点视频编码方法
CN110392258B (zh) * 2019-07-09 2021-03-16 武汉大学 一种联合时空边信息的分布式多视点视频压缩采样重建方法

Also Published As

Publication number Publication date
WO2024077616A1 (zh) 2024-04-18

Similar Documents

Publication Publication Date Title
US11917130B2 (en) Error mitigation in sub-picture bitstream based viewpoint dependent video coding
ES2989421T3 (es) Un codificador, un decodificador y métodos correspondientes para la intrapredicción
CN112514393B (zh) 解码视频序列的方法、装置和存储介质
WO2020228744A1 (en) An encoder, a decoder and corresponding methods using ibc dedicated buffer and default value refreshing for luma and chroma component
CN112005551B (zh) 一种视频图像预测方法及装置
US20130271565A1 (en) View synthesis based on asymmetric texture and depth resolutions
US11741635B2 (en) Partitioning a 3D space based on dimensions of the 3D space
CN110800303A (zh) 用于360度视频译码的参考图片推导及运动补偿
US20220114568A1 (en) Method and apparatus for video coding
BR112021004442A2 (pt) método de decodificação de vídeo e decodificador de vídeo
TW201436539A (zh) 在三維視訊寫碼中之可適性明度補償
CN110881127A (zh) 控制残差编码的方法、装置、计算机设备和存储介质
BR112016000465B1 (pt) Previsão de paleta em codificação de vídeo com base em paleta
CN105308966A (zh) 视频编码方法及其设备以及视频解码方法及其设备
ES2984615T3 (es) Interpredicción de video basada en flujo óptico
CN113302663B (zh) 点云译码中的有效patch旋转
KR102817818B1 (ko) 픽처 예측 방법 및 장치, 및 컴퓨터 판독 가능형 저장 매체
US20210329252A1 (en) Motion information acquisition method and device for video encoding or decoding
CN114913249B (zh) 编码、解码方法和相关设备
CN105264890A (zh) 用于补偿亮度差的层间视频编码方法和设备以及层间视频解码方法和设备
CN114342393A (zh) 基于变换的图像编译方法及其设备
US20230131478A1 (en) Transform-based video coding method, and device therefor
CN119856485A (zh) 编解码方法、装置、设备、及存储介质
CN118541733A (zh) 位置压缩中的网格顶点分组
US20240282010A1 (en) Adaptive integrating duplicated vertices in mesh motion vector coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination