CN101895744B - 处理多视图视频 - Google Patents

处理多视图视频 Download PDF

Info

Publication number
CN101895744B
CN101895744B CN 201010135987 CN201010135987A CN101895744B CN 101895744 B CN101895744 B CN 101895744B CN 201010135987 CN201010135987 CN 201010135987 CN 201010135987 A CN201010135987 A CN 201010135987A CN 101895744 B CN101895744 B CN 101895744B
Authority
CN
China
Prior art keywords
view
information
bit stream
views
auxiliary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 201010135987
Other languages
English (en)
Other versions
CN101895744A (zh
Inventor
梁正休
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020060037773A external-priority patent/KR20070076356A/ko
Priority claimed from KR1020060110338A external-priority patent/KR20070076392A/ko
Priority claimed from KR1020060110337A external-priority patent/KR20070076391A/ko
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN101895744A publication Critical patent/CN101895744A/zh
Application granted granted Critical
Publication of CN101895744B publication Critical patent/CN101895744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及处理多视图视频。对视频信号进行解码包括:接收比特流,该比特流包括根据第一简表编码的视频信号和简表信息,该第一简表表示从一组简表中选择的简表,该组简表包括用于单个视图视频信号的多个简表和用于多视图视频信号的至少一个简表,该简表信息标识该第一简表。从该比特流提取简表信息。根据所确定的简表来解码视频信号。

Description

处理多视图视频
本申请是2008年8月1日进入中国的、申请日为2007年1月12日、申请号为200780003120.5(PCT/KR2007/000228),发明名称为“处理多视图视频”的专利申请的分案申请。
技术领域
本发明涉及处理多视图视频。
背景技术
多视图视频编码(MVC)涉及压缩通常由对应照相机获取的视频序列(例如,图像或者“图像”序列)。视频序列或者“视图”能够根据标准例如MPEG编码。视频序列中的图像能够表示全视频帧或者视频帧的场。条带(slice)是图像的独立编码部分,条带包括图像中的一些或者所有的宏块,并且宏块包括图像元素(或者“像素”)的块。
视频序列能够根据H.264/AVC编解码器技术被编码成多视图视频序列,并且很多研发者对标准的修订进行研究以适应多视图视频序列。
在当前H.264标准中规定了用于支持特定功能的三个简表(profile)。术语“简表”表示用于视频编码/解码算法的技术元素的标准化。换言之,简表是为解码压缩序列的比特流而规定的一组技术元素,并且可以被认为是子标准。上述三个简表是基线简表、主要简表和扩展简表。在H.264标准中定义了用于编码器和解码器的各种功能,从而编码器和解码器能够分别地与基线简表、主要简表和扩展简表兼容。
根据用于处理运动图像编码(即序列编码)的视频编码层(VCL)以及与能够发送/存储编码信息的子系统相关联的网络提取层(NAL),构造用于H.264/AVC标准的比特流。编码过程的输出数据是VCL数据,并且在它被发送或者存储之前被映射成NAL单元。每一个NAL单元包括对应于压缩视频数据或者头部信息的原始字节序列载荷(RBSP)。
NAL单元包括NAL头部和RBSP。NAL头部包括标志信息(例如,nal_ref_idc)和标识(ID)信息(例如,nal_unit_type)。标志信息“nal_ref_idc”指示用作NAL单元参考图像的条带是否存在。ID信息“nal_unit_type”指示NAL单元的简表型。RBSP存储压缩后的原始数据。RBSP末位能够被添加到RBSP的最后部分,从而RBSP的长度能够由8比特的倍数来表示。
存在各种NAL单元,例如,即时解码刷新(IDR)图像、序列参数集(SPS)、图像参数集(PPS)和补充增强信息(SEI)等。
该标准通常使用各种简表和级来定义目标产品,从而能够以适当成本实现目标产品。解码器满足在对应的简表和级处的预定约束。
简表和级能够指示解码器的功能或者参数,从而它们指示解码器能够处理哪些压缩图像。指示多个简表中的哪一个对应于比特流的特定信息能够利用简表ID信息来标识。简表ID信息“profile_idc”提供用于标识与比特流相关联的简表的标志。H.264/AVC标准包括三个简表标识符(IDs)。如果简表ID信息“profile idc”被设为“66”,则比特流基于基线简表。如果简表ID信息“profile_idc”被设为“77”,则比特流基于主要简表。如果简表ID信息“profile_idc”被设为“88”,则比特流基于扩展简表。上述“profile_idc”信息可以例如被包含在SPS(序列参数集)中。
发明内容
在一个方面中,通常,一种用于解码视频信号的方法包括:接收比特流,该比特流包括根据第一简表编码的视频信号和标识该第一简表的简表信息,第一简表表示从包括用于多视图视频信号的至少一个简表的一组多个简表中做出的选择;从该比特流提取简表信息;以及根据确定的简表来解码视频信号。
本发明的方面能够包括下面的特征中的一个或者多个。
该方法还包括:当确定的简表对应于多视图视频信号时,从比特流提取与多个视图相关联的配置信息,其中,该配置信息包括如下信息中的至少一个:表示在各个视图之间的依赖关系的视图依赖信息、指示参考视图的视图标识信息、指示视图数目的视图数目信息、用于提供视图缩放性的视图级信息,以及指示照相机布局的视图布局信息。例如,能够响应于确定所述简表对应于多视图视频信号而提取所述配置信息。
所述简表信息位于比特流的头部中。
所述视图依赖信息以二维数据结构表示所述依赖关系。
二维数据结构包括矩阵。
视图级信息对应于在多视图视频信号的视图中根据分层视图预测结构被分配给视图的多个级。
给定视图的给定图像的多个部分与指示对应级的对应标识符相关联。
该多个部分对应于给定图像的独立条带。
每一个条带对应于全图像。
被分配给定级的视图的图像利用分配比该给定级更低的级的视图的图像进行预测。
不从另一级的图像对分配最低级的单个视图的图像进行预测。
分层视图预测结构包括单个基础视图和多个辅助视图,其中,基于基础视图中的图像来预测第一级视图中的图像,并且在给定的更高级视图中的图像则基于比该给定更高级视图的级更低的级中的视图进行预测。
在另一个方面中,通常,一种用于解码多视图视频信号的方法包括:接收比特流,该比特流包括根据各个视图之间的依赖关系编码的多视图视频信号以及视频依赖信息,该视频依赖信息利用二维数据结构表示该依赖关系;提取所述二维数据结构并且根据所提取的数据结构来确定该依赖关系;并且根据确定的依赖关系来解码多视图视频信号。
本发明的方面能够包括下面的特征中的一个或者多个。
二维数据结构包括矩阵。
该方法还包括:从比特流提取配置信息,该配置信息包括如下信息中的至少一个:指示参考视图的视图标识信息、指示视图数目的视图数目信息、用于提供视图缩放性的视图级信息,以及指示照相机布局的视图布局信息。
视图级信息对应于在多视图视频信号的视图中根据分层视图预测结构被分配给视图的多个级。
给定视图的给定图像的多个部分与指示对应级的对应标识符相关联。
该多个部分对应于给定图像的独立条带。
每一个条带对应于全图像。
被分配给定级的视图的图像利用被分配比给定级更低的级的视图的图像进行预测。
不利用另一级的图像对分配最低级的单个视图的图像进行预测。
分层视图预测结构包括单个基础视图和多个辅助视图,其中,基于基础视图中的图像来预测第一级视图中的图像,并且在给定更高级视图中的图像则基于在比该给定更高级视图的级更低的级中的视图进行预测。
在另一方面,通常,对于各种解码方法来说,一种用于编码视频信号的方法包括:产生能够通过对应解码方法被解码成视频信号的比特流。例如,在另一方面,通常,一种用于编码比特流的方法包括:根据第一简表形成比特流,该第一简表表示从一组简表选择的简表,该组简表包括用于单视图视频信号的多个简表以及用于多视图视频信号的至少一个简表,以及形成标识该第一简表的简表信息。在另一方面,通常,一种用于编码比特流的方法包括:根据各个视图之间的依赖关系形成比特流,以及形成利用二维数据结构表示该依赖关系的视频依赖信息。
在另一方面,通常,对于各种解码方法来说,在计算机可读介质上存储的计算机程序包括用于致使计算机执行对应的解码方法的指令。
在另一方面,通常,对于各种解码方法来说,在机器可读信息载体上实现的图像数据能够利用对应的解码方法被解码成视频信号。
在另一方面,通常,对于各种解码方法来说,解码器包括用于执行对应的解码方法的装置。
在另一方面,通常,对于各种解码方法来说,编码器包括用于产生能够利用对应的解码方法解码成视频信号的比特流的装置。
在另一方面,通常,一种用于编码多视图序列的方法包括:通过编码在数个视图(即多视图)处获取的图像来产生比特流,其中如果多视图(m)的数目被设为 2n-1<m≤2n,则该比特流包括单个基础视图比特流和N层辅助视图比特流。
在另一方面,通常,提供一种用于编码多视图序列的方法,包括:通过编码在数个二维(2D)视图(即2D多视图)处获取的图像产生比特流,其中,如果2D多视图在水平轴上的数目(m)被设为2n-1<m≤2n,并且2D多视图在垂直轴上的数目(p)被设为2k-1<p≤2k,则该比特流包括单个基础视图比特流和(n+k)个分层辅助视图比特流。
在又一方面,通常,提供一种用于解码多视图序列的方法,包括:接收在数个视图(即多视图)处获取的图像的编码比特流,其中如果多视图(m)的数目被设为2n-1<m≤2n,则该比特流包括单个基础视图比特流和N个分层辅助视图比特流,并且根据所接收的比特流选择性地解码该基础视图比特流和/或该N个分层辅助视图比特流。
在又一方面,通常,提供一种用于解码多视图序列的方法,包括:通过对在数个二维(2D)视图(即2D多视图)处获取的图像进行编码来接收比特流,其中,如果2D多视图在水平轴上的数目(m)被设为2n-1<m≤2n,并且2D多视图在垂直轴上的数目(p)被设为2k-1<p≤2k,则该比特流包括单个基础视图比特流和(n+k)个分层辅助视图比特流,并且根据所接收的比特流来选择性地解码该基础视图比特流和/或该(n+k)个分层辅助视图比特流。
在又一方面,通常,提供一种用于编码多视图序列的方法,包括:通过对在m个视图(即m的多视图)处获取的图像编码而产生比特流,其中,该比特流包括单个基础视图比特流和至少一个辅助视图比特流,该多视图的两端被分别地设为第一视图,该多视图中的中心视图被设为第二视图,基于第二视图沿着两个方向通过跳过至少一个视图而接连布局的视图被分别地设为第三视图,除了第一到第三视图之外的其余视图被分别地设为第四视图,并且第一到第三视图中的任何一个被设为用于独立编码的基础视图,且除了基础视图之外的其余视图被设为用于预测编码的辅助视图。
在又一方面,通常,提供一种用于编码多视图序列的方法,包括:通过对在m个视图(即m的多视图)处获取的图像编码而产生比特流,其中,该比特流包括单个基础视图比特流和至少一个辅助视图比特流,基础视图的位置被设为位于多视图的中心部分处的视图,第二辅助视图的位置被设为位于多视图的两端处的视图,并且通过基于基础视图沿着两个方向跳过至少一个视图来接连布局第一辅助视图的位置。
在又一方面,通常,提供一种用于解码多视图序列的方法,包括:接收在m个视图(即m的多视图)处获取的图像的编码比特流,其中,该比特流包括单个基础视图比特流和至少一个辅助视图比特流,通过独立解码多视图中的中心视图的数据来恢复所接收比特流中的基础视图图像,使用所接收的比特流中的基础视图图像来恢复第一辅助视图的图像,第一辅助视图是通过基于基础视图沿着两个方向跳过至少一个视图而接连布局的视图,并且使用所接收比特流中的基础视图图像来恢复第二辅助视图的图像,第二辅助视图是位于多视图两端的视图。
在又一方面,通常,提供一种用于解码多视图序列的方法,包括:接收在m个视图(即,m的多视图)处获取的图像的编码比特流,其中,该比特流包括单个基础视图比特流和至少一个辅助视图比特流;从所接收的比特流读出基础视图的位置信息,通过该位置信息标识基础视图和辅助视图的位置,并且恢复基础视图和辅助视图的图像,其中,基础视图的位置信息表示位于多视图两端处的第一视图、位于多视图中心处的第二视图以及通过基于第二视图沿着两个方向跳过至少一个视图而被接连布局的第三视图中的任何一个。
在又一方面,通常,一种用于编码视频序列的方法包括:当产生比特流时从数个简表中选择至少一个简表;并且在所述简表中包括与视频序列相关联的至少一个配置信息。
在又一方面,通常,提供一种用于解码视频序列的方法,包括:从所接收的比特流提取至少一个简表信息;基于所提取的简表信息提取在所述简表中包含的至少一个配置信息;并且使用所提取的配置信息来解码该比特流。
在又一方面,通常,提供一种用于编码视频序列的设备,包括:用于当产生比特流时从数个简表中选择至少一个简表的装置;和用于将所接收的视频序列的至少一个配置信息包括在所选择简表中的装置。
在又一方面,通常,提供一种用于解码视频序列的设备,包括:用于从所接收的比特流提取至少一个简表信息的装置;用于基于所提取的简表信息提取在该简表中包含的至少一个配置信息的装置;和用于使用所提取的配置信息来解码该比特流的装置。
本发明的方面可以具有以下的一个或多个优点。
用于编码/解码多视图序列的方法能够有效地编码多视图序列。在对多视图序列进行解码期间,在解码多视图序列期间能够以分层方式显示各个视图。该方法在编码多视图序列期间建立各个视图图像的预测结构。因此,虽然多视图数目增加并且阵列被扩展,该方法能够以与上述优选实施例相同的方式扩展预测结构。另外,该方法使用分层结构执行多视图的视图缩放性功能,从而它能够执行编码/解码过程以适用于在接受端中包含的各种显示器,结果实现了一种有效的编码/解码系统。
用于编码/解码视频序列的方法当处理由数个照相机捕获的多视图序列时,向编码器和解码器发送指示视图数目的“num_views”信息。该编码/解码方法能够指定用作整个视图的基础的参考视图。能够彼此独立地编码参考视图序列而不参考另一视图序列。该编码/解码方法能够通过参考″view_arrangement″信息而根据各个布局有效地执行编码/解码过程。
该编码/解码方法能够标识简表类型,能够添加与视频序列相关联的各种配置,并且能够使用所添加的信息有效地执行编码/解码过程。
从下面的说明以及从权利要求可以清楚其它特征和优点。
附图说明
图1是示例性解码设备。
图2是示出序列参数集RBSP语法的结构图示。
图3A是示出包括仅仅一个序列的比特流的结构图示。
图3B是示出包括两个序列的比特流的结构图示。
图4A-4C是示出示例性GOP组(GGOP)结构的图示。
图5是示出用于解码视频序列的方法的流程图。
图6A-6B、7A-7B和8是示出多视图序列预测结构的实例的图示。
图9A-9B是示出在多视图序列数据的数个观点之间的分层预测结构的图示。
图10A-10B是示出二维(2D)多视图序列数据的预测结构的图示。
图11A-11C是示出多视图序列预测结构的图示。
图12是示出分层编码/解码系统的图示。
具体实施方式
为了有效处理多视图序列,输入比特流包括允许解码设备判定输入比特流是否与多视图简表有关的信息。在确定输入比特流涉及多视图简表的情形中,根据语法将与多视图序列相关联的补充信息添加到比特流并且发送到解码器。例如,多视图简表ID能够指示用于根据H.264/AVC标准的修订来处理多视图视频数据的简表模式。
MVC(多视图视频编码)技术是H.264/AVC标准的修订技术。即,作为补充信息为MVC模式添加特定语法。用于支持MVC技术的这种修订能够比其中使用无条件语法的备选方案更加有效。例如,如果AVC技术的简表标识符指示多视图简表,则添加多视图序列信息可以提高编码效率。
H.264/AVC比特流的序列参数集(SPS)指示包括与整个序列编码相关联的信息(例如简表和级)的头部信息。
全部压缩后的运动图像(即序列)能够以序列头部开始,从而对应于头部信息的序列参数集(SPS)早于由参数集参考的数据到达解码器。结果,序列参数集RBSP在进口S1处用作运动图像的压缩数据的头部信息(图2)。如果接收到比特流,则简表ID信息“profile_idc”标识数个简表中哪一个简表对应于接收到的比特流。
简 表 ID 信 息 “ profile_idc”能够被例如设为“MULTI_VIEW_ROFILE”,从而包括简表ID信息的语法能够确定所接收的比特流是否涉及多视图简表。当所接收的比特流涉及多视图简表时,能够添加下面的配置信息。
图1是示出用于解码含有多视图视频序列的视频信号的多视图视频系统的示例性解码设备(或者“解码器”)的框图。多视图视频系统包括对应的编码设备(或者“编码器”),以提供多视图视频序列作为比特流,该比特流包括在机器可读信息载体(例如机器可读存储介质或者在发送器和接收器之间传播的机器可读能量信号)上实施的编码图像数据。
参考图1,解码设备包括解析单元10、熵解码单元11、反量化/反变换单元12、帧间预测单元13、帧内预测单元14、解块滤波器15和解码图像缓存器16。
帧间预测单元13包括运动补偿单元17、亮度补偿单元18和亮度补偿偏移预测单元19。
解析单元10对在NAL单元中所接收的视频序列执行解析以解码所接收的视频序列。一般地,在对条带头部和条带数据进行解码之前,一个或者多个序列参数集和图像参数集被发送到解码器。在此情形中,NAL头部或者NAL头部的扩展区域可以包括各种配置信息,例如时域级信息、视图级信息、锚图像ID信息和视图ID信息等。
术语“时间级信息”表示用于从视频信号提供时域缩放性的分层结构信息,从而经由上述时域级信息能够将各种时间区的序列提供给用户。
术语“视图级信息”表示用于从视频信号提供视图缩放性的分层结构信息。多视图视频序列能够限定时域级和视图级,从而根据所限定的时域级和视图级,能够将各种时域序列和视图序列提供给用户。
以此方式,如果如上所述限定级信息,则用户可以采用时域缩放性和视图缩放性。因此,用户能够查看对应于所需时间和视图的序列,或者能够查看对应于另一限制的序列。也可以根据参考条件以各种方式建立上述级信息。例如,可以根据照相机位置改变级信息,并且也可以根据照相机布局类型来改变级信息。另外,也可以不加任何特定参考地任意建立级信息。
术语“锚图像”表示其中所有条带仅仅指的是当前视图中的条带而非其它视图中的条带的编码图像。在视图之间的随机访问能够被用于多视图序列解码。
锚图像ID信息能够被用于执行随机访问过程,以访问特定视图的数据而无需解码大量数据。
术语“视图ID信息”表示用于区别当前视图的图像和另一视图的图像的特定信息。当视频序列信号被编码时,为了将一个图像从其它图像区别开,能够使用图像序列号(POC)和帧数信息(frame_num)。
如果当前序列被确定为多视图视频序列,则能够执行帧间视图预测。标识符被用于区别当前视图的图像与另一视图的图像。
能够定义视图标识符以指示图像的视图。解码设备能够使用上述视图标识符来获得不同于当前图像的视图的视图中的图像的信息,从而它能够使用图像的信息来解码视频信号。上述视图标识符能够被应用于视频信号的全部编码/解码过程。而且,上述视图标识符也能够被应用于考虑视图使用帧数信息“frame_num”的多视图视频编码过程。
一般地,多视图序列具有大量数据,并且每一个视图的分层编码功能(也被称为“视图缩放性”)能够被用于处理该大量数据。为了执行视图缩放性功能,可以定义考虑多视图序列的视图的预测结构。
可以通过结构化数个视图序列的预测次序或者方向来定义上述预测结构。例如,如果给定要被编码的数个视图序列,则总体布局的中心位置被设为基础视图,从而能够分层地选择要被编码的视图序列。总体布局的端部或者其它部分可以被设为基础视图。
如果照相机视图的数目由“2”的指数幂表示,可以基于由“2”的指数幂表示的照相机视图的上述情形,形成在数个视图序列之间的分层预测结构。否则,如果照相机视图的数目不由“2”的指数幂表示,则能够使用虚拟视图,并且可以基于虚拟视图来形成预测结构。如果照相机布局表示二维布局,则可以沿着水平或者垂直方向交替地形成预测次序。
被解析的比特流由熵解码单元11进行熵解码,并且提取例如每一个宏块的系数、运动矢量等的数据。反量化/反变换单元12用预定常数去乘所接收的量化值以获取变换后的系数值,并且对所获取的系数值执行变换,从而它重构像素值。帧间预测单元13使用重构的像素值由当前图像的解码样本来执行帧间预测功能。
同时,解块滤波器15被应用于每一个解码的宏块以减少块失真程度。解块滤波器15执行块边缘的平滑,从而它提高解码帧的图像质量。滤波过程的选择依赖于边界强度和在边界附近布局的图像样本的梯度。已滤波图像被存储在解码图像缓存器16中,从而它们能够被输出或者被用作参考图像。
解码图像缓存器16存储或者输出预编码图像以执行帧间预测功能。在此情形中,图像的帧数信息“frame_num”和POC(图像序列号)信息被用于存储或者输出预编码图像。在MVC技术的情形中,其它视图的图像可以存在于上述预编码图像中。因此,为了使用上述图像作为参考图像,可以根据需要不仅使用“frame_num”和POC信息,而且使用指示图像视图的视图标识符。
帧间预测单元13使用在解码图像缓存器16中存储的参考图像来执行帧间预测。帧间编码宏块可以被划分成宏块部分。每一个宏块部分能够利用一个或者两个参考图像预测。
运动补偿单元17使用从熵解码单元11接收的信息来补偿当前块的运动。运动补偿单元17从视频信号提取当前块的相邻块的运动矢量,并且获得当前块的运动矢量预测器。运动补偿单元17使用从视频信号和所获得的运动矢量预测器提取的运动矢量和预测器之间的差值来补偿当前块的运动。上述运动补偿可以利用仅仅一个参考图像执行,或者也可以利用多个参考图像执行。
因此,如果上述参考图像被确定为不同于当前视图的其它视图的图像,则可以根据指示其它视图的视图标识符来执行运动补偿。
直接模式表示用于基于被完全解码的块的运动信息来预测当前块的运动信息的编码模式。上述直接模式能够减少用于编码运动信息所需要的位数,结果提高压缩效率。
例如,时域直接模式使用时域方向的运动信息的相关性来预测当前块的运动信息。类似于时域直接模式,解码器能够使用视图方向的运动信息的相关性来预测当前块的运动信息。
如果所接收的比特流对应于多视图序列,则可以分别地由不同照相机捕获视图序列,从而由于照相机的内部或者外部因素导致可以发生亮度差异。为了减少与亮度差异相关联的潜在的效率低下问题,亮度补偿单元18执行亮度补偿功能。
在执行亮度补偿功能的情形中,标志信息可以用于指示是否执行在视频信号的特定级处的亮度补偿。例如,亮度补偿单元18可以使用指示是否执行对应的条带或者宏块的亮度补偿的标志信息来执行亮度补偿功能。而且,用于使用上述标志信息来执行亮度补偿的上述方法可以被应用于各种宏块类型(例如16×16模式、B跳过(B-skip)模式、直接模式等)。
当执行亮度补偿时,为了重构当前块,可以使用相邻块的信息或者不同于当前块的视图的视图中的块的信息,并且也可以使用当前块的偏移值。
在此情形中,当前块的偏移值表示在当前块的平均像素值与对应于当前块的参考块的平均像素值之间的差值。作为用于使用上述偏移值的实例,可以通过使用当前块的相邻块来获得当前块偏移值的预测器,并且可以使用在偏移值和预测器之间的残值。因此,解码器能够使用残值和预测器来重构当前块的偏移值。
为了获得当前块的预测器,可以根据需要使用相邻块的信息。
例如,能够通过使用相邻块的偏移值来预测当前块的偏移数值。在预测当前块偏移数值之前,判定当前块的参考索引是否等于相邻块的参考索引。根据判定结果,亮度补偿单元18能够确定将使用哪一个相邻块或者使用哪个值。
亮度补偿单元18可以使用当前块的预测类型来执行亮度补偿。如果利用两个参考块对当前块进行预测编码,则亮度补偿单元18可以使用当前块的偏移值来获得对应于每一个参考块的偏移值。
如上所述,根据预测模式来选择通过亮度补偿和运动补偿所获取的帧间预测图像或者帧内预测图像,并且重构当前图像。
在该文献中将在以后描述用于重构当前图像的编码/解码方法的各种实例。图2是示出序列参数集RBSP语法的结构图示。
参考图2,序列参数集指示包括与全序列编码相关联的信息(例如简表和级)的头部信息。
全压缩的序列能够以序列头部开始,从而对应于头部信息的序列参数集早于参考参数集的数据到达解码器。结果,在步骤S1,序列参数集(RBSP)用作与得到的压缩后的运动图像的数据相关联的头部信息。在步骤S2,如果接收到比特流,“profile_idc”信息判定数个简表中的哪一个简表对应于所接收比特流。例如,如果“profile_idc”被设为“66”,则这指示所接收的比特流基于基线简表。如果“profile_idc”被设为“77”,则这指示所接收的比特流基于主要简表。如果“profile_idc”被设为“88”,则这指示所接收的比特流基于扩展简表。步骤S3使用语法“If(profile_idc)==MULTI_VIEW_PROFILE)”以判定所接收的比特流是否涉及多视图简表。
如果在步骤S3所接收的比特流涉及多视图简表,则多视图序列的各种信息能够被添加到所接收的比特流。“reference_view”信息表示全视图的参考视图,并且可以将与参考视图相关联的信息添加到比特流。通常,MVC技术使用能够被用于单个序列的编码方案(例如H.264/AVC编解码器)来编码或者解码参考视图序列。如果参考视图被添加到语法,则语法指示数个视图中的哪一个视图将被设为参考视图。
用作编码参考的基础视图用作上述参考视图。参考视图的图像被独立编码而不参考另一视图的图像。
视图数目(num_views)可以添加指示由数个照相机捕获的多视图的数目的特定信息。可以以各种方式设定每一个序列的视图数目(num_views)。在步骤S5,“num_views”信息被发送到编码器和解码器,从而编码器和解码器能够自由地使用“num_views”信息。
照相机布局(view_arrangement)指示当获取到序列时照相机的布局类型。如果“view_arrangement”信息被添加到语法,则编码过程能够有效执行从而适合于各个布局。此后,如果开发出新的编码方法,能够使用不同的“view_arrangement”信息。
帧数目“temporal_units_size”指示每一个视图的接连编码/解码的帧的数目。如果需要,也可以添加指示帧数的特定信息。更加详细地,如果当前第N个视图正在被编码/解码,并且下一次将对第M个视图进行编码/解码,则“temporal_units_size”信息指示在第N个视图将首先处理然后在第M个视图将处理多少个帧。通过“temporal_units_size”信息和“num_views”信息,系统能够确定数个视图中的哪一个视图对应于每个帧。如果从每一个视图序列的I条带到P条带的第一长度、在P条带之间的第二长度或者对应于第一或者第二长度的倍数的长度被设为“temporal_units_size”信息,则可以仅仅在一个视图处处理“temporal_units_size”信息,并且可以进行到下一个视图。“temporal_units_size”信息可以等于或者小于传统GOP长度。例如,图4B~4C示出用于解释“temporal_units_size”概念的GGOP结构。在此情形中,在图4B中,“temporal_units_size”信息被设为“3”。在图4C中,“temporal_units_size”信息被设为“1”。
在一些实例中,对应于“temporal_units_size”为“1”的情况,MVC方法在时间轴和视图轴上布局数个帧,从而它可以在相同时间值处处理每个视图的单个帧,并且然后可以在下一时间值处处理每个视图的单个帧。可替代地,对应于“temporal_units_size”为“N”的情况,MVC方法可以在相同视图处处理N个帧,并且然后可以在下一视图处处理N个帧。因为通常处理至少一个帧,“temporal_units_size_minusl”可以被添加到语法以表示处理多少另外的帧。因此,在步骤S7,上述实例 可 以 分 别 地 由 “temporal_units_size_minusl=0”和“temporal_units_size_minusl=N-1”表示。
传统编码方案的简表不具有公共简表,从而标志被进一步用于指示可兼容性。“constraint_set*_flag”信息指示哪一个简表能够使用解码器来解码比特流。“constraint_setO_flag”信息指示比特流能够在步骤S8利用基线简表的解码器解码。“constraint_setl_flag”信息指示比特流能够在步骤S9利用主要简表的解码器解码。“constraint_set2_flag”信息指示比特流能够在步骤S10利用扩展简表的解码器解码。因此,需要 定 义 “ MULTI_VIEW_PROFILE”解 码 器,并 且“ MULTI_VIEW_PROFILE”解 码 器 可 以 在 步 骤 S11 由“constraint_set4_flag”信息定义。
“level_idc”信息指示级标识符。“level”通常指示解码器的性能和比特流的复杂度,并且在步骤S12涉及在上述简表中规定的技术元素。
“seq_parameter_set_id”信息指示在SPS(序列参数集)中包含的SPS(序列参数集)ID信息从而在步骤S13标识序列类型。
图3A是示出包括仅仅一个序列的比特流的结构图示。
参考图3A,序列参数集(SPS)指示包括与全序列编码相关联的信息(例如简表和级)的头部信息。补充增强信息(SEI)指示补充信息,对于运动图像(即序列)编码层的解码过程而言并不需要该补充信息。图像参数集(PPS)是指示全图像的编码模式的头部信息。I条带仅仅执行帧内编码过程。P条带执行帧内编码过程或者帧间预测编码过程。图像分隔符指示在视频图像之间的边界。系统向上述SPS应用SPS RBSP语法。因此,系统在产生比特流期间采用上述语法,从而它能够向所需对象添加各种信息。
图3B是示出包括两个序列的比特流的结构图示。
参考图3B,H.264/AVC技术能够使用单个比特流来处理各种序列。SPS包括SPS中的SPS ID信息(seq_parameter_set_id)从而标识序列。在PPS(图像参数集)中规定SPS ID信息,从而识别哪一个序列包括图像。而且,在条带头部中规定PPS ID信息(pic_parameter_set_id),从而“pic_parameter_set_id”信息能够标识将使用哪一个PPS。
例如,图3B的条带#1的头部包括将被参考的PPS ID信息(pic_parameter_set_id),如由①所表示。PPS#1包括所参考的SPS ID信息(SPS=1),如由②所表示。因此,能够认识到条带#1属于序列#1。以此方式,也能够认识到条带#2属于序列#2,如由③和④所表示。实际上,基线简表和主要简表被添加和编辑以创建新的视频比特流。在此情形中,两个比特流被分配不同的SPS ID信息。该两个比特流中的任何一个也可以根据需要被转变为多视图简表。
图4A示出示例性GOP组(GGOP)结构。图4B和图4C示出用于解释“temporal_units_size”概念的GGOP结构。GOP表示一些图像的数据组。为了有效执行编码过程,MVC使用GGOP概念来执行空域预测和时域预测。
如果在每一个视图序列的I条带和P条带之间的第一长度、在P条带之间的第二长度或者对应于第一或者第二长度的倍数的第三长度被设为“temporal_units_size”信息,则可以在仅仅一个视图处处理“temporal_units_size”信息,并且可以进行到下一视图。“temporal_units_size”信息可以等于或者小于传统GOP长度。例如,在图4B中,“temporal_units_size”信息被设为“3”。在图4C中,“temporal_units_size”信息被设为“1”。特别地,在图4B中,如果“temporal_units_size”信息由“temporal_units_size>1”表示,并且一个或者多个视图在I帧处开始,则能够处理(temporal_units_siZe+1)个帧。而且,通过参考上述“temporal_units_size”和“num_views”信息,系统能够从数个视图中识别出哪一个视图对应于全序列的每一个帧。
在图4A中,在时间轴和视图轴上布局各个帧。V1~V8的图像分别指示GOP。用作基础GOP的V4被用作其它GOP的参考GOP。如果“temporal_units_size”信息被设为“1”,则MVC方法在相同时间区处理各个视图的帧,并且然后能够在下一个时间区再次处理各个视图的帧。T1~T4的图像指示在相同时间区的各个视图的帧。换言之,MVC方法能够首先处理T1的帧,并且然后能够以T4->T2->T3->...的顺序处理多个帧。如果“temporal_units_size”信息被设为“N”,MVC方法可以首先在单个视图中沿着时间轴方向处理N个帧,并且可以在下一个视图处处理该N个帧。换言之,如果“temporal_units_size”信息被设为“4”,则MVC方法可以首先处理在V4GOP的T1~T4帧中包含的帧,并且然后可以按照顺序V1->V2->V3->...处理多个帧。
因此,在产生图4A中的比特流的情形中,视图数目(num_views)被设为“8”,参考视图被设为V4 GOP(图像组)。帧的数目(temporal_units_size)指示每一个视图的接连编码/解码帧的数目。因此,如果在图4A中的相同时间区处处理每一个视图的帧,则“temporal_units_size”信息被设为“1”。如果在单个视图中沿着时间轴方向处理帧,“temporal_units_size”信息被设为“N”。上述信息被添加到比特流产生过程。
图5是示出用于解码视频序列的方法的流程图。
参考图8,从所接收的比特流中提取一个或者多个简表信息。在此情形中,所提取的简表信息可以是数个简表(例如基线简表、主要简表和多视图简表)中的至少一个。在步骤S51可以根据输入视频序列来改变上述简表信息。从所提取的简表信息中提取在上述简表中包含的至少一个配置信息。例如,如果所提取的简表信息涉及多视图简表,在步骤S53提取在多视图简表中包含的一个或者多个配置信息(即“reference_view”、“num_views”、“view_arrangement”和“temporal_units_size”信息)。以此方式,上述所提取的信息被用于解码多视图编码的比特流。
图6A-6B是示出根据第一实例的多视图序列预测结构的概念图示。
参考图6A-6B,如果数个观点的数目(m)(即多视图数目)被设为2n(即,m=2n),如果n=0,则多视图数目(m)被设为“1”。如果n=1,则多视图数目(m)被设为“2”。如果n=2,则多视图数目(m)被设为“4”。如果n=3,则多视图数目(m)被设为“8”。因此,如果多视图数目(m)被设为2n-1<m≤2n,则比特流包括单个基础视图比特流和n个分层辅助视图比特流。
特别地,术语“基础视图”表示数个观点(即多视图)中的参考视图。换言之,对应于该基础视图的序列(即运动图像)利用普通视频编码方案(例如MPEG-2、MPEG-4、H.263和H.264等)编码,从而它以独立比特流的形式产生。为了方便说明,该独立比特流被称为“基础视图比特流”。
术语“辅助视图”表示在数个观点(即多视图)中除了上述基础视图之外的剩余视图。换言之,对应于辅助视图的序列通过执行基础视图序列的差异(disparity)估计而形成比特流,并且该比特流被称为“辅助视图比特流”。
当在数个观点(即多视图)之间执行分层编码过程(即视图缩放性过程)的情形中,上述辅助视图比特流被分类成第一辅助视图比特流、第二辅助视图比特流和第n辅助视图比特流。
术语“比特流”根据需要可以包括上述基础视图比特流和上述辅助视图比特流。
例如,如果多视图数目(m)被设为“8”(n=3),比特流包括单个基础视图和三层辅助视图。如果比特流包括单个基础视图和n层辅助视图,优选利用普通规则定义成为多视图中的基础视图的位置和成为每一个分层辅助视图的位置。作为参考,图6A-6B的正方形区域表示各个观点。关于在正方形区域中包含的数字,数字“0”表示基础视图,数字“1”表示第一层辅助视图,数字“2”表示第二层辅助视图,并且数字“3”表示第三层辅助视图。在图6A-6B的这个实例中,作为多视图视频序列示例性地公开最多8个观点,然而,应该注意,多视图数目不限于“8”并且根据需要任何多视图数目可以用于其它实例。
参考图6A,由下面的规则来确定对应的基础视图和对应的辅助视图。首先,基础视图的位置被设为第2n-1个视图。例如,如果n=3,基础视图被设为第四视图。图6A-6B示出其中开始视图位于最右侧的示例性情形。对应于从最右视图61的第四次序的特定视图被用作基础视图。优选地,基础视图位置可以位于多视图中的中心视图附近的特定位置处或者可以被设为多视图中的中心视图,因为基础视图可以被用作参考以执行其它辅助视图的预测编码过程。
对于另一实例,最左视图总是被设为开始视图,并且观点的数目(m)(即多视图数目)可以按照m=0->m=1->m=2->m=3...的顺序布局。例如,如果n=3,第2n-1多视图数目(即m=4)可以被设为基础视图。
第一层辅助视图位置可以被设为从上述基础视图分开第2n-2量级的左侧视图,或者从上述基础视图分开2n-2量级的右侧视图。例如,图6A示出其中沿着左方向从基础视图分开2n-2视图(即在n=3的情形中两个观点)的观点被确定为第一层辅助视图的示例性情形。在其它情形中,图6B示出其中沿着右方向从基础视图分开2n-2视图(即在n=3的情形中两个观点)的观点被确定为第一层辅助视图的示例性情形。在上述实例中,第一层辅助视图的数目被设为“1”。
第二层辅助视图位置可以被设为从基础视图分开2n-2量级的左侧视图,或者从第一层辅助视图分开2n-2量级的右侧视图。例如,上述图6A的情形产生两个第二层辅助视图。因为上述图6B的情形不具有沿着右方向从第一层辅助视图分开2n-2量级的视图,所以沿着左方向从基础视图分开2n-2量级的观点被确定为第二层辅助视图。
沿着左方向从第二层辅助视图分开2n-2量级的也可以被确定为第二层辅助视图63。然而,如果该观点对应于多视图的两端,则上述观点可以被确定为第三层辅助视图。在图6B的情形中可以产生一个或者两个第二层辅助视图。
最后,第三层辅助视图位置被设为除了已被选择作为基础视图和第一以及第二层辅助视图的上述观点之外的剩余观点。在图6A中,产生四个第三层辅助视图。在图6B中,产生四个或者五个第三层辅助视图。
图7A-7B是示出根据第二实例的多视图序列预测结构的概念图示。
图7A-7B的第二实例在概念上类似于上述图6A-6B的第一实例,然而,应该注意,不同于图6A-6B,图7A-7B示出用于选择基础视图的开始视图位于最左侧。换言之,从最左侧65分开的第四视图被选择作为基础视图。在图7A-7B中,除了上述差异之外的其余部分与图6A-6B的那些相同。
图8是示出根据第三实例的多视图序列预测结构的概念图示。
图8的第三实例示出其中多视图数目(m)被设为2n-1<m≤2n的示例性情形。更加详细地,图8示出由m=5、m=6、m=7和m=8表示的各种情形。如果m=5、6、和7,则多视图数目(m)并不满足m=2n的条件,从而系统不做改变难以实现图6A-6B的上述第一实例和图7A-7B的上述第二实例不做改变。为了解决上述问题,该系统应用虚拟视图概念,从而利用虚拟视图概念来避免上述问题。
例如,如果2n-1<m<2n,产生2n-m个虚拟视图。如果多视图数目(m)是奇数,在多视图布局的左侧(或者右侧)产生(2n-m+1)/2个虚拟视图,并且在多视图布局的右侧(或者左侧)产生(2n-m-1)/2个虚拟视图。如果多视图数目(m)是偶数,分别地在多视图布局的左侧和右侧产生(2n-m)/2个虚拟视图。并且然后,能够以相同方式利用所得到的虚拟视图应用上述预测结构。
例如,如果多视图数目(m)被设为“5”,通过分别地向多视图的两端添加一个或者两个虚拟视图而虚拟地形成m=8的多视图,并且选择基础视图的位置和三层辅助视图的位置。如从图8可见,两个虚拟视图被添加到左侧的端部,并且单个虚拟视图被添加到右侧的端部,从而根据图6A的上述实例选择基础视图和第一到第三层辅助视图。
例如,如果多视图数目(m)被设为“6”,通过向多视图的两端添加单个虚拟视图而虚拟地形成m=8的多视图,并且分别地选择基础视图的位置和三层辅助视图的位置。如从图8可见,根据图6A的上述实例选择基础视图和第一到第三层辅助视图。
例如,如果多视图数目(m)被设为“7”,通过向多视图两端的任何一个添加单个虚拟视图而虚拟地形成m=8的多视图,并且分别地选择基础视图的位置和三层辅助视图的位置。例如,如图8所示,单个虚拟视图被添加到左侧端部,从而根据图6A的上述实例来选择基础视图和第一到第三层辅助视图。
图9A-9B是示出在多视图序列数据的数个观点之间的分层预测结构的概念图示。例如,图9A示出图6A情形的实现实例,并且图9B示出图7A情形的实现实例。更加详细地,如果多视图数目(m)被设为“8”,提供基础视图和三层辅助视图,从而在多视图序列的编码期间能够实现在数个观点之间的分层编码(或者“视图缩放性”)。
基于基础视图的图像和/或上层辅助视图图像的图像来估计/预测利用上述分层辅助视图比特流实现的各个图像,从而对得到的图像执行编码。特别地,差异估计通常被用作上述估计。
例如,第一层辅助视图92通过参考基础视图91执行在观点之间的估计/编码过程(即多视图的估计/编码过程)。第二层辅助视图(93a和93b)通过参考基础视图91和/或第一层辅助视图92执行在观点之间的估计/编码过程。第三层辅助视图(94a、94b、94c和94d)通过参考基础视图和第一层辅助视图92和/或第二层辅助视图(93a和93b)执行在观点之间的估计/编码过程。与上述说明相关联地,图中箭头部指示上述多视图的估计/编码过程的进度方向,并且可以理解,在相同层中包含的辅助流可以根据需要表示不同视图。上述分层编码的比特流根据显示器特性在接受端中被选择性地解码,并且将参考图12在以后描述其详细说明。
通常,编码器的预测结构可以被改变为另一结构,从而通过发送指示各个视图的关系的信息,解码器能够容易地识别出各个视图图像的预测结构关系。而且,指示全视图分层中的哪一个级包括各个视图的特定信息,也可以被发送到解码器。
如果视图级(view_level)被分配给对应的图像(或者条带),并且给定在视图图像之间的依赖关系,即便预测结构被编码器以各种方式改变,解码器也能够容易地认出被改变的预测结构。在此情形中,对应视图的预测结构/方向信息可以以矩阵的形式构造,从而矩阵型预测结构/方向信息被发送到目的地。换言之,视图数目(num_view)被发送到解码器,并且对应视图的依赖关系也可以由二维(2D)矩阵来表示。
如果视图的依赖关系按时改变,例如,如果每一个GOP的第一帧的依赖关系不同于其余时间区的其它帧的依赖关系,则可以发送与各个情形相关联的依赖关系矩阵信息。
图10A-10B是示出根据第四实例的二维(2D)多视图序列的预测结构的概念图示。
上述第一到第三实例已经作为实例公开了一维阵列的多视图。应该注意到,根据需要它们也能够被应用于二维(2D)多视图序列。
在图10A-10B中,正方形指示以2D的形式布局的各个视图,并且在正方形中包含的数字指示分层视图的关系。
例如,如果以“A-B”的形式构造正方形数目,“A”指示对应的分层辅助视图,并且“B”指示在相同分层辅助视图中的优先权。
关于在正方形区域中包含的数字,数目“0”指示基础视图,数字“1”指示第一层辅助视图,数字“2-1”或者“2-2”指示第二层辅助视图,数字“3-1”或者“3-2”指示第三层辅助视图,数字“4-1”、“4-2”或者“4-3”指示第四层辅助视图,以及数字“5-1”、“5-2”或者“5-3”指示第五层辅助视图。
总之,在对从二维(2D)多视图获取的图像进行编码来产生比特流的情形中,如果在水平轴上的2D多视图数目(m)是2n-1<m≤2n并且在垂直轴上的2D多视图数目(p)是2k-1<p≤2k,上述比特流包括单个基础视图比特流和(n+k)个分层辅助视图比特流。
更加详细地,在水平轴和垂直轴上交替地形成上述(n+k)层辅助视图。例如,在图10A中的(n+k)层辅助视图中的第一层辅助视图位于包括基础视图的垂直轴处。在图10B中的(n+k)层辅助视图中的第一层辅助视图位于包括基础视图的水平轴处。
例如,如图10A所示,如果水平轴的多视图数目(m)被设为“8”(即,n=3),并且垂直轴的多视图数目(p)被设为“4”(即,k=2),则比特流包括单个基础视图和五层辅助视图。与上述说明有关联地,图10A示出按照“垂直轴->水平轴->垂直轴->...”的顺序来选择分层辅助视图。将如下在下文中描述用于确定基础视图和辅助视图的位置的方法。
首先,以与上述一维阵列相同的方式确定基础视图位置。因此,基础视图位置被确定为对应于沿着水平轴方向第2n-1个位置和沿着垂直轴方向第2k-1个位置的特定视图。
第一层辅助视图位置被确定为沿着垂直轴方向从基础视图位置分开2k-2量级的顶侧视图或者底侧视图,如由①所表示。第二层辅助视图位置被确定为,或者利用2k-2量级沿着水平轴方向从基础视图位置和第一分层辅助视图分开2n-2量级的如由②所表示的左侧视图以及右侧视图。第三层辅助视图位置被确定为在包括不仅第一和第二层辅助视图而且还包括基础视图的垂直轴中包含的其余视图。第四层辅助视图位置被确定为沿着水平轴方向从第一到第三层辅助视图和基础视图分开2n-2量级的左侧视图或者右侧视图。最后,第五层辅助视图位置被确定为除了基础视图和第一到第四层辅助视图之外的其余视图。
例如,如从图10B可见,如果水平轴的多视图数目(m)被设为“8”(即n=3)并且垂直轴的多视图数目(p)被设为“4”(即k=2),则比特流包括单个基础视图和五层辅助视图。与上述说明相关联地,图10B示出按照“水平轴->垂直轴->水平->...”的次序选择分层辅助视图。将如下在下文中描述用于确定基础视图和辅助视图的位置的方法。
首先,以与上述一维阵列相同的方式来确定基础视图位置。因此,基础视图位置被确定为对应于沿着水平轴方向的第2n-1位置以及沿着垂直轴方向的第2k-1位置的特定视图。
第一层辅助视图位置被确定为沿着水平轴方向从基础视图位置分开2n-2量级的左侧视图或者右侧视图,如由①所表示。第二层辅助视图位置被确定为沿着垂直轴方向从基础视图和第一层辅助视图分开2k-1量级的如由②所示的顶侧视图或底侧视图。第三层辅助视图位置被确定为沿着水平轴方向从基础视图和第一到第二层辅助视图分开2n-2量级的左和右方向视图。第四层辅助视图位置被确定为在包括不仅第一到第三层辅助视图而且还包括基础视图的垂直轴中包含的的其余视图。最后,第五层辅助视图位置被确定为除了基础视图和第一到第四层辅助视图之外的其余视图。
图11A-11C是示出根据第五实例的多视图序列预测结构的概念图示。图11A-11C的第五实例具有不同于上述第一到第四实例的预测结构规则。例如,图11A-11C的正方形区域指示各个视图,然而,在正方形区域中包含的数字指示视图预测的次序。换言之,关于在正方形区域中包含的数字,数字“0”指示第一预测视图(或者第一视图),数字“1”指示第二预测视图(或者第二视图),数字“2”指示第三预测视图(或者第三视图),以及数字“3”指示第四预测视图(或者第四视图)。
例如,图11A示出在多视图数目(m)由m=1~m=10表示的情形中第一到第四视图的决定格式。第一到第四视图利用下面的规则确定。
例如,多视图的两端被设为第一视图(0),并且多视图中的中心视图被设为第二视图(1)。分别地通过基于第二视图(1)沿着两个方向跳过至少一个视图而被接连布局的视图被设为第三视图(2)。除了第一到第三视图之外的其余视图被分别地设为第四视图(3)。如果如上所述确定第一到第四视图,则需要区分基础视图和辅助视图。例如,第一视图、第二视图和第三视图中的任何一个被设为基础视图,并且除了基础视图之外的其余视图可以被设为辅助视图。
如果基础视图没有通过上述规定规则确定而是由编码器任意选择,则基础视图位置的标识(ID)信息(即“base_view_position”)可以被包含在比特流中。
图11B示出决定第二视图(1)的另一实例。更加详细地,图11B示出不同于图11A的实例的另一实例,从而它示出其中除了第一视图(0)之外的其余视图被设为偶数的示例性情形。换言之,如果m=4、m=6、m=8或者m=10,则图11B的第二视图(1)可以根据需要不同于图11A的第二视图(1)。对于另一实例,在确定位于第二视图(1)之后的视图的情形中,可以通过基于最左第一视图(0)顺序地跳过单个视图而确定上视图。
与上述说明相关联地,图11C示出一种例示情形,其中,多视图数目(m)为10(即m=10),并且多视图中的基础视图由基础视图ID信息利用“base_view_position=T视图”(对应于第六视图)表示。例如,如从图11C可见,第一层辅助视图被设为第三视图(2),第二层辅助视图被设为第一视图(0),并且第三层辅助视图被设为第四视图(3)。
与上述说明相关联地,在图11A-11B中,基础视图也可以被设为第一视图(1),如图11C所示。原因在于,如果基础视图位于多视图的中心部分附近的特定位置处,或者位于多视图的中心部分处,则其它辅助视图的估计/编码过程能够有效执行。因此,能够根据下面的规则来确定基础视图位置和辅助视图位置。
换言之,基础视图位置被设为多视图的中心视图(1),第二辅助视图位置被设为多视图的两端视图(0),并且第一辅助视图位置被设为通过基于基础视图沿着两个方向跳过至少一个视图而接连布局的视图(2)。除了上述视图之外的其余视图(3)都被设为第三辅助视图。
与上述说明相关联地,如果多视图数目(m)等于或者小于“7”(即,m≤7),仅仅两个或者更少视图被布局在基础视图(1)和第二辅助视图(0)之间,在基础视图(1)和第二辅助视图(0)之间布局的所有的视图分别被设为第一辅助视图(2)。
如果多视图数目(m)等于或者大于“8”(即,m≥8)并且仅仅两个或者更少视图被布局在第二辅助视图(0)和第一辅助视图(2)之间,则在第二辅助视图(0)和第一辅助视图(2)之间布局的所有的视图分别被设为第三辅助视图(3)。
例如,如图11A~11B所指示,如果m=8、m=9和m=10,则能够认出位于第二辅助视图(0)和第一辅助视图(2)之间的一个或者两个视图被分别地设为第三辅助视图(3)。
对于另一实例,如果仅仅两个或者更少视图位于基础视图(1)和第二辅助视图(0)之间,则在基础视图(1)和第二辅助视图(0)之间布局的所有的视图可以分别地被设为第三辅助视图(3)。例如,如图11A~11B所示,如果m=8,则能够认出位于基础视图(1)和第二辅助视图(0)之间的两个视图被分别地设为第三辅助视图(3)。
使用由上述方法确定的基础视图和辅助视图,能够执行在视图(或观点)之间的视图缩放性。
例如,如果多视图数目(m)等于或者小于“7”(即,m≤7),则产生单个基础视图流和两个分层辅助视图比特流。例如,第二辅助视图(0)能够被设为第一层辅助视图,并且第一辅助视图(2)也能够被设为第二层辅助视图。
例如,如果多视图数目(m)等于或者高于“8”(即,m≥8),即,如果m=8、m=9或者m=10,则产生单个基础视图比特流和三个分层辅助视图比特流。例如,第一辅助视图(2)被选择作为第一层辅助视图,第二辅助视图(0)被选择作为第一层辅助视图,并且第三辅助视图(3)被选择作为第三层辅助视图。
图12是示出编码/解码多视图序列的分层方法的概念图示。
参考图12,传输端的编码器使用可以由第一到第五实施例预测的修改方法和在第一到第五实例中示出的方法来执行多视图序列的视图缩放性功能,以产生比特流,并且将比特流发送到接受端。
因此,解码方法或者设备接收由上述特性形成的比特流、解码所接收的比特流,并且对于每一个分层产生解码数据。此后,根据用户或者显示器的选择,能够使用由每一个分层解码的数据来实现各种显示。
例如,用于仅仅再现基础视图的数据的基础层121适用于2D显示125。用于一起再现基础视图的数据和第一层辅助视图的数据的第一增强层#1(122)适用于通过组合两个2D图像而形成的立体型显示126。用于一起地再现基础视图的数据、第一层辅助视图的数据和第二层辅助视图的数据的第二增强层#2(123)适用于多视图序列的3D再现的低多视图显示127。用于一起再现基础视图的数据和所有分层辅助视图的数据的第三增强层#3(124)适用于多视图序列的3D再现的高多视图显示128。

Claims (4)

1.一种用于解码视频信号的方法,所述方法包括:
接收比特流,该比特流包括根据第一简表编码的视频信号和标识该第一简表的简表信息,该第一简表表示从包括用于单视图视频信号和多视图视频信号的至少一个简表的一组多个简表中选择的简表,所述简表是规定的用于解码压缩序列的比特流的一组技术元素;
从所述比特流中提取所述简表信息;
当所述简表信息对应于多视图视频信号时,从比特流提取与多个视图相关联的配置信息,所述配置信息包括如下信息中的至少一个:表示在多个视图之间的依赖关系的视图依赖信息、指示参考视图的视图标识信息、指示视图数目的视图数目信息以及用于提供视图缩放性的视图级信息;以及
根据所述配置信息来解码所述视频信号,
其中所述比特流包括单个基础视图比特流和至少一个辅助视图比特流,基础视图表示独立地编码而无须参考其他视图的视图,辅助视图为除了基础视图以外的视图。
2.根据权利要求1所述的方法,其中,所述辅助视图是通过参考所述基础视图而被解码的。
3.一种用于解码视频信号的装置,所述装置包括:
解析单元,接收比特流,该比特流包括根据第一简表编码的视频信号和标识该第一简表的简表信息,该第一简表表示从包括用于单视图视频信号和多视图视频信号的至少一个简表的一组多个简表中选择的简表,所述简表是规定的用于解码压缩序列的比特流的一组技术元素,以及从所述比特流中提取所述简表信息;以及当所述简表信息对应于多视图视频信号时,从比特流提取与多个视图相关联的配置信息,所述配置信息包括如下信息中的至少一个:表示在多个视图之间的依赖关系的视图依赖信息、指示参考视图的视图标识信息、指示视图数目的视图数目信息以及用于提供视图缩放性的视图级信息;
帧间预测单元,其根据所述配置信息来解码所述视频信号;
其中所述比特流包括单个基础视图比特流和至少一个辅助视图比特流,基础视图表示独立地编码而无须参考其他视图的视图,辅助视图为除了基础视图以外的视图。
4.根据权利要求3所述的装置,其中,所述辅助视图是通过参考所述基础视图而被解码的。
CN 201010135987 2006-01-12 2007-01-12 处理多视图视频 Active CN101895744B (zh)

Applications Claiming Priority (22)

Application Number Priority Date Filing Date Title
US75823406P 2006-01-12 2006-01-12
US60/758,234 2006-01-12
KR20060004956 2006-01-17
KR10-2006-0004956 2006-01-17
US75962006P 2006-01-18 2006-01-18
US60/759,620 2006-01-18
US76253406P 2006-01-27 2006-01-27
US60/762,534 2006-01-27
KR20060027100 2006-03-24
KR10-2006-0027100 2006-03-24
US78719306P 2006-03-30 2006-03-30
US60/787,193 2006-03-30
KR10-2006-0037773 2006-04-26
KR1020060037773A KR20070076356A (ko) 2006-01-18 2006-04-26 비디오 영상의 부호화/복호화 방법 및 장치
US81827406P 2006-07-05 2006-07-05
US60/818,274 2006-07-05
US60/830,087 2006-07-12
US60/830,328 2006-07-13
KR10-2006-0110338 2006-11-09
KR1020060110338A KR20070076392A (ko) 2006-01-18 2006-11-09 비디오 신호의 디코딩/인코딩 방법 및 장치
KR1020060110337A KR20070076391A (ko) 2006-01-18 2006-11-09 비디오 신호의 디코딩/인코딩 방법 및 장치
KR10-2006-0110337 2006-11-09

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2007800031205A Division CN101375594B (zh) 2006-01-12 2007-01-12 处理多视图视频

Publications (2)

Publication Number Publication Date
CN101895744A CN101895744A (zh) 2010-11-24
CN101895744B true CN101895744B (zh) 2013-03-20

Family

ID=43104789

Family Applications (2)

Application Number Title Priority Date Filing Date
CN 201010135987 Active CN101895744B (zh) 2006-01-12 2007-01-12 处理多视图视频
CN 201010275254 Active CN101945277B (zh) 2006-01-12 2007-01-12 处理多视图视频

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN 201010275254 Active CN101945277B (zh) 2006-01-12 2007-01-12 处理多视图视频

Country Status (1)

Country Link
CN (2) CN101895744B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102401123B1 (ko) 2011-02-09 2022-05-23 엘지전자 주식회사 움직임 정보 저장 방법 및 이를 이용한 시간적 움직임 벡터 예측자 유도 방법
US9247249B2 (en) * 2011-04-20 2016-01-26 Qualcomm Incorporated Motion vector prediction in video coding
KR20130050405A (ko) * 2011-11-07 2013-05-16 오수미 인터 모드에서의 시간 후보자 결정방법
AR092786A1 (es) * 2012-01-09 2015-05-06 Jang Min Metodos para eliminar artefactos de bloque
WO2013115023A1 (ja) * 2012-01-31 2013-08-08 ソニー株式会社 画像処理装置および画像処理方法
US9596446B2 (en) * 2013-02-06 2017-03-14 Koninklijke Philips N.V. Method of encoding a video data signal for use with a multi-view stereoscopic display device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055012A (en) * 1995-12-29 2000-04-25 Lucent Technologies Inc. Digital multi-view video compression with complexity and compatibility constraints
CN1545808A (zh) * 2002-06-20 2004-11-10 ������������ʽ���� 解码设备和解码方法
CN1864406A (zh) * 2003-08-07 2006-11-15 索尼电子有限公司 用于多视图视频编码的基于语义的运动估计

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100481732B1 (ko) * 2002-04-20 2005-04-11 전자부품연구원 다 시점 동영상 부호화 장치
KR100968842B1 (ko) * 2002-06-20 2010-07-28 소니 주식회사 복호 장치 및 복호 방법
KR100760258B1 (ko) * 2004-12-10 2007-09-19 한국전자통신연구원 범용적 다시점 동영상 부호화/복호화 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055012A (en) * 1995-12-29 2000-04-25 Lucent Technologies Inc. Digital multi-view video compression with complexity and compatibility constraints
CN1545808A (zh) * 2002-06-20 2004-11-10 ������������ʽ���� 解码设备和解码方法
CN1864406A (zh) * 2003-08-07 2006-11-15 索尼电子有限公司 用于多视图视频编码的基于语义的运动估计

Also Published As

Publication number Publication date
CN101945277B (zh) 2013-08-14
CN101945277A (zh) 2011-01-12
CN101895744A (zh) 2010-11-24

Similar Documents

Publication Publication Date Title
CN101375594B (zh) 处理多视图视频
KR100953646B1 (ko) 다시점 비디오의 처리 방법 및 장치
CN105637878B (zh) 在视频译码中用于基于子解码图片缓冲器(sub-dpb)的dpb操作的传信
CN104205819B (zh) 用于视频编码的方法和装置
CN110024401A (zh) 用于时间扩缩性支持的修改适应性环路滤波器时间预测
CN104885459B (zh) 用于多层译码的多分辨率经解码图片缓冲器管理
CN101385350B (zh) 用于视频信号的层间预测方法
CN106464918A (zh) 用信号表示用于位流分区的hrd参数
CN105531999A (zh) 涉及用于信号传输运动信息的语法的视频编码方法及装置
CN105409220A (zh) 用于视频译码的经解码图片缓冲器操作
CN103299619A (zh) 遮挡数据的压缩方法和装置
CN104641642A (zh) 用于视频编码的方法和装置
CN105519119A (zh) 图像解码装置
CN104272741A (zh) 多视图译码和3d译码中的视图相依性
JP2010515400A (ja) 全域差ベクトルを利用した多視点映像の符号化、復号化方法及び装置
CN104247428A (zh) 解码装置和解码方法以及编码装置和编码方法
CN102771125A (zh) 使用树形结构的编码/解码方法和装置
CN101895744B (zh) 处理多视图视频
CN101584220B (zh) 对视频信号进行编码的方法和系统、编码的视频信号、对视频信号进行解码的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant