CN101485208B - 多视图视频的编码和解码方法及装置 - Google Patents

多视图视频的编码和解码方法及装置 Download PDF

Info

Publication number
CN101485208B
CN101485208B CN200780025531.4A CN200780025531A CN101485208B CN 101485208 B CN101485208 B CN 101485208B CN 200780025531 A CN200780025531 A CN 200780025531A CN 101485208 B CN101485208 B CN 101485208B
Authority
CN
China
Prior art keywords
parameter set
view
decoding
institute
syntax elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200780025531.4A
Other languages
English (en)
Other versions
CN101485208A (zh
Inventor
普尔温·比贝哈斯·潘迪特
苏叶平
尹鹏
克里斯蒂娜·戈米拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN101485208A publication Critical patent/CN101485208A/zh
Application granted granted Critical
Publication of CN101485208B publication Critical patent/CN101485208B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

提供了多视图视频编码和解码的方法及装置。所述装置包括:编码器(100),用于使用语法元素将与多视图视频内容相对应的至少两个视图编码为结果比特流。所述语法元素标识至少两种方法中的一种,所述两种方法指示至少两个视图的至少部分视图间的解码依赖性。

Description

多视图视频的编码和解码方法及装置
相关申请的交叉引用
本申请要求2006年7月5日提交的序号为60/818,655的美国临时专利申请,并将其全部内容合并在此以作参考。
技术领域
本发明的原理总体涉及视频编码和解码,更具体地,涉及多视图视频的编码和解码方法及装置。
背景技术
多视图视频编码(MVC)序列是从不同视点捕捉同一场景的两个以上的视频序列的集合。为了有效地支持视图随机访问以及视图可扩展性,了解多视图视频编码序列中不同图像如何相互依赖对于解码器十分重要的。
发明内容
现有技术的上述和其他缺陷和缺点可通过本发明的原理得到解决,本发明的原理涉及多视图视频编码和解码的方法及装置。
根据本发明原理的一方面,提供了一种装置。该装置包括:编码器,用于使用语法元素将与多视图视频内容相对应的至少两个视图编码为结果比特流,其中,所述语法元素标识至少两种方法中的一种,所述两种方法指示至少两个视图的至少部分视图间的解码依赖性。
根据本发明原理的另一方面,提供了一种方法。该方法包括:使用语法元素将与多视图视频内容相对应的至少两个视图编码为结果比特流。所述语法元素标识至少两种方法中特定的一种,所述两种方法指示至少两个视图的至少部分视图间的解码依赖性。
根据本发明原理的另一方面,提供了一种装置。该装置包括:解码器,用于使用语法元素对与比特流中的多视图视频内容相对应的至少两个视图进行解码。所述语法元素标识至少两种方法中特定的一种,所述两种方法指示至少两个视图的至少部分视图间的解码依赖性。
根据本发明原理的另一方面,提供了一种方法。该方法包括:使用语法元素对与比特流中的多视图视频内容相对应的至少两个视图进行解码。所述语法元素标识至少两种方法中特定的一种,所述两种方法指示至少两个视图的至少部分视图间的解码依赖性。
根据对以下需要结合附图加以阅读的典型实施例的说明,本发明原理的上述和其他方面、特征和优势就更加显而易见。
附图说明
根据以下典型附图,可以更好地理解本发明的原理,附图中:
图1是根据本发明原理的实施例的、可以应用本发明原理的典型视频编码器的方框图;
图2是根据本发明原理的实施例的、可以应用本发明原理的典型视频解码器的方框图;
图3是根据本发明原理的实施例的、将vps_selection_flag插入结果比特流的典型方法的流程图;以及
图4是根据本发明原理的实施例的、对比特流中的vps_selection_flag进行解码的典型方法的流程图。
具体实施方式
本发明的原理涉及多视图视频编码和解码的方法及装置。
本说明书阐释了本发明的原理。因此,应当的理解的是,所属领域的技术人员将能够设计出虽未在此处明确说明或示出、但体现了本发明的原理并涵盖于其精神和范围内的各种配置。
此处叙述的所有示例以及条件式语言均为达到教学目的,旨在帮助读者理解由发明者提出的改进了现有技术的发明原理以及发明构思,因而应将其看成不限于那些具体叙述的示例以及条件。
此外,此处叙述的所有本发明的原理、方案和实施例的所有说明及其具体示例均意在涵盖其结构以及功能等价物。此外,这些等价物意在包括现存等价物以及将于未来开发出来的等价物,即,不管结构如何,开发出来用于执行同一功能的任意元件。
因而,举例而言,所属领域技术人员应意识到此处所示的方框图呈现了体现本发明原理的示意电路的概念视图。类似地,应意识到流程图、状态转移图、伪码等表示各种可以计算机可读介质充分表现的,因而无论是否明确说明了计算机或处理器,均能够用计算机或处理器予以执行的过程。
可以通过采用专用硬件以及能够执行同适当软件有关的软件的硬件实现附图所示的各种实施例的功能。如果用处理器来提供功能,则可以用单独的专用处理器、单独的共享处理器或者多个其中若干可以是共享处理器的独立处理器来提供功能。此外,不应将术语“处理器”或“控制器”的明确使用看成专指能够执行软件的硬件,反之其可以无限制地隐含包括,数字处理器(“DSP”)硬件、用于存储软件的只读存储器(“ROM”)、随机存取存储器(“RAM”)以及非易失性存储器。
还可以包括常规的和/或定制的其他硬件。类似地,附图中的所有开关也只是概念上的。可以通过程序逻辑操作、专用逻辑、程序控制以及专用逻辑的相互作用,或者甚至手动实现它们的功能,其中具体技术可以根据上下文进行了更加具体的理解后,由实施者加以选择。
在其权利要求中,任意被表示为用于执行指定功能的元件都意在包含执行该功能的任意方式,后者包括:比如,a)执行该功能的电路元件的组合或b)任意形式的软件,因而包括:同用于执行该软件以实现所述功能的适当电路相结合的固件、微码或类似软件。由这种权利要求所限定的发明在于以权项要求的方式结合在一起的各种所述装置所提供的功能。因而,应将能够提供这种功能的任意装置看做此处说明的装置的等价物。
说明书中对本发明原理“一个实施例”或“一实施例”的引用意味着,至少在依照本发明原理的一实施例中包含了结合实施例进行说明的特定的特征、结构、特点等等。因而,在整篇说明书中各处出现的短语“在一个实施例中”或在“一实施例”未必指同一实施例。
如此处所用,“高层语法”指存在于在层次结构中位于宏块层之上的比特流中的语法。例如,如此处所用,高层语法可以指但不限于位于图像条(slice)头层、辅助增强信息(SEI)层、图像参数集层、以及序列参数集层的语法。
下面参考图1,参考标记100总体指示可以应用本发明原理的典型视频编码器。
视频编码器100的输入信号通信地连接至合并器110的同相输入。合并器110的输出信号通信地连接至变换器/量化器120。变换器/量化器120的输出信号通信地连接至熵编码器140。熵编码器140的输出可用作编码器100的输出。
变换器/量化器120的输出还信号通信地连接至逆变换器/量化器150。逆变换器/量化器150的输出信号通信地连接至去块滤波器160的输入。去块滤波器160的输出信号通信地连接至参考图像存储器170。参考图像存储器170的第一输出信号通信地连接至运动估计器180的第一输入。编码器100的输入还信号通信地连接至运动估计器180的第二输入。运动估计器180的输出信号通信地连接至运动补偿器190的第一输入。参考图像存储器170的第二输出信号通信地连接至运动补偿器190的第二输入。运动补偿器190的输出信号通信地连接至合并器110的反向输入。
下面参考图2,参考标记200总体指示可以应用本发明原理的典型视频解码器。
视频解码器200包括熵解码器210,用于接收视频序列。熵解码器210的第一输出信号通信地连接至逆量化器/变换器220的输入。逆量化器/变换器220的输出信号通信地连接至合并器240的第一同相输入。
合并器240的输出信号通信地连接至去块滤波器290的输入。去块滤波器290的输出信号通信地连接至参考图像存储器250的输入。参考图像存储器250的输出信号通信地连接至运动补偿器260的第一输入。运动补偿器260的输出信号通信地连接至合并器240的第二同相输入。熵解码器210的第二输出信号通信地连接至运动补偿器260的第二输入。去块滤波器290的输出可用作视频解码器200的输出。
根据本发明的原理,提供了一种多视图视频编码和解码的方法及装置。在一实施例中,提出对MPEG-4AVC标准的高层语法加以改变,以有效地处理多视图视频序列。例如,在一实施例中,提出包含标记或其他语法元素,用以在指示多视图视频序列依赖结构的不同方法间作出选择。通过提供这样的标记或其他语法元素,根据本发明原理的实施例使解码器能够确定多视图视频编码序列中不同图像如何相互依赖。采用这种方法,可以有利地仅对必要图像进行解码。此外,这种视图依赖信息提供了对于视随机访问和视可扩展性的有效支持。
已提出了两种不同的方法(以下称“第一方法”和“第二方法”),用于提供多视图压缩比特流中的依赖信息。两种方法都提出对国际标准化组织/国际电工委员会(ISO/IEC)运动图像专家组-4(MPEG-4)第10部分高级视频编码(AVC)标准/国际电信联盟电信标准化部门(ITU-T)的H.264建议(以下称“MPEG-4AVC标准”)加以改变。具体而言,两种方法定义了所谓视图参数集(VPS)的新参数集。
在以下说明中,假定节点对应于视频序列中的图像。每幅图像可以独立编码也可以根据之前编码的图像进行编码。如果图像编码依赖于之前编码的图像,则可以将参考图像(即,之前编码的图像)称为正在编码的图像的父图像。一幅图像可以用一幅以上的父图像。图像A的派生图像是用A作为其参考图像的图像。
第一种方法提供局部依赖信息。这意味着以信号告知各节点的直接父节点。采用这种方法,需要使用该依赖信息重建依赖图。重建依赖图的一种方法是递归调用以确定所述依赖图。
第二种方法提供全局依赖信息。这意味着以信号告知各节点的所有派生节点。实际上,仅使用查找表就可以判断出任意两节点间存在的祖先/后代关系。以下语法表示用于指示多视图视频比特流中依赖信息的第一和第二方法的可能的实施例。
表1示出了指示多视图比特流中依赖信息的第一方法所用的视图参数集(VPS)语法。
表1
view_parameter_set_rbsp(){ 描述符
view_parameter_set_id ue(v)
num_multiview_refs_for_list0 ue(v)
num_multiview_refs_for_list1 ue(v)
for(i=0;i<num_multiview_refs_for_list0;i++){
reference_view_for_list_0[i] ue(v)
}
for(i=0;i<num_multiview_refs_for_list1;i++){
reference_view_for_list_1[i] ue(v)
}
}
view_parameter_set_id标识图像条头中所涉及的视图参数集。
view_parameter_set_id的值应位于0到216-1的范围内。
num_multiview_refs_for_list0指定列表0的多视图预测参考的数量。
num_multiview_refs_for_list0的值应当小于等于列表0中的最大元素数。
num_multiview_refs_for_list1指定列表1的多视图预测参考的数量。
num_multiview_refs_for_list0的值应当小于等于列表1中的最大元素数。
reference_view_for_list_0[i]标识用作列表0的当前视图的第i参考的视图的视图索引。
reference_view_for_list_1[i]标识用作列表0的当前视图的第i参考的视图的视图索引。
表2示出了指示多视图比特流中依赖信息的第二方法所用的视图参数集(VPS)语法。
表2
view_parameter_set_rbsp(){ C 描述符
view_parameter_set_id 0 ue(v)4 -->
number_of_views_minus_1 0 ue(v)
avc_compatible_view_id 0 ue(v)
for(i=0;i<=number_of_views_minus_1;i++){
is_base_view_flag[i] 0 u(1)
dependency_update_flag 0 u(1)
if(dependency_update_flag==1){
for(j=0;j<number_of_views_minus_1;j++){
anchor_picture_dependency_maps[i][j] 0 f(1)
if(anchor_picture_dependency_maps[i][j]==1)
non_anchor_picture_dependency_maps[i][j] 0 f(1)
}
}
}
view_pararneter_set_id标识图像条头中所涉及的视图参数集。
view_parameter_set_id的值应位于0到255的范围内。
number_of_views_minus_1加1标识比特流中视图总数。
number_of_view_minus_1的值应位于0到255的范围内。
avc_compatible_view_id指示AVC兼容视图的view_id。
avc_compatible_view_id的值应位于0到255的范围内。
is_base_view_flag[i]等于1表示视图i是基本视图,可独立解码。
is_base_view_flag[i]等于0表示视图i不是基本视图。对于AVC兼容视图i,is_base_view_flag[i]的值等于1。
dependency_update_flag等于1表示在VPS中更新该视图的依赖信息。
dependency_update_flag等于0表示不更新且不应改变该视图的依赖信息。
anchor_picture_dependency_maps[i][j]等于1表示view_id等于j的锚点图像将依赖于view_id等于i的锚点图像。
non_anchor_picture_dependency_maps[i][j]等于1表示view_id等于j的非锚点图像将依赖于view_id等于i的非锚点图像。仅当anchor_picture_dependency_maps[i][i]等于1时才存在non_anchor_picture_dependency_maps[i][j]。如果存在anchor_picture_dependency_maps[i][i],且其等于0,则应推断non_anchor_picture_dependency_maps[i][j]为0.
两种方法均依赖于被称为锚点图像(锚点图像)的新图像类型的定义。
锚点图像:是一种其中所有图像条仅参考具有相同时间索引的图像条(即其他视图中的图像条,而不是当前视图中的图像条)的编码视图。这样的图像是通过设置nal_ref_idc=3来以信号进行通知的。在对锚点图像进行解码后,将可以在不根据在锚点图像之前进行解码的任意图像进行帧间预测的情况下,对依显示顺序的所有随后的编码图像进行解码。如果一视图中的图像是锚点图像,那么其他视图中具有相同时间索引的所有图像也将是锚点图像。
通过令锚点图像要求将依显示顺序的之前的图像标记为未用于参考(以斜体示出),和/或要求各视图的锚点图像对齐(以斜体加黑体示出),两种独立改变标记出了时间依赖性的断点。
如表4中以粗体显示的那样,第一方法和第二方法均引入了新的NAL单元类型。此外,如表5所示,两种方法还修改了图像条头,以指示所使用的视图参数集以及view_id。
第一方法具有处理基本视图随时间改变的情况的优势,但其需要在决定丢弃哪些图像前对图像进行额外的缓存。第一方法还具有需要用于确定依赖性的递归过程的缺点。
相反,第二方法无需任何递归过程,并且在基本视图不改变的情况下无需对图像进行缓存。然而,如果基本图像随时间变化,那么第二方法仍需要对图像进行缓存。
应当意识到,虽然本发明的原理主要是针对于用于指示多视图视频比特流中依赖信息的两种方法进行说明的,但本发明的原理还可以应用于其他用于指示多视图视频比特流中依赖信息的方法,并同时依然使本发明原理的范围保持不变。例如,可以针对替代和/或除此处描述的两种用于指示依赖信息的方法以外的其他方法实现本发明的原理。
根据本发明的原理,提出了用于引入多视图视频比特流的新语法,所述新语法用于在指示比特流中一幅以上图像的依赖结构的不同方法间进行选择。在一实施例中,该语法是高层语法。如上所述,术语“高层语法”指存在于在层次结构中位于宏块层之上的比特流中的语法。例如,如此处所用,高层语法可以指但不限于位于图像条头层、辅助增强信息(SEI)层、图像参数集层、以及序列参数集层的语法。在一实施例中,解码器根据这种语法的值可以识别出属于指示依赖结构的特定方法的随后的语法元素。在一实施例中,可以在此时将该语法存储在解码器中,并在稍后有需要时加以处理。
可以将在仅仅两种指示依赖结构的方法中进行选择看作根据本发明原理的新语法的一种特殊情况。在这种情况下,该语法元素可以只取两个值。因此,在一实施例中,该语法元素可以仅仅是比特流中的二进制值标记。以下,将对一个这样的典型实施例加以说明。
假定对于MPEG-4AVC比特流,两种方法之一基于提供该局部依赖信息,如上述第一方法。这意味着,对于每个节点以信号告知其直接父节点。在这种方法中,需要使用该信息重建依赖图。一种方式是采用递归调用以确定该依赖图。
在第二方法中,依赖信息是全局的。这意味着,对于每个节点,以信号告知其派生节点。实际上,仅使用查找表就可以判断出任意两节点间存在的祖先/后代关系。
在一实施例中,在比特流高层引入标记以指示在比特流中以信号告知了两种方法中的哪种方法。这可以是在序列参数集(SPS)、视图参数集(VPS)或存在于MPEG-4AVC比特流的高层的某种其他特殊的数据结构。
在一实施例中,该标记指vps_selection_flag。当vps_selection_flag被设置为1时,用第一方法(全局法)表示依赖图。当vps_selection_flag被设置为0时,用第二方法(局部法)指示表示依赖图。这使应用能够在指示依赖结构的两种不同方法间进行选择。表3所示的视图参数集中示出了该标记的实施例。表3示出了根据本发明原理的实施例的所提出的视图参数集(VPS)语法。表4示出了根据本发明原理的实施例的NAL单元类型码。表5示出了根据本发明原理的实施例的图像条头语法。表6示出了根据本发明原理的一实施例的所提出的序列参数集(SPS)语法。表7示出了根据本发明原理的一实施例的所提出的图像参数集(PPS)语法。
表3
view_parameter_set_rbsp(){ 描述符
view_parameter_set_id ue(v)
vps_selection_flag u(l)
if(vps_selection_flag){
num_multiview_refs_for_list0 ue(v)
num_multiview_refs_for_list1 ue(v)
for(i=0;i<num_multiview_refs_for_list0;i++){
reference_view_for_list_0[i] ue(v)
}
for(i=0;i<num_multiview_refs_for_list1;i++){
reference_view_for_list_1[i] ue(v)
}
}else{
view_parameter_set_id ue(v)
number_of_views_minus_1 ue(v)
avc_compatible_view_id ue(v)
for(i=0;i<=number_of_views_minus_1;i++){
is_base_view_flag[i] u(l)
dependency_update_flag u(l)
if(dependency_update_flag==1){
for(j=0;j<number_of_views_minus_1;j++){
anchor_picture_dependency_maps[i][j] f(l)
if(anchor_picture_dependency_maps[i][j]==1)
non_anehor_picture_dependency_maps[i][j] f(l)
}
}
}
}
表4
NAL单元类型码
nai_unit_type NAL单元的内容和RBSP语法结构 C
0 未指定
1 非IDR图像的编码图像条slice_layer_without_partitioning_rbsp() 2,3,4
2 编码图像条数据划分A slice_data_partition_a_layer_rbsp() 2
3 编码图像条数据划分B slice_data_partition_b_layer_rbsp() 3
4 编码图像条数据划分C slice_daa_partition_c_layer_rbsp() 47 -->
5 IDR图像的编码图像条slice_layer_without_partitioning_rbsp() 2,3
6 辅助增强信息(SEI)sei_rbsp() 5
7 序列参数集seq_parameter_set_rbsp() 0
8 图像参数集pic_parameter_set_rbsp() 1
9 访问单元定界符access_unit_delimiter_rbsp() 6
10 序列结尾end_of_seq_rbsp() 7
11 流的结尾end_of_stream_rbsp() 8
12 填充数据filler_data_rbsp() 9
13 序列参数集extension seq parameter_set_extension_rbsp() 10
14 视图参数集view_parameter_set_rbps() 11
15..18 保留
19 未划分的辅助编码图像的编码图像条slice_layer_without_partitioning_rbsp() 2,3,4
20 可伸缩扩展中非IDR图像的编码图像条slice_layer_in_scalable_extension_rbsp() 2,3,4
21 可伸缩扩展中IDR图像的编码图像条slice_layer_in_scalable_extension_rbsp() 2,3
22 多视图扩展中非IDR图像的编码图像条slice_layer_in_mvc_extension_rbsp() 2,3,4
23 多视图扩展中DR图像的编码图像条slice_layer_in_mvc_extension_rbsp() 2,3
24..31 未指定
表5
slice_header(){ C 描述符
first_mb_in_slice 2 ue(v)
slice_type 2 ue(v)
pic_parameter_set_id 2 ue(v)
if(nal_unit_type==22||nal_unit_type==23){
view_parameter_set_id 2 ue(v)
view_id 2 ue(v)
}
frame_num 2 u(v)
if(!frame_mbs_only_flag){
field_pic_flag 2 u(l)
if(field_pic_flag)
bottom_field_fag 2 u(l)
}
........ 8 -->
}
表6
seq_parameter_set_rbsp(){ C 描述符
profile_idc 0 u(8)
.....
if(profile_idc==MULTI_VIEW_PROFILE){
vps_selection_flag
}
if(profile_idc==100||profile_idc==110||profile_idc==122||profile_idc==144||profile_idc==83||profile_idc==MULTI_VIEW_PROFILE){
chroma_format_idc 0 ue(v)
.....
}
表7
pic_parameter_set_rbsp(){ C 描述符
pic_parameter_set_id 1 ue(v)
seq_parameter_set_id 1 ue(v)
entropy_coding_mode_flag 1 u(l)
......
if(profile_idc==MULTI_VIEW_PROFILE){ 1 u(l)
vps_slection_flag 1 ue(v)
} 1
.....
}
下面参考图3,参考标记300总体指示将vps_selection_flag插入结果比特流的典型方法。方法300特别适于对与多视图视频内容相对应的多视图进行编码。
方法300包括将控制权交予功能框310的起始框305。功能框310提供随机访问方法选择准则,并将控制权交予判决框315。判决框315判断是否要将第一方法的语法用于随机访问。倘若如此,就将控制权交予功能框320。否则,就将控制权交予功能框335。
功能框320将vps_selection_flag设置为1,并将控制权交予功能框325。功能框325将第一方法的随机访问语法写入视图参数集(VPS)、序列参数集(SPS)、或图像参数集(PPS),并将控制权交予功能框350。
功能框350读取编码器参数,并将控制权交予功能框355。功能框355对图像进行编码,并将控制权交予功能框360。功能框360将比特流写入文件或流,并将控制权判决框365。判决框365判断是否要对更多的图像进行编码。倘若如此,就将控制权返还至功能框355(以对下一图像进行编码)。否则,就将控制权传递至判决框370。判决框370判断参数是不是以带内信号告知的。倘若如此,就将控制权传递至功能框375。否则,将控制权传递至功能框380。
功能框375将参数集作为比特流的一部分写入文件,或使参数集与比特流一起流动,并将控制权交予终止框399。
功能框380使参数集独立于比特流(带外)成流,并将控制权交予终止框399。
功能框335将vps_selection_flag设置为0,并将控制权交予功能框340。功能框340将第二方法的随机访问语法写入VPS、SPS、或PPS,并将控制权交予功能框350。
下面参考图4,参考标记400总体指示对比特流中的vps_selection_flag进行解码的典型方法。方法400适于对与多视图视频内容相对应的多视图进行解码。
方法400包括将控制权交予功能框410的起始框405。功能框410判断参数集是不是以带内信号告知的。倘若是以带内信号告知的,就将控制权传递至功能框415。否则,将控制权传递至功能框420。
功能框415开始解析包含参数集和编码视频的比特流,并将控制权交予功能框425。
功能框425读取存在于视图参数集(VPS)、序列参数集(SPS)、或图像参数集(PPS)中的vps_selection_flag,并将控制权交予判决框430。
判决框430判断vps_selection_flag是否等于1。倘若等于1,就控制权就被传递至功能框435。否则,就将控制权传递至功能框440。
功能框435读取第一方法的随机访问语法,并将控制权交予判决框455。判决框455判断是否要求随机访问。倘若要求,就将控制权传递至功能框460。否则,将控制权传递至功能框465。
功能框460基于VPS、SPS、或PPS语法确定对所请求视图进行解码所需的图像,并将控制权交予功能框465。
功能框465对比特流进行解析,并将控制权交予功能框470。功能框470对图像进行解码,并将控制权交予判决框475。判决框475判断是否有更多的图像需要译码。倘若存在更多需要译码的图像,就将控制权返还至功能框465。否则,就将控制权传递至终止框499。
功能框420从带外流中获得参数集,并将控制权交予功能框425。
功能框440读取第二方法的随机访问语法,并将控制权交予判决框455。
下面将对本发明的某些附属优势/特征予以说明,其中某些优势/特征已在上文有所提及。举例而言,一种优势/特征在于一种装置,该装置包括:编码器,用于使用语法元素将与多视图视频内容相对应的至少两个视图编码为结果比特流。语法元素标识至少两种方法中特定的一种,所述两种方法指示至少两个视图的至少部分视图间的解码依赖性。另一优势/特征在于具有上述编码器的装置,其中,所述语法元素是高层语法元素。另一优势/特征在于具有上述编码器的装置,其中,所述高层语法是相对于结果比特流以带外方式来提供的。另一优势/特征在于具有上述编码器的装置,其中,所述高层语法是相对于结果比特流以带内方式来提供的。此外,另一优势/特征在于具有上述编码器的装置,其中,所述语法元素存在于结果比特流的参数集中。此外,另一优势/特征在于具有上述编码器的装置,其中,所述参数集是视图参数集、序列参数集、或图像参数集之一。此外,另一优势/特征在于具有上述编码器的装置,其中,所述语法元素是二进制值标记。此外,另一优势/特征在于具有上述编码器的装置,其中,所述语法元素是上述二进制值标记,其中所述标记被表示为vps_selection_flag元素。此外,另一优势/特征在于具有上述编码器的装置,其中,所述语法元素是上述二进制值标记,其中所述标记存在于比结果比特流中的宏块层更高的高层中。此外,另一优势/特征在于具有上述编码器的装置,其中,所述语法元素是存在于比结果比特流中的宏块层更高的高层中的上述二进制值标记,其中所述高层与结果比特流的参数集相对应。此外,另一优势/特征在于具有上述编码器的装置,其中,所述语法元素位于与上述参数集相对应的层中,其中所述参数集是序列参数集、图像参数集、或视图参数集之一。
根据此处的教导,所属领域技术人员易于弄清本发明的上述和其他特征以及优势。应当理解的是,可以硬件、软件、固件、专用处理器或其组合等各种形式实现对本发明原理的教导。
优选情况下,用硬件和软件的组合实现对本发明原理的教导。此外,可以用确实包含于程序存储单元中的应用程序实现软件。应用程序可装载于具有任意适当架构的机器,并由后者予以执行。优选情况下,在具有诸如一个以上的中央处理单元(“CPU”)、随机存取存储器(“RAM”)以及输入/输入(“I/O”)接口等硬件的计算机平台上实现所述机器。计算机平台还可以包含操作系统以及微指令代码。此处说明的各种处理以及函数可以是用CPU执行的、微指令代码的一部分或者应用程序的一部分或者其任意组合的一部分。此外,可以将诸如附加数据存储单元和打印单元等各种其他外围设备连接至计算机平台。
还应当理解的是,由于附图中所描绘的某些构成系统组件以及方法在优选情况下是用软件来实现的,因而系统组件或处理功能框间的实际连接根据本发明的编程方式可能会有所不同。给定此处的说明,所属领域技术人员将能够构想出本发明的上述以及类似的实现或者配置。
虽然参考附图对说明性实施例进行了描述,然而应当理解的是,本发明不局限于这些具体的实施例,所属领域技术人员可以在不背离本发明范围或精神的前提下进行各种改进以及修改。正如附属权利要求所阐释的那样,意图将所有此类修改以及改进包含于本发明的范围之内。

Claims (44)

1.一种多视图视频的编码装置,包括:
编码器(100),用于使用语法元素将与多视图视频内容相对应的至少两个视图编码为结果比特流,其中,所述语法元素标识多种方法中的特定一种,所述多种方法包括第一方法和第二方法,第一方法根据局部范围的依赖信息表示至少两个视图间的解码依赖性,第二方法根据全局范围的依赖信息表示至少两个视图间的解码依赖性,其中,第一方法不同于第二方法。
2.根据权利要求1所述的编码装置,其中,所述语法元素是高层语法元素。
3.根据权利要求1所述的编码装置,其中,所述语法元素是相对于结果比特流以带外方式来提供的。
4.根据权利要求1所述的编码装置,其中,所述语法元素是相对于结果比特流以带内方式来提供的。
5.根据权利要求1所述的编码装置,其中,所述语法元素存在于所述结果比特流的参数集中。
6.根据权利要求5所述的编码装置,其中,所述参数集是视图参数集、序列参数集、或图像参数集之一。
7.根据权利要求1所述的编码装置,其中,所述语法元素是二进制值标记。
8.根据权利要求7所述的编码装置,其中,所述标记由vps_selection_flag元素表示。
9.根据权利要求7所述的编码装置,其中,所述标记存在于比所述结果比特流中的宏块层更高的层中。
10.根据权利要求9所述的编码装置,其中,所述层与所述结果比特流的参数集相对应。
11.根据权利要求10所述的编码装置,其中,所述参数集是序列参数集、图像参数集、或视图参数集之一。
12.一种多视图视频的编码方法,包括:
使用语法元素将与多视图视频内容相对应的至少两个视图编码为结果比特流,其中,所述语法元素标识多种方法中的特定一种,所述多种方法包括第一方法和第二方法,第一方法根据局部范围的依赖信息表示至少两个视图间的解码依赖性,第二方法根据全局范围的依赖信息表示至少两个视图间的解码依赖性,其中,第一方法不同于第二方法。
13.根据权利要求12所述的编码方法,其中,所述语法元素是高层语法元素(325,340)。
14.根据权利要求12所述的编码方法,其中,所述语法元素是相对于结果比特流以带外方式来提供的(380)。
15.根据权利要求12所述的编码方法,其中,所述语法元素是相对于结果比特流以带内方式来提供的(375)。
16.根据权利要求12所述的编码方法,其中,所述语法元素存在于所述结果比特流的参数集中(325,340)。
17.根据权利要求16所述的编码方法,其中,所述参数集是视图参数集、序列参数集、或图像参数集之一(325,340)。
18.根据权利要求12所述的编码方法,其中,所述语法元素是二进制值标记。
19.根据权利要求18所述的编码方法,其中,所述标记由vps_selection_flag元素表示(320,335)。
20.根据权利要求18所述的编码方法,其中,所述标记存在于比所述结果比特流中的宏块层更高的层中(325,340)。
21.根据权利要求20所述的编码方法,其中,所述层与所述结果比特流的参数集相对应(325,340)。
22.根据权利要求21所述的编码方法,其中,所述参数集是序列参数集、图像参数集、或视图参数集之一(325,340)。
23.一种多视图视频的解码装置,包括:
解码器(200),用于使用语法元素对与比特流中的多视图视频内容相对应的至少两个视图进行解码,其中,所述语法元素标识多种方法中特定的一种,所述多种方法包括第一方法和第二方法,第一方法根据局部范围的依赖信息表示至少两个视图中间的解码依赖性,第二方法根据全局范围的依赖信息表示至少两个视图间的解码依赖性,其中,第一方法不同于第二方法。
24.根据权利要求23所述的解码装置,其中,所述语法元素是高层语法元素。
25.根据权利要求23所述的解码装置,其中,所述语法元素是相对于结果比特流以带外方式来提供的。
26.根据权利要求23所述的解码装置,其中,所述语法元素是相对于结果比特流以带内方式来提供的。
27.根据权利要求23所述的解码装置,其中,所述语法元素存在于所述比特流的参数集中。
28.根据权利要求27所述的解码装置,其中,所述参数集是视图参数集、序列参数集、或图像参数集之一。
29.根据权利要求23所述的解码装置,其中,所述语法元素是二进制值标记。
30.根据权利要求29所述的解码装置,其中,所述标记由vps_selection_flag元素表示。
31.根据权利要求29所述的解码装置,其中,所述标记存在于比所述比特流中的宏块层更高的层中。
32.根据权利要求31所述的解码装置,其中,所述层与所述比特流的参数集相对应。
33.根据权利要求32所述的解码装置,其中,所述参数集是序列参数集、图像参数集、或视图参数集之一。
34.一种多视图视频的解码方法,包括:
使用语法元素对与比特流中的多视图视频内容相对应的至少两个视图进行解码,其中,所述语法元素标识多种方法中特定的一种,所述多种方法包括第一方法和第二方法,第一方法根据局部范围的依赖信息表示至少两个视图间的解码依赖性,第二方法根据全局范围的依赖信息表示至少两个视图间的解码依赖性,其中,第一方法不同于第二方法。
35.根据权利要求34所述的解码方法,其中,所述语法元素是高层语法元素(425)。
36.根据权利要求34所述的解码方法,其中,所述语法元素是相对于比特流以带外方式来提供的(420)。
37.根据权利要求34所述的解码方法,其中,所述语法元素是相对于比特流以带内方式来提供的(415)。
38.根据权利要求34所述的解码方法,其中,所述语法元素存在于所述比特流的参数集中(425)。
39.根据权利要求38所述的解码方法,其中,所述参数集是视图参数集、序列参数集、或图像参数集之一(425)。
40.根据权利要求34所述的解码方法,其中,所述语法元素是二进制值标记。
41.根据权利要求40所述的解码方法,其中,所述标记由vps_selection_flag元素表示(425)。
42.根据权利要求40所述的解码方法,其中,所述标记存在于比所述比特流中的宏块层更高的层中(425)。
43.根据权利要求42所述的解码方法,其中,所述层与所述比特流的参数集相对应(425)。
44.根据权利要求43所述的解码方法,其中,所述参数集是序列参数集、图像参数集、或视图参数集之一(425)。
CN200780025531.4A 2006-07-05 2007-05-25 多视图视频的编码和解码方法及装置 Expired - Fee Related CN101485208B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US81865506P 2006-07-05 2006-07-05
US60/818,655 2006-07-05
PCT/US2007/012452 WO2008005124A2 (en) 2006-07-05 2007-05-25 Methods and apparatus for multi-view video encoding and decoding

Publications (2)

Publication Number Publication Date
CN101485208A CN101485208A (zh) 2009-07-15
CN101485208B true CN101485208B (zh) 2016-06-22

Family

ID=38895066

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780025531.4A Expired - Fee Related CN101485208B (zh) 2006-07-05 2007-05-25 多视图视频的编码和解码方法及装置

Country Status (7)

Country Link
US (1) US20090279612A1 (zh)
EP (1) EP2039168A2 (zh)
JP (4) JP5715756B2 (zh)
KR (1) KR101450921B1 (zh)
CN (1) CN101485208B (zh)
BR (1) BRPI0713348A2 (zh)
WO (1) WO2008005124A2 (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101450921B1 (ko) * 2006-07-05 2014-10-15 톰슨 라이센싱 멀티뷰 비디오 엔코딩 및 디코딩을 위한 방법 및 장치
CN104093031B (zh) * 2006-10-16 2018-07-20 诺基亚技术有限公司 在多视点视频编码中实施已解码缓存器管理的系统和方法
KR100973657B1 (ko) * 2007-11-01 2010-08-02 경희대학교 산학협력단 디블록킹 필터링을 포함하는 코덱 사이의 트랜스코딩 방법 및 장치
US8326075B2 (en) 2008-09-11 2012-12-04 Google Inc. System and method for video encoding using adaptive loop filter
JPWO2011013257A1 (ja) * 2009-07-29 2013-01-07 パナソニック株式会社 マルチビュービデオ復号装置およびその方法
IL204087A (en) 2010-02-21 2016-03-31 Rafael Advanced Defense Sys A method and system for subsequent viewing of two video streams
CN102868881B (zh) * 2011-07-05 2015-04-15 富士通株式会社 视频编码系统和方法
US8885706B2 (en) 2011-09-16 2014-11-11 Google Inc. Apparatus and methodology for a video codec system with noise reduction capability
CN103096054B (zh) * 2011-11-04 2015-07-08 华为技术有限公司 一种视频图像滤波处理方法和装置
US20130113882A1 (en) * 2011-11-08 2013-05-09 Sony Corporation Video coding system and method of operation thereof
JP6078927B2 (ja) * 2012-01-10 2017-02-15 サン パテント トラスト 動画像符号化方法、動画像符号化装置、動画像復号方法、及び、動画像復号装置
SG10201606621XA (en) 2012-01-20 2016-09-29 Ge Video Compression Llc Coding Concept Allowing Parallel Processing, Transport Demultiplexer and Video Bitstream
EP2811744A1 (en) * 2012-01-31 2014-12-10 Sony Corporation Image processing apparatus and image processing method
US9131073B1 (en) 2012-03-02 2015-09-08 Google Inc. Motion estimation aided noise reduction
KR20130116782A (ko) 2012-04-16 2013-10-24 한국전자통신연구원 계층적 비디오 부호화에서의 계층정보 표현방식
US9813705B2 (en) * 2012-04-26 2017-11-07 Qualcomm Incorporated Parameter set coding
US9762903B2 (en) * 2012-06-01 2017-09-12 Qualcomm Incorporated External pictures in video coding
MY200990A (en) * 2012-07-02 2024-01-29 Samsung Electronics Co Ltd Entrophy Coding of a Video and Entropy Decoding of a Video
US20140010277A1 (en) * 2012-07-09 2014-01-09 Qualcomm, Incorporated Supplemental enhancement information (sei) messages having a fixed-length coded video parameter set (vps) id
US9344729B1 (en) 2012-07-11 2016-05-17 Google Inc. Selective prediction signal filtering
US9380289B2 (en) * 2012-07-20 2016-06-28 Qualcomm Incorporated Parameter sets in video coding
US9426462B2 (en) * 2012-09-21 2016-08-23 Qualcomm Incorporated Indication and activation of parameter sets for video coding
US9154785B2 (en) * 2012-10-08 2015-10-06 Qualcomm Incorporated Sub-bitstream applicability to nested SEI messages in video coding
US9693055B2 (en) 2012-12-28 2017-06-27 Electronics And Telecommunications Research Institute Video encoding and decoding method and apparatus using the same
US10219006B2 (en) * 2013-01-04 2019-02-26 Sony Corporation JCTVC-L0226: VPS and VPS_extension updates
US9374581B2 (en) * 2013-01-07 2016-06-21 Qualcomm Incorporated Signaling of picture order count to timing information relations for video timing in video coding
US9516306B2 (en) * 2013-03-27 2016-12-06 Qualcomm Incorporated Depth coding modes signaling of depth data for 3D-HEVC
US9756335B2 (en) * 2013-07-02 2017-09-05 Qualcomm Incorporated Optimizations on inter-layer prediction signalling for multi-layer video coding
US10102613B2 (en) 2014-09-25 2018-10-16 Google Llc Frequency-domain denoising

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5640208A (en) * 1991-06-27 1997-06-17 Sony Corporation Video signal encoding in accordance with stored parameters
US6055012A (en) * 1995-12-29 2000-04-25 Lucent Technologies Inc. Digital multi-view video compression with complexity and compatibility constraints
JP3776595B2 (ja) * 1998-07-03 2006-05-17 日本放送協会 多視点画像の圧縮符号化装置および伸長復号化装置
KR100397511B1 (ko) * 2001-11-21 2003-09-13 한국전자통신연구원 양안식/다시점 3차원 동영상 처리 시스템 및 그 방법
KR100481732B1 (ko) * 2002-04-20 2005-04-11 전자부품연구원 다 시점 동영상 부호화 장치
US7415069B2 (en) * 2003-12-09 2008-08-19 Lsi Corporation Method for activation and deactivation of infrequently changing sequence and picture parameter sets
KR100679740B1 (ko) * 2004-06-25 2007-02-07 학교법인연세대학교 시점 선택이 가능한 다시점 동영상 부호화/복호화 방법
US7468745B2 (en) * 2004-12-17 2008-12-23 Mitsubishi Electric Research Laboratories, Inc. Multiview video decomposition and encoding
US7903737B2 (en) * 2005-11-30 2011-03-08 Mitsubishi Electric Research Laboratories, Inc. Method and system for randomly accessing multiview videos with known prediction dependency
KR100889745B1 (ko) * 2006-01-09 2009-03-24 한국전자통신연구원 날 유닛 타입 표시방법 및 그에 따른 비트스트림 전달장치및 리던던트 슬라이스 부호화 장치
KR100934677B1 (ko) * 2006-01-12 2009-12-31 엘지전자 주식회사 다시점 비디오의 처리
BRPI0709194A2 (pt) * 2006-03-29 2011-06-28 Thomson Licensing métodos e aparelhos para uso em um sistema de codificação de vìdeo multivista
KR101450921B1 (ko) * 2006-07-05 2014-10-15 톰슨 라이센싱 멀티뷰 비디오 엔코딩 및 디코딩을 위한 방법 및 장치

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Jens-Rainer Ohm.Stereo/Multiview Video Encoding Using the MPEG Family of Standards.《Proceedings of the SPIE》.1999,242-255. *
JeongEun Lim 等.A multiview sequence CODEC with view scalability.《Signal Processing:Image Communication》.2004,第19卷239,242-247. *

Also Published As

Publication number Publication date
US20090279612A1 (en) 2009-11-12
JP5833531B2 (ja) 2015-12-16
KR20100014212A (ko) 2010-02-10
JP6108637B2 (ja) 2017-04-05
WO2008005124A2 (en) 2008-01-10
JP5715756B2 (ja) 2015-05-13
JP5833532B2 (ja) 2015-12-16
EP2039168A2 (en) 2009-03-25
WO2008005124A3 (en) 2008-04-24
BRPI0713348A2 (pt) 2012-03-06
JP2009543448A (ja) 2009-12-03
JP2015216680A (ja) 2015-12-03
KR101450921B1 (ko) 2014-10-15
JP2013070415A (ja) 2013-04-18
JP2013081198A (ja) 2013-05-02
CN101485208A (zh) 2009-07-15

Similar Documents

Publication Publication Date Title
CN101485208B (zh) 多视图视频的编码和解码方法及装置
US9100659B2 (en) Multi-view video coding method and device using a base view
CN102780883B (zh) 用于包含多视点视频编码的参考图像管理的方法
JP6395667B2 (ja) 多視点映像符号化及び復号化用の、ハイレベルシンタックスを使用した改善されたシグナリングのための方法及び装置
CN103797797B (zh) 参考画面信号通知
US20090323824A1 (en) Methods and Apparatus for Use in Multi-View Video Coding
US20100002761A1 (en) Method for using a network abstract layer unit to signal an instantaneous decoding refresh during a video operation
KR20090085581A (ko) 다중-뷰 비디오 코딩을 위한 화상 관리
AU2012203039B2 (en) Methods and apparatus for use in a multi-view video coding system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: French Boulogne - Bilang Kurt

Patentee before: THOMSON LICENSING

CP02 Change in the address of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20190529

Address after: American Delaware

Patentee after: Interactive Digital VC Holdings

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160622

Termination date: 20210525

CF01 Termination of patent right due to non-payment of annual fee