CN101658040B - 用于多视点视频编码的假设参考解码器 - Google Patents

用于多视点视频编码的假设参考解码器 Download PDF

Info

Publication number
CN101658040B
CN101658040B CN2008800120627A CN200880012062A CN101658040B CN 101658040 B CN101658040 B CN 101658040B CN 2008800120627 A CN2008800120627 A CN 2008800120627A CN 200880012062 A CN200880012062 A CN 200880012062A CN 101658040 B CN101658040 B CN 101658040B
Authority
CN
China
Prior art keywords
flag
hrd
present
parameters
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008800120627A
Other languages
English (en)
Other versions
CN101658040A (zh
Inventor
罗建聪
朱立华
尹鹏
普尔温·比贝哈斯·潘迪特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN101658040A publication Critical patent/CN101658040A/zh
Application granted granted Critical
Publication of CN101658040B publication Critical patent/CN101658040B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

本发明提供了一种定义用于多视点视频编码(MVC)的假设参考解码器(HRD)的方法和装置,所述方法和装置针对每一个可能的互操作性点定义限制。M个视点的每一种组合意味着一个互操作性点。本发明的所述原理还允许针对一组互操作点定义限制,并且从所定义一组推导出其它组。所述方法还使得可以根据所述比特流语法中的信息推导出互操作性点的规则。

Description

用于多视点视频编码的假设参考解码器
相关申请的交叉引用
本申请要求于2007年4月17日提交的美国临时申请序号No.60/923,800的权益,其全部内容被合并于此作为参考。
技术领域
本申请涉及一种压缩视频系统中的用于多视点视频编码的假设参考解码器。
背景技术
假设参考解码器(HRD)在压缩视频系统中是有价值的,这是由于它用于使编码比特流对标准的遵循生效。在编码标准(比如H.264/AVC)中,在标准的多视点视频编码(MVC)特征中存在大量的互操作性点。MVC允许解码器同时对一个或者更多视点进行解码,并且对一个视点的解码可能需要来自其它视点的信息。H.264/AVC标准具有定义HRD的规则(也称作要求、限制或者操作规范)。HRD一致性是H.264/MPEG-4AVC标准的标准化部分。任意AVC比特流必须遵循根据该规则建立的HRD。目前,没有针对MVC HRD定义的规则。之前的HRD不具有足以允许它们使诸如AVC中的MVC比特流等比特流有效的规则。
在很多情况下,需要使用编码器以及解码器处的缓冲机制来使平滑压缩比特流中的比特率变化。物理缓冲的大小是有限的,因此编码器将对比特率变化进行限制以适合缓冲极限。视频编码标准不强制要求特定的编码器或者解码器缓冲机制,但是它们要求编码器控制比特率波动,使得给定缓冲区大小的假设参考解码器(HRD)(或者虚拟缓冲验证器(VBV))在不出现缓冲上溢或者下溢的情况下对视频比特流进行解码。
该HRD基于理想化的解码器模型。HRD的目的是在编码流中对于比特率随着时间的变化施加基本的缓冲限制。这些限制使得较高层可以对流进行复用,并且使得性价比高的解码器能够实时解码。在下面的讨论中,使用H.264/AVC作为例子。尽管如此,可以将本发明扩展至其它视频编码模型或者标准。
发明内容
本发明提出了几种定义用于多视点视频编码(MVC)的假设参考解码器(HRD)的方法。
在MVC的当前的基于H.264/MPEG-4AVC的实现中,参考软件通过用单一编码器对每一个视点进行编码并且考虑到交叉视点参考来实现多视点预测。编码器将每一个视点按照它原始的分辨率编码为分离的比特流,并且稍后将所有比特流合并以形成单一比特流。在解码器侧,用户可以基于其应用对一个或者更多个视点进行解码。在目前的规范中,没有针对MVC定义的HRD规则。
在MVC中,假定总共存在N个编码视点。解码器可以具有同时对任意M(1≤M≤N)个视点进行解码的灵活性。M个视点的每一种组合意味着一个互操作性点(IOP)。为了允许最佳的灵活性,在本类中,本发明提出:MVC HRD针对每一IOP定义HRD限制。该解决方案的问题是存在高达(2N-1)种的、过多的组合。即使对M加以限制(其中M≤32),组合的总数依然很大。本发明描述了为用于多视点视频编码的假设参考解码器提供规则的方法,其中针对每一个可互操作点指定该规则。
附图说明
图1示出了由单一视点的HRD参数得到的视点组合的HRD参数。
图2示出了多视点视频编码编码器。
图3示出了多视点视频编码解码器。
图4示出了用于第1类的MVC编码过程的视频可用性信息。
图5示出了用于第1类的MVC解码过程的视频可用性信息。
图6示出了第1类的多视点嵌套SEI编码过程。
图7示出了第1类的多视点嵌套SEI解码过程。
图8示出了用于第2类的MVC编码过程的视频可用性信息。
图9示出了用于第2类的MVC解码过程的视频可用性信息。
图10示出了第2和第3类的多视点嵌套SEI编码过程。
图11示出了第2和第3类的多视点嵌套SEI解码过程。
图12示出了用于第3类的MVC编码过程的视频可用性信息。
图13示出了用于第3类的MVC解码过程的视频可用性信息。
具体实施方式
在当前H.264/MPEG-4AVC参考实现中,将HRD相关参数放在序列参数集合(SPS)和SEI消息中。
如表1所示,SPS包含语法结构VUI参数。
表1序列参数集合
  seq_parameter_set_rbsp(){   C   描述符
  profile_idc   0   u(8)
  ...
  sequence_parameter_set_id   0   ue(v)
  ...
  vui_parameters_present_flag   0   u(1)
  if(vui_parameters_present_flag)
  vui_parameters()   0
  rbsp_trailing_bits()   0
  }
如表2所示,将语法元素num_units_in_tick、time_scale、fixed_frame_rate_flag以及low_delay_hrd_flag以及语法结构HRD参数被置于语法结构VUI参数中。
表2VUI参数
  ...
  timing_info_present_flag   0   u(1)
  if(timing_info_present_flag){
  num_units_in_tick   0   u(32)
  time_scale   0   u(32)
  fixed_frame_rate_flag   0   u(1)
  }
  nal_hrd_parameters_present_flag   0   u(1)
  if(nal_hrd_parameters_present_flag)
  hrd_parameters()
  vcl_hrd_parameters_present_flag   0   u(1)
  if(vcl_hrd_parameters_present_flag)
  hrd_parameters()
  if(nal_hrd_parameters_present_flag‖vcl_hrd_parameters_present_flag)
  low_delay_hrd_flag   0   u(1)
  ...
语法结构HRD参数包含指定缓冲区大小以及比特率等的语法。
缓冲期SEI以及图像定时SEI指定在对图像进行解码之前的初始编码图像缓冲移除延迟以及用于导出每一幅图像的定时的参数。
基于当前的AVC实现、SPS中放置的HRD相关参数、以及在缓冲期SEI和图像定时SEI中放置的参数,可以针对H.264/MPEG-4AVC比特流定义一组HRD限制。
尽管如此,当前的AVC实现仅支持一组HRD参数,这不适合MVC比特流中包含的多个IOP。
在AVC的当前基于H.264/MPEG-4AVC的实现中,参考软件通过用单一编码器对每一个视点进行编码并且考虑到交叉视点参考来实现多视点预测。由编码器将每一个视点以其原始分辨率编码为分离的比特流,并且稍后将所有比特流合并以形成单一比特流。在解码器处,用户可以基于其应用对一个或者更多个视点进行解码。图2和图3分别示出了MVC编码器和解码器图。
在当前规范中,没有针对MVC定义的HRD规则。
在很多所描述的实施例中,使用MVC的基于H.264/MPEG-4AVC框架的实现。相似的理念适用于其它视频编码标准。例如,可以将为一个或者更多操作点(如互操作性点)指定特定参数的特征应用于除了H.264/MPEG-4AVC标准之外的标准。
本文描述了三个不同类别的实现。
A.为MVC中的每一个互操作点指定HRD规则
在MVC中,假定总共存在N个编码视点。解码器可以具有同时对任意M(1≤M≤N)个视点进行解码的灵活性。M个视点的每一种组合意味着一个互操作性点(IOP)。为了允许最佳灵活性,在本类中,本发明提出:MVC HRD针对每一个IOP定义HRD限制。该解决方案的问题是存在高达(2N-1)种的、过多的组合。即使对于M加以限制,(其中M≤32),组合的总数依然很大。
下面描述本解决方案的实施例。
在下面对AVC HRD规则的修改中对视点的所有组合进行组合。表3取自AVC标准,并且涉及AVC-HRD。使用斜体来示出对AVC标准表的添加。在表4中引入新的SEI消息,即多视点嵌套SEI。在图4和图5中分别示出了VUI编码和解码过程的流程图。并且在图6和图7中分别示出了多视点嵌套SEI编码和解码过程的流程图。
1、VUI参数:如表所示,表3示出:通过引入测试变量“profile_idc”的“if-then”语句,对AVC标准中的VUI参数的语法进行了修改。如果“profile_idc”等于“MVC”,则执行一次或者更多次循环,以测试一个或者更多个点(即,IOP)。如果“profile_idc”不等于“MVC”,则假定“AVC”是相关标准,并且执行“else”,以为AVC兼容测试一个点(使用现有的AVC-HRD规则)。如果“profile_idc”等于MVC,则执行第30至60行,否则,执行第63至88行。变量“num_view_combinations_minus1”(第30行)提供循环中IOP的数量。在主循环中,针对每一个IOP的子循环(第33至34行)提供与IOP相关联的view_ids。对于每一个子循环,“num_views_minus1[i]”(第32行)提供与第i个IOP相关联的的视点数量,并且“view_id[i][j]”(第34行)提供第i个IOP的第j个视点的view_id。第35至59行提供针对第i个IOP的语法。对于MVC比特流来说,最多可以存在(2N-1)个IOP。这与针对AVC比特流的单一检查点相比较。
2、在表4中定义新的SEI消息,即多视点嵌套SEI。多视点嵌套SEI消息涉及存取单元。多视点嵌套SEI消息包含一个并且仅包含一个SEI消息,该消息称作嵌套SEI消息。嵌套SEI消息的应用范围由第2至10行的语法所指示。
“num_view_combinations_minus1”、“num_views_minus1[i]”以及“view_id[i][j]”共享VUI参数中的相同语义。
3、可以将缓冲期SEI消息以及图像定时SEI消息(它们是AVC的一部分)实现为在多视点嵌套SEI消息中嵌入的SEI消息有效载荷。缓冲期SEI和图像定时SEI的语法保持与AVC中的一样。针对AVC兼容视点的缓冲期SEI消息和图像定时SEI消息不应当嵌套在多视点嵌套SEI中。这允许AVC兼容性。
表3:VUI参数语法
  1   vui_parameters(){   C   描述符
  2   aspect_ratio_info_present_flag   0   u(1)
  3   if(aspect_ratio_info_present_flag){
  4   aspect_ratio_idc   0   u(8)
  5   if(aspect_ratio_idc==Extended_SAR){
  6   sar_width   0   u(16)
  7   sar_height   0   u(16)
  8   }
  9   }
  10   overscan_info_present_flag   0   u(1)
  11   if(overscan_info_present_flag)
  12   overscan_appropriate_flag   0   u(1)
  13   video_signal_type_present_flag   0   u(1)
  14   if(video_signal_type_present_flag){
  15   video_format   0   u(3)
  16   video_full_range_flag   0   u(1)
  17   colour_description_present_flag   0   u(1)
  18   if(colour_description_present_flag){
  19   colour_primaries   0   u(8)
  20   transfer_characteristics   0   u(8)
  21   matrix_coefficients   0   u(8)
  22   }
  23   }
  24   chroma_loc_info_present_flag   0   u(1)
  25   if(chroma_loc_info_present_flag){
  26   chroma_sample_loc_type_top_field   0   ue(v)
  27   chroma_sample_loc_type_bottom_field   0   ue(v)
  28   }
  29   if(profile_idc==MVC){
  30   num_view_combinations_minus1   0   ue(v)
  31   for(i=0;i<=num_view_combinations_minus1;i++){
  32   num_views_minus1[i]   0   u(5)
  33   for(j=0;j<=num_views_minus1[i];j++)
  34   view_id[i][j]   0   u(5)
  35   timing_info_present_flag[i]   0   u(1)
  36   if(timing_info_present_flag[i]){
  37   num_units_in_tick[i]   0   u(32)
  38   time_scale[i]   0   u(32)
  39   fixed_frame_rate_flag[i]   0   u(1)
  40   }
  41   nal_hrd_parameters_present_flag[i]   0   u(1)
  42   if(nal_hrd_parameters_present_flag[i])
  43   hrd_parameters()
44 vcl_hrd_parameters_present_flag[i] 0 u(1)
  45   if(vcl_hrd_parameters_present_flag[i])
  46   hrd_parameters()
  47   if(nal_hrd_parameters_present_flag[i]‖vcl_hrd_parameters_present_flag[i])
  48   low_delay_hrd_flag[i]   0   u(1)
  49   pic_struct_present_flag[i]   0   u(1)
  50   bitstream_restriction_flag   0   u(1)
  51   if(bitstream_restriction_flag){
  52   motion_vectors_over_pic_boundaries_flag   0   u(1)
  53   max_bytes_per_pic_denom   0   ue(v)
  54   max_bits_per_mb_denom   0   ue(v)
  55   log2_max_mv_length_horizontal   0   ue(v)
  56   log2_max_mv_length_vertical   0   ue(v)
  57   num_reorder_frames   0   ue(v)
  58   max_dec_frame_buffering   0   ue(v)
  59   }
  60   }
  61   }
  62   else{
  63   timing_info_present_flag   0   u(1)
  64   if(timing_info_present_flag){
  65   num_units_in_tick   0   u(32)
  66   time_scale   0   u(32)
  67   fixed_frame_rate_flag   0   u(1)
  68   }
  69   nal_hrd_parameters_present_flag   0   u(1)
  70   if(nal_hrd_parameters_present_flag)
  71   hrd_parameters()
  72   vcl_hrd_parameters_present_flag   0   u(1)
  73   if(vcl_hrd_parameters_present_flag)
  74   hrd_parameters()
  75   if(nal_hrd_parameters_present_flag‖vcl_hrd_parameters_present_flag)
  76   low_delay_hrd_flag   0   u(1)
  77   pic_struct_present_flag   0   u(1)
  78   bitstream_restriction_flag   0   u(1)
  79   if(bitstream_restriction_flag){
  80   motion_vectors_over_pic_boundaries_flag   0   u(1)
  81   max_bytes_per_pic_denom   0   ue(v)
  82   max_bits_per_mb_denom   0   ue(v)
  83   log2_max_mv_length_horizontal   0   ue(v)
  84   log2_max_mv_length_vertical   0   ue(v)
  85   num_reorder_frames   0   ue(v)
  86   max_dec_frame_buffering   0   ue(v)
  87   }
  88   }
  89   }
num_view_combinations_minus1加1指示由引用包含该hrd_parameters()的SPS中相同seq_parameter_set_id的比特流所支持的视点组合的数量。
num_views_minus1[i]指示与第i个IOP相关联的视点数量。
view_id[i][j]指示第i个IOP的第j个视点的view_id。
timing_info_present_flag[i]指定了第i个IOP的timing_info_present_flag值。
num_units_in_tick[i]指定了第i个IOP的num_units_in_tick值。
time_scale[i]指定了第i个IOP的time_scale值。
fixed_framerate_flag[i]指定了第i个IOP的fixed_frame_rate_flag值。
nal_hrd_parameters_present_flag[i]指定了第i个IOP的nal_hrd_parameters_present_flag值。
vcl_hrd_parameters_present_flag[i]指定了第i个IOP的vcl_hrd_parameters_present_flag值。
low_delay_hrd_flag[i]指定了第i个IOP的low_delay_hrd_flag值。
pic_struct_present_flag[i]指定了第i个IOP的pic_struct_present_flag值。
timing_info_present_flag、num_units_in_tick、time_scale、nal_hrd_parameters_present_flag、vcl_hrd_parameters_present_flag、low_delay_hrd_flag以及pic_struct_present_flag具有与AVC中一样的语义。
表4:多视点嵌套SEI消息语法
  1   multiview_nesting(payloadSize){   C   描述符
  2   all_view_combinations_in_au_flag   5   u(1)
  3   if(all_view_combinations_in_au_flag==0){
  4   num_view_combinations_minus1   5   ue(v)
  5   for(i=0;i<=num_view_combinations_minus1;i++){
  6   Num_views_minus1[i]   0   u(5)
  7   for(j=0;j<=num_views_minus1[i];j++)
  8   view_id[i][j]   0   u(5)
  9   }
  10   }
  11   while(!byte_aligned())
  12   sei_nesting_zero_bit/*equal to 0*/   5   f(1)
  13   sei_message()   5
  14   }
all_view_combinations_in_au_flag等于1指示了嵌套SEI消息适用于存取单元的所有视点组合。all_view_combinations_in_au_flag等于0指示,由语法元素num_view_combinations_minus1、num_views_minus1[i]以及view_id[i][j]以信号发送该嵌套SEI消息的可应用范围。
num_view_combinations_minus1加1指示了该比特流支持的视点组合的数量。
num_views_minus1[i]指示了与第i个IOP相关联的视点的数量。
view_id[i][j]指示了第i个IOP的第j个视点的view_id。
B、指定仅针对一组IOP的HRD规则
在本类中,提出了针对一组IOP定义MVC HRD,并且从该组得到其它组IOP。在一实施例中,提出了MVC HRD仅定义用于对每一个可能的单一视点进行解码的HRD限制,并且根据相关单一视点参数推出用于对多于一个视点进行解码的HRD参数。该方法允许发送比第一种方法更少的参数,但是它为推导增添了更多的复杂性。
下面描述本解决方案的实施例:
针对每一个视点定义HRD。发送的HRD参数集合的最大数量是M,其中M=1...N。所以,如果存在N个视点,该实施例将发送N组HRD参数。图8和图9分别示出了VUI编码和解码过程的流程图。并且图10和图11分别示出了多视点嵌套SEI编码和解码过程的流程图。
1、VUI参数:如表所示,示出了通过引入测试变量“profile_idc”的“if-then”语句,对AVC标准中的VUI参数的语法进行了修改。如果“profile_idc”等于“MVC”,则执行一次或者更多次循环,以测试一个或者更多个点。如果“profile_idc”不等于“MVC”,则假定“AVC”是相关标准,并且执行“else”,以为AVC兼容测试一个点(使用现有的AVC-HRD规则)。如果“profile_idc”是MVC,则执行第30至58行,否则,执行第61至85行。变量“num_views_minus1”(第30行)提供循环中视点的数量。“view_id[i]”(第32行)提供第i个视点的view_id。第33至58行提供第i个视点的语法。在MVC比特流中最多可以存在M个视点(M=1...N)。这与针对AVC比特流的单一检查点相比较。
2、在表6中定义了新SEI消息,即多视点嵌套SEI。多视点嵌套SEI消息涉及存取单元。多视点嵌套SEI消息包含一个并且仅包含一个SEI消息,该消息称作嵌套SEI消息。嵌套SEI消息的应用范围由第2至7行的语法所指示。“num_views_minus1”以及“view_id[i]”共享VUI参数中的相同语义。
3、可以将缓冲期SEI消息以及图像定时SEI消息实现为在多视点嵌套SEI消息中嵌入的SEI消息有效载荷。缓冲期SEI和图像定时SEI的语法保持与AVC中的一样。针对AVC兼容视点的缓冲期SEI消息和图像定时SEI消息不应当嵌套在多视点嵌套SEI中。
由与IOP相关联的视点的HRD参数得到每一个IOP(视点组合)的HRD参数。在图1中给出了一个示例。
表5:VUI参数语法
  1   vui_parameters(){   C   描述符
  2   aspect_ratio_info_present_flag   0   u(1)
  3   if(aspect_ratio_info_present_flag){
  4   aspect_ratio_idc   0   u(8)
  5   if(aspect_ratio_idc==Extended_SAR){
  6   sar_width   0   u(16)
  7   sar_height   0   u(16)
  8   }
  9   }
  10   overscan_info_present_flag   0   u(1)
  11   if(overscan_info_present_flag)
  12   overscan_appropriate_flag   0   u(1)
  13   video_signal_type_present_flag   0   u(1)
  14   if(video_signal_type_present_flag){
  15   video_format   0   u(3)
  16   video_full_range_flag   0   u(1)
  17   colour_description_present_flag   0   u(1)
  18   if(colour_description_present_flag){
  19   colour_primaries   0   u(8)
  20   transfer_characteristics   0   u(8)
  21   matrix_coefficients   0   u(8)
  22   }
  23   }
  24   chroma_loc_info_present_flag   0   u(1)
  25   if(chroma_loc_info_present_flag){
  26   chroma_sample_loc_type_top_field   0   ue(v)
  27   chroma_sample_loc_type_bottom_field   0   ue(v)
  28   }
  29   if(profile_idc==MVC){
  30   num_views_minus1   0   ue(v)
  31   for(i=0;i<=num_views_minus1;i++){
  32   view_id[i]   0   u(5)
  33   timing_info_present_flag[i]   0   u(1)
  34   if(timing_info_present_flag[i]){
  35   num_units_in_tick[i]   0   u(32)
  36   time_scale[i]   0   u(32)
  37   fixed_frame_rate_flag[i]   0   u(1)
  38   }
  39   nal_hrd_parameters_present_flag[i]   0   u(1)
  40   if(nal_hrd_parameters_present_flag[i])
  41   hrd_parameters()
  42   vcl_hrd_parameters_present_flag[i]   0   u(1)
  43   if(vcl_hrd_parameters_presen_flag[i])
  44   hrd_parameters()
  45   if(nal_hrd_parameters_present_flag[i]‖vcl_hrd_parameters_present_flag[i])
  46   low_delay_hrd_flag[i]   0   u(1)
  47   pic_struct_presen_flag[i]   0   u(1)
  48   bitstream_restriction_flag   0   u(1)
  49   if(bitstream_restriction_flag){
  50   motion_vectors_over_pic_boundaries_flag   0   u(1)
  51   max_bytes_per_pic_denom   0   ue(v)
  52   max_bits_per_mb_denom   0   ue(v)
  53   log2_max_mv_length_horizontal   0   ue(v)
  54   log2_max_mv_length_vertical   0   ue(v)
  55   num_reorder_frames   0   ue(v)
  56   max_dec_frame_buffering   0   ue(v)
  57   }
  58   }
  59   }
  60   else{
  61   timing_info_present_flag   0   u(1)
  62   if(timing_info_present_flag){
  63   num_units_in_tick   0   u(32)
  64   time_scale   0   u(32)
  65   fixed_frame_rate_flag   0   u(1)
  66   }
  67   nal_hrd_parameters_present_flag   0   u(1)
  68   if(nal_hrd_parameters_present_flag)
  69   hrd_parameters()
  70   vcl_hrd_parameters_present_flag   0   u(1)
  71   if(vcl_hrd_parameters_present_flag)
  72   hrd_parameters()
  73   if(nal_hrd_parameters_present_flag‖vcl_hrd_parameters_present_flag)
  74   low_delay_hrd_flag   0   u(1)
  75   pic_struct_present_flag   0   u(1)
76 bitstream_restriction_flag 0 u(1)
  77   if(bitstream_restriction_flag){
  78   motion_vectors_over_pic_boundaries_flag   0   u(1)
  79   max_bytes_per_pic_denom   0   ue(v)
  80   max_bits_per_mb_denom   0   ue(v)
  81   log2_max_mv_length_horizontal   0   ue(v)
  82   log2_max_mv_length_vertical   0   ue(v)
  83   num_reorder_frames   0   ue(v)
  84   max_dec_frame_buffering   0   ue(v)
  85   }
  86   }
  87   }
num_views_minus1指示比特流中的视点总数。
view_id[i]指示第i个视点的view_id。
timing_info_present_flag[i]指定了第i个视点的timing_info_present_flag值。
num_units_in_tick[i]指定了第i个视点的num_units_in_tick值。
time_scale[i]指定了第i个IOP的time_scale值。
fixed_frame_rate_flag[i]指定了第i个视点的fixed_frame_rate_flag值。
nal_hrd_parameters_present_flag[i]指定了第i个视点的nal_hrd_parameters_present_flag值。
vcl_hrd_parameters_present_flag[i]指定了第i个视点的vcl_hrd_parameters_present_flag值。
low_delay_hrd_flag[i]指定了第i个视点的low_delay_hrd_flag值。
pic_struct_present_flag[i]指定了第i个视点的pic_struct_present_flag值。
timing_info_present_flag、num_units_in_tick、time_scale、nal_hrd_parameters_present_flag、vcl_hrd_parameters_present_flag、low_delay_hrd_flag以及pic_struct_present_flag具有与AVC中相同的语义。
表6:多视点嵌套SEI消息语法
  1   multiview_nesting(payloadSize){   C   描述符
  2   all_views_in_au_flag   5   u(1)
  3   if(all_views_in_au_flag==0){
  4   num_views_minus1   5   ue(v)
  5   for(i=0;i<=num_views_minus1;i++)
  6   view_id[i]   0   u(5)
  7   }
  8   while(!byte_aligned())
  9   sei_nesting_zero_bit/*equal to 0*/   5   f(1)
  10   sei_message()   5
  11   }
all_views_in_au_flag等于1指示了嵌套SEI消息适用于存取单元的所有视点。all_views_in_au_flag等于0指示,由语法元素num_views_minus1以及view_id[i]以信号发送嵌套SEI消息的可应用范围。
num_views_minus1加1指示了该比特流支持的视点数量。
view_id[i]指示了第i个视点的view_id。
C、指定用于最差情况的HRD规则
在本类中,提出MVC HRD仅定义用于对M(M=1...N)个视点进行解码的最差情况的HRD限制。可以将最差情况定义为,例如要求最大的缓冲区大小、最长延迟、最高比特率、传输任意M个视点的最多比特消耗等情况。所以,可以为对每M个视点进行解码定义1组HRD参数。即,定义用于最差情况单一视点的一组HRD参数,以及用于最差情况2视点组合的一组HRD参数,等等,直到用于最差情况N-1视点组合的一组HRD参数,以及用于(最差情况)N视点组合的一组HRD参数。一共仅定义N组HRD参数,用于针对1、2、...、直至N个视点测试HRD一致性。该方法的缺点是,同一个特定情况可能需要的限制相比,它需要发送更高的限制。但是可以节约用于发送所有HRD参数的比特,并且不推导任意参数。
下面描述该解决方案的实施例。
发送的HRD参数集合的最大数量是M,其中M=1...N。图12和图13分别示出了VUI编码和解码过程的流程图。
1、VUI参数:如表所示,表7示出了通过引入测试变量“profile_idc”的“if-then”语句,对AVC标准中的VUI参数的语法进行了修改。如果“profile_idc”等于“MVC”,则执行一次或者更多次循环,以测试一个或者更多个点。如果“profile_idc”不等于“MVC”,则假定“AVC”是相关标准,并且执行“else”,以为AVC兼容测试一个点(使用现有的AVC-HRD规则)。如果“profile_idc”是MVC,则执行第30至57行,否则,执行第60至84行。变量“num_views_minus1”(第30行)提供比特流中视点的数量。第32至56行提供了针对于与对(num_views_minus1+1)个视点的任意i个视点进行解码的最高HRD限制相关联的HRD相关参数的语法。
应当注意到表7与表5不同。例如,参见记载了“view_id[i]”的表5的第32行。
2、可以将缓冲期SEI消息以及图像定时SEI消息实现为在多视点嵌套SEI消息中嵌入的SEI消息有效载荷。多视点嵌套SEI消息的语法可以共享表6中定义的那个。嵌套缓冲期和图像定时SEI消息与对比特流中的视点发送的总数个视点中的任意(num_views_minus1+1)个视点进行解码的最高HRD限制相关联。缓冲期SEI和图像定时SEI的语法保持与AVC中的一样。针对AVC兼容视点的缓冲期SEI消息和图像定时SEI消息不应当嵌套在多视点嵌套SEI中。
表7:VUI参数语法
  1   Vui_parameters(){   C   描述符
  2   aspect_ratio_info_present_flag   0   u(1)
  3   if(aspect_ratio_info_present_flag){
  4   aspect_ratio_idc   0   u(8)
  5   if(aspect_ratio_idc==Extended_SAR){
  6   sar_width   0   u(16)
  7   sar_height   0   u(16)
  8   }
  9   }
  10   overscan_info_present_flag   0   u(1)
  11   if(overscan_info_present_flag)
  12   overscan_appropriate_flag   0   u(1)
  13   video_signal_type_present_flag   0   u(1)
  14   if(video_signal_type_present_flag){
  15   video_format   0   u(3)
  16   video_full_range_flag   0   u(1)
  17   colour_description_present_flag   0   u(1)
  18   if(colour_description_present_flag){
  19   colour_primaries   0   u(8)
  20   transfer_characteristics   0   u(8)
  21   matrix_coefficients   0   u(8)
  22   }
  23   }
  24   chroma_loc_info_present_flag   0   u(1)
  25   if(chroma_loc_info_present_flag){
  26   chroma_sample_loc_type_top_field   0   ue(v)
  27   chroma_sample_loc_type_bottom_field   0   ue(v)
  28   }
  29   if(profile_idc==MVC){
  30   num_views_minus1   0   ue(v)
  31   for(i=0;i<=num_views_minus1;i++){
  32   timing_info_present_flag[i]   0   u(1)
  33   if(timing_info_present_flag[i]){
  34   num_units_in_tick[i]   0   u(32)
  35   time_scale[i]   0   u(32)
  36   fixed_frame_rate_flag[i]   0   u(1)
  37   }
  38   nal_hrd_parameters_present_flag[i]   0   u(1)
  39   if(nal_hrd_parameters_present_flag[i])
  40   hrd_parameters()
  41   vcl_hrd_parameters_present_flag[i]   0   u(1)
  42   if(vcl_hrd_parameters_present_flag[i])
  43   hrd_parameters()
  44   if(nal_hrd_parameters_present_flag[i]‖vcl_hrd_parameters_present_flag[i])
  45   low_delay_hrd_flag[i]   0   u(1)
  46   pic_struct_present_flag[i]   0   u(1)
  47   bitstream_restriction_flag   0   u(1)
  48   if(bitstream_restriction_flag){
  49   motion_vectors_over_pic_boundaries_flag   0   u(1)
  50   max_bytes_per_pic_denom   0   ue(v)
  51   max_bits_per_mb_denom   0   ue(v)
  52   log2_max_mv_length_horizontal   0   ue(v)
  53   log2_max_mv_length_vertical   0   ue(v)
  54   num_reorder_frames   0   ue(v)
  55   max_dec_frame_buffering   0   ue(v)
  56   }
  57   }
  58   }
  59   else{
  60   timing_info_present_flag   0   u(1)
  61   if(timing_info_present_flag){
  62   num_units_in_tick   0   u(32)
  63   time_scale   0   u(32)
  64   fixed_frame_rate_flag   0   u(1)
  65   }
  66   nal_hrd_parameters_present_flag   0   u(1)
  67   if(nal_hrd_parameters_present_flag)
  68   hrd_parameters()
  69   vcl_hrd_parameters_present_flag   0   u(1)
  70   if(vcl_hrd_parameters_present_flag)
  71   hrd_parameters()
  72   if(nal_hrd_parameters_present_flag‖vcl_hrd_parameters_present_flag)
  73   low_delay_hrd_flag   0   u(1)
  74   pic_struct_present_flag   0   u(1)
  75   bitstream_restriction_flag   0   u(1)
  76   if(bitstream_restriction_flag){
  77   motion_vectors_over_pic_boundaries_flag   0   u(1)
78 max_bytes_per_pic_denom   0   ue(v)
79 max_bits_per_mb_denom   0   ue(v)
  80   log2_max_mv_length_horizontal   0   ue(v)
  81   log2_max_mv_length_vertical   0   ue(v)
82 num_reorder_frames   0   ue(v)
83 max_dec_frame_buffering   0   ue(v)
  84   }
  85   }
  86   }
num_views_minus1指示比特流中的视点总数。
timing_info_present_flag[i]指定了用于对i个视点进行解码的timing_info_present_flag值。
num_units_in_tick[i]指定了用于对i个视点进行解码的num_units_in_tick值。
time_scale[i]指定了用于对i个视点进行解码的time_scale值。
fixed_frame_rate_flag[i]指定了用于对i个视点进行解码的fixed_frame_rate_flag值。
nal_hrd_parameters_present_flag[i]指定了用于对i个视点进行解码的nal_hrd_parameters_present_flag值。
vcl_hrd_parameters_present_flag[i]指定了用于对i个视点进行解码的vcl_hrd_parameters_present_flag值。
low_delay_hrd_flag[i]指定了用于对i个视点进行解码的low_delay_hrd_flag值。
pic_struct_present_flag[i]指定了用于对i个视点进行解码的pic_struct_present_flag值。
参数timing_info_present_flag、num_units_in_tick、time_scale、nal_hrd_parameters_present_flag、vcl_hrd_parameters_present_flag、low_delay_hrd_flag以及pic_struct_present_flag具有与AVC中相同的语义。
图4至13示出了用于写入或者读取被标识的特定语法的各种流程图。
本文描述了几种实现,例如提供了用于写入和/或读取HRD说明的规则,所述HRD用于MVC。这使得可以在MVC中定义和使用HRD。
尽管如此,所描述的实现的特征和方面还可适于其它实现。例如,如上所述,可以使用用于其它标准的上述特征来提供HRD。此外,可以使用上述实施例的变型来提供HRD。这些变型可以包括例如使用其它高级语法、使用非高级语法、提供针对其它IOP的参数的实现。因此,尽管可以在实现了本文描述的三个主要实现之一的、针对H.264的高级语法的上下文中描述本文所述的发明,但不应当认为这些描述将特征和概念限制为这样的实现或者上下文。
可以用例如方法或者过程、装置、或者软件程序来实现本文中描述的实现。即使仅在单一形式实现的上下文中进行了讨论(例如,仅作为方法讨论),也还可以将所讨论的实现或者特征以其它形式加以实现(例如,装置或者程序)。可以用例如适当的硬件、软件以及固件来实现装置。可以用例如装置(比如计算机或者其它处理设备)来实现方法。此外,可以由处理设备或者其它装置执行的指令来实施方法,并且可以在计算机可读介质(比如CD、或者其它计算机可读存储设备、或者集成电路)上存储这些指令。
对于本领域技术人员而言显而易见的是,所述实现还可以产生被格式化为承载信息的信号,可以例如存储或者传输该信息。该信息可以包括例如用于执行方法的指令,或者由所描述的实现之一所产生的数据。例如,可以将信号格式化为,将用于写入或者读取描述的实施例的语法的规则作为数据来承载,或者将由所描述的实施例写入的实际语法作为数据来承载。
此外,可以在编码器和解码器中的一个或者二者中同时实现多种实现。
此外,通过本发明可以构思出其它实现。例如,可以通过将所披露的实现的各种特征进行组合、删除、修改或者补充,来创建附加实现。
之前的描述提供了一些不同的实施。本意上,这不是穷尽的,而仅仅是提供对多个可能实现中少量实现的简短描述。

Claims (8)

1.一种用于多视点视频编码的假设参考解码器,包括:用于针对多视点视频编码MVC中的每一个互操作点,指定与一个或者更多个参数和比特流限制信息相关的规则的部件。
2.一种用于多视点视频编码的假设参考解码器,包括:用于仅针对一组互操作点来指定与参数和比特流限制信息相关的规则的部件,以及用于根据所指定的一组推导出其它组的部件。
3.一种用于多视点视频编码的假设参考解码器,包括:用于仅针对对任意数量的视点进行解码的最差情况来指定与参数和比特流限制信息相关的规则的部件。
4.根据权利要求2所述的假设参考解码器,包括:用于仅针对对单一视点进行解码来指定所述规则的部件,以及用于根据所述单一视点的与假设参考解码器相关的参数和比特流限制信息推导用于对多于一个视点进行解码的、与假设参考解码器相关的参数和比特流限制信息的部件。
5.一种用于指定规则、以创建用于多视点视频编码的假设参考解码器的方法,其中,所述规则与一个或者更多个参数和比特流限制信息相关,并且针对MVC中的每一个互操作点来指定所述规则。
6.一种对比特流进行编码的方法,其中,将所述比特流进行格式化为包括描述参数的信息,所述参数是用于多视点视频编码的假设参考解码器的参数,所述用于多视点视频编码的假设参考解码器是根据权利要求1至4中任一项所述的假设参考解码器。
7.一种用于指定规则、以创建用于多视点视频编码的假设参考解码器的方法,其中,所述规则与参数和比特流限制信息相关,并且仅针对对一组互操作点进行解码来指定所述规则,并根据所指定的一组推导出其它组。
8.一种用于指定规则、以创建用于多视点视频编码的假设参考解码器的方法,其中,所述规则与参数和比特流限制信息相关,并且仅针对对任意数量的视点进行解码的最差情况来指定所述规则。
CN2008800120627A 2007-04-17 2008-04-14 用于多视点视频编码的假设参考解码器 Active CN101658040B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US92380007P 2007-04-17 2007-04-17
US60/923,800 2007-04-17
PCT/US2008/004821 WO2008130528A2 (en) 2007-04-17 2008-04-14 Hypothetical reference decoder for multiview video coding

Publications (2)

Publication Number Publication Date
CN101658040A CN101658040A (zh) 2010-02-24
CN101658040B true CN101658040B (zh) 2013-09-11

Family

ID=39768494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008800120627A Active CN101658040B (zh) 2007-04-17 2008-04-14 用于多视点视频编码的假设参考解码器

Country Status (7)

Country Link
US (1) US8761265B2 (zh)
EP (1) EP2145483B1 (zh)
JP (4) JP5263901B2 (zh)
KR (3) KR101615967B1 (zh)
CN (1) CN101658040B (zh)
BR (1) BRPI0809585A2 (zh)
WO (1) WO2008130528A2 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008130528A2 (en) * 2007-04-17 2008-10-30 Thomson Licensing Hypothetical reference decoder for multiview video coding
WO2010125812A1 (ja) 2009-04-28 2010-11-04 パナソニック株式会社 画像復号方法、画像符号化方法、画像復号装置および画像符号化装置
US8948241B2 (en) * 2009-08-07 2015-02-03 Qualcomm Incorporated Signaling characteristics of an MVC operation point
JP2011119906A (ja) * 2009-12-02 2011-06-16 Sony Corp 画像処理装置および画像処理方法
US9473752B2 (en) 2011-11-30 2016-10-18 Qualcomm Incorporated Activation of parameter sets for multiview video coding (MVC) compatible three-dimensional video coding (3DVC)
US20140003534A1 (en) * 2012-07-02 2014-01-02 Sony Corporation Video coding system with temporal scalability and method of operation thereof
US9602827B2 (en) * 2012-07-02 2017-03-21 Qualcomm Incorporated Video parameter set including an offset syntax element
US10110890B2 (en) * 2012-07-02 2018-10-23 Sony Corporation Video coding system with low delay and method of operation thereof
US9241158B2 (en) 2012-09-24 2016-01-19 Qualcomm Incorporated Hypothetical reference decoder parameters in video coding
US8989508B2 (en) * 2012-09-28 2015-03-24 Sharp Kabushiki Kaisha Electronic device for signaling a sub-picture buffer parameter
US9154785B2 (en) * 2012-10-08 2015-10-06 Qualcomm Incorporated Sub-bitstream applicability to nested SEI messages in video coding
MX353121B (es) * 2012-12-26 2017-12-20 Sony Corp Dispositivo y metodo de procesamiento de imagenes.
US9521393B2 (en) 2013-01-07 2016-12-13 Qualcomm Incorporated Non-nested SEI messages in video coding
US9374581B2 (en) 2013-01-07 2016-06-21 Qualcomm Incorporated Signaling of picture order count to timing information relations for video timing in video coding
US9716900B2 (en) * 2014-06-20 2017-07-25 Qualcomm Incorporated Extensible design of nesting supplemental enhancement information (SEI) messages
US9930340B2 (en) 2014-06-20 2018-03-27 Qualcomm Incorporated Systems and methods for selectively performing a bitstream conformance check
JP6497874B2 (ja) * 2014-08-28 2019-04-10 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP7569316B2 (ja) 2018-12-07 2024-10-17 インターデジタル ヴイシー ホールディングス, インコーポレイテッド コード化ツールの組み合わせおよび制限の管理

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1767655A (zh) * 2005-10-18 2006-05-03 宁波大学 一种多视点视频图像视差估计的方法
CN1874520A (zh) * 2006-06-23 2006-12-06 清华大学 一种交互式多视点视频的编码方法
CN1913640A (zh) * 2006-08-11 2007-02-14 宁波大学 多模式多视点视频信号编码压缩方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050254575A1 (en) * 2004-05-12 2005-11-17 Nokia Corporation Multiple interoperability points for scalable media coding and transmission
WO2006062377A1 (en) 2004-12-10 2006-06-15 Electronics And Telecommunications Research Institute Apparatus for universal coding for multi-view video
CN101317459A (zh) 2005-10-11 2008-12-03 诺基亚公司 用于可伸缩视频编码的有效解码图像缓存管理
CN101292538B (zh) 2005-10-19 2012-11-28 汤姆森特许公司 使用可缩放的视频编码的多视图视频编码
ZA200805337B (en) 2006-01-09 2009-11-25 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multiview video coding
KR101245251B1 (ko) 2006-03-09 2013-03-19 삼성전자주식회사 균일한 화질을 제공하는 다시점 영상 부호화 및 복호화방법 및 장치
US8565319B2 (en) * 2006-03-30 2013-10-22 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal
WO2008130528A2 (en) * 2007-04-17 2008-10-30 Thomson Licensing Hypothetical reference decoder for multiview video coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1767655A (zh) * 2005-10-18 2006-05-03 宁波大学 一种多视点视频图像视差估计的方法
CN1874520A (zh) * 2006-06-23 2006-12-06 清华大学 一种交互式多视点视频的编码方法
CN1913640A (zh) * 2006-08-11 2007-02-14 宁波大学 多模式多视点视频信号编码压缩方法

Also Published As

Publication number Publication date
WO2008130528A2 (en) 2008-10-30
JP2013070411A (ja) 2013-04-18
JP5263901B2 (ja) 2013-08-14
KR20100014574A (ko) 2010-02-10
JP6233984B2 (ja) 2017-11-22
WO2008130528A3 (en) 2009-08-20
CN101658040A (zh) 2010-02-24
EP2145483B1 (en) 2020-10-21
JP5475855B2 (ja) 2014-04-16
KR101741050B1 (ko) 2017-05-29
JP2010525662A (ja) 2010-07-22
KR101615967B1 (ko) 2016-04-28
BRPI0809585A2 (pt) 2014-09-23
KR20150086557A (ko) 2015-07-28
KR101633576B1 (ko) 2016-06-27
JP2016167867A (ja) 2016-09-15
US8761265B2 (en) 2014-06-24
KR20140127881A (ko) 2014-11-04
JP2014112922A (ja) 2014-06-19
US20100091882A1 (en) 2010-04-15
EP2145483A2 (en) 2010-01-20

Similar Documents

Publication Publication Date Title
CN101658040B (zh) 用于多视点视频编码的假设参考解码器
CN101658038B (zh) 针对可缩放视频编码的视频可用信息的方法和设备
ES2714279T3 (es) Mejoras de conformidad e interoperabilidad en codificación de vídeo multicapa
CN103718557B (zh) 用于解码视频的方法
EP3026900B1 (en) Image processing device and method
TWI520616B (zh) 用於解碼多視界視頻寫碼內容之方法
CN105491382B (zh) 视频解码装置、视频解码方法以及程序
CN104685878B (zh) 具有颜色空间缩放性的视频压缩
CN104429069B (zh) 用于标识前导画面的设备
TWI407796B (zh) An image signal decoding apparatus, an image signal decoding method, an image signal coding apparatus, an image signal coding method, and a program
CN104604235A (zh) 用于视频处理的发送装置及其方法
KR20080108448A (ko) 멀티-뷰 비디오 코딩 방법 및 디바이스
TWI739042B (zh) 視訊編碼方法
CN101584220B (zh) 对视频信号进行编码的方法和系统、编码的视频信号、对视频信号进行解码的方法和系统
CN101883276B (zh) 软硬件联合解码的多格式高清视频解码器结构
CN110022481A (zh) 视频码流的解码、生成方法及装置、存储介质、电子装置
CN106063267B (zh) 发送装置、发送方法、接收装置以及接收方法
WO2024094540A1 (en) Coding format for optimized encoding of volumetric video
TW202408245A (zh) 一種編解碼方法、裝置、編碼器、解碼器、儲存媒介及碼流
TWI272849B (en) Decoder and decoding method, recording medium, and program

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: French Boulogne - Bilang Kurt

Patentee before: THOMSON LICENSING

CP02 Change in the address of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20190528

Address after: American Delaware

Patentee after: Interactive Digital VC Holdings

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

TR01 Transfer of patent right