CN105393542B - Hevc扩展的层间参数集 - Google Patents

Hevc扩展的层间参数集 Download PDF

Info

Publication number
CN105393542B
CN105393542B CN201480033473.XA CN201480033473A CN105393542B CN 105393542 B CN105393542 B CN 105393542B CN 201480033473 A CN201480033473 A CN 201480033473A CN 105393542 B CN105393542 B CN 105393542B
Authority
CN
China
Prior art keywords
layer
layers
video
inter
equal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480033473.XA
Other languages
English (en)
Other versions
CN105393542A (zh
Inventor
Y·何
叶琰
贺玉文
修晓宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vid Scale Inc
Original Assignee
Vid Scale Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vid Scale Inc filed Critical Vid Scale Inc
Publication of CN105393542A publication Critical patent/CN105393542A/zh
Application granted granted Critical
Publication of CN105393542B publication Critical patent/CN105393542B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种可提供视频数据处理的视频编码设备。该视频编码设备可以接收多个视频表征格式子集。所述多个视频表征格式子集可以对应于多个层。所述多个视频表征子集中的每一个可以包括一个或多个视频表征参数值。视频编码设备可以接收与当前层关联的视频表征格式子集索引(如,在跨层参数集中)。视频编码设备可以通过使用视频表征格式子集索引来确定与当前层关联的多个视频表征格式子集中的一个视频表征格式子集。

Description

HEVC扩展的层间参数集
相关申请的交叉引用
本申请要求2013年6月18日提交的美国临时专利申请No.61/836,552,2013年6月19日提交的美国临时专利申请No.61/837,116,2013年6月27日提交的美国临时专利申请No.61/840,380和2013年7月30日提交的美国临时专利申请No.61/860,221的权益,其内容通过引用合并于此。
背景技术
数字视频压缩技术,例如,提高数字视频通信效率、分布和/或消耗的高效能视频编码HEVC,正不断的发展。与传统数字视频服务(例如,TV信号)相比,视频应用可以被部署在异构环境中。这种异构性可存在于客户端侧以及网络侧。可伸缩的视频编码机制可被用于一次性地在高分辨率编码视频信号,但可以允许根据具体应用要求的和/或客户端设备支持的特定的速率和分辨率对流子集进行解码。
提供一种包括可伸缩的视频编码技术的视频压缩技术以改进终端用户体验和/或服务质量。例如,可伸缩的视频编码可通过一个或多个参数集由高级语法设计来实现。但是,被用信号发送的参数集和语法元素可能无效率地耗费可贵的通信带宽和/或处理资源。
发明内容
提供一种系统、方法和手段以实现视频数据处理。视频编码设备接收多个视频表征(representation)格式子集。视频编码设备可以接收多个视频表征格式子集的计数。多个视频表征格式子集对应于多个层。例如,多个视频表征格式子集中的第一视频表征格式子集对应于第一层,多个视频表征格式子集中的第二视频表征格式子集对应于第二层或多层。
多个视频表征子集中的每一个可以包括一个或多个视频表征参数值。参数值可以包括亮度样本中图像宽度的指示、亮度样本中图像高度的指示、一个或多个亮度数组样本(one or more samples of a luma array)的比特深度的指示、一个或多个色度数组样本(one or more samples of a chroma array)的比特深度的指示、或者色度格式索引的指示中的至少一个。
视频编码设备可以接收与当前层关联的视频表征格式子集索引。例如,视频表征格式子集索引可以在跨层参数集和/或序列参数集SPS中被接收。
视频编码设备可以通过使用视频表征格式子集索引来确定与当前层关联的多个视频表征格式子集中的一个视频表征格式子集。
视频编码设备可以将活动参考层的数目和直接参考层的数量进行比较。基于活动参考层的数目和直接参考层的数目的比较,视频编码设备可以确定是否在切片级报头中包括活动参考层的指示。
视频编码设备可包括用于层间预测的图像的指示,例如,如果活动参考层的数目不等于直接参考层的数目。视频编码设备可以忽略用于层间预测的图像的指示,例如,如果活动参考层的数目等于直接参考层的数目。
视频解码设备可以接收包含一个或多个层的比特流。在接收到的比特流中的活动参考层数目不等于直接参考层数目的条件下,视频解码设备可以接收层间预测层语法元素。层间预测层语法元素指示参考图像层标识(ID)列表,参考图像层标识列表可以被当前层的当前图像用于层间预测。
视频解码设备可以得到层间预测层语法元素,例如,如果活动参考层的数目等于直接参考层的数目。层间预测层语法元素可以根据当前层的直接参考层的层ID被推断出。
附图说明
图1A-1C是示出层间参数集示例的语法表。
图2A-2C是示出简化的序列参数集示例的语法表。
图3是示出简化的序列参数集扩展示例的语法表。
图4是示出从层间参数集合中得到视频编码和/或解码参数的示例过程。
图5示出了参考图像的裁剪示例。
图6A是在其中一个或更多个公开的实施例可得以实现的示例通信系统的系统图。
图6B是可在图6A所示的通信系统中使用的示例无线发射/接收单元(WTRU)的系统图。
图6C是可在图6A所示的通信系统中使用的示例无线电接入网和示例核心网的系统图。
图6D是可在图6A所示的通信系统中使用的另一示例无线电接入网和示例核心网的系统图。
图6E是可在图6A所示的通信系统中使用的另一示例无线电接入网和示例核心网的系统图。
具体实施方式
以下结合多个附图详细描述示例性实施例。虽然该描述提供了可能的实施的具体实例,但应注意到这些细节只是示范性的并不限制本申请的范围。
在视频编码系统中,在客户端设备侧,多屏场景中,例如,具有变化的屏幕尺寸和/或显示能力的智能电话、平板电脑、PC、HDTV等等设备上消耗视频内容预计将继续。在通信网络侧,视频可以通过因特网、WiFi网络、移动通信网络(例如,3G,4G等等)中的一个或多个,或者是其中的组合进行传输。
为了改进用户体验(例如,对于客户端设备的终端用户)和/或视频服务质量,可伸缩的视频编码可以被执行。基于可伸缩的视频编码,视频信号可以一次性地在高分辨率下被编码。这种视频信号可以从一个多个与视频信号关联的视频流的一个或多个子集中被解码,例如,根据特定应用需求的和/或客户端支持的特定速率和/或分辨率。分辨率可以包括一个或多个视频参数,例如空间分辨率(例如,图像尺寸),时间分辨率(例如,帧速率)和视频质量(例如,主观质量,例如平均意见值MOS,和/或客观质量,例如峰值信号噪声比PSNR,结构相似度指数SSIM,或视频质量度量VQM)。其他被使用的视频参数还包括色度格式(例如,YUV420,YUV422,或YUV444),比特深度(例如,8比特或10比特视频),复杂度,视点,域(例如,色域),和/或画面比例(例如,16:9或4:3)。
视频标准包括支持可伸缩模式的工具和/或轮廓。例如,高效能视频编码被配置以支持可伸缩的视频编码。HEVC的可伸缩扩展可以支持空间可伸缩性(例如,可伸缩比特流可以包括在多于一个的空间分辨率上的相应信号),质量可伸缩性(例如,可伸缩比特流可以包括在多于一个质量水平上的相应信号),和标准可伸缩性(例如,可伸缩比特流可以包括使用H.264/AVC编码的基础层和使用HEVC编码的一个或多个增强层)中的一个或多个。可伸缩视频可以被扩展到3D视频,例如,多视点可伸缩性被执行(例如,可伸缩比特流可以包括2D和3D视频信号)。应注意到的是,虽然可伸缩HEVC设计的各个方面可以包括空间和/或质量可伸缩性的使用,如同在此描述的,但是在此描述的技术可以应用到一个或多个的其他可伸缩类型。
HEVC的可伸缩扩展(SHEVC)可以根据基于参考索引的框架被执行。基于参考索引的框架可以在块级别和/或低于块级别上维持操作不变,以使单层编解码器逻辑可以在采用该框架的可伸缩编码系统中被重用,基于参考索引的框架可以简化可伸缩编解码器的设计。这种框架可以支持不同的可伸缩性类型,例如,通过结合高级语法信令和/或层间处理模块,以实现编码效率。例如,执行高级语法变换以支持层间处理和/或SHVC的多层信令。例如,可以根据基于参考索引的框架来执行这种语法变换。
可伸缩视频编码可以支持一个或多个层(例如,多层)。每层都可以被设计成使能一个或多个空间可伸缩性,时间可伸缩性,SNR可伸缩性,或其他类型的可伸缩性。可伸缩比特流可以包括混合可伸缩层,并且为了能够被解码,一个或多个相应增强层可以依赖一个或多个较低层。层间过程可以产生层间参考图像样本和/或运动场信息,例如以增强一个或多个增强层的预测精确度。
多个参数集被指定给一个HEVC实现和/或一个或多个相应扩展。例如,一个视频参数集VPS可以包括一个或多个由多层共享的语法元素。VPS可以包括用于比特流提取、能力交换和/或会话协商的信息(例如,最大层数和/或配置文档,等级(tier)和级别信息中的一个或多个)。
序列参数集SPS可以包括对一个或多个编码视频序列中的编码切片(例如,所有编码切片)来说共同的信息,例如,跨越时间间隔的一系列视频图像。该信息可以包括图像分辨率,比特深度,编码块尺寸等等中的一个或多个。
图像参数集PPS可以包括图像级别信息,该信息可以包括初始量化值,编码工具使能和/或去使能标志等等中的一个或多个。PPS中携带的信息可以在相当长的持续时间内保持不变,例如,多个图像的持续时间,以使该信息不会被频繁的更新。可以在切片级别上变换的信息可以被包括在切片报头中。
一个或多个参数集,例如VPS,SPS和/或PPS可以在带外传输(例如,在一些应用场景中,使用可靠信道)。高级语法设计允许多层参考单个SPS(例如,相同SPS)。例如,这可以用于多视点和/或SNR可伸缩性。对于空间可伸缩性,例如由于不同的视频分辨率,一个或多个层(例如,每层)可以参考相应的不同SPS。如果SPS中的一个或多个参数(例如,大多数参数)在多层间是完全相同的,那么通过删除这种冗余以节省比特率是可取的。一个或多个这样的参数可以由多层共享。
在节省比特率的示例性方法中,可以执行SPS到SPS预测,该预测被用于从基础层的SPS和/或其他依赖层的参数预测一个或多个增强层SPS参数,例如可伸缩性列表,参考图像集等等。该SPS到SPS的预测可以引入不同层之间参数集的依赖性。
在节省比特率的另一示例中,可以执行VPS到SPS预测,该预测可以将一个或多个多层间共享的参数重新设置(relocate)给VPS,并可以基于VPS中相应参数来预测一个或多个共享SPS参数(例如,每层的SPS参数)。
HEVC扩展中SPS实现和/或VPS的设计准则包括如下中的一个或多个,VPS可以包括一个或多个有利于比特流提取和/或能力交换的参数。VPS扩展中可以包括与解码图像缓存(DPB)相关的参数。
参数集(例如,层间参数集IPS)可以通过在多层间共享的一个或多个高级语法元素的聚合来被实现。一个或多个层(例如,每层)可以参考一个或多个IPS参数以节省相应开销比特。
IPS可被用于在可伸缩性HEVC视频编码系统中,例如,由于IPS可以不在基础层中被携带,IPS的大小不会对基础层子数据流产生影响。IPS,例如,通过促进多层间的一个或多个共享参数的预测,来提供高级信令效率。IPS的实现可以在视频编码系统中去除解析依赖,例如,由于被典型地放置在不同参数集中的一个或多个参数可能被包含在同一IPS中,因而,对每个参数的解析可以不依赖于其他不同参数集的解析结果。
IPS可以适用于可伸缩性编码系统中的一个或多个增强层,以至于IPS NAL单元的nuh_layer_id值对于合格的比特流可以不为0。例如,合格比特流的一个或多个IPS NAL单元的nuh_layer_id值可以等于1。
图1A-1C是示出IPS示例的语法表。如图1A-1C中示出的,IPS可以包括一个或多个参数并且可以为多层编码而被专门设计。参数可以包括,例如,max_sublayer_for_ilp_plus1和direct_dependency_type。由于一个或多个层可以共享相同的或非常相似的RPS,IPS可以包括与一个或多个层相关的RPS。
起到一个或多个相似作用并呈现于SPS中的一个或多个参数可以被分成相应的子集,子集包括视频格式子集,编码参数子集,伸缩列表子集,伸缩偏移子集,或VUI子集中的一个或多个。在IPS中,一个或多个子集(例如,每个子集)可以具有相应的多个参数值。这样可以允许增强层通过在IPS和子集中索引来参考多个参数值。例如,第一视频格式集(如,格式0)可以指定720p格式,第二视频格式集(如,格式1)可以指定1080p格式。对于具有四层(如,层0为720p层,层1,层2和层3为1080p层)的混合空间和/或SNR伸缩性编码系统,基础层(如,层0)SPS可以参考ips_video_format_subset(0),增强层(如,层1,2,3)可以参考ips_video_format_subset(1)。在这种示例中,数量被减少的(例如最小的)语法元素可以被用信号发送以覆盖多层使用的参数。
下列内容用于如图1A-1C所示的示例IPS语法表的条目,语法元素ips_inter_layer_view_parameter_set_id可以标识其他语法元素参考的IPS。语法元素num_video_format_subsets可以指定视频格式语法结构(ips_video_format_subset)的数量。语法元素num_coding_param_subsets可以指定编码参数语法结构(ips_coding_param_subset)的数量。语法元素num_pcm_param_subsets可以指定PCM编码参数语法结构(ips_pcm_param_subset)的数量。语法元素num_scaling_list_subsets可以指定可伸缩列表结构(ips_scaling_list_subset)的数量。语法元素num_scaled_ref_layer_offset_subset可以指定可伸缩参考层偏移结构(ips_scaled_ref_layer_offset_subset)的数量。语法元素num_vui_param_subsets可以指定VUI参数结构(ips_vui_param_subset)。
一个或多个视频表征格式可以被分成为子集。一个或多个子集可以在参数集(如,IPS)中被用信号发送。子集可以被一个或多个层参考。例如,第一层可以参考第一子集。一个或多个层可以参考第二子集。每层可以参考子集的索引来获取视频表征语法值。一个或多个子集,例如,在IPS中,可以被执行以进一步节省比特信令IPS语法元素(如,开销比特)。例如,局限于给定子集的第一组参数值的参数值的绝对值可被用信号发送。对于参数值的一个或多个后续集,当前参数值集与先前参数值集之间相应的差值可被用信号发送。为了进行说明,ips_video_format_subset(0)可以指示720p格式(pic_width_in_luma_samples被设置成1280,pic_height_in_luma_samples被设置成720),ips_video_format_set(1)可以指示1080p格式(pic_width_in_luma_samples被设置成1920,pic_height_in_luma_samples被设置成1080)。ips_video_format_set(0)与ips_video_format_set(1)之间的差值被用信号发送,而不是通知1920和1080。按照该示例,针对宽度和高度的640和360之间的差值,相应地,在ips_video_format_set(1)中被用信号发送。
该IPS相应的语法表可以与图1A-1C示出的相同,而描述符类型可以变成ue(v)或se(v),例如,对于可以作为差值用信号发送的参数,相关参数值可以通过如下方式获得。
例如,如果S(i)是给定子集中的第i组参数,则变量P(i,X)是第i参数组S(i)中的参数X,和/或变量ParamValueInIPS(i,X)是针对在IPS中P(i,X)被用信号发送的值。第i参数子集中的参数X的变量ParamValue(i,X),P(i,X),可以从第i-1参数子集,P(i-1,X)中的参数X中获取,例如,通过如下方式。
如同图2A-2C和图3中所描述的,SPS和/或其扩展可以分别被简化。增强层SPS语法表可以,例如通过包括对IPS参数集索引的参考,而被简化,而不是针对一个或多个增强层而在SPS中携带相似的语法元素。
一个或多个SPS语法元素(例如,所有语法元素)可以针对基础层(nuh_layer_id=0)保持不变,如同图2A-2C中阴影条目所表示的。这种方式可以允许与单层HEVC规范的向后兼容性。根据IPS实现而被添加到SPS中的示例性语法元素通过图2A-2C和图3中的斜体文字表示出来。
如下内容应用于如图2A-2C和图3所示的简化的SPS和扩展语法表中的条目。如图2A-2C和图3所示,语法元素sps_inter_layer_view_parameter_set_id可以指定活动参数集(例如,IPS)中ips_inter_layer_view_parameter_set_id的值。参数集中用信号发送的语法元素ips_video_format_subsets_index可以将索引指定到包含在活动参数集中的视频表征格式语法结构列表中。语法元素ips_video_format_subsets_index可以指定应用于参考该SPS的层的表征格式语法结构。ips_video_format_subsets_index的取值范围可以从0到num_video_format_subsets_index(不含)。语法元素ips_coding_param_subsets_index可以将索引指定到包含在活动IPS中的编码参数语法结构列表中。ips_coding_param_subsets_index的取值范围可以从0到num_coding_param_subsets_index(不含)。ips_scaling_list_subsets_index可以将索引指定到包含在活动IPS中的可伸缩列表语法结构列表中。ips_scaling_list_subsets_index的取值范围可以从0到num_scaling_list_subsets_index(不含)。ips_pcm_param_subsets_index可以将索引指定到包含在活动IPS中的PCM参数语法结构列表中。ips_pcm_param_subsets_index的取值范围可以从0到num_pcm_param_subsets_index(不含)。ips_vui_param_subsets_index可以将索引指定到包含在活动IPS中的VUI语法结构列表中,ips_vui_param_subsets_index的取值范围可以从0到num_vui_param_subsets_index(不含)。ips_scaled_ref_layer_offset_subset_index可以将索引指定到包含在活动IPS中的视频格式语法结构列表。ips_scaled_ref_layer_offset_subsets_index的取值范围可以从0到num_scaled_ref_layer_offset_subsets_index(不含)。
这些示例性的语法结构索引允许增强层获取多个参数值,例如,通过索引到IPS和特定子集。例如,为了获取层(如,增强层EL)的pic_width_in_luma_samples,增强层EL可以通过IPS标识(sps_inter_layer_view_parameter_set_id),例如,呈现在给定EL的SPS中,定位(locate)到关联活动IPS。使用EL SPS中的索引ips_video_format_subsets_index的值,EL可以定位到呈现在关联活动IPS中的特定视频格式子集,ips_video_format_subset(ips_video_format_subsets_index)。EL的pic_width_in_luma_samples值可以从呈现在ips_video_format_subset(ips_video_format_subsets_index)中的pic_width_in_luma_samples的相应参数值中被获取,例如,直接根据此处所描述的第一示例性IPS信令方法。可替换地,pic_width_in_luma_samples值可以从ParamValue(ips_video_format_subsets_index,pic_width_in_luma_samples)中被获取,例如,根据此处所描述的第二示例性IPS信令方法。该EL的pic_height_in_luma_samples值可以通过相似方式被获取。图4示出了从IPS获取参数的示例。一个或多个其他参数子集中的一个或多个其他参数的值可以通过相似方式被获取。
IPS原始字节序列有效载荷(RBSP)可以包括一个或多个被一个或多个SPS RBSP参考的参数。每个IPS RBSP最初被认为是非活动的,例如,在解码过程操作启动时。在示例性解码过程操作期间,最多有一个IPS RBSP被认为是活动的。任何IPS RBSP的激活会导致之前处于活动状态的IPS RBSP去激活。
当IPS RBSP并未已经处于活动状态且通过SPS RBSP的激活(如,sps_inter_layer_view_parameter_set_id等于ips_inter_layer_view_parameter_set_id值)而被参考时,IPS RBSP可以被激活。被激活的IPS RBSP被称为活动IPS RBSB直到其被去激活,例如,由于另一个IPS RBSP的激活。具有特定ips_inter_layer_view_parameter_subset_id值的IPS RBSP可以在被激活之前对解码过程可用。
切片报头可以包括从一个切片到另一个切片而变换的信息以及图像相关信息,图像相关信息对于一些切片和/或图像类型来说是相关的不或者是小的。在视频编码标准中,如,可伸缩扩展的高效能视频编码HEVC(SHVC),被设计用于层间预测的语法元素可以包括具有固有冗余的样本预测和动作预测。切片报头的比特代价可以通过消除特定冗余度来减少,例如,通过一些调整信令逻辑。
表1VPS扩展语法表示例。表2示出了用于视频编码标准,如SHVC的切片报头语法示例。
表1
表2
如表1中说明的,max_one_active_ref_layer_flag可以在VPS扩展中被用信号发送以指定,例如,是否来自一个层或多于一个层的一个或多个图像可以被用于可伸缩系统中的层间预测。该标志可以施加限制以允许可伸缩系统中来自一个层的层间参考图像。当可伸缩配置文档和/或级别被定义时,这种限制是可取的。基于max_one_active_ref_layer_flag的设定,切片报头(如表2所示)中的语法元素num_inter_layer_ref_pics_minus1可能在或不在切片报头中被用信号发送。当max_one_active_ref_layer_flag等于1时,num_inter_layer_ref_pic_minus1可以被推断为0,因此而不被用信号发送,并且一个参考层的层标识可以在切片报头中被用信号发送,否则(例如,当max_one_active_ref_layer_flag为0时),num_inter_layer_ref_pic_minus1可以被用信号发送。切片报头中的num_inter_layer_ref_pic_minus1标志之后跟着(num_inter_layer_ref_pics_minus1+1)个层的层标识。
max_one_active_ref_layer_flag可以被max_num_active_ref_layers_minus1标志取代,max_num_active_ref_layers_minus1标志的描述符类型可以为ue(v)(如表3所示)。语法元素可以指示在解码过程中被使用以用于能力交换目的的最大参考层。适当的配置文档和/或级别约束被定义。语法元素可以比1比特标志更加灵活。
表3
当max_num_active_ref_layers_minus1等于0时,num_inter_layer_ref_pics_minus1不在切片报头中被用信号发送(例如,被省略)。假使最多一个参考层被允许层间预测,VPS扩展中的这种语法元素的比特代价与原始max_one_active_ref_layer_flag的比特代价相同(例如,1比特)。在这种情况下,视频解码设备可以推断层间预测层语法元素,表4示出了切片片段段头示例。
表4
变量NumActiveRefLayerPics可基于max_num_active_ref_layers_minus1获得。例如,该变量可通过如下方式获得:
伪代码1:
如表4中说明的,例如当活动参考层的数量(如,NumActiveRefLayerPics)与直接参考层(如,NumDirectRefLayers[num_layer_id])的数量不同时,inter_layer_pred_layer_idc可被用信号发送。例如当活动参考层的数量(如,NumActiveRefLayerPics)与直接参考层(如,NumDirectRefLayers[num_layer_id])的数量相同时,inter_layer_pred_layer_idc不被呈现在比特流中。例如,切片报头中的inter_layer_pred_layer_idc是冗余的。在这种情况下,图像被用于层间预测的指示可被跳过。在这种情况下,inter_layer_pred_layer_idc可以从如伪代码2中说明的方式被获取或被推断出。变量NumDirectRefLayers的值可以在标准中被提供,如SHVC.
伪代码2:
如果切片不是一个从属切片,从错误恢复(resilience)角度考虑,切片报头可以提供给图像中的每个切片。由于一个图像可以包括一个或多个切片并且切片报头可以提供给每个切片,切片报头的比特代价应当比其他参数集,如SPS(序列参数集),PPS(图像参数集)等的比特代价受到更多的关注。与切片报头相比,这些参数集不经常被提供。
在视频编码标准,如SHVC中,变量,例如NumActiveRefLayerPics,inter_layer_pred_layer_idc,collocated_ref_layer_idx对于编码图像的每个切片来说可以是相同的。因此,SPS扩展,PPS,APS或IPS中的语法元素,例如,inter_layer_pred_enable_flag,num_inter_layer_ref_pics_minus1,inter_layer_pred_layer_idc,inter_layer_sample_pred_only_flag,alt_collocated_indicate_flag和collocated_ref_layer_idx,而不是切片报头,可以被发送以使对于图像中的每个切片来说相同语法不被重复。表5示出了在SPS扩展中被用信号发送的语法元素。
表5
在将语法元素从切片报头中重新设置到参数集中时,依赖于在其他参数集中用信号发送参数值的情况可以被改变以避免多个参数集之间的解析依赖。表5示出了当相关语法元素从切片报头中重新设置到SPS扩展时的SPS扩展语法表示例。
在一些应用中,层间预测相关信令(如,inter_layer_pred_enabled_flag,inter_layer_sample_pred_only_flag等)在切片之间或图像之间是变化的。对于这类应用,发送切片报头中的语法元素会带来不希望的信令开销。SPS扩展(或PPS,IPS)中可能会增加标志,例如用于指示是否在切片段头中呈现层间预测相关语法元素。表6示出了在SPS扩展中用信号发送的语法元素示例。表7示出了相应的切片报头示例。
表6
表7
sample_prediction_present_slice_present_flag等于1表明层间样本预测相关语法元素,如inter_layer_pred_enable_flag,num_inter_layer_ref_pics_minus1,inter_layer_pred_layer_idc,inter_layer_sample_pred_only_flag被呈现在切片报头中。sample_prediction_present_slice_present_flag等于0表明相关样本预测语法元素不被呈现在切片片段头中。当不呈现时,语法元素的值可基于一个或多个变量推断出。例如,伪代码3提供了如何推断语法元素值的示例。
伪代码3:
变量NumSamplePredRefLayers,NumSamplePredLayers和SamplePredEnabledFlag在视频编码标准,如SHVC中被提供。当sample_prediction_slice_present_flag等于0时,样本预测语法元素inter_layer_sample_pred_only可被推断出等于0。motion_prediction_slice_present_flag等于1表明层间动作预测相关语法元素,如alt_collocated_indication_flag,collocated_ref_layer_idx等可以呈现在切片报头中。motion_prediction_slice_present_flag等于0表明层间动作预测相关语法元素不呈现在增强层切片片段头中。这些语法元素的值可基于一个或多个变量推断出来。例如,伪代码4提供了如何推断语法元素值的示例。NumMotionPredRefLayers和/或MotionPredRefLayerId由视频编码标准,如SHVC提供。
伪代码4:
如伪代码4所示,如果至少一个动作预测参考层可用,则层间动作信息(如,而不是时间运动信息)可以用于时间运动向量预测。并置的参考层可被设置为最靠近当前增强层的运动预测参考层。其他运动预测参考层可被指定为并置参考层。例如,最低运动预测参考层MotionPredRefLayerId[nuh_layer_id][0],而不是最近参考层,可被用作TMVP的默认并置参考层。
语法元素inter_layer_sample_pred_only_flag等于1表明当解码当前图像时,使用EL中时间参考图像的层间预测是不被允许的。参考图像列表L0和L1不包括时间参考图像。不论切片的网络提取层NAL的单元类型,inter_layer_sample_pred_only_flag可在每个切片中被用信号发送。增强层EL的瞬时译码器刷新IDR图像可以是不使用时间参考图像进行层间预测的图像。inter_layer_sample_pred_only_flag可基于EL中的IDR NAL单元被确定。如表8中所示的条件(如,(nal_unit_type!=IDR_W_RADL&&nal_unit_type!=IDR_N_LP))可能被应用。
表8
当inter_layer_sample_pred_only_flag等于1时,可用参考图像可以是层间参考图像。由于在SHVC中,来自层间参考图像的运动矢量可能等于0,因而时间运动矢量预测(TMVP)可能被旁路并且切片报头中与TMVP相关的语法元素可能被跳过。inter_layer_sample_pred_only_flag可能被利用以忽略运动预测信令。
WTRU可不使用inter_layer_sample_pred_only_flag来确定用于层间预测的参考图像。例如,WTRU不接收inter_layer_sample_pred_only_flag,但WTRU可以确定用于层间预测的参考图像。WTRU的层间预测的推断,例如,不使用时间预测,可不依赖于inter_layer_sample_pred_only_flag。如果inter_layer_sample_pred_only_flag不在比特流中被用信号发送(例如,与/或不被WTRU接收),WTRU可推断时间参考图像。例如,WTRU通过检查RPS(例如,RPS中的标志used_by_curr_pic_flag,used_by_curr_pic_s0_flag和used_by_curr_pic_s1_flag可以被设置为0)来检测时间参考图像未被用于当前切片。时间运动矢量预测TMVP过程可被旁路,例如,如果时间参考图像没有被用于当前切片的编码。例如,其他相关语法元素可被跳过(例如,可同样被跳过)。
slice_temporal_mvp_enabled_flag可基于增强层(例如,nuh_layer_id>0)的sps_temporal_mvp_enabled_flag(例如在SHVC中被提供的)和/或inter_layer_sample_pred_only_flag来被用信号发送。表9示出了该种信令的示例。例如,变量InterRefEnabledInRPLFlag可根据如下方式获得:如果NumSamplePredRefLayers[nuh_layer_id]和NumActiveRefLayerPics大于0,InterRefEnabledInRPLFlag可被设置等于!inter_layer_sample_pred_only_flag;否则,InterRefEnabledInRPLFlag可被设置等于1。
为了使slice_temporal_mvp_enabled_flag取决于inter_layer_sample_pred_only_flag,inter_layer_sample_pred_only_flag的信令和样本预测语法结构(如表9中所示)可先于slice_temporal_mvp_enabled_flag被确定或被用信号发送。当slice_temporal_mvp_enabled_flag没被用信号发送(例如,由于inter_layer_sample_pred_only_flag被设置等于1),slice_temporal_mvp_enabled_flag可被推断等于0。
当slice_temporal_mvp_enabled_flag为0时,语法元素,例如alt_collocated_indication_flag,collocated_ref_layer_idx,collocated_from_l0_flag和/或collocated_ref_idx可被跳过(如表9中所示)。表9
信令顺序,slice_temporal_mvp_enabled_flag可先于inter_layer_sample_pred_only_flag被用信号发送,可被保持。如表10中所示,条件(InterRefEnabledInRPLFlag)可应用于用信号发送TMVP参数。InterRefEnabledInRPLFlag的获取可在视频编码标准,如SHVC中被指明。变量InterRefEnabledInRPLFlag可通过如下方式获得:如果NumSamplePredRefLayers[nuh_layer_id]大于0并且NumActiveRefLayerPics大于0,InterRefEnabledInRPLFlag可被设置等于!inter_layer_sample_pred_only_flag;否则,InterRefEnabledInRPLFlag可被设置等于1。slice_temporal_mvp_enabled_flag的值可通过如下方式发生改变:如果InterRefEnabledInRPLFlag等于0,则slice_temporal_mvp_enabled_flag可被设置等于0。
表10
时间亮度运动矢量预测的推导过程可发生改变,变量mvLXCol和availableFlagLXCol被获得,例如,slice_temporal_mvp_enabled_flag等于0或者InterRefEnabledInRPLFlag等于0,则mvLXCol成分(例如两个)可被设置等于0,并且availableFlagLXCol可被设置等于0。
视频编码设备(如,基于SHVC编码标准的)可在切片报头中用信号发送一个或多个语法元素(例如,两个语法元素),alt_collocated_indication_flag和/或collocated_ref_layer_idx以指示用于层间运动预测的参考层。原始时间运动矢量预测(TMVP)可使用语法元素collocated_from_l0_flag和collocated_ref_idx来指示用于TMVP的参考图像。相同的信令可应用到层间运动预测,以便多余的语法元素alt_collocated_indication_flag和collocated_ref_layer_idx可不被用信号发送(如,可被忽略)。表11示出了示例通用切片片段头语法。
alt_collocated_indication_flag和collocated_ref_layer_idx可由视频编码标准,如HEVC提供。用于TMVP的一些层间参考图像可不被用于样本预测。参考图像列表中的层间参考图像的索引可用于指示TMVP的层间并置参考图像。参考图像列表中的层间参考图像的索引可不被用于层间样本预测。施加对比特流的限制,使得对应于层间参考图像的参考索引不被任何增强层图像的预测块参考。
表11
用于用信号发送SNR可伸缩性的系统和/或方法被提供。在这些系统和/或方法中,信令应在不同伸缩性之间予以区分。例如,空间可伸缩性可区别于SNR可伸缩性,反之亦然。在一个实施例中,指示符,标志,或其他标识符或信息可用来区分SNR可伸缩性和空间可伸缩性。此外,基于指示符,如SNR可伸缩性指示符,该信令可指示是否调用或执行重采样过程,(如,针对样本)和/或运动预测。
如此处所描述的,已存在的国际视频标准,如MPEG-2视频,H.263,MPEG4视觉。和。H.264,每一个可包括或具有支持可伸缩性模式的工具和/或配置文档。但是,对于由这些已存在标准支持的可伸缩性编码,HEVC可能现在并不支持。因此,HEVC可被扩展以支持该可伸缩性编码,该可伸缩性编码包括如下内容中的至少一项:空间可伸缩性(即,可伸缩比特流可在多于一个空间分辨率上用信号发送),质量可伸缩性(即,可伸缩比特流包括处于多于一个质量级别上的信号)和标准可伸缩性(即,可伸缩比特流包括使用H.264/AVC编码的基础层和一个或多个使用HEVC编码的增强层)。在示例实施例中,被HEVC支持的质量可伸缩性可以也包括SNR可伸缩性。此外,由于现在3D视频越来越受欢迎,可伸缩性的附加扩展(如,可伸缩比特流包括2D和/或3D视频信号)将被提供和/或使用(如,在MPEG中描述或定义的)。
用于HEVC可伸缩和多视点扩展的公共规范可包括用于HEVC可伸缩性扩展(SHVC)的基于参考索引的框架。在该框架下,SHVC的语法,语义和解码过程被提供。基于参考索引的框架可以在块级别和/或低于块级别上维持一个或操作不变,以使存在的单层编解码器逻辑可以在可伸缩编码系统中被重用,框架可以简化可伸缩性编解码器的设计,并且可以进一步通过结合高级语法信令和层间处理模块而灵活地支持不同的可伸缩性类型以实现编码效率。多种新高级语法变化可被提供和/或支持层间处理和SHVC的多层信令。
为了用信号发送HEVC中的这种可伸缩性,如在此处描述的系统和/或方法被提供。例如,空间可伸缩性可区别于SNR可伸缩性,反之亦然。在一个实施例中,指示符,标志,或其他标识符或信息可用来区分SNR可伸缩性和空间可伸缩性。此外,基于指示符,如SNR可伸缩性指示符,该信令可指示是否调用或执行重采样过程,(如,针对样本)和/或运动预测。
可伸缩视频编码可支持多个层,每个层可支持空间可伸缩性,时间可伸缩性,SNR(信号噪声比)可伸缩性和/或任何其他类型的可伸缩性。可伸缩比特流可以具有混合可伸缩层,并且每个增强层可以依赖一个或多个将被解码的较低层。层间过程可以产生层间参考图像ILR样本和/或运动场信息,以增强或改进增强层编码效率。
SNR伸缩性信令被提供和/或使用。对于空间可伸缩性,视频可在不同分辨率和不同层上被编码。例如,基础层视频可具有720p分辨率,增强层可具有1080p分辨率。此外,对于SNR可伸缩性,视频分辨率可在多层间相同,但不同的层可在不同的质量水平上被编码。例如,基础层以33dB被编码,而增强层以36dB被编码。在SHVC中,语法元素,如scalability_mask,可包含在参数集(如,视频参数集VPS)中以区分多视点可伸缩性和空间/SNR可伸缩性(如,表12中所示)。
表12 可伸缩性标识到可伸缩性维度的映射
但是,如今在SHVC中,scalability_mask语法可能无法区分空间可伸缩性和SNR可伸缩性。例如,空间可伸缩性和SNR可伸缩性可能是两种不同的可伸缩性,两种不同的伸缩性可能使用不同的编解码器操作和存储器分配。这些区别的示例如下所示。参考层运动场和参考层图像样本的重采样过程可用于空间可伸缩性但不能用于SNR可伸缩性。此外,一些层间滤波器,如固定可替换重采样滤波器(如,在核心实验SCE3中评估的),可获得在SNR可伸缩性上的改进性能增益,但可能不能应用于空间可伸缩性。应用可将单环路设计(如,该设计被SVC,H.264的可伸缩扩展,支持)用于SNR可伸缩性而不是用于空间可伸缩性。采样网格(如,目前正经历核心实验SCE1)可解决与空间可伸缩性,而不是SNR可伸缩性,相关的特定问题。
如在此所述,提供一种在高级语法中区分空间可伸缩性和SNR可伸缩性的系统、方法和手段,以使编码器和解码器操作可根据被支持的相关编码工具而被配置和/或初始化。
例如,如今在SHVC中,SNR可伸缩性可根据比例因子,如在重采样过程(如2013年4月SHVC工作草案JCTVC-M1008的G.8.1.4中描述的重采样过程)中指定的ScaleFactorX被推断出。当ScaleFactorX等于1,可伸缩性为SNR可伸缩性。可伸缩性可在解析SPS和SPS扩展后获得。其他信令选择可被提供以寻址(address)重采样过程和SNR可伸缩性的信令,从而减少或避免(如,通过避免解析)多余的编解码器操作和存储器分配和/或接入。
单独的可伸缩性维度可被分配给空间和SNR可伸缩性,例如,以区分空间和SNR可伸缩性。表13示出了修改后的可伸缩维度表的示例实施例,其中空间和SNR可伸缩性具有独特的或单独的值。
表13 建议的可伸缩性标识到可伸缩性维度的映射
scalability_mask索引 可伸缩性维度 可伸缩性标识映射
0 多视点 视点标识
1 空间可伸缩性 依赖性标识
2 SNR可伸缩性 SnrId
3-15 保留
如表13所示,除了视点标识ViewId和依赖性标识DependencyId,变量SnrId[layer_id_in_nuh[i]]被提供和/或被用作第i层的SNR标识符。根据示例实施例,SnrId通过如下方式获得:
此外,例如,为了区分空间和SNR可伸缩性,SNR可伸缩性标志被提
供和/或被使用。例如,SNR可伸缩性标志可被添加到参数集扩展(如,视
频参数集VPS扩展)中以指示如表14中所示的SNR可伸缩性。
表14 视频参数集扩展语法
根据示例实施例,如果或当SNR_scalability_flag等于1时,nuh_layer_id等于layer_id_in_nuh[i]的层和nuh_layer_id等于layer_id_in_nuh[j]的层之间的可伸缩性可以指定或指示SNR可伸缩性。如果或当SNR_scalability_flag等于0时,nuh_layer_id等于layer_id_in_nuh[i]的层和nuh_layer_id等于layer_id_in_nuh[j]的层之间的可伸缩性不是SNR可伸缩性(如,不能指定或指示SNR可伸缩性)。此外,如果或当SNR_scalability_flag未被提供时,它被推断等于0。
如在此描述的,解码可,例如作为重采样过程的一部分,被执行。与示例性重采样过程相关的解码过程可通过如下方式执行。如果PicWidthInSamplesL等于RefLayerPicWidthInSamplesL,PicHeightInSamplesL等于RefLayerPicHeightInSamplesL,并且ScaledRefLayerLeftOffset,ScaledRefLayerTopOffset,ScaledRefLayerRightOffset和/或ScaledRefLayerBottomOffset的值中的每一个等于0,rsPicSample可被设置为rlPicSample并且rsPicMotion可被设置成等于rlPicMotion,例如,当alt_collocated_indication_flag等于1。rsPic可通过如下方式得到。图像样本重采样过程(如,在2013年4月SHVC工作草案JCTVC-M1008G.8.1.4.1的子条款中指定的)可被调用,并以rlPicSample样本值作为输入,rsPicSample的被重采样样本值作为输出。当alt_collocated_indication_flag等于1,图像运动场重采样过程(如,2013年4月SHVC工作草案JCTVC-M1008G.8.1.4.2的子条款中指定的)可被调用,并以rlPicMotion作为输入,rsPicMotion的被重采样运动场作为输出。
使用此处描述的SNR_scalability_flag,示例性的重采样过程可通过如下方式被提供。例如,如果SNR_scalability_flag被设置成等于1,rsPicSample可被设置成等于rlPicSample。此外,当alt_collocated_indication_flag等于1且如果SNR_scalability_flag被设置成等于1,rsPicMotion可被设置成rlPicMotion。rsPic可通过如下方式获得。图像样本重采样过程(如2013年4月SHVC工作草案JCTVC-M1008G.8.1.4.1的子条款中指定的)可被调用,并以rlPicSample样本值作为输入,rsPicSample的被重采样样本值作为输出。当alt_collocated_indication_flag等于1,图像运动场重采样过程(如2013年4月SHVC工作草案JCTVC-M1008G.8.1.4.2的子条款中指定的)可被调用,并以rlPicMotion作为输入,rsPicMotion的被重采样运动场作为输出。
在示例性实施例中,一个或多个例外可被提供和/或呈现。一个该种例外可包括或可能是混合标准可伸缩性,其中,基础层(BL)是AVC编码的。视频编码尺寸在HEVC EL和AVCBL之间是不同的。例如,当AVC基础层(BL)和HEVC增强层同样对1920x1080视频进行编码时,解码BL参考图像尺寸可为1920x1088,同时增强编码图像尺寸可为1920x1080(如,这是由于AVC和HEVC标准应用不同的填充过程)。虽然亮度和/或色度样本的重采样不是必须的,但解码后的参考图像(1920x1088)可不被直接用于预测EL图像(1920x1080),且相应的裁剪区域可被拷贝到ILR图像。
如在此描述的,多种方法可被用于解决该种例外。例如,在一种方法中,当BL和EL视频编码尺寸相同而无需考虑一个或多个伸缩偏移值时,SNR_scalability_flag可被限制成1。这种限制可在比特流一致性限定中被提供和/或强调以保证编码器可适当地设置SNR_scalability_flag的值。在这种情况下,针对上述1920x1080混合标准可伸缩性,SNR_scalability_flag可被设置成0并且层间参考图像可从根据重采样过程(如2013年4月SHVC工作草案JCTVC-M1008G.8.1.4.21的子条款中指定的)从1920x1088AVC基础层图像获得。
在一个方法中,当比例因子,ScaleFactorX(如G.8.1.4中指定的)等于1时,SNR_scalability_flag可被设置为1。在该方法中,重采样过程可被进一步修改以覆盖如下特殊情况。除rlPic和rsPic(如,在SHVC WD G.8.1.4定义的)之外,另一个被裁减参考层图像rcPic可被添加到重采样过程。变量CroppedRefLayerPicWidthInSamplesL和CroppedRefLayerPicWidthinSamplesL可各自被设置成在亮度样本单位下等于rcPic的宽度和高度。变量rcPicSample可进一步被定义成指定亮度和色度成分的rcPic的样本值的一组样本数组。此外,rcPicMotion可被定义成指定rcPic压缩运动场的一组变量数组。
变量RefLayerPicWidthInSamplesL和RefLayerPicHeightInSamplesL可各自被设置成在亮度样本单位下等于被解码的参考层图像rcPic的宽度和高度。亮度样本位置[xP][yP]可指定rlPic的左上样本。此外,变量rc左侧开始rcLeftStart,rc右侧结束rcRightEnd,rc上部开始rcTopStart和rc下部结束rcBottomEnd可通过如下方式获得:
rcLeftStart=xP+可伸缩参考层左侧偏移ScaledRefLayerLeftOffset
rcRightEnd=xP+(RefLayerPicWidthInSamplesL–1)+可伸缩参考层右侧偏移ScaledRefLayerRightOffset
rcTopStart=yP+可伸缩参考层上部偏移ScaledRefLayerTopOffset
rcBottomEnd=yP+(RefLayerPicHeightInSamplesL–1)+可伸缩参
考层下部偏移ScaledRefLayerBottomOffset
rcPic可通过裁剪rlPic的左上位置(rcLeftStart,rcTopStart)和右下位置(rcRightEnd,rcBottomEnd)获得。图5示出了裁剪的示例。如图5所示,当伸缩偏移不等于0时,rcPic可从rlPic获得。
重采样过程可按如下方式提供。如果SNR_scalability_flag被设置成1,rsPicSample可被设置成等于rcPicSample,并且当alt_collocated_indication_flag等于1时,rsPicMotion可被设置成等于rcPicMotion。rsPic可通过如下方式获得。图像样本重采样过程(如2013年4月SHVC工作草案JCTVC-M1008G.8.1.4.1的子条款中指定的)可被调用,并以rlPicSample样本值作为输入,rsPicSample的被重采样样本值作为输出。图像运动场重采样过程(如2013年4月SHVC工作草案JCTVC-M1008G.8.1.4.2的子条款中指定的)可被调用,并以rlPicMotion作为输入,rsPicMotion的被重采样运动场作为输出,如当alt_collocated_indication_flag等于1时。
空间和SNR可伸缩性可被区分以,例如,避免没必要的重采样操作和/或存储器分配。额外或追加的语法元素可在参数集扩展(如表15中所示视频参数集VPS扩展)中被用信号发送以指示重采样过程是否被旁路(bypass)。
表15 视频参数集扩展语法
resampling_buffer_enable_flag[i][j]可等于0以指示或指定第i层和第j层之间的重采样过程可被旁路并且无重采样缓存器被分配。resampling_buffer_enable_flag等于1指示或指定用于图像样本或运动值的重采样过程的相关缓存器被调用。当resampling_buffer_enable_flag没有呈现,则默认值为0。重采样过程将按如下方式修改。如果resampling_buffer_enable_flag被设置成0,rsPicSample可被设置等于rlPicSample,并且当alt_collocated_indication_flag等于1,rsPicMotion可被设置成等于rlPicMotion。rsPic可按如下方式获得。图像样本重采样过程(如2013年4月SHVC工作草案JCTVC-M1008G.8.1.4.1的子条款中指定的)可被调用,并以rlPicSample样本值作为输入,rsPicSample的被重采样样本值作为输出。此外,当alt_collocated_indication_flag等于1,图像运动场重采样过程(如2013年4月SHVC工作草案JCTVC-M1008G.8.1.4.2的子条款中指定的)可被调用,并以rlPicMotion作为输入,rsPicMotion的被重采样运动场作为输出。
resampling_buffer_enable_flag可不与direct_dependency_type语法元素结合。resampling_buffer_enable_flag可被如表17所示被用信号发送(如,单独用信号发送)。resampling_buffer_enable_flag可提供灵活性以使被重采样参考图像和运动可被用于不同于样本预测和/或运动预测的其他目的。例如,被重采样的运动可被用于产生混合层间参考图像。
表16 视频参数集扩展语法
resampling_buffer_enable_flag可不与direct_dependency_type语法元素结合。resampling_buffer_enable_flag可被作为SNR_scalability_flag被用信号发送(如,单独用信号发送),而resampling_buffer_enable_flag可被放置在SPS或SPS扩展或其他任何合适的参数集中。表17示出了SPS扩展中的信令SNR_scalability_flag的示例实施例。如表17中示出的语法元素num_SNR_scalability_flags可指示被用信号发送标志的数量。num_SNR_scalability_flags的值可等于当前增强层的参考层的数量。num_scaled_ref_layer_offsets可等于当前增强层的参考层的数量。如表19所示,语法元素num_SNR_scalability_flags和num_scaled_ref_layer_offsets可合并成一个语法元素并作为一个语法元素而被用信号发送,如,num_ref_layers。
表17 序列参数集扩展语法
鉴于在此描述的SNR可伸缩性信令,编解码器操作可用信号发送一个或多个语法元素以节省被用信号发送比特的数量,从而提高效率。例如,如在此描述的SNR_scalability_flag(如,可被添加到之前所述的VPS扩展中)可用于不同的应用场景中。
例如,SNR_scalability_flag可被提供给采样网格转移信令和/或被采样网格移位信令使用,采样网格移位信息可使用多种技术和/或方法被采样(如,2013年4月JCTVC-M0465提出的“Signaling of phase offset in up-sampling process and chromasampling location”)。例如,采样网格信息可通过相位偏移呈现标志和亮度和或色度相位偏移参数在SPS扩展中被用信号发送。由于采样相位移位可用于空间可伸缩性,提出的SNR_scalability_flag可用作避免不必要的在用于SNR可伸缩性的比特流中呈现语法元素的条件。表18示出了使用SNR_scalability_flag信令作为确定是否用信号发送额外采样网格参数的条件的示例语法表。
表18 提出的SPS扩展中的采样网格信息
可伸缩参考层偏移被提供或被使用。例如,在SPS扩展中被用信号发送的可伸缩参考层偏移语法元素可被用于对齐基础层和增强层。在SNR可伸缩性中,可伸缩偏移可为0并且同样的,通过这些偏移的信令依赖于SNR_scalability_flag,额外的比特可通过跳过SNR可伸缩层的伸缩偏移信令而被节省下来。表19示出了该种信令的示例。
表19 序列参数集扩展语法
num_ref_layer的语义可能无法精确的匹配于VPS中用信号发送的依赖层(如,参考层)的数量。在VPS中,num_ref_layers指定呈现在SPS中的可伸缩参考层偏移参数集的数量。在实施例中,num_ref_layers的值可处于0到63(含63)的范围内。语义可按如下方式修改,num_ref_layers可指定或指示呈现在SPS中的可伸缩参考层偏移参数集的数量。num_ref_layers的值可等于NumDirectRefLayers[nuh_layer_id](如,作为比特流一致性限定的一部分以及在2013年4月SHVC工作草案JCTVC-M1008的F.7.4.3.1.1中指定的)。
层间过滤信令可被提供和/或使用。例如,开关整数位置滤波器(如,2013年4月JCTVC-M0273中描述的滤波器,在整数位置上非SCE4可开关滤波器,可在层间过滤上的核心实验(SCE3)中提供)可实现对于SNR可伸缩性而不是空间可伸缩性的性能增益。因此,多种过滤开关方法可被提供和/或使用。例如,过滤开关可在切片报头中被用信号发送,并且,在其他实施例中,ILR和过滤ILR可被插入到用于层间预测的参考图像列表(RPL)。例如,当SNR_scalability_flag被设置成0,如由于该过滤器无法改进空间可伸缩性场景的性能时,切片报头中的一比特语法元素可被旁路。在另一个示例中,当SNR_scalability_flag被设置成0,如由于过滤ILR图像不被添加到参考图像集和参考图像列表时,活动层间参考图像的数量可被减小。用信号发送SNR可伸缩性指示符可针对空间可伸缩性情况提前节省DPB存储器尺寸和简化参考图像列表构建过程。SNR_scalability_flag可在重采样过程中被参考以针对空间可伸缩性(SNR_scalability_flag被设置成0)旁路开关整数位置滤波器(如,2013年4月JCTVC-M0273中描述的滤波器,在整数位置上非SCE4可开关滤波器)的,以便减少编解码器操作复杂性和存储器分配。
多个标志可在参数集(如,视频参数集)中被用信号发送。每个标志可指示与可伸缩比特流的层(例如基础层和依赖增强层)相关的重采样过程是否需要执行。在标志指示不需要重采样过程的情况下,重采样缓存器的分配可被旁路。在标志指示需要重采样过程的情况下,一个或多个重采样缓存器可被分配并且与一个参考图像样本相关的参考图像样本或运动中的一个或多个的重采样将被调度。
在此描述的信令可被用于,例如,任何网络或在此描述的合适的网络元素。例如,在此描述的信令可根据与例如图6A-图6E所示出的示例无线通信系统100的无线通信系统和/或其组件关联的设备(如,视频流设备)执行的可伸缩视频编码而被执行。
图6A描述了在其中可以实施和/或使用一个或更多个实施方式的示例通信系统的系统图。通信系统100可以是向多个用户提供内容,例如语音、数据、视频、消息发送、广播等的多接入系统。通信系统100可以使多个无线用户通过系统资源共享(包括无线带宽)访问这些内容。例如,通信系统可以使用一种或多种信道接入方法,例如码分多址(CDMA),时分多址(TDMA),频分多址(FDMA),正交FDMA(OFDMA),单载波FMDA(SC-FDMA)等。
如图6A所示,通信系统100可以包括无线发射/接收单元(WTRU)102a、102b、102c、和/或102d(其通常或整体上被称为WTRU),无线电接入网(RAN)103、104、105,核心网106、107、109,公共交换电话网(PSTN)108、因特网110和其他网络112。不过应该理解的是,公开的实施方式考虑到了任何数量的WTRU、基站、网络和/或网络元件。WTRU 102a、102b、102c、和/或102d的每一个可以是配置为在无线环境中进行操作和/或通信的任何类型的设备。作为示例,可以将WTRU 102a、102b、102c、和/或102d配置为发送和/或接收无线信号,并可以包括用户设备(UE)、基站、固定或者移动用户单元、寻呼器、蜂窝电话、个人数字助理(PDA)、智能电话、笔记本电脑、上网本、个人计算机、无线传感器、消费电子产品等等。
通信系统100还可以包括基站114a和基站114b。基站114a、114b的每一个都可以是配置为与WTRU 102a、102b、102c、和/或102d中的至少一个无线对接以便于接入一个或者更多个通信网络,例如核心网106、107、109、因特网110和/或网络112的任何设备类型。作为示例,基站114a、和/或114b可以是基站收发信台(BTS)、节点B)、演进的节点B(e节点B)、家庭节点B、家庭eNB、站点控制器、接入点(AP)、无线路由器等等。虽然基站114a、114b的每一个被描述为单独的元件,但是应该理解的是,基站114a、114b可以包括任何数量互连的基站和/或网络元件。
基站114a可以是RAN 103、104、105的一部分,RAN 104还可以包括其他基站和/或网络元件(未显示),例如基站控制器(BSC)、无线电网络控制器(RNC)、中继节点等。可以将基站114a和/或基站114b配置为在特定地理区域之内发送和/或接收无线信号,该区域可以被称为小区(未显示)。小区还可以被划分为小区扇区。例如,与基站114a关联的小区可以划分为三个扇区。因此,在一种实施方式中,基站114a可以包括三个收发信机,即每一个用于小区的一个扇区。在另一种实施方式中,基站114a可以使用多输入多输出(MIMO)技术,因此可以将多个收发信机用于小区的每一个扇区。
基站114a和/或114b可以通过空中接口115、116、117与WTRU 102a、102b、102c、和/或102d中的一个或者更多个通信,该空中接口115、116、117可以是任何合适的无线通信链路(例如,射频(RF)、微波、红外(IR)、紫外线(UV)、可见光等)。可以使用任何合适的无线电接入技术(RAT)来建立空中接口116。
更具体地,如上所述,通信系统100可以是多接入系统,并可以使用一种或者多种信道接入方案,例如CDMA、TDMA、FDMA、OFDMA、SC-FDMA等等。例如,RAN 103、104、105中的基站114a和WTRU 102a、102b、和/或102c可以使用例如通用移动电信系统(UMTS)陆地无线电接入(UTRA)的无线电技术,其可以使用宽带CDMA(WCDMA)来建立空中接口115、116、117。WCDMA可以包括例如高速分组接入(HSPA)和/或演进的HSPA(HSPA+)的通信协议。HSPA可以包括高速下行链路分组接入(HSDPA)和/或高速上行链路分组接入(HSUPA)。
在另一种实施方式中,基站114a和WTRU 102a、102b、和/或102c可以使用例如演进的UMTS陆地无线电接入(E-UTRA)的无线电技术,其可以使用长期演进(LTE)和/或高级LTE(LTE-A)来建立空中接口115、116、117。
在其他实施方式中,基站114a和WTRU 102a、102b、102c可以使用例如IEEE802.16(即,全球微波接入互操作性(WiMAX))、CDMA2000、CDMA20001X、CDMA2000EV-DO、暂行标准2000(IS-2000)、暂行标准95(IS-95)、暂行标准856(IS-856)、全球移动通信系统(GSM)、GSM演进的增强型数据速率(EDGE)、GSM EDGE(GERAN)等等的无线电技术。
图6A中的基站114b可以是无线路由器、家庭节点B、家庭e节点B或者接入点,例如,并且可以使用任何适当的RAT以方便局部区域中的无线连接,例如商业场所、住宅、车辆、校园等等。在一种实施方式中,基站114b和WTRU 102c、102d可以实施例如IEEE 802.11的无线电技术来建立无线局域网(WLAN)。在另一种实施方式中,基站114b和WTRU 102c、102d可以使用例如IEEE 802.15的无线电技术来建立无线个域网(WPAN)。在另一种实施方式中,基站114b和WTRU 102c、102d可以使用基于蜂窝的RAT(例如,WCDMA,CDMA2000,GSM,LTE,LTE-A等)来建立微微小区或毫微微小区。如图6A所示,基站114b可以具有到因特网110的直接连接。因此,基站114b可以不需要经由核心网106、107、109而接入到因特网110。
RAN 103、104、105可以与核心网106、107、109通信,所述核心网106、107、109可以是被配置为向WTRU 102a、102b、102c、和/或102d中的一个或更多个提供语音、数据、应用和/或基于网际协议的语音(VoIP)服务等的任何类型的网络。例如,核心网106、107、109可以提供呼叫控制、计费服务、基于移动位置的服务、预付费呼叫、因特网连接、视频分配等和/或执行高级安全功能,例如用户认证。虽然图6A中未示出,应该理解的是,RAN 103、104、105和/或核心网106、107、109可以与使用和RAN 103、104、105相同的RAT或不同RAT的其他RAN进行直接或间接的通信。例如,除了连接到正在使用E-UTRA无线电技术的RAN 103、104、105之外,核心网106、107、109还可以与使用GSM无线电技术的另一个RAN(未示出)通信。
核心网106、107、109还可以充当WTRU 102a、102b、102c、和/或102d接入到PSTN108、因特网110和/或其他网络112的网关。PSTN 108可以包括提供普通老式电话服务(POTS)的电路交换电话网络。因特网110可以包括使用公共通信协议的互联计算机网络和设备的全球系统,所述协议例如有TCP/IP网际协议组中的传输控制协议(TCP)、用户数据报协议(UDP)和网际协议(IP)。网络112可以包括被其他服务提供商拥有和/或运营的有线或无线的通信网络。例如,网络112可以包括连接到一个或更多个RAN的另一个核心网,该RAN可以使用和RAN 103、104、105相同的RAT或不同的RAT。
通信系统100中的WTRU 102a、102b、102c、和/或102d的某些或全部可以包括多模式能力,即WTRU 102a、102b、102c、和/或102d可以包括用于在不同无线链路上与不同无线网络进行通信的多个收发信机。例如,图6A中示出的WTRU 102c可被配置为与基站114a通信,所述基站114a可以使用基于蜂窝的无线电技术,以及与基站114b通信,所述基站114b可以使用IEEE 802无线电技术。
图6B描述了WTRU 102示例的系统图。如图6B所示,WTRU 102可以包括处理器118、收发信机120、发射/接收元件122、扬声器/麦克风124、键盘126、显示器/触摸板128、不可移动存储器130、可移动存储器132、电源134、全球定位系统(GPS)芯片组136和其他外围设备138。应该理解的是,WTRU 102可以在保持与实施方式一致时,包括前述元件的任何子组合。而且,实施方式考虑了基站114a和114b和/或基站114a和114b可以表示的节点(诸如但不局限于收发信台(BTS)、节点B、站点控制器、接入点(AP)、家庭节点B、演进型家庭节点B(e节点B)、家庭演进型节点B(HeNB)、家庭演进型节点B网关和代理节点等)可以包括图6B所描绘和这里描述的一些或所有元件。
处理器118可以是通用处理器、专用处理器、常规处理器、数字信号处理器(DSP)、多个微处理器、与DSP核相关联的一个或更多个微处理器、控制器、微控制器、专用集成电路(ASIC)、场可编程门阵列(FPGA)电路、任何其他类型的集成电路(IC)、状态机等等。处理器118可执行信号编码、数据处理、功率控制、输入/输出处理和/或使WTRU 102运行于无线环境中的任何其他功能。处理器118可以耦合到收发信机120,所述收发信机120可耦合到发射/接收元件122。虽然图6B描述了处理器118和收发信机120是单独的部件,但是可以理解的是,处理器118和收发信机120可以一起集成在电子封装或芯片中。
发射/接收元件122可以被配置为通过空中接口115、116、117将信号发送到基站(例如,基站114a),或从基站(例如,基站114a)接收信号。例如,在一种实施方式中,发射/接收元件122可以是被配置为发送和/或接收RF信号的天线。在另一种实施方式中,发射/接收元件122可以是被配置为发送和/或接收例如IR、UV或可见光信号的发射器/检测器。在另一种实施方式中,发射/接收元件122可以被配置为发送和接收RF和光信号两者。应当理解,发射/接收元件122可以被配置为发送和/或接收无线信号的任何组合。
另外,虽然发射/接收元件122在图6B中描述为单独的元件,但是WTRU 102可以包括任意数量的发射/接收元件122。更具体的,WTRU 102可以使用例如MIMO技术。因此,在一种实施方式中,WTRU 102可以包括用于通过空中接口115、116、117发送和接收无线信号的两个或更多个发射/接收元件122(例如,多个天线)。
收发信机120可以被配置为调制要由发射/接收元件122发送的信号和/或解调由发射/接收元件122接收的信号。如上面提到的,WTRU 102可以具有多模式能力。因此收发信机120可以包括使WTRU 102经由多个例如UTRA和IEEE 802.11的RAT通信的多个收发信机。
WTRU 102的处理器118可以耦合到下述设备,并且可以从下述设备中接收用户输入数据:扬声器/麦克风124、键盘126和/或显示器/触摸板128(例如,液晶显示器(LCD)显示单元或有机发光二极管(OLED)显示单元)。处理器118还可以输出用户数据到扬声器/麦克风124、键盘126和/或显示/触摸板128。另外,处理器118可以从任何类型的适当的存储器访问信息,并且可以存储数据到任何类型的适当的存储器中,例如不可移动存储器130和/或可移动存储器132。不可移动存储器130可以包括随机存取存储器(RAM)、只读存储器(ROM)、硬盘或任何其他类型的存储器设备。可移动存储器132可以包括用户标识模块(SIM)卡、记忆棒、安全数字(SD)存储卡等等。在其他实施方式中,处理器118可以从在物理位置上没有位于WTRU 102上,例如位于服务器或家用计算机(未示出)上的存储器访问信息,并且可以将数据存储在该存储器中。
处理器118可以从电源134接收电能,并且可以被配置为分配和/或控制到WTRU102中的其他部件的电能。电源134可以是给WTRU 102供电的任何适当的设备。例如,电源134可以包括一个或更多个干电池(例如,镍镉(NiCd)、镍锌(NiZn)、镍氢(NiMH)、锂离子(Li-ion)等等),太阳能电池,燃料电池等等。
处理器118还可以耦合到GPS芯片组136,所述GPS芯片组136可以被配置为提供关于WTRU 102当前位置的位置信息(例如,经度和纬度)。另外,除来自GPS芯片组136的信息或作为其替代,WTRU 102可以通过空中接口115、116、117从基站(例如,基站114a、114b)接收位置信息和/或基于从两个或更多个邻近基站接收的信号的定时来确定其位置。应当理解,WTRU 102在保持实施方式的一致性时,可以通过任何适当的位置确定方法获得位置信息。
处理器118可以耦合到其他外围设备138,所述外围设备138可以包括一个或更多个提供附加特性、功能和/或有线或无线连接的软件和/或硬件模块。例如,外围设备138可以包括加速计、电子罗盘、卫星收发信机、数字相机(用于照片或视频)、通用串行总线(USB)端口、振动设备、电视收发信机、免提耳机、蓝牙模块、调频(FM)无线电单元、数字音乐播放器、媒体播放器、视频游戏机模块、因特网浏览器等等。
图6C描述了根据实施方式的RAN 103和核心网106的系统图。如上面提到的,RAN103可使用UTRA无线电技术通过空中接口115与WTRU 102a、102b和/或102c通信。RAN 103还可以与核心网106通信。如图6C所示,RAN 103可以包括节点B 140a、140b、140c,节点B140a、140b、140c的每一个包括一个或更多个用于通过空中接口115与WTRU 102a、102b、和/或102c通信的收发信机。节点B 140a、140b、和/或140c的每一个可以与RAN 103内的特定小区(未显示)关联。RAN 103还可以包括RNC 142a和/或142b。应当理解的是,RAN 103在保持实施方式的一致性时,可以包括任意数量的节点B和RNC。
如图6C所示,节点B 140a和/或140b可以与RNC 142a通信。此外,节点B 140c可以与RNC 142b通信。节点B 140a、140b、和/或140c可以通过Iub接口分别与RNC 142a、142b通信。RNC 142a、142b可以通过Iur接口相互通信。RNC 142a、142b的每一个可以被配置以控制其连接的各个节点B 140a、140b、和/或140c。另外,RNC 142a、142b的每一个可以被配置以执行或支持其他功能,例如外环功率控制、负载控制、准入控制、分组调度、切换控制、宏分集、安全功能、数据加密等等。
图6C中所示的核心网106可以包括媒体网关(MGW)144、移动交换中心(MSC)146、服务GPRS支持节点(SGSN)148、和/或网关GPRS支持节点(GGSN)。尽管前述元件的每一个被描述为核心网106的部分,应当理解的是,这些元件中的任何一个可以被不是核心网运营商的实体拥有或运营。
RAN 103中的RNC 142a可以通过IuCS接口连接至核心网106中的MSC 146。MSC 146可以连接至MGW 144。MSC 146和MGW 144可以向WTRU 102a、102b、和/或102c提供到电路交换网络(例如PSTN 108)的接入,以便于WTRU 102a、102b、和/或102c和传统陆地线路通信设备之间的通信。
RAN 103中RNC 142a还可以通过IuPS接口连接至核心网106中的SGSN 148。SGSN148可以连接至GGSN 150。SGSN 148和GGSN 150可以向WTRU 102a、102b、102c提供到分组交换网络(例如因特网110)的接入,以便于WTRU 102a、102b、102c和IP使能设备之间的通信。
如上所述,核心网106还可以连接至网络112,网络112可以包括由其他服务提供商拥有或运营的其他有线或无线网络。
图6D描述了根据实施方式的RAN 104和核心网107的系统图。如上面提到的,RAN104可使用E-UTRA无线电技术通过空中接口116与WTRU 102a、102b、和/或102c通信。RAN104还可以与核心网107通信。
RAN 104可包括e节点B 160a、160b、和/或160c,但可以理解的是,RAN 104可以包括任意数量的e节点B而保持与各种实施方式的一致性。eNB 160a、160b、和/或160c的每一个可包括一个或更多个用于通过空中接口116与WTRU 102a、102b、和/或102c通信的收发信机。在一种实施方式中,e节点B 160a、160b、和/或160c可以使用MIMO技术。因此,e节点B160a例如可以使用多个天线来向WTRU 102a发送无线信号和/或从其接收无线信号。
e节点B 160a、160b、和/或160c的每一个可以与特定小区关联(未显示),并可以被配置为处理无线资源管理决策、切换决策、在上行链路和/或下行链路中的用户调度等等。如图6D所示,e节点B 160a、160b、和/或160c可以通过X2接口相互通信。
图6D中所示的核心网107可以包括移动性管理实体(MME)162、服务网关164和/或分组数据网络(PDN)网关166。虽然前述单元的每一个被描述为核心网107的一部分,应当理解的是,这些单元中的任意一个可以由除了核心网运营商之外的实体拥有和/或运营。
MME 162可以经由S1接口连接到RAN 104中的e节点B 160a、160b、和/或160c的每一个,并可以作为控制节点。例如,MME 162可以负责WTRU 102a、102b、和/或102c的用户认证、承载激活/去激活、在WTRU 102a、102b、和/或102c的初始附着期间选择特定服务网关等等。MME 162还可以提供控制平面功能,用于在RAN 104和使用例如GSM或者WCDMA的其他无线电技术的其他RAN(未显示)之间切换。
服务网关164可以经由S1接口连接到RAN 104中的eNB 160a、160b、和/或160c的每一个。服务网关164通常可以向/从WTRU 102a、102b、和/或102c路由和转发用户数据分组。服务网关164还可以执行其他功能,例如在eNB间切换期间锚定用户平面、当下行链路数据对于WTRU 102a、102b、和/或102c可用时触发寻呼、管理和存储WTRU 102a、102b、和/或102c的上下文(context)等等。
服务网关164还可以连接到PDN网关166,PDN网关166可以向WTRU102a、102b、和/或102c提供到分组交换网络(例如因特网110)的接入,以便于WTRU 102a、102b、和/或102c与IP使能设备之间的通信。
核心网107可以便于与其他网络的通信。例如,核心网107可以向WTRU 102a、102b、和/或102c提供到电路交换网络(例如PSTN 108)的接入,以便于WTRU 102a、102b、和/或102c与传统陆地线路通信设备之间的通信。例如,核心网107可以包括IP网关(例如IP多媒体子系统(IMS)服务器),或者与之通信,该IP网关作为核心网107与PSTN 108之间的接口。另外,核心网107可以向WTRU 102a、102b、和/或102c提供到网络112的接入,该网络112可以包括被其他服务提供商拥有和/或运营的其他有线或无线网络。
图6E描述了根据实施方式的RAN 105和核心网109的系统图。RAN 105可以是使用IEEE 802.16无线电技术通过空中接口117与WTRU 102a、102b、和/或102c进行通信的接入服务网络(ASN)。如下面进一步讨论的,WTRU 102a、102b、和/或102c,RAN 105和核心网109的不同功能实体之间的链路可以被定义为参考点。
如图6E所示,RAN 105可以包括基站180a、180b、和/或180c和ASN网关182,但应当理解的是,RAN 105可以包括任意数量的基站和ASN网关而与实施方式保持一致。基站180a、180b、和/或180c的每一个可以与RAN 105中特定小区(未示出)关联并可以包括一个或更多个通过空中接口117与WTRU 102a、102b、和/或102c通信的收发信机。在一个实施方式中,基站180a、180b、和/或180c可以使用MIMO技术。因此,基站180a例如使用多个天线来向WTRU102a发送无线信号,或从其接收无线信号。基站180a、180b、和/或180c可以提供移动性管理功能,例如呼叫切换(handoff)触发、隧道建立、无线电资源管理,业务分类、服务质量策略执行等等。ASN网关182可以充当业务聚集点,并且负责寻呼、缓存用户资料(profile)、路由到核心网109等等。
WTRU 102a、102b、和/或102c和RAN 105之间的空中接口117可以被定义为使用802.16规范的R1参考点。另外,WTRU 102a、102b、和/或102c的每一个可以与核心网109建立逻辑接口(未显示)。WTRU 102a、102b、和/或102c和核心网109之间的逻辑接口可以定义为R2参考点,其可以用于认证、授权、IP主机(host)配置管理和/或移动性管理。
基站180a、180b、和/或180c的每一个之间的通信链路可以定义为包括便于WTRU切换和基站间转移数据的协议的R8参考点。基站180a、180b、和/或180c和ASN网关182之间的通信链路可以定义为R6参考点。R6参考点可以包括用于促进基于与WTRU 102a、102b、和/或102c的每一个关联的移动性事件的移动性管理的协议。
如图6E所示,RAN 105可以连接至核心网109。RAN 105和核心网109之间的通信链路可以定义为包括例如便于数据转移和移动性管理能力的协议的R3参考点。核心网109可以包括移动IP本地代理(MIP-HA)184,认证、授权、计费(AAA)服务器186和网关188。尽管前述的每个元件被描述为核心网109的部分,应当理解的是,这些元件中的任意一个可以由不是核心网运营商的实体拥有或运营。
MIP-HA可以负责IP地址管理,并可以使WTRU 102a、102b、和/或102c在不同ASN和/或不同核心网之间漫游。MIP-HA 184可以向WTRU 102a、102b、和/或102c提供分组交换网络(例如因特网110)的接入,以促进WTRU 102a、102b、和/或102c和IP使能设备之间的通信。AAA服务器186可以负责用户认证和支持用户服务。网关188可促进与其他网络互通。例如,网关可以向WTRU 102a、102b、和/或102c提供电路交换网络(例如PSTN 108)的接入,以促进WTRU 102a、102b、和/或102c和传统陆地线路通信设备之间的通信。此外,网关188可以向WTRU 102a、102b、和/或102c提供网络112,其可以包括由其他服务提供商拥有或运营的其他有线或无线网络。
尽管未在图6E中显示,应当、可以和/或将理解的是,RAN 105可以连接至其他ASN,并且核心网109可以连接至其他核心网。RAN 105和其他ASN之间的通信链路可以定义为R4参考点,其可以包括协调RAN 105和其他ASN之间的WTRU 102a、102b、和/或102c的移动性的协议。核心网109和其他核心网之间的通信链路可以定义为R5参考点,其可以包括促进本地核心网和被访问核心网之间的互通的协议。
虽然上面以特定的组合描述了特征和元件,但是本领域普通技术人员可以理解,每个特征或元件可以单独的使用或与其他的特征和元件进行组合使用。此外,这里描述的方法可以用计算机程序、软件或固件实现,其可包含到由计算机或处理器执行的计算机可读介质中。计算机可读介质的示例包括电子信号(通过有线或无线连接传送)和计算机可读存储介质。计算机可读存储介质的示例包括,但不限制为,只读存储器(ROM)、随机存取存储器(RAM)、寄存器、缓冲存储器、半导体存储器设备、磁性介质(例如内部硬盘和可移动磁盘)、磁光介质和光介质(例如CD-ROM盘和数字通用盘(DVD))。与软件关联的处理器用于实现射频收发信机,用于WTRU、UE、终端、基站、RNC或任何主计算机。

Claims (8)

1.一种视频编码方法,该方法包括:
确定活动参考层数目;
对活动参考层数目和直接参考层数目进行比较;
基于所述活动参考层数目和所述直接参考层数目的所述比较,确定是否在切片级报头中包括所述活动参考层的指示;以及
生成包含一个或多个层的比特流,其中在所述活动参考层数目不等于所述直接参考层数目的情况下,在所述比特流中包含能够用于层间预测的图像的指示,以及
在所述活动参考层数目等于所述直接参考层数目的情况下,在所述比特流中不包含能够用于层间预测的图像的指示。
2.根据权利要求1所述的视频编码方法,其中所述指示为图像的层ID。
3.一种视频解码方法,该方法包括:
接收包含一个或多个层的比特流,其中在接收到的比特流中的活动参考层数目不等于直接参考层数目的情况下,接收所述比特流中的层间预测层语法元素,其中,所述层间预测层语法元素指示能够被当前层的当前图像用于层间预测的参考图像层ID列表,以及
在接收到的比特流中的活动参考层数目等于直接参考层数目的情况下,推断层间预测层语法元素。
4.根据权利要求3所述的视频解码方法,该方法进一步包括:
在所述活动参考层数目等于所述直接参考层数目的情况下,根据所述当前层的直接参考层的层ID推断所述层间预测层语法元素。
5.一种视频编码设备,该视频编码设备包括:
处理器,被配置成:
确定活动参考层数目;
对活动参考层数目和直接参考层数目进行比较;
基于所述活动参考层数目和所述直接参考层数目的所述比较,确定是否在切片级报头中包括所述活动参考层的指示;以及
生成包含一个或多个层的比特流,其中在所述活动参考层数目不等于所述直接参考层数目的情况下,在所述比特流中包含能够用于层间预测的图像的指示,以及
在所述活动参考层数目等于所述直接参考层数目的情况下,在所述比特流中不包含能够用于层间预测的图像的指示。
6.根据权利要求5所述的视频编码设备,其中所述指示为图像的层ID。
7.一种视频解码设备,该视频解码设备包括:
处理器,被配置成:
接收包含一个或多个层的比特流,其中在接收到的比特流中的活动参考层数目不等于直接参考层数目的情况下,接收所述比特流中的层间预测层语法元素,其中,所述层间预测层语法元素指示能够被当前层的当前图像用于层间预测的参考图像层ID列表,以及
在接收到的比特流中的活动参考层数目等于直接参考层数目的情况下,推断层间预测层语法元素。
8.根据权利要求7所述的视频解码设备,在所述活动参考层数目等于所述直接参考层数目的情况下,所述处理器进一步被配置成根据所述当前层的直接参考层的层ID推断所述层间预测层语法元素。
CN201480033473.XA 2013-06-18 2014-06-18 Hevc扩展的层间参数集 Active CN105393542B (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201361836552P 2013-06-18 2013-06-18
US61/836,552 2013-06-18
US201361837116P 2013-06-19 2013-06-19
US61/837,116 2013-06-19
US201361840380P 2013-06-27 2013-06-27
US61/840,380 2013-06-27
US201361860221P 2013-07-30 2013-07-30
US61/860,221 2013-07-30
PCT/US2014/042923 WO2014205067A1 (en) 2013-06-18 2014-06-18 Inter-layer parameter set for hevc extensions

Publications (2)

Publication Number Publication Date
CN105393542A CN105393542A (zh) 2016-03-09
CN105393542B true CN105393542B (zh) 2019-04-09

Family

ID=51136856

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480033473.XA Active CN105393542B (zh) 2013-06-18 2014-06-18 Hevc扩展的层间参数集

Country Status (9)

Country Link
US (1) US10104374B2 (zh)
EP (2) EP3011747A1 (zh)
JP (2) JP2016523483A (zh)
KR (2) KR102115075B1 (zh)
CN (1) CN105393542B (zh)
IL (1) IL243101B (zh)
MY (1) MY174134A (zh)
TW (1) TWI667911B (zh)
WO (1) WO2014205067A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140087971A (ko) 2012-12-26 2014-07-09 한국전자통신연구원 계층적 비디오 부호화에서 다중참조계층을 적용한 화면간 부/복호화 방법 및 그 장치
US9756335B2 (en) 2013-07-02 2017-09-05 Qualcomm Incorporated Optimizations on inter-layer prediction signalling for multi-layer video coding
WO2015006281A2 (en) * 2013-07-09 2015-01-15 Sony Corporation High level syntax improvement on inter-layer prediction for shvc/mv-hevc
US9510001B2 (en) * 2013-07-09 2016-11-29 Electronics And Telecommunications Research Institute Video decoding method and apparatus using the same
US20160191933A1 (en) * 2013-07-10 2016-06-30 Sharp Kabushiki Kaisha Image decoding device and image coding device
CN104604234B (zh) * 2013-07-12 2019-07-16 索尼公司 图像编码设备和方法
US9681145B2 (en) 2013-10-14 2017-06-13 Qualcomm Incorporated Systems and methods for inter-layer RPS derivation based on sub-layer reference prediction dependency
WO2015054812A1 (en) 2013-10-14 2015-04-23 Microsoft Technology Licensing, Llc Features of base color index map mode for video and image coding and decoding
US9794558B2 (en) 2014-01-08 2017-10-17 Qualcomm Incorporated Support of non-HEVC base layer in HEVC multi-layer extensions
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
CN104093028B (zh) * 2014-06-25 2019-02-01 中兴通讯股份有限公司 一种设备能力协商的方法和装置
KR102330740B1 (ko) 2014-09-30 2021-11-23 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 파면 병렬 프로세싱이 인에이블되는 경우의 인트라 픽쳐 예측 모드에 대한 규칙
US10419779B2 (en) * 2014-10-08 2019-09-17 Lg Electronics Inc. Method and device for processing camera parameter in 3D video coding
US10659783B2 (en) 2015-06-09 2020-05-19 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
US20170359575A1 (en) * 2016-06-09 2017-12-14 Apple Inc. Non-Uniform Digital Image Fidelity and Video Coding
US11259037B2 (en) * 2017-12-06 2022-02-22 V-Nova International Limited Method and apparatus for decoding a received set of encoded data
MX2022008177A (es) * 2019-12-31 2022-10-10 Huawei Tech Co Ltd Un codificador, un decodificador y métodos y aparatos correspondientes.
JP2023520227A (ja) * 2020-03-31 2023-05-16 エルジー エレクトロニクス インコーポレイティド レイヤ間参照の如何に基づいてサブレイヤを決定する画像符号化/復号化方法及び装置、並びにビットストリームを伝送する方法
US11563980B2 (en) * 2020-04-02 2023-01-24 Qualcomm Incorporated General constraint information syntax in video coding

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US78854A (en) * 1868-06-16 William adair
MX2007012604A (es) 2005-04-13 2008-01-11 Nokia Corp Metodo, dispositivo y sistema para codificar y decodificar efectivamente datos de video.
WO2007148909A1 (en) * 2006-06-19 2007-12-27 Lg Electronics, Inc. Method and apparatus for processing a vedeo signal
US8532176B2 (en) * 2006-07-10 2013-09-10 Sharp Laboratories Of America, Inc. Methods and systems for combining layers in a multi-layer bitstream
US8059714B2 (en) * 2006-07-10 2011-11-15 Sharp Laboratories Of America, Inc. Methods and systems for residual layer scaling
US7535383B2 (en) * 2006-07-10 2009-05-19 Sharp Laboratories Of America Inc. Methods and systems for signaling multi-layer bitstream data
US7840078B2 (en) * 2006-07-10 2010-11-23 Sharp Laboratories Of America, Inc. Methods and systems for image processing control based on adjacent block characteristics
TWI368443B (en) * 2006-11-09 2012-07-11 Lg Electronics Inc Method and apparatus for decoding/encoding a video signal
US7742524B2 (en) * 2006-11-17 2010-06-22 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal using inter-layer prediction
US8548056B2 (en) 2007-01-08 2013-10-01 Qualcomm Incorporated Extended inter-layer coding for spatial scability
US8953685B2 (en) 2007-12-10 2015-02-10 Qualcomm Incorporated Resource-adaptive video interpolation or extrapolation with motion level analysis
CN102257818B (zh) * 2008-10-17 2014-10-29 诺基亚公司 3d视频编码中运动向量的共享
EP2425626A2 (en) 2009-05-01 2012-03-07 Thomson Licensing Inter-layer dependency information for 3dv
US8780999B2 (en) * 2009-06-12 2014-07-15 Qualcomm Incorporated Assembling multiview video coding sub-BITSTREAMS in MPEG-2 systems
US8411746B2 (en) * 2009-06-12 2013-04-02 Qualcomm Incorporated Multiview video coding over MPEG-2 systems
CA2829493A1 (en) * 2011-03-10 2012-09-13 Vidyo, Inc. Dependency parameter set for scalable video coding
US10237565B2 (en) * 2011-08-01 2019-03-19 Qualcomm Incorporated Coding parameter sets for various dimensions in video coding
JP6110410B2 (ja) 2012-01-31 2017-04-05 ヴィド スケール インコーポレイテッド スケーラブルな高効率ビデオコーディング(hevc)のための参照ピクチャセット(rps)シグナリング
KR20140087971A (ko) * 2012-12-26 2014-07-09 한국전자통신연구원 계층적 비디오 부호화에서 다중참조계층을 적용한 화면간 부/복호화 방법 및 그 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MV-HEVC/SHVC HLS:On signalling and derivation of inter-layer RPS (combining aspects of JCTVC-M0046 and JCTVC-M0269);Ye-Kui Wang;《Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,13th Meeting: Incheon, KR》;20130426;第2-4页

Also Published As

Publication number Publication date
EP3011747A1 (en) 2016-04-27
JP2016523483A (ja) 2016-08-08
IL243101B (en) 2020-03-31
US10104374B2 (en) 2018-10-16
CN105393542A (zh) 2016-03-09
KR20170121317A (ko) 2017-11-01
KR102115075B1 (ko) 2020-05-25
EP3522540A1 (en) 2019-08-07
JP6420429B2 (ja) 2018-11-07
WO2014205067A1 (en) 2014-12-24
US20160134868A1 (en) 2016-05-12
MY174134A (en) 2020-03-10
KR20160021222A (ko) 2016-02-24
TWI667911B (zh) 2019-08-01
JP2017212752A (ja) 2017-11-30
TW201526612A (zh) 2015-07-01

Similar Documents

Publication Publication Date Title
CN105393542B (zh) Hevc扩展的层间参数集
CN106664410B (zh) 用于基于三维色彩映射模型参数优化的系统和方法
US11570470B2 (en) Complexity reduction of overlapped block motion compensation
CN104704831B (zh) 多层视频编码中用于空间层的采样栅格信息
US10917660B2 (en) Prediction approaches for intra planar coding
CN105706451B (zh) Hevc扩展的高级句法
US20220191543A1 (en) Methods and apparatus for sub-picture adaptive resolution change
KR101840915B1 (ko) 스케일러블 비디오 코딩을 위한 모션 정보 시그널링
CN112740282A (zh) 用于点云压缩比特流格式的方法和装置
CN108322744A (zh) 用于可缩放的高效视频编码(hevc)的参考图片集(rps)信令
CN107534769A (zh) 用于高动态范围视频译码的色度增强滤波
US20220377344A1 (en) Systems and methods for versatile video coding
JP2022525401A (ja) 対称的マージモード動きベクトル符号化
TW201841507A (zh) 基於幾何填充360度視訊預測編碼
CN113826400A (zh) 用于利用光流的解码器侧运动向量细化的预测细化的方法和装置
CA3145538A1 (en) Dynamic adaptation of volumetric content component sub-bitstreams in streaming services
WO2023057488A1 (en) Motion vector coding with input motion vector data
WO2023194556A1 (en) Implicit intra mode for combined inter merge/intra prediction and geometric partitioning mode intra/inter prediction
WO2023194558A1 (en) Improved subblock-based motion vector prediction (sbtmvp)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant