CN110035286A - 用于多层视频编码的编解码器架构 - Google Patents
用于多层视频编码的编解码器架构 Download PDFInfo
- Publication number
- CN110035286A CN110035286A CN201811639520.1A CN201811639520A CN110035286A CN 110035286 A CN110035286 A CN 110035286A CN 201811639520 A CN201811639520 A CN 201811639520A CN 110035286 A CN110035286 A CN 110035286A
- Authority
- CN
- China
- Prior art keywords
- image
- coded data
- layer
- ilp
- gradability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000010410 layer Substances 0.000 claims abstract description 182
- 239000011229 interlayer Substances 0.000 claims abstract description 64
- 238000000034 method Methods 0.000 claims abstract description 44
- 230000008569 process Effects 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims description 47
- 238000005070 sampling Methods 0.000 claims description 34
- 238000013507 mapping Methods 0.000 claims description 7
- 230000033001 locomotion Effects 0.000 description 40
- 238000004891 communication Methods 0.000 description 38
- 238000005516 engineering process Methods 0.000 description 26
- 230000006870 function Effects 0.000 description 21
- 239000002356 single layer Substances 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 238000013139 quantization Methods 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 230000001419 dependent effect Effects 0.000 description 7
- 230000000007 visual effect Effects 0.000 description 6
- 238000001914 filtration Methods 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 238000011084 recovery Methods 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 2
- 101100445050 Caenorhabditis elegans elt-2 gene Proteins 0.000 description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 238000013475 authorization Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 229910001416 lithium ion Inorganic materials 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- QELJHCBNGDEXLD-UHFFFAOYSA-N nickel zinc Chemical compound [Ni].[Zn] QELJHCBNGDEXLD-UHFFFAOYSA-N 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 101100445049 Caenorhabditis elegans elt-1 gene Proteins 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- HBBGRARXTFLTSG-UHFFFAOYSA-N Lithium ion Chemical compound [Li+] HBBGRARXTFLTSG-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004100 electronic packaging Methods 0.000 description 1
- 208000008487 fibromuscular dysplasia Diseases 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/187—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/33—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/36—Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/56—Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Error Detection And Correction (AREA)
Abstract
提供了一种用于多层视频编码的编解码器架构,涉及视频编码领域。视频编码方法包括:接收基础层BL编码数据、增强层EL编码数据和层间预测ILP信息,其中所述ILP信息被分包在与包括所述BL编码数据和所述EL编码数据的网络抽象单元分开的网络抽象单元中;基于所述BL编码数据重建BL图像;对重建的BL图像执行图像级层间过程以基于所述分包的ILP信息生成层间参考ILR图像;以及基于所述ILR图像和所述EL编码数据重建EL图像。
Description
本申请是申请日为2013年07月09日、申请号为201380036878.4、名称为“用于多层视频编码的编解码器架构”的中国发明专利申请的分案申请。
相关申请的交叉引用
本申请要求2012年07月09日提交的美国临时专利申请No.61/699,356和2012年12月06日提交的美国临时专利申请No.61/734,264的权益,所述申请的内容以引用的方式结合于此。
技术领域
本申请涉及视频编码领域。
背景技术
近年来,多媒体技术和移动通信经历了巨大的发展并在商业上取得了成功。无线通信技术显著增长了无线带宽,并改善了对移动用户的服务质量。例如,与第二代(2G)和/或第三代(3G)相比,第三代合作伙伴计划(3GPP)长期演进(LTE)标准改善了服务质量。
由于无线网络上高带宽的可应用性,在有线网络上可用的视频和多媒体内容可以使得用户期望对来自各种具有不同大小、质量和/或连接能力的移动设备的内容的等效按需访问。
为使各种类型的视频内容在网络上可用,可以使用一种或多种视频编码和压缩机制。视频编码系统可以用于压缩数字视频信号,例如,来减小所述信号的存储需求和/或传输带宽。基于一种或多种视频编码标准的各种类型的视频压缩技术可以被使用。所述标准可包括例如H.261、MPEG-1、MPEG-2、H.263、MPEG-4部分2、以及H.264/MPEG-4部分10AVC、高效视频编码(HEVC)等等。视频编码标准的扩展(如H.264(可分级(scalable)视频编码(SVC))和/或可分级HEVC)可以被使用。所提供的可分级编码机制存在缺点且不完善。
发明内容
提供了用于实施视频编码系统(VCS)的系统、方法和手段。包括例如基础层(BL)编码器、增强层(EL)编码器、层间预测(ILP)处理和管理单元等的VCS可被配置成接收视频信号。该视频信号可以包括一个或多个层(如基础层(BL)和/或一个或多个增强层(EL))。VCS可例如使用图像级层间预测过程将BL图像处理成层间参考(ILR)图像。处理后的ILR图像可以是非共位(non-collocated)的ILR图像。
将BL图像处理成ILR图像可以包括将BL图像格式化成适用于对当前EL图像进行预测的格式。该格式可依赖于BL编解码器与EL编解码器间的可分级性的类型。BL编解码器与EL编解码器间的可分级性的类型可以包括以下中的一者或多者:空间可分级性、色度格式可分级性、质量可分级性、空间可分级性、视图可分级性或位深可分级性。格式化可包括以下中的一者或多者:上采样、去噪、恢复、或重定向、视差补偿或逆色调映射。
VCS可选择经处理的ILR图像或增强层(EL)参考图像中的一者或两者。所选择的参考图像可包括EL参考图像或ILR图像中的一者。多个所选择的参考图像可对应于公共时间实例。
VCS可使用所选择的ILR图像或EL参考图像中的一者或多者来预测当前EL图像。VCS可将被处理过的ILR图像存储到EL解码图像缓存(DPB)中。VCS可从BL中提取BL信息。所述BL信息可以包括BL模式信息或BL运动信息中的一者或多者。VCS可基于包括所提取的BL信息的信息来处理BL图像。VCS可将BL信息从第一格式转换为第二格式,并在EL编码中使用转换后的BL信息。所述第一格式可以与BL编解码器相关,以及所述第二格式可以与EL编解码器相关,且所述第一格式不同于所述第二格式。
VCS可将ILP信息分包(packetize),并发送所述ILP信息,例如,经由网络抽象层(NAL)单元。ILP信息可包括例如上采样滤波器信息、一个或多个上采样系数、一个或多个去噪系数、一个或多个视差补偿参数、一个或多个逆色调映射参数等。
附图说明
从以下以示例方式给出的描述并结合附图可以获得更详细的理解。
图1是示出可分级视频编码系统的图。
图2是示出使用多视图视频编码(MVC)来对立体视频(例如具有左视图和右视图)进行编码的预测结构的示例的图;
图3是示出两层可分级视频编码器的架构的示例的图。
图4是示出两层可分级视频解码器的架构的示例的图。
图5是示出基于块的单层视频编码器的示例的图。
图6是示出基于块的单层视频解码器的示例的图。
图7是示出支持图像级层间预测(ILP)的两层可分级编码系统的示例的图。
图8是示出支持图像级ILP的两层可分级解码系统的示例的图。
图9是示出使用针对增强层编码使能的时间预测和层间预测的两层系统的示例的图。
图10是示出ILP处理和管理单元的示例的图。
图11示出了使用层间运动矢量预测的示例预测结构。
图12是示出了可以使用增强型ILP处理和管理单元的可分级编码系统的示例的图。
图13A是可以实施一个或多个公开的实施方式的示例通信系统的系统图。
图13B是可以在图13A所示的通信系统中使用的示例无线发射/接收单元(WTRU)的系统图。
图13C是可以在图13A所示的通信系统中使用的示例无线电接入网和示例核心网的系统图。
图13D是可以在图13A所示的通信系统中使用的另一示例无线电接入网和另一示例核心网的系统图。
图13E是可以在图13A所示的通信系统中使用的另一示例无线电接入网和另一示例核心网的系统图。
具体实施方式
现在将参照各个附图描述示例性实施方式的详细描述。虽然该描述提供了可能实施的详细示例,但应当注意的是,细节是示例性的,并且不以任何方式限制本申请的范围。此外,附图可以示出流程图,其旨在是示例性的。可使用其他实施方式。在适当的情况下,消息的顺序可被改变。如果不需要,则消息可被省略,并且可增加附加的流。
可分级视频编码可改善在异构网络上对在具有不同能力的设备上运行的视频应用的体验质量。可分级视频编码可以最高表示(例如,时间分辨率、空间分辨率、质量等等)对信号编码一次,但依赖于客户端设备上运行的某些应用所需的特定速率和表示来使能从视频流的子集进行解码。与不可分级的解决方案相比,可分级视频编码可节省带宽和/或存储空间。国际视频标准(如MPEG-2视频、H.263、MPEG4视觉、H.264等)可以具有支持可分级性模式的工具和/或配置文件。
图1是示出基于块的混合可分级视频编码系统的示例的图。可通过对输入视频信号进行下采样来产生可由层1(例如,基础层)表示的空间/时间信号分辨率。合适的量化器(例如,Q1)的设置可导致特定质量等级的基础信息。可以是更高层分辨率等级中的一者或多者(例如,所有)的近似的基础层重建Y1可以在对随后的层进行编码/解码中被使用,例如,以更有效地对随后的更高层进行编码。上采样单元1010和/或1012可对基础层重建信号执行上采样以达到层2的分辨率。可遍及每一层(例如,1,2…N)来执行下采样和上采样。下采样率和上采样率可根据两个给定层间的可分级性的维度而不同。
如图1所示,对于任意给定的较高层n(2≤n≤N),可通过从当前层n信号中减去经上采样的较低层信号(例如,层n-1信号)来产生差信号。所获取的差信号可被编码。如果由两层(例如,n1和n2)表示的视频信号具有相同的空间分辨率,对应的下采样和上采样操作可以被旁路。可在不使用任何来自更高层的解码信息的情况下,对任意给定的层n(1≤n≤N)或多个层进行解码。如图1的系统所采用的,依赖于对除基础层外的层的残差信号(例如,两层间的差信号)的编码可导致视觉伪像(artifact)。所述视觉伪像可能是由于对残差信号进行量化和标准化以限制其动态范围的期望,和/或在残差的编码期间执行的附加量化。一个或多个较高层编码器可采用运动估计和/或运动补偿预测作为编码模式。在残差信号中的运动估计和/或运动补偿可与常规运动估计不同,并且,例如,可更易于产生视觉伪像。更复杂的残差量化、和在对残差信号进行量化和标准化以限制其动态范围的期望与在所述残差的编码期间执行的附加量化之间的联合量化可被利用,并可增加系统复杂度,例如,以使所述视觉伪像最小化。图1的系统可以不考虑其他层间预测模式,这会限制其能实现的压缩效率等级。
可分级视频编码(SVC)是H.264的扩展,其可以使能部分比特流的传输和解码,例如以提供具有较低时间或空间分辨率或者降低的保真度的视频服务,同时在给定部分比特流的速率的情况下,保持重建质量(例如,较高的重建质量)。SVC可包括单环路解码,其可以提供SVC解码器在正被解码的层处建立一个运动补偿环路,而在其他更低层处不建立运动补偿环路。例如,如果比特流包括2层:层1(例如,基础层)和层2(例如,增强层)。解码器可通过设置解码图像缓存和运动补偿预测(例如,针对层1而不针对层2;层2可依赖于层1)来重建层2视频。SVC可以不需要来自将被全部重建的更低层的参考图像,这可降低计算复杂度和解码器利用的存储空间。通过被约束的层间纹理预测可实现单环路解码。对于给定层中的块(例如,当前块),如果对应的低层块以内模式被编码(例如,受限制的内预测),可利用来自更低层的空间纹理预测。当更低层块以内模式被编码时,其可以被重建,而不需要运动补偿操作和解码图像缓存。SVC可利用附加的层间预测技术,例如,运动矢量预测、残差预测、模式预测等。SVC的单环路解码特征可降低计算复杂度和/或解码器所利用的存储空间。单环路解码可例如通过强烈依赖于块级层间预测实施来实现满意的性能而增加实施复杂度。编码器设计和计算复杂度可以被增加,以使可以实现期望的性能,例如,以补偿通过施加单环路解码约束而导致的性能损失。具有足够性能的SVC可能不支持交错(interlaced)内容的可分级编码,这会影响其在广播工业的应用。
多视图视频编码(MVC)是H.264的示例扩展,其可以提供视图可分级性。视图可分级性意味着基础层比特流可被解码以重建常规的2D视频,而附加的增强层可被解码以重建相同视频信号的其他视图表示。当一个或多个视图(例如,所有视图)被合并在一起并由合适的3D显示器显示时,用户可以合适的深度感体验3D视频。图2是示出使用MVC对具有左视图(例如,层1)和右视图(例如,层2)的立体视频进行编码的示例预测结构的图。如图2中的示例所示,可以用IBBP预测结构对左视图视频编码。可以用PBBB预测结构对右视图视频编码。例如,在右视图中,与左视图中的第一I图像2002的第一共位图像可以被编码为P图像2004。右视图中其他图像中的每一者可以被编码为B图像,例如,使用来自右视图中的时间参考的第一预测和来自左视图中的层间参考的第二预测。MVC可能不支持单环路解码。例如如图2所示,右视图(例如,层2)视频的解码可能需要左视图(例如,层1)中的全部图像可用,其可在两个视图/层中支持运动补偿环路。
MVC可包括(例如,仅包括)高级语法变化,并且不包括对H.264/AVC的块级变化。例如,由于底层MVC编码器/解码器逻辑可以保持相同并且可被复制,切片(slice)级/图像级的参考图像(例如,仅参考图像)可被正确配置以使能MVC。MVC可通过扩展图2的示例来支持多于两个的视图的编码,以在多个视图之间执行层间预测。
运动图像专家组(MPEG)帧兼容(MFC)编码可以被用作编码技术。3D内容可以是包括一个或多个视图(如左视图和右视图)的立体3D视频。可通过将两个视图打包/复用成一个帧、使用编解码器(例如,H.264/AVC)压缩以及传送被打包的视频来实现立体3D内容分发。在接收机侧,在解码之后,帧可以被拆包并被显示为两个视图。所述视图可在时域和/或空间域中被复用。当所述视图在空间域中被复用时,所述两个视图可在空间上按照因子(例如,因子2)来被下采样,并按照各种排列(arrangement)被打包,例如,以保持相同的图像大小。举例来说,图像可被排列有图像的左半部分上的下采样后的左视图,以及图像的右半部分上的下采样后的右视图。其他排列可以包括上和下(top-and-bottom)、逐行、棋盘格等等。用于实现帧兼容3D视频的特定排列可由帧打包排列SEI信息来传达。空间下采样可导致视图中的混淆现象以及降低视觉质量和3D视频的用户体验。焦点可以被放在提供对帧兼容(例如,被打包为同一帧的两个视图)基础层视频的可分级扩展,和/或为改善的3D体验提供一个或多个增强层以恢复全分辨率视图。虽然其在提供3D视频分发方面是适合的,但使能全分辨率MFC的底层技术可与空间可分级性技术相关。
可提供HEVC的可分级增强。标准可分级性可指当用一种标准(例如H.264/AVC或MPEG2)对基础层进行编码、同时可用另一标准(例如HEVC标准)对一个或多个增强层进行编码时的可分级性的类型。标准可分级性可提供对使用之前的标准编码的旧有内容的向后兼容性,并且可以使用一个或多个增强层提高旧有内容的质量。
可提供3D视频编码(3DV)。3DV可提供一个或多个不同的视图可分级性,其可以裸眼立体(autostereoscopic)应用为目标。裸眼立体显示和应用可以允许人们体验3D,而无需笨重的眼镜。为了在没有眼镜的情况下实现良好的3D体验,可以采用多于两个的视图。对多于两个的视图(例如,9个视图或10个视图)进行编码会很昂贵。3DV可采用对具有相对较大视差的少量视图(例如,2或3个视图)一起编码、和/或与一个或多个可以提供视图的深度信息的深度图编码的混合方式。这可被称为多视图加深度(MVD)。在显示器侧,编码后的视图和深度图可以被解码。使用视图合成技术利用解码后的视图和它们的深度图来生成其余视图。3DV可利用多种实现方式来对视图和深度图编码,例如,采用不同标准的组合对其编码,例如但不限于H.264/AVC、MVC、HEVC等等。3DV可用一种标准(例如,H.264/AVC)对基础层编码,而用另一种标准(例如,HEVC)对一个或多个增强层编码。
表1提供了不同类型的可分级性和可以支持他们的对应的标准的示例。位深可分级性和色度格式可分级性可与主要由专业视频应用使用的视频格式(如高于8位视频和高于YUV4:2:0的色度采样格式)相关联。可提供纵横比可分级性。
表1
可分级视频编码可提供与使用基础层比特流的第一视频参数集相关联的第一视频质量等级。可分级视频编码可提供与使用一个或多个增强层比特流的一个或多个增强型参数集相关联的一个或多个更高质量等级。视频参数集可包括空间分辨率、帧速率、重建视频质量(例如,以SNR、PSNR、VQM、视觉质量等的形式)、3D能力(例如,具有两个或更多个视图)、亮度和色度位深、色度格式和底层单层编码标准中的一者或多者。如表1所示,不同的使用情况可能需要不同类型的可分级性。如此处讨论的,可分级编码架构可提供可被配置成支持一种或多种可分级性(如表1所列出的分级性)的公共结构。可分级编码架构可以最小的配置工作量(effort)来灵活地支持不同的可分级性。可分级编码架构可包括至少一种不需要改变块级操作的优选的操作模式,以使在可分级编码系统中最大限度地重新使用编码逻辑(例如,编码和/或解码逻辑)。例如,可提供基于图像级层间处理和管理单元的可分级编码架构,其中可在图像级执行层间预测。
图3是两层可分级视频编码器的示例架构的图。举例来说,通过可实现空间可分级性的下采样过程,增强层视频输入和基础层视频输入可彼此对应。如图3所示,可使用下采样器3002对增强层视频进行下采样。基础层编码器3006(例如,本示例中的HEVC编码器)可逐块对基础层视频输入进行编码,并生成基础层比特流。图5是示出可被用作图3中的基础层编码器的示例基于块的单层视频编码器的图。如图5所示,单层编码器可使用如空间预测5020(如被称为内预测)和/或时间预测5022(例如,被称为间预测和/或运动补偿预测)的技术来实现有效压缩,和/或预测输入视频信号。编码器可具有能选择最合适的预测形式的模式判定逻辑5002。编码器判定逻辑可以基于速率和失真考虑的组合。编码器可分别使用转换单元5004和量化单元5006来转换和量化预测残差(例如,输入信号与预测信号间的差信号)。被量化的残差和模式信息(如内或间预测)以及预测信息(例如,移动矢量、参考图像索引、内预测模式等等)可以在熵编码器5008被进一步压缩,并被打包成输出视频比特流。编码器还可通过对被量化的残差施加逆量化(如使用逆量化单元5010)和逆转换(例如,使用逆转换器5012)以获取重建残差,来生成重建视频信号。编码器可把重建视频信号添加回至预测信号5014。重建视频信号可通过环路滤波处理5016(例如,使用去块滤波器、采样自适应偏移和/或自适应环路滤波器),并被存储在参考图像存储库(store)5018中,以用于预测将来的视频信号。
术语参考图像存储库在这里可与术语解码图像缓存或DPB替换使用。图6是示例基于块的单层解码器的框图,该基于块的单层解码器可接收由图5的编码器产生的视频比特流,并可以重建待被显示的视频信号。在视频解码器处,比特流可以由熵解码器6002解析。残差系数可以被逆量化(例如,使用逆量化单元6004)和逆转换(例如,使用逆转换单元6006)以获得重建残差。可利用编码模式和预测信息来获得预测信号。可使用空间预测6010和/或时间预测6008来完成这一步骤。预测信号和重建残差可以被叠加在一起以得到重建视频。此外,重建视频可通过环路滤波(例如,使用环路滤波器6014)。然后,重建视频可被存储在参考图像存储库6012中,以被显示和/或被用于解码将来的视频信号。
如在图3的示例可分级编码器中示出的,在增强层,增强层(EL)编码器3004可采用更高空间分辨率(和/或其他视频参数的更高值)的EL输入视频信号。EL编码器3004可以与基础层视频编码器3006基本相似的方式产生EL比特流,例如,利用空间和/或时间预测来实现压缩。附加的预测形式(此处被称为层间预测(ILP)(例如,图3中阴影箭头所指示的))可在增强编码器处可用以改善其编码性能。不像基于在当前增强层中的编码视频信号来得出预测信号的空间和时间预测,层间预测可基于来自基础层(和/或当在可分级系统中存在多于两个的层时的其他更低层)的编码视频信号来得出预测信号。在可分级系统中,可存在至少两种形式的层间预测,即图像级ILP和块级ILP。此处讨论图像级ILP和块级ILP。比特流复用器(例如,图3中的MUX 3014)可将基础层和增强层比特流合并在一起,以产生一个可分级的比特流。
图4是两层可分级视频解码器的示例架构的框图。图4的两层可分级视频解码器架构可对应于图3的可分级编码器。例如,解复用器(例如,DEMUX 4002)可将可分级比特流分为基础层和增强层比特流。基础层解码器4006可对基础层比特流解码并重建基础层视频。增强层解码器4004可对增强层比特流解码。增强层解码器可使用来自当前层的信息和/或来自一个或多个相关(dependent)层(如基础层)的信息进行上述步骤。例如,来自一个或多个相关层的所述信息可通过层间处理,这在使用图像级ILP和/或块级ILP时可以被实现。虽然图3和图4中未示出,在MUX 3014处,附加ILP信息可与基础层和增强层比特流一起被复用。ILP信息可由DEMUX 4002解复用。
图7是支持图像级ILP的两层可分级编码系统的示例。图7中的BL编码器7006(如HEVC编码器)可使用空间和/或时间预测的组合来对BL视频输入编码,例如但不限于参考图5所讨论的。BL编码器可建立用于存储重建的图像的基础层DPB 7010,以例如通过时间运动补偿预测来执行对输入视频信号的预测。在增强层中,EL编码器7004可以以与BL编码器7006基本上相似的方式运行。可提供参考图像以供EL编码器对输入EL视频进行预测的增强层DPB 7008可包括来自当前增强层的参考图像和/或来自一个或多个相关层的DPB(例如,图7所示的BL DPB 7010)的参考图像。来自BL DPB的参考图像可在被用于预测EL视频之前由层间预测处理和管理单元7012进行处理。层间预测处理和管理单元7012可在使用来自BLDPB 7010的图像预测EL视频之前先对其进行处理。ILP处理和管理单元7012可将存储在BLDPB 7010中的一个或多个参考图像处理成适用于增强层视频的预测的格式。ILP处理和管理单元7012可管理处理后的参考图像,并自适应性地决定哪些被处理的图像可以被用作由EL编码器7004进行的对EL视频的预测。
ILP处理和管理单元可将存储在BL DPB中的参考图像处理成适用于增强层视频的预测的格式。处理的本质可以基于BL与EL间的可分级性的类型。例如,如果BL视频和EL视频具有不同的空间分辨率,所述处理可涉及上采样,以对准BL和EL空间分辨率。所述处理可传达在上采样过程中使用的参数。例如,ILP处理和管理单元7012可建立预定义的上采样滤波器集合。ILP处理和管理单元7012可选择预定义的上采样滤波器中的一者或多者来对BLDPB中的图像进行上采样,并且可以在比特流中发送一个或多个对应的滤波器索引。例如,解码器可执行相同的上采样过程。ILP处理和管理单元可得出(例如,自适应地得出)有益于使用的一个或多个上采样滤波器(例如,就某种意义而言,经上采样的参考可以用于更有效地预测EL视频,并产生更良好的速率失真特性)。当使用自适应上采样滤波器时,滤波器系数和滤波器分接头(tap)的大小可被包括在比特流中。
在另一个SNR或质量可分级性的示例中,BL视频和EL视频可以具有相同的分辨率。BL视频可用粗量化(例如,较低比特速率和较低质量)编码,然而EL视频可用细量化(例如,较高比特速率和较高质量)编码。ILP处理和管理单元7012可对BL DPB 7010中的参考图像执行去噪和/或图像恢复类型的操作。所述去噪或恢复操作可包括但不限于自适应滤波器(例如,基于最小二乘或LS技术)、采样自适应偏移(SAO)(例如,可被HEVC支持)和/或以减小量化噪声为目标的其他类型的去噪滤波器。在去噪或恢复操作中使用的相应参数可被用信号发送至解码器。所述去噪或恢复技术可与上采样过程合并,以改善对于空间可分级性情况的预测效率。如图7所示,编码的EL比特流、编码的BL比特流和ILP信息可被复用(如MUX7014)成可分级HEVC比特流。
在另一个空间可分级性或纵横比可分级性的示例中,可以执行BL视频的重定向。重定向可以被用来建立两个层之间的空间对应。例如,重定向可以将与BL视频的一个图像(但不必是全部图像)相关联的空间区域对应于与EL视频的图像(但不必是全部图像)相关联的空间区域。例如,当EL视频为将要在大显示屏TV上显示的较高分辨率,且BL为将要在具有有限的屏幕分辨率的移动设备上显示的较低分辨率时,BL视频可以表现EL视频的一部分(例如,EL图像的感兴趣的区域)。不同的水平和/或垂直缩放比例量可以被应用于BL中的空间区域,例如,取决于BL样本在BL区域中的位置。重定向可以被用于纵横比可分级性,例如,当BL是4:3纵横比且EL是16:9纵横比时。通过应用在水平和垂直方向的均等(例如,相等)缩放比例,在BL区域中的主要对象(例如,新闻主播)可以被保留为4:3纵横比,而周围的区域可以被水平伸展以在EL中匹配16:9纵横比。
作为视图可分级性的示例,BL视频和EL视频可代表立体3D视频的两个视图。BL视频可代表一个视图而EL视频可代表另一个补充视图。ILP处理和管理单元可对BL DPB中的参考图像施加视差补偿,以使其成为对于EL视频的有效预测信号。对于执行相同的视差补偿处理的解码器,在视差补偿期间使用的参数(例如,在使用仿射变换的情况下的仿射变换参数,和/或在使用翘曲(warp)的情况下的翘曲参数)可以在比特流中被用信号发送。
表2示出了ILP处理和管理单元可以执行的功能的示例和特定功能可以被使用所针对的对应的可分级性类型的列表。
表2
ILP处理和管理单元可管理处理后的参考图像,并可决定(例如,自适应地决定)哪些参考图像可被用作由EL编码器进行的预测。ILP处理和管理单元可确定有多少处理后的ILP图像和哪些处理后的ILP图像可被用于当前增强层图像的预测。图9是示出使用对增强层编码使能的时间预测和层间预测的两层系统的示例的图。对于时间预测,图9中的预测结构可被称为分层B预测。对于EL图像,其参考图像可以是时域中的参考图像、BL中其共位的图像和/或共位的BL图像的时间参考图像的组合。例如,图像EL2 9006可根据时间参考(如EL0 9004和/或EL4 9008)和/或层间参考(BL2 9010,BL0 9002,BL4 9012)被预测。层间参考的集合(BL2,BL0,BL4)可在被用于预测EL2图像9006前先由ILP处理和管理单元处理。如此处所述,ILP处理可将BL参考图像处理成适用于EL的格式(如合适的空间分辨率,位深等),和/或例如通过对基础层图像施加去噪和/或恢复来改善ILP参考的预测质量。
处理后的ILP参考图像可提供有效的预测信号。从增强层中的多个参考中进行选择可能会引起问题。例如,在块级,用于指示哪个或哪些参考图像可以被选择以获得一个或多个预测信号的信令开销会增大。因为可以对扩展的参考图像集合执行运动估计,所以编码复杂度也会增大。参考图像选择和管理可提供有效的可分级编码,而不增加复杂度。
图10是示例ILP处理和管理单元的图。在时间实例“t”,基础层共位图像BLt 1054和来自BL DPB 1056的其参考图像BLt-1、BLt-2和BLt+1可被处理1058以成为ILPt、ILPt-1、ILPt-2和ILPt+1 1060。这些ILP参考和时间参考ELt-1、ELt-2和ELt+1 1062可以由ILP管理单元1064检查。可以选择一个子集。在图10的示例中,被选择的参考图像可包括非共位的层间参考图像(如ILPt+1 1070)。对于其他示例,所选择的参考图像可包括对应于相同时间实例的多于一个的参考图像(如,ILPt+1 1070和ELt+1 1068)。
例如,ILP管理单元1064可在当前EL图像(ELt)与时间和层间参考的合并集(ELt-1,ELt-2,ELt+1,ILPt,ILPt-1,ILPt-2,ILPt+1)中的一个或多个参考之间执行运动估计(例如,整数像素运动估计)。ILP管理单元1014可收集当前图像与被检查的一个或多个参考图像间的运动估计失真(如,平方误差的和,均方误差,和/或绝对转换失真的和)。ILP管理单元1064可选择导致运动估计失真低于预定义的阈值的参考图像的子集。ILP处理和管理单元1064可按照失真增加的顺序选择参考图像的子集,直到选出预定义数量的参考。可采用多通道编码来执行ILP管理操作。例如,第一编码通道可用于获取适合于选择参考图像的子集的视频编码统计,而一个或多个随后的编码通道可被用于对当前EL图像编码,直到编码性能(如,依据其速率失真特性)被认为符合要求。如图10所示,当确定要使用哪些参考图像时,ILP管理单元1064可将增强层视频1052作为其的一个输入。
执行图像级ILP可允许底层低级编码和解码逻辑保持与在单层非可分级的系统中使用的那些基本上相同。例如,如图7所示,增强层编码器(如HEVC编码器)可以以与基础层编码器(如HEVC编码器)基本上相同的方式运行,可能的例外是在图像或切片级进行最小的重新配置(例如,以包括层间参考图像)。ILP处理和管理单元可使能可分级编码。ILP处理和管理单元可在系统中作为附加块运行。许多应用都非常期望这种特性,因为单层编码器和解码器设计可被最大限度地重新使用,因此显著降低实施复杂度。
图7中的EL编码器7004可将在ILP处理和ILP管理期间使用的各种参数用信号发送给图8中的EL解码器8004,以能够构建和使用相同的层间参考。这些信息(在此处被称为ILP信息)可作为可分级比特流的一部分被发送。如图7所示,ILP处理和管理单元7012可将ILP信息从包括BL和EL视频的编码视频数据的分组中单独分包。可从视频分组中单独发送ILP信息,来以独立的方式实施ILP处理和管理单元并降低实施复杂度。例如,在HEVC和H.264中,网络抽象层(NAL)单元可以被作为分包单元。对于使用HEVC和H.264作为底层单层编解码器的可分级系统,ILP处理和管理单元可以在单独的NAL单元中发送ILP信息。在图7中,MUX 7014可对用EL比特流和BL比特流携带ILP信息的NAL单元进行复用。例如,如图8所示,DEMUX单元8002可接收包括NAL单元的可分级比特流,所述NAL单元对应于BL编码切片/图像、EL编码切片/图像以及ILP信息。DEMUX单元可对比特流进行解复用,并向BL解码器8006发送对应于BL编码切片/图像的NAL单元,向EL解码器8004发送对应于EL编码切片/图像的NAL单元,以及向ILP处理和管理单元8012发送对应于ILP信息的NAL单元。
可分级视频编码系统可在HEVC中使用自适应参数集(APS)来传达ILP处理和管理单元所需的ILP信息。APS分组可以是单独的NAL单元,例如具有特定的nal_单元_类型(nal_unit_typ)。APS NAL单元可包括在单层编码中使用的编码参数,如自适应环路滤波(ALF)参数和/或去块滤波器参数。每个APS NAL单元可被分配一个aps_id,其可由编码切片使用以识别从哪个APS获取这些编码参数。HEVC中的APS语法可包括1比特标志,aps_扩展_标志(aps_extension_flag)。例如,当aps_extension_flag被设置为1时,随后可以是附加的APS数据。此处所公开的可分级系统可携带作为APS扩展的一部分的ILP信息。ILP信息可包括ILP处理参数(例如,在空间可分级性被使能的情况下的上采样滤波器,在视图可分级性被使能的情况下的视差补偿参数,在位深可分级性被使能的情况下的逆色调映射参数等等)。ILP信息可包括ILP管理参数。ILP管理参数可指定时间参考和/或层间参考的子集来预测当前EL图像,可与其他参考图像信令进行合并。ILP管理参数可能不是APS扩展的一部分,且可以作为切片片段报头的一部分被用信号发送。
层间处理可从基础层DPB中得出重建的纹理,并应用高级滤波技术,以及在层间处理期间可依赖于来自基础层比特流的某个模式和运动信息,例如,以改善增强层中的编码效率。ILP可利用超过来自BL DPB的重建的纹理数据的基础层信息。可提供内模式相关方向滤波器(IMDDF)。例如,内编码基础层块的内预测模式可用于选择合适的方向滤波器,所述方向滤波器在增强层编码期间被用来进行层间预测前先被应用到基础层重建图像。可提供运动场映射(MFM)。来自基础层比特流的块运动信息(例如,其可包括参考图像索引和运动矢量)可被映射以形成针对ILR图像的“虚拟”运动场。所映射的虚拟运动场可被用于例如通过由HEVC支持的时间运动矢量预测(TMVP)来预测增强层运动。
来自基础层比特流的模式和运动信息是否可用取决于BL解码器的特定实施。例如,如果图8中的可分级解码系统使用HEVC的ASIC实施作为其BL解码器,BL解码器可能不通过开放应用程序接口(API)向ILP处理和管理单元提供模式和运动信息。当来自基础层的附加的模式和运动信息(例如,如图8中的点划线所示)不可用时,高级ILP处理可被禁用。
标准可分级性可允许BL编解码器和EL编解码器(如图7和图8中的编解码器)是不同的编解码器。例如,BL编解码器可使用H.264/AVC标准而EL编解码器可使用HEVC标准。当BL和EL编解码器不同时,对EL编解码器有用的某个信息可不自动存在于BL编解码器中。例如,HEVC标准可利用参考图像集(PRS)来实现DPB管理。在H.264/AVC标准中,可以由滑动窗DPB管理和存储管理命令选项(MMCO)的组合提供类似于RPS的功能性。如果EL编解码器根据例如此处所述的一种或多种实施执行层间RPS预测,并且如果BL编解码器因其基于H.264/AVC而不产生RPS信息,就不能以直接的方式应用层间RPS预测。在一些情况下,例如,如果BL编解码器使用不同于EL编解码器的标准,对EL编解码器有用的一种或多种类型的信息可能是不可用的。
例如,由于实施限制,基础层(BL)视频比特流信息可变得不可用,和/或不具有用于有效的EL视频编码的合适的格式。此处所述的实施可包括增强型ILP处理和管理单元。所述增强型ILP单元可执行附加功能,以改善编码效率和/或提供对可分级编码系统的最大设计灵活性。
可提供增强型ILP单元。可利用增强型ILP单元来在不降低可分级编码效率的情况下克服限制(如,实施限制)。增强型ILP单元可将存储在BL DPB中的参考图像处理为适合于对增强层视频进行预测的格式。增强型ILP单元可管理处理后的参考图像和/或决定(例如,自适应地决定)哪些处理后的图像将被用作由EL编码器进行的对EL视频的预测。增强型ILP单元可从基础层比特流中提取可被用于层间预测的模式和运动信息。例如,增强型ILP单元可使用被提取的模式和运动信息来将存储在BL DPB中的参考图像处理为适合于对增强层视频进行预测的格式。增强型ILP单元可将来自基础层比特流的信息转化为将在增强层编码中使用的合适的格式。例如,增强型ILP单元可将在H.264/AVC BL编解码器中使用的滑动窗DPB管理和MMCO转化为将由EL中的HEVC编解码器使用的RPS。
图12是示出使用增强型ILP单元1202的可分级解码系统的示例的图。如图12所示,增强型ILP单元1202可执行一个或多个功能,例如包括对信息进行处理1204、管理1206、提取1208或转化1210。增强型ILP单元1202可利用BL重建图像,并根据由比特流解复用器(DEMUX)提供的ILP信息来应用层间处理技术,以生成处理后的BL重建图像。如果BL解码器1212不能提供用于层间处理的信息,(例如,BL解码器1212提供重建的BL图像但不提供BL比特流的模式和运动信息),增强型ILP单元1202可得出该信息(例如,通过增强型ILP单元的提取功能,例如,如此处所述)。一个或多个处理后的BL重建图像可被插入到EL DPB 1214中,以进行增强层编码。
增强型ILP单元1202可利用DEMUX 1216提供的ILP信息,并可确定所述一个或多个处理后的BL重建图像中的哪些可被插入到EL DPB 1214中。增强型ILP单元可确定处理后的BL重建图像的顺序。BL信息可能不具有用于增强型ILP单元(例如,用于增强型ILP单元的管理功能)的合适的格式。例如,如果BL比特流使用不同于由EL编解码器使用的标准的标准来被编码,BL信息可能不具有合适的格式。如果BL信息不具有用于增强型ILP单元1202的合适的格式,增强型ILP单元1202可将BL信息重新格式化和/或转化为合适的格式(例如,通过增强型ILP单元1202的转化功能,例如此处所述的)。如图5中的示例所示,增强型ILP单元1202可利用经转化的BL信息来执行合适的参考图像缓存管理。
增强型ILP单元1202可提取BL信息。例如,如果BL视频信息能够由增强型ILP单元(例如,对于增强型ILP单元的处理功能)使用,但所述BL视频信息不可从BL解码器获得,则增强型ILP单元可以解析BL比特流并提取所述信息(例如,例如但不限于BL模式和运动信息)。所解析和提取出的信息可被增强型ILP单元使用(例如,被增强型ILP单元的处理功能所使用)。例如,BL模式信息可包括但不限于:基础层块是间编码的还是内编码的,对于内编码的基础层块的定向内预测模式等。BL运动信息可包括但不限于:基础层块划分、基础层块预测方向信息(例如,单向预测或双向预测)、基础层块运动矢量、基础层块参考图像索引等等。
增强型ILP单元可转化BL信息。例如,如果BL视频信息不具有将由增强层编码使用的合适的格式,则增强型ILP单元可将BL视频信息重新格式化和转化为适用于增强层编码的格式。例如,当可分级系统(例如,图7和图8中所示例的)使用不同的BL和EL编解码器时,增强型ILP单元可重新格式化和转化BL信息。当可分级系统中使用混合编解码器时,增强型ILP单元可将来自BL编解码器的信息转化和准备成将由EL编解码器使用的合适的格式。例如,当增强层编解码器使用HEVC时,基于来自H.264/AVC基础层编解码器的滑动窗和MMCO命令的DPB管理信息可被转化为用于EL编码的RPS。增强型ILP单元可将来自任意BL编解码器的BL信息重新格式化并转化为可由任意增强层编解码器使用的信息。如图12所示,增强型ILP单元的输出可包括例如处理后的BL图像,所述处理后的BL图像可被插入到EL解码图像缓存(DPB)1214中,以进行有效的层间预测。增强型ILP单元可输出BL模式和运动信息,经转化的RPS信息等。
增强型ILP单元1202可提供可用于实现有效可分级视频编码的信息,例如当这种附加信息不容易从基础层编解码器中获得时。增强型ILP单元1202可被设计用于使单层编解码器实施的使用最大化。增强型ILP单元1202可在BL编解码器与EL编解码器间提供无缝且有效的接口,例如,通过引入单层编解码器实施无法执行的功能。例如,增强型ILP单元1202可允许有效的可分级编码,而不影响基础层和增强层编解码器的较低级的功能(例如,内预测、间预测、转换、量化、逆转换、逆量化、环路滤波、块重建等等)。可在具有高编码效率和能支持混合编解码器架构(例如,基础层编码器和/或解码器以及增强层编码器和/或解码器可采用不同的编解码器)的可分级系统中使用增强型ILP单元1202。增强型ILP单元可降低实施成本并保持可分级编码效率。
参考图3和图4,块级ILP可被用于进一步改善可分级编码性能。虽然块级ILP可能需要增强层编码器和解码器具有和基础层编码器和解码器不同的底层逻辑(例如,以附加编码模式、针对算法编码的附加环境(context)等的形式),但是块级ILP可允许编码器基于速率失真考虑从扩展的操作模式集合中做选择。附加的选择可表现在以更高可分级编码性能的形式。例如,视频编码标准可以是具有图5和图6所示的框图的混合的基于块的视频编码系统。
在HEVC的情况下,视频块在被用于预测时可被称为预测单元(PU),在被用作编码单元时可被称为编码树块(CTB),以及在被用于转换和逆转换时可被称为转换单元(TU)。HEVC可使用基于四叉树(QT)的分区(partitioning)。因为基础层和增强层视频信号是相关的,对应的块编码模式和大小(包括但不限于PU、TU和CTB)也是相关的。增强层编码器和解码器可利用所述相关来改善增强层中的QT分裂的编码、PU、TU和CTB模式和/或大小。这可减小信令开销。当在两层之间使能空间可分级性时,可首先应用块大小调整。例如,如果EL视频和BL视频的空间比率是2:1时(例如,EL视频在每个维度中是2倍那么大),则基础层PU、TU和CTB的大小在被用于预测增强层块大小前可在每个维度中乘以因子2。基础层块模式和/或大小可被用作附加的二进制算法编码器的环境,以对增强层块模式和/或大小进行编码。视频编码系统可将得出的块(例如,PU、TU或者CTB)信息(例如,模式和/或大小)分配给图像级层间参考图像。视频编码设备可使用这些得出的块信息来预测在层(例如EL层)处的块。
当在同一时间实例t,针对基础层和增强层图像和/或切片使能运动补偿预测时,来自基础层的运动矢量可被用于预测增强层中的运动矢量。例如,当空间可分级性被使能时,来自基础层的运动矢量可以被适当地分级。例如,如图11所示,在同一时间实例t,在BL1102中,可在时间实例(t-1)利用运动矢量MVa 1106从BL参考预测水平散列的块1104。如果在时间实例(t-1)1108从EL参考预测出,EL中的分级水平散列的块可以具有其值接近于R*MVa的运动矢量,其中R可以是空间分级比率。对于EL中垂直散列的块1110,对应的基础层垂直散列的块1112可从时间实例(t-2)1114利用运动矢量MVb来预测。如果在时间实例(t-2)1116从EL参考预测出,EL中的分级垂直散列的块可以具有其值基本上接近于R*MVb的运动矢量。当视图可分级性被使能时,代表第一视图的来自基础层的运动矢量可被翘曲和/或仿射变换,以补偿视图偏差,以使它们能与代表第二视图的增强层中的运动矢量最大限度地相关。为了利用层间运动矢量间的这种强相关性,分级基础层运动矢量(或在视图可分级性的情况下被翘曲/转换的运动矢量)可被用作运动矢量预测者,以减少增强层运动矢量编码比特。
块级层间预测可涉及根据基础层残差预测增强层中的残差信号。例如,残差预测可以在从增强层残差中减去来自基础层的块残差(例如,如果需要,在被上采样成合适的维度之后)的情况下被执行,以进一步减少增强层残差能量和对其进行编码所需的比特数。可使用块级层间预测技术来以类似于在SVC中所使用的方式对EL纹理(例如,像素值)编码。在以上讨论的可分级系统中,可以图像级ILP的形式提供纹理预测。
用于多层视频编码的可分级架构(例如,灵活的可分级架构)可被重配置为支持表1所列的不同类型的可分级性中的任意一者。例如,一个操作模式可集中于图像级ILP。例如,ILP处理和管理单元可处理基础层参考图像,使得基础层参考图像集可以具有合适的格式,并可以为增强层视频编码提供准确和有效的预测信号。例如,ILP处理和管理单元可从时间参考和处理后的层间参考的组合中选择子集,以实现任意良好的速率、失真和/或计算复杂度的权衡。例如,ILP处理和管理单元可将ILP信息分包成单独的NAL单元,使得可以以对基础和增强层编码器和解码器操作最小的干扰来执行层间预测操作。图像级ILP的包含物可以通过允许可分级系统在基础层和增强层处最大限度地重新使用单层编码器和解码器逻辑来降低实施复杂度。
图13A是在其中可以实施一个或多个公开的实施方式的示例通信系统100的图。通信系统100可以是向多个无线用户提供内容(例如语音、数据、视频、消息发送、广播等)的多接入系统。通信系统100可以使多个无线用户能够通过系统资源(包括无线带宽)的共享来访问这些内容。例如,通信系统100可以使用一种或多种信道接入方法,例如码分多址(CDMA),时分多址(TDMA),频分多址(FDMA),正交FDMA(OFDMA),单载波FMDA(SC-FDMA)等。
如图13A所示,通信系统100可以包括无线发射/接收单元(WTRU)102a、102b、102c、和/或102d(其通常或整体上被称为WTRU 102),无线电接入网(RAN)103/104/105,核心网106/107/109,公共交换电话网(PSTN)108、因特网110和其他网络112。不过应该理解的是,公开的实施方式考虑到了任何数量的WTRU、基站、网络和/或网络元件。WTRU 102a、102b、102c、102d的每一个可以是被配置为在无线环境中进行操作和/或通信的任何类型的设备。作为示例,WTRU 102a、102b、102c、102d可以被配置为传送和/或接收无线信号,并可以包括无线发射/接收单元(WTRU)、移动站、固定或者移动用户单元、寻呼机、蜂窝电话、个人数字助理(PDA)、智能电话、膝上型计算机、上网本、个人计算机、无线传感器、消费电子产品等等。
通信系统100还可以包括基站114a和基站114b。基站114a、114b的每一个都可以是被配置为与WTRU 102a、102b、102c、102d中的至少一个无线对接以便于接入一个或者多个通信网络(例如核心网106/107/109、因特网110和/或网络112)的任何类型的设备。作为示例,基站114a、114b可以是基站收发信台(BTS)、节点B、e节点B、家用节点B、家用e节点B、站点控制器、接入点(AP)、无线路由器等等。虽然基站114a、114b的每一个被描述为单独的元件,但是应该理解的是,基站114a、114b可以包括任何数量的互连基站和/或网络元件。
基站114a可以是RAN 103/104/105的一部分,所述RAN 103/104/105还可以包括其他基站和/或网络元件(未显示),例如基站控制器(BSC)、无线电网络控制器(RNC)、中继节点等。基站114a和/或基站114b可以被配置为在特定地理区域内传送和/或接收无线信号,该区域可以被称为小区(未显示)。小区还可以被划分为小区扇区。例如,与基站114a关联的小区可以划分为三个扇区。因此,在一种实施方式中,基站114a可以包括三个收发信机,即每一个用于小区的一个扇区。在一种实施方式中,基站114a可以使用多输入多输出(MIMO)技术,因此可以将多个收发信机用于小区的每一个扇区。
基站114a、114b可以通过空中接口115/116/117与WTRU 102a、102b、102c、102d中的一个或者多个通信,该空中接口115/116/117可以是任何合适的无线通信链路(例如,射频(RF)、微波、红外(IR)、紫外(UV)、可见光等)。可以使用任何合适的无线电接入技术(RAT)来建立空中接口115/116/117。
更具体地,如上所述,通信系统100可以是多接入系统,并可以使用一种或者多种信道接入方案,例如CDMA、TDMA、FDMA、OFDMA、SC-FDMA等等。例如,RAN 103/104/105中的基站114a和WTRU 102a、102b、102c可以实施例如通用移动电信系统(UMTS)陆地无线电接入(UTRA)的无线电技术,其可以使用宽带CDMA(WCDMA)来建立空中接口115/116/117。WCDMA可以包括例如高速分组接入(HSPA)和/或演进型HSPA(HSPA+)的通信协议。HSPA可以包括高速下行链路分组接入(HSDPA)和/或高速上行链路分组接入(HSUPA)。
在一种实施方式中,基站114a和WTRU 102a、102b、102c可以实施例如演进型UMTS陆地无线电接入(E-UTRA)的无线电技术,其可以使用长期演进(LTE)和/或高级LTE(LTE-A)来建立空中接口115/116/117。
在一种实施方式中,基站114a和WTRU 102a、102b、102c可以实施例如IEEE802.16(即,全球微波接入互操作性(WiMAX))、CDMA2000、CDMA2000 1X、CDMA2000EV-DO、暂行标准2000(IS-2000)、暂行标准95(IS-95)、暂行标准856(IS-856)、全球移动通信系统(GSM)、用于GSM演进的增强型数据速率(EDGE)、GSM EDGE(GERAN)等等的无线电技术。
图13A中的基站114b可以是无线路由器、家用节点B、家用e节点B或者接入点,例如,并且可以使用任何适当的RAT以便于局部区域中的无线连接,例如商业场所、住宅、车辆、校园等等。在一种实施方式中,基站114b和WTRU 102c、102d可以实施例如IEEE 802.11的无线电技术来建立无线局域网(WLAN)。在一种实施方式中,基站114b和WTRU 102c、102d可以实施例如IEEE 802.15的无线电技术来建立无线个域网(WPAN)。在另一种实施方式中,基站114b和WTRU 102c、102d可以使用基于蜂窝的RAT(例如,WCDMA,CDMA2000,GSM,LTE,LTE-A等)来建立微微小区或毫微微小区。如图13A所示,基站114b可以具有到因特网110的直接连接。因此,基站114b可以不需要经由核心网106/107/109而接入因特网110。
RAN 103/104/105可以与核心网106/107/109通信,所述核心网106/107/109可以是被配置为向WTRU 102a、102b、102c、102d中的一个或多个提供语音、数据、应用和/或网际协议上的语音(VoIP)服务等的任何类型的网络。例如,核心网106/107/109可以提供呼叫控制、计费服务、基于移动位置的服务、预付费呼叫、因特网连接、视频分发等、和/或执行高级安全功能,例如用户认证。虽然图13A中未示出,应该理解的是,RAN103/104/105和/或核心网106/107/109可以与使用和RAN 103/104/105相同的RAT或不同RAT的其他RAN进行直接或间接的通信。例如,除了连接到正在使用E-UTRA无线电技术的RAN 103/104/105之外,核心网106/107/109还可以与使用GSM无线电技术的RAN(未示出)通信。
核心网106/107/109还可以充当WTRU 102a、102b、102c、102d接入PSTN 108、因特网110和/或其他网络112的网关。PSTN 108可以包括提供普通老式电话服务(POTS)的电路交换电话网络。因特网110可以包括使用公共通信协议的全球互联计算机网络和设备系统,所述协议例如有TCP/IP网际协议组中的传输控制协议(TCP)、用户数据报协议(UDP)和网际协议(IP)。网络112可以包括被其他服务提供商拥有和/或运营的有线或无线通信网络。例如,网络112可以包括连接到一个或多个RAN的核心网,该RAN可以使用和RAN 103/104/105相同的RAT或不同的RAT。
通信系统100中的WTRU 102a、102b、102c、102d的某些或全部可以包括多模式能力,即WTRU 102a、102b、102c、102d可以包括用于在不同无线链路上与不同无线网络进行通信的多个收发信机。例如,图13A中示出的WTRU 102c可被配置为与可以使用基于蜂窝的无线电技术的基站114a通信,以及与可以使用IEEE 802无线电技术的基站114b通信。
图13B是示例WTRU 102的系统图。如图13B所示,WTRU 102可以包括处理器118、收发信机120、发射/接收元件122、扬声器/麦克风124、键盘126、显示器/触摸板128、不可移除存储器130、可移除存储器132、电源134、全球定位系统(GPS)芯片组136和其他外围设备138。应该理解的是,在保持与实施方式一致时,WTRU 102可以包括前述元件的任何子组合。而且,实施方式考虑了基站114a和114b和/或基站114a和114b可以表示的节点(诸如但不局限于收发信台(BTS)、节点B、站点控制器、接入点(AP)、家用节点B、演进型家用节点B(e节点B)、家用演进型节点B(HeNB)、家用演进型节点B网关和代理节点等),可以包括图13B所描述的和这里描述的元件中的一些或每个。
处理器118可以是通用处理器、专用处理器、常规处理器、数字信号处理器(DSP)、多个微处理器、与DSP核相关联的一个或多个微处理器、控制器、微控制器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)电路、任何其他类型的集成电路(IC)、状态机等等。处理器118可执行信号编码、数据处理、功率控制、输入/输出处理和/或使WTRU 102能够运行于无线环境中的任何其他功能。处理器118可以耦合到收发信机120,所述收发信机120可耦合到发射/接收元件122。虽然图13B描述了处理器118和收发信机120是单独的部件,但是应该理解的是,处理器118和收发信机120可以一起被集成在电子封装或芯片中。
发射/接收元件122可以被配置为通过空中接口115/116/117将信号传送到基站(例如,基站114a),或从基站(例如,基站114a)接收信号。例如,在一种实施方式中,发射/接收元件122可以是被配置为传送和/或接收RF信号的天线。在一种实施方式中,发射/接收元件122可以是被配置为传送和/或接收例如IR、UV或可见光信号的发射器/检测器。在另一种实施方式中,发射/接收元件122可以被配置为传送和接收RF和光信号两者。应当理解,发射/接收元件122可以被配置为传送和/或接收无线信号的任何组合。
另外,虽然发射/接收元件122在图13B中被描述为单个元件,但是WTRU 102可以包括任意数量的发射/接收元件122。更具体的,WTRU 102可以使用MIMO技术。因此,在一种实施方式中,WTRU 102可以包括用于通过空中接口115/116/117传送和接收无线信号的两个或更多个发射/接收元件122(例如,多个天线)。
收发信机120可以被配置为调制要由发射/接收元件122传送的信号和/或解调由发射/接收元件122接收的信号。如上面提到的,WTRU 102可以具有多模式能力。因此收发信机120可以包括用于使得WTRU 102能够经由多个RAT(例如UTRA和IEEE 802.11)通信的多个收发信机。
WTRU 102的处理器118可以耦合到下述设备,并且可以从下述设备中接收用户输入数据:扬声器/麦克风124、键盘126和/或显示器/触摸板128(例如,液晶显示器(LCD)显示单元或有机发光二极管(OLED)显示单元)。处理器118还可以输出用户数据到扬声器/麦克风124、键盘126和/或显示器/触摸板128。另外,处理器118可以从任何类型的适当的存储器访问信息,并且可以存储数据到任何类型的适当的存储器中,所述存储器例如不可移除存储器130和/或可移除存储器132。不可移除存储器130可以包括随机存取存储器(RAM)、只读存储器(ROM)、硬盘或任何其他类型的存储器存储设备。可移除存储器132可以包括用户标识模块(SIM)卡、记忆棒、安全数字(SD)存储卡等等。在一个实施方式中,处理器118可以从在物理上没有位于WTRU 102上(例如位于服务器或家用计算机(未示出)上)的存储器访问信息,并且可以将数据存储在该存储器中。
处理器118可以从电源134接收电力,并且可以被配置为分发和/或控制到WTRU102中的其他部件的电力。电源134可以是给WTRU 102供电的任何适当的设备。例如,电源134可以包括一个或更多个干电池(例如,镍镉(NiCd)、镍锌(NiZn)、镍氢(NiMH)、锂离子(Li-ion)等等),太阳能电池,燃料电池等等。
处理器118还可以耦合到GPS芯片组136,所述GPS芯片组136可以被配置为提供关于WTRU 102的当前位置的位置信息(例如,经度和纬度)。作为来自GPS芯片组136的信息的补充或作为其替代,WTRU 102可以通过空中接口115/116/117从基站(例如,基站114a、114b)接收位置信息和/或基于从两个或更多个邻近基站接收的信号的定时来确定其位置。应当理解,在保持实施方式的一致性时,WTRU 102可以通过任何适当的位置确定方法来获得位置信息。
处理器118还可以耦合到其他外围设备138,所述外围设备138可以包括提供附加特征、功能和/或有线或无线连接的一个或多个软件和/或硬件模块。例如,外围设备138可以包括加速计、电子罗盘、卫星收发信机、数字相机(用于照片或视频)、通用串行总线(USB)端口、振动设备、电视收发信机、免提耳机、模块、调频(FM)无线电单元、数字音乐播放器、媒体播放器、视频游戏机模块、因特网浏览器等等。
图13C是根据实施方式的RAN 103和核心网106的系统图。如上所述,RAN 103可使用UTRA无线电技术以通过空中接口115与WTRU 102a、102b、102c通信。RAN 103还可以与核心网106通信。如图13C所示,RAN103可以包括节点B 140a、140b、140c,所述节点B 140a、140b、140c的每一个可以包括一个或多个用于通过空中接口115与WTRU 102a、102b、102c通信的收发信机。节点B 140a、140b、140c的每一个可以与RAN 103内的特定小区(未显示)关联。RAN 103还可以包括RNC 142a、142b。应当理解的是,在保持实施方式的一致性时,RAN103可以包括任意数量的节点B和RNC。
如图13C所示,节点B 140a、140b可以与RNC 142a通信。此外,节点B 140c可以与RNC 142b通信。节点B 140a、140b、140c可以经由Iub接口与各自的RNC 142a、142b通信。RNC142a、142b可以经由Iur接口相互通信。RNC 142a、142b的每一个可以被配置为控制与其连接的各个节点B140a、140b、140c。另外,RNC 142a、142b的每一个可以被配置为执行或支持其他功能,例如外环功率控制、负载控制、准入控制、分组调度、切换控制、宏分集、安全功能、数据加密等等。
图13C中所示的核心网106可以包括媒体网关(MGW)144、移动交换中心(MSC)146、服务GPRS支持节点(SGSN)148、和/或网关GPRS支持节点(GGSN)。尽管前述元件的每一个被描述为核心网106的一部分,应当理解的是,这些元件中的任何一个可以被除核心网运营商以外的实体拥有和/或运营。
RAN 103中的RNC 142a可以经由IuCS接口连接至核心网106中的MSC 146。MSC 146可以连接至MGW 144。MSC 146和MGW 144可以向WTRU 102a、102b、102c提供到电路交换网络(例如PSTN 108)的接入,以便于WTRU 102a、102b、102c与传统陆线通信设备之间的通信。
RAN 103中的RNC 142a还可以经由IuPS接口连接至核心网106中的SGSN 148。SGSN148可以连接至GGSN 150。SGSN 148和GGSN 150可以向WTRU 102a、102b、102c提供到分组交换网络(例如因特网110)的接入,以便于WTRU 102a、102b、102c与IP使能设备之间的通信。
如上所述,核心网106还可以连接至网络112,该网络112可以包括由其他服务提供商拥有和/或运营的其他有线或无线网络。
图13D是根据实施方式的RAN 104和核心网107的系统图。如上所述,RAN 104可使用E-UTRA无线电技术以通过空中接口116与WTRU 102a、102b、102c通信。RAN 104还可以与核心网107通信。
RAN 104可包括e节点B 160a、160b、160c,但可以理解的是,在保持与各种实施方式的一致性的同时,RAN 104可以包括任意数量的e节点B。e节点B 160a、160b、160c的每一个可包括一个或多个用于通过空中接口116与WTRU 102a、102b、102c通信的收发信机。在一种实施方式中,e节点B160a、160b、160c可以实施MIMO技术。因此,e节点B 160a例如可以使用多个天线来向WTRU 102a传送无线信号,以及从该WTRU 102a接收无线信号。
e节点B 160a、160b、160c的每一个可以与特定小区关联(未显示),并可以被配置为处理无线电资源管理决策、切换决策、在上行链路和/或下行链路中的用户调度等等。如图13D所示,e节点B 160a、160b、160c可以通过X2接口相互通信。
图13D中所示的核心网107可以包括移动性管理网关(MME)162、服务网关164和/或分组数据网络(PDN)网关166。虽然前述元件的每一个被描述为核心网107的一部分,应当理解的是,这些元件中的任意一个可以由除了核心网运营商之外的实体拥有和/或运营。
MME 162可以经由S1接口连接到RAN 104中的e节点B 160a、160b、160c的每一个,并可以作为控制节点。例如,MME 162可以负责认证WTRU102a、102b、102c的用户、承载激活/去激活、在WTRU 102a、102b、102c的初始附着期间选择特定服务网关等等。MME 162还可以提供控制平面功能,以用于在RAN 104与使用例如GSM或者WCDMA的其他无线电技术的其他RAN(未显示)之间切换。
服务网关164可以经由S1接口连接到RAN 104中的eNB 160a、160b、160c的每一个。服务网关164通常可以路由和转发去往/来自WTRU 102a、102b、102c的用户数据分组。服务网关164还可以执行其他功能,例如在e节点B间切换期间锚定用户平面、当下行链路数据对于WTRU 102a、102b、102c可用时触发寻呼、管理和存储WTRU 102a、102b、102c的上下文等等。
服务网关164还可以连接到PDN网关166,该PDN网关166可以向WTRU 102a、102b、102c提供到分组交换网络(例如因特网110)的接入,以便于WTRU 102a、102b、102c与IP使能设备之间的通信。
核心网107可以便于与其他网络的通信。例如,核心网107可以向WTRU 102a、102b、102c提供到电路交换网络(例如PSTN 108)的接入,以便于WTRU 102a、102b、102c与传统陆线通信设备之间的通信。例如,核心网107可以包括IP网关(例如IP多媒体子系统(IMS)服务器),或者与之通信,该IP网关作为核心网107与PSTN 108之间的接口。另外,核心网107可以向WTRU 102a、102b、102c提供到网络112的接入,该网络112可以包括被其他服务提供商拥有和/或运营的其他有线或无线网络。
图13E是根据实施方式的RAN 105和核心网109的系统图。RAN 105可以是使用IEEE802.16无线电技术通过空中接口117与WTRU 102a、102b、102c进行通信的接入服务网络(ASN)。如下面进一步讨论的,WTRU 102a、102b、102c,RAN 105和核心网109的不同功能实体之间的通信链路可以被定义为参考点。
如图13E所示,RAN 105可以包括基站180a、180b、180c和ASN网关182,但应当理解的是,在保持与实施方式的一致性的同时,RAN 105可以包括任意数量的基站和ASN网关。基站180a、180b、180c的每一个可以与RAN 105中特定小区(未示出)关联,并可以包括一个或多个用于通过空中接口117与WTRU 102a、102b、102c通信的收发信机。在一个实施方式中,基站180a、180b、180c可以实施MIMO技术。因此,基站180a例如可以使用多个天线来向WTRU102a传送无线信号,以及从其接收无线信号。基站180a、180b、180c还可以提供移动性管理功能,例如切换(handoff)触发、隧道建立、无线电资源管理,业务分类、服务质量策略执行等等。ASN网关182可以充当业务聚集点,并且可以负责寻呼、用户简档(profile)的缓存、到核心网109的路由等等。
WTRU 102a、102b、102c与RAN 105之间的空中接口117可以被定义为实施802.16规范的R1参考点。另外,WTRU 102a、102b、102c的每一个可以与核心网109建立逻辑接口(未显示)。WTRU 102a、102b、102c与核心网109之间的逻辑接口可以被定义为R2参考点,其可以用于认证、授权、IP主机(host)配置管理和/或移动性管理。
基站180a、180b、180c的每一个之间的通信链路可以被定义为包括便于WTRU切换和基站间数据转移的协议的R8参考点。基站180a、180b、180c与ASN网关182之间的通信链路可以被定义为R6参考点。R6参考点可以包括用于便于基于与WTRU 102a、102b、102c的每一个关联的移动性事件的移动性管理的协议。
如图13E所示,RAN 105可以连接至核心网109。RAN 105与核心网109之间的通信链路可以被定义为包括例如便于数据转移和移动性管理能力的协议的R3参考点。核心网109可以包括移动IP本地代理(MIP-HA)184,认证、授权、计费(AAA)服务器186和网关188。尽管前述的每个元件被描述为核心网109的一部分,应当理解的是,这些元件中的任意一个可以由除核心网运营商以外的实体拥有和/或运营。
MIP-HA可以负责IP地址管理,并可以使得WTRU 102a、102b、102c能够在不同ASN和/或不同核心网之间漫游。MIP-HA184可以向WTRU 102a、102b、102c提供对分组交换网络(例如因特网110)的接入,以便于WTRU 102a、102b、102c与IP使能设备之间的通信。AAA服务器186可以负责用户认证和支持用户服务。网关188可便于与其他网络互通。例如,网关188可以向WTRU 102a、102b、102c提供对电路交换网络(例如PSTN 108)的接入,以便于WTRU102a、102b、102c与传统陆线通信设备之间的通信。此外,网关188可以向WTRU 102a、102b、102c提供对网络112的接入,该网络112可以包括由其他服务提供商拥有和/或运营的其他有线或无线网络。
尽管未在图13E中显示,应当理解的是,RAN 105可以连接至其他ASN,并且核心网109可以连接至其他核心网。RAN 105与其他ASN之间的通信链路可以被定义为R4参考点,该R4参考点可以包括用于协调RAN 105与其他ASN之间的WTRU 102a、102b、102c的移动性的协议。核心网109与其他核心网之间的通信链路可以被定义为R5参考,该R5参考可以包括便于本地核心网与被访问核心网之间的互通的协议。
本领域的普通技术人员可理解,每个特征或元素可以单独使用或与其他特征和元素进行组合使用。此外,此处描述的方法可以在引入到计算机可读介质中并供计算机或处理器运行的计算机程序、软件或固件中实施。计算机可读介质的示例包括电信号(通过有线或无线连接传送)和计算机可读存储介质。计算机可读存储介质的示例包括但不限于只读存储器(ROM)、随机存取存储器(RAM)、寄存器、缓冲存储器、半导体存储设备、例如内部硬盘和可移除磁盘的磁介质、磁光介质和例如CD-ROM磁盘和数字多用途碟片(DVD)的光介质。与软件关联的处理器可以被用于实施在WTRU、WTRU、终端、基站、RNC或任何主计算机中使用的射频收发信机。
尽管使用两层可分级系统进行了描述,但本领域的技术人员可以将这里讨论的架构扩展成多层可分级视频编码系统。此外,尽管HEVC常被用作样本单层编解码器,但系统可以较少地依赖于底层单层视频编解码器本身,并且可以与任意其他单层编解码器合并。本领域的普通技术人员将能认识到,每个特征或元素能够被单独使用,或与其他特征和元素进行任意组合。
此处描述的方法可以在引入到计算机可读介质中并供计算机或处理器运行的计算机程序、软件或固件中实施。计算机可读介质的示例包括电信号(通过有线或无线连接传送)和计算机可读存储介质。计算机可读存储介质的示例包括但不限于只读存储器(ROM)、随机存取存储器(RAM)、寄存器、缓冲存储器、半导体存储设备、例如内部硬盘和可移除磁盘的磁介质、磁光介质和例如CD-ROM磁盘和数字多用途碟片(DVD)的光介质。与软件关联的处理器可以被用于实施在WTRU、WTRU、终端、基站、RNC或任何主计算机中使用的射频收发信机。
Claims (20)
1.一种方法,该方法包括:
接收基础层BL编码数据、增强层EL编码数据和层间预测ILP信息,其中所述ILP信息被分包在与包括所述BL编码数据和所述EL编码数据的网络抽象单元分开的网络抽象单元中;
基于所述BL编码数据,重建BL图像;
对重建的BL图像执行图像级层间过程以基于所述分包的ILP信息生成层间参考ILR图像;以及
基于所述ILR图像和所述EL编码数据,重建EL图像。
2.根据权利要求1所述的方法,其中所述分包的ILP信息包括上采样滤波器信息。
3.根据权利要求1所述的方法,其中所述分包的ILP信息被分包在多个网络抽象单元中,该多个网络抽象单元中的每个网络抽象单元与一单元类型相关联。
4.根据权利要求1所述的方法,其中所述分包的ILP信息包括以下至少一者:被分包在第一单元类型的网络抽象单元中的上采样滤波器信息、被分包在第二单元类型的网络抽象单元中的一个或多个视差补偿参数、或者被分包在第三单元类型的网络抽象单元中的一个或多个逆色调映射参数。
5.根据权利要求1所述的方法,该方法还包括:
基于所述BL编码数据、所述EL编码数据、或者所述ILP信息中的一者或多者,确定使所述EL和所述BL相关的第一可分级性类型和使所述EL和所述BL相关的第二可分级性类型;以及
基于所述第一可分级性类型和所述第二可分级性类型,确定用于将所述重建的BL图像处理为所述ILR图像的合并的图像级层间过程,其中所述图像级层间过程包括所述合并的图像级层间过程。
6.根据权利要求5所述的方法,其中所述第一可分级性类型是空间可分级性,以及所述合并的图像级层间过程包括上采样。
7.根据权利要求5所述的方法,其中所述第一可分级性类型是空间可分级性,所述第二可分级性类型是位深可分级性,以及所述合并的图像级层间过程包括上采样和逆色调映射。
8.根据权利要求1所述的方法,该方法还包括解复用视频信号以将包括所述ILP信息的所述网络抽象单元与包括所述BL编码数据和所述EL编码数据的所述网络抽象单元分开。
9.根据权利要求1所述的方法,其中所述重建的EL图像和所述ILR图像对应相同的时间实例。
10.根据权利要求1所述的方法,其中所述ILR图像被包括在参考图像集合中,所述参考图像集合还包括参考EL图像,并且重建所述EL图像包括:
使用所述ILR图像预测所述EL图像的第一部分;以及
使用所述参考EL图像预测所述EL图像的第二部分。
11.根据权利要求1所述的方法,其中所述分包的ILP信息包括一个或多个逆色调映射参数。
12.一种系统,该系统包括:
处理器,被配置成:
接收视频信号,该视频信号包括基础层BL编码数据、增强层EL编码数据和层间预测ILP信息,其中所述ILP信息被分包在与包括所述BL编码数据和所述EL编码数据的网络抽象单元分开的网络抽象单元中;
基于所述BL编码数据,重建BL图像;
对重建的BL图像执行图像级层间过程以基于所述分包的ILP信息生成层间参考ILR图像;以及
基于所述ILR图像和所述EL编码数据,重建EL图像。
13.根据权利要求12所述的系统,其中所述分包的ILP信息包括上采样滤波器信息。
14.根据权利要求12所述的系统,其中所述处理器还被配置成:
基于所述BL编码数据、所述EL编码数据、或者所述ILP信息中的一者或多者,确定使所述EL和所述BL相关的第一可分级性类型和使所述EL和所述BL相关的第二可分级性类型;以及
基于所述第一可分级性类型和所述第二可分级性类型,确定用于将所述重建的BL图像处理为所述ILR图像的合并的图像级层间过程,其中所述图像级层间过程包括所述合并的图像级层间过程。
15.根据权利要求14所述的系统,其中所述第一可分级性类型是空间可分级性,以及所述合并的图像级层间过程包括上采样。
16.根据权利要求14所述的系统,其中所述第一可分级性类型是位深可分级性,以及所述合并的图像级层间过程包括逆色调映射。
17.根据权利要求14所述的系统,其中所述第一可分级性类型是空间可分级性,所述第二可分级性类型是位深可分级性,以及所述合并的图像级层间过程包括上采样和逆色调映射。
18.根据权利要求12所述的系统,其中所述重建的EL图像和所述ILR图像对应相同的时间实例。
19.根据权利要求12所述的系统,其中包括所述ILP信息的所述网络抽象单元处于第一模式,以及包括所述BL编码数据和所述EL编码数据的所述网络抽象单元处于第二模式。
20.根据权利要求12所述的系统,其中所述分包的ILP信息包括一个或多个逆色调映射参数。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261669356P | 2012-07-09 | 2012-07-09 | |
US61/669,356 | 2012-07-09 | ||
US201261734264P | 2012-12-06 | 2012-12-06 | |
US61/734,264 | 2012-12-06 | ||
CN201380036878.4A CN104429071B (zh) | 2012-07-09 | 2013-07-09 | 用于多层视频编码的编解码器架构 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380036878.4A Division CN104429071B (zh) | 2012-07-09 | 2013-07-09 | 用于多层视频编码的编解码器架构 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110035286A true CN110035286A (zh) | 2019-07-19 |
CN110035286B CN110035286B (zh) | 2021-11-12 |
Family
ID=48833069
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811639520.1A Active CN110035286B (zh) | 2012-07-09 | 2013-07-09 | 用于多层视频编码的编解码器架构 |
CN201380036878.4A Active CN104429071B (zh) | 2012-07-09 | 2013-07-09 | 用于多层视频编码的编解码器架构 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380036878.4A Active CN104429071B (zh) | 2012-07-09 | 2013-07-09 | 用于多层视频编码的编解码器架构 |
Country Status (17)
Country | Link |
---|---|
US (4) | US9998764B2 (zh) |
EP (2) | EP3407608A1 (zh) |
JP (5) | JP2015523815A (zh) |
KR (4) | KR20150029745A (zh) |
CN (2) | CN110035286B (zh) |
AU (2) | AU2013288832B2 (zh) |
BR (1) | BR112015000480B1 (zh) |
CA (1) | CA2878807C (zh) |
HK (1) | HK1204515A1 (zh) |
IL (1) | IL236629A0 (zh) |
IN (1) | IN2015DN00191A (zh) |
MX (2) | MX361767B (zh) |
MY (1) | MY172999A (zh) |
RU (1) | RU2616549C2 (zh) |
SG (2) | SG10201700161UA (zh) |
TW (2) | TWI649999B (zh) |
WO (1) | WO2014011595A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11012717B2 (en) | 2012-07-09 | 2021-05-18 | Vid Scale, Inc. | Codec architecture for multiple layer video coding |
WO2022166462A1 (zh) * | 2021-02-08 | 2022-08-11 | 华为技术有限公司 | 编码、解码方法和相关设备 |
WO2024093305A1 (zh) * | 2022-10-31 | 2024-05-10 | 华为技术有限公司 | 图像编解码方法和装置 |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2013261845A1 (en) * | 2012-05-14 | 2014-12-11 | Guido MEARDI | Encoding and reconstruction of residual data based on support information |
US20140085415A1 (en) * | 2012-09-27 | 2014-03-27 | Nokia Corporation | Method and apparatus for video coding |
EP2911397A1 (en) * | 2012-09-28 | 2015-08-26 | Intel Corporation | Inter-layer pixel sample prediction |
US9936215B2 (en) | 2012-10-04 | 2018-04-03 | Vid Scale, Inc. | Reference picture set mapping for standard scalable video coding |
US20140192881A1 (en) * | 2013-01-07 | 2014-07-10 | Sony Corporation | Video processing system with temporal prediction mechanism and method of operation thereof |
US10321130B2 (en) | 2013-01-07 | 2019-06-11 | Vid Scale, Inc. | Enhanced deblocking filters for video coding |
KR102273025B1 (ko) * | 2013-03-06 | 2021-07-05 | 삼성전자주식회사 | 선택적인 노이즈제거 필터링을 이용한 스케일러블 비디오 부호화 방법 및 그 장치, 선택적인 노이즈제거 필터링을 이용한 스케일러블 비디오 복호화 방법 및 그 장치 |
US9324161B2 (en) * | 2013-03-13 | 2016-04-26 | Disney Enterprises, Inc. | Content-aware image compression method |
US9800884B2 (en) * | 2013-03-15 | 2017-10-24 | Qualcomm Incorporated | Device and method for scalable coding of video information |
EP3410715A1 (en) | 2013-04-05 | 2018-12-05 | Vid Scale, Inc. | Inter-layer reference picture enhancement for multiple layer video coding |
US11438609B2 (en) * | 2013-04-08 | 2022-09-06 | Qualcomm Incorporated | Inter-layer picture signaling and related processes |
BR112015026244B1 (pt) * | 2013-04-15 | 2023-04-25 | V-Nova International Ltd | Codificação e decodificação de sinal compatível com versões anteriores híbrido |
US10284840B2 (en) * | 2013-06-28 | 2019-05-07 | Electronics And Telecommunications Research Institute | Apparatus and method for reproducing 3D image |
US10212437B2 (en) * | 2013-07-18 | 2019-02-19 | Qualcomm Incorporated | Device and method for scalable coding of video information |
KR101595397B1 (ko) * | 2013-07-26 | 2016-02-29 | 경희대학교 산학협력단 | 서로 다른 다계층 비디오 코덱의 통합 부호화/복호화 방법 및 장치 |
US9818422B2 (en) * | 2013-08-30 | 2017-11-14 | The Regents Of The University Of California | Method and apparatus for layered compression of multimedia signals for storage and transmission over heterogeneous networks |
WO2015031891A2 (en) * | 2013-08-30 | 2015-03-05 | ARRIS Enterprises, Inc | Multipass encoder with heterogeneous codecs |
WO2015058397A1 (en) | 2013-10-25 | 2015-04-30 | Microsoft Technology Licensing, Llc | Representing blocks with hash values in video and image coding and decoding |
EP3061253A4 (en) | 2013-10-25 | 2016-08-31 | Microsoft Technology Licensing Llc | PAIRING OF BLOCKS BY HASHING VIDEO AND IMAGE CODING |
EP3090549A1 (en) | 2014-01-02 | 2016-11-09 | VID SCALE, Inc. | Methods and systems for scalable video coding with mixed interlace and progressive content |
US10368092B2 (en) | 2014-03-04 | 2019-07-30 | Microsoft Technology Licensing, Llc | Encoder-side decisions for block flipping and skip mode in intra block copy prediction |
KR102185245B1 (ko) * | 2014-03-04 | 2020-12-01 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 해시 기반 블록 매칭을 위한 해시 테이블 구성 및 이용가능성 검사 |
US9712837B2 (en) * | 2014-03-17 | 2017-07-18 | Qualcomm Incorporated | Level definitions for multi-layer video codecs |
US9591316B2 (en) * | 2014-03-27 | 2017-03-07 | Intel IP Corporation | Scalable video encoding rate adaptation based on perceived quality |
US10681372B2 (en) * | 2014-06-23 | 2020-06-09 | Microsoft Technology Licensing, Llc | Encoder decisions based on results of hash-based block matching |
JP6462119B2 (ja) | 2014-09-30 | 2019-01-30 | マイクロソフト テクノロジー ライセンシング,エルエルシー | コンピューティングデバイス |
US9591254B2 (en) * | 2015-03-26 | 2017-03-07 | Qualcomm Incorporated | Device and method for processing video data |
WO2017020021A1 (en) * | 2015-07-29 | 2017-02-02 | Vid Scale, Inc. | Scalable high efficiency video coding to high efficiency video coding transcoding |
GB2544800A (en) * | 2015-11-27 | 2017-05-31 | V-Nova Ltd | Adaptive bit rate ratio control |
US10440401B2 (en) | 2016-04-07 | 2019-10-08 | Dolby Laboratories Licensing Corporation | Backward-compatible HDR codecs with temporal scalability |
US10390039B2 (en) | 2016-08-31 | 2019-08-20 | Microsoft Technology Licensing, Llc | Motion estimation for screen remoting scenarios |
US11095877B2 (en) | 2016-11-30 | 2021-08-17 | Microsoft Technology Licensing, Llc | Local hash-based motion estimation for screen remoting scenarios |
US20190356926A1 (en) * | 2017-02-03 | 2019-11-21 | Sony Corporation | Transmission device, transmission method, reception device, and reception method |
US20200236355A1 (en) * | 2017-08-01 | 2020-07-23 | Sharp Kabushiki Kaisha | Systems and methods for filtering reconstructed video data using adaptive loop filtering techniques |
CN107800649A (zh) * | 2017-10-29 | 2018-03-13 | 湖州师范学院 | 一种增强的基于路径的虚拟光网络映射方法 |
CN117834831A (zh) * | 2018-01-16 | 2024-04-05 | Vid拓展公司 | 用于360度视频译码的自适应帧封装 |
GB2570324A (en) * | 2018-01-19 | 2019-07-24 | V Nova Int Ltd | Multi-codec processing and rate control |
KR102039711B1 (ko) * | 2018-03-13 | 2019-11-01 | 삼성전자주식회사 | 팬-아웃 부품 패키지 |
US10764588B2 (en) * | 2018-08-10 | 2020-09-01 | Apple Inc. | Deep quality enhancement of adaptive downscaled coding for image compression |
KR102022648B1 (ko) | 2018-08-10 | 2019-09-19 | 삼성전자주식회사 | 전자 장치, 이의 제어 방법 및 서버의 제어 방법 |
GB201905400D0 (en) * | 2019-04-16 | 2019-05-29 | V Nova Int Ltd | Video coding technology |
CN110113604B (zh) * | 2019-04-26 | 2021-03-30 | 电子科技大学 | 一种图像分层编码方法 |
JP7403245B2 (ja) * | 2019-06-21 | 2023-12-22 | キヤノン株式会社 | 画像復号装置、画像復号方法 |
CN111190577B (zh) * | 2019-12-19 | 2023-03-31 | 贠学文 | 一种对工具包统一管理并实现轻量级mvc的框架构建方法 |
US11202085B1 (en) | 2020-06-12 | 2021-12-14 | Microsoft Technology Licensing, Llc | Low-cost hash table construction and hash-based block matching for variable-size blocks |
US11330296B2 (en) * | 2020-09-14 | 2022-05-10 | Apple Inc. | Systems and methods for encoding image data |
US11677934B2 (en) * | 2021-09-24 | 2023-06-13 | Apple Inc. | Encoding and decoding video content |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060088102A1 (en) * | 2004-10-21 | 2006-04-27 | Samsung Electronics Co., Ltd. | Method and apparatus for effectively encoding multi-layered motion vectors |
US20060260991A1 (en) * | 2005-05-23 | 2006-11-23 | Chin-Tuan Liao | Filtering device |
JP2008078979A (ja) * | 2006-09-21 | 2008-04-03 | Victor Co Of Japan Ltd | 動画像階層符号量割当装置、階層符号化装置、階層符号量割当プログラム及び階層符号化プログラム |
US20090097558A1 (en) * | 2007-10-15 | 2009-04-16 | Qualcomm Incorporated | Scalable video coding techniques for scalable bitdepths |
CN101420609A (zh) * | 2007-10-24 | 2009-04-29 | 深圳华为通信技术有限公司 | 视频编码、解码方法及视频编码器、解码器 |
JP2009538085A (ja) * | 2006-11-17 | 2009-10-29 | エルジー エレクトロニクス インコーポレイティド | ビデオ信号のデコーディング/エンコーディング方法及び装置 |
JP2010517343A (ja) * | 2007-01-18 | 2010-05-20 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 品質スケーラブル・ビデオ・データ・ストリーム |
WO2010123855A1 (en) * | 2009-04-20 | 2010-10-28 | Dolby Laboratories Licensing Corporation | Filter selection for video pre-processing in video applications |
WO2012006299A1 (en) * | 2010-07-08 | 2012-01-12 | Dolby Laboratories Licensing Corporation | Systems and methods for multi-layered image and video delivery using reference processing signals |
Family Cites Families (76)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7929610B2 (en) | 2001-03-26 | 2011-04-19 | Sharp Kabushiki Kaisha | Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding |
US7715477B2 (en) * | 2002-05-29 | 2010-05-11 | Diego Garrido | Classifying image areas of a video signal |
KR100596705B1 (ko) * | 2004-03-04 | 2006-07-04 | 삼성전자주식회사 | 비디오 스트리밍 서비스를 위한 비디오 코딩 방법과 비디오 인코딩 시스템, 및 비디오 디코딩 방법과 비디오 디코딩 시스템 |
DE102004059978B4 (de) * | 2004-10-15 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz und zum Decodieren einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Restwerte-Prädiktion sowie ein Computerprogramm und ein computerlesbares Medium |
KR20060063613A (ko) * | 2004-12-06 | 2006-06-12 | 엘지전자 주식회사 | 영상 신호의 스케일러블 인코딩 및 디코딩 방법 |
KR100763178B1 (ko) | 2005-03-04 | 2007-10-04 | 삼성전자주식회사 | 색 공간 스케일러블 비디오 코딩 및 디코딩 방법, 이를위한 장치 |
US7961963B2 (en) * | 2005-03-18 | 2011-06-14 | Sharp Laboratories Of America, Inc. | Methods and systems for extended spatial scalability with picture-level adaptation |
KR100703770B1 (ko) | 2005-03-25 | 2007-04-06 | 삼성전자주식회사 | 가중 예측을 이용한 비디오 코딩 및 디코딩 방법, 이를위한 장치 |
US7876833B2 (en) * | 2005-04-11 | 2011-01-25 | Sharp Laboratories Of America, Inc. | Method and apparatus for adaptive up-scaling for spatially scalable coding |
FR2889778A1 (fr) | 2005-08-12 | 2007-02-16 | Thomson Licensing Sas | Procede de codage et de decodage d'images video avec echelonnabilite spatiale |
KR100891662B1 (ko) * | 2005-10-05 | 2009-04-02 | 엘지전자 주식회사 | 비디오 신호 디코딩 및 인코딩 방법 |
CN101317460A (zh) * | 2005-10-11 | 2008-12-03 | 诺基亚公司 | 用于有效的可伸缩流适配的系统和方法 |
US8345755B2 (en) | 2006-01-09 | 2013-01-01 | Lg Electronics, Inc. | Inter-layer prediction method for video signal |
KR100772873B1 (ko) | 2006-01-12 | 2007-11-02 | 삼성전자주식회사 | 스무딩 예측을 이용한 다계층 기반의 비디오 인코딩 방법,디코딩 방법, 비디오 인코더 및 비디오 디코더 |
US8170116B2 (en) | 2006-03-27 | 2012-05-01 | Nokia Corporation | Reference picture marking in scalable video encoding and decoding |
KR100781525B1 (ko) * | 2006-04-06 | 2007-12-03 | 삼성전자주식회사 | 가중 평균합을 이용하여 fgs 계층을 인코딩 및디코딩하는 방법 및 장치 |
WO2008010932A2 (en) | 2006-07-20 | 2008-01-24 | Thomson Licensing | Method and apparatus for signaling view scalability in multi-view video coding |
US8060651B2 (en) | 2006-08-17 | 2011-11-15 | Sharp Laboratories Of America, Inc. | Systems and methods for adaptively packetizing data partitions for transport over a network |
CN101888559B (zh) * | 2006-11-09 | 2013-02-13 | Lg电子株式会社 | 用于解码/编码视频信号的方法及装置 |
RU2426267C2 (ru) * | 2007-01-08 | 2011-08-10 | Нокиа Корпорейшн | Усовершенствованное межуровневое предсказание для расширенной пространственной масштабируемости при кодировании видеосигнала |
US8737474B2 (en) | 2007-06-27 | 2014-05-27 | Thomson Licensing | Method and apparatus for encoding and/or decoding video data using enhancement layer residual prediction for bit depth scalability |
JP5534521B2 (ja) * | 2007-10-15 | 2014-07-02 | トムソン ライセンシング | スケーラブルなビデオのためにレイヤー間残差予測を行う方法および装置 |
US8855199B2 (en) * | 2008-04-21 | 2014-10-07 | Nokia Corporation | Method and device for video coding and decoding |
US8867616B2 (en) * | 2009-02-11 | 2014-10-21 | Thomson Licensing | Methods and apparatus for bit depth scalable video encoding and decoding utilizing tone mapping and inverse tone mapping |
JP5059062B2 (ja) | 2009-07-08 | 2012-10-24 | シャープ株式会社 | 通信システム、移動局装置および基地局装置 |
US20120063517A1 (en) * | 2010-09-14 | 2012-03-15 | Samsung Electronics Co., Ltd. | Method and apparatus for hierarchical picture encoding and decoding |
US20120075436A1 (en) | 2010-09-24 | 2012-03-29 | Qualcomm Incorporated | Coding stereo video data |
EP2630799A4 (en) * | 2010-10-20 | 2014-07-02 | Nokia Corp | METHOD AND DEVICE FOR VIDEO CODING AND DECODING |
AU2012225513B2 (en) * | 2011-03-10 | 2016-06-23 | Vidyo, Inc. | Dependency parameter set for scalable video coding |
US9253233B2 (en) * | 2011-08-31 | 2016-02-02 | Qualcomm Incorporated | Switch signaling methods providing improved switching between representations for adaptive HTTP streaming |
US9124895B2 (en) * | 2011-11-04 | 2015-09-01 | Qualcomm Incorporated | Video coding with network abstraction layer units that include multiple encoded picture partitions |
US9210430B2 (en) * | 2012-01-19 | 2015-12-08 | Sharp Kabushiki Kaisha | Reference picture set signaling and restriction on an electronic device |
KR101652928B1 (ko) | 2012-01-31 | 2016-09-01 | 브이아이디 스케일, 인크. | 스케일러블 고효율 비디오 코딩(hevc)을 위한 참조 픽처 세트(rps) 시그널링 |
PL2822276T3 (pl) * | 2012-02-29 | 2019-04-30 | Lg Electronics Inc | Sposób predykcji międzywarstwowej i stosujące go urządzenie |
CN108377393A (zh) * | 2012-03-22 | 2018-08-07 | 联发科技股份有限公司 | 编码视频数据的方法以及装置 |
CN104396244B (zh) * | 2012-04-16 | 2019-08-09 | 诺基亚技术有限公司 | 用于视频编码和解码的装置、方法和计算机可读存储介质 |
WO2013158293A1 (en) * | 2012-04-19 | 2013-10-24 | Vid Scale, Inc. | System and method for error-resilient video coding |
US10205961B2 (en) * | 2012-04-23 | 2019-02-12 | Qualcomm Incorporated | View dependency in multi-view coding and 3D coding |
US9253487B2 (en) * | 2012-05-31 | 2016-02-02 | Qualcomm Incorporated | Reference index for enhancement layer in scalable video coding |
WO2013189257A1 (en) * | 2012-06-20 | 2013-12-27 | Mediatek Inc. | Method and apparatus of bi-directional prediction for scalable video coding |
US20140003504A1 (en) * | 2012-07-02 | 2014-01-02 | Nokia Corporation | Apparatus, a Method and a Computer Program for Video Coding and Decoding |
CN104429075B (zh) * | 2012-07-09 | 2017-10-31 | 太阳专利托管公司 | 图像编码方法、图像解码方法、图像编码装置及图像解码装置 |
US9854259B2 (en) * | 2012-07-09 | 2017-12-26 | Qualcomm Incorporated | Smoothing of difference reference picture |
CN110035286B (zh) | 2012-07-09 | 2021-11-12 | Vid拓展公司 | 用于多层视频编码的编解码器架构 |
US9344718B2 (en) * | 2012-08-08 | 2016-05-17 | Qualcomm Incorporated | Adaptive up-sampling filter for scalable video coding |
JP5961761B2 (ja) * | 2012-08-29 | 2016-08-02 | ヴィド スケール インコーポレイテッド | スケーラブルビデオ符号化のための動きベクトルの予測の方法および装置 |
WO2014038905A2 (ko) * | 2012-09-09 | 2014-03-13 | 엘지전자 주식회사 | 영상 복호화 방법 및 이를 이용하는 장치 |
US20140069969A1 (en) | 2012-09-11 | 2014-03-13 | Christopher Yannis Bosch | Delivery System |
US9554133B2 (en) * | 2012-09-18 | 2017-01-24 | Vid Scale, Inc. | Method and apparatus for region of interest video coding using tiles and tile groups |
EP4221217B1 (en) * | 2012-09-26 | 2024-09-18 | Sun Patent Trust | Image decoding method and image decoding apparatus |
EP3748969B1 (en) * | 2012-09-27 | 2024-01-03 | Dolby Laboratories Licensing Corporation | Inter-layer reference picture processing for coding standard scalability |
US9706199B2 (en) * | 2012-09-28 | 2017-07-11 | Nokia Technologies Oy | Apparatus, a method and a computer program for video coding and decoding |
TW201424397A (zh) * | 2012-09-28 | 2014-06-16 | Samsung Electronics Co Ltd | 可調式視訊解碼、編碼方法及其裝置與非暫時性電腦可讀記錄體 |
US9565452B2 (en) * | 2012-09-28 | 2017-02-07 | Qualcomm Incorporated | Error resilient decoding unit association |
CN104904202A (zh) * | 2012-09-28 | 2015-09-09 | 三星电子株式会社 | 用于使用参考画面信息进行并行视频编码的方法和设备以及用于使用参考画面信息进行并行视频解码的方法和设备 |
WO2014053518A1 (en) * | 2012-10-01 | 2014-04-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Scalable video coding using subblock-based coding of transform coefficient blocks in the enhancement layer |
CN104704835B (zh) * | 2012-10-03 | 2017-11-24 | 联发科技股份有限公司 | 视频编码中运动信息管理的装置与方法 |
US9723321B2 (en) * | 2012-10-08 | 2017-08-01 | Samsung Electronics Co., Ltd. | Method and apparatus for coding video stream according to inter-layer prediction of multi-view video, and method and apparatus for decoding video stream according to inter-layer prediction of multi view video |
US20140192881A1 (en) * | 2013-01-07 | 2014-07-10 | Sony Corporation | Video processing system with temporal prediction mechanism and method of operation thereof |
US9294776B2 (en) * | 2013-03-05 | 2016-03-22 | Qualcomm Incorporated | Parallel processing for video coding |
US9648353B2 (en) * | 2013-04-04 | 2017-05-09 | Qualcomm Incorporated | Multiple base layer reference pictures for SHVC |
US8958477B2 (en) * | 2013-04-05 | 2015-02-17 | Vidyo, Inc. | Multiple reference layer prediction signaling techniques |
CA2908853C (en) * | 2013-04-08 | 2019-01-15 | Arris Technology, Inc. | Signaling for addition or removal of layers in video coding |
US9674522B2 (en) * | 2013-04-08 | 2017-06-06 | Qualcomm Incorporated | Device and method for scalable coding of video information |
US9432667B2 (en) * | 2013-06-11 | 2016-08-30 | Qualcomm Incorporated | Processing bitstream constraints relating to inter-layer prediction types in multi-layer video coding |
US9609329B2 (en) * | 2013-06-25 | 2017-03-28 | Samsung Electronics Co., Ltd | Dynamic voltage/frequency scaling for video processing using embedded complexity metrics |
US9756335B2 (en) * | 2013-07-02 | 2017-09-05 | Qualcomm Incorporated | Optimizations on inter-layer prediction signalling for multi-layer video coding |
US9560358B2 (en) * | 2013-07-22 | 2017-01-31 | Qualcomm Incorporated | Device and method for scalable coding of video information |
US9648333B2 (en) * | 2013-10-11 | 2017-05-09 | Vid Scale, Inc. | High level syntax for HEVC extensions |
US9681145B2 (en) * | 2013-10-14 | 2017-06-13 | Qualcomm Incorporated | Systems and methods for inter-layer RPS derivation based on sub-layer reference prediction dependency |
EP3090549A1 (en) * | 2014-01-02 | 2016-11-09 | VID SCALE, Inc. | Methods and systems for scalable video coding with mixed interlace and progressive content |
US9654794B2 (en) * | 2014-01-03 | 2017-05-16 | Qualcomm Incorporated | Methods for coding an inter-layer reference picture set (RPS) and coding end of bitstream (EOB) network access layer (NAL) units in multi-layer coding |
US9641851B2 (en) * | 2014-04-18 | 2017-05-02 | Qualcomm Incorporated | Conformance window information in multi-layer coding |
MX360655B (es) * | 2014-05-21 | 2018-11-12 | Arris Entpr Llc | Gestión individual de memorias intermedias en transporte de video escalable. |
US9716900B2 (en) * | 2014-06-20 | 2017-07-25 | Qualcomm Incorporated | Extensible design of nesting supplemental enhancement information (SEI) messages |
EP3453178A1 (en) * | 2016-05-06 | 2019-03-13 | VID SCALE, Inc. | Systems and methods for motion compensated residual prediction |
-
2013
- 2013-07-09 CN CN201811639520.1A patent/CN110035286B/zh active Active
- 2013-07-09 CA CA2878807A patent/CA2878807C/en active Active
- 2013-07-09 RU RU2015103915A patent/RU2616549C2/ru active
- 2013-07-09 JP JP2015521710A patent/JP2015523815A/ja active Pending
- 2013-07-09 TW TW106127382A patent/TWI649999B/zh active
- 2013-07-09 EP EP18183668.5A patent/EP3407608A1/en active Pending
- 2013-07-09 US US13/937,645 patent/US9998764B2/en active Active
- 2013-07-09 KR KR1020157003481A patent/KR20150029745A/ko active Application Filing
- 2013-07-09 TW TW102124530A patent/TWI606716B/zh active
- 2013-07-09 EP EP13739902.8A patent/EP2870757A1/en not_active Ceased
- 2013-07-09 MX MX2017000249A patent/MX361767B/es unknown
- 2013-07-09 MY MYPI2015000023A patent/MY172999A/en unknown
- 2013-07-09 MX MX2015000265A patent/MX344952B/es active IP Right Grant
- 2013-07-09 KR KR1020187028380A patent/KR20180112099A/ko not_active Application Discontinuation
- 2013-07-09 KR KR1020207009980A patent/KR20200038564A/ko active Application Filing
- 2013-07-09 WO PCT/US2013/049662 patent/WO2014011595A1/en active Application Filing
- 2013-07-09 SG SG10201700161UA patent/SG10201700161UA/en unknown
- 2013-07-09 IN IN191DEN2015 patent/IN2015DN00191A/en unknown
- 2013-07-09 KR KR1020217033594A patent/KR20210129266A/ko not_active Application Discontinuation
- 2013-07-09 AU AU2013288832A patent/AU2013288832B2/en active Active
- 2013-07-09 CN CN201380036878.4A patent/CN104429071B/zh active Active
- 2013-07-09 SG SG11201500129UA patent/SG11201500129UA/en unknown
- 2013-07-09 BR BR112015000480-6A patent/BR112015000480B1/pt active IP Right Grant
-
2015
- 2015-01-11 IL IL236629A patent/IL236629A0/en active IP Right Grant
- 2015-05-26 HK HK15105004.6A patent/HK1204515A1/zh unknown
-
2017
- 2017-01-13 AU AU2017200225A patent/AU2017200225B2/en active Active
- 2017-08-14 JP JP2017156630A patent/JP6574223B2/ja active Active
-
2018
- 2018-01-05 US US15/863,088 patent/US10484717B2/en active Active
-
2019
- 2019-08-15 JP JP2019149152A patent/JP2019208279A/ja active Pending
- 2019-10-24 US US16/662,304 patent/US11012717B2/en active Active
-
2021
- 2021-04-30 US US17/246,025 patent/US11627340B2/en active Active
- 2021-10-08 JP JP2021166188A patent/JP2022023856A/ja active Pending
-
2023
- 2023-10-02 JP JP2023171301A patent/JP2023166011A/ja active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060088102A1 (en) * | 2004-10-21 | 2006-04-27 | Samsung Electronics Co., Ltd. | Method and apparatus for effectively encoding multi-layered motion vectors |
US20060260991A1 (en) * | 2005-05-23 | 2006-11-23 | Chin-Tuan Liao | Filtering device |
JP2008078979A (ja) * | 2006-09-21 | 2008-04-03 | Victor Co Of Japan Ltd | 動画像階層符号量割当装置、階層符号化装置、階層符号量割当プログラム及び階層符号化プログラム |
JP2009538085A (ja) * | 2006-11-17 | 2009-10-29 | エルジー エレクトロニクス インコーポレイティド | ビデオ信号のデコーディング/エンコーディング方法及び装置 |
JP2010517343A (ja) * | 2007-01-18 | 2010-05-20 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 品質スケーラブル・ビデオ・データ・ストリーム |
US20090097558A1 (en) * | 2007-10-15 | 2009-04-16 | Qualcomm Incorporated | Scalable video coding techniques for scalable bitdepths |
CN101420609A (zh) * | 2007-10-24 | 2009-04-29 | 深圳华为通信技术有限公司 | 视频编码、解码方法及视频编码器、解码器 |
WO2010123855A1 (en) * | 2009-04-20 | 2010-10-28 | Dolby Laboratories Licensing Corporation | Filter selection for video pre-processing in video applications |
WO2012006299A1 (en) * | 2010-07-08 | 2012-01-12 | Dolby Laboratories Licensing Corporation | Systems and methods for multi-layered image and video delivery using reference processing signals |
Non-Patent Citations (5)
Title |
---|
AJAY LUTHRA: "Scalable enhancement requirements for HEVC", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC)》 * |
HYOMIN CHOI,JUNGHAK NAM AND DONGGYU: "Scalable structures and inter-layer predictions for HEVC scalable extension", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC)》 * |
MARTIN WINKEN, DETLEV MARPE, HEIKO: "BIT-DEPTH SCALABLE VIDEO CODING", 《IMAGE PROCESSING》 * |
TIAN HONGXIAN; YANG WEI;ZHEN HAIBO;YANG GONGXUN: "Full Direction Search (FDS) Based Fast Motion Estimation Algorithm for Video Encoding in Coalmining Underground", 《EXTENDED SPATIAL SCALABILITY WITH PICTURE-LEVEL ADAPTATION》 * |
巫戈明,孙立峰,钟玉琢: "基于多层LDPC的分布式视频编码", 《小型微型计算机系统》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11012717B2 (en) | 2012-07-09 | 2021-05-18 | Vid Scale, Inc. | Codec architecture for multiple layer video coding |
CN110035286B (zh) * | 2012-07-09 | 2021-11-12 | Vid拓展公司 | 用于多层视频编码的编解码器架构 |
US11627340B2 (en) | 2012-07-09 | 2023-04-11 | Vid Scale, Inc. | Codec architecture for multiple layer video coding |
WO2022166462A1 (zh) * | 2021-02-08 | 2022-08-11 | 华为技术有限公司 | 编码、解码方法和相关设备 |
WO2024093305A1 (zh) * | 2022-10-31 | 2024-05-10 | 华为技术有限公司 | 图像编解码方法和装置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104429071B (zh) | 用于多层视频编码的编解码器架构 | |
CN105706451B (zh) | Hevc扩展的高级句法 | |
CN104685877B (zh) | 用于多层视频编码的自适应上采样 | |
AU2014362246B2 (en) | Color gamut scalable video coding device and method for the phase alignment of luma and chroma using interpolation | |
CN105765979B (zh) | 用于可缩放视频编码的层间预测 | |
CN105122805B (zh) | 针对多层视频编码的层间参考图片增强的设备 | |
CN105874804A (zh) | 针对hevc扩展的子比特流提取过程 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240812 Address after: Delaware, USA Patentee after: Interactive Digital VC Holdings Country or region after: U.S.A. Address before: Delaware, USA Patentee before: VID SCALE, Inc. Country or region before: U.S.A. |
|
TR01 | Transfer of patent right |