CN108718411B - 图像解码方法和使用其的装置 - Google Patents

图像解码方法和使用其的装置 Download PDF

Info

Publication number
CN108718411B
CN108718411B CN201810569672.2A CN201810569672A CN108718411B CN 108718411 B CN108718411 B CN 108718411B CN 201810569672 A CN201810569672 A CN 201810569672A CN 108718411 B CN108718411 B CN 108718411B
Authority
CN
China
Prior art keywords
layer
dependency
inter
prediction
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810569672.2A
Other languages
English (en)
Other versions
CN108718411A (zh
Inventor
亨得利·亨得利
朴俊永
金哲瑾
全柄文
金廷宣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN108718411A publication Critical patent/CN108718411A/zh
Application granted granted Critical
Publication of CN108718411B publication Critical patent/CN108718411B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/29Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving scalability at the object level, e.g. video object layer [VOL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Abstract

本发明公开了图像解码方法和使用其的装置。本发明涉及用于解码图像、用于解码包括多个层的比特流的方法和装置。该图像解码方法可以包括:接收和识别指示是否上层通过与下层相同的编译方法编译的依赖性信息的步骤;和基于识别的依赖性信息恢复上层的图像的步骤。因此,可以识别指示当前层参考的参考层的信息是否是编译的数据或者恢复值的信息。

Description

图像解码方法和使用其的装置
本申请是2015年3月9日提交的国际申请日为2013年9月9日、申请号为201380046742.1(PCT/KR2013/008119)、发明名称为“图像解码方法和使用其的装置”专利申请的分案申请。
技术领域
本发明涉及视频压缩技术,尤其是,涉及用于执行可分级的视频编译(SVC)的方法和装置。
背景技术
近年来,对高分辨率和高质量视频的需要已经在各种各样的应用领域中越来越增长。由于图片具有更高的分辨率和更高的质量,有关图片的信息量也增长。
随着数据量的增长,引入具有各种各样环境的多功能设备和网络。随着具有各种各样性能的装置和具有各种各样环境的网络的发展,相同的内容可以以不同的质量等级使用。
特别地,由于终端能够支持各种的图片质量,并且建立各种各样的网络环境,在一个环境下允许具有常规质量的图片,而在另一个环境下更高质量的图片是可用的。
例如,已经经由移动终端购买视频内容的用户可以在他的或者她的家庭中,在具有更高分辨率的大屏幕显示器上欣赏视频内容。
近年来,由于高分辨率(HD)广播服务是可用的,大量的用户习惯于高分辨率和高质量的视频,并且服务提供者和服务用户也关注具有比HDTV高四倍分辨率的超高分辨率(UHD)服务。
因此,存在基于有关大容量视频的高效率的编码和解码方法对提供视频质量可分级性,例如,图像质量、分辨率、视频的大小和帧速率,以便在不同的环境下对用户的需求提供变化的视频服务质量的需要。
发明内容
技术问题
本发明的一个目的是提供一种用于使用有关另一个层的信息预测当前层的方法,和一种使用其的装置。
本发明的另一个目的是提供一种用于接收和识别指示有关当前层所参考的参考层的信息是否是编译的数据或者重建值的信息的装置,和使用其的方法。
本发明的再一个目的是提供一种当通过不同的编译方案编译的视频被解码时用于识别层间依赖性类型的方法,和一种使用其的装置。
技术解决方案
根据本发明的一个方面,提供了一种解码包括多个层的比特流的视频解码方法,该视频解码方法包括:接收和识别指示是否上层通过与下层相同的编译方法编译的依赖性信息;和基于识别的依赖性信息重建上层的视频。
依赖性信息可以包括指示上层是否参考有关下层的编译的数据的信息。
编译的数据可以包括相对于下层的视频的运动信息、块分割和残留的至少一个。
上层的视频的重建可以包括分析有关下层的编译的数据;和通过参考运动信息预测上层的视频的运动。
依赖性信息可以包括表示上层是否参考有关下层的重建数据的信息。
重建数据可以包括下层的视频的上采样的采样值。
上层的视频的重建可以包括通过参考采样值预测上层的视频。
依赖性信息在比特流的视频参数集中被包括和接收。
依赖性信息在比特流的片头中被包括和接收。
根据本发明的另一个方面,提供了一种解码包括多个层的比特流的视频解码装置,该视频解码装置包括:依赖性信息识别模块,接收和识别指示是否上层通过与下层相同的编译方法编译的依赖性信息;和上层解码模块,基于识别的依赖性信息重建上层的视频。
有益的效果
根据本发明的一个实施例,提供了一种用于使用有关另一个层的信息预测当前层的方法,和一种使用其的装置。
根据本发明的一个实施例,提供了一种用于接收和识别指示有关当前层所参考的参考层的信息是否是编译的数据或者重建值的信息的装置,和使用其的方法。
根据本发明的一个实施例,提供了一种当通过不同的编译方案编译的视频被解码时用于识别层间依赖性类型的方法,和一种使用其的装置。
附图说明
图1是示意地图示根据本发明的一个实施例的支持可分级性的视频编码装置的方框图。
图2是示意地图示根据本发明的一个实施例的支持可分级性的视频解码装置的方框图。
图3图示根据本发明的一个实施例的参考层和使用有关参考层信息的增强层。
图4图示根据本发明的另一个实施例的参考层和使用有关参考层信息的增强层。
图5图示根据本发明的再一个实施例的参考层和使用有关参考层信息的增强层。
图6是图示根据本发明的一个实施例的视频编码装置的方框图。
图7是图示根据本发明的一个实施例的视频解码装置的方框图。
图8是图示根据本发明的一个实施例的视频解码方法的流程图。
具体实施方式
本发明可以以各种各样的形式不同地修改,并且其特定的实施例将在该附图中描述和示出。但是,这些实施例不意欲限制本发明。在以下的描述中使用的术语仅仅用于描述特定的实施例,但是,不意欲限制本发明。单数的表示包括多数表示,只要其清楚不同地读取。该术语,诸如“包括”和“具有”意欲表示存在在以下的描述中使用的特点、数目、步骤、操作、单元、组件,或者其组合,并且因此,应该理解,不排除存在或者增加一个或多个不同的特点、数目、步骤、操作、单元、组件,或者其组合的可能性。
另一方面,在本发明描述的附图中的单元在图像编码/解码装置中为解释不同的特定功能的便利的目的独立地绘制,并且不意味该单元由单独的硬件或者单独的软件实施。例如,该单元的两个或更多个单元可以合并以形成单个单元,或者一个单元可以被分成多个单元。不脱离本发明的概念,该单元被合并和/或分解的实施例属于本发明的范围。
在下文中,本发明示范的实施例将参考伴随的附图详细描述。在该附图中类似的组成将由类似的参考数字引用,并且不会重复地描述。
在支持可分级性的视频编译方法(在下文中,称为“可分级编译”)中,输入信号可以通过层处理。取决于层,输入信号(输入视频)可以在分辨率、帧速率、位深度、颜色格式和长宽比的至少一个方面彼此不同。
在本说明书中,可分级编译包括可分级的编码和可分级的解码。
在可分级的编码/解码中,有可能通过使用层间差别,也就是说,基于可分级性,执行层间预测,来减少重复传输/信息的处理,并且提高压缩效率。
图1是示意地图示根据本发明的一个实施例的支持可分级性的视频编码装置的方框图。
参考图1,视频编码装置100包括用于层1的编码模块105和用于层0的编码模块135。
层0可以是基本层、参考层或者下层,并且层1可以是增强层、当前层或者上层。
用于层1的编码模块105包括预测模块110、变换/量化模块115、滤波模块120、解码图片缓存器(DPB)125、熵编码模块130和多路复用器(MUX)165。
用于层0的编码模块135包括预测模块140、变换/量化模块145、滤波模块150、DPB155,和熵编码模块160。
预测模块110和140可以对输入视频执行中间预测和内部预测。预测模块110和140可以通过预先确定的处理单元执行预测。用于预测的处理单元可以是编码单元编译单元((CU))、预测单元((PU)),或者可以是变换单元((TU))。
例如,预测模块110和140可以确定是否由CU实施中间预测或者内部预测,可以由PU确定预测模式,并且可以由PU或者TU执行预测。要执行的预测包括预测块的结构和残留块(残留信号)的结构。
在中间预测中,预测可以基于有关当前图片的先前图片和/或后续图片的至少一个的信息执行以构造预测块。在内部预测中,预测可以基于在当前图片中的像素信息执行以构造预测块。
中间预测模式或者方法的示例包括跳过模式、合并模式、运动矢量预测器(MVP)模式。在中间预测中,用于要预测的当前PU的参考图片可以被选择,并且对应于当前PU的参考块可以从参考图片中选择。预测模块110和140可以基于参考块构造预测块。
预测块可以被构造为整数采样单元或者作为分数像素单元。在这里,运动矢量也可以以分数像素表示。
在中间预测中的运动信息,也就是说,诸如参考图片的索引、运动矢量和残留信号的信息,被熵编码,并且发送给视频解码装置。当适用跳过模式的时候,残留信号可以完全不被生成、变换、量化和发送。
在内部预测中,预测模式可以包括33个方向预测模式,和至少2个无方向模式。无方向模式可以包括DC预测模式和平面模式。在内部预测中,在滤波适用于参考采样之后,可以构造预测块。
PU可以是具有各种各样大小和形状的块。例如,在中间预测中,PU可以是2N×2N、2N×N、N×2N或者N×N块(这里N是整数)。在内部预测中,PU可以是2N×2N或者N×N块(这里N是整数)。具有N×N大小的PU可以被设置为仅仅适用于特定的情形。例如,具有N×N大小的PU可以被设置为仅仅用于最小的CU,或者仅仅用于内部预测。除了具有以上提及大小的PU之外,PU可以进一步定义为供使用的N×mN块、mN×N块、2N×mN块,或者mN×2N块(这里m<1)。
预测模块110可以使用有关层0的信息执行对于层1的预测。在本说明书中,为了方便起见,使用另一个层信息预测当前层信息的过程定义为层间预测。
使用另一个层信息预测的(也就是说,通过层间预测预测的)当前层信息可以包括纹理、运动信息、单元信息、预先确定的参数(例如,滤波器参数)等等。
用于预测当前层信息(也就是说,用于层间预测)的另一个层信息可以包括纹理、运动信息、单元信息、预先确定的参数(例如,滤波器参数)等等。
作为层间预测的一个示例,层间运动预测也称为层间中间预测。根据层间中间预测,用于层1(当前层或者增强层)的当前块的预测可以使用有关层0(参考层或者基本层)的运动信息实现。
当采用层间中间预测的时候,有关参考层的运动信息可以被分级。
作为层间预测的另一个示例,层间纹理预测也称为层间内部预测或者内部基本层(BL)预测。当在参考层中的参考块由内部预测重建的时候,可以采用层间纹理预测。
层间内部预测可以将在参考层中参考块的纹理作为用于在增强层中当前块的预测值使用。在这里,参考块的纹理可以通过上采样分级。
作为层间预测的再一个示例,层间单元参数预测可以推导有关基本层的单元信息(CU、PU和/或TU)用作有关增强层的单元信息,或者基于有关基本层的单元信息确定有关增强层的单元信息。
单元信息可以包括在每个单元级别中的信息。例如,CU信息可以包括有关分割(CU、PU和/或TU)的信息、有关变换的信息、有关预测的信息,和有关编译的信息。PU信息可以包括有关PU分割的信息和有关预测(例如,运动信息和有关预测模式的信息)的信息。TU信息可以包括有关TU分割的信息和有关变换(变换系数和变换方法)的信息。
单元信息可以仅仅包括有关处理单元(例如,CU、PU、TU等等)的分割信息。
作为层间预测的又一个示例,层间参数预测可以推导在基本层中使用的参数供增强层重复使用,或者可以基于在基本层中使用的参数预测用于增强层的参数。
虽然层间纹理预测、层间运动预测、层间单元信息预测和层间参数预测已经在上面作为层间预测图示,但是替换的层间预测也可以适用于本发明,而不受限于此。
例如,预测模块110可以使用有关另一个层的残留信息作为层间预测实施预测当前层的残留的层间残留预测,并且基于该残留执行用于在当前层中当前块的预测。
此外,预测模块110可以使用在通过上采样或者下采样当前层的重建图片获得的图片和另一个层的重建图片之间差分的图片,作为层间预测实施执行用于在当前层中当前块预测的层间差分的预测。
另外,作为层间预测,预测模块110可以采用用于使用有关另一个层的语法信息预测或者产生当前块纹理的层间语法预测。在这里,有关用于当前块预测的参考层的语法信息可以是有关内部预测模式、运动信息等等的信息。
在这里,层间语法预测可以通过参考来自在内部预测模式适用于的参考层中的块(内部)的内部预测模式,以及通过参考来自于中间预测模式适用于的块(MV)的运动信息来执行。
例如,虽然参考层是P片或者B片,但是在该片中的参考块可以是经受内部预测模式的块。在这种情况下,当适用层间语法预测的时候,产生/预测当前块纹理的层间预测可以使用有关参考层的语法信息的参考块的内部预测模式来执行。
在先前的各种层间预测方法之中的多个方法可以用于预测特定的块。例如,为了预测当前块,可以另外使用有关相应的层0或者相应的块的单元信息、滤波参数信息等等,同时使用有关层0的预测信息。层间预测方法的这种组合也可以适用于将在本说明书中下面提及的预测。
变换/量化模块115和145可以通过TU变换残留块,以生成变换系数并且可以量化该变换系数。
变换块是相同的变换适用于的采样的矩形块。变换块可以是TU,并且可以具有四树结构。
变换/量化模块115和145可以基于适用于残留块的预测模式和变换块的大小执行变换以生成二维(2D)的变换系数阵列。例如,当内部预测适用于残留块,并且该残留块具有4×4阵列的时候,残留块可以被使用离散正弦变换(DST)变换。另外,残留块可以被使用离散余弦变换(DCT)变换。
变换/量化模块115和145可以量化变换系数,以生成量化的变换系数。
变换/量化模块115和145可以将量化的变换系数发送给熵编译模块130和160。在这里,变换/量化模块115和145可以以预先确定的扫描顺序将2D阵列的量化的变换系数重新排列为一维的(1D)阵列,并且可以将重新排列的1D阵列发送给熵编译模块130和160。变换/量化模块115和145可以无需被变换/量化而将基于残留块和预测块产生的重建的块发送给用于中间预测的滤波模块120和150。
必要时,变换/量化模块115和165可以跳过变换,并且仅仅执行量化,或者可以跳过变换和量化两者。例如,变换/量化模块115和165可以跳过用于涉及特定的预测方法,或者具有特定的大小的块,或者涉及特定的预测块并且具有特定大小的块的变换。
熵编译模块130和180可以对量化的变换系数执行熵编码。编码方法,诸如指数Golomb编译和上下文自适应二进制运算编译(CAVLC)可以用于熵编码。
滤波模块120和150可以将去块滤波、自适应环路滤波(ALF),或者采样自适应偏移(SAO)适用于重建的图片。
去块滤波可以在重建的图片中除去在块之间的边界上产生的块失真。ALF可以基于将原始图片与重建的图片(其中块由去块滤波进行滤波)比较的结果值执行滤波过程。SAO可以通过在已经经历去块滤波的残留块和原始图片之间的像素重建偏移差值,并且以带偏移、边缘偏移等等的形式适用。
滤波模块120和150可以不适用去块滤波、ALF和SAO的全部,而是可以仅仅适用去块滤波、可以仅仅适用去块滤波和ALF,或者可以仅仅适用去块滤波和SAO。
DPB 125和155可以从滤波模块120和150接收和存储重建的块或者重建的图片。DPB 125和155可以将重建的块或者图片提供给执行中间预测的预测模块110和140。
从用于层0的熵编译模块160输出的信息和从用于层1的熵编译模块130输出的信息可以由MUX 165多路复用,并且可以作为比特流输出。
虽然用于层1的编码模块105为了方便起见已经描述为包括MUX 165,但是MUX可以是与用于层1的编码模块105和用于层0的编码模块135无关的设备或者模块。
图1的编码装置可以被配置为包括相机的能够捕捉和编码图像的电子装置。例如,该编码装置可以被配置为或者包括在电子装置,诸如电视、计算机系统和包括移动电话或者平板PC的便携式电子设备中。
图2是图示在执行根据本发明可分级编译的视频解码装置中的层间预测示例的方框图。
参考图2,视频解码装置200包括用于层1的解码模块210和用于层0的解码模块250。
层0可以是基极层、参考层或者下层,并且层1可以是增强层、当前层或者上层。
用于层1的解码模块210可以包括熵解码模块215、重新排列模块220、去量化模块225、反变换模块230、预测模块235、滤波模块240,和存储器245。
用于层0的解码模块250可以包括熵解码模块255、重新排列模块260、去量化模块265、反变换模块270、预测模块275、滤波模块280,和存储器285。
当包括视频信息的比特流被从视频编码装置发送的时候,多路分解器(DEMUX)205可以按层多路分解信息,并且可以按层将信息发送给解码器。
熵解码模块215和255可以执行对应于在视频编码装置中使用的熵编码方法的熵解码。例如,当在视频编码装置中使用CABAC的时候,熵解码模块215和255可以使用CABAC执行熵解码。
在由熵解码模块215和255解码的信息之中用于构造预测块的信息可以提供给预测模块235和275,并且由熵解码模块215和255熵解码的残留值,即,量化的变换系数,可以输入给重新排列模块220和260。
重新排列模块220和260可以基于在视频编码装置中使用的重新排列方法重新排列由熵解码模块215和255熵解码的比特流的信息,即,量化的变换系数。
例如,重新排列模块220和260可以将1D阵列的量化的变换系数重新排列回为2D阵列的系数。重新排列模块220和260可以基于适用于当前块(变换块)的预测模式和/或变换块的大小执行扫描,以构造2D阵列的系数(量化的变换系数)。
去量化模块225和265可以基于从视频编码装置发送的量化参数和块的重新排列的系数执行去量化以生成变换系数。
反变换模块230和270可以对变换系数执行由视频编码装置的变换模块执行的变换的反变换。反变换模块230和270可以执行由视频编码装置执行的DCT和DST的反DCT和/或反DST。
在视频编码装置中,DCT和/或DST可以取决于多条信息,诸如预测方法、当前块的大小和预测方向有选择地执行,并且视频解码装置的反变换模块230和270可以基于由视频解码装置使用的变换信息执行反变换。
例如,反变换模块230和270可以取决于预测模式/块大小执行反DCT和反DST。特别地,反变换模块230和270可以对内部预测已经适用于的4×4亮度块执行反DST。
或者,反变换模块230和270可以不考虑预测模式/块大小固定地使用特定的反变换方法。例如,反变换模块230和270可以仅仅将反DST适用于所有变换块。反变换模块230和270也可以仅仅将反DCT适用于所有变换块。
反变换模块230和270可以对变换系数或者变换系数块进行反向地变换以构造残留信号或者残留块。
必要时,或者取决于用于视频编码装置的编码方法,反变换模块230和270可以跳过变换。例如,反变换模块230和270可以跳过用于涉及特定的预测方法,或者具有特定的大小的块,或者涉及特定的预测块并且具有特定大小的块的变换。
预测模块235和275可以基于从熵解码模块215和255提供的预测块构造信息,和有关预先解码的块的信息,和/或从存储器245和285提供的图片来构造当前块的预测块。
当用于当前块的预测模式是内部预测模式的时候,预测模块235和275可以基于有关在当前图片中像素的信息对当前块执行内部预测。
当用于当前块的预测模式是中间预测模式的时候,预测模块235和275可以基于包括在当前图片的先前图片和后续图片的至少一个中的信息对当前块执行中间预测。中间预测所必需的部分或者所有运动信息可以基于从视频编码装置接收的信息推导。
当跳过模式用作中间预测模式的时候,残留可以不从视频编码装置发送,并且预测块可以用作重建块。
用于层1的预测模块235可以仅仅使用在层1中的信息执行中间预测或者内部预测,并且可以使用有关另一个层(层0)的信息执行层间预测。
例如,用于层1的预测模块235可以使用有关层1的信息、有关层1的纹理信息、有关层1的单元信息和有关层1的参数信息的一个执行用于当前块的预测。
用于层1的预测模块235可以从用于层0的预测模块275接收有关层1的运动信息,并且可以执行运动预测。层间运动预测也称为层间中间预测。通过层间运动预测,用于在当前层(增强层)中当前块的预测可以使用有关参考层(基本层)的运动信息执行。必要时,预测模块235可以分级和使用有关参考层的运动信息。
用于层1的预测模块235可以从用于层0的预测模块275接收有关层1的纹理信息,并且可以执行纹理预测。纹理预测也称为层间内部预测或者内部基本层(BL)预测。当在参考层中的参考块由内部预测重建的时候,可以采用纹理预测。或者,纹理预测可以指的是参考层分配的参考索引。
在层间内部预测中,在参考层中的参考块的纹理可以用作用于在增强层中当前块的预测值。在这里,参考块的纹理可以通过上采样分级。
用于层1的预测模块235可以从用于层0的预测模块275接收有关层0的单元参数信息,并且可以执行单元参数预测。通过单元参数预测,有关基本层的单元(CU、PU和/或TU)信息可以用作有关增强层的单元信息,或者有关增强层的单元信息可以基于有关基本层的单元信息确定。
用于层1的预测模块235可以从用于层0的预测模块275接收有关层0的滤波参数信息,并且可以执行参数预测。通过参数预测,用于基本层的参数可以被推导为对于增强层重复使用,或者用于增强层的参数可以基于用于基本层的参数被预测。
在先前的各种层间预测方法之中的多个方法可以用于预测特定的块。例如,为了预测当前块,可以另外使用有关相应的层0或者相应的块的单元信息、滤波参数信息等等,同时使用有关层0的预测信息。层间预测方法的这种组合也可以适用于将在本说明书中下面提及的预测。
加法器290和295可以使用由预测模块235和275构造的预测块和由反变换模块230和270构造的残留块构造重建块。在这种情况下,加法器290和295可以被认为是构造重建块的单独的模块(重建块构造模块)。
由加法器290和295重建的块和/或图片可以提供给滤波模块240和280。
参考图2,用于层1的滤波模块240可以使用从用于层0的预测模块和/或用于层1的滤波模块280发送的参数信息对重建的图片执行滤波操作。例如,用于层1的滤波模块240可以对层1执行滤波操作,或者使用从适用于层0的滤波参数预测的参数执行层间滤波操作。
存储器245和285可以存储重建的块或者图片用作参考图片或者参考块。存储器245和285可以经由预先确定的输出模块(未示出)或者显示器(未示出)输出在存储器245和285中存储的重建的图片。
虽然图2图示重新排列模块、去量化模块和反变换模块作为单独的模块,但是视频解码装置也可以被配置为允许去量化/反变换模块作为单个模块,以连续地执行类似图1的视频编码装置的重新排列、去量化和反变换。
虽然图1和2图示了预测模块,但是用于层1的预测模块可以包括使用有关另一个层(层0)的信息执行预测过程的层间预测模块,和无需使用有关另一个层(层0)的信息执行预测过程的中间/内部预测模块。
图2的解码装置可以被配置为能够再现图像或者再现和显示图像的各种电子装置。例如,解码装置可以被配置为或者包括在电子装置,诸如机顶盒、电视、计算机系统和包括移动电话或者平板PC的便携式电子设备中。
在编码和解码在比特流中支持多个层的视频时,即可分级编译,在多个层之间存在强的相关性。因此,当使用该相关性执行预测的时候,数据的冗余元素可以被除去,并且视频编码性能可以被增强。预测当前层为使用有关另一个层的信息预测在下面定义为层间预测。在下文中,可分级的视频编译指的是在编码时的可分级的视频编码,和在解码时的可分级的视频解码。
多个层可以在分辨率、帧速率和颜色格式的至少一个方面相互不同,并且可以执行层的上采样或者下采样以在层间预测中调整分辨率。
图3图示根据本发明的一个实施例的基本层,即,参考层,和使用有关参考层信息的增强层。
第一增强层320可以指的是有关参考层310的编译的数据,诸如包括运动矢量、块分割和残留的运动信息。也就是说,编译的数据可以指的是从编码装置发送的语法和语义信息。
此外,如图示的,第二增强层330可以指的是有关参考层310和第一增强层320的编译的数据,诸如运动矢量、块分割和残留。
第二增强层330可以指的是仅仅参考层310,或者仅仅第一增强层320。
如图3所示,当增强层参考有关下层的信息的时候,可以考虑有关参考层的编译的块或者编译的图片信息的依赖性。例如,增强层的运动预测可以通过参考运动信息,诸如运动矢量,来执行。
在本发明中,依赖性可用于表示有关用于解码诸如增强层的上层的下参考层信息的使用、在其间的关系,或者在特定的可分级性类型中参考下层的参考类型。依赖性需要清楚地示意以用于层间预测。
编译的数据不需要解码,并且解码装置可以经由分析获得编译的数据。由于分析是必要的,所以参考层和参考参考层的增强层需要通过相同的编解码方案编译。
在本发明中,编解码方案指的是用于编译视频和解码编码视频的方案,并且视频通常可以根据预先确定的标准使用相同的方案编译和解码。当前可用的编解码方案包括H.264/运动图像专家组(MPEG)高级视频编译(AVC)、高效视频编译(HEVC)可分级扩展等等。
H.264/MPEG-4部分10或者AVC是一种视频压缩标准,其是用于视频内容的记录、压缩和发布的当前最普遍使用的格式的一个,并且具有高的数据压缩能力。这个标准是通过由国际电信联盟电信标准化部门(ITU-T)视频编译专家组(VCEG)与作为联合视频组(JVT)的国际标准化组织(ISO)/国际电子技术委员会(IEC)运动图像专家组(MPEG)一起实施标准化开发的。因此,ITU-T H.264标准和ISO/IEC MPEG-4 AVC标准(形式上,ISO/IEC 14496-10–MPEG-4部分10,高级视频编译)具有相同的技术内容。该标准的草稿出现于2003年5月。
高效视频编译(HEVC)是继H.264/MPEG-4 AVC之后开发的下一代视频编码技术。ISO/IEC MPEG和ITU-T VCEG开发H.264/MPEG-4 AVC,在2003年1月建立有关视频编码(JCT-VC)的联合合作组,并且目前正在开发HEVC。HEVC的标准化已经完结。主要属性被定义,并且可分级视频编译和三维(3D)视频编译技术正在基于该主要属性进行开发。
ITU于2013年1月25日在瑞士日内瓦公布HEVC已经批准作为最终的下一代草案标准。HEVC具有ISO/IEC 23008-2的ISO/IEC标准编号,并且当前处于最终草案国际标准(FDIS)状态之中。ISO/IEC标准编号于2013年4月13日颁布为H.265。
图1的用于层1,即,增强层的编码模块105和用于图2的增强层的解码模块210可以互相配对以处理由相同的编解码方案编译的视频,并且图1的用于层0,即,参考层的编码模块135和用于图2的参考层的解码模块250可以互相配对以处理由相同的编解码方案编码的视频。
当使用不同的编解码方案的时候,用于分析信息的分析方案是不同的,并且因此,需要分析的编译的数据对于由不同的编解码方案编码的视频不可以被参考。
因此,当如在图3中存在有关编码数据的层间依赖性的时候,参考层和参考参考层的增强层需要通过相同的编解码来编译。因此,有关编译的数据的层间依赖性信息可以是表示被参考的层和进行参考的层是否通过相同的编码模式编译的信息,也就是说,是否使用相同的编解码方案。
例如,当参考层根据H.264/MPEG AVC编译的时候,增强层也需要通过H.264/MPEGAVC编码,使得增强层使用有关参考层的编译的信息。
如果参考层根据H.264/MPEG AVC编译,并且参考参考层的增强层通过HEVC可分级扩展,而不是H.264/MPEG AVC编译,则增强层不能参考有关参考层的编译的数据,因为解码两个层的解码装置的分析模块具有不同的结构。
当存在有关解码的数据的层间依赖性的时候,按层执行单独的解码的单环解码是可可能的。
同时,存在有关重建值而非有关编译的数据的层间依赖性。
图4图示根据本发明的另一个实施例的基本层,也就是说,参考层410,和使用有关参考层410信息的增强层420。
增强层420可以参考有关参考层410的重建数据,即,参考图片的像素值或者采样值,或者经由解码重建的参考块,或者经由重建过程获得的数据。该重建数据可以对应于如图4所示的增强层的图片的大小被上采样。
有关重建采样值的信息可以用于增强层420的纹理预测,也就是说,采样预测。
虽然未示出,但是额外的增强层可以如图3所示呈现,而在这样的情况下,额外的增强层可以参考重建数据,诸如参考层和更低的增强层的至少一个的像素值。
当存在如在图4中呈现的有关重建数据的层间依赖性的时候,参考层的参考图片如何被编译,即,编译方法或者编解码方案,不是增强层参考参考层所必需的。也就是说,虽然增强层和参考层通过不同的编解码方案编译并且经历解码,但是当仅仅呈现供参考的重建数据的时候可以建立层间依赖性。
因此,与有关编译的数据的依赖性相比较,当存在有关重建数据的层间依赖性的时候,即使不同的编解码方案用于该层,增强层也能够参考参考层。
当存在有关重建数据的层间依赖性的时候,为了解码增强层需要有关参考层的解码信息,并且因此,需要多环解码。
如上所述,取决于是否增强层参考有关参考层的编译的数据或者重建数据,编解码方案的同一性可能影响层间依赖性。
也就是说,解码装置可以使用用于由不同的编解码方案编译的层的预测的编译的数据,并且使用用于由相同的编解码结构编译的层的编译的数据和重建数据。
本发明提供能够清楚地示意依赖性关系,并且基于示意的依赖性关系执行层间预测的解码装置。
图5图示根据本发明的再一个实施例的参考层和使用有关参考层信息的增强层。
如在图5中图示的,参考层510可以根据第一编解码方案,例如,H.264/MPEG AVC被编译,并且第一增强层520和第二增强层530可以根据第二编解码方案,例如,HEVC分级扩展被编译。
用于编码层的方案不局限于图5,并且第一增强层和第二增强层也可以通过不同的编解码方案编译。
参考图5,层间依赖性取决于编解码方案明显地变化。不管在编解码方案方面的差别,第一增强层520可以使用有关由第一编解码方案编译的参考层510的重建信息,并且因此,重建的数据依赖性在第一增强层520和参考层510之间呈现。也就是说,由于第一增强层520和参考层510由不同的编解码方案编译,在两个层之间没有编译数据依赖性。
相反地,由于第二增强层530通过与用于第一增强层520相同的编解码方案编译,所以第二增强层530可以参考有关第一增强层520的编译的数据和重建数据两者。也就是说,第二增强层530可以具有有关在第一增强层520上的重建数据和编译的数据两者的直接依赖性。
由于第二增强层530通过与用于参考层510不同的方案编码,所以第二增强层530不具有有关在参考层510上编译的数据的依赖性,而是具有有关在参考层510上重建数据的依赖性。
总之,考虑有关编译的数据的依赖性和有关重建数据的依赖性作为不同类型的依赖性,取决于用于编译相应的层的编解码方案,可以在层之中建立不同类型的依赖性。在图5中,第一增强层520具有有关在参考层510上重建数据的直接依赖性,并且第二增强层530具有有关在第一增强层520上重建数据和编译的数据的直接依赖性。第二增强层530可以具有有关在参考层510上重建数据的直接依赖性。
当如上所述上层在参考下层时具有不同类型的依赖性的时候,信令依赖性是重要的,使得解码装置准确地识别依赖性,并且执行解码。
图6是图示根据本发明的一个实施例的视频编码装置的方框图。
如图6所示,根据当前的实施例的编码装置包括第一编码模块610、第二编码模块620和依赖性信息生成模块630。
第一编码模块610可以对应于在图1的视频编码装置中用于编码层0的编码模块135,并且第二编码模块620可以对应于在图1的视频编码装置中用于编码层1的编码模块105。
第一编码模块610和第二编码模块620执行每层的视频的预测、变换和熵编译,并且其描述大体上与参考图1提及的编码装置的相同,并且因此,在此处被省略。
除了两个层之外,该编码装置还可以编码三个以上的层,并且在这种情况下,可以进一步包括第三编码模块和第四编码模块。
根据当前的实施例的依赖性信息生成模块630产生表示当层由编码模块610和620编码的时候参考哪个信息层的依赖性信息。该依赖性信息生成模块630可以是包括在第一编码模块610中的一部分,或者包括在第二编码模块620中的一部分。或者,该依赖性信息生成模块630可以被设计为包括在编码模块610和620的每个中。也就是说,虽然为了描述方便起见,依赖性信息生成模块630在图中示出为单独的部件,但是依赖性信息生成模块630的物理结构和位置不局限于图6。
类似于其它类型的信息,由依赖性信息生成模块630产生的信息被编码和作为比特流发送给视频解码装置。
表1图示根据本发明的一个实施例,由依赖性信息生成模块630产生的依赖性信息的语法元素。
[表1]
Figure BDA0001685424140000231
参考表1,层间依赖性信息包括和在视频参数集(VPS)中示意。
num_direct_ref_layers[i]指定第i个层直接依赖于的层数。例如,在具有参考层和两个增强层的比特流中,最高的增强层可以具有有关最多两个层的直接依赖性。
ref_layer_id[i][j]表示第i个层直接依赖于的第j个层,并且指定用于识别特定的层参考的参考层的信息。
inter_layer_coded_flag[i][j]是表示当第i个层参考识别为第j个层的层的时候,第i个层是否具有有关在第j个层上的编译的数据的依赖性的标记信息。inter_layer_coded_flag[i][j]等于1表示第i个层具有有关在第j个层上的编译的数据的依赖性,并且inter_layer_coded_flag[i][j]等于0表示第i个层没有有关在第j个层上的编译的数据的依赖性。
inter_layer_reconstructed_flag[i][j]是表示当第i个层参考识别为第j个层的层的时候,第i个层是否具有有关在第j个层上的重建数据的依赖性的标记信息。inter_layer_reconstructed_flag[i][j]等于1表示第i个层具有有关在第j个层上的重建数据的依赖性,并且inter_layer_reconstructed_flag[i][j]等于0表示第i个层没有有关在第j个层上的重建数据的依赖性。
也就是说,先前的标记信息用来直接表示当示意层间参考关系的时候是否上层使用有关下层的编译的信息或者重建信息。当参考关系在层之间建立的时候,该标记信息可以直接表示依赖性类型。
表2图示根据本发明的另一个实施例,由依赖性信息生成模块630产生的依赖性信息的语法元素。
[表2]
Figure BDA0001685424140000251
参考表2,层间依赖性信息包括在片头(slice_header)中并且被示意。也就是说,层间依赖性信息由片产生,并且发送给视频解码装置。
inter_layer_coded_flag[i][j]是表示当编译的树块参考参考层的时候包括在片中的编译的树块是否具有有关在参考层上的编译的数据的依赖性的标记信息。inter_layer_coded_flag[i][j]等于1表示该片具有有关在参考层上的编译的数据的依赖性,并且inter_layer_coded_flag[i][j]等于0表示该片没有有关在参考层上的编译的数据的依赖性。
inter_layer_reconstructed_flag[i][j]是表示当编译的树块参考参考层的时候包括在片中的编译的树块是否具有有关在参考层上的重建数据的依赖性的标记信息。inter_layer_reconstructed_flag[i][j]等于1表示该片具有有关在参考层上的重建数据的依赖性,并且inter_layer_reconstructed_flag[i][j]等于0表示该片没有有关在参考层上的重建数据的依赖性。
图7是图示根据本发明的一个实施例的视频解码装置的方框图。
如在图7中图示的,根据当前的实施例的解码装置包括依赖性信息识别模块710、第一解码模块720和第二解码模块730。
依赖性信息识别模块710基于从视频编码装置接收的比特流识别表示当该层由相应的解码模块720和730编码的时候层参考什么信息的依赖性信息。该依赖性信息识别模块710可以被配置为用于分析比特流的分析模块,或者被配置为用于熵解码比特流的熵解码模块。
依赖性信息识别模块710可以是包括在第一解码模块720中的一部分,或者包括在第二解码模块730中的一部分。或者,依赖性信息识别模块710可以被设计为包括在相应的解码模块720和730中的多个部件。也就是说,虽然为了描述方便起见,依赖性信息识别模块710在图中示出为单独的部件,但是依赖性信息识别模块710的物理结构和位置不局限于图7。
从编码装置接收并且通过依赖性信息识别模块710识别的依赖性信息可以是表示是否上层参考有关下层的编译的数据的信息,例如,其可以是在表1和2中图示的标记信息inter_layer_coded_flag[i][j]。
依赖性信息也可以是表示是否上层参考有关下层的重建数据的信息,例如,其可以是在表1和2中图示的标记信息inter_layer_reconstructed_flag[i][j]。
先前的标记信息可以表示上层参考的下层的依赖性类型。当依赖性信息是inter_layer_coded_flag[i][j],并且具有等于1的标记值的时候,该标记信息可以指定表示上层可以参考有关下层的编译的数据的依赖性类型。
表示有关编译的数据的依赖性的该依赖性信息可以解释为上层和下层通过相同的编解码方案被编译,并且进一步解释为上层可以使用编译的数据,特别地,运动信息,执行运动预测。也就是说,该标记信息可以解释为各种预置的含义。
依赖性信息的标记值等于0可以解释为上层不使用有关下层的编译的数据,或者解释为两个层通过不同的编解码方案被编译。
当依赖性信息是inter_layer_reconstructed_flag[i][j],并且具有等于1的标记值的时候,该标记信息可以指定表示上层可以参考有关下层的重建数据的依赖性类型。该重建数据可以用于上层的纹理预测,也就是说,采样预测。
该依赖性信息可以在如表1的比特流中的视频参数集中,或者在如表2的片头中被包括和接收。
通过依赖性信息识别模块710识别的层间依赖性信息被发送给解码模块720和730,并且该解码模块720和730可以基于该依赖性信息执行层间预测和重建。
第一解码模块720可以对应于在图2的视频解码装置中用于解码层0的解码模块250,并且第二解码模块730可以对应于在图2的视频解码装置中用于解码层1的解码模块210。
第一解码模块720和第二解码模块730执行每层的视频的熵解码、反变换、预测和重建,并且其描述大体上与参考图2提及的解码装置的相同,并且因此,在此处被省略。
除了两个层之外,该解码装置还可以解码三个以上的层,并且在这种情况下,可以进一步包括第三解码模块和第四解码模块。
图8是图示根据本发明的一个实施例的视频解码方法的流程图。根据当前的实施例的视频解码方法在下面参考图8描述。
首先,可以配置为分析模块或者熵解码模块的依赖性信息识别模块识别在比特流中有关参考下层的上层的依赖性信息(S810)。
该依赖性信息可以在视频参数集或者片头中被包括和接收,并且可以是用于表示是否上层以与用于下层相同的编译模式被编译的信息。该依赖性信息可以包括表示有关重建数据或者编译的数据的依赖性的标记信息。
作为识别的结果,当表示有关编译的数据依赖性的标记是1的时候,其指的是上层具有有关下层的编译的数据的依赖性(S820),该依赖性信息识别模块可以随后识别是否上层参考有关下层的重建数据,也就是说,有关重建数据的依赖性(S830)。
因此,当上层具有有关下层的重建数据的依赖性的时候,也就是说,当上层引用有关下层的编译的数据和重建数据两者的时候,用于上层的解码模块可以通过参考有关下层的编译的数据和重建数据两者预测和重建上层的视频(S840)。
在这种情况下,由于表示有关编译的数据的依赖性的标记是1,所以上层和下层被识别为通过相同的编解码方案解码。
在这里,有关下层的编码数据可以是包括相对于下层的视频的运动矢量的运动信息、块分割和残留的至少一个,并且有关下层的重建数据可以是下层的视频的像素值,和/或像素值的上采样值。
解码装置可以分析有关下层的编译的数据,并且重建下层的像素值,以使用编译的数据和像素值用于预测和重建上层。
也就是说,解码装置可以使用下层的重建值执行上层的采样预测,并且使用有关下层的运动信息执行运动预测。
但是,当上层没有有关下层的重建数据的依赖性的时候,也就是说,当上层仅仅参考有关下层的编译的数据的时候,解码装置分析有关下层的编译的数据(S850)。
有关下层的编译的数据可以是包括相对于下层的视频运动矢量的运动信息、块分割和残留的至少一个。
用于解码上层的解码模块可以参考编译的数据和解码执行预测,诸如分割上层的视频以解码和运动补偿,使用残留信息视频的重建(S860)。
在这种情况下,由于表示有关编译的数据的依赖性的标记也是1,所以上层和下层被识别为通过相同的编解码方案解码。
同时,当上层没有有关下层的编译的数据的依赖性的时候(S820),其可以识别是否上层参考有关下层的重建数据,也就是说,有关重建数据的依赖性。在这种情况下,上层和下层可以通过相同的编解码方案或者通过不同的编解码方案编译。
当经由标记信息识别上层参考有关下层的重建数据的时候,也就是说,当上层仅仅参考有关下层的重建数据的时候(S870),用于解码下层的解码模块可以执行用于重建下层视频的解码和上采样(S880)。
解码和/或上采样下层可以在上层解码之前执行,并且有关下层的重建数据,诸如,经由解码产生的像素值,可以存储在存储器,诸如解码图片缓存器(DPB)中。或者,必要时,重建数据可以在解码时被重建和/或上采样。
用于解码上层的解码模块通过参考重建数据预测和重建上层的视频(S890)。
同时,当上层不具有有关下层的编译的数据和重建数据的依赖性的时候,用于解码上层的解码模块可以仅仅使用有关上层的信息执行常规解码(S801)。
如上所述,本发明涉及用于使用有关另一个层的信息预测当前层的方法,并且提供用于接收和识别表示是否有关当前层参考的参考层的信息是编译的数据或者重建值的信息的方法和装置。
因此,当解码通过不同的编译方案模式编译的视频的时候,也可以识别层间依赖性类型。
虽然在以上提及的示范的系统中,该方法已经基于包括一系列的步骤或者模块的流程图描述,本发明不局限于该步骤顺序,并且某个步骤可以以除如上所述或者同时如上所述以外的步骤或者顺序执行。以上提及的实施例可以包括各种各样的示例。因此,本发明包括属于所附的权利要求的所有的替换、修正和改进。

Claims (10)

1.一种由编码装置执行的图像信息编码方法,包括:
确定当前层的层间依赖性类型;
生成指示所述当前层的层间依赖性类型的依赖性信息;以及
编码包括所述依赖性信息的图像信息,
其中,所述依赖性信息指示以下情况中的所述层间依赖性类型:1)表示参考层的第一依赖性类型可用于所述当前层的层间采样预测但不可用于所述当前层的层间运动预测,2)表示所述参考层的第二依赖性类型可用于层间运动预测但不可用于层间采样预测,3)表示所述参考层的第三依赖性类型可用于所述当前层的层间运动预测和层间采样预测。
2.根据权利要求1所述的方法,其中,当所述依赖性信息指示所述第一依赖性类型作为所述层间依赖性类型时,所述参考层中的重建的采样可用于所述当前层的层间预测。
3.根据权利要求1所述的方法,其中,当所述依赖性信息指示所述第二依赖性类型作为所述层间依赖性类型时,所述参考层中的运动信息可用于所述当前层的层间预测。
4.根据权利要求1所述的方法,其中,所述依赖性信息以视频参数集扩展语法来配置。
5.根据权利要求1所述的方法,其中,所述依赖性信息包括编译的数据依赖性标记和重建的数据依赖性标记,
其中,如果所述编译的数据依赖性标记的值为0并且所述重建的数据依赖性标记的值为1,则所述依赖性信息指示所述第一依赖性类型用作所述当前层的层间依赖性类型,
其中,如果所述编译的数据依赖性标记的值为1并且所述重建的数据依赖性标记的值为0,则所述依赖性信息指示所述第二依赖性类型用作所述当前层的层间依赖性类型,以及
其中,如果所述编译的数据依赖性标记的值为1并且所述重建的数据依赖性标记的值为1,则所述依赖性信息指示所述第三依赖性类型用作所述当前层的层间依赖性类型。
6.一种视频编码装置,包括:
依赖性信息生成模块,所述依赖性信息生成模块用于确定当前层的层间依赖性类型,以及用于生成指示所述当前层的层间依赖性类型的依赖性信息,以及
编码模块,所述编码模块用于编码包括所述依赖性信息的图像信息,
其中,所述依赖性信息指示以下情况中的所述层间依赖性类型:1)表示参考层的第一依赖性类型可用于所述当前层的层间采样预测但不可用于所述当前层的层间运动预测,2)表示所述参考层的第二依赖性类型可用于层间运动预测但不可用于层间采样预测,3)表示所述参考层的第三依赖性类型可用于所述当前层的层间运动预测和层间采样预测。
7.根据权利要求6所述的装置,其中,当所述依赖性信息指示所述第一依赖性类型作为所述层间依赖性类型时,所述参考层中的重建的采样可用于所述当前层的层间预测。
8.根据权利要求6所述的装置,其中,当所述依赖性信息指示所述第二依赖性类型作为所述层间依赖性类型时,所述参考层中的运动信息可用于所述当前层的层间预测。
9.根据权利要求6所述的装置,其中,所述依赖性信息包括编译的数据依赖性标记和重建的数据依赖性标记,
其中,如果所述编译的数据依赖性标记的值为0并且所述重建的数据依赖性标记的值为1,则所述依赖性信息指示所述第一依赖性类型用作所述当前层的层间依赖性类型,
其中,如果所述编译的数据依赖性标记的值为1并且所述重建的数据依赖性标记的值为0,则所述依赖性信息指示所述第二依赖性类型用作所述当前层的层间依赖性类型,以及
其中,如果所述编译的数据依赖性标记的值为1并且所述重建的数据依赖性标记的值为1,则所述依赖性信息指示所述第三依赖性类型用作所述当前层的层间依赖性类型。
10.一种用于图像的数据的传输方法,所述方法包括:
获得所述图像的比特流,其中,所述比特流基于确定当前层的层间依赖性类型、生成指示所述当前层的层间依赖性类型的依赖性信息、以及对包括所述依赖性信息的图像信息进行编码来生成;以及
发送包括所述比特流的数据,
其中,所述依赖性信息指示以下情况中的所述层间依赖性类型:1)表示参考层的第一依赖性类型可用于所述当前层的层间采样预测但不可用于所述当前层的层间运动预测,2)表示所述参考层的第二依赖性类型可用于层间运动预测但不可用于层间采样预测,3)表示所述参考层的第三依赖性类型可用于所述当前层的层间运动预测和层间采样预测。
CN201810569672.2A 2012-09-09 2013-09-09 图像解码方法和使用其的装置 Active CN108718411B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261698706P 2012-09-09 2012-09-09
US61/698,706 2012-09-09
PCT/KR2013/008119 WO2014038905A2 (ko) 2012-09-09 2013-09-09 영상 복호화 방법 및 이를 이용하는 장치
CN201380046742.1A CN104604228B (zh) 2012-09-09 2013-09-09 图像解码方法和使用其的装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380046742.1A Division CN104604228B (zh) 2012-09-09 2013-09-09 图像解码方法和使用其的装置

Publications (2)

Publication Number Publication Date
CN108718411A CN108718411A (zh) 2018-10-30
CN108718411B true CN108718411B (zh) 2022-07-15

Family

ID=50237731

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201380046742.1A Active CN104604228B (zh) 2012-09-09 2013-09-09 图像解码方法和使用其的装置
CN201810569159.3A Active CN108769683B (zh) 2012-09-09 2013-09-09 图像解码方法和使用其的装置
CN201810569672.2A Active CN108718411B (zh) 2012-09-09 2013-09-09 图像解码方法和使用其的装置

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN201380046742.1A Active CN104604228B (zh) 2012-09-09 2013-09-09 图像解码方法和使用其的装置
CN201810569159.3A Active CN108769683B (zh) 2012-09-09 2013-09-09 图像解码方法和使用其的装置

Country Status (7)

Country Link
US (1) US9654786B2 (zh)
EP (1) EP2894854A4 (zh)
JP (1) JP6055098B2 (zh)
KR (1) KR102160242B1 (zh)
CN (3) CN104604228B (zh)
HK (2) HK1257972A1 (zh)
WO (1) WO2014038905A2 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI649999B (zh) * 2012-07-09 2019-02-01 美商Vid衡器股份有限公司 視訊編碼方法及視訊編碼系統
US10805605B2 (en) * 2012-12-21 2020-10-13 Telefonaktiebolaget Lm Ericsson (Publ) Multi-layer video stream encoding and decoding
KR20140087971A (ko) * 2012-12-26 2014-07-09 한국전자통신연구원 계층적 비디오 부호화에서 다중참조계층을 적용한 화면간 부/복호화 방법 및 그 장치
US10129550B2 (en) * 2013-02-01 2018-11-13 Qualcomm Incorporated Inter-layer syntax prediction control
US20140254681A1 (en) * 2013-03-08 2014-09-11 Nokia Corporation Apparatus, a method and a computer program for video coding and decoding
US10212437B2 (en) * 2013-07-18 2019-02-19 Qualcomm Incorporated Device and method for scalable coding of video information
KR101869882B1 (ko) * 2013-10-11 2018-06-25 브이아이디 스케일, 인크. Hevc 확장을 위한 하이 레벨 구문

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080008205A (ko) * 2006-07-19 2008-01-23 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
CN101601299A (zh) * 2006-12-14 2009-12-09 汤姆逊许可公司 用位深度可分级性的增强层残差预测对视频数据进行编码和/或解码的方法和设备
CN101888559A (zh) * 2006-11-09 2010-11-17 Lg电子株式会社 用于解码/编码视频信号的方法及装置
CN102257818A (zh) * 2008-10-17 2011-11-23 诺基亚公司 3d视频编码中运动向量的共享

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101040533B (zh) 2004-10-13 2010-10-06 汤姆逊许可公司 复杂性可伸缩的视频编码和解码方法和设备
KR100885443B1 (ko) 2005-04-06 2009-02-24 엘지전자 주식회사 레이어간 예측방식를 사용해 엔코딩된 영상신호를디코딩하는 방법
KR100678911B1 (ko) * 2005-07-21 2007-02-05 삼성전자주식회사 방향적 인트라 예측의 적용을 확장하여 비디오 신호를인코딩하고 디코딩하는 방법 및 장치
US7535383B2 (en) * 2006-07-10 2009-05-19 Sharp Laboratories Of America Inc. Methods and systems for signaling multi-layer bitstream data
US7840078B2 (en) * 2006-07-10 2010-11-23 Sharp Laboratories Of America, Inc. Methods and systems for image processing control based on adjacent block characteristics
US7991236B2 (en) 2006-10-16 2011-08-02 Nokia Corporation Discardable lower layer adaptations in scalable video coding
EP1933564A1 (en) * 2006-12-14 2008-06-18 Thomson Licensing Method and apparatus for encoding and/or decoding video data using adaptive prediction order for spatial and bit depth prediction
WO2008071036A1 (en) * 2006-12-14 2008-06-19 Thomson Licensing Method and apparatus for encoding and/or decoding bit depth scalable video data using adaptive enhancement layer prediction
US8767834B2 (en) * 2007-03-09 2014-07-01 Sharp Laboratories Of America, Inc. Methods and systems for scalable-to-non-scalable bit-stream rewriting
KR20090097015A (ko) * 2008-03-10 2009-09-15 삼성전자주식회사 스케일러블 영상 부호화장치 및 스케일러블 영상복호화장치
US8542748B2 (en) * 2008-03-28 2013-09-24 Sharp Laboratories Of America, Inc. Methods and systems for parallel video encoding and decoding
EP2425626A2 (en) * 2009-05-01 2012-03-07 Thomson Licensing Inter-layer dependency information for 3dv
CN102075766B (zh) * 2009-11-23 2013-01-09 华为技术有限公司 视频编码、解码方法、装置及视频编解码系统
US8705624B2 (en) * 2009-11-24 2014-04-22 STMicroelectronics International N. V. Parallel decoding for scalable video coding
JP2011228059A (ja) 2010-04-16 2011-11-10 Sumitomo Electric Ind Ltd レドックスフロー電池用双極板
US20110274178A1 (en) * 2010-05-06 2011-11-10 Canon Kabushiki Kaisha Method and device for parallel decoding of video data units
EP2661881A4 (en) * 2010-12-29 2016-10-12 Nokia Technologies Oy CODING OF DISPARITY CARD
WO2013009441A2 (en) 2011-07-12 2013-01-17 Vidyo, Inc. Scalable video coding using multiple coding technologies
US20130243100A1 (en) * 2012-03-15 2013-09-19 Mediatek Inc. System and Method for Adaptive Frame Re-compression in Video Processing System
US10205961B2 (en) * 2012-04-23 2019-02-12 Qualcomm Incorporated View dependency in multi-view coding and 3D coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080008205A (ko) * 2006-07-19 2008-01-23 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
CN101888559A (zh) * 2006-11-09 2010-11-17 Lg电子株式会社 用于解码/编码视频信号的方法及装置
CN101601299A (zh) * 2006-12-14 2009-12-09 汤姆逊许可公司 用位深度可分级性的增强层残差预测对视频数据进行编码和/或解码的方法和设备
CN102257818A (zh) * 2008-10-17 2011-11-23 诺基亚公司 3d视频编码中运动向量的共享

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
High efficiency video coding (HEVC) scalable extension draft 3;Jianle Chen;《Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11》;20130802;参见第25-30页 *

Also Published As

Publication number Publication date
HK1257971A1 (zh) 2019-11-01
KR20150054751A (ko) 2015-05-20
US9654786B2 (en) 2017-05-16
JP6055098B2 (ja) 2016-12-27
CN104604228B (zh) 2018-06-29
EP2894854A4 (en) 2016-01-27
HK1257972A1 (zh) 2019-11-01
WO2014038905A3 (ko) 2014-05-01
WO2014038905A2 (ko) 2014-03-13
CN104604228A (zh) 2015-05-06
EP2894854A2 (en) 2015-07-15
KR102160242B1 (ko) 2020-09-25
CN108769683A (zh) 2018-11-06
US20150201203A1 (en) 2015-07-16
CN108718411A (zh) 2018-10-30
JP2015529410A (ja) 2015-10-05
CN108769683B (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
KR20210061991A (ko) 스케일러블 비디오 코딩 및 디코딩 방법과 이를 이용한 장치
CN108718411B (zh) 图像解码方法和使用其的装置
US9955176B2 (en) Efficient and scalable intra video/image coding using wavelets and AVC, modified AVC, VPx, modified VPx, or modified HEVC coding
US10616607B2 (en) Method for encoding video of multi-layer structure supporting scalability and method for decoding same and apparatus therefor
CN111684809B (zh) 基于变换的图像编码方法和用于该方法的装置
US20170155905A1 (en) Efficient intra video/image coding using wavelets and variable size transform coding
JP5993092B2 (ja) 映像復号化方法及びそれを利用する装置
EP2903282A1 (en) Method for sao compensation for encoding inter-layer prediction error and apparatus therefor
EP2866440A1 (en) Image decoding method and apparatus using same
JP6082123B2 (ja) 複数のレイヤをサポートする映像符号化/復号化方法
US9860549B2 (en) Inter-layer prediction method and encoding device and decoding device using same
US20140286415A1 (en) Video encoding/decoding method and apparatus for same
CN105075260B (zh) 编码支持可伸缩性的多层结构视频的方法和解码其的方法以及用于其的装置
WO2013147497A1 (ko) 스케일러블 비디오 코딩에서 샘플 적응적 오프셋 적용 방법 및 이를 이용한 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1257971

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant