CN105247869B - 解码多层视频的方法和设备 - Google Patents

解码多层视频的方法和设备 Download PDF

Info

Publication number
CN105247869B
CN105247869B CN201480029061.9A CN201480029061A CN105247869B CN 105247869 B CN105247869 B CN 105247869B CN 201480029061 A CN201480029061 A CN 201480029061A CN 105247869 B CN105247869 B CN 105247869B
Authority
CN
China
Prior art keywords
layer
current
block
motion information
reference layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480029061.9A
Other languages
English (en)
Other versions
CN105247869A (zh
Inventor
李培根
金柱英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KT Corp
Original Assignee
KT Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KT Corp filed Critical KT Corp
Priority claimed from PCT/KR2014/004680 external-priority patent/WO2014189345A1/ko
Publication of CN105247869A publication Critical patent/CN105247869A/zh
Application granted granted Critical
Publication of CN105247869B publication Critical patent/CN105247869B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Abstract

本发明涉及在多层结构中用于编码视频的方法和用于解码视频的方法以及使用这些方法的设备。根据本发明的用于解码视频的方法包括以下步骤:根据当前层来指定当前层参考位置,当前层参考位置用于指定当前块;根据参考层来指定与当前层的参考位置相对应的参考层参考位置;基于运动信息保存单元的大小,根据参考层参考位置来引出运动信息;以及对所引出的运动信息进行缩放,并且将经缩放的运动信息引出为用于在当前层中恢复图片的运动矢量。

Description

解码多层视频的方法和设备
技术领域
本发明总体上涉及视频压缩技术,并且更具体地涉及用于在多层结构中基于参考层的信息来导出当前层的运动信息的方法。
背景技术
近来,在各个应用领域中对于高分辨率、高质量视频例如HD(高清晰度)视频和UHD(超高清)视频的需求均在增加。由于视频数据具有高分辨率、高质量图像,所以数据量高于现有视频数据。因此,当使用例如现有的有线和无线宽带线路的媒介来传输视频数据或者将视频数据存储于现有存储媒介中时,传输成本和存储成本增加。为了解决这些由高分辨率、高质量视频数据所引起的问题,可以使用高效视频压缩技术。
作为视频压缩技术,存在各种技术,例如:帧间预测技术,用于根据在当前图片之前或之后的图片来预测包括在当前图片中的像素的数目;帧内预测技术,用于使用与包括在当前图片中的像素有关的信息来预测当前图片中的像素的数目;熵编码技术,在熵编码技术中,将最短的码分配给最频繁使用的值,而将最长的码分配给最不常使用的值等。视频数据可以使用这些视频压缩技术进行有效地压缩,并且然后可以进行传输或存储。
同时,随着对于高分辨率视频的需求的增加,对于作为新的视频服务的立体视频内容的需求也正在增加。关于用于有效地提供高分辨率和超分辨率立体视频内容(例如3D视频)的视频压缩技术的讨论正在进行中。
发明内容
技术问题
本发明的目的是提供用于在多层结构的视频编码和解码中有效导出当前层的运动信息的方法和装置。
本发明的另一目的是提供用于在多层结构的视频编码和解码中基于参考层的运动信息来导出当前层的运动信息的方法和装置。
本发明的又一目的是提供用于在多层结构的视频编码和解码中使用当前层的运动信息来恢复当前层的图片的方法和装置,该运动信息基于参考层的运动信息被导出。
技术方案
本发明的实施方式为支持多层结构的视频解码方法和装置。根据本发明的视频解码方法包括:在当前层中指定当前层基准位置,当前层基准位置指定当前块;在参考层中指定与当前层基准位置相对应的参考层基准位置;基于运动信息存储单元的大小,根据参考层基准位置来导出运动信息;以及对所导出的运动信息进行缩放,并且将经缩放的运动信息导出为要被用于在当前层中重建图片的运动矢量。
本发明的另一实施方式为支持多层结构的视频编码方法和装置。根据本发明的视频编码方法包括:在当前层中指定当前层基准位置,当前层基准位置指定当前块;在参考层中指定与当前层基准位置相对应的参考层基准位置;基于运动信息存储单元的大小,根据参考层基准位置来导出运动信息;以及对所导出的运动信息进行缩放,并且将经缩放的运动信息导出为要被用于在当前层中重建图片的运动矢量。
有益效果
根据本发明,可以在多层结构的视频编码和解码中有效地导出当前层的运动信息。
根据本发明,可以在多层结构的视频编码和解码中基于参考层的运动信息来有效地导出当前层的运动信息。
根据本发明,可以在多层结构的视频编码和解码中使用当前层的运动信息来有效地恢复当前层的图片,其中,当前层的运动信息基于参考层的运动信息被导出。
附图说明
图1为示意性地示出根据本发明的实施方式的编码装置的框图;
图2为示意性地示出根据本发明的实施方式的解码装置的框图;
图3为示意性地说明根据本发明的用于在基础层上指定与增强层的样本位置相对应的样本位置的方法的视图;
图4为示意性地说明根据本发明的示例的用于导出存储有运动矢量的位置的方法的视图;
图5为示意性地说明根据本发明的另一示例的用于导出存储有运动矢量的位置的方法的视图;
图6为示意性地说明根据本发明的又一示例的用于导出存储有运动矢量的位置的方法的视图;
图7为示意性地说明根据本发明的再一示例的用于导出存储有运动矢量的位置的方法的视图;以及
图8为示意性地说明根据本发明的用于在多层结构中存储运动信息的方法的视图。
具体实施方式
在下文中,将参照附图来详细描述本发明的实施方式。在对于本发明的实施方式的描述中,如果认为对于相关已知元素或功能的详细描述会使得本发明的主旨不必要地模糊,则将省去对于相关已知元素或功能的详细描述。
在本说明书中,当提及一个元素与另一元素“连接”或“耦接”时,这可以意指一个元素可以与其它元素直接连接或耦接,并且第三元素可以“连接”或“耦接”在这两个元素之间。此外,在本说明书中,当提及“包括”特定元素时,这可以意指不排除特定元素之外的元素,并且在本发明的实施方式中或本发明的技术精神的范围内可以包括另外的元素。
术语例如“第一”和“第二”可以用于描述各个元素,但是元素不受术语的限制。术语仅用于将一个元素与其它元素进行区分。例如,可以在不偏离本发明的范围的情况下将第一元素命名为第二元素。同样地,可以将第二元素命名为第一元素。
此外,在本发明的实施方式中描述的元素模块被独立地示出,以表明不同的和特有的功能,但是这并不意味着每个元素模块均由单独的硬件或软件形成。亦即,为了描述的方便来布置和包括元素模块,并且元素模块中的至少两个可以形成一个元素模块,或者可以将一个元素模块划分成多个元素模块,以执行它们各自的功能。除非其偏离本发明的本质,否则将元素模块进行集成的实施方式和将元素模块分开的实施方式均包括在本发明的范围内。
此外,在本发明中,一些元素并非为用于执行本质功能的本质元素,而可能为仅用于改进性能的可选元素。可以仅使用除了仅用于改进性能的元素以外的用于实现本发明的本质的基本元素来实现本发明,并且仅包括基本元素而不包括仅用于改进性能的可选元素的结构被包括在本发明的范围内。
支持多层比特流的视频编码和解码被称为可调式压缩编码。因为在多个层之间存在强的相关性,所以当使用该相关性来执行预测时,可以移除重复元素并且可以改进视频编码性能。使用关于另一层的信息来预测当前层(其为预测的目标)被称为层间预测。
分辨率、帧速率和颜色格式中至少一者可以在多个层之间有所不同,并且在层间预测期间可以执行对层的重新采样(例如上采样或下采样),以调整分辨率。
图1为示意性示出根据本发明的实施方式的编码装置的框图。
根据本发明的编码装置100包括用于上层的编码单元100a和用于下层的编码单元100b。
可以将上层称为当前层或增强层,并且可以将下层称为参考层或基础层。分辨率、帧速率和颜色格式中至少一者可以在上层与下层之间有所不同。当对于层间预测而言需要改变分辨率时,可以执行层的上采样或下采样。
上层的编码单元100a可以包括划分单元110、预测单元100、帧内预测单元121、帧间预测单元122、层间预测单元123、变换单元130、量化单元140、重新布置单元150、熵编码单元160、解量化单元170、反变换单元180、滤波器单元190、存储器195和多路复用器197。
下层的编码单元100b可以包括划分单元111、预测单元125、帧内预测单元126、帧间预测单元127、变换单元131、量化单元141、重新布置单元151、熵编码单元161、解量化单元171、逆变换单元181、滤波器单元191和存储器196。
可以通过在本发明的实施方式中描述的视频编码方法(该视频编码方法将在下面进行描述)来实现编码单元,但是可以不执行一些部分的操作以减小编码装置的复杂性或者使得能够快速实时地进行编码。例如,当预测单元执行帧内预测时,可以执行从有限数目的帧内预测模式中选择一个模式并且将所选择的一个模式设置为最终的帧内预测模式的方法,以用于进行实时编码,而不是执行使用所有帧内预测模式方法以选择最佳帧内编码方法的方法。在另一示例中,用于帧内预测或帧间预测的预测块可以具有有限的形式。
在编码装置中处理的块的单元可以是用于执行编码的编码单元、用于执行预测的预测单元以及用于执行变换的变换单元。可以将编码单元、预测单元和变换单元分别表示为CU、PU和TU。
划分单元110和划分单元111可以通过以下来对层进行划分:将层图片划分成编码块、预测块和变换块的多个组合,并且通过基于预定的基准(例如成本函数)来选择编码块、预测块和变换块的一个组合。例如,为了将层图片划分成编码单元,可以使用递归树结构例如四叉树结构。在下文本发明的实施方式中,编码块不仅可以意指用于编码的块,而且可以意指用于解码的块。
预测块可以是用于执行预测(例如帧内预测或帧间预测)的单元。用于帧内预测的块可以是具有正方形的形式的块,例如2N×2N或N×N。作为用于帧间预测的块,存在有正方形的形式的块,例如2N×2N或N×N;通过将具有正方形的形式的预测块分成两个而获得的2N×N和N×2N形式的块;以及通过使用非对称运动划分(AMP)的预测块划分方法获得的具有非对称形式的块。变换单元115可以根据预测块的形式来使用不同的变换方法。
编码单元100a和100b的预测单元120和125可以包括用于执行帧内预测的帧内预测单元121和126以及用于执行帧间预测的帧间预测单元122和126。上层的编码单元100a的预测单元120还包括使用与下层有关的信息来对上层执行预测的层间预测单元123。
预测单元120和125可以确定是否针对预测块来执行帧内预测或帧间预测。被执行预测的处理单元可以不同于用于确定预测方法的处理块的单元。例如,当执行帧内预测时,可以基于预测块来确定预测模式,并且可以基于变换块来执行预测处理。所生成的预测块与原始块之间的残差(残差块)可以被输入至变换单元130和131。此外,用于预测的预测模式信息、运动矢量信息等连同残差一起由熵编码单元130进行编码,并且可以被传输至解码装置。
当使用脉冲编码调制(PCM)模式时,原始块可以在预测单元120和125未执行预测的情况下被编码,并且可以被传输至解码单元。
帧内预测单元121和126可以基于定位在当前块(预测目标块)附近的参考像素来生成经帧内预测的块。在帧内预测方法中,帧内预测模式可以具有方向性预测模式和非方向性模式,其中,方向性预测模式根据预测方向来使用参考像素信息,非方向性模式在进行预测时不使用方向信息。用于预测亮度信息的模式可以不同于用于预测色度信息的模式。通过对亮度信息进行预测所获得的帧内预测模式信息或者关于所预测的亮度信号的信息可以用于预测色度信息。同时,如果参考像素不可用,则可以通过用其它像素替换不可用的参考像素来生成预测块。
预测块可以包括多个变换块。当执行帧内预测时,如果预测块的大小与变换块的大小相同,则可以基于预测块的左侧像素、左上像素和上方像素来执行针对预测块的帧内预测。然而,当执行帧内预测时,如果预测块的大小与变换块的大小不同并且因此预测块包括多个变换块,则可以基于以变换块为基础所确定的参考像素来执行帧内预测。
在根据帧内预测模式将模式依赖帧内平滑(MDIS)滤波器应用于参考像素之后,帧内预测方法可以生成预测块。应用于参考像素的MDIS滤波器的类型可以不同。MDIS滤波器是应用于经帧内预测的块的附加滤波器,其中,通过执行帧内预测来生成经帧内预测的块,并且MDIS滤波器可以用于减小参考像素与在执行预测后生成的经帧内预测的块之间的残差。当执行MDIS滤波时,可以根据帧内预测模式的方向来对参考像素以及对包括在经帧内预测的块中的一些列执行不同的滤波。
帧间预测单元122和127可以通过参考关于以下块的信息来执行预测:在当前图片之前的图片和在当前图片之后的图片中的至少一者中包括所述块。帧间预测单元122和127可以包括参考图片内插单元、运动预测单元和运动补偿单元。
参考图片内插单元可以被提供有关于来自存储器195或196的参考图片的信息,并且可以生成与来自参考图片的小于整像素的像素有关的信息。在亮度像素的情况下,可以使用具有可变滤波器系数的8抽头基于离散余弦变换的内插滤波器来生成与小于整像素的以1/4像素为单位的像素有关的信息。在色度信号的情况下,可以使用具有可变滤波器系数的4抽头基于离散余弦变换的内插滤波器来生成与小于整像素的以1/8像素为单位的像素有关的信息。
帧间预测单元122和127可以基于由参考图片内插单元进行内插的参考图片来执行运动预测。为了获得运动矢量,可以使用各种方法,例如基于全搜索的块匹配算法(FBMA)、三步搜索(TSS)算法和新三步搜索(NTSS)算法等。运动矢量可以基于内插的像素而具有以1/2或1/4像素为单位的运动矢量值。帧间预测单元122和127可以通过应用各种帧间预测方法中的一种方法来对当前块执行预测。
作为帧间预测方法,可以使用各种方法,例如跳跃法、合并法和使用运动矢量预测器(MVP)的方法等。
帧间预测中的运动信息(即与参考图片的索引、运动矢量和残差信号等有关的信息)被进行熵编码并且被传输至解码单元。当应用跳跃模式时,可能不执行用于生成残差、对残差进行变换、使残差量化和传输残差的处理。
层间预测单元123执行层间预测,在层间预测中使用与下层有关的信息来对上层进行预测。层间预测单元123可以使用与下层有关的运动信息等来执行层间预测。
层间预测将下层的图片设置为参考图片,并且使用与下层(参考层)的图片中的运动有关的信息来对上层的当前块执行预测。
参考层的图片(其被用作层间预测中的参考图片)可以是被进行采样以匹配当前层的分辨率的图片。此外,运动信息可以包括运动矢量和参考图片索引。在该情况下,可以将参考层的图片的运动矢量值设置为0。
作为层间预测的示例,对将下层的图片用作参考图片的预测方法进行描述,但是本发明不限于此。层间预测单元123可以另外执行层间纹理预测、层间运动预测、层间语法预测和层间残差预测等。
层间纹理预测可以基于参考层的纹理来导出当前层的纹理。参考层的纹理可以被采样,以匹配当前层的分辨率,并且层间预测单元123可以基于参考层的经采样的纹理来预测当前层的纹理。层间运动预测可以基于参考层的运动矢量来导出当前层的运动矢量。在该情况下,参考层的运动矢量可以被缩放,以匹配当前层的分辨率。层间语法预测可以基于参考层的语法来预测当前层的语法。例如,层间预测单元123可以将参考层的语法用作当前层的语法。此外,层间残差预测可以使用参考层的恢复的图片和当前层的恢复的图片之间的残差来重建当前层的图片。
生成残差块(其包括与残差有关的信息),并且将残差块输入至变换单元130和131,其中,残差块为由预测单元120和125生成的预测块和根据预测块重建的块之间的差。
变换单元130和131可以使用变换方法例如离散余弦变换(DCT)或离散正弦变换(DST)来对残差块进行变换。是否应用DCT或DST来对残差块进行变换可以基于与预测块(其用于生成残差块)有关的帧内预测模式信息以及与预测块的大小有关的信息进行确定。换言之,变换单元130和131可以取决于预测块的大小和预测方法来使用不同的变换方法。
量化单元140和141可以对由变换单元130和131变换至频域的值进行量化。量化系数可以根据图片的重要性或块而改变。由量化单元140和141计算的值可以被提供至解量化单元170和171以及重新布置单元150和151。
重新布置单元150和151可以重新布置经量化的残差值的系数值。重新布置单元150和151可以通过系数扫描方法将二维块型系数变成一维矢量形式。例如,重新布置单元150和151可以使用锯齿扫描法从直流系数扫描为高频域的系数,以将二维块型系数变成一维矢量形式。可以取决于变换块的大小和帧内预测模式来使用垂直扫描方法和水平扫描方法,其中,垂直扫描方法沿垂直方向扫描二维块型系数,水平扫描法沿水平方向扫描二维块型系数。换言之,可以取决于变换块的大小和帧内预测模式来确定是否使用锯齿扫描法、垂直扫描法还是水平扫描法。
熵编码单元160和161可以基于由重新布置单元150和151计算的值来执行熵编码。熵编码可以使用各种编码方法,例如,指数哥伦布编码、上下文自适应变长编码(CAVLC)以及上下文自适应二进制算术编码(CABAC)。
熵编码单元160和161可以基于预定的编码方法通过以下来执行熵编码:从重新布置单元150和151以及预测单元120和125接收各种信息,例如编码块的残差系数信息和块类型信息、预测模式信息、划分单元信息、预测块信息和传输单元信息、运动矢量信息、参考帧信息、块的内插信息以及滤波信息等。此外,熵编码单元160和161可以对从重新布置单元150和151输入的编码单元的系数值进行熵编码。
熵编码单元160和161可以通过对帧内预测模式信息进行二进制编码来对当前块的帧内预测模式信息进行编码。熵编码单元160和161可以包括用于进行二进制编码的码字映射单元,并且可以取决于用于帧内预测的预测块的大小来有区别地执行二进制编码。码字映射单元可以通过二进制编码操作来适应性地生成码字映射表,或者可以具有先前生成的映射表。在另一实施方式中,熵编码单元160和161可以使用用于执行码号(code-num)映射的码号映射单元和用于执行码字映射的码字映射单元来表示与当前块有关的帧内预测模式信息。码号映射单元和码字映射单元可以分别生成码号映射表和码字映射表,或者可以分别具有先前生成的码号映射表和码字映射表。
解量化单元170和171对由量化单元140和141量化的值进行解量化,并且逆变换单元180和181对由变换单元130和131变换的值进行逆变换。由解量化单元170和171以及逆变换单元180和181生成的残差与预测块相组合,其中,预测块通过运动预测单元、运动补偿单元以及包括在预测单元120和125中的帧内预测单元进行预测,由此可以生成重建的块。
滤波器单元190和191可以包括解块滤波器和偏移校正单元中的至少一者。
解块滤波器可以在重建的图片中移除由于块之间的边界而生成的块失真。是否执行解块(即是否将解块滤波器应用于当前块)可以基于包括在块的一些行或列中的像素来确定。当将解块滤波器应用于块时,可以根据所要求的解块滤波的强度来应用强滤波器或弱滤波器。此外,在应用解块滤波器中,当执行垂直滤波和水平滤波时,可以同时处理垂直滤波和水平滤波。
偏移校正单元可以以像素为单位对被执行解块的图片与原始图片之间的偏移进行校正。为了对特定图片执行偏移校正,可以使用将包括在图片中的像素分成一定数目的区域、确定偏移要被应用的区域以及将偏移应用于该区域的方法,或者可以使用在考虑与每个像素的边缘有关的信息的情况下应用偏移的方法。
滤波器单元190和191可以仅应用解块滤波器,或者可以应用解块滤波器和偏移校正二者。
存储器195和196可以存储由滤波器单元190和191计算的重建的块或图片,并且当执行帧内预测时,存储于存储器中的重建的块和图片可以被提供至预测单元120和125。
从下层的熵编码单元100b输出的信息以及从上层的熵编码单元100a输出的信息通过多路复用器197被多路复用,并且然后可以被以比特流的形式输出。
多路复用器197可以被包括在下层的编码单元100b中,或者多路复用器197可以被实现为与编码单元100不同的单独的装置或模块。
图2为示意性地示出根据本发明的实施方式的解码装置的框图。
如图2所示,解码装置200包括上层的解码单元200a和下层的解码单元200b。
上层的解码单元200a可以包括熵解码单元210、重新布置单元220、解量化单元230、逆变换单元240、预测单元250、滤波器单元260和存储器270。
下层的解码单元200b可以包括熵解码单元211、重新布置单元221、解量化单元231、逆变换单元241、预测单元251、滤波器单元261和存储器271。
当从编码装置传输包括多个层的比特流时,解复用器280根据每一层对信息进行解复用,并且将信息传输至层中的每一层的解码单元200a或200b。可以通过作为编码装置的逆过程的过程来对输入的比特流进行解码。
熵解码单元210和211可以通过由编码装置的熵编码单元执行的熵编码的逆过程来执行熵解码。在由熵解码单元210和211解码的各条信息中,用于生成预测块的信息被提供至预测单元250和251,并且由熵解码单元进行熵解码的残差可以被输入至重新布置单元220和221。
像熵编码单元160和161一样,熵解码单元210和211可以通过使用CABAC和CAVLC中至少一者来执行逆变换。
熵解码单元210和211可以对与由编码装置执行的帧内预测和帧间预测有关的信息进行解码。熵解码单元包括码字映射单元,其具有用于根据所接收的码字来生成帧内预测模式号的码字映射表。码字映射表可以被提前存储,或者可以被适应性地生成。当使用码号映射表时,用于执行码号映射的码号映射单元可以被另外地进行布置。
重新布置单元220和221可以基于编码单元所使用的布置方法来对由熵解码单元210和211熵解码的比特流进行重新布置。以一维矢量形式表示的系数可以通过重建而被重新布置为二维块型系数。重新布置单元接收与由编码单元执行的系数扫描方法有关的信息,并且可以使用基于由编码单元执行的扫描序列来执行逆扫描的方法来对系数进行重新布置。
解量化单元230和231可以基于由编码装置提供的量化参数和块的重新布置的系数来执行解量化。
逆变换单元240和241可以对由编码装置执行的量化的结果执行逆DCT和逆DST,所述逆DCT和逆DST对应于由变换单元130和131执行的DCT和DST。可以在由编码装置确定的传输单元中执行逆变换。在编码装置的变换单元中,可以根据多条信息(例如预测方法、当前块的大小和预测方向等)选择性地执行DCT和DST。逆变换单元225可以基于与由编码装置的变换单元执行的变换有关的信息来执行逆变换。可以基于编码块而非变换块来执行变换。
预测单元250和251可以基于由熵解码单元210和211提供的与预测块的生成有关的信息以及从存储器270和271提供的与先前解码的块或图片有关的信息来生成预测块。
预测单元250和251可以包括预测单元确定单元、帧间预测单元和帧内预测单元。
预测单元确定单元接收各种信息,将预测块与当前编码块分开并且确定预测块是否执行帧内预测或帧间预测,其中,所述各种信息包括从熵解码单元输入的预测单元信息、与帧内预测方法有关的预测模式信息以及与帧间预测方法有关的运动预测信息等。
帧间预测单元可以使用由编码装置提供的对于当前预测块的帧间预测所需的信息、基于在当前图片(其包括当前预测块)之前的图片和在当前图片之后的图片中的至少一者中包括的信息来对当前预测块执行帧间预测。为了执行帧间预测,可以基于对应编码块来确定用作包括在编码块中的预测块的运动预测方法的方法是否为跳跃模式、合并模式或者使用运动矢量预测器(MVP)的AMVP模式。
帧内预测单元可以基于与当前图片中的像素有关的信息来生成预测块。当预测块为被执行帧内预测的预测块时,可以基于由编码装置提供的与预测块有关的帧内预测模式信息来执行帧内预测。帧内预测单元可以包括:MDIS滤波器,其用于对当前块的参考像素执行滤波;参考像素内插单元,其用于通过对参考像素进行内插来以小于单个像素的单位生成参考像素;以及直流滤波器,其用于在当前块的预测模式为直流模式时通过滤波来生成预测块。
上层的解码单元200a的预测单元250还可以包括用于执行层间预测的层间预测单元,其中,使用与下层有关的信息来对上层进行预测。
层间预测单元可以使用帧内预测模式信息和运动信息等来执行层间预测。
层间预测将下层的图片设置为参考图片,并且使用下层(参考层)的图片的运动信息来对上层的当前块执行预测。
参考层的图片(其被用作层间预测中的参考图片)可以是被采样以匹配当前层的分辨率的图片。此外,运动信息可以包括运动矢量和参考图片索引。在该情况下,可以将参考层的图片的运动矢量值设置为0。
作为层间预测的示例,对将下层的图片用作参考图片的预测方法进行描述,但是本发明不限于此。层间预测单元123可以另外执行层间纹理预测、层间运动预测、层间语法预测和层间残差预测等。
层间纹理预测可以基于参考层的纹理来导出当前层的纹理。参考层的纹理可以被采样,以匹配当前层的分辨率,并且层间预测单元可以基于参考层的经采样的纹理来预测当前层的纹理。层间运动预测可以基于参考层的运动矢量来导出当前层的运动矢量。在该情况下,参考层的运动矢量可以被缩放,以匹配当前层的分辨率。层间语法预测可以基于参考层的语法来预测当前层的语法。例如,层间预测单元123可以将参考层的语法用作当前层的语法。此外,层间残差预测可以使用参考层的恢复的图片与当前层的恢复的图片之间的残差来重建当前层的图片。
重建的块或图片可以被提供至滤波器单元260和261。滤波器单元260和261可以包括解块滤波器和偏移校正单元。
编码装置可以提供关于解块滤波器是否被应用于对应的块或图片的信息,并且提供指示当应用了解块滤波器时滤波器为强滤波器或者弱滤波器的信息。解码装置的解块滤波器接收由编码装置提供的与解块滤波器有关的信息,并且解码装置可以对相应的块执行解块滤波。
偏移校正单元可以基于在编码期间应用于图片的偏移校正的类型以及与偏移值有关的信息来对重建的图片执行偏移校正。
存储器270和271可以存储要被用作参考图片或参考块的重建的图片或块,并且可以将重建的图片输出。
编码装置和解码装置可以对三层或更多层(而非两层)执行编码,在该情况下,上层的编码单元和上层的解码单元可以包括在数目上与上层的数目相对应的多个编码单元和多个解码单元。
在支持多层结构的可伸缩视频编码(SVC)中,存在多个层之间的相关性。当使用该相关性来执行预测时,可以移除重复元素,并且可以改进视频编码性能。
因此,当对当前层(增强层)的编码图片或解码图片进行预测时,不仅可以使用与当前层有关的信息来执行帧间预测或帧内预测,而且可以使用与另一层有关的信息来执行层间预测。
当执行层间预测时,当前层可以在将用于层间预测的参考层的解码图片用作参考图片的情况下生成当前层的预测样本。
在该情况下,因为分辨率、帧速率、颜色格式和视点中的至少一者在当前层与参考层之间可以有所不同(由于层之间的可伸缩性的差别),所以参考层的解码图片被重新采样,以适应当前层的可伸缩性,并且然后可以被用作当前层的层间预测的参考图片。“重新采样”意指对参考层图片的样本进行上采样或下采样,以匹配当前层图片的大小。
在本说明书中,当前层为被执行编码或解码的层,并且可以是增强层或上层。参考层为在当前层的层间预测中所指的层,并且可以是基础层或下层。可以将用于当前层的层间预测的参考层的图片(即参考图片)称为层间参考图片。
在可伸缩视频编码中,当导出用于要被应用于当前层的合并模式的候选者时或者当导出用于预测运动信息的模式(使用MVP的模式)的候选者时,可以使用参考层(基础层)的运动信息。在该情况下,有必要考虑的是,当前层的分辨率不同于参考层的分辨率,以及参考层的运动信息被存储于预定的单元中。换言之,有必要确定在根据其导出运动信息的基础层上的位置,以将运动信息应用于当前层的目标块。
对根据基础层来导出运动信息并且将运动信息应用于当前层的预测单元的处理进行如下简述:
(1)在当前层中指定当前层基准位置,所述当前层基准位置指定当前块(例如PU)
(2)在参考层中指定与当前层基准位置相对应的参考层基准位置
(3)在考虑用于存储运动信息(例如运动矢量)的单元的大小的情况下,根据参考层基准位置来导出运动信息
(4)对所导出的运动信息(例如运动矢量)进行缩放,以被用作当前层的运动信息
将各个运动信息或各个运动矢量用作候选者可以提高预测效率,而不是将用作合并模式中的合并候选者的相邻块的各条运动信息配置为彼此相似,或者不是将用作使用MVP的模式中的候选者的块的运动矢量配置为彼此相似。因此,为了根据基础层来导出各个运动信息,适当地选择指定当前层的块的位置,并且基于此可以执行针对当前层的预测。
在下文中,根据本发明来详细描述用于指定当前层的基准位置和参考层的基准位置的方法,以及基于基准位置来导出参考层的运动信息并且将其用作当前层的运动信息的方法。
(1)在当前层中指定当前层基准位置,所述当前层基准位置指定当前块(例如PU)
图3为示意性地说明根据本发明的用于指定基础层的与增强层的样本位置相对应的样本位置的方法的视图。
参照图3,用于对当前层的块(例如预测块)进行指定的位置,存在块300的左上样本305的位置、块300的中心的左上样本310的位置、块300的中心的右下样本315的位置、块300的右下划分的右上样本320的位置、块300的右下底样本330的位置以及与块300的右下角相邻的样本340的位置,并且可以将从这些位置中选择的任意一个位置用作对当前层的块300进行指定的位置。
假设:当前层中的块300的左上样本的位置为基于当前图片的左上角的(xP,yP),当前层的块300的宽度为nPbWC,而其高度为nPbHC
在当前层的块300中,可以依照等式1来指定左上样本305的位置(xPLA,yPLA)。
<等式1>
xPLA=xP
yPLA=yP
在当前层的块300中,可以依照等式2来指定中心的左上样本310的位置(xPCL,yPCL)。
<等式2>
xPCL=xP+nPbWC>>1-1
yPCL=yP+nPbHC>>1-1
在当前层的块300中,可以依照等式3来指定中心的右下样本315的位置(xPCR,yPCR)。
<等式3>
xPCR=xP+nPbWC>>1
yPCR=yP+nPbHC>>1
在当前层的块300中,可以依照等式4来指定右下划分的右上样本320的位置(xPPR,yPPR)。
<等式4>
xPPR=xP+(nPbWC–1)
yPPR=yP+nPbHC>>1
在当前层的块300中,可以依照等式5来指定右下底样本330的位置(xPBR,yPBR)。
<等式5>
xPBR=xP+nPbWC–1
yPBR=yP+nPbHC–1
在当前层的块300中,可以依照等式6来指定与右下角相邻的样本340的位置(xPH,yPH)。
<等式6>
xPLA=xP+nPbWC
yPLA=yP+nPbHC
编码器和解码器可以使用当前层的块中的上述预定位置中的任意一者来指定块。
例如,编码器和解码器可以将处于当前层中的编码/解码目标块(在下文中称为当前块)的中心的样本的位置用作指定当前块的样本的位置。换言之,如果当前块为具有16×16大小的预测块,则对当前块进行指定的样本的位置会是(xp+8,yP+8)。
(2)在参考层中指定与当前层基准位置相对应的参考层基准位置
在指定当前块的位置后,可以指定参考层的与对当前块进行指定的位置相对应的基准位置。在该情况下,指定了参考层的基准位置的图片(即导出要被应用于当前块的运动矢量的参考层的图片)可以被包括在访问单元(AU)中,在AU中包括当前层的图片(当前图片),所述当前层的图片包括当前块。
编码器和解码器可以使用当前层(增强层)与参考层(基础层)之间的大小的比率(分辨率比率),以在参考层中指定与当前块的位置相对应的位置。
假设参考层的图片的宽度为PicWRL,而参考层的图片的高度为PicHRL。
如上所述,当对当前层的块进行指定的样本的位置为(xP,yP)时,可以依照等式7来指定参考层的与(xP,yP)相对应的位置(xRef,yRef)。
<等式7>
xRef=(xP*PicWRL+scaledW/2)/scaledW
yRef=(yP*picHRL+scaledH/2)/scaledH
此处,scaledW为通过将参考层(基础层)的图片的宽度乘以可伸缩比率而获得的值,而scaledH为通过将参考层(基础层)的图片的高度乘以可伸缩比率而获得的值。可伸缩比率为当前层的分辨率与参考层的分辨率的比率,即当前层(增强层)的分辨率/参考层(基础层)的分辨率。
因此,参考等式7确认的是,(xRef,yRef)为对当前层的块进行指定的样本的位置与可伸缩性比率之间的比率。
当参考层与当前层之间的可伸缩比率为2(即分辨率的比率为2)时,scaledW的值为2PicWRL,而scaledH的值为2PicWRH。此外,当参考层与当前层之间的可伸缩比率为1.5(例如分辨率的比率为1.5)时,scaledW的值为1.5PicWRL,而scaledH的值为1.5PicWRH。
同时,与等式7不同,可以依照等式8、通过使用移位操作而非除法操作并且通过应用缩放因子而非图片的特定大小来导出参考层的与对当前块进行指定的样本位置(xP,yP)相对应的位置(xRef,yRef)。
<等式8>
xRef=((xP)*scaledFactorX+(1<<(shiftX–1)))>>shiftX
yRef=((yP)*scaledFactorY+(1<<(shiftY–1)))>>shiftY
此处,在考虑位深度和/或运动信息存储单位的情况下,可以依照等式9来限定scaledFactorX、scaledFactorY、shiftX和shiftY。
<等式9>
shiftX=shiftY=16
scaledFactorX=((PicWRL<<shiftX)+(scaledW>>1))/scaledW)
scaledFactorY=((PicHRL<<shiftY)+(scaledH>>1))/scaledH)
编码器和解码器可以使用等式7至等式9来导出参考层的与对当前块进行指定的样本的位置相对应的位置。
例如,再次参照图3,编码器和解码器可以使用等式1至等式6以及等式7或等式8来导出以下位置:参考层的与当前层的样本305相对应的样本355的位置;参考层的与当前层的样本310相对应的样本360的位置;参考层的与当前层的样本315相对应的样本365的位置;参考层的与当前层的样本320相对应的样本370的位置;参考层的与当前层的样本330相对应的样本375的位置;以及参考层的与当前层的样本340相对应的样本380的位置。
(3)在考虑运动信息(例如运动矢量)的存储单元的大小的情况,根据参考层基准位置来导出运动信息
在参考层(基础层)中,运动矢量被存储在具有预定大小的块单元(运动矢量存储单元)中,以减小所需的存储器(缓冲器)大小。例如,运动矢量可以存储在具有16×16大小的块单元中。
如上所述,在多层结构中,可以根据参考层来导出要被应用于当前层的运动矢量。例如,如(1)中所述来指定当前层中的预定位置(当前块的位置),并且如(2)中所述来指定参考层的与当前块的位置相对应的位置,由此,可以从与(2)中得出的位置相对应的运动矢量存储单元(例如16×16块)来导出运动矢量。
因此,为了根据参考层来导出运动矢量,有必要考虑的是,参考层上的与对当前层的块(当前块)进行指定的样本的位置相对应的位置以及参考层中用于存储运动矢量的块单元的大小。
假设对参考层中用于存储运动矢量的块单元(运动矢量存储单元)进行指定的位置为(xRef0,yRef0)。在本说明书中,为了描述的方便,将位置(xRef0,yRef0)称为参考层的运动矢量存储位置。
在多层结构中,为了相对于对当前块进行指定的样本的位置来指定参考层的运动矢量存储位置,有必要考虑的是,运动矢量存储单元的大小以及通过(1)和(2)导出的样本的位置。
假设如上所述对当前层中的当前块(例如当前预测块)进行指定的样本的位置为(xP,yP),以及参考层上与(xP,yP)相对应的位置为(xRef,yRef)。
在该情况下,(xP,yP)可以是通过等式1至等式6指定的(xPLA,yPLA)、(xPCL,yPCL)、(xPCR,yPCR)、(xPPR,yPPR)、(xPBR,yPBR)和(xPLA,yPLA)中一者。此外,可以通过等式7或等式8来指定(xRef,yRef)。
如果运动矢量存储单元为16×16的块,则可以依照等式10来导出存储运动矢量的位置(xRef0,yRef0)。
<等式10>
xRef0=(xRef>>4)<<4
yRef0=(yRef>>4)<<4
图4为示意性地说明根据本发明的示例的用于导出存储有运动矢量的位置的方法的视图。在图4的示例中,描述了以下情况:增强层的编码块400的大小为32×32,而基础层的相对应的块430的大小为16×16。
在图4的示例中,假设当前层(增强层)的编码块400的第二划分为当前块,并且当前块的左上样本410的位置为(xPb,yPb)。在该情况下,如果对当前块进行指定的样本的位置为处于当前块的中心的样本420的位置,则可以依照等式11来导出对当前块进行指定的样本420的位置(xPCtr,yPCtr)。
<等式11>
xPCtr=xPb+nPbW/2=xPb+8
yPCtr=yPb+nPbH/2=yPb+16
在等式11中,nPbW表示当前块的宽度,而nPbH表示当前块的高度。
当依照等式11来确定对当前块进行指定的样本的位置时,可以依照等式12来导出参考层(基础层)的与该样本的位置相对应的样本440的位置。
<等式12>
xRef=(xPCtr*PicWRL+ScaledW/2)/ScaledW
yRef=(yPCtr*PicHRL+ScaledH/2)/ScaledH
在等式12中,scaledW为通过将参考层(基础层)的图片的宽度乘以可伸缩比率而获得的值,而scaledH为通过将参考层(基础层)的图片的高度乘以可伸缩比率而获得的值。可伸缩比率为当前层的分辨率与参考层的分辨率的比率。
基于(xRef,yRef),可以依照等式13(等式10)来导出基本层的与当前块相对应的运动矢量存储位置450,即(xRef0,yRef0)。
<等式13>
xRef0=(xRef>>4)<<4
yRef0=(yRef>>4)<<4
同时,如上所述,根据具有16×16的大小的运动矢量存储单元来存储参考层(基础层)的运动矢量,其中,运动矢量存储单元由处于左上角的样本的位置进行指定。
关于此,更有效的是将各种运动矢量用作合并候选者或者MVP候选者,以提高编码性能。
例如,将对当前块进行指定的样本的位置设定为(1)中导出的各个位置中的一者,并且可以找到与所设定的位置相对应的16×16块的左上样本的位置,由此,可以将对应位置的运动矢量导出为参考层的与当前块相对应的运动矢量。
因此,与等式10不同,作为用于导出运动矢量存储单元的另一示例,可以通过应用反映以下的差的偏移来导出对运动矢量存储单元进行指定的位置:所述差为对运动矢量存储单元进行指定的位置与参考层中与对当前块进行指定的样本的位置相对应的样本的位置之间的差。
当运动矢量存储单元为16×16并且偏移值为f时,可以依据等式14来导出对运动矢量存储单元进行指定的位置(xRef0,yRef0)(即存储运动矢量的位置)。
<等式14>
xRef0=((xRef+f)>>4)<<4
yRef0=((yRef+f)>>4)<<4
此处,偏移f可以为表示参考层的样本值的相位的值。例如,如果参考层的运动矢量为1/8像素单元,并且当前层的分辨率为参考层的分辨率的两倍,则f可以具有在0至15范围之内的整数值。
为了清楚的理解本发明,将对当前块进行指定的样本的位置处于当前块的中心的样本的位置的情况视为以下的实施方式:在该实施方式中,根据对当前块进行指定的样本的位置、通过应用偏移来导出对基础层的运动矢量存储单元进行指定的位置。
在当前块为16×16的块并且当前块的左上样本的位置为(xP,yP)时,可以通过等式3将对当前块进行指定的样本的位置(x,y)导出为(xP+8,yP+8)。
在该情况下,如果当前层与参考层之间的分辨率的比率为2,则偏移值f变为4,并且可以通过等式15来指定参考层中运动矢量存储单元的位置。
<等式15>
xRef0=((xRef+4)>>4)<<4
yRef0=((yRef+4)>>4)<<4
参照附图,将对此进行详细描述。
图5为示意性地说明根据本发明的另一示例的用于导出存储运动矢量的位置的方法的视图。在图5的示例中,描述了以下情况:在该情况中,增强层的编码块500的大小为32×32,并且基础层的相对应的块的大小为16×16。
在图5的示例中,假设当前层(增强层)的编码块500的第二划分为当前块,并且当前块的左上样本510的位置为(xPb,yPb)。在该情况下,当对当前块进行指定的样本的位置为处于当前块的中心的样本520的位置时,可以依照等式16来导出对当前块进行指定的样本520的位置(xPCtr,yPCtr)。
<等式16>
xPCtr=xPb+nPbW/2=xPb+8
yPCtr=yPb+nPbH/2=yPb+8
在等式16中,nPbW表示当前块的宽度,而nPbH表示当前块的高度。
当依照等式16来确定对当前块进行指定的样本的位置时,可以依照等式17来导出参考层(基础层)的与样本的位置相对应的样本540的位置。
<等式17>
xRef=(xPCtr*PicWRL+ScaledW/2)/ScaledW
yRef=(yPCtr*PicHRL+ScaledH/2)/ScaledH
在等式17中,scaledW为通过将参考层(基础层)的图片的宽度乘以可伸缩比率而获得的值,而scaledH为通过将参考层的图片的高度乘以可伸缩比率而获得的值。可伸缩比率为当前层的分辨率与参考层的分辨率的比率。
基于(xRef,yRef),可以依照等式18来导出基础层的与当前块相对应的运动矢量存储位置550,即(xRef0,yRef0)。
<等式18>
xRef0=((xRef+4)>>4)<<4
yRef0=((yRef+4)>>4)<<4
如附图所示,当应用偏移时,可以根据基础层中与当前块相对应的块(同位块)的相邻的块来导出要被应用于当前块的运动矢量。
换言之,当使用等式14而非等式10时,根据参考层的与当前块相对应的块的相邻的块来导出运动矢量存储单元。
因此,作为用于导出运动矢量存储单元的另一示例,可以在考虑到存储容量等的情况下选择性地使用等式10和等式14。例如,当通过等式14导出的位置和通过等式10导出的位置被包括在不同的最大编码单元(LCU)中时,可以应用等式13。
图6为用于示意性地说明根据本发明的又一示例的用于导出存储有运动矢量的位置的方法的视图。在图6的示例中,描述了以下情况:在该情况中,增强层的编码块600的大小为32×32,并且基础层的相对应的块的大小为16×16。
在图6的示例中,在当前块为块600的第二划分并且处于左上角的样本610的位置为(16,0)时,如附图中所示的,处于中心的对当前块进行指定的样本620的位置变为(24,8)。
当scaledW的值为2PicWRL而scaledH的值为2PicWRH时,参考层的与(24,8)相对应的位置680变为(12,4)。
图6的示例示出了当应用等式10时运动矢量存储位置变为包括在参考层的LCU0630中的位置670的情况,然而当应用等式14时运动矢量存储位置变为包括在参考层的LUC1640中的位置690。
图7为示意性地说明根据本发明的又一示例的用于导出存储有运动矢量的位置的方法的视图。在图7的示例中,描述了以下情况:在该情况中,增强层的编码块700的大小为32×32,并且基础层的相对应的块的大小为16×16。
在图7的示例中,在当前块为块700的第二划分并且左上样本710的位置为(16,0)时,如附图所示出的,处于中心的对当前块进行指定的样本620的位置变为(24,8)。
当scaledW的值为2PicWRL并且scaledH的值为2PicWRH时,参考层的与(24,8)相对应的位置760变为(12,4)。
图8的示例示出了无论是否应用等式10或者等式14的运动矢量存储位置均变为参考层的LCU 730中的位置770的情况。
因此,根据本发明,(i)可以使用将等式10应用于图6的情况和图7的情况二者的实施方式,(ii)可以使用将等式14应用于图6的情况和图7的情况二者的实施方式,(iii)可以使用其中图6使用等式10的情况而图7使用等式14的情况的实施方式,以及(iv)可以使用其中图6使用等式14的情况而图7使用等式10的情况的实施方式。
同时,运动矢量可以被存储于8×8的块单元而非16×16块单元。
图8为用于示意性地说明当运动矢量以8×8的块单元存储于增强层中时使用层间运动矢量的方法的视图。
在该情况下,因为运动矢量以16×16的块单元存储于基础层中,所以当根据基础层的第n个块810导出运动矢量并且将其应用于增强层的第n个块820时,运动矢量存储单元被压缩了1/2。此外,当根据增强层的第n个块820导出运动矢量并且将其应用于基础层的第(n+1)个块830时,四个运动矢量存储单元被压缩成一个运动矢量存储单元。
当参考层(基础层)上与对当前层(增强层)的当前块进行指定的样本相对应的位置为(xRef,yRef)时,并且当增强层的运动矢量存储单元为8×8的块时,同样根据与增强层的存储单元相对应的块导出基础层的运动矢量。因此,如等式19所表示的来导出运动矢量的位置(xRef0,yRef0)。
<等式19>
xRef0=(xRef>>3)<<3
yRef0=(yRef>>3)<<3
与等式19不同,即使增强层的运动矢量存储单元为8×8的块,仍可以应用偏移。
在该情况下,如等式20所表示的在基础层中导出运动矢量的位置(xRef0,yRef0)。
<等式20>
xRef0=((xRef+f)>>3)<<3
yRef0=((yRef+f)>>3)<<3
此处,偏移f为在0至7范围之内的整数。
在对参考层(基础层)进行解码的处理中,编码器和解码器可以将运动矢量存储在由参考层的位置(xRef0,yRef0)所指定的运动矢量存储单元中。
在对当前层(增强层)进行解码的处理中,编码器和解码器可以从存储器(缓冲器)获得所存储的针对参考层上的位置(xRef0,yRef0)的运动矢量,作为参考层的与当前块相对应的运动矢量。
同时,当(xRef0,yRef0)落在参考层的图片区域之外时,不可以使用运动矢量。例如,当所导出的xRef0小于0或者等于或大于PicWRL(其为参考层的图片的宽度)时,或者当所导出的yRef0小于0或者等于或大于PicHRL(其为参考层的图片的高度)时,不可以将参考层的运动矢量应用于当前块。
(4)对要被用作当前层的运动信息的所导出的运动信息(例如运动矢量)进行缩放
在使用参考层的运动信息的层间预测中,参考层的样本根据当前层的分辨率被重新采样,并且被用作层间预测的参考图片。
类似地,当参考层图片的大小与根据当前层的分辨率被调整的参考层图片的大小不同时,可以对(3)中导出的运动矢量进行缩放并且将其应用于当前块。
根据当前层的分辨率被调整的参考层图片可以是根据当前层的分辨率被采样的图片。此处,参考层图片的大小不同于根据当前层的分辨率被调整的参考层图片的大小的情况可以意指参考层的重新采样的图片的大小不同于当前层的图片的大小。
此外,根据当前层的分辨率被调整的参考层图片可以是具有在图片被重新采样前根据当前层的分辨率被应用了偏移的宽度和高度的图片。此处,参考层图片的大小不同于根据当前层的分辨率被调整的参考层图片的大小可以意指参考层图片的大小不用于被应用了偏移的参考层图片的大小。
例如,当参考层图片的宽度不同于根据当前层的分辨率被调整的参考层图片的宽度时,编码器和解码器可以对在(3)中导出的运动矢量(即参考层的所导出的与当前块相对应的运动矢量)的x分量执行缩放。
当参考层图片的高度不同于根据当前层的分辨率被调整的参考层图片的高度时,编码器和解码器可以对在(3)中导出的运动矢量(即参考层的所导出的与当前块相对应的运动矢量)的y分量执行缩放。
编码装置和解码装置可以使用通过处理(1)至处理(4)所导出的运动矢量对当前块执行预测。
在多层结构中,可以将层之间的相依性归类为三种类型,即:层间样本预测是可能的相依性;层间运动预测是可能的相依性;以及层间样本预测和层间运动预测二者均是可能的相依性。
当层间运动预测可能时,可以将层间参考图片的参考片的片类型和要激活的参考图片索引的数目等设置为与参考层图片的第一片的值一致。
在该情况下,在当前层的空间可伸缩性与参考层的空间可伸缩性相同时,可以将层的值设置为与参考层的图片的值一致,其中,在参考层中参考图片的运动场(motionfield)被解码。此处,空间可伸缩性相同的情况包括当前层的图片的大小与参考层的图片的大小相同的情况。此外,运动场包括预测模式、参考图片索引、运动矢量和可用预测列表信息等。
在当前层的空间可伸缩性与参考层的空间可伸缩性不相同时,可以将通过处理(1)至处理(4)进行缩放的运动矢量用作当前块的运动矢量。
可以将根据本发明的上述方法实现为可以由各种计算机装置执行的程序,并且可以将其记录在计算机可读存储介质上。计算机可读存储介质的示例包括ROM、RAM、CD-ROM、磁带、软盘和光数据存储装置等,并且可以以载波(例如通过因特网传输)的形式实现。
计算机可读存储介质可以分布于由网络连接的计算机系统中,并且可以使用分布式方法存储和执行计算机可读取的代码。此外,包括本发明的技术领域的编程人员可以容易地理解用于实现上面的方法的函数式程序、代码和代码段。
虽然已经基于上面实施方式中的流程图将方法描述为步骤或块,但是本发明并不限于步骤的顺序,并且一些步骤可以以不同的次序发生或同时发生。本领域技术人员将理解的是,流程图的步骤不是排他的,而是可以包括其它步骤,或者可以在不影响本发明的范围的情况下删除流程图的一个或更多个步骤。
上面的描述仅为本发明的技术精神的说明,而且具有本发明所属的技术领域内的普通知识的技术人员可以在不偏离本发明的本质特征的范围内做出修改和变型。相应地,本发明的所公开的实施方式不意在限制本发明的技术精神,而是示出本发明的技术精神,并且本发明的技术精神的范围并不限于这些实施方式。本发明的保护范围应当基于所附权利要求来进行解释,并且在与权利要求等同的范围内的所有技术精神应被解释为落在本发明的权利范围内。

Claims (18)

1.一种支持多层结构的视频解码方法,所述视频解码方法包括:
在当前层中指定当前层基准位置,所述当前层基准位置指定当前块;
在参考层中指定与所述当前层基准位置相对应的参考层基准位置;
基于运动信息存储单元的大小,通过将所述参考层基准位置和偏移相加来导出所述参考层中的运动信息存储位置,其中,所述偏移反映所述运动信息存储位置和在所述参考层中的参考层基准位置之间的差异,并且所述偏移具有从0至15范围内的整数值;
导出与所导出的运动信息存储位置相对应的运动信息;以及
对所导出的运动信息进行缩放,并且将经缩放的运动信息导出为要被用于在所述当前层中重建图片的运动矢量。
2.根据权利要求1所述的视频解码方法,其中,所述当前层基准位置为所述当前块的中心的右下样本的位置。
3.根据权利要求2所述的视频解码方法,其中,所述当前块的左上样本的位置为(xP,yP),所述当前块为具有16×16的大小的块,并且所述当前层基准位置为(xP+8,yP+8)。
4.根据权利要求1所述的视频解码方法,其中,基于所述当前层基准位置、所述参考层的图片的大小以及所述当前层与所述参考层之间的缩放比率来确定所述参考层基准位置。
5.根据权利要求4所述的视频解码方法,其中,所述缩放比率为通过将所述当前层的分辨率除以所述参考层的分辨率而获得的值。
6.根据权利要求4所述的视频解码方法,其中,所述缩放比率为通过将所述当前层的分辨率除以所述参考层的分辨率而获得的值,并且基于所述当前层基准位置与所述缩放比率之间的比率来确定所述参考层基准位置。
7.根据权利要求1所述的视频解码方法,其中,所述运动信息存储位置指定存储所述运动矢量的运动信息存储单元的位置,其中,所述运动信息存储位置为所述运动信息存储单元的左上样本。
8.根据权利要求1所述的视频解码方法,其中,所述运动信息存储单元为16×16的块,以及
所述运动信息存储位置(xRef0,yRef0)如下:
xRef0=((xRef+f)>>4)<<4
yRef0=((yRef+f)>>4)<<4
其中,(xRef,yRef)指示所述参考层基准位置,而f指示具有从0至15范围内的整数值的偏移。
9.根据权利要求8所述的视频解码方法,其中,所述f的值为4。
10.一种支持多层结构的视频编码方法,所述视频编码方法包括:
在当前层中指定当前层基准位置,所述当前层基准位置指定当前块;
在参考层中指定与所述当前层基准位置相对应的参考层基准位置;
基于运动信息存储单元的大小,通过将所述参考层基准位置和偏移相加来导出所述参考层中的运动信息存储位置,其中,所述偏移反映所述运动信息存储位置和在所述参考层中的参考层基准位置之间的差异,并且所述偏移具有从0至15范围内的整数值;
导出与所导出的运动信息存储位置相对应的运动信息;以及
对所导出的运动信息进行缩放,并且将经缩放的运动信息导出为要被用于在所述当前层中重建图片的运动矢量。
11.根据权利要求10所述的视频编码方法,其中,所述当前层基准位置为所述当前块的中心的右下样本的位置。
12.根据权利要求11所述的视频编码方法,其中,所述当前块的左上样本的位置为(xP,yP),所述当前块为具有16×16的大小的块,并且所述当前层基准位置为(xP+8,yP+8)。
13.根据权利要求10所述的视频编码方法,其中,基于所述当前层基准位置、所述参考层的图片的大小以及所述当前层与所述参考层之间的缩放比率来确定所述参考层基准位置。
14.根据权利要求13所述的视频编码方法,其中,所述缩放比率为通过将所述当前层的分辨率除以所述参考层的分辨率而获得的值。
15.根据权利要求13所述的视频编码方法,其中,所述缩放比率为通过将所述当前层的分辨率除以所述参考层的分辨率而获得的值,并且基于所述当前层基准位置与所述缩放比率之间的比率来确定所述参考层基准位置。
16.根据权利要求10所述的视频编码方法,其中,所述运动信息存储位置指定存储所述运动矢量的运动信息存储单元的位置,其中,所述运动信息存储位置为所述运动信息存储单元的左上样本的位置。
17.根据权利要求10所述的视频编码方法,其中,所述运动信息存储单元为16×16的块,以及
所述运动信息存储位置(xRef0,yRef0)如下:
xRef0=((xRef+f)>>4)<<4
yRef0=((yRef+f)>>4)<<4
其中,(xRef,yRef)指示所述参考层基准位置,而f指示具有从0至15范围内的整数值的偏移。
18.根据权利要求17所述的视频编码方法,其中,所述f的值为4。
CN201480029061.9A 2013-05-24 2014-05-26 解码多层视频的方法和设备 Active CN105247869B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20130059330 2013-05-24
KR10-2013-0059330 2013-05-24
PCT/KR2014/004680 WO2014189345A1 (ko) 2013-05-24 2014-05-26 멀티 레이어 구조에 있어서 움직임 정보의 유도 방법 및 이를 이용하는 장치

Publications (2)

Publication Number Publication Date
CN105247869A CN105247869A (zh) 2016-01-13
CN105247869B true CN105247869B (zh) 2019-05-10

Family

ID=52459213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480029061.9A Active CN105247869B (zh) 2013-05-24 2014-05-26 解码多层视频的方法和设备

Country Status (3)

Country Link
US (1) US10250902B2 (zh)
KR (1) KR102212631B1 (zh)
CN (1) CN105247869B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105187824A (zh) * 2014-06-10 2015-12-23 杭州海康威视数字技术股份有限公司 图像编码方法和装置以及图像解码方法和装置
JP6528635B2 (ja) * 2015-10-05 2019-06-12 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
KR102301352B1 (ko) 2016-02-09 2021-09-14 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 효율적인 감소성 또는 효율적인 랜덤 액세스를 허용하는 픽처/비디오 데이터 스트림들에 대한 개념
US11218706B2 (en) * 2018-02-26 2022-01-04 Interdigital Vc Holdings, Inc. Gradient based boundary filtering in intra prediction
CN108830790B (zh) * 2018-05-16 2022-09-13 宁波大学 一种基于精简卷积神经网络的快速视频超分辨率重建方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101047860A (zh) * 2006-03-27 2007-10-03 华为技术有限公司 交织模式下的视频分层编码方法
WO2012108701A2 (ko) * 2011-02-09 2012-08-16 엘지전자 주식회사 움직임 정보 저장 방법 및 이를 이용한 시간적 움직임 벡터 예측자 유도 방법
WO2013051897A1 (ko) * 2011-10-05 2013-04-11 한국전자통신연구원 영상 부호화 방법과 영상 복호화 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012050301A2 (ko) 2010-10-14 2012-04-19 엘지전자 주식회사 영상 부호화 및 복호화 방법과 이를 이용한 장치
KR101853744B1 (ko) 2011-04-15 2018-05-03 에스케이플래닛 주식회사 멀티트랙 비디오를 스케일러블 비디오로 인코딩하는 방법 및 장치
WO2013051899A2 (ko) 2011-10-05 2013-04-11 한국전자통신연구원 스케일러블 비디오 부호화 및 복호화 방법과 이를 이용한 장치
KR20130037161A (ko) * 2011-10-05 2013-04-15 한국전자통신연구원 스케일러블 비디오 코딩을 위한 향상된 계층간 움직임 정보 예측 방법 및 그 장치
KR101979284B1 (ko) * 2011-10-26 2019-05-17 인텔렉추얼디스커버리 주식회사 인터 예측 모드 스케일러블 코딩 방법 및 장치
US9319679B2 (en) * 2012-06-07 2016-04-19 Qualcomm Incorporated Signaling data for long term reference pictures for video coding
US9124899B2 (en) * 2012-09-28 2015-09-01 Sharp Laboratories Of America, Inc. Motion derivation and coding for scaling video

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101047860A (zh) * 2006-03-27 2007-10-03 华为技术有限公司 交织模式下的视频分层编码方法
WO2012108701A2 (ko) * 2011-02-09 2012-08-16 엘지전자 주식회사 움직임 정보 저장 방법 및 이를 이용한 시간적 움직임 벡터 예측자 유도 방법
WO2013051897A1 (ko) * 2011-10-05 2013-04-11 한국전자통신연구원 영상 부호화 방법과 영상 복호화 방법

Also Published As

Publication number Publication date
CN105247869A (zh) 2016-01-13
US20160100187A1 (en) 2016-04-07
US10250902B2 (en) 2019-04-02
KR102212631B1 (ko) 2021-02-05
KR20140138544A (ko) 2014-12-04

Similar Documents

Publication Publication Date Title
CN105230018B (zh) 用于对支持多个层的视频进行编码的方法和设备
CN104247423B (zh) 可伸缩视频编码系统的帧内模式编码方法和装置
CN106105191B (zh) 用于处理多视图视频信号的方法和装置
JP6580185B2 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
CN105453568B (zh) 可扩展视频信号编码/解码方法及装置
DK3280145T3 (en) PROCEDURE FOR ENCODING AND DEVICE FOR DECODING PICTURE THROUGH INTRAPHIC PREDICTION.
CN107925758A (zh) 视频编译系统中的帧间预测方法和设备
CN105247869B (zh) 解码多层视频的方法和设备
CN103548356B (zh) 使用跳跃模式的图像解码方法及使用该方法的装置
CN108111846A (zh) 用于可伸缩视频编码的帧间层预测方法及装置
CN104811717A (zh) 用于编码/解码高分辨率图像的方法和设备
KR20130028815A (ko) 화면 내 예측 방법 및 장치
CN103096069A (zh) 推导帧内预测模式的方法和设备
CN104255032B (zh) 层间预测方法和使用其的编码设备和解码设备
CN107635137A (zh) 利用解码装置对视频信号进行解码的方法
KR20140019221A (ko) 인루프 필터링 방법 및 이를 이용하는 장치
CN103444180A (zh) 视频编码设备、视频解码设备、视频编码方法以及视频解码方法
CN110366850A (zh) 基于帧内预测模式处理图像的方法和用于该方法的设备
KR20130066660A (ko) 영상 부호화 방법, 영상 복호 방법, 영상 부호화 장치, 영상 복호 장치 및 그들의 프로그램
CN105379276A (zh) 可伸缩视频信号编码/解码方法和装置
KR20130055631A (ko) 영상 부호화 방법, 영상 복호 방법, 영상 부호화 장치, 영상 복호 장치 및 이들의 프로그램
KR101652072B1 (ko) 멀티 레이어 비디오의 움직임 정보 탐색 방법 및 장치
KR20110062748A (ko) 공간적 예측장치 및 그 예측방법, 그것을 이용한 영상 부호화 장치 및 방법, 및 영상 복호화 장치 및 방법
CN106105213A (zh) 多层视频信号编码/解码方法和装置
KR20110036401A (ko) 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant