CN105594212B - 用于确定运动矢量的方法及其设备 - Google Patents

用于确定运动矢量的方法及其设备 Download PDF

Info

Publication number
CN105594212B
CN105594212B CN201480052699.4A CN201480052699A CN105594212B CN 105594212 B CN105594212 B CN 105594212B CN 201480052699 A CN201480052699 A CN 201480052699A CN 105594212 B CN105594212 B CN 105594212B
Authority
CN
China
Prior art keywords
unit
prediction
motion vector
subelement
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480052699.4A
Other languages
English (en)
Other versions
CN105594212A (zh
Inventor
朴慜祐
李振荣
魏浩千
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN105594212A publication Critical patent/CN105594212A/zh
Application granted granted Critical
Publication of CN105594212B publication Critical patent/CN105594212B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了一种视频解码方法,包括:当第一样点是亮度样点和色度样点中的一个,并且第二样点是另一个时,确定用于在具有不同彩色分量的第一样点和第二样点之间校正第一样点的值的第二样点的一个或更多个值;根据通过以预定间隔划分样点值的总范围而确定的带之中的包括第一样点的值的带来确定滤波器系数集;通过使用确定的滤波器系数集来对确定的第二样点的所述一个或更多个值进行滤波;使用通过滤波而获得的值来校正第一样点的值。

Description

用于确定运动矢量的方法及其设备
技术领域
本公开涉及一种用于在执行视频编码和解码的同时确定运动矢量的方法和设备。
背景技术
随着用于再现和存储高分辨率或高质量视频内容的硬件正被开发和提供,对于用于有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。根据传统的视频编解码器,基于具有预定尺寸的编码单元,根据受限的编码方法来对视频进行编码。
视频编解码器通过使用基于视频的图像之间的高时间和空间关系的预测方法来减少数据量。根据所述预测方法,通过使用图像之间的时间或空间距离、预测误差等来记录图像信息以通过使用外围图像来预测当前图像。
发明内容
技术问题
提供了一种确定在使用运动矢量执行视频编码和解码的同时所使用的运动矢量的方法。
技术方案
提供了一种用于在执行视频编码和解码的同时确定运动矢量的方法和设备。
有益效果
提供了一种关于执行视频编码和解码的用于在执行帧间预测或层间预测的同时确定运动矢量的有效方法和设备。
附图说明
图1a是根据实施例的运动矢量确定设备的框图。
图1b是根据实施例的运动矢量确定方法的流程图。
图2a是根据实施例的涉及运动矢量确定方法的视频编码器的框图。
图2b是根据实施例的涉及运动矢量确定方法的视频解码器的框图。
图3示出根据各种实施例的层间预测结构。
图4a和图4b示出根据各种实施例的运动矢量确定方法。
图5a至图5f示出根据各种实施例的划分预测单元的方法。
图6a至图6c示出根据各种实施例的关于运动矢量确定方法的语法和语义。
图7a是用于描述根据实施例的与参考单元的帧内预测区域相关的运动矢量确定方法的示图。
图7b是用于描述根据实施例的划分参考块的方法的示图。
图8是根据实施例的基于根据树结构的编码单元的视频编码设备的框图。
图9是根据实施例的基于根据树结构的编码单元的视频解码设备的框图。
图10是用于描述根据实施例的编码单元的概念的示图。
图11是根据实施例的基于编码单元的图像编码器的框图。
图12是根据实施例的基于编码单元的图像解码器的框图。
图13是示出根据实施例的较深层编码单元以及分区的示图。
图14是用于描述根据实施例的编码单元与变换单元之间的关系的示图。
图15是用于描述根据实施例的编码单元的编码信息的示图。
图16是根据实施例的较深层编码单元的示图。
图17至图19是用于描述根据实施例的编码单元、预测单元和变换单元之间的关系的示图。
图20是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。
图21是根据实施例的存储程序的盘的物理结构的示图。
图22是通过使用盘来记录和读取程序的盘驱动器的示图。
图23是提供内容分发服务的内容供应系统的整体结构的示图。
图24和图25分别是根据实施例的应用了视频编码方法和视频解码方法的移动电话的外部结构和内部结构的示图。
图26是根据实施例的采用通信系统的数字广播系统的示图。
图27是根据实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。
最佳实施方式
提供了一种关于执行视频编码和解码的用于确定运动矢量的方法和设备。
根据各种实施例,一种运动矢量确定方法,包括:当属于当前层的预测单元的尺寸大于预设尺寸时,将预测单元划分为多个子单元;确定属于参考层的用于对作为所述多个子单元之一的当前子单元进行层间预测的参考子单元;通过使用用于对参考子单元进行帧间预测的运动矢量来确定用于对当前子单元进行帧间预测的子运动矢量预测候选;通过使用包括所述子运动矢量预测候选的预测候选之一来确定用于对当前子单元进行帧间预测的运动矢量。
所述预设尺寸可包括8×8。
确定用于对当前子单元进行帧间预测的运动矢量的步骤可包括:将用于对参考子单元进行帧间预测的运动矢量确定为用于对当前子单元进行帧间预测的运动矢量。
运动矢量确定方法还可包括:当参考子单元的编码方法是帧内模式时,通过使用用于对当前子单元进行层间预测的视差矢量来确定所述子运动矢量预测候选。
将预测单元划分为多个子单元的步骤可包括:用信号传输所述预设尺寸;当预测单元的尺寸大于用信号传输的所述预设尺寸时,将预测单元划分为所述多个子单元。
运动矢量确定方法还可包括:接收比特流,其中,用信号传输所述预设尺寸的步骤可包括:从所述比特流解析出所述预设尺寸。
将预测单元划分为多个子单元的步骤可包括:当预测单元的宽度和高度之和大于12时,将预测单元划分为所述多个子单元。
运动矢量确定方法还可包括:通过使用确定的运动矢量来对当前子单元执行运动补偿。
根据各种实施例,一种运动矢量确定设备,包括:预测候选确定器,被配置为在属于当前层的预测单元的尺寸大于预设尺寸时将预测单元划分为多个子单元,确定属于参考层的用于对作为所述多个子单元之一的当前子单元进行层间预测的参考子单元,并通过使用用于对参考子单元进行帧间预测的运动矢量来确定用于对当前子单元进行帧间预测的子运动矢量预测候选;运动矢量确定器,被配置为通过使用包括所述子运动矢量预测候选的预测候选之一来确定用于对当前子单元进行帧间预测的运动矢量。
根据各种实施例,一种记录有程序的非易失性计算机可读记录介质,其中,所述程序在被计算机运行时执行所述运动矢量确定方法。
具体实施方式
根据在本说明书中描述的各种实施例,术语“图像”可以指静止图像或视频的运动图像,或者视频本身。
以下,术语“样点”表示被分配到图像的采样位置的数据,其中,所述数据是处理目标的数据。例如,空间区的图像中的像素可以是样点。作为另一示例,与空间域的图像中的像素相应的残差可以是样点。
以下,块的类型可以是方形或矩形,或者可以是任意几何形状。块不限于具有特定尺寸的数据单元。根据实施例的块可以是根据树结构的编码单元之中的最大编码单元、编码单元、预测单元或变换单元。以下将参照图8至图20描述基于根据树结构的编码单元的视频编码方法和视频解码方法。
此外,块可包括与稍后描述的术语相关的所有子单元、当前子单元、参考单元和参考子单元。
以下,用信号传输(signaling)可表示发送信号或接收信号。例如,当图像数据被编码时,用信号传输可表示发送编码的信号。作为另一示例,当图像数据被解码时,用信号传输可表示接收编码的信号。
以下,将参照图1a至图7描述根据各种实施例的用于确定与视频编码和解码相关的运动矢量的方法和设备。此外,将参照图8至图20描述可应用到视频编码方法和视频解码方法的根据各种实施例的基于具有树结构的编码单元的视频编码方法和视频解码方法。将参照图21至图27描述视频编码方法和视频解码方法可应用到的各种实施例。
图1a是根据实施例的运动矢量确定设备10的框图。
如图1a所示,运动矢量确定设备10可包括预测候选确定器11和运动矢量确定器12。然而运动矢量确定设备10可包括比图1a示出的组件更多或更少的组件。
运动矢量确定设备10可通过使用当前图像和另一图像之间的相似度来执行帧间预测。运动矢量确定设备10可从在当前图像之前被重建的参考图像之中检测与当前图像的当前块相应的参考块。当前块和参考块之间的在坐标上的距离可被表示为运动矢量,当前块和参考块之间的像素值差可被表示为残差数据。因此,经由当前块的帧间预测输出的信息不是当前块的图像信息,而可以是指示参考块的索引、运动矢量和残差数据。
运动矢量确定设备10可通过使用当前图像和另一图像之间的相似度来执行层间预测。用于重建当前图像的参考图像可以是属于与当前图像所属的层不同的层的图像。运动矢量确定设备10可从在当前图像之前重建的参考图像之中检测与当前图像的当前块相似的参考块。当前块和参考块之间的在坐标上的距离可被表示为运动矢量,当前块和参考块之间的像素值差可被表示为残差数据。因此,经由当前块的帧间预测输出的信息不是当前块的图像信息,而可以是指示参考块的索引、运动矢量和残差数据。
层间运动预测可以是层间预测的示例。根据实施例的层间运动预测可包括通过使用在对参考层的参考图像执行帧间预测时使用的运动矢量来确定在对当前层的当前图像执行帧间预测时使用的运动矢量的操作。
以下将参照图2和图3描述关于与层间预测相关的多层图像的细节。
根据实施例的运动矢量确定设备10可根据视频的每个图像的块执行帧间预测或层间预测。
对于运动矢量预测、块合并(merging)(PU合并)或先进运动矢量预测(AMVP),可通过参考另一块的运动矢量来确定当前块的运动矢量。其它块可包括与当前块的层不同的层的块。
根据实施例的运动矢量确定设备10可通过参考与当前块时间邻近或空间邻近的另一块的运动矢量来确定当前块的运动矢量。运动矢量确定设备10可确定包括候选块的运动矢量的预测候选,其中,候选块的运动矢量可以是当前块的运动矢量的参考目标。运动矢量确定设备10可通过参考从预测候选的运动矢量选择的一个运动矢量来确定当前块的运动矢量。
根据实施例的预测单元可表示作为预测的基础并且从编码单元划分出的单元。
根据实施例的预测单元从编码单元被划分出,在编码单元不按照四叉树形状被划分的情况下,仅对编码单元划分一次。例如,编码单元可被划分为多个预测单元,预测单元可不被另外划分。
根据另一实施例的预测单元可被划分为子单元。例如,一个预测单元可被划分为多个子单元。
根据上述实施例,当一个预测单元被划分为多个子单元时,可根据子单元来执行帧内预测、帧间预测或层间预测。
运动矢量可包括视差矢量。例如,当与当前块相应的参考块在帧内模式下被编码时,与当前块和参考块匹配的视差矢量可以是用于对当前块进行解码的视差矢量。
当执行帧间预测或层间预测时可使用运动矢量。
例如,运动矢量确定设备10可通过使用用于对当前子单元执行帧间预测的运动矢量来确定与当前子单元相应的参考子单元。此时,参考子单元可被包括在与当前子单元相同的层中。此外,编码器可将确定的参考子单元和当前子单元之间的像素值差表示为残差数据。编码器可输出指示参考子单元的索引、运动矢量和确定的残差数据,而不是直接输出当前子单元的图像信息。
作为另一示例,运动矢量确定设备10可通过使用用于对当前子单元执行层间预测的运动矢量来确定与当前子单元相应的参考子单元。此时,参考子单元可被包括在与当前子单元的层不同的层中。此外,编码器可将确定的参考子单元和当前子单元之间的像素值差表示为残差数据。编码器可输出指示参考子单元的索引、运动矢量和确定的残差数据,而不是直接输出当前子单元的图像信息。
作为另一示例,为了确定用于对当前子单元执行帧间预测的运动矢量,运动矢量确定设备10可使用在对包括在与当前子单元所属的层不同的层中的参考子单元进行帧间预测中使用的运动矢量。
作为另一示例,当通过使用帧间预测对当前子单元进行解码时,运动矢量确定设备10可通过接收当前子单元的运动矢量、量化后的变换系数和参考子单元的索引来重建当前子单元的残差数据。然后,解码器可通过对经由帧间预测或层间预测编码的当前子单元执行运动补偿来重建当前子单元。
作为另一示例,运动矢量确定设备10可通过使用用于对当前子单元执行层间预测的运动矢量来确定与当前子单元相应的参考子单元。此时,参考子单元可被包括在与当前子单元的层不同的层中。
作为另一示例,运动矢量确定设备10可使用用于对包括在与当前子单元所属的层不同的层中的参考子单元进行帧间预测的运动矢量,以确定用于对当前子单元进行帧间预测的运动矢量。
根据实施例的子单元可表示随包括在当前层中的预测单元被划分而产生的块。
此外,根据实施例的当前子单元可表示当前被编码或解码的子单元。
此外,根据实施例的子运动矢量预测候选可表示用于对当前子单元进行帧间预测或层间预测的候选运动矢量。
此外,根据实施例的预测候选可表示用于对当前子单元或预测单元进行帧间预测或层间预测的候选运动矢量。根据实施例的预测候选可包括上述的子运动矢量预测候选。
此外,根据实施例的参考单元可表示与包括在当前层中的预测单元相应的块。参考单元可包括在当前块中或参考层中。例如,参考单元可表示用于对预测单元执行帧间预测或层间预测的参考块。
此外,根据实施例的参考子单元可表示随包括在参考层中的参考单元被划分而产生的块。
根据实施例的预测候选确定器11可在属于当前层的预测单元的尺寸大于预设尺寸时,将预测单元划分为多个子单元。
例如,预测候选确定器11可在属于当前层的预测单元的尺寸大于8×8时,将预测单元划分为多个子单元。这里,当预测单元的尺寸是8×8、8×4或4×8时,预测单元不被划分为子单元,而是可根据预测单元确定运动矢量。
作为另一示例,预测候选确定器11可在属于当前层的预测单元的尺寸大于4×4时,将预测单元划分为多个子单元。
作为另一示例,预测候选确定器11可在预测单元的宽度和高度的和不为12时,将预测单元划分为多个子单元。
作为另一示例,预测候选确定器11可在预测单元的宽度和高度的和大于12时,将预测单元划分为多个子单元。
作为另一示例,预测候选确定器11可在预测单元的尺寸既不为8×4也不为4×8时,将预测单元划分为多个子单元。
作为另一示例,预测候选确定器11可在预测单元的尺寸不为8×4,不为4×8,也不为8×8时,将预测单元划分为多个子单元。
作为另一示例,预测候选确定器11可仅在预测单元的尺寸为2N×2N时,将预测单元划分为多个子单元。
作为另一示例,预测候选确定器11可在预测单元的尺寸大于N×N时,将预测单元划分为多个子单元。
根据实施例的预测候选确定器11可在预测单元的尺寸小于或等于预设尺寸时,不将预测单元划分为子单元。在这种情况下,视频编码器或视频解码器可根据预测单元执行层间预测或帧间预测。
2N×2N、2N×N、N×2N或N×N可表示编码单元、预测单元或子单元的尺寸。例如,当编码单元的尺寸为2N×2N并且所述尺寸是在8×8至64×64的范围中时,N可以是4、8、16和32之一。作为另一示例,当编码单元的尺寸是2N×2N并且预测单元的尺寸是2N×2N时,在一个编码单元中仅存在一个预测单元。作为另一示例,当编码单元的尺寸是2N×2N并且预测单元的尺寸是N×2N时,在一个编码单元中可存在两个预测单元。
当根据实施例的预测候选确定器11将预测单元划分为多个子单元时,最小子单元的尺寸可被预设。
例如,当预测候选确定器11将预测单元划分为多个子单元时,最小子单元的尺寸可以是8×8。
作为另一示例,当预测候选确定器11将预测单元划分为多个子单元时,最小子单元的尺寸可以是4×4、4×8和8×4中的至少一个。
根据实施例的预测候选确定器11可在将预测单元划分为多个子单元时,根据预测单元的尺寸将预测单元划分为预设数量的子单元。
例如,当预测单元的尺寸为16×16时,预测单元可被划分为四个子单元,其中,四是被预设的。
作为另一示例,当预测单元的尺寸为32×16时,预测单元可被划分为八个子单元,其中,八是被预设的。
作为另一示例,当预测单元的尺寸为2N×2N时,预测单元可被划分为八个子单元,其中,八是被预设的。
作为另一示例,当预测单元的尺寸为2N×N时,预测单元可被划分为四个子单元,其中,四是被预设的。
作为另一示例,当预测单元的尺寸为N×2N时,预测单元可被划分为十六个子单元,其中,十六是被预设的。
根据实施例的子单元的最小尺寸可被预设。
根据实施例的预测候选确定器11可在预测单元的尺寸为2N×2N时将预测单元划分为十六个子单元,可在预测单元的尺寸为N×2N或2N×N时将预测单元划分为八个子单元。
根据实施例的预测候选确定器11可在预测单元的尺寸为16×16、16×8或8×16时将预测单元划分为尺寸为8×8的子单元,并可在预测单元的尺寸为8×8、8×4或4×8时不划分预测单元。
作为另一示例,预测候选确定器11可将预测单元划分为最大数量的8×8块的子单元,其中,最大数量的8×8块的子单元可在没有任何重叠区域的情况下包括在预测单元中。
作为另一示例,预测候选确定器11可将预测单元划分为最大数量的具有预设尺寸的块的子单元,其中,最大数量的具有预设尺寸的块的子单元可在没有任何重叠区域的情况下包括在预测单元中。
可用信号发送根据实施例的用于确定是否将预测单元划分为多个子单元的预设尺寸。
例如,预测候选确定器11可通过解析接收到的比特流来获得预设尺寸。此外,预测候选确定器11可在预测单元的尺寸大于通过解析接收到的比特流而获得的预设尺寸时,将预测单元划分为多个子单元。
作为另一示例,视频编码设备20可通过比特流向外部发送根据实施例的用于确定是否将预测单元划分为多个子单元的预设尺寸。
根据实施例的预设尺寸可经由视频参数集(VPS)、序列参数集(SPS)、画面参数集(PPS)和条带片段头中的至少一个被用信号发送。
根据实施例的预测候选确定器11可确定属于参考层的用于对作为子单元之一的当前子单元进行层间预测的参考子单元。
图像可包括多个层的图像。为了重建属于当前层的当前子单元,可使用属于参考层的参考子单元。例如,预测候选确定器11可通过使用用于对参考子单元进行帧间预测的运动矢量来确定用于对当前子单元进行帧间预测的运动矢量。
根据实施例的预测候选确定器11可在确定与当前子单元相应的参考子单元时使用视差矢量。可在将当前层的当前块与参考层的参考块进行匹配时使用视差矢量。
与当前单元相应的参考单元可被划分为多个参考子单元。此外,多个参考子单元之一可与当前子单元相应。
当属于参考层的用于对属于当前层的预测单元进行层间预测的块是参考单元时,可通过划分参考单元来获得参考子单元。
根据实施例的预测候选确定器11可通过使用用于对参考子单元进行帧间预测的运动矢量来确定用于对当前子单元进行帧间预测的子运动矢量预测候选。
第一运动矢量可被用于对参考子单元进行帧间预测。此外,第二运动矢量可被用于对当前子单元进行帧间预测。子运动矢量预测候选可被用于对当前子单元进行帧间预测。可通过使用第一运动矢量来确定子运动矢量预测候选。例如,预测候选确定器11可将第一运动矢量确定为子运动矢量预测候选。
此外,子运动矢量预测候选可以是用于对当前子单元进行帧间预测的候选运动矢量之一。例如,子运动矢量预测候选可以与第二运动矢量相同。
根据实施例的运动矢量确定设备10可通过使用第一运动矢量确定第二运动矢量。
具体地,预测候选确定器11可将第一运动矢量包括到用于确定第二运动矢量的预测候选中。运动矢量确定器12可从包括在预测候选中的运动矢量之中选择用于对当前子单元进行帧间预测的运动矢量。
根据实施例的视频编码设备20或视频解码设备25可从在时间上在当前图像之前或之后的图像中包括的与当前子单元相应的块之中确定将被当前子单元参考的候选块。此外,根据实施例的视频编码设备20或视频解码设备25可从预测候选的运动矢量之中选择用于确定将被当前子单元参考的候选块的运动矢量。第一运动矢量可被包括在用于对参考子单元进行帧间预测的预测候选中。
根据实施例的运动矢量确定器12可通过使用包括子运动矢量预测候选的预测候选之一来确定用于对当前子单元进行帧间预测的运动矢量。
例如,运动矢量确定器12可将由预测候选确定器11确定的子运动矢量预测候选确定为用于对当前子单元进行帧间预测或帧内预测的运动矢量。作为另一示例,运动矢量确定器12可将用于对参考子单元进行帧间预测的运动矢量确定为用于对当前子单元进行帧间预测的运动矢量。作为另一示例,当执行帧间预测的单元不是预测单元,而是子单元时,运动矢量确定器12可将由预测候选确定器11确定的用于对参考子单元进行帧间预测的运动矢量确定为用于对当前子单元进行帧间预测的运动矢量。
根据实施例的运动矢量确定器12可产生预测候选,其中,预测候选包括被参考以对当前子单元的运动矢量进行预测的块的候选运动矢量。
根据实施例的运动矢量确定器12可从包括在预测候选中的候选运动矢量之中选择至少一个候选运动矢量,并通过使用选择的至少一个候选运动矢量来确定当前块的运动矢量。运动矢量确定器12可通过完全复制、合并或修改所选择的至少一个候选运动矢量来确定当前块的运动矢量。
如上所述,运动矢量确定设备10可根据通过划分预测单元而获得的子单元来确定运动矢量。
此外,如稍后将参照图2所描述的,视频编码器或视频解码器可通过使用由运动矢量确定设备10确定的运动矢量来根据子单元执行帧间预测或层间预测。
当通过使用根据实施例的运动矢量确定设备10根据小于预测单元的子单元执行帧间预测或层间预测时,与根据预测单元执行预测相比可获得具有高图像质量的图像。
当根据子单元执行帧间预测或层间预测时,根据实施例的运动矢量确定设备10可将当前子单元的运动矢量确定为参考子单元的运动矢量,而不判断另一候选运动矢量是否是当前子单元的运动矢量。
图1b是根据实施例的运动矢量确定方法的流程图。
在操作S11,预测候选确定器11可在属于当前层的预测单元的尺寸大于预设尺寸时,将预测单元划分为多个子单元。
例如,预设尺寸可以是8×8。当预设尺寸为8×8时,预测候选确定器11可在属于当前层的预测单元的尺寸大于8×8时,将预测单元划分为多个子单元。
根据实施例的预设尺寸可被用信号发送。因此,根据实施例的预测候选确定器11可解析接收到的比特流以获得预设尺寸,并在预测单元的尺寸大于获得的预设尺寸时将预测单元划分为多个子单元。
在操作S12,预测候选确定器11确定属于参考层的用于对作为在操作S11获得的子单元之一的当前子单元进行层间预测的参考子单元。预测候选确定器11可确定包括在与当前子单元的层不同的层中的参考子单元。此外,预测候选确定器11可获得用于对确定的参考子单元进行帧间预测的运动矢量。
预测候选确定器11可在确定参考子单元时,使用将当前子单元与参考子单元进行匹配的视差矢量。
此外,在操作S13,如稍后将描述的,预测候选确定器11可通过使用获得的运动矢量来确定用于对当前子单元进行帧间预测的子运动矢量预测候选。
此外,如稍后参照图7a所描述的,当参考子单元的编码方法是在帧内模式下时,参考子单元的样点值可被用于对当前子单元进行编码或解码。
在操作S13,预测候选确定器11通过使用在操作S12确定的用于对参考子单元进行帧间预测的运动矢量来确定用于对当前子单元进行帧间预测的子运动矢量预测候选。
预测候选确定器11可使用参考子单元的运动矢量以确定在对当前子单元进行帧间预测中使用的子运动矢量预测候选。
例如,预测候选确定器11可将在操作S12确定的用于对参考子单元进行帧间预测的运动矢量确定为用于对当前子单元进行帧间预测的子运动矢量预测候选。
子运动矢量预测候选除了可包括在操作S12确定的用于对参考子单元进行帧间预测的运动矢量之外还可包括另一候选运动矢量。
在操作S14,运动矢量确定器12可通过使用包括在操作S13确定的子运动矢量预测候选的预测候选之一来确定用于对当前子单元进行帧间预测的运动矢量。
例如,当执行帧间预测的单元是子单元而不是预测单元时,运动矢量确定器12将在操作S12确定的用于对参考子单元进行帧间预测的运动矢量确定为用于对当前子单元进行帧间预测的运动矢量。
此外,如稍后将描述的,编码器或解码器可通过使用在操作S14确定的运动矢量来对当前子单元执行运动补偿。可经由使用在操作S14确定的运动矢量的运动补偿来对当前子单元进行编码或解码。运动补偿可表示通过将通过使用当前图像的运动矢量确定的参考图像与当前图像的残差分量合成来产生当前图像的重建图像的操作。
图2a是根据实施例的涉及运动矢量确定方法的视频编码设备20的框图。
如图2a所示,视频编码设备20可包括第二层编码器18和第一层编码器24。第二层编码器18可包括预测器22和变换量化器23。预测器22可包括根据实施例的运动矢量确定设备10以及残差产生器21。然而,视频编码设备20可包括比图2a所示出的组件更多或更少的组件。
视频编码设备20可产生数据流。由视频编码设备20产生的数据流可由网络抽象层(NAL)单元来配置。
NAL单元是配置比特流的基本单元。此外,一个或更多个NAL单元可配置数据流。视频编码设备20可将由一个或更多个NAL单元配置的数据流发送到外部源。
根据实施例,每个NAL单元可包括2字节的头信息。根据实施例,视频编码设备20可通过将2字节的头信息包括在每个NAL单元中来标识每个NAL单元的内部数据的整体信息。
以下,将描述视频编码设备20的编码处理。
根据各种实施例的视频编码设备20可根据可伸缩视频编码针对每个层对多个图像序列进行分类和编码,并可输出包括针对每个层编码的数据的单独的流。此外,视频编码设备20可通过复用将针对每个层输出的比特流变换并输出为一个比特流。
根据各种实施例的视频编码设备20可根据可伸缩视频编码针对每个层对多个图像序列进行分类和编码,并可输出包括针对每个层编码的数据的单独的流。此外,视频编码设备20可根据不同的层对第一层图像序列和第二层图像序列进行编码。
第一层编码器24可对第一层图像进行编码,并输出包括第一层图像的编码数据的第一层流。
第二层编码器18可对第二层图像进行编码,并输出包括第二层图像的编码数据的第二层流。
例如,根据基于空间可伸缩性的可伸缩视频编码,低分辨率图像可被编码为第一层图像,高分辨率图像可被编码为第二层图像。第一层图像的编码结果可在第一层流中被输出。第二层图像的编码结果可在第二层流中被输出。
作为另一示例,可根据可伸缩视频编码对多视点视频进行编码。左视点图像可被编码为第二层图像,右视点图像可被编码为第一层图像。可选地,中间视点图像、左视点图像和右视点图像可被分别编码为第一层图像、第二层图像和第三层图像。
作为另一示例,可根据基于时间可伸缩性的时间分层预测来执行可伸缩视频编码。可输出包括通过对基本帧率的图像进行编码而产生的编码信息的第一层流。时间级可针对每个帧率被分类并可在层中被分别编码。可通过进一步参照基本帧率的图像对高帧率的图像进行编码来输出包括高速帧率的编码信息的第二层流。
可对第一层和多个第二层执行可伸缩视频编码。在存在三个或更多个第二层的情况下,可对第一层图像、第一第二层图像、第二第二层图像、…、第K第二层图像进行编码。因此,第一层图像的编码结果可在第一层流中被输出,第一第二层图像至第K第二层图像的编码结果可分别在第一第二层流至第K第二层流中被输出。
视频编码设备20可执行用于参考第一层图像来预测第二层图像的层间预测。例如,视频编码设备20可参考第一层图像来预测第二层图像,其中,第一层可表示被参考以对第二层进行编码的层。因此,第一层可与第二层对应,第二层可与第一层对应。
根据各种实施例,视频编码设备20可通过对第一层图像执行包括帧间预测或帧内预测的源编码操作以产生符号数据。例如,视频编码设备20可通过对第一层图像的数据单元的样点执行帧间预测或帧内预测、变换和量化来产生符号数据,并可通过对符号数据执行熵编码来产生第一层流。
视频编码设备20可基于具有树结构的编码单元对第二层图像进行编码。视频编码设备20可通过对第二层图像的数据单元的样点执行预测、变换和量化来产生符号数据,并可通过对符号数据执行熵编码来产生第二层流。
根据各种实施例,视频编码设备20可通过使用第一层图像的重建样点执行对第二层图像进行预测的层间预测。为了基于层间预测结构对第二层图像序列之中的第二层原始图像进行编码,视频编码设备20可通过使用第一层重建图像来产生第二层预测图像,并对第二层原始图像和第二层预测图像之间的预测误差进行编码。
视频编码设备20可针对每个块(诸如编码单元或预测单元)对第二层图像执行层间预测。视频编码设备20可确定第一层图像之中的将由第二层图像的块参考的块。例如,可根据第二层图像中的当前块的位置确定第一层图像中的重建块。视频编码设备20可通过使用与第二层块相应的第一层重建块来确定第二层预测块。
根据实施例,当通过参考第一层对第二层执行层间预测时,第二层可被称为当前层,第一层可被称为参考层。
根据实施例,当通过参考基本层对增强层执行层间预测时,当前层可以是增强层,参考层可以是基本层。
根据实施例,当通过参考基本层对增强层执行层间预测时,视频编码设备20可在对第二层图像进行编码之前对第一层图像进行编码。
根据实施例,当通过参考第一层对第二层执行层间预测时,视频编码设备20可在对增强层图像进行编码之前对基本层图像进行编码。
根据各种实施例的视频编码设备20可针对每个层根据视频的每个图像的块执行编码。
以下,描述由视频编码设备20执行的编码操作。
根据实施例的运动矢量确定设备10可确定用于对预测单元或当前子单元进行帧间预测或层间预测的运动矢量。
根据实施例的运动矢量确定设备10可确定与当前子单元空间上邻近的邻近块、时间上在当前图像之前或之后的图像之中位于与当前子单元相同位置的块、或者包括在参考层中的与当前子单元相应的参考子单元之中的将由当前子单元参考的候选块。
此外,根据实施例的运动矢量确定设备10可通过使用确定的候选块的运动矢量来确定当前子单元的运动矢量。
上面已参照图1a描述了运动矢量确定设备10的详细操作。
根据实施例的残差产生器21可通过使用包括在与当前块相同的层中的参考图像中的由当前块的运动矢量指示的参考块来产生参考块和当前块之间的残差数据。例如,残差产生器21可确定由运动矢量确定设备10确定的运动矢量所指示的参考块,并产生当前子单元和参考块之间的残差数据。这里,当前子单元和参考块都可被包括在当前层中。
根据实施例的残差产生器21可通过使用包括在与当前块的层不同的层中的参考图像中的由当前块的运动矢量指示的参考块来产生参考块和当前块之间的残差数据。例如,残差产生器21可确定由运动矢量确定设备10确定的运动矢量所指示的参考块,并产生当前子单元和参考块之间的残差数据。这里,当前子单元可被包括在当前层中,参考块可被包括在参考层中。
因此,预测器22可输出根据块的残差数据,作为根据块执行帧间预测或层间预测的结果。例如,预测器22可基于根据当前子单元执行帧间预测或层间预测的结果来输出残差数据。
根据实施例的变换量化器23可通过对由预测器22输出的残差数据执行变换和量化来产生量化后的变换系数。变换量化器23可通过对从预测器22接收的根据块的残差数据执行变换和量化来产生根据块的量化后的变换系数。
视频编码设备20可通过对由变换量化器23产生的量化后的变换系数执行熵编码来输出编码比特流。此外,当从预测器22还输出了参考索引和运动矢量时,视频编码设备20可通过不仅对量化后的变换系数执行熵编码还对参考索引和运动矢量执行熵编码来输出比特流。
根据实施例的视频编码设备20可在发送关于确定的运动矢量的数据时使用合并模式或先进运动矢量预测(AMVP)。根据实施例的视频编码设备20可形成用于确定运动矢量的邻近块的列表,并将作为关于在所述列表中的邻近块之中的哪个块将被选择的信息的选择信息发送到视频编码设备25,从而减少运动相关数据的量。此外,视频编码设备20可通过使用合并模式或AMVP来减少在预测单元中发送的运动信息的量。运动信息可包括关于运动矢量的信息。
根据实施例的合并模式是通过使用参考块确定当前块的运动矢量的一种方法。根据实施例的视频编码设备20可在合并模式下确定作为位于当前块附近的块的至少一个空间候选块。此外,根据实施例的视频编码设备20可在合并模式下确定至少一个时间候选块,其中,所述至少一个时间候选块是包括在时间与当前块的时间不同的画面中的块。此外,根据实施例的视频编码设备20可在合并模式下确定包括在参考层中的至少一个候选块。视频编码设备20可在确定候选块时使用视差矢量。这里,视差矢量可表示用于将当前块与候选块进行匹配的运动矢量。此外,根据实施例的视频编码设备20可通过使用参考块的运动矢量来确定包括在参考层中的候选块。
根据实施例的视频编码设备20可通过将根据上述方法确定的候选块组合来确定用于确定当前块的运动矢量的候选块。
根据实施例的候选块可被包括在参考画面中。一个或更多个参考画面可被包括在两个列表中。当两个列表分别被称为参考画面列表0和参考画面列表1时,可通过使用从包括在参考画面列表0中的参考画面中的候选块获得的第一运动矢量以及从包括在参考画面列表1中的参考画面中的候选块获得的第二运动矢量来确定当前块的运动矢量。例如,第一运动矢量和第二运动矢量之一可以是当前块的运动矢量。作为另一示例,通过将第一运动矢量和第二运动矢量组合而确定的新的运动矢量可被确定为当前块的运动矢量。
根据实施例的AMVP模式可表示通过使用差运动矢量、参考画面区分信息和参考索引中的至少一个来重建当前块的方法。
根据实施例的差运动矢量可表示与两个运动矢量之间的差值相应的值。例如,视频编码设备20可通过使用被参考以重建当前块的两个矢量来发送运动矢量的差值。
根据实施例的参考画面区分信息可示出参考块被包括在的画面的列表,其中,参考块被用于对当前块执行帧间预测或层间预测。例如,当帧间预测被执行时,参考画面区分信息可指示是包括在L0中的候选块被使用,还是包括在L1中的候选块被使用,还是包括在L1和L2两者中的候选块被使用。
根据实施例的参考索引可表示指示在对当前块执行帧间预测或层间预测时使用的画面列表中的参考画面的索引。
根据实施例的视频编码设备20可在发送关于通过使用合并模式确定的运动矢量的数据时用信号发送合并索引。
例如,视频编码设备20可从执行运动预测的块之中确定在确定当前块的运动矢量时使用的候选块。视频编码设备20可将作为指示从候选块中选择的块的信息的合并索引发送到视频解码设备25。
根据实施例的视频编码设备20可用信号发送差运动矢量、参考画面区分信息和参考索引中的至少一个,以发送关于通过使用AMVP确定的运动矢量的数据。
根据实施例的视频编码设备20可包括中央处理器(未示出),其中,中央处理器总体控制运动矢量确定设备10、残差产生器21和变换量化器23。可选地,运动矢量确定设备10、残差产生器21和变换量化器23可由它们各自的处理器(未示出)操作,并且视频编码设备20可根据这些处理器(未示出)的交互来总体进行操作。可选地,运动矢量确定设备10、残差产生器21和变换量化器23可根据视频编码设备20的外部处理器(未示出)的控制被控制。
根据实施例的视频编码设备20可包括一个或更多个数据存储单元(未示出),其中,运动矢量确定设备10、残差产生器21和变换量化器23的输入数据和输入数据被存储在所述一个或更多个数据存储单元中。视频编码设备20可包括控制数据存储单元(未示出)的数据输入和输出的存储器控制单元(未示出)。
根据实施例的视频编码设备20可与内部视频编码处理器或外部视频编码处理器关联地操作以输出视频编码结果,从而执行包括变换的视频编码操作。不仅单独的处理器可包括视频编码处理模块,而且视频编码设备20、中央处理器或图形处理器可包括视频编码处理模块,使得视频编码设备20的内部视频编码处理器可执行基本视频编码。
图2b是根据实施例的涉及运动矢量确定方法的视频解码设备25的框图。
如图2b所示,视频解码设备25可包括第一层解码器29和第二层解码器19。第二层解码器19可包括反量化器逆变换器28和运动补偿器27。运动补偿器27可包括根据实施例的运动矢量确定设备10以及块重建器26。然而,视频解码设备25可包括比如图2b示出的组件更多或更少的组件。
根据实施例的视频解码设备25可对当前块执行解码。当前块可包括预测单元和当前子单元。
此外,根据实施例的视频解码设备25可在对当前块执行解码时使用候选块的运动矢量。候选块可包括参考单元和参考子单元。
根据各种实施例的视频解码设备25可根据可伸缩编码针对每个层接收比特流。由视频解码设备25接收的比特流的层数不受限。然而,为了便于描述,将描述视频解码设备25的第一层解码器29接收第一层流并对第一层流进行解码,第二层解码器19接收第二层流并对第二层流进行解码的实施例。
例如,基于空间可伸缩性的视频解码设备25可接收不同分辨率的图像序列根据不同层被编码的流。可通过对第一层流进行解码来重建低分辨率图像序列,可通过对第二层流进行解码来重建高分辨率图像序列。
作为另一示例,可根据可伸缩视频编码来对多视点视频进行解码。当以多个层接收到立体视频流时,第一层流可被解码以重建左视点图像。第二层流可被进一步解码至第一层流以重建右视点图像。
可选地,当以多个层接收到多视点视频流时,第一层流可被解码以重建中间视点图像。第二层流可被进一步解码至第一层流以重建左视点图像。第三层流可被进一步解码至第一层流以重建右视点图像。
作为另一示例,可执行基于时间可伸缩性的可伸缩视频编码。第一层流可被解码以重建基本帧率图像。第二层流可被进一步解码至第一层流以重建高速帧率图像。
此外,在存在三个或更多个当前层的情况下,可从第一层流重建第一层图像。如果通过参考第一层重建图像来进一步对第二层流进行解码,则第二层图像可被进一步重建。如果通过参考第二层重建图像来进一步对第K层流进行解码,则第K层图像可被进一步重建。
视频解码设备25可从第一层流和第二层流获得第一层图像和第二层图像的编码数据,并可进一步获得通过帧间预测产生的运动矢量和通过层间预测产生的预测信息。
例如,视频解码设备25可对针对每个层的帧间预测的数据进行解码,并可对多个层之间的层间预测的数据进行解码。可基于编码单元或预测单元通过运动补偿和层间解码来执行重建。
对于每层流,通过参考通过相同层的帧间预测而预测出的重建图像来执行对当前图像的运动补偿。运动补偿是指将通过使用当前图像的运动矢量确定的参考图像和当前图像的残差进行合成并且对当前图像的重建图像进行重建的操作。
此外,视频解码设备25可参照第一层图像的预测信息来执行层间解码以对通过层间预测而被预测的第二层图像进行解码。层间解码是指通过使用不同层的参考块的预测信息重新配置当前图像的预测信息以确定当前图像的预测信息的操作。
根据各种实施例的视频解码设备25可执行用于对参考第二层图像而预测的第三层图像进行重建的层间解码。稍后将参照图3来描述层间预测结构。
然而,根据各种实施例的第二层解码器19可在不参考第一层图像序列的情况下对第二层流进行解码。因此,不应限制地解释为第二层解码器19仅执行层间预测以对第二层图像序列进行解码。
视频解码设备25针对每个块对视频的每个图像进行解码。块可包括根据树结构的编码单元之中的最大编码单元、编码单元、预测单元、变换单元等。
第一层解码器29可通过使用解析出的第一层图像的编码符号来对第一层图像进行解码。如果视频解码设备25基于具有树结构的编码单元来接收编码的流,则第一层解码器29可针对第一层流的每个最大编码单元,基于具有树结构的编码单元来执行解码。
第一层解码器29可针对每个最大编码单元执行熵编码,并可获得编码信息和编码的数据。第一层解码器29可对从流获得的编码的数据执行反量化和逆变换以重建残差分量。根据另一实施例的第一层解码器29可直接接收量化后的变换系数的比特流。作为对量化后的变换系数执行反量化和逆变换的结果,图像的残差分量可被重建。
第一层解码器29可通过确定预测图像,并通过相同层图像之间的运动补偿将预测图像和残差分量进行组合来重建第一层图像。
第二层解码器19可根据层间预测结构通过使用第一层重建图像的样点来产生第二层预测图像。第二层解码器19可根据层间预测对第二层流进行解码以获得预测误差。第二层解码器19可将第二层预测图像和预测误差进行组合,从而产生第二层重建图像。
第二层解码器19可使用解码的第一层重建图像来确定第二层预测图像。第二层解码器19可根据层间预测结构确定第一层图像之中的将被第二层图像中的诸如编码单元或预测单元的块参考的块。例如,可确定第一层图像之中的位置与第二层图像中的当前块的位置相应的重建块。第二层解码器19可使用与第二层块相应的第一层重建块来确定第二层预测块。
第二层解码器19可将根据层间预测结构使用第一层重建块确定的第二层预测块用作用于对第二层原始块进行层间预测的参考图像。在这种情况下,第二层解码器19可通过将使用第一层重建图像确定的第二层预测块的样值与根据层间预测的残差分量进行合成来重建第二层块。
根据实施例,当通过参考第一层对第二层执行层间预测时,第二层可以是当前层,第一层可以是参考层。
根据实施例,当通过参考基本层对增强层执行层间预测时,当前层可被称为增强层,参考层可被称为基本层。
根据实施例,当通过参考第一层对第二层执行层间预测时,视频解码设备25可在对第二层图像进行解码之前对第一层图像进行解码。
根据实施例,当通过参考基本层对增强层执行层间预测时,视频解码设备25可在对增强层图像进行解码之前对基本层图像进行解码。
视频解码设备25可接收数据流。由视频解码设备25接收到的数据流可由NAL单元配置。
NAL单元是配置比特流的基本单元。此外,一个或更多个NAL单元可配置数据流。视频解码设备25可将由一个或更多个NAL单元配置的数据流发送到外部源。
视频解码设备25可接收数据流,将数据流分离成NAL单元,并对每个NAL单元进行解码。
每个NAL单元可包括2字节的头信息。此外,视频解码设备25对每个NAL单元中的2字节的头信息进行解码以识别每个NAL单元的内部数据的整体信息。
根据各种实施例的视频解码设备25可通过对基本层图像执行包括帧间预测或帧内预测的源编码操作来产生符号数据。例如,视频解码设备25可通过对基本层图像的数据单元的样点执行帧间预测或帧内预测、变换、量化来产生符号数据,并可通过对符号数据执行熵编码来产生基本层流。
此外,视频解码设备25可在执行视频解码时执行滤波。
根据实施例的视频解码设备25可通过对通过执行帧间预测或帧内预测而产生的符号数据进行滤波来产生增强的滤波后的符号数据。
根据另一实施例的视频解码设备25可通过对重建的图像信号进行滤波来产生增强的重建图像信号。
在环内(in-loop)滤波期间,根据另一实施例的视频解码设备25可执行除了去块滤波和样点自适应偏移(SAO)滤波之外的另外的滤波。
以下,将描述视频解码设备25的解码操作。
以上参照图1a描述了运动矢量确定设备10的操作。
视频解码设备25可接收当前块的参考索引和量化后的变换系数以及候选块的运动矢量。反量化器逆变换器28可通过对接收到的当前块的量化后的变换系数执行反量化和逆变换来重建当前块的残差数据。
运动补偿器27可通过对经由帧间预测而编码的当前块执行运动补偿来重建当前块。
运动矢量确定设备10可确定根据块的运动矢量。运动矢量确定设备10可针对运动矢量预测确定包括用于当前块预测的至少一个候选运动矢量的预测候选。候选块可包括并置(collcated)块或邻近块。运动矢量确定设备10可从包括在预测候选中的候选运动矢量之中确定一个参考运动矢量。
运动矢量确定设备10可通过从包括在预测候选中的运动矢量之中选择最佳候选运动矢量来确定参考运动矢量,并通过使用参考运动矢量预测并确定当前块的运动矢量。
块重建器26可确定当前块的参考图像,其中,当前块的参考图像由视频解码设备25所接收到的当前块的参考索引来指示。由运动矢量确定设备10确定的当前块的运动矢量可确定在参考图像中指示的参考块,并且可通过将当前块的残差数据与参考块组合来重建当前块。
因此,运动补偿器27可通过执行根据块的运动补偿来重建块,并重建包括重建的块的当前图像。因此,视频解码设备25可随着图像被重建来重建包括图像序列的视频。
视频解码设备25还可包括环内滤波单元,其中,环内滤波单元对随着块被重建而被重建的当前块执行去块滤波并对包括重建的块的重建图像执行去块滤波。
视频解码设备25可接收编码的视频流,并且通过对视频流进行解码来重建视频。在这种情况下,视频解码设备25可通过解析接收到的视频流从视频流中提取当前块的参考索引和量化后的变换系数以及候选块的运动矢量。此外,视频解码设备25还可包括接收器,其中,接收器接收比特流,并对比特流执行熵解码以从比特流解析并提取当前块的参考索引和量化后的变换系数以及候选块的运动矢量。
此外,为了使以上参照图2a描述的视频编码设备20产生将被参考以对另一图像进行帧间预测的重建图像,视频解码设备25可被组合到视频编码设备20。在这种情况下,视频解码设备25可接收由视频编码设备20经由帧间预测、变换和量化而产生并输出的当前块的参考索引和量化后的变换系数以及候选块的运动矢量,并通过反量化器逆变换器28和运动补偿器27输出最终重建的当前图像。由视频解码设备25输出的重建后的图像可被用作用于对视频编码设备20的另一图像进行帧间预测的参考图像。
根据实施例的视频解码设备25可基于当接收到关于运动矢量的数据时的模式是合并模式还是AMVP来不同地进行操作。
以上已参照图2a描述了合并模式和AMVP。
根据实施例的视频解码设备25可通过解析接收到的比特流来确定预测模式是合并模式还是AMVP。
当预测模式是合并模式时,根据实施例的视频解码设备25可从接收到的比特流获得合并索引。随后,合并索引可被解析以确定当前块的运动矢量。随后,可通过使用确定的运动矢量来重建当前块。
根据实施例的合并索引可表示视频编码设备20在发送关于通过使用合并模式确定的运动矢量的数据时所使用的数据。
当预测模式是AMVP时,根据实施例的视频解码设备25可从接收到的比特流获得差运动矢量、参考画面区分信息和参考索引中的至少一个。此外,可通过解析获得的信息来确定当前块的运动矢量。随后,可通过使用确定的运动矢量来重建当前块。
如上所述,在根据实施例的运动矢量确定设备10中,通过划分视频数据而获得的块被划分为树结构的编码单元,并且用于对编码单元进行帧间预测的预测单元被使用。稍后将参照图8至图20描述基于树结构的编码单元和变换单元的视频编码方法和设备以及视频解码方法和设备。
根据实施例的视频解码设备25可包括中央处理器(未示出),其中,中央处理器总体控制运动矢量确定设备10、块重建器26和反量化器逆变换器28。可选地,视频解码设备25可根据处理器(未示出)的交互进行总体操作。可选地,可根据视频解码设备25的外部处理器(未示出)的控制来控制运动矢量确定设备10、块重建器26和反量化器逆变换器28。
根据实施例的视频解码设备25可包括一个或更多个数据存储单元(未示出),其中,运动矢量确定设备10、块重建器26和反量化器逆变换器28的输入数据和输入数据被存储在所述一个或更多个数据存储单元中。视频解码设备25可包括控制数据存储单元(未示出)的数据输入和输出的存储器控制单元(未示出)。
根据实施例的视频解码设备25可与内部视频解码处理器或外部视频解码处理器关联地操作以输出视频解码结果,从而执行包括变换的视频解码操作。不仅单独的处理器可包括视频解码处理模块,而且视频解码设备25、中央处理器或图形处理器可包括视频解码处理模块,使得视频解码设备25的内部视频解码处理器可执行基本视频解码。以下,将参照图3至图7b来描述可由根据实施例的视频解码设备25执行的滤波器操作的各种实施例。
图3示出根据各种实施例的层间预测结构30。
以下,将参照图3描述由根据各种实施例的视频编码设备20执行的层间预测结构。
图3示出根据各种实施例的层间预测结构。
根据实施例的视频编码设备20可根据图3的多视点视频预测结构的再现顺序30来对基本视点图像、左视点图像和右视点图像进行预测编码。
根据现有技术的多视点视频预测结构的再现顺序30,相同视点的图像可沿水平方向被布置。因此,由“左”指示的左视点图像可沿水平方向被布置在一条线上,由“中心”指示的基本视点图像可沿水平方向被布置在一条线上,由“右”指示的右视点图像可沿水平方向被布置在一条线上。相对于左视点图像/右视点图像,基本视点图像可以是中心视点图像。
此外,具有相同POC顺序的图像可沿垂直方向被布置。图像的POC顺序指示形成视频的图像的再现顺序。在多视点视频预测结构30中指示的“POC X”是指在相应列中的图像的相对再现顺序,其中,当X的值低时,再现顺序在前,当X的值高时,再现顺序在后。
因此,根据现有技术的多视点视频预测结构的再现顺序30,由“左”指示的左视点图像可根据POC顺序(再现顺序)沿水平方向被布置,由“中心”指示的基本视点图像可根据POC顺序(再现顺序)沿水平方向被布置,由“右”指示的右视点图像可根据POC顺序(再现顺序)沿水平方向被布置。此外,与基本视点图像位于相同列中的左视点图像和右视点图像具有不同的视点但具有相同的POC顺序(再现顺序)。
四个连续图像根据视点形成一个画面组(GOP)。每个GOP包括连续锚画面(anchorpicture)之间的图像和一个锚画面(关键画面)(key picture)。
锚画面是随机访问点,当在再现视频的同时从根据再现顺序(即,根据POC顺序)布置的图像中任意选择再现位置时,根据POC顺序最接近再现位置的锚画面被再现。基本层图像包括基本层锚画面31至35,左视点图像包括左视点锚画面131至135,右视点图像包括右视点锚画面231至235。
可根据GOP顺序再现并预测(重建)多视点图像。首先,根据多视点视频预测结构的再现顺序30,包括在GOP 0中的图像可根据视点被再现,随后包括在GOP 1中的图像可根据视点被再现。也就是说,可按照GOP 0、GOP 1、GOP 2和GOP 3的顺序来再现包括在每个GOP中的图像。此外,根据多视点视频预测结构的编码顺序,包括在GOP 0中的图像根据视点被预测(重建),并且随后包括在GOP 1中的图像可根据视点被预测(重建)。也就是说,可按照GOP0、GOP 1、GOP 2和GOP 3的顺序来预测(重建)包括在每个GOP中的图像。
根据多视点视频预测结构的再现顺序30,可对图像执行视点间预测(层间预测)和帧间预测。在多视点视频预测结构中,箭头开始的图像是参考图像,箭头结束的图像是通过使用参考图像被预测的图像。
基本视点图像的预测结果可被编码,并随后以基本视点图像流的形式被输出,并且附加视点图像的预测结果可被编码,并随后以层比特流的形式被输出。另外,左视点图像的预测编码结果可被输出为基于层比特流,右视点图像的预测编码结果可被输出为增强层比特流。
对基本视点图像仅执行帧间预测。换句话说,I画面类型的基本层锚画面31至35不参考其它图像,而其余的B画面类型的图像和b画面类型的图像通过参考其它基本视点图像而被预测。B画面类型的图像通过参考根据POC顺序在B画面类型的图像之前的I画面类型的锚画面和在后的I画面类型的锚画面而被预测。b画面类型的图像通过参考根据POC顺序在b画面类型的图像之前的I类型的锚画面和在后的B画面类型的图像或者通过参考根据POC顺序在b画面类型的图像之前的B画面类型的图像和在后的I画面类型的锚画面而被预测。
对左视点图像和右视点图像中的每个视点图像执行参考不同视点图像的视点间预测(层间预测)和参考相同视点图像的帧间预测。
可通过分别参考具有相同POC顺序的基本视点锚画面31至35对左视点锚画面131至135执行视点间预测(层间预测)。可通过分别参考具有相同POC顺序的基本视点锚画面31至35或左视点锚画面131至135对右视点锚画面231至235执行视点间预测。此外,可通过参考具有相同POC顺序的其它视点图像来对除了左视点图像131至135和右视点图像231至235之外的其余图像执行视点间预测(层间预测)。
左视点图像和右视点图像之中的除了锚画面131至135以及231至235之外的其余图像可参考相同视点图像而被预测。
然而,左视点图像和右视点图像中的每一个可不参考相同视点的附加视点图像之中的具有在前再现顺序的锚画面而被预测。也就是说,为了对当前左视点图像执行帧间预测,可参考除了再现顺序在当前左视点图像之前的左视点锚画面之外的左视点图像。类似地,为了对当前右视点图像执行帧间预测,可参考除了再现顺序在当前右视点图像之前的右视点锚画面之外的右视点图像。
此外,为了对当前左视点图像执行帧间预测,可通过不参考属于在当前左视点所属的当前GOP之前的GOP的左视点图像,而是通过参考属于当前GOP并将在当前左视点图像之前被重建的左视点图像,来执行预测。相同方式可被应用于右视点图像。
根据各种实施例的视频解码设备25可根据图3的多视点视频预测结构的再现顺序30来重建基本视点图像、左视点图像和右视点图像。
可通过参考基本视点图像的视点间视差补偿和参考左视点图像的帧间运动补偿来重建左视点图像。可通过参考基本视点图像和左视点图像的视点间视差补偿和参考右视点图像的帧间运动补偿来重建右视点图像。参考图像可被首先重建以用于对左视点图像和右视点图像进行视差补偿和运动补偿。
为了对左视点图像进行帧间运动补偿,可通过参考重建的左视点参考图像的帧间运动补偿来重建左视点图像。为了对右视点图像进行帧间运动补偿,可通过参考重建的右视点参考图像的帧间运动补偿来重建右视点图像。
此外,为了对当前左视点图像进行帧间运动补偿,可参考属于当前左视点图像的当前GOP并且将在当前左视点图像之前被重建的左视点图像,而不参考属于在当前GOP之前的GOP的左视点图像。相同方式可被应用于右视点图像。
此外,根据各种实施例的视频解码设备25可不仅执行视差补偿(或层间预测补偿)以对多视点图像进行编码或解码,还可经由视点间运动矢量预测执行图像之间的运动补偿(或层间运动预测补偿)。
图4a和图4b示出根据各种实施例的运动矢量确定方法。
图4a描述确定属于当前层的当前子单元44的第二运动矢量48的方法。
当前层40可包括预测单元42。预测单元42可被划分为多个子单元43。
根据实施例的预测候选确定器11可在确定与当前子单元相应的参考子单元时使用包括在当前子单元中的像素。
例如,预测候选确定器11可通过使用视差矢量49来确定作为参考单元45中的像素的与作为在当前子单元44中的中心位置处的像素的第一像素相应的第二像素。此外,包括第二像素的参考子单元46可被确定为与当前子单元44相应的参考子单元46。
根据实施例的在当前子单元44中的中心位置处的像素可位于当前子单元44的左上方。根据另一实施例的在当前子单元44中的中心位置处的像素可位于当前子单元44的中心。根据另一实施例的在当前子单元44中的中心位置处的像素可以是当前子单元44的像素之中的最接近预测单元的中心的像素。
根据实施例的视差矢量49可将预测单元42与参考单元45匹配。可选地,根据实施例的视差矢量49可将当前子单元44和参考子单元46匹配。根据实施例的视差矢量可根据预测单元或根据子单元43被确定。
第一运动矢量47可表示用于对参考子单元46进行帧间预测的运动矢量。此外,第二运动矢量48可表示用于对当前子单元44进行帧间预测的运动矢量。
根据实施例的运动矢量确定单元10可在按照子单元43执行预测时将第一运动矢量47确定为第二运动矢量48。
根据另一实施例的运动矢量确定设备10可通过使用第一运动矢量47确定用于对当前子单元44进行帧间预测的子运动矢量预测候选。
例如,运动矢量确定设备10可将第一运动矢量47用作用于确定第二运动矢量48的候选运动矢量。根据实施例的运动矢量确定设备10可将第一运动矢量47确定为子运动矢量预测候选。此外,子运动矢量预测候选可以是用于对当前子单元44进行帧间预测的候选运动矢量之一。运动矢量确定设备10可将第一运动矢量47包括到用于确定第二运动矢量48的预测候选中。此外,运动矢量确定设备10可从包括在预测候选中的运动矢量之中选择用于对当前子单元44进行帧间预测或层间预测的运动矢量。
根据实施例的运动矢量确定设备10可在确定参考子单元46的运动矢量时使用与参考子单元46邻近的块或位于参考子单元46中的块。
根据另一实施例的运动矢量确定设备10可通过预测包括位于参考子单元46中的中心位置处的像素的块的运动矢量来确定参考子单元46的运动矢量。
例如,运动矢量确定设备10可通过预测具有预设尺寸并包括位于参考子单元46的左上方的像素的块的运动矢量来确定参考子单元46的运动矢量。
作为另一示例,运动矢量确定设备10可通过预测具有预设尺寸并包括位于参考子单元46中的中心处的像素的块的运动矢量来确定参考子单元46的运动矢量。
作为另一示例,运动矢量确定设备10可通过预测具有预设尺寸并包括参考子单元46中的像素之中的与参考单元45的中心最接近的像素的块的运动矢量来确定参考子单元46的运动矢量。
根据实施例的运动矢量确定设备10可按照对子单元43执行帧间预测或层间预测时,在不必确定另一候选运动矢量是否是第一运动矢量47的情况下,将第二运动矢量48确定为第一运动矢量47。
图4b是用于描述确定参考子单元46的运动矢量的方法的实施例的示图。
根据实施例,运动矢量确定设备10可通过预测包括位于参考子单元46中的中心处的像素的块的运动矢量来确定参考子单元46的运动矢量。
例如,运动矢量确定设备10可通过预测具有预设尺寸并包括参考子单元46中的像素之中的与参考单元45的中心最接近的像素的块的运动矢量来确定参考子单元46的运动矢量。参考子单元46中的像素之中的与参考单元45的中心最接近的像素可以是第一像素57、第二像素58、第三像素59和第四像素60之一。
根据另一实施例,当参考单元45被划分为四个块时,运动矢量确定设备10可将与第一像素57至第四像素60之中的包括在参考子单元46中的像素相应的运动矢量确定为第一运动矢量47。例如,当包括在参考子单元46中的像素是第一像素57时,与第一像素57相应的运动矢量可被确定为第一运动矢量47。
根据另一实施例,当参考单元45被划分为四个块时,运动矢量确定设备10可将具有预设尺寸并与第一像素57至第四像素60之中的包括在参考子单元46中的像素相应的块的运动矢量确定为第一运动矢量47。
图5a至图5f示出根据各种实施例的划分预测单元的方法。
图5a示出预测候选确定器11将具有方形形状的第一预测单元51划分为四个子单元的实施例。
例如,第一预测单元51的尺寸可以是16×16。
作为另一示例,第一预测单元51的尺寸可以是2N×2N。
作为另一示例,第一预测单元51的尺寸可以等于或大于16×16。当子单元的最小尺寸为8×8并且第一预测单元51的尺寸小于16×16时,第一预测单元51不能够被划分为四个子单元,并因此第一预测单元51的尺寸可等于或大于16×16。
图5b示出预测候选确定器11将具有方形形状的第二预测单元52划分为16个子单元的实施例。
例如,第二预测单元52的尺寸可以是64×64。
作为另一示例,第二预测单元52的尺寸可以是2N×2N。
作为另一示例,第二预测单元52的尺寸可以等于或大于32×32。当子单元的最小尺寸为8×8并且第二预测单元52的尺寸小于32×32时,第二预测单元52不能够被划分为16个子单元,并因此第二预测单元52的尺寸可等于或大于32×32。
图5c示出预测候选确定器11将具有矩形形状的第三预测单元53划分为两个子单元的实施例。
例如,第三预测单元53的尺寸可以是64×32。
作为另一示例,第三预测单元53的尺寸可以是2N×N。
作为另一示例,第三预测单元53的尺寸可以等于或大于16×8。当子单元的最小尺寸为8×8并且第三预测单元53的尺寸小于16×8时,第三预测单元53不能够被划分为两个子单元,并因此第三预测单元53的尺寸可等于或大于16×8。
图5d示出预测候选确定器11将具有矩形形状的第四预测单元54划分为两个子单元的实施例。
例如,第四预测单元54的尺寸可以是64×32。
作为另一示例,第四预测单元54的尺寸可以是N×2N。
作为另一示例,第四预测单元54的尺寸可以等于或大于8×16。当子单元的最小尺寸为8×8并且第四预测单元54的尺寸小于8×16时,第四预测单元54不能够被划分为两个子单元,并因此第四预测单元54的尺寸可等于或大于8×16。
图5e示出预测候选确定器11将具有矩形形状的第五预测单元55划分为8个子单元的实施例。
例如,第五预测单元55的尺寸可以是32×16。
作为另一示例,第五预测单元55的尺寸可以是2N×N。
作为另一示例,第五预测单元55的尺寸可以等于或大于32×16。当子单元的最小尺寸为8×8并且第五预测单元55的尺寸小于32×16时,第五预测单元55不能够被划分为8个子单元,并因此第五预测单元55的尺寸可等于或大于32×16。
图5f示出预测候选确定器11将具有矩形形状的第六预测单元56划分为8个子单元的实施例。
例如,第六预测单元56的尺寸可以是32×64。
作为另一示例,第六预测单元56的尺寸可以是N×2N。
作为另一示例,第六预测单元56的尺寸可以等于或大于16×32。当子单元的最小尺寸为8×8并且第六预测单元56的尺寸小于16×32时,第六预测单元56不能够被划分为8个子单元,并因此第六预测单元56的尺寸可等于或大于16×32。
图6a至图6c示出根据各种实施例的关于运动矢量确定方法的语法或语义。
图6a是用于描述与确定子单元的运动矢量的方法相关的关于子单元的最小尺寸的语法元素。
第一语法元素61指示:当当前层的ID不为0时,关于与当前层的ID相应的层间运动矢量预测的标记被解析。
第二语法元素62指示:当预测单元被划分为子单元时,子单元的尺寸被解析。当子单元的尺寸为sub_pb_size时,“log2(sub_pb_size)-3”的值被用信号发送。为了满足用信号发送的值等于或大于0的条件,子单元的尺寸可等于或大于8。因此,子单元的最小尺寸可以是8×8。
图6b是用于描述关于确定是否按照子单元执行预测的方法的语义的示图。
当确定变量N时,可使用合并候选列表。
例如,如第一语义63所指示的,当预测单元的宽度和高宽之和为12时,在确定变量N时可使用在HEVC中使用的合并候选列表。然而,如第二语义64所指示的,当预测单元的宽度和高度之和不为12时,在确定变量N时可使用通过扩展在HEVC中使用的合并候选列表而获得的合并候选列表。
当通过扩展在HEVC中使用的合并候选列表而获得的合并候选列表被用于执行根据实施例的帧间预测时,可执行将预测单元划分为多个子单元的操作。
因此,可基于预测单元的宽度和高度之和来确定在执行根据实施例的帧间预测时是否按照子单元执行预测。
例如,当预测单元的宽度和高度之和为12时,按照预测单元执行帧间预测,但是不按照子单元执行帧间预测。作为另一示例,当预测单元的尺寸为8×4或4×8时,按照预测单元执行帧间预测,但是不按照子单元执行帧间预测。
作为另一示例,当预测单元的宽度和高度之和不为12时,可按照子单元执行帧间预测。作为另一示例,当预测单元的尺寸为16×8时,可按照子单元执行帧间预测。
图6c示出关于通过比较子单元的预设尺寸和预测单元的尺寸来确定执行帧间预测或层间预测的单元的尺寸的方法的语义。
在图6c中,nSbW可表示子单元的宽度,nPbW可表示当前被编码或解码的预测单元的宽度,nSbH可表示子单元的高度,nPbH可表示当前被编码或解码的预测单元的高度,SubPbSize可表示子单元的预设尺寸,minSize可表示最小子单元尺寸。
根据实施例的运动矢量确定设备10可通过比较当前被编码或解码的预测单元的尺寸和子单元的预设尺寸来确定子单元的尺寸。
例如,如第三语义65所指示的,当当前被编码或解码的预测单元的宽度小于或等于预设子单元的宽度时,运动矢量确定设备10可将子单元的宽度确定为与预测单元的宽度相同。
作为另一示例,如第三语义65所指示的,当当前被编码或解码的预测单元的宽度大于预设子单元的宽度时,运动矢量确定设备10可将子单元的宽度确定为预定最小尺寸。
作为另一示例,如第四语义66所指示的,当当前被编码或解码的预测单元的高度小于或等于预设子单元的高度时,运动矢量确定设备10可将子单元的高度确定为与预测单元的高度相同。
作为另一示例,如第四语义66所指示的,当当前被编码或解码的预测单元的高度大于预设子单元的高度时,运动矢量确定设备10可将子单元的高度确定为预定最小尺寸。
图7a是用于描述根据实施例的与参考单元的帧内预测区域相关的运动矢量确定方法的示图。
包括在当前层70中的预测单元72可被划分为子单元73。
预测单元72可与包括在参考层71中的参考单元75相应。例如,运动矢量确定设备10可通过使用第一视差矢量77将预测单元72与参考单元75匹配。
第一视差矢量77和第二视差矢量78可相互关联。例如,在确定与预测单元72相应的参考单元75时使用的第一视差矢量77可与在确定与当前子单元74相应的第二参考子单元79时使用的第二视差矢量78相同。作为另一示例,运动矢量确定设备10可通过使用第一视差矢量77来确定第二视差矢量78。
包括在参考层71中的与包括在当前层70中的当前子单元74相应的第二参考子单元79的编码模式可以是帧内模式。
当第二参考子单元79在帧内模式下被编码时,不会存在与第二参考子单元79相应的运动矢量。
因此,当与当前子单元74相应的第二参考子单元79的编码模式是帧内模式时,运动矢量确定设备10可将第二视差矢量78确定为用于对当前子单元74进行预测的运动矢量。例如,当第二参考子单元79的编码模式是帧内模式时,视频解码设备25可通过使用第二视差矢量78执行层间预测来对当前子单元74进行解码。当根据实施例的视频解码设备25通过使用第二视差矢量78执行层间预测时,当前子单元74的像素值可与第二参考子单元79的像素值相同。
图7b是用于描述根据实施例的划分参考块的方法的示图。
参考单元75可位于参考层71的图像中的特定边界线上。因此,运动矢量确定设备10可在将参考单元75划分为多个块时考虑特定边界线。
在运动矢量确定设备10将参考单元75划分为多个块时考虑的根据实施例的特定边界线可由编码单元形成。运动矢量确定设备10可通过考虑划分用于对参考图像进行编码的编码单元的边界线来将参考单元75划分为多个块。
例如,运动矢量确定设备10可调整第一参考子单元14至第四参考子单元17的尺寸,使得参考单元75根据由编码单元形成的边界线80而被划分为多个块。
以上已参照图4描述了通过使用像素确定参考子单元的方法。
此外,以上已参照图1至图2b描述了在参考子单元被确定之后确定运动矢量的方法。图8是根据一个或更多个实施例的基于根据树结构的编码单元的视频编码设备100的框图。
涉及基于根据树结构的编码单元的视频预测的视频编码设备100包括编码单元确定器120和输出器130。
编码单元确定器120可基于图像的当前画面的LCU来对当前画面进行划分,其中,LCU是具有最大尺寸的编码单元。如果当前画面大于LCU,则可将当前画面的图像数据划分为至少一个LCU。根据一个或更多个实施例的LCU可以是尺寸为32×32、64×64、128×128、256×256等的数据单元,其中,数据单元的形状是宽度和长度为2的若干次方的正方形。
根据一个或更多个实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从LCU被空间划分的次数,并且随着深度加深,根据深度的较深层编码单元可从LCU被划分到最小编码单元(SCU)。LCU的深度为最高深度,SCU的深度为最低深度。由于随着LCU的深度加深,与每个深度相应的编码单元的尺寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为LCU,并且每个LCU可包括根据深度被划分的较深层编码单元。由于根据深度对根据一个或更多个实施例的LCU进行划分,因此可根据深度对包括在LCU中的空间域的图像数据进行分层地分类。
可预先确定编码单元的最大深度和最大尺寸,其中,所述最大深度和最大尺寸限制对LCU的高度和宽度进行分层划分的总次数。
编码单元确定器120对通过根据深度对LCU的区域进行划分而获得的至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换句话说,编码单元确定器120通过根据当前画面的LCU以根据深度的较深层编码单元对图像数据进行编码,并选择具有最小编码误差的深度,来确定深度。确定的深度和根据确定的深度的被编码的图像数据被输出到输出器130。
基于与等于或低于最大深度的至少一个深度相应的较深层编码单元,对LCU中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个LCU选择至少一个深度。
随着编码单元根据深度而被分层地划分并且编码单元的数量增加,LCU的尺寸被划分。另外,即使在一个LCU中编码单元与同一深度相应,也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分为更低深度。因此,即使图像数据被包括在一个LCU中,在一个LCU中编码误差可根据区域而不同,因此在图像数据中深度可根据区域而不同。因此,可在一个LCU中确定一个或更多个深度,并且可根据至少一个深度的编码单元来对LCU的图像数据进行划分。
因此,编码单元确定器120可确定包括在LCU中的具有树结构的编码单元。根据一个或更多个实施例的“具有树结构的编码单元”包括LCU中所包括的所有较深层编码单元中的与确定为深度的深度相应的编码单元。可根据LCU的相同区域中的深度来分层地确定深度的编码单元,并可在不同区域中独立地确定深度的编码单元。类似地,可独立于另一区域中的深度而确定当前区域中的深度。
根据一个或更多个实施例的最大深度是与从LCU到SCU进行划分的次数有关的索引。根据一个或更多个实施例的第一最大深度可表示从LCU到SCU的总划分次数。根据一个或更多个实施例的第二最大深度可表示从LCU到SCU的深度等级的总数。例如,当LCU的深度是0时,对LCU划分一次的编码单元的深度可被设置为1,对LCU划分两次的编码单元的深度可被设置为2。这里,如果SCU是对LCU划分四次的编码单元,则存在深度0、1、2、3和4的5个深度等级,并且因此第一最大深度可被设置为4,第二最大深度可被设置为5。
可根据LCU执行预测编码和变换。还根据LCU,基于根据等于最大深度的深度或小于最大深度的深度的较深层编码单元来执行预测编码和变换。
由于每当根据深度对LCU进行划分时,较深层编码单元的数量增加,因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述,在LCU中,现在将基于当前深度的编码单元来描述预测编码和变换。
视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
为了在LCU中执行预测编码,可基于与深度相应的编码单元(即,基于不再被划分成与更低深度相应的编码单元的编码单元)来执行预测编码。以下,不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元获得的分区可包括预测单元或通过对从预测单元的高度和宽度中选择的至少一个进行划分而获得的数据单元。分区是对编码单元的预测单元进行划分的数据单元,预测单元可以是与编码单元具有相同的尺寸的分区。
例如,当2N×2N(其中,N是正整数)的编码单元不再被划分,并且成为2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区模式的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如,1:n或n:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。
预测单元的预测模式可以是从帧内模式、帧间模式和跳过模式中选择的至少一个。例如,可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。另外,可仅对2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元,来对编码单元中的图像数据执行变换。为了在编码单元中执行变换,可基于具有小于或等于编码单元的尺寸的数据单元来执行变换。例如,用于变换的数据单元可包括帧内模式的数据单元和帧间模式的数据单元。
按照与根据树结构的编码单元类似的方式,编码单元中的变换单元可被递归地划分为更小尺寸的区域。因此,可基于根据变换深度的具有树结构的变换单元,对编码单元中的残差图像数据进行划分。
还可在变换单元中设置变换深度,其中,变换深度指示通过对编码单元的高度和宽度进行划分以达到变换单元所进行的划分的次数。例如,在2N×2N的当前编码单元中,当变换单元的尺寸是2N×2N时,变换深度可为0,当变换单元的尺寸是N×N时,变换深度可为1,当变换单元的尺寸是N/2×N/2时,变换深度可为2。换句话说,可根据变换深度设置具有树结构的变换单元。
根据与深度相应的编码单元的编码信息不仅需要关于深度的信息,还需要关于与预测编码和变换相关的信息的信息。因此,编码单元确定器120不仅确定具有最小编码误差的深度,还确定预测单元中的分区模式、根据预测单元的预测模式和用于变换的变换单元的尺寸。
下面将参照图7至图19详细描述根据一个或更多个实施例的LCU中的根据树结构的编码单元以及确定预测单元/分区和变换单元的方法。
编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化,来测量根据深度的较深层编码单元的编码误差。
输出器130在比特流中输出LCU的图像数据和关于根据深度的编码模式的信息,其中,所述LCU的图像数据基于由编码单元确定器120确定的至少一个深度被编码。
可通过对图像的残差图像数据进行编码来获得编码的图像数据。
关于根据深度的编码模式的信息可包括关于深度的信息、关于预测单元中的分区模式的信息、关于预测模式的信息和关于变换单元的尺寸的信息。
可通过使用根据深度的划分信息来定义关于深度的信息,其中,根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是深度,则对当前编码单元中的图像数据进行编码并输出,因此划分信息可被定义为不将当前编码单元划分到更低深度。可选地,如果当前编码单元的当前深度不是所述深度,则对更低深度的编码单元执行编码,因此划分信息可被定义为对当前编码单元进行划分来获得更低深度的编码单元。
如果当前深度不是所述深度,则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复执行编码,并且因此可对具有相同深度的编码单元递归地执行编码。
由于针对一个LCU确定具有树结构的编码单元,并且针对深度的编码单元确定关于至少一个编码模式的信息,所以可针对一个LCU确定关于至少一个编码模式的信息。另外,由于根据深度对图像数据进行分层划分,因此LCU的图像数据的深度可根据位置而不同,因此可针对图像数据设置划分信息。
因此,输出器130可将相应的划分信息分配给从包括在LCU中的编码单元、预测单元和最小单元中选择的至少一个。
根据一个或更多个实施例的最小单元是通过将构成最低深度的SCU划分为4份而获得的方形数据单元。可选择地,根据实施例的最小单元可以是包括在LCU中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大方形数据单元。
例如,通过输出器130输出的编码信息可被分类为根据较深层编码单元的编码信息和根据预测单元的编码信息。根据较深层编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。
根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、序列参数集或画面参数集。
还可通过比特流的头、序列参数集或画面参数集输出关于针对当前视频允许的变换单元的最大尺寸的信息和关于变换单元的最小尺寸的信息。输出器130可对与以上参照图1a至图14描述的SAO操作有关的SAO参数进行编码,并输出该SAO参数。
在视频编码设备100中,较深层编码单元可以是通过将更高深度(更高一层)的编码单元的高度或宽度划分成两份而获得的编码单元。换言之,在当前深度的编码单元的尺寸是2N×2N时,更低深度的编码单元的尺寸是N×N。另外,尺寸为2N×2N的当前深度的编码单元可包括最多4个更低深度的编码单元。
因此,视频编码设备100可基于考虑当前画面的特征而确定的LCU的尺寸和最大深度,通过针对每个LCU确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外,由于可通过使用各种预测模式和变换中的任意一个对每个LCU执行编码,因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。
因此,如果以传统宏块对具有高分辨率或大数据量的图像进行编码,则每个画面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩的信息,并且数据压缩效率降低。然而,通过使用视频编码设备100,由于考虑图像的尺寸,在增加编码单元的最大尺寸的同时,基于图像的特征来调整编码单元,因此可增加图像压缩效率。
参照图2a描述的视频编码设备20可包括与层数一样多的视频编码设备100,以针对多层视频的各个层对单层图像进行编码。
当视频编码设备100对第一层图像进行编码时,编码单元确定器120可针对每个最大编码单元的各个根据树结构的编码单元,确定用于帧间预测的预测单元,并可针对各个预测单元执行帧间预测。
当视频编码设备100对第二层图像进行编码时,编码单元确定器120也可针对每个最大编码单元确定预测单元和根据树结构的编码单元,并可针对各个预测单元执行帧间预测。
视频编码设备100可对第一层图像和第二层图像之间的亮度差进行编码以对亮度差进行补偿。然而,可根据编码单元的编码模式来确定是否执行亮度补偿。例如,可仅对2N×2N的预测单元执行亮度补偿。
图9根据一个或更多个实施例的基于具有树结构的编码单元的视频解码设备200的框图。
涉及基于具有树结构的编码单元的视频预测的视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据解码器230。
用于视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图8和视频编码设备100描述的定义相同。
接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流针对每个编码单元提取编码图像数据,并将提取的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个LCU的树结构。图像数据和编码信息提取器220可从关于当前画面的头、序列参数集或画面参数集提取关于当前画面的编码单元的最大尺寸的信息。
另外,图像数据和编码信息提取器220从解析的比特流,根据每个LCU,提取具有树结构的编码单元的划分信息和编码信息。提取的划分信息和编码信息被输出到图像数据解码器230。换言之,比特流中的图像数据被划分为LCU,使得图像数据解码器230针对每个LCU对图像数据进行解码。
可针对与深度相应的至少一条划分信息设置根据LCU的划分信息和编码信息,根据深度的编码信息可包括关于与深度相应的相应编码单元的分区模式的信息、关于预测模式的信息和变换单元的划分信息。另外,根据深度的划分信息可被提取作为关于最终深度的信息。
由图像数据和编码信息提取器220提取的根据每个LCU的划分信息和编码信息是这样的划分信息和编码信息:该划分信息和编码信息被确定为在编码器(诸如,视频编码设备100)根据每个LCU对根据深度的每个较深层编码单元重复地执行编码时产生最小编码误差。因此,视频解码设备200可通过根据产生最小编码误差的深度和编码模式对图像数据进行解码来重建图像。
由于划分信息和编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单元提取划分信息和编码信息。如果相应LCU的划分信息和编码信息根据预定数据单元被记录,则可将被分配了相同的划分信息和编码信息的预定数据单元推断为是包括在同一LCU中的数据单元。
图像数据解码器230基于根据LCU的划分信息和编码信息,通过对每个LCU中的图像数据进行解码来重建当前画面。换言之,图像数据解码器230可基于提取出的关于包括在每个LCU中的具有树结构的编码单元之中的每个编码单元的分区模式、预测模式和变换单元的信息,对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆变换。
图像数据解码器230可基于关于根据深度的编码单元的预测单元的分区模式和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
另外,为了对每个LCU执行逆变换,图像数据解码器230可读取关于每个编码单元的根据树结构的变换单元的信息,从而基于每个编码单元的变换单元执行逆变换。通过逆变换,可重建编码单元的空间域的像素值。
图像数据解码器230可通过使用根据深度的划分信息来确定当前LCU的最终深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是最终深度。因此,图像数据解码器230可针对与深度相应的每个编码单元,通过使用关于预测单元的分区模式的信息、关于预测模式的信息和变换单元的划分信息,对当前LCU中的编码数据进行解码。
换言之,可通过观察分配给编码单元、预测单元和最小单元中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。这样,针对每个编码单元,可通过获得关于编码模式的信息来对当前编码单元进行解码。
参照图2b描述的视频解码设备25可包括与视点数一样多的视频解码设备200,以便对接收到的第一层图像流和第二层图像数据进行解码以重建第一层图像和第二层图像。
当接收到第一层图像流时,视频解码设备200的图像数据解码器230将由图像数据和编码信息提取器220从第一层图像流提取的第一层图像的样点划分为最大编码单元的根据树结构的编码单元。图像数据解码器230可针对第一层图像的样点的各个根据树结构的编码单元,对各个用于帧间预测的预测单元执行运动补偿,以重建第一层图像。
当接收到第二层图像流时,视频解码设备200的图像数据解码器230可将由图像数据和编码信息提取器220从第二层图像流提取的第二层图像的样点划分为最大编码单元的根据树结构的编码单元。图像数据解码器230可对第二层图像的样点的各个用于帧间预测的预测单元执行运动补偿,以重建第二层图像。
图像数据和编码信息提取器220可从比特流获得与第一层图像和第二层图像之间的亮度差相关的信息,以对亮度差进行补偿。然而,可根据编码单元的编码模式确定是否执行亮度补偿。例如,可仅对2N×2N的预测单元执行亮度补偿。
视频解码设备200可获得关于当针对每个最大编码单元递归地执行编码时产生最小编码误差的至少一个编码单元的信息,并且可使用所述信息来对当前画面进行解码。换言之,被确定为每个最大编码单元中的最优编码单元的具有树结构的编码单元可被解码。此外,考虑图像数据的分辨率和图像数据量来确定编码单元的最大尺寸。
因此,即使图像数据具有高分辨率和大数据量,也可通过使用编码单元的尺寸和编码模式,对图像数据进行有效地解码和重建,其中,通过使用从编码器接收到的关于最优编码模式的信息,根据图像数据的特征自适应地确定编码单元的尺寸和编码模式。
图10是用于描述根据各种实施例的编码单元的概念的示图。
编码单元的尺寸可被表示为宽度×高度,并可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区,32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区,16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区,8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。
在视频数据310中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是2。在视频数据320中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是3。在视频数据330中,分辨率是352×288,编码单元的最大尺寸是16,最大深度是1。图17中示出的最大深度表示从LCU到最小编码单元的划分总次数。
如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。
由于视频数据310的最大深度是2,因此由于通过对LCU划分两次,深度加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的LCU和长轴尺寸为32和16的编码单元。由于视频数据330的最大深度是1,因此由于通过对LCU划分一次,深度加深至一层,因此视频数据330的编码单元335可包括长轴尺寸为16的LCU和长轴尺寸为8的编码单元。
由于视频数据320的最大深度是3,因此由于通过对LCU划分三次,深度加深至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的LCU和长轴尺寸为32、16和8的编码单元。随着深度加深,详细信息可被精确地表示。
图11是根据一个或更多个实施例的基于编码单元的图像编码器400的框图。
图像编码器400执行视频编码设备100的编码单元确定器120中对图像数据进行编码所需的操作。换言之,帧内预测器420根据预测单元对当前帧405中的帧内模式下的编码单元执行帧内预测,帧间预测器415通过使用当前图像405和从重建画面缓冲器410获得的参考图像,根据预测单元对帧间模式下的编码单元执行帧间预测。当前图像405可被划分为LCU,并且随后LCU可被顺序编码。在这点上,将被划分为具有树结构的编码单元的LCU可被编码。
通过从关于当前图像405的被编码的编码单元的数据去除从帧内预测器420或帧间预测器415输出的每个模式的关于编码单元的预测数据来产生残差图像数据,并且残差数据通过变换器425和量化器430被输出为根据变换单元的量化后的变换系数。量化后的变换系数通过反量化器445和逆变换器450被重建为空间域中的残差图像数据。重建的空间域中的残差图像数据与从帧内预测器420或帧间预测器415输出的每个模式的针对编码单元的预测数据相加,因此被重建为针对当前图像405的编码单元的空间域中的数据。重建的空间域中的数据通过去块器455和SAO执行器560被产生为重建图像,重建图像被存储在重建画面缓冲器410中。存储在重建画面缓冲器410中的重建图像可被用作用于对另一图像进行帧间预测的参考图像。由变换器425和量化器430量化的变换系数可通过熵编码器435被输出为比特流440。
为了将图像编码器400应用到视频编码设备100中,图像编码器400的所有元件(即,帧间预测器415、帧内预测器420、变换器425、量化器430、熵编码器435、反量化器445、逆变换器450、去块器455和SAO执行器460)基于根据每个LCU的具有树结构的编码单元中的每个编码单元执行操作。
具体地,帧内预测器420和帧间预测器415可考虑当前LCU的最大尺寸和最大深度来确定具有树结构的编码单元之中的每个编码单元的分区模式和预测模式,变换器425可确定是否对具有树结构的编码单元中的每个编码单元中的具有四叉树结构的变换单元进行划分。
图12是根据一个或更多个实施例的基于编码单元的图像解码器500的框图。
熵解码器515从比特流505解析将被解码的编码图像数据和解码所需的关于编码的信息。编码图像数据是量化后的变换系数,其中,反量化器520和逆变换器525从量化后的变换系数重建残差图像数据。
帧内预测器540根据每个预测单元对帧内模式下的编码单元执行帧内预测。帧间预测器535通过使用从重建画面缓冲器530获得的参考图像针对每个预测单元对当前图像405中的帧间模式下的编码单元执行帧间预测。
通过帧内预测器540和帧间预测器535的每个模式的关于编码单元的预测数据和残差图像数据被相加,因此可重建关于当前图像405的编码单元的空间域中的数据,并且重建的空间域中的数据可通过去块器545和SAO执行器550被输出为重建图像560。存储在重建画面缓冲器530中的重建图像可被输出为参考图像。
为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,可执行在根据实施例的图像解码器500的熵解码器515之后的操作。
为了将图像解码器500应用到根据实施例的视频解码设备200中,图像解码器500的所有元件(即,熵解码器515、反量化器520、逆变换器525、帧间预测器535、去块器545和SAO执行器550)可针对每个LCU基于具有树结构的编码单元执行操作。
具体地,SAO执行器550和帧间预测器535可确定每个具有树结构的编码单元的分区和预测模式,逆变换器525可针对每个编码单元确定是否对具有四叉树结构的变换单元进行划分。
图10的编码操作和图11的解码操作分别描述了单层的视频流编码和解码操作。因此,如果图2a的视频编码设备20对两层或更多层的视频流进行编码,则可针对每个层提供图像编码器400。类似地,如果图2b的视频解码设备25对两层或更多层的视频流进行解码,则可针对每个层提供图像解码器500。
图13是示出根据一个或更多个实施例的根据深度的较深层编码单元以及分区的示图。
视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
在根据一个或更多个实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,最大深度是3。在这种情况下,最大深度表示编码单元从LCU被划分到SCU的总次数。由于沿着分层结构600的垂直轴深度加深,因此较深层编码单元的高度和宽度均被划分。另外,预测单元和分区沿着分层结构600的水平轴被示出,其中,所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
换言之,在分层结构600中,编码单元610是LCU,其中,深度为0,尺寸(即,高度乘宽度)为64×64。深度沿着垂直轴加深,并且存在尺寸为32×32且深度为1的编码单元620、尺寸为16×16且深度为2的编码单元630、尺寸为8×8且深度为3的编码单元640。尺寸为8×8且深度为3的编码单元640是SCU。
编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之,如果尺寸为64×64且深度为0的编码单元610是预测单元,则可将预测单元划分成包括在编码单元610中的分区,即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。
类似地,可将尺寸为32×32且深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区,即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。
类似地,可将尺寸为16×16且深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区,即,包括在编码度单元630中的尺寸为16×16的分区630、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。
类似地,可将尺寸为8×8且深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区,即,包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。
为了确定构成LCU 610的编码单元的最终深度,视频编码设备100的编码单元确定器120对包括在LCU 610中的与每个深度相应的编码单元执行编码。
随着深度加深,包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,与深度1相应的编码单元和四个与深度2相应的编码单元均被编码。
为了针对深度之中的当前深度执行编码,可沿着分层结构600的水平轴,通过对与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深度选择最小编码误差。可选地,随着深度沿着分层结构600的垂直轴加深,可通过针对每个深度执行编码,比较根据深度的最小编码误差,来搜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的最终深度和分区模式。
图14是用于描述根据一个或更多个实施例的在编码单元710和变换单元720之间的关系的示图。
视频编码设备100或视频解码设备200针对每个LCU,根据具有小于或等于LCU的尺寸的编码单元对图像进行编码或解码。可基于不大于相应的编码单元的数据单元,来选择用于在编码期间进行变换的变换单元的尺寸。
例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行变换。
此外,可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的每个变换单元执行变换,来对尺寸为64×64的编码单元710的数据进行编码,然后可选择具有最小编码误差的变换单元。
图15是用于描述根据一个或更多个实施例的与深度相应的编码单元的编码信息的示图。
视频编码设备100的输出器130可对与最终深度相应的每个编码单元的关于分区模式的信息800、关于预测模式的信息810以及关于变换单元的尺寸的信息820进行编码,并将信息800、信息810和信息820作为关于编码模式的信息来发送。
信息800指示关于通过划分当前编码单元的预测单元而获得的分区的模式的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。这里,关于分区模式的信息800被设置来指示尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808中的一个。
信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧间变换单元828。
视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元提取并使用用于解码的信息800、810和820。
图16是根据一个或更多个实施例的根据深度的较深层编码单元的示图。
划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。
用于对深度为0且尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区模式的分区:尺寸为2N_0×2N_0的分区模式912、尺寸为2N_0×N_0的分区模式914、尺寸为N_0×2N_0的分区模式916和尺寸为N_0×N_0的分区模式918。图23仅示出了通过对称地划分预测单元910而获得的分区模式912至918,但是分区模式不限于此,并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。
根据每种分区模式,对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。可仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。
如果在分区模式912至916中的一个分区模式中编码误差最小,则可不将预测单元910划分到更低深度。
如果在分区模式918中编码误差最小,则深度从0改变到1以在操作920中划分分区模式918,并对深度为2且尺寸为N_0×N_0的编码单元930重复地执行编码来搜索最小编码误差。
用于对深度为1且尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进行预测编码的预测单元940可包括以下分区模式的分区:尺寸为2N_1×2N_1的分区模式942、尺寸为2N_1×N_1的分区模式944、尺寸为N_1×2N_1的分区模式946以及尺寸为N_1×N_1的分区模式948。
如果在分区模式948中编码误差最小,则深度从1改变到2以在操作950中划分分区模式948,并对深度为2且尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。
当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成d-1,并且划分信息可被编码直到深度是0到d-2中的一个。换句话说,当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-1时,用于对深度为d-1且尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区模式的分区:尺寸为2N_(d-1)×2N(d-1)的分区模式992、尺寸为2N_(d-1)×N(d-1)的分区模式994、尺寸为N_(d-1)×2N(d-1)的分区模式996和尺寸为N_(d-1)×N(d-1)的分区模式998。
可对分区模式992至998中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区模式。
即使当分区模式998具有最小编码误差时,由于最大深度是d,因此深度为d-1的编码单元CU_(d-1)也不再被划分到更低深度,构成当前LCU 900的编码单元的深度被确定为d-1,并且当前LCU 900的分区模式可被确定为N_(d-1)×N(d-1)。此外,由于最大深度是d,并且具有最低深度d-1的SCU 980不再被划分到更低深度,因此不设置SCU 980的划分信息。
数据单元999可以是用于当前LCU的“最小单元”。根据一个或更多个实施例的最小单元可以是通过将SCU 980划分成4份而获得的方形数据单元。通过重复地执行编码,视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定深度,并将相应分区模式和预测模式设置为深度的编码模式。
这样,在所有深度1至d中对根据深度的最小编码误差进行比较,并且具有最小编码误差的深度可被确定为深度。深度、预测单元的分区模式和预测模式可作为关于编码模式的信息被编码并发送。另外,由于编码单元从深度0被划分到深度,因此仅该深度的划分信息被设置为0,并且除了该深度以外的深度的划分信息被设置为1。
视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的深度和预测单元的信息,来对分区912进行解码。视频解码设备200可通过使用根据深度的划分信息,将划分信息为0的深度确定为深度,并且使用关于相应深度的编码模式的信息来进行解码。
图17至图19是用于描述根据一个或更多个实施例的编码单元1010、预测单元1060和变换单元1070之间的关系的示图。
编码单元1010是LCU中的与由视频编码设备100确定的深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010的预测单元的分区,变换单元1070是每个编码单元1010的变换单元。
当在编码单元1010中LCU的深度是0时,编码单元1012和编码单元1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
在预测单元1060中,通过划分编码单元1010中的编码单元来获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说,编码单元1014、1022、1050和1054中的分区模式的尺寸是2N×N,编码单元1016、1048和1052中的分区模式的尺寸是N×2N,编码单元1032的分区模式的尺寸是N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。
在小于编码单元1052的数据单元中的变换单元1070中,对编码单元1052的图像数据执行变换或逆变换。另外,在尺寸和形状方面,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050和1052。换句话说,视频编码设备100和视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。
因此,对LCU的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元,从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区模式的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由视频编码设备100和视频解码设备200设置的编码信息。
[表1]
视频编码设备100的输出器130可输出关于具有树结构的编码单元的编码信息,视频解码设备200的图像数据和编码信息提取器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。
划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0,则当前编码单元不再被划分成更低深度的深度是最终深度,从而可针对所述最终深度来定义关于分区模式、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分,则对更低深度的四个划分编码单元独立地执行编码。
预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可针对所有分区模式定义帧内模式和帧间模式,仅针对尺寸为2N×2N的分区模式定义跳过模式。
关于分区模式的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区模式,以及通过非对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的非对称分区模式。可通过按1:3和3:1划分预测单元的高度来分别获得尺寸为2N×nU和2N×nD的非对称分区模式,可通过按1:3和3:1划分预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的非对称分区模式。
可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换句话说,如果变换单元的划分信息是0,则变换单元的尺寸可以是2N×2N,即当前编码单元的尺寸。如果变换单元的划分信息是1,则可通过对当前编码单元进行划分来获得变换单元。另外,如果尺寸为2N×2N的当前编码单元的分区模式是对称分区模式,则变换单元的尺寸可以是N×N,如果当前编码单元的分区模式是非对称分区模式,则变换单元的尺寸可以是N/2×N/2。
关于具有树结构的编码单元的编码信息可包括从与深度相应的编码单元、预测单元和最小单元中选择的至少一个。与深度相应的编码单元可包括从包含相同编码信息的预测单元和最小单元中选择的至少一个。
因此,通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与深度相应的同一编码单元中。另外,通过使用数据单元的编码信息来确定与深度相应的相应编码单元,并且因此可确定LCU中的深度的分布。
因此,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。
可选地,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元,并可参考搜索到的邻近编码单元以对当前编码单元进行预测。
图20是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。
LCU 1300包括深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里,由于编码单元1318是深度的编码单元,因此划分信息可以被设置成0。可将关于尺寸为2N×2N的编码单元1318的分区模式的信息设置成以下分区模式中的一种:尺寸为2N×2N的分区模式1322、尺寸为2N×N的分区模式1324、尺寸为N×2N的分区模式1326、尺寸为N×N的分区模式1328、尺寸为2N×nU的分区模式1332、尺寸为2N×nD的分区模式1334、尺寸为nL×2N的分区模式1336以及尺寸为nR×2N的分区模式1338。
变换单元的划分信息(TU尺寸标记)是一类变换索引。与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区模式而改变。
例如,当分区模式被设置成对称(即,分区模式1322、1324、1326或1328)时,如果变换单元的TU尺寸标记是0,则设置尺寸为2N×2N的变换单元1342,如果TU尺寸标记是1,则设置尺寸为N×N的变换单元1344。
当分区模式被设置成非对称(即,分区模式1332、1334、1336或1338)时,如果TU尺寸标记是0,则设置尺寸为2N×2N的变换单元1352,如果TU尺寸标记是1,则设置尺寸为N/2×N/2的变换单元1354。
参照图19,TU尺寸标记是具有值0或1的标记,但是TU尺寸标记不限于1比特,在TU尺寸标记从0增加的同时,变换单元可被分层划分以具有树结构。变换单元的划分信息(TU尺寸标记)可以是变换索引的示例。
在这种情况下,根据一个或更多个实施例,可通过使用变换单元的TU尺寸标记以及变换单元的最大尺寸和最小尺寸来表示实际上已使用的变换单元的尺寸。视频编码设备100能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码的结果可被插入SPS。视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记来对视频进行解码。
例如,(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32,则(a-1)当TU尺寸标记为0时,变换单元的尺寸可以是32×32,(a-2)当TU尺寸标记为1时,变换单元的尺寸可以是16×16,(a-3)当TU尺寸标记为2时,变换单元的尺寸可以是8×8。
作为另一示例,(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32,则(b-1)当TU尺寸标记为0时,变换单元的尺寸可以是32×32。这里,由于变换单元的尺寸不能够小于32×32,因此TU尺寸标记不能够被设置为除了0以外的值。
作为另一示例,(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标记为1,则TU尺寸标记可以是0或1。这里,TU尺寸标记不能够被设置为除了0或1以外的值。
因此,如果定义最大TU尺寸标记为“MaxTransformSizeIndex”,最小变换单元尺寸为“MinTransformSize”,并且当TU尺寸标记为0时变换单元尺寸为“RootTuSize”,则可通过等式(1)来定义可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”:
CurrMinTuS ize=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))…(1)
与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比,当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可指示可在系统中选择的最大变换单元尺寸。在等式(1)中,“RootTuSize/(2∧MaxTransformSizeIndex)”指示当TU尺寸标记为0时的变换单元尺寸“RootTuSize”被划分了与最大TU尺寸标记相应的次数时的变换单元尺寸,“MinTransformSize”指示最小变换尺寸。因此,“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中较小的值可以是可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。
根据一个或更多个实施例,最大变换单元尺寸RootTuSize可根据预测模式的类型而改变。
例如,如果当前预测模式是帧间模式,则可通过使用以下的等式(2)来确定“RootTuSize”。在等式(2)中,“MaxTransformSize”指示最大变换单元尺寸,“PUSize”指示当前预测单元尺寸:
RootTuSize=min(MaxTransformSize,PUSize)……(2)
也就是说,如果当前预测模式是帧间模式,则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中较小的值。
如果当前分区单元的预测模式是帧内模式,则可通过使用以下的等式(3)来确定“RootTuSize”。在等式(3)中,“PartitionSize”指示当前分区单元的尺寸:
RootTuSize=min(MaxTransformSize,PartitionSize)……(3)
也就是说,如果当前预测模式是帧内模式,则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元的尺寸之中较小的值。
然而,根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸“RootTuSize”仅是示例,实施例不限于此。
根据参照图8至图20描述的基于具有树结构的编码单元的视频编码方法,针对树结构的每个编码单元对空间域的图像数据进行编码。根据基于具有树结构的编码单元的视频解码方法,针对每个LCU执行解码以重建空间域的图像数据。因此,可重建画面和视频(即,画面序列)。重建后的视频可通过再现设备被再现,可被存储在存储介质中,或者可通过网络被发送。
实施例可被编写为计算机程序,并可在使用计算机可读记录介质执行程序的通用数字计算机中被实现。计算机可读记录介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)和光学记录介质(例如,CD-ROM或DVD)。
为了便于解释,以上描述的视频编码方法和/或视频编码方法将被称为“根据各种实施例的视频编码方法”。另外,以上描述的视频解码方法和/或视频解码方法将被称为“根据各种实施例的视频解码方法”。
以上描述的视频编码设备(包括视频编码设备20、视频编码设备100或图像编码器400)将被称为“根据各种实施例的视频编码设备”。另外,以上描述的视频解码设备(包括视频解码设备25、视频解码设备200或图像解码器500)将被称为“根据各种实施例的视频解码设备”。
现在将详细描述根据各种实施例的存储程序的计算机可读记录介质(例如,盘26000)。
图21是根据一个或更多个实施例的存储程序的盘26000的物理结构的示图。作为存储介质的盘26000可以是硬盘驱动器、致密盘只读存储器(CD-ROM)盘、蓝光盘或数字多功能盘(DVD)。盘26000包括多个同心磁道Tr,每个同心磁道Tr沿盘26000的圆周方向被划分成特定数量的扇区Se。在盘26000的特定区域中,可分配并存储执行如上所描述的量化参数确定方法、视频编码方法和视频解码方法的程序。
现在将参照图22来描述使用存储以下程序的存储介质来实现的计算机系统,其中,所述程序用于执行如上所述的视频编码方法和视频解码方法。
图22是通过使用盘26000来记录并读取程序的盘驱动器26800的示图。计算机系统26700可经由盘驱动器26800将执行从根据一个或更多个实施例的视频编码方法和视频解码方法中选择的至少一个的程序存储在盘26000中。为了在计算机系统26700中运行存储在盘26000中的程序,可通过使用盘驱动器26800从盘26000读取程序并将程序发送到计算机系统26700。
执行从根据一个或更多个实施例的视频编码方法和视频解码方法中选择的至少一个的程序不仅可被存储在图21或图22中示出的盘26000中,还可被存储在存储卡、ROM卡带或固态驱动器(SSD)中。
以下将描述应用了以上所描述的视频编码方法和视频解码方法的系统。
图23是用于提供内容分发服务的内容供应系统11000的整体结构的示图。将通信系统的服务区域划分成预定尺寸的小区,并将无线基站11700、11800、11900和12000分别安装在这些小区中。
内容供应系统11000包括多个独立装置。例如,诸如计算机12100、个人数字助理(PDA)12200、视频相机12300和移动电话12500的多个独立装置经由互联网服务提供器11200、通信网络11400和无线基站11700、11800、11900和12000连接到互联网11100。
然而,内容供应系统11000不限于如图23中所示,并且装置可选择性地被连接到内容供应系统11000。多个独立装置可不经由无线基站11700、11800、11900和12000而直接连接到通信网络11400。
视频相机12300是能够捕捉视频图像的成像装置,例如,数字视频相机。移动电话12500可利用各种协议(例如,个人数字通信(PDC)、码分多址(CDMA)、宽带码分多址(W-CDMA)、全球移动通信系统(GSM)和个人手持电话系统(PHS))中的至少一种通信方法。
视频相机12300可经由无线基站11900和通信网络11400连接到流服务器11300。流服务器11300允许经由视频相机12300从用户接收到的内容经由实时广播被流传输。可使用视频相机12300或流服务器11300来对从视频相机12300接收到的内容进行编码。通过视频相机12300捕捉到的视频数据可经由计算机12100被发送到流服务器11300。
通过相机12600捕捉到的视频数据也可经由计算机12100被发送到流服务器11300。与数码相机类似,相机12600是能够捕捉静止图像和视频图像两者的成像装置。可使用相机12600或计算机12100对通过相机12600捕捉到的视频数据进行编码。可将对视频执行编码和解码的软件存储在可由计算机12100访问的计算机可读记录介质(例如,CD-ROM盘、软盘、硬盘驱动器、SSD或存储卡)中。
如果视频数据通过内置在移动电话12500中的相机被捕捉到,则可从移动电话12500接收视频数据。
还可通过安装在视频相机12300、移动电话12500或相机12600中的大规模集成电路(LSI)系统来对视频数据进行编码。
内容供应系统1100可对由用户使用视频相机12300、相机12600、移动电话12500或另一成像装置所记录的内容数据(例如,在音乐会期间记录的内容)进行编码,并将编码后的内容数据发送到流服务器11300。流服务器11300可将编码后的内容数据以流内容的形式发送到请求内容数据的其它客户端。
客户端是能够对编码后的内容数据进行解码的装置,例如,计算机12100、PDA12200、视频相机12300或移动电话12500。因此,内容供应系统11000允许客户端接收并再现编码后的内容数据。此外,内容供应系统11000允许客户端实时接收编码后的内容数据并对编码后的内容数据进行解码和再现,从而能够进行个人广播。
包括在内容供应系统11000中的多个独立装置的编码和解码操作可类似于根据一个或更多个实施例的视频编码设备和视频解码设备的编码和解码操作。
现在将参照图24和图25更加详细地描述包括在根据一个或更多个实施例的内容供应系统11000中的移动电话12500。
图24示出根据一个或更多个实施例的应用视频编码方法和视频解码方法的移动电话12500的外部结构。移动电话12500可以是智能电话,所述智能电话的功能不受限,并且所述智能电话的大部分功能可被改变或扩展。
移动电话12500包括可与图21的无线基站12000交换射频(RF)信号的内部天线12510,并包括用于显示由相机12530捕捉到的图像或经由天线12510接收到的和解码的图像的显示屏12520(例如,液晶显示器(LCD)或有机发光二极管(OLED)屏幕)。移动电话12500包括包含有控制按钮和触摸面板的操作面板12540。如果显示屏12520是触摸屏,则操作面板12540还包括显示屏12520的触摸感测面板。移动电话12500包括用于输出语音和声音的扬声器12580或另一类型声音输出器、以及用于输入语音和声音的麦克风12550或另一类型声音输入器。移动电话12500还包括用于捕捉视频和静止图像的相机12530,诸如电荷耦合器件(CCD)相机。移动电话12500还可包括:存储介质12570,用于存储通过相机12530捕捉到的、经由电子邮件接收到的、或根据各种方式获得的编码/解码数据(例如,视频或静止图像);插槽12560,存储介质12570经由插槽12560被装入移动电话12500中。存储介质12570可以是闪存,例如,包括在塑料壳中的安全数字(SD)卡或电可擦可编程只读存储器(EEPROM)。
图25示出根据一个或更多个实施例的移动电话12500的内部结构。为了系统地控制包括显示屏12520和操作面板12540的移动电话12500的部件,供电电路12700、操作输入控制器12640、图像编码器12720、相机接口12630、LCD控制器12620、图像解码器12690、复用器/解复用器12680、记录器/读取器12670、调制器/解调器12660以及声音处理器12650经由同步总线12730被连接到中央控制器12710。
如果用户操作电源按钮,并从“电源关闭”状态设置为“电源开启”状态,则供电电路12700从电池组向移动电话12500的所有部件供电,从而将移动电话12500设置为操作模式。
中央控制器12710包括中央处理器(CPU)、ROM和RAM。
在移动电话12500将通信数据发送到外部的同时,在中央控制器12710的控制下,由移动电话12500产生数字信号。例如,声音处理器12650可产生数字声音信号,图像编码器12720可产生数字图像信号,并且消息的文本数据可经由操作面板12540和操作输入控制器12640被产生。当在中央控制器12710的控制下数字信号被发送到调制器/解调器12660时,调制器/解调器12660对数字信号的频带进行调制,并且通信电路12610对频带被调制的数字声音信号执行数模转换(DAC)和频率转换。从通信电路12610输出的发送信号可经由天线12510被发送到语音通信基站或无线基站12000。
例如,当移动电话12500处于通话模式时,在中央控制器12710的控制下,经由麦克风12550获得的声音信号通过声音处理器12650被变换成数字声音信号。数字声音信号可经由调制器/解调器12660和通信电路12610被变换成发送信号,并可经由天线12510被发送。
当文本消息(例如,电子邮件)在数据通信模式下被发送时,文本消息的文本数据经由操作面板12540被输入,并经由操作输入控制器12640被发送到中央控制器12610。在中央控制器12610的控制下,文本数据经由调制器/解调器12660和通信电路12610被变换成发送信号,并经由天线12510被发送到无线基站12000。
为了在数据通信模式下发送图像数据,由相机12530捕捉到的图像数据经由相机接口12630被提供给图像编码器12720。捕捉到的图像数据可经由相机接口12630和LCD控制器12620被直接显示在显示屏12520上。
图像编码器12720的结构可与以上描述的根据一个或更多个实施例的视频编码设备的结构相应。图像编码器12720可基于上述根据一个或更多个实施例的视频编码方法,将从相机12530接收到的图像数据变换为压缩和编码后的图像数据,并然后将编码后的图像数据输出到复用器/解复用器12680。在相机12530的记录操作期间,由移动电话12500的麦克风12550获得的声音信号可经由声音处理器12650被变换成数字声音数据,并且数字声音数据可被发送到复用器/解复用器12680。
复用器/解复用器12680对从图像编码器12720接收到的编码后的图像数据与从声音处理器12650接收到的声音数据一起进行复用。对数据进行复用的结果可经由调制器/解调器12660和通信电路12610被变换成发送信号,然后可经由天线12510被发送。
当移动电话12500从外部接收通信数据时,可对经由天线12510接收到的信号执行频率恢复和ADC以将信号变换成数字信号。调制器/解调器12660对数字信号的频带进行调制。根据频带被调制后的数字信号的类型将所述数字信号发送到视频解码单元12690、声音处理器12650或LCD控制器12620。
在通话模式下,移动电话12500对经由天线12510接收到的信号进行放大,并通过对放大后的信号执行频率转换和ADC来获得数字声音信号。在中央控制器12710的控制下,接收到的数字声音信号经由调制器/解调器12660和声音处理器12650被变换成模拟声音信号,并且模拟声音信号经由扬声器12580被输出。
当在数据通信模式下,接收在互联网网站上访问的视频文件的数据时,经由调制器/解调器12660将经由天线12510从无线基站12000接收到的信号输出为复用数据,并且复用数据被发送到复用器/解复用器12680。
为了对经由天线12510接收到的复用数据进行解码,复用器/解复用器12680将复用数据解复用成编码后的视频数据流和编码后的音频数据流。经由同步总线12730,编码后的视频数据流和编码后的音频数据流分别被提供给视频解码单元12690和声音处理器12650。
图像解码器12690的结构可与上述的根据一个或更多个实施例的视频解码设备的结构相应。图像解码单元12690可通过使用上述的根据一个或更多个实施例的视频解码方法,对编码后的视频数据进行解码来获得重建的视频数据,并经由LCD控制器12620将重建的视频数据提供给显示屏12520。
因此,可将在互联网网站上访问的视频文件的数据显示在显示屏12520上。同时,声音处理器12650可将音频数据变换成模拟声音信号,并将模拟声音信号提供给扬声器12580。因此,也可经由扬声器12580再现在互联网网站上访问的视频文件中包含的音频数据。
移动电话12500或另一类型的通信终端可以是包括根据一个或更多个实施例的视频编码设备和视频解码设备两者的收发终端,可以是仅包括视频编码设备的收发终端,或者可以是仅包括视频解码设备的收发终端。
根据一个或更多个实施例的通信系统不限于以上参照图24描述的通信系统。例如,图26示出根据一个或更多个实施例的采用通信系统的数字广播系统。图26的数字广播系统可通过使用根据一个或更多个实施例的视频编码设备和视频解码设备来接收经由卫星或地面网络发送的数字广播。
具体地,广播站12890通过使用无线电波将视频数据流发送到通信卫星或广播卫星12900。广播卫星12900发送广播信号,广播信号经由家用天线12860被发送到卫星广播接收器。在每个房屋中,可通过TV接收器12810、机顶盒12870或另一装置对编码后的视频流进行解码和再现。
当根据一个或更多个实施例的视频解码设备被实现在再现设备12830中时,再现设备12830可对记录在存储介质12820(诸如盘或存储卡)上的编码后的视频流进行解析和解码以重建数字信号。因此,可在例如监视器12840上再现重建的视频信号。
在被连接到用于卫星/地面广播的天线12860或用于接收有线电视(TV)广播的电缆天线12850的机顶盒12870中,可安装根据一个或更多个实施例的视频解码设备。从机顶盒12870输出的数据也可被再现在TV监视器12880上。
作为另一示例,可将根据一个或更多个实施例的视频解码设备安装在TV接收器12810中,而不是机顶盒12870中。
具有适当天线12910的汽车12920可接收从图21的卫星12900或无线基站11700发送的信号。可在安装在汽车12920中的汽车导航系统12930的显示屏上再现解码后的视频。
视频信号可由根据一个或更多个实施例的视频编码设备来编码,然后可被存储在存储介质中。具体地,可由DVD记录器将图像信号存储在DVD盘12960中,或可由硬盘记录器12950将图像信号存储在硬盘中。作为另一示例,可将视频信号存储在SD卡12970中。如果硬盘记录器12950包括根据一个或更多个实施例的视频解码设备,则记录在DVD盘12960、SD卡12970或另一存储介质上的视频信号可被再现于TV监视器12880上。
汽车导航系统12930可不包括图26的相机12530、图26的相机接口12630和图像编码器12720。例如,计算机12100和TV接收器12810可不包括相机12530、相机接口12630和图像编码器12720。
图27是示出根据一个或更多个实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。
云计算系统可包括云计算服务器14000、用户数据库(DB)14100、多个计算资源14200和用户终端。
响应于来自用户终端的请求,云计算系统经由数据通信网络(例如,互联网)提供多个计算资源14200的点播外包服务。在云计算环境下,服务提供商通过使用虚拟技术组合位于不同的物理位置的数据中心处的计算资源,来为用户提供想要的服务。服务用户不必将计算资源(例如,应用、存储器、操作系统(OS)和安全)安装在他/她拥有的终端中以使用它们,但可在想要的时间点在通过虚拟技术产生的虚拟空间中从服务中选择和使用想要的服务。
被指定的服务用户的用户终端经由包括互联网和移动通信网络的数据通信网络被连接到云计算服务器14100。可从云计算服务器14100向用户终端提供云计算服务,特别是视频再现服务。用户终端可以是能够被连接到互联网的各种类型的电子装置,例如,桌上型PC 14300、智能TV 14400、智能电话14500、笔记本计算机14600、便携式多媒体播放器(PMP)14700、平板PC 14800等。
云计算服务器14100可组合分布在云网络中的多个计算资源14200,并向用户终端提供组合的结果。所述多个计算资源14200可包括各种数据服务,并可包括从用户终端上传的数据。如上所描述的,云计算服务器14100可通过根据虚拟技术组合分布在不同区域中的视频数据库来向用户终端提供想要的服务。
将关于已经订购云计算服务的用户的用户信息存储在用户DB 14100中。用户信息可包括用户的注册信息、地址、姓名和个人信用信息。用户信息还可包括视频的索引。这里,所述索引可包括已经被再现的视频的列表、正在被再现的视频的列表、之前被再现的视频的暂停点等。
可在用户装置之间共享存储在用户DB 14100中的关于视频的信息。例如,当响应于来自笔记本计算机14600的请求将视频服务提供给笔记本计算机14600时,视频服务的再现历史被存储在用户DB 14100中。当从智能电话14500接收到用于再现此视频服务的请求时,云计算服务器14000基于用户DB 14100搜索并再现此视频服务。当智能电话14500从云计算服务器14000接收到视频数据流时,通过对视频数据流进行解码来再现视频的处理与以上参照图24描述的移动电话12500的操作类似。
云计算服务器14000可参考存储在用户DB 14100中的想要的视频服务的再现历史。例如,云计算服务器14000从用户终端接收用于再现存储在用户DB 14100中的视频的请求。如果此视频之前被再现过,则由云计算服务器14000执行的对此视频进行流传输的方法可根据来自用户终端的请求(即,根据是将从视频的起点还是视频的暂停点来再现视频)而不同。例如,如果用户终端请求从视频的起点开始再现视频,则云计算服务器14000将从视频的第一帧开始的视频的流数据发送到用户终端。如果用户终端请求从视频的暂停点开始再现视频,则云计算服务器14000将从与暂停点相应的帧开始的视频的流数据发送到用户终端。
在此情况下,用户终端可包括上述的视频解码设备。作为另一示例,用户终端可包括上述的视频编码设备。可选地,用户终端可包括上述的视频解码设备和上述的视频编码设备两者。
以上已描述了上述的根据一个或更多个实施例的视频编码方法、视频解码方法、视频编码设备和视频解码设备的各种应用。然而,根据上述的各种实施例的将视频编码方法和视频解码方法存储在存储介质中的方法,或者将视频编码设备和视频解码设备实现在装置中的方法不限于上述的实施例。
应理解,这里描述的实施例应该被解释为是说明性意义,而不是为了限制的目的。每个实施例内的特征和方面的描述应该通常被视为可用于其它实施例中的其它类似的特征或方面。
虽然已参照附图描述了本发明的一个或更多个实施例,但是本领域的普通技术人员将理解,在不脱离由权利要求书限定的本发明的精神和范围的情况下,可在其中进行形式和细节上的各种改变。

Claims (8)

1.一种用于多层视频解码的运动矢量确定方法,包括:
接收包括关于预设尺寸的信息的比特流;
当属于当前层的当前图像的预测单元的尺寸被确定为大于所述预设尺寸时,将属于当前层的当前图像的所述预测单元划分为多个子单元;
确定属于参考层的用于对作为所述多个子单元之一的当前子单元进行层间预测的参考子单元;
通过使用用于对参考子单元进行帧间预测的运动矢量来确定用于对当前子单元进行帧间预测的子运动矢量预测候选;
通过使用包括所述子运动矢量预测候选的多个预测候选之一来确定用于对当前子单元进行帧间预测的运动矢量,
其中,当属于当前层的所述预测单元的尺寸被确定为不大于所述预设尺寸时,不将所述预测单元划分为多个子单元,通过使用用于对参考层的参考单元进行帧间预测的运动矢量或通过使用用于对当前层的参考单元进行帧间预测的运动矢量来确定用于对所述预测单元进行帧间预测的运动矢量预测候选,
其中,当前层的当前图像被划分为多个最大编码单元,
其中,最大编码单元被分层划分为多个编码单元,
其中,包括所述预测单元的一个或更多个预测单元从编码单元被获得,
其中,所述预设尺寸为N×N之一,
其中,N为2的M次方,
M是大于或等于3的整数,
其中,关于所述预设尺寸的所述信息指示M减3。
2.如权利要求1所述的运动矢量确定方法,其中,确定用于对当前子单元进行帧间预测的运动矢量的步骤包括:将用于对参考子单元进行帧间预测的运动矢量确定为用于对当前子单元进行帧间预测的运动矢量。
3.如权利要求1所述的运动矢量确定方法,还包括:当参考子单元在帧内模式下被编码时,将用于对当前子单元进行层间预测的视差矢量确定为用于对当前子单元进行层间预测的子运动矢量预测候选。
4.如权利要求1所述的运动矢量确定方法,其中,当所述预测单元的宽度和高度之和为12时,属于当前层的所述预测单元被确定为不大于所述预设尺寸。
5.如权利要求1所述的运动矢量确定方法,还包括:通过使用确定的运动矢量来对当前子单元执行运动补偿。
6.一种用于多层视频解码的运动矢量确定设备,包括:
接收器,被配置为接收包括关于预设尺寸的信息的比特流;
预测候选确定器,被配置为在属于当前层的当前图像的预测单元的尺寸被确定为大于所述预设尺寸时将属于当前层的当前图像的所述预测单元划分为多个子单元,确定属于参考层的用于对作为所述多个子单元之一的当前子单元进行层间预测的参考子单元,并通过使用用于对参考子单元进行帧间预测的运动矢量来确定用于对当前子单元进行帧间预测的子运动矢量预测候选;
运动矢量确定器,被配置为通过使用包括所述子运动矢量预测候选的多个预测候选之一来确定用于对当前子单元进行帧间预测的运动矢量,
其中,当属于当前层的所述预测单元的尺寸被确定为不大于所述预设尺寸时,不将所述预测单元划分为多个子单元,通过使用用于对参考层的参考单元进行帧间预测的运动矢量或通过使用用于对当前层的参考单元进行帧间预测的运动矢量来确定用于对所述预测单元进行帧间预测的运动矢量预测候选,
其中,当前层的当前图像被划分为多个最大编码单元,
其中,最大编码单元被分层划分为多个编码单元,
其中,包括所述预测单元的一个或更多个预测单元从编码单元被获得,
其中,所述预设尺寸为N×N之一,
其中,N为2的M次方,
M是大于或等于3的整数,
其中,关于所述预设尺寸的所述信息指示M减3。
7.如权利要求6所述的运动矢量确定设备,其中,当参考子单元在帧内模式下被编码时,预测候选确定器将用于对当前子单元进行层间预测的视差矢量确定为用于对当前子单元进行层间预测的子运动矢量预测候选。
8.如权利要求6所述的运动矢量确定设备,其中,当所述预测单元的宽度和高度之和为12时,属于当前层的所述预测单元被确定为不大于所述预设尺寸。
CN201480052699.4A 2013-07-24 2014-07-24 用于确定运动矢量的方法及其设备 Active CN105594212B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361857780P 2013-07-24 2013-07-24
US61/857,780 2013-07-24
PCT/KR2014/006770 WO2015012622A1 (ko) 2013-07-24 2014-07-24 움직임 벡터 결정 방법 및 그 장치

Publications (2)

Publication Number Publication Date
CN105594212A CN105594212A (zh) 2016-05-18
CN105594212B true CN105594212B (zh) 2019-04-16

Family

ID=52393566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480052699.4A Active CN105594212B (zh) 2013-07-24 2014-07-24 用于确定运动矢量的方法及其设备

Country Status (5)

Country Link
US (1) US20160173904A1 (zh)
EP (1) EP3016392A4 (zh)
KR (1) KR102216128B1 (zh)
CN (1) CN105594212B (zh)
WO (1) WO2015012622A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105723713A (zh) * 2013-12-19 2016-06-29 夏普株式会社 合并候选导出装置、图像解码装置以及图像编码装置
WO2015099506A1 (ko) 2013-12-26 2015-07-02 삼성전자 주식회사 서브블록 기반 예측을 수행하는 인터 레이어 비디오 복호화 방법 및 그 장치 및 서브블록 기반 예측을 수행하는 인터 레이어 비디오 부호화 방법 및 그 장치
EP3270593A4 (en) * 2015-03-13 2018-11-07 LG Electronics Inc. Method of processing video signal and device for same
WO2017091007A1 (ko) * 2015-11-24 2017-06-01 삼성전자 주식회사 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치
CN116389738A (zh) * 2016-11-21 2023-07-04 松下电器(美国)知识产权公司 图像编码方法、图像解码方法及非暂时性的存储介质
JPWO2018092869A1 (ja) * 2016-11-21 2019-10-17 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JPWO2018092868A1 (ja) 2016-11-21 2019-10-17 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法及び復号方法
WO2019057893A1 (en) * 2017-09-22 2019-03-28 V-Nova International Limited OBTAINING A TARGET REPRESENTATION OF A TIME SAMPLE OF A SIGNAL
CN109660800B (zh) * 2017-10-12 2021-03-12 北京金山云网络技术有限公司 运动估计方法、装置、电子设备及计算机可读存储介质
WO2020185128A1 (en) * 2019-03-12 2020-09-17 Huawei Technologies Co., Ltd. Design for distributed decoding refresh in video coding
CN110505485B (zh) * 2019-08-23 2021-09-17 北京达佳互联信息技术有限公司 运动补偿方法、装置、计算机设备以及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101107254B1 (ko) * 2007-01-25 2012-01-20 삼성전자주식회사 인접 블록의 움직임 벡터를 이용한 움직임 벡터 추정 방법및 그 장치
WO2012015275A2 (ko) * 2010-07-29 2012-02-02 에스케이텔레콤 주식회사 블록 분할예측을 이용한 영상 부호화/복호화 방법 및 장치
CN102823247A (zh) * 2010-03-30 2012-12-12 富士通株式会社 图像处理装置和图像处理方法
WO2012167711A1 (en) * 2011-06-10 2012-12-13 Mediatek Inc. Method and apparatus of scalable video coding
CN102948150A (zh) * 2010-06-07 2013-02-27 索尼公司 图像解码装置、图像编码装置、及其方法和程序
WO2013068548A2 (en) * 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient multi-view coding using depth-map estimate for a dependent view
WO2013100635A1 (ko) * 2011-12-30 2013-07-04 (주)휴맥스 3차원 영상 부호화 방법 및 장치, 및 복호화 방법 및 장치

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090103663A (ko) * 2008-03-28 2009-10-01 삼성전자주식회사 움직임 벡터 정보의 부호화/복호화 방법 및 장치
JP4990927B2 (ja) * 2008-03-28 2012-08-01 三星電子株式会社 動きベクトル情報の符号化/復号化方法及び装置
KR20120080122A (ko) * 2011-01-06 2012-07-16 삼성전자주식회사 경쟁 기반의 다시점 비디오 부호화/복호화 장치 및 방법
WO2014039778A2 (en) * 2012-09-07 2014-03-13 Vid Scale, Inc. Reference picture lists modification
US20140086328A1 (en) * 2012-09-25 2014-03-27 Qualcomm Incorporated Scalable video coding in hevc
WO2015003383A1 (en) * 2013-07-12 2015-01-15 Mediatek Singapore Pte. Ltd. Methods for inter-view motion prediction
US9693077B2 (en) * 2013-12-13 2017-06-27 Qualcomm Incorporated Controlling sub prediction unit (sub-PU) motion parameter inheritance (MPI) in three dimensional (3D) HEVC or other 3D coding

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101107254B1 (ko) * 2007-01-25 2012-01-20 삼성전자주식회사 인접 블록의 움직임 벡터를 이용한 움직임 벡터 추정 방법및 그 장치
CN102823247A (zh) * 2010-03-30 2012-12-12 富士通株式会社 图像处理装置和图像处理方法
CN102948150A (zh) * 2010-06-07 2013-02-27 索尼公司 图像解码装置、图像编码装置、及其方法和程序
WO2012015275A2 (ko) * 2010-07-29 2012-02-02 에스케이텔레콤 주식회사 블록 분할예측을 이용한 영상 부호화/복호화 방법 및 장치
WO2012167711A1 (en) * 2011-06-10 2012-12-13 Mediatek Inc. Method and apparatus of scalable video coding
WO2013068548A2 (en) * 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient multi-view coding using depth-map estimate for a dependent view
WO2013100635A1 (ko) * 2011-12-30 2013-07-04 (주)휴맥스 3차원 영상 부호화 방법 및 장치, 및 복호화 방법 및 장치

Also Published As

Publication number Publication date
KR102216128B1 (ko) 2021-02-16
KR20150012223A (ko) 2015-02-03
US20160173904A1 (en) 2016-06-16
EP3016392A4 (en) 2017-04-26
EP3016392A1 (en) 2016-05-04
CN105594212A (zh) 2016-05-18
WO2015012622A1 (ko) 2015-01-29

Similar Documents

Publication Publication Date Title
CN105594212B (zh) 用于确定运动矢量的方法及其设备
CN105308966B (zh) 视频编码方法及其设备以及视频解码方法及其设备
CN105144713B (zh) 用于解码器设置的对视频进行编码的方法及其装置以及基于解码器设置对视频进行解码的方法及其装置
CN104365101B (zh) 用于确定用于帧间预测的参考图像的方法及设备
CN105027568B (zh) 用于对条带段进行熵编码的方法及其设备以及用于对条带段进行熵解码的方法及其设备
CN104902273B (zh) 视频解码设备
CN105103552B (zh) 用于补偿亮度差的对层间视频进行编码的方法及其装置以及用于对视频进行解码的方法及其装置
CN105532001B (zh) 用于使用基于深度的视差矢量对视频进行层间编码方法以及解码方法和设备
CN105340271B (zh) 用于随机访问的多层视频编码方法及其装置以及用于随机访问的多层视频解码方法及其装置
CN106063271B (zh) 用于执行基于子块的预测的层间视频解码方法及其设备以及用于执行基于子块的预测的层间视频编码方法及其设备
CN104205834B (zh) 用于对每个空间子区域进行视频解码的方法
CN104396252B (zh) 使用用于多视点视频预测的参考画面集的多视点视频编解码方法及其装置
CN104365104B (zh) 用于多视点视频编码和解码的方法和设备
CN104869415B (zh) 视频解码方法
CN105556972B (zh) 用于层间视频解码和编码设备和方法的对深度图像的场景内预测方法
CN105532004B (zh) 层间视频解码方法及设备
CN108235030A (zh) Sao编码方法和设备以及sao解码方法和设备
CN106031175B (zh) 使用亮度补偿的层间视频编码方法及其装置、以及视频解码方法及其装置
CN107409214A (zh) 用于对层间视频进行解码的方法和设备以及用于对层间视频进行编码的方法和设备
CN106416256B (zh) 用于对深度图像进行编码或解码的方法和设备
CN106105210B (zh) 管理用于对多层视频进行编码和解码的缓冲器的方法和设备
CN105264890B (zh) 用于补偿亮度差的层间视频编码方法和设备以及层间视频解码方法和设备
CN105308961B (zh) 用于补偿亮度差的层间视频编码方法和设备以及层间视频解码方法和设备
CN105340273B (zh) 用于预测用于层间视频解码的视差矢量的方法以及编码方法和设备
CN105532005B (zh) 用于层间编码的方法和设备以及用于使用残差预测对视频进行层间解码的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant