CN105264894A - 针对层间解码和编码方法以及设备的确定帧间预测候选的方法 - Google Patents

针对层间解码和编码方法以及设备的确定帧间预测候选的方法 Download PDF

Info

Publication number
CN105264894A
CN105264894A CN201480032434.8A CN201480032434A CN105264894A CN 105264894 A CN105264894 A CN 105264894A CN 201480032434 A CN201480032434 A CN 201480032434A CN 105264894 A CN105264894 A CN 105264894A
Authority
CN
China
Prior art keywords
block
layer
ground floor
unit
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480032434.8A
Other languages
English (en)
Inventor
尹载元
朴慜祐
魏浩千
李振荣
曹容振
崔秉斗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN105264894A publication Critical patent/CN105264894A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

根据本发明的实施例的一种层间视频解码方法包括以下步骤:确定用于通过参考第一层的图像针对第二层的当前块执行层间预测的视差矢量;基于第二层的当前块的位置确定与确定的视差矢量相应的第一层的参考位置;获取位于第一层的参考位置周围的至少一个周围块的运动信息;将获取的运动信息中的至少一个添加到用于帧间预测的候选列表。

Description

针对层间解码和编码方法以及设备的确定帧间预测候选的方法
技术领域
本发明涉及层间视频编码和解码方法,更具体地讲,涉及一种针对层间视频编码和解码方法的确定帧间预测候选的方法。
背景技术
随着用于再现和存储高分辨率或高质量视频内容的硬件的开发和提供,对于用于有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。根据传统的视频编解码器,基于具有预定尺寸的编码单元,根据受限的编码方法来对视频进行编码。
空间域的图像数据经由频率变换被变换为频域的系数。根据视频编解码器,将图像划分为预定尺寸的块,对每个块执行离散余弦变换(DCT),并以块为单位对频率系数进行编码,以进行频率变换的快速计算。与空间域的图像数据相比,频域的系数容易被压缩。具体地,由于根据经由视频编解码器的帧间预测或帧内预测的预测误差来表示空间域的图像像素值,因此当对预测误差执行频率变换时,大量数据可被变换为0。根据视频编解码器,可通过使用小量数据来代替连续并重复产生的数据,来减少数据量。
多层视频编解码器对第一层视频和多个第二层视频进行编码和解码,以去除第一层视频和第二层视频的时间和空间冗余以及层之间的冗余,从而减少第一层视频和第二层视频的数据量。
发明内容
技术问题
提供一种能够针对确定帧间预测候选的方法通过将位于由视差矢量指示的位置周围的周围块中的一个周围块确定为其余候选来提高帧间预测模式的性能和精度的层间视频编码和解码方法。
解决方案
另外的方面将在以下描述中被部分地阐述,并且将部分地从所述描述清楚,或者可通过本实施例的实践被了解。
根据本发明的实施例的一方面,一种层间视频解码方法可包括:确定用于参考第一层图像对第二层当前块执行层间预测的视差矢量;与第二层当前块的位置相关地确定与确定的视差矢量相应的第一层参考位置;获取位于第一层参考位置周围的一个或更多个周围块的运动信息;将获取的运动信息中的至少一个添加到用于帧间预测的候选列表。
获取运动信息的步骤可包括:确定与第一层参考位置相应的第一层参考块;从第一层参考块的一个或更多个周围块获取一条或更多条运动信息。
获取一条或更多条运动信息的步骤可包括:根据预定扫描顺序从与第一层参考位置相应的第一层参考块的左下方块获取所述一条或更多条运动信息。
获取一条或更多条运动信息的步骤可包括:根据预定扫描顺序从第一层参考块的所述一个或更多个周围块获取所述一条或更多条运动信息。
当与第一层参考位置相应的块包括多个子块时,所述一个或更多个周围块可包括所述多个子块。
层间视频解码方法还可包括:确定与第一层参考位置相应的第一层参考块;将第一层参考块划分为多个子块,并从所述多个子块获取一条或更多条运动信息。
将获取的运动信息中的至少一个添加到候选列表的步骤可包括:将所述一个或更多个周围块中的运动信息被获取的一个周围块确定为预测候选;将确定的预测候选的运动信息添加到候选列表。
将所述一个或更多个周围块中的运动信息被获取的一个周围块确定为预测候选的步骤可包括:将所述一个或更多个周围块中的具有最大大小的运动矢量的周围块确定为预测候选。
将所述一个或更多个周围块中的运动信息被获取的一个周围块确定为预测候选的步骤可包括:将所述一个或更多个周围块中的具有与第二层当前块的参考画面顺序计数(POC)相同的参考POC的周围块确定为预测候选。
将所述一个或更多个周围块中的运动信息被获取的一个周围块确定为预测候选的步骤可包括:优先考虑所述一个或更多个周围块中的使用双向预测的周围块,并将使用双向预测的所述周围块确定为预测候选。
根据本发明的实施例的另一方面,一种层间视频编码方法包括:确定用于参考第一层图像对第二层当前块执行层间预测的视差矢量;与第二层当前块的位置相关地确定与确定的视差矢量相应的第一层参考位置;获取位于第一层参考位置周围的一个或更多个周围块的运动信息;将获取的运动信息中的至少一个添加到用于帧间预测的候选列表。
获取运动信息的步骤可包括:确定与第一层参考位置相应的第一层参考块;从第一层参考块的一个或更多个周围块获取一条或更多条运动信息。
获取一条或更多条运动信息的步骤可包括:根据预定扫描顺序从与第一层参考位置相应的第一层参考块的左下方块获取所述一条或更多条运动信息。
获取一条或更多条运动信息的步骤可包括:根据预定扫描顺序从与第一层参考位置相应的第一层参考块的左下方块获取所述一条或更多条运动信息。
获取一条或更多条运动信息的步骤可包括:根据预定扫描顺序从第一层参考块的一个或更多个周围块获取所述一条或更多条运动信息。
当与第一层参考位置相应的块包括多个子块时,所述一个或更多个周围块可包括所述多个子块。
所述层间视频解码方法还可包括:确定与第一层参考位置相应的第一层参考块;将第一层参考块划分为多个子块,并从所述多个子块获取一条或更多条运动信息。
将获取的运动信息中的至少一个添加到候选列表的步骤可包括:将所述一个或更多个周围块中的运动信息被获取的一个周围块确定为预测候选;将确定的预测候选的运动信息添加到候选列。
将所述一个或更多个周围块中的运动信息被获取的一个周围块确定为预测候选的步骤可包括:将所述一个或更多个周围块中的具有最大大小的运动矢量的周围块确定为预测候选。
将所述一个或更多个周围块中的运动信息被获取的一个周围块确定为预测候选的步骤可包括:将所述一个或更多个周围块中的具有与第二层当前块的参考画面顺序计数(POC)相同的参考POC的周围块确定为预测候选。
将所述一个或更多个周围块中的运动信息被获取的一个周围块确定为预测候选的步骤可包括:优先考虑所述一个或更多个周围块中的使用双向预测的周围块,并将使用双向预测的所述周围块确定为预测候选。
根据本发明的实施例的另一方面,一种层间视频解码设备包括:视差矢量确定器,确定用于参考第一层图像对第二层当前块执行层间预测的视差矢量;运动信息获取器,与第二层当前块的位置相关地确定与确定的视差矢量相应的第一层参考位置,并获取位于第一层参考位置周围的一个或更多个周围块的运动信息;候选列表确定器,将获取的运动信息中的至少一个添加到用于帧间预测的候选列表。
根据本发明的实施例的另一方面,一种层间视频编码设备包括:视差矢量确定器,确定用于参考第一层图像对第二层当前块执行层间预测的视差矢量;运动信息获取器,与第二层当前块的位置相关地确定与确定的视差矢量相应的第一层参考位置,并获取位于第一层参考位置周围的一个或更多个周围块的运动信息;候选列表确定器,将获取的运动信息中的至少一个添加到用于帧间预测的候选列表。
根据本发明的实施例的另一方面,提供一种记录有用于执行所述层间视频解码方法的计算机程序的非暂时性计算机可读记录介质。
有益效果
根据本发明的实施例,可提供能够提高帧间预测模式的性能和精度的层间视频编码和解码方法。
附图说明
图1a是根据各种实施例的层间视频编码设备的框图;
图1b是根据各种实施例的层间视频编码方法的流程图;
图2a是根据各种实施例的层间视频解码设备的框图;
图2b是根据各种实施例的层间视频解码方法的流程图;
图3示出根据实施例的层间预测结构;
图4a示出根据实施例的在帧间预测模式中使用的空间预测候选;
图4b示出根据实施例的在帧间预测模式中使用的时间预测候选;
图5a示出根据实施例的在帧间预测模式中使用的视点间预测候选;
图5b示出根据实施例的层间参考块未被确定为帧间预测模式下的视点间预测候选的示例;
图5c示出根据实施例的确定在帧间预测模式中使用的视点间预测候选的改进方法;
图6示出根据实施例的周围块被确定为帧间预测模式下的预测候选的示例;
图7示出根据实施例的子块被确定为帧间预测模式下的预测候选的示例;
图8是根据实施例的基于根据树结构的编码单元的视频编码设备的框图;
图9是根据实施例的基于根据树结构的编码单元的视频解码设备的框图;
图10是用于描述根据实施例的编码单元的构思的示图;
图11是根据实施例的基于编码单元的图像编码器的框图;
图12是根据实施例的基于编码单元的图像解码器的框图;
图13是示出根据实施例的较深层编码单元和分区的示图;
图14是用于描述根据实施例的编码单元和变换单元之间的关系的示图;
图15是用于描述根据实施例的编码单元的编码信息的示图;
图16是根据实施例的较深层编码单元的示图;
图17至图19是用于描述根据实施例的编码单元、预测单元和变换单元之间的关系的示图;
图20是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图;
图21是根据实施例的存储程序的盘的物理结构的示图;
图22是用于通过使用盘来记录和读取程序的盘驱动器的示图;
图23是用于提供内容分配服务的内容供应系统的整体结构的示图;
图24和图25分别是根据实施例的应用了视频编码方法和视频解码方法的移动电话的外部结构和内部结构的示图;
图26是根据实施例的应用通信系统的数字广播系统的示图;
图27是示出根据实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。
具体实施方式
在下文中,将参照图1a至图7描述根据各种实施例的确定帧间预测候选列表的层间视频编码方法和层间视频解码方法。将参照图8至图20描述根据各种实施例的基于具有树结构的编码单元的视频编码方法和视频解码方法,其中,所述视频编码方法和视频解码方法可应用于层间视频编码方法和层间视频解码方法。将参照图21至图27描述可应用视频编码方法和视频解码方法的各种实施例。
在下文中,“图像”可指示静止图像或视频的运动图像,或者视频本身。
在下文中,作为被分配给图像的采样位置的“样点”可表示作为处理目标的数据。例如,空间域的图像中的像素可以是样点。
现在将参照图1a至图7描述根据实施例的层间视频编码设备和方法以及层间视频解码设备和方法。
图1a是根据各种实施例的层间视频编码设备10的框图。图1b是根据各种实施例的层间视频编码方法的流程图。
根据各种实施例的层间视频编码设备10可包括视差矢量确定器12、运动信息获取器14和候选列表确定器16。
根据各种实施例的层间视频编码设备10可根据可伸缩视频编码针对每个层对多个图像序列进行分类和编码,并且可输出包括针对每个层编码的数据的单独的流。层间视频编码设备10可根据不同的层对第一层图像序列和第二层图像序列进行编码。
例如,根据基于空间可伸缩性的可伸缩视频编码,低分辨率图像可被编码为第一层图像,高分辨率图像可被编码为第二层图像。第一层图像的编码结果可被输出在第一层流中。第二层图像的编码结果可被输出在第二层流中。
作为另一示例,可根据可伸缩视频编码对多视点视频进行编码。在此情况下,中心视点图像可被编码为第一层图像,左视点图像和右视点图像可被编码为参考第一层图像的第二层图像。可选地,当层间视频编码设备10允许三层或更多层(诸如第一层、第二层和第三层)时,中心视点图像可被编码为第一层图像,左视点图像可被编码为第二层图像,右视点图像可被编码为第三层图像。然而,本发明不一定限于此。可改变中心视点图像、左视点图像和右视点图像被编码和被参考的层。
作为另一示例,可根据基于时间可伸缩性的时间分层预测来执行可伸缩视频编码。包括编码信息的第一层流可被输出,其中,所述编码信息是通过对基本帧率的图像进行编码而产生的。时间级别可针对每个帧率被分类,并且可被分别编码在层中。通过参考基本帧率的图像进一步对高速帧率的图像进行编码,可输出包括高速帧率的编码信息的第二层流。
可对第一层和多个第二层执行可伸缩视频编码。在存在三个或更多个第二层的情况下,可对第一层图像、第一第二层图像、第二第二层图像、第K第二层图像进行编码。因此,第一层图像的编码结果可被输出在第一层流中,第一第二层图像、第二第二层图像、…第K第二层图像的编码结果可被分别输出在第一第二层流、第二第二层流、…第K第二层流中。
根据各种实施例的层间视频编码设备10可执行通过参考单个层的图像对当前图像进行预测的帧间预测。可通过帧间预测产生指示当前图像与参考图像之间的运动信息的运动矢量以及当前图像与参考图像之间的残差。
层间视频编码设备10可执行用于通过参考第一层图像的预测信息来对第二层图像的预测信息进行预测的层间预测。
当根据实施例的层间视频编码设备10允许三个或更多个层(诸如第一层、第二层、第三层等)时,层间视频编码设备10可根据多层预测结构执行第一层图像与第三层图像之间的层间预测以及第二层图像与第三层图像之间的层间预测。
可通过层间预测来产生当前图像与不同层的参考图像之间的位置差分量以及当前图像与所述不同层的参考图像之间的残差。
稍后将参照图3详细地描述层间预测结构。
根据各种实施例的层间视频编码设备10根据每个层针对每个块对每个视频图像进行编码。块可具有方形、矩形或任意几何形状,并且不限于具有预定尺寸的数据单元。块可以是根据树结构的编码单元之中的最大编码单元、编码单元、预测单元、变换单元等。包括具有树结构的编码单元的最大编码单元被不同地称为编码块单元、块树、根块树、编码树、编码根或树干。现在将参照图8至图20描述基于具有树结构的编码单元的视频编码和解码方法。
可基于编码单元、预测单元或变换单元的数据单元来执行帧间预测和层间预测。
根据各种实施例的层间视频编码设备10可对第一层图像执行包括帧间预测或帧内预测的源编码操作来产生符号数据。符号数据表示每个编码参数的样值和残差的样值。
例如,层间视频编码设备10可对第一层图像的数据单元中的样点执行帧间预测或帧内预测、变换和量化,产生符号数据,对符号数据执行熵编码,并产生第一层流。
层间视频编码设备10可基于具有树结构的编码单元对第二层图像进行编码。层间视频编码设备10可对第二层图像的数据单元中的样点执行帧间/帧内预测、变换和量化,产生符号数据,对符号数据执行熵编码,并产生第二层流。
根据各种实施例的层间视频编码设备10可执行通过使用第一层图像的预测信息对第二层图像进行预测的层间预测。为了通过层间预测结构对第二层图像序列之中的第二层原始图像进行编码,第二层编码器16可通过使用第一层重建图像的预测信息来确定第二层当前图像的预测信息,并基于确定的预测信息来产生第二层预测图像以对第二层原始图像与第二层预测图像之间的预测误差进行编码。
层间视频编码设备10可针对每个块(诸如编码单元或预测单元)对第二层图像执行层间预测。也就是说,可确定第一层图像的将被第二层图像的块参考的块。例如,可确定第一层图像的与当前块图像在第二层图像中的位置相应地定位的重建块。层间视频编码设备10可通过使用与第二层块相应的第一层重建块来确定第二层预测块。
层间视频编码设备10可执行运动估计,其中,所述运动估计在第一层和第二层中重建的重建块之中搜索与第二层原始块具有高相关性的预测块以执行帧间预测。搜索到的预测块的运动信息可被发送到使用随后将被描述的方法的层间视频解码设备20。在这方面,运动信息可包括:用于根据运动估计的结果来识别参考画面列表0和参考画面列表1的参考方向信息、用于识别参考列表中的参考画面的索引、运动矢量等。
同时,层间视频编码设备10可使用合并模式或高级运动矢量预测(AMVP)模式,其中,合并模式和AMVP模式使用周围块与当前块之间的运动信息方面的相关性来减少与针对每个预测单元发送的运动信息相关的数据量。当使用这两种方法中的任意一种时,在编码设备和解码设备中按照相同方式配置用于推导运动信息的周围块的候选列表,并将候选列表中的候选选择信息发送到解码设备,从而有效地减少与运动信息相关的数据量。
同时,对于确定用于帧间预测的候选列表的方法,当包括与由视差矢量指示的位置最接近的整像素的块的预测模式是帧间预测模式或跳过模式时,可使用视点间预测候选。也就是说,当与在第二层当前块处由视差矢量指示的第一层的位置相应的参考块的预测模式是帧间预测模式或跳过模式时,该参考块的运动信息可被添加到用于帧间预测的候选列表。
然而,当与由视差矢量指示的第一层的位置相应的参考块的预测模式不是帧间预测模式或跳过模式时,视点间预测候选会不可用。另外,即使参考块的预测模式是帧间预测模式或跳过模式,仍会包括不准确的运动信息。
因此,根据实施例的层间视频编码设备10可从位于在第二层当前块处由视差矢量指示的参考位置周围的一个或更多个周围块中获取运动信息,并将获取的运动信息中的至少一个添加到用于帧间预测的候选列表,从而提高合并模式或AMVP模式的准确性。
随后将参照图4a至图7详细描述根据实施例的层间视频编码设备10配置用于执行帧间预测的候选列表的方法。
层间视频编码设备10可使用第一层重建图像对第二层预测块的样值与第二层原始块的样值之间的误差(即,根据层间预测的残差)执行变换和量化以及熵编码。
如上所述,层间视频编码设备10可通过经由层间预测结构参考第一层重建图像对当前层图像序列进行编码。然而,根据各种实施例的层间视频编码设备10可在不参考不同层样点的情况下根据单层预测结构对第二层图像序列进行编码。因此,不应局限地理解为:层间视频编码设备10为了对第二层图像序列进行编码而仅执行层间预测结构的帧间预测。
同时,当以上描述的层间视频编码设备10对多视点视频进行编码时,将被编码的第一层图像是第一视点视频,第二层图像可以是第二视点视频。可通过不同相机或通过不同镜头来捕获用于每个视点的视频。
下面将参照图1b详细描述确定高级帧间预测候选列表的层间视频编码设备10的详细操作。
图1b是根据各种实施例的层间视频编码方法的流程图。
在操作11,根据实施例的视差矢量确定器12可确定用于参照第一层图像对第二层当前块执行层间预测的视差矢量。由视差矢量确定器12确定的视差矢量可通过被包括在比特流中被发送,或者可从多条其它编码信息推导。
在操作13,根据实施例的运动信息获取器14可与第二层当前块的位置相关地确定与确定的视差矢量相应的第一层参考位置。
在操作15,根据实施例的运动信息获取器14可从位于第一层参考位置周围的一个或更多个周围块获取运动信息。在这方面,周围块可被确定为在从第一层参考位置移动预定距离的位置处的块。
根据实施例的运动信息获取器14可将包括与第一层参考位置最接近的整像素的块确定为第一层参考块,并从第一层参考位置周围的一个或更多个周围块获取运动信息。在这方面,由于视差矢量可具有小数单位精度(诸如四分之一像素或半像素),因此在第二层当前块的位置处由视差矢量指示的参考位置可以是子像素位置。因此,运动信息获取器14可将以下块确定为第一层参考块:该块包括与在第二层当前块的位置处由视差矢量指示的第一层重建图像的参考位置邻近的整像素。
运动信息获取器14可根据预定扫描顺序(例如,z字形扫描顺序和光栅扫描顺序)搜索第一层参考位置的周围来从在帧间预测模式或跳过模式下重建的一个或更多个周围块获取运动信息。例如,可从与第一层参考位置相应的参考块的右下方块获取运动信息。
当第一层参考块包括多个子块时,根据实施例的运动信息获取器14可从在与视差矢量相应的子块的周围的子块获取运动信息。例如,当与在第二层当前块处由视差矢量指示的第一层参考位置相应的参考块位于多个第一层预测单元的边界时,可在所述多个第一层预测单元中获取运动信息。可选地,运动信息获取器14可确定在参考位置的周围的一个或更多个整像素,并从所述整像素所属的周围块获取运动信息。
在操作17,根据实施例的候选列表确定器16可将获取的运动信息中的至少一个添加到候选列表。
更详细地讲,候选列表确定器16可基于获取的运动信息将一个或更多个周围块中的一个周围块确定为预测候选,并且当用于帧间预测的候选列表未包括最大数量的候选时,将确定的预测候选的运动信息添加到候选列表。在这方面,预测候选可以是合并候选或AMVP候选。
例如,当在参考位置周围的多个块处于帧间预测模式或跳过模式时,候选列表确定器16可将具有最大大小的运动矢量的周围块确定为预测候选,并将确定的预测候选的运动信息添加到候选列表。
作为另一示例,当在参考位置周围的多个周围块处于帧间预测模式或跳过模式时,候选列表确定器16可将参考画面顺序计数(POC)与第二层参考块的参考POC相同的周围块确定为预测候选,并将确定的预测候选的运动信息添加到候选列表。在这方面,在存在参考POC与第二层参考块的参考POC相同的多个周围块的情况下,可基于所述多个周围块的运动矢量的大小来确定预测候选。
作为另一示例,当在参考位置周围的多个块处于帧间预测模式或跳过模式时,候选列表确定器16可优先考虑使用双向预测的周围块,将所述周围块确定为预测候选,并将确定的预测候选的运动信息添加到候选列表。
因此,层间视频编码设备10可选择确定的候选列表中所包括的候选中的一个候选来对第二层当前块执行帧间预测,产生第二层预测图像,并对第二层原始图像与第二层预测图像之间的预测误差进行编码。
根据各种实施例的层间视频编码设备10可包括通常控制视差矢量确定器12、运动信息获取器14和候选列表确定器16的中央处理器(未示出)。可选地,视差矢量确定器12、运动信息获取器14和候选列表确定器16可由其各自的处理器(未示出)来操作,并且层间视频编码设备10通常可根据处理器(未示出)的交互来操作。可选地,根据层间视频编码设备10的外部处理器(未示出)的控制,第一层编码器12和第二层编码器16可被控制。
层间视频编码设备10可包括一个或更多个数据存储单元(未示出),其中,所述一个或更多个数据存储单元用于存储视差矢量确定器12、运动信息获取器14和候选列表确定器16的输入数据和输出数据。层间视频编码设备10可包括存储器控制单元(未示出),其中,存储器控制单元观察数据存储单元(未示出)的数据的输入和输出。
层间视频编码设备10可与内部视频编码处理器或外部视频编码处理器关联地进行操作以便输出视频编码结果,从而执行包括变换的视频编码操作。层间视频编码设备10的内部视频编码处理器可用中央处理器或图形处理器以及单独的处理器来实现。
图2a是根据各种实施例的层间视频解码设备20的框图。
根据各种实施例的层间视频解码设备20可包括视差矢量确定器22、运动信息获取器24和候选列表确定器26。
根据各种实施例的层间视频解码设备20可根据可伸缩编码接收针对每个层的比特流。由层间视频解码设备20接收的比特流的层的数量不被限制。然而,为了便于描述,将详细描述层间视频解码设备20接收第一层流并对第一层流进行解码并且接收第二层流并对第二层流进行解码的示例。
例如,基于空间伸缩性的层间视频解码设备20可接收流,其中,在所述流中,不同分辨率的图像序列根据不同层被编码。可通过对第一层流进行解码来重建低分辨率图像序列,并且可通过对第二层流进行解码来重建高分辨率图像序列。
作为另一示例,可根据可伸缩视频编码对多视点视频进行解码。当按多个层接收到立体视频流时,可对第一层流进行解码来重建左视点图像。可将第二层流进一步解码至第一层流来重建右视点图像。
可选地,当按多个层接收到多视点视频流时,可对第一层流进行解码来重建中心视点图像。可进一步将第二层流解码至第一层流以重建左视点图像。可将第三层流进一步解码至第一层流以重建右视点图像。
作为另一示例,可执行基于时间伸缩性的可伸缩视频编码。可对第一层流进行解码来重建基本帧率图像。可将第二层流进一步解码至第一层流以重建高速帧率图像。
在存在三个或更多个第二层的情况下,可从第一层流重建第一层图像。如果第二层流进一步通过参考第一层重建图像被解码,则第二层图像可被进一步重建。如果第K层流进一步通过参考第二层重建图像被解码,则第K层图像可被进一步重建。
层间视频解码设备20可从第一层流和第二层流获取第一层图像和第二层图像的编码数据,并进一步获取通过帧间预测产生的运动矢量以及通过层间预测产生的预测信息。
例如,层间视频解码设备20可针对每个层对帧间预测的数据进行解码,并且可对在多个层之间的层间预测的数据进行解码。可基于编码单元或预测单元,通过运动补偿和层间解码来执行重建。
通过参考经由同一层的帧间预测被预测的重建图像来对每个层流执行针对当前图像的运动补偿,因此可重建图像。运动补偿是指将当前图像的残差与通过使用当前图像的运动矢量而确定的参考图像进行合成并重新构造当前图像的重建图像的操作。
层间视频解码设备20可参考第一层图像的预测信息来执行层间解码,以便对通过层间预测被预测的第二层图像进行解码。层间解码是指使用不同层的参考块的预测信息来重新构造当前图像的预测信息以便确定当前图像的预测信息的操作。
根据实施例的层间视频解码设备20可执行层间解码以重建参考第二层图像被预测的第三层图像。随后将参照图3详细描述层间预测结构。
然而,根据各种实施例的层间视频解码设备20可在不参考第一层图像序列的情况下对第二层流进行解码。因此,不应局限地理解为:层间视频解码设备20为了对第二层图像序列进行解码而仅执行层间预测。
层间视频解码设备20针对每个块对视频的每个图像进行解码。根据示例性实施例的块可包括根据树结构的编码单元之中的最大编码单元、编码单元、预测单元、变换单元等。
层间视频解码设备20可通过使用解析的第一层图像的编码符号来对第一层图像进行解码。如果层间视频解码设备20接收到基于具有树结构的编码单元被编码的流,则层间视频解码设备20可基于具有树结构的编码单元对第一层流的每个最大编码单元执行解码。
层间视频解码设备20可对每个最大编码单元执行熵编码,并可获取编码信息和编码数据。层间视频解码设备20可对从流获取的编码数据执行反量化和逆变换来重建残差。根据另一实施例的层间视频解码设备20可直接接收量化后的变换系数的比特流。作为对量化后的变换系数执行反量化和逆变换的结果,图像的残差可被重建。
层间视频解码设备20可通过经由在同一层图像之间进行的运动补偿确定预测图像、将预测图像和残差组合来重建第一层图像。
层间视频解码设备20可根据层间预测结构通过使用第一层重建图像的样点来产生第二层预测图像。层间视频解码设备20可根据层间预测对第二层流进行解码来获取预测误差。层间视频解码设备20可将第二层预测图像与预测误差进行组合,从而产生第二层重建图像。
层间视频解码设备20可使用解码的第一层重建图像来确定第二层预测图像。层间视频解码设备20可根据层间预测结构确定第一层图像的将被第二层图像的块(诸如编码单元或预测单元)参考的块。也就是说,可确定第一层图像的将被第二层图像的块参考的块。例如,可确定第一层图像的在第二层图像中与当前块的位置相应地定位的重建块。层间视频解码设备20可使用与第二层块相应的第一层重建块来确定第二层预测块。
当前将被重建的第二层块的运动信息对于确定这种预测块而言是必需的。因此,层间视频解码设备20可使用合并模式或高级运动矢量预测(AMVP)模式来获取运动信息,其中,合并模式和AMVP模式使用在周围块与当前块之间的运行信息方面的相关性。当使用这两种方法中的一种时,在编码设备和解码设备中按照相同方式配置用于推导运动信息的周围块的候选列表,并在层间视频解码设备20中仅接收候选列表中的候选选择信息,从而有效地减少与运动信息相关的数据量。
同时,对于确定用于帧间预测的候选列表的方法,当包括与由视差矢量指示的位置最接近的整像素的块的预测模式是帧间预测模式或跳过模式时,可使用视点间预测候选。也就是说,当与在第二层当前块处由视差矢量指示的第一层的位置相应的参考块的预测模式是帧间预测模式或跳过模式时,参考块的运动信息可被添加到用于帧间预测的候选列表。
然而,当与由视差矢量指示的第一层的位置相应的参考块的预测模式不是帧间预测模式或跳过模式时,视点间预测候选不可用。另外,即使参考块的预测模式是帧间预测模式或跳过模式,仍会包括不准确的运动信息。
因此,根据实施例的层间视频解码设备20可从位于在第二层当前块处由视差矢量指示的参考位置周围的一个或更多个周围块获取运动信息,并将获取的运动信息中的至少一个添加到用于帧间预测的候选列表,从而提高合并模式或AMVP模式的准确性。
随后将参照图4a至图7详细描述根据实施例的层间视频解码设备20配置用于执行帧间预测的候选列表的方法。
层间视频解码设备20可将根据帧间预测使用第一层重建块而确定的第二层预测块用作用于对第二层原始块进行层间预测的参考图像。层间视频解码设备20可通过将使用第一层重建图像确定的第二层预测块的样值与根据层间预测的残差进行合成来重建第二层块。
根据空间可伸缩视频编码,当层间视频解码设备20重建分辨率与第二层图像的分辨率不同的第一层图像时,层间视频解码设备20可对第一层重建图像进行插值来调整第一层重建图像的大小以具有与第二层原始图像的分辨率相同的分辨率。插值后的第一层重建图像可被确定为用于层间预测的第二层预测图像。
因此,层间视频解码设备20可通过对第一层流进行解码来重建第一层图像序列,并通过对第二层流进行解码来重建第二层图像序列。
同时,当上述层间视频解码设备20对多视点视频进行解码时,将被解码的第一层图像是第一视点视频,第二层图像可以是第二视点视频。可通过不同相机或通过不同镜头来捕获用于每个视点的视频。
下面将参照图2b详细描述确定高级帧间预测候选列表的层间视频解码设备20的详细操作。
图2b是根据各种实施例的层间视频解码方法的流程图。
在操作21,根据实施例的视差矢量确定器22可确定用于参照第一层图像对第二层当前块执行层间预测的视差矢量。可从比特流获取由视差矢量确定器22确定的视差矢量,或者可从多条其它编码信息推导所述视差矢量。
在操作23,根据实施例的运动信息获取器24可与第二层当前块的位置相关地确定与确定的视差矢量相应的第一层参考位置。
在操作25,根据实施例的运动信息获取器24可从位于第一层参考位置周围的一个或更多个周围块获取运动信息。在这方面,周围块可被确定为在从第一层参考位置移动预定距离的位置处的块。
根据实施例的运动信息获取器24可将包括与第一层参考位置最接近的整像素的块确定为第一层参考块,并从第一层参考位置周围的一个或更多个周围块获取运动信息。在这方面,由于视差矢量可具有小数单位精度(诸如四分之一像素或半像素),因此在第二层当前块的位置处由视差矢量指示的参考位置可以是子像素位置。因此,运动信息获取器24可将以下块确定为第一层参考块:该块包括与在第二层当前块的位置处由视差矢量指示的第一层重建图像的参考位置邻近的整像素。
运动信息获取器24可根据预定扫描顺序(例如,z字形扫描顺序和光栅扫描顺序)搜索第一层参考位置的周围来从在帧间预测模式或跳过模式下重建的一个或更多个周围块获取运动信息。例如,可从与第一层参考位置相应的参考块的右下方块获取运动信息。
当第一层参考块包括多个子块时,根据实施例的运动信息获取器24可从在与视差矢量相应的子块的周围的子块获取运动信息。例如,当与在第二层当前块处由视差矢量指示的第一层参考位置相应的参考块位于多个第一层预测单元的边界时,可在所述多个第一层预测单元中获取运动信息。可选地,运动信息获取器24可确定在参考位置的周围的一个或更多个整像素,并从所述整像素所属的周围块获取运动信息。
在操作27,根据实施例的候选列表确定器26可将获取的运动信息中的至少一个添加到候选列表。
更详细地讲,候选列表确定器26可基于获取的运动信息将一个或更多个周围块中的一个周围块确定为预测候选,并且当用于帧间预测的候选列表未包括最大数量的候选时,将确定的预测候选的运动信息添加到候选列表。在这方面,预测候选可以是合并候选或AMVP候选。
例如,当在参考位置周围的多个块处于帧间预测模式或跳过模式时,候选列表确定器26可将具有最大大小的运动矢量的周围块确定为预测候选,并将确定的预测候选的运动信息添加到候选列表。
作为另一示例,当在参考位置周围的多个周围块处于帧间预测模式或跳过模式时,候选列表确定器26可将参考画面顺序计数(POC)与第二层参考块的参考POC相同的周围块确定为预测候选,并将确定的预测候选的运动信息添加到候选列表。在这方面,当存在参考POC与第二层参考块的参考POC相同的多个周围块时,可基于所述多个周围块的运动矢量的大小来确定预测候选。
作为另一示例,当在参考位置周围的多个块处于帧间预测模式或跳过模式时,候选列表确定器26可优先考虑双向预测中使用的块,将所述块确定为预测候选,并将确定的预测候选的运动信息添加到候选列表。
因此,层间视频解码设备20可基于从比特流获取的候选选择信息来选择确定的候选列表中所包括的候选中的一个候选。因此,层间视频解码设备20可使用选择的候选的运动信息对第二层当前块执行帧间预测来确定第二层预测块。层间视频解码设备20可将确定的第二层预测块的样值与根据层间预测的残差进行合成来重建第二层块。
根据各种实施例的层间视频解码设备20可包括通常控制视差矢量确定器22、运动信息获取器24和候选列表确定器26的中央处理器(未示出)。可选地,视差矢量确定器22、运动信息获取器24和候选列表确定器26可由其各自的处理器(未示出)来操作,并且层间视频解码设备20通常可根据处理器(未示出)的交互来操作。可选地,视差矢量确定器22、运动信息获取器24和候选列表确定器26可根据层间视频解码设备20的外部处理器(未示出)的控制而被控制。
根据各种实施例的层间视频编码设备20可包括一个或更多个数据存储单元(未示出),其中,视差矢量确定器22、运动信息获取器24和候选列表确定器26的输入数据和输出数据被存储在所述一个或更多个数据存储单元中。层间视频解码设备20可包括存储器控制单元(未示出),其中,存储器控制单元观察数据存储单元(未示出)的数据输入和输出。
根据各种实施例的层间视频解码设备20可与内部视频解码处理器或外部视频解码处理器关联地进行操作以便输出视频解码结果,从而执行包括变换的视频解码操作。层间视频解码设备20的内部视频解码处理器可用中央处理器或图形处理器以及单独的处理器来实现。
参照图1a至图2b,层间视频编码设备10和层间视频解码设备20可从包括在第二层当前块处由视差矢量指示的像素的周围像素的一个或更多个周围块获取运动信息,并将获取的运动信息中的至少一个添加到用于帧间预测的候选列表,从而提高合并模式或AMVP模式的准确性。因此,可提高编码效率。
下面将参照图3详细描述根据各种实施例的可在视频流编码设备10中执行的层间预测结构。
图3示出根据实施例的层间预测结构。
层间编码系统1600包括基本层编码终端1610、增强层编码终端1660以及在基本层编码终端1610和增强层编码终端1660之间的层间预测终端1650。基本层编码终端1610和增强层编码终端1660可包括在层间编码器12中。
基本层编码终端1610接收基本层图像序列,并针对每个图像对基本层图像序列进行编码。增强层编码终端1660接收增强层图像序列,并针对每个图像对增强层图像序列进行编码。将同时给出对在基本层编码终端1610与增强层编码终端1660之间类似操作的重复描述。
块划分器1618和1668将输入图像(低分辨率图像和高分辨率图像)划分为最大编码单元、编码单元、预测单元、变换单元等。为了对由块划分器1618或1668输出的编码单元进行编码,可对编码单元的每个预测单元执行帧内预测或帧间预测。预测切换器1648和1698可根据预测单元的预测模式是帧内预测模式还是帧间预测模式,通过参考由运动补偿器1640和1690输出的先前的重建图像来执行帧间预测,或者可通过使用由帧内预测单元1645和1695输出的当前输入图像内的当前预测单元的邻近预测单元来执行帧内预测。可通过帧间预测针对每个预测单元产生残差信息。
对于编码单元的每个预测单元,预测单元和邻近图像之间的残差信息被输入到变换器/量化器1620和1670。变换器/量化器1620和1670可基于编码单元的变换单元针对每个变换单元执行变换和量化,并可输出量化后的变换系数。
缩放/逆变换器1625和1675可再次针对编码单元的每个变换单元对量化后的变换系数执行缩放和逆变换以产生空间域的残差信息。当帧间模式通过预测切换器1648和1698被配置时,将残差信息与先前的重建图像或邻近预测单元合成,从而可产生包括当前预测单元的重建图像,并可将当前的重建图像存储在存储器1630和1680中。根据随后被编码的预测单元的预测模式,当前的重建图像可被传送到帧内预测单元1645和1695/运动补偿单元1640和1690。
具体地,在帧间模式下,环路滤波单元1635和1685可针对每个编码单元对存储在存储器1630和1680中的重建图像执行从去块滤波和样点自适应偏移(SAO)滤波中选择的至少一个。可对编码单元、包括在编码单元中的预测单元以及变换单元中的至少一个执行去块滤波和样点自适应偏移(SAO)滤波中的至少一个。
去块滤波是用于减轻数据单元的块现象的滤波。SAO滤波是用于对经数据编码和解码修改的像素值进行补偿的滤波。对于每个预测单元,由环路滤波单元1635和1685滤波的数据可被传送到运动补偿单元1640和1690。可产生由运动补偿单元1640和1680以及块划分器1618和1668输出的当前的重建图像与下一编码单元之间的残差信息,来再次对由块划分器1618和1668输出的下一次序的编码单元进行编码。
按照此方式,可针对输入图像的每个编码单元重复上述编码方法。
用于层间预测的增强层编码终端1660可参考存储在基本层编码终端1610的存储器1630中的重建图像。基本层编码终端1610的编码控制器1615可控制基本层编码终端1610的存储器1630,并可将基本层编码终端1610的重建图像传送给增强层编码终端1660。层间预测终端1650可对由基本层编码终端1610的存储器1630输出的基本层重建图像执行去块滤波或SAO滤波。当基本层的图像与增强层的图像之间分辨率不同时,层间预测终端1650可对基本层的重建图像进行上采样,并且可将重建图像传送给增强层编码终端1660。当层间预测根据增强层编码终端1660的切换器1698的控制被执行时,可参考通过层间预测终端1650传送的基本层重建图像对增强层图像执行层间预测。
为了对图像进行编码,可设置用于编码单元、预测单元和变换单元的各种编码模式。例如,深度或划分标志等可被设置为关于编码单元的编码模式。预测模式、分区类型、帧内方向信息、参考列表信息等可被设置为关于预测单元的编码模式。变换深度或划分标志等可被设置为关于变换单元的编码模式。
基本层编码终端1610可根据通过应用用于编码单元的各种深度、关于预测单元的各种预测模式、各种分区类型、各种帧内方向、各种参考列表和用于变换单元的各种变换深度来执行编码的结果,确定具有最高编码效率的编码深度、预测模式、分区类型、帧内方向/参考列表、变换深度等。然而,本发明不限于由基本层编码终端1610确定的编码模式。
基本层编码终端1610的编码控制器1615可控制不同的编码模式被适当地应用到元件的操作。为了增强层编码终端1660进行的层间编码,编码控制器1615可控制增强层编码终端1660通过参考基本层编码终端1610的编码结果来确定编码模式或残差信息。
例如,增强层编码终端1660可通过将基本层编码终端1610的编码模式用作增强层图像的编码模式或通过参考基本层编码终端1610的编码模式来确定用于增强层图像的编码模式。基本层编码终端1610的编码控制器1615可控制增强层编码终端1660的编码控制器1655的控制信号,使得增强层编码终端1660可使用基本层编码终端1610的编码模式中的当前编码模式来确定当前编码模式。
与根据图3的层间预测方法的层间编码系统1600相似,可实现根据层间预测方法的层间解码系统。也就是说,多层视频的层间解码系统可接收基本层比特流和增强层比特流。层间解码系统的基本层解码终端可对基本层比特流进行解码以重建基本层图像。多层视频的层间解码系统的增强层解码终端可使用基本层重建图像和解析的编码信息对增强层比特流进行解码并可重建增强层图像。
如果根据各种示例性实施例的层间视频编码设备10执行层间预测,则层间视频解码设备20可根据上述层间解码系统重建多层图像。
现在将参照图4a至图7详细描述视频流编码设备10和视频流解码设备20应用关于多视点视频的层间预测结构的示例性实施例。单视点视频被应用于多视点视频的视点间预测结构中的一个层,因此视点间预测结构可被解释为层间预测结构。
现在将参照图4a至图5b详细地描述层间视频解码设备20确定用于帧间预测模式的空间预测候选、时间预测候选和视点间预测候选的示例性实施例。然而,用于帧间预测模式的预测候选也可包括层间结构中的视差预测候选、视点合成预测候选等。
图4a示出根据实施例的在帧间预测模式中使用的空间预测候选。
参照图4a,层间视频解码设备20将参考以确定当前画面30的当前块31的预测信息的候选块可以是图与当前块31空间邻近的预测单元。例如,候选块可包括位于当前块31的左下方样点外部的左下方的周围块A032、位于当前块31的左下方样点外部的左侧的周围块A133、位于当前块31的右上方样点外部的右上方的周围块B034、位于当前块31的右上方样点外部的上方的周围块B135、以及位于当前块31的左上方样点外部的左上方的周围块B236。为了确定可作为候选块的块,可按照周围块A133、B135、B034、A032和B236的顺序来搜索预定位置的周围块32、33、34、35和36。
例如,周围块A133、B135、B034、A032和B236中的四个周围块可被选为空间候选块。也就是说,所述四个空间候选块的运动信息可被包括在用于帧间预测的候选列表中。
层间视频解码设备20可将周围块A133、B135、B034、A032和B236中具有运动信息的块(即,帧间预测的块)包括在用于帧间预测的预测候选中,并从预测候选中排除不具有运动信息的块。层间视频解码设备20可从用于帧间预测的预测候选中排除具有重复运动信息的块。
可被包括在空间预测候选中的周围块的位置和数量可不限于此,并且可被改变。同时,用于确定空间预测候选的块可以是编码单元或预测单元。
图4b示出根据实施例的在帧间预测模式中使用的时间预测候选。
参照图4b,层间视频解码设备20可包括与当前块41共同定位的共同定位块44、以及包括在参考画面43中的在共同定位块44周围的块中的至少一个块作为时间预测候选。例如,共同定位块44的右下方块45可被包括在时间预测候选中。同时,用于确定时间预测候选的块可以是编码单元或预测单元。
图5a示出根据实施例的在帧间预测模式中使用的视点间预测候选。
参照图5a,层间视频解码设备20可确定在当前块51的位置处由视差矢量DV指示的第一层参考块53是否包括用于对第二层当前画面50中包括的当前块51进行帧间预测的运动信息。也就是说,确定第一层参考块53是否是在帧间模式或跳过模式下被确定的。在这方面,由视差矢量DV指示的参考位置可以与当前块51的中心像素或当前块51的左上方像素相关。
如果第一层参考块53包括运动信息,则层间视频解码设备20可将参考块53确定为视点间预测候选,并将参考块53的运动信息添加到用于帧间预测的候选列表。同时,用于确定视点间预测候选的块可以是编码单元或预测单元。
图5b示出根据实施例的层间参考块未被确定为帧间预测模式下的视点间预测候选的示例。
参照图5b,由视差矢量DV指示的参考块53可位于第一层画面52的编码单元或预测单元边界。在此情况下,包括与由视差矢量DV指示的参考位置最接近的整像素的编码单元53-1的预测模式信息可被确定为参考块53的预测模式信息。
因此,虽然参考块53位于多个编码单元53-1、53-2、53-3和53-4上,但是如上所述,仅使用包括与由视差矢量DV指示的参考位置最接近的整像素的编码单元53-1的预测模式信息来确定参考块53的预测模式。
也就是说,当确定参考块53的预测模式信息的单个编码单元53-1的预测模式不是帧间预测模式或跳过模式时,可不使用视点间预测候选。因此,层间视频解码设备20可不将层间参考块确定为视点间预测候选。
然而,在图5b中,由视差矢量DV指示的参考块53位于第一层画面52的编码单元或预测单元边界,因此与由视差矢量DV指示的参考位置邻近的周围块53-1、53-2、53-3和53-4中的块53-2、53-3、53-4可包括运动信息。
另外,虽然预测在帧间预测模式下被执行并且参考块53的预测模式被确定为包括运动信息,但是运动信息可能包括不准确的信息。例如,可能存在由于近似块未通过帧间预测被搜索而使得参考块53不包括准确的运动信息的问题。
因此,根据实施例的层间视频解码设备20可从位于在第二层当前块51处由视差矢量DV指示的参考位置周围的周围块53-2、53-3和53-4获取运动信息mv0、mv1和mv2,并将获取的运动信息mv0、mv1和mv2中的至少一个添加到用于帧间预测的候选列表,从而提高合并模式或AMVP模式的准确性。
图5c示出根据实施例的确定在帧间预测模式中使用的视点间预测候选的改进方法。
参照图5c,层间视频解码设备20的候选列表确定器26可基于获取的运动信息将一个或更多个周围块中的一个周围块确定为预测候选,并且当用于帧间预测的候选列表未包括最大数量的候选时,将确定的预测候选的运动信息添加到候选列表。在这方面,预测候选可以是合并候选或AMVP候选。
例如,在由视差矢量DV指示的参考位置周围存在帧间预测模式或跳过模式下的多个周围块53-1、53-2和53-3的情况下,候选列表确定器26可将具有最大大小的运动矢量的周围块53-1确定为预测候选,并将确定的预测候选的运动信息mv1添加到候选列表。
作为另一示例,在由视差矢量DV指示的参考位置周围存在帧间预测模式或跳过模式下的多个周围块53-1、53-2和53-3的情况下,候选列表确定器16可将参考画面顺序计数(POC)与第二层参考块51的参考POC相同的周围块确定为预测候选,并将确定的预测候选的运动信息添加到候选列表。在这方面,在存在参考POC与第二层参考块51的参考POC相同的多个周围块的情况下,可基于多个周围块的运动矢量的大小来确定预测候选。
作为另一示例,在由视差矢量DV指示的参考位置周围存在帧间预测模式或跳过模式下的多个周围块53-1、53-2和53-3的情况下,候选列表确定器16可优先考虑使用双向预测的周围块,将所述周围块确定为预测候选,并将确定的预测候选的运动信息添加到候选列表。
图6示出根据实施例的周围块被确定为帧间预测模式下的预测候选的示例。
参照图6,层间视频解码设备20可确定参考画面62中包括的并由第二层当前块61中的视差矢量指示的第一层参考块63以及第一层参考块63的周围块的预测模式,以对当前画面60中包括的第二层当前块61进行帧间预测。例如,如果参考块63的右下方块64的预测模式是帧间预测模式或跳过模式,则参考块63的右下方块64可被确定为用于帧间预测的预测候选。同时,用于确定预测候选的块可以是编码单元或预测单元。
下面将参照语法元素和伪代码来描述将参考块63的右下方块64确定为合并模式下的合并候选并将右下方块64添加到候选列表的操作。参考块63和右下方块64可分别对应于IvMC候选和IvMCShift候选。
层间视频解码设备20可获取语法元素iv_mv_pred_flag[..]和DispAvailabilityldc[][],并确定视点间方向的运动预测是否可用以及第二层当前块61的视差矢量是否可用。如果两个条件之一未被满足,则IvMC候选和IvMCShift候选不能用作帧间预测候选。
同时,如果视点间方向的运动预测和视差矢量可用,则IvMCShift候选可被用作用于帧间预测的合并候选。
可对当前块的列表0和1执行推导操作,以推导IvMCShift候选。偏移矢量(nPbW×2+4、nPbH×2+4)可被用于推导IvMCShift候选,使得当前块的位置(xPb、yPb)、当前块的宽度nPbW和高度nPbH、指示当前推导操作是列表1还是列表0的标志、被当前块参考的层的索引RefViewIdx[][]以及当前块的视差矢量MvRefinedDisp[][]可指示参考块63的右下方块64的位置。随后,可通过预定推导操作来获取相对于每个列表方向的IvMCShift候选的可用信息、运动矢量信息和参考索引信息。
当IvMCShift候选被推导时,可设置被表示为语法元素predFlagLXIvMCShift和mvLXIvMCShift运动信息。在这方面,predFlagLXIvMCShift表示参考方向信息,其中,所述参考方向信息作为指示IvMCShift候选是否已沿L0或L1方向执行了预测的标志,mvLXIvMCShift表示沿L0或L1方向的IvMCShift候选的运动矢量。如果IvMCShift候选在L0和L1方向之一可用,则IvMCShift候选可被设置为有用。
例如,如果IvMCShift候选具有帧间模式或跳过模式,则由于IvMCShift候选可被设置为有用,因此IvMCShift候选的运动矢量信息和参考索引信息可被获取。然后,层间视频解码设备20可执行将IvMCShift候选确定为合并候选并将IvMCShift候选添加到合并候选列表的伪代码操作。
i=0
if(availableFlagIvMCShift&&i<(5+NumExtraMergeCand)&&(!availableFlagIvMC||differentMotion(IvMC,IvMCShift)))
extMergeCandList[i++]=IvMCShift
根据以上的伪代码,可通过availableFlagIvMCShift确定IvShift候选是否可用。为了将IvShift候选添加到合并候选列表,可确定合并候选列表是否已被填充了最大数量(i<(5+NumExtraMergeCand))。如果合并候选列表到达最大数量,则IvShift候选可不被添加到合并候选列表。可确定IvShift候选是否不可用(!availableFlagIvMC)以及IvShift候选的运动矢量和IvMCShift候选的运动矢量是否彼此相同(differentMotion(IvMC,IvMCShift))。
当上述条件被满足时,IvMCShift候选可被添加到候选列表(extMergeCandList[i++])。在这方面,被添加到候选列表的信息可以是指示IvMCShift候选的信息以及IvMCShift的候选运动信息。
如果候选列表被完成,则层间视频解码设备20可基于从比特流获取的候选选择信息选择确定的候选列表中包括的候选之一。因此,层间视频解码设备20可使用选择的候选的运动信息对第二层当前块61执行帧间预测,从而确定第二层预测块。
图7示出根据实施例的子块被确定为帧间预测模式下的预测候选的示例。
参照图7,当被包括在参考画面72中并在第二层当前块71处由视差矢量指示的第一层参考块73包括多个子块时,层间视频解码设备20可将与视差矢量相应的子块75的周围块包括在预测候选中,以对当前画面70中包括的当前块71进行帧间预测。例如,当参考块73被划分为九个子块时,与视差矢量相应的子块75的周围块74可被确定为用于帧间预测的预测块。在这方面,可按照预定顺序(例如,z字形扫描和光栅扫描)来执行搜索,以确定子块是否包括运动信息。同时,用于确定预测候选的子块可以是编码单元或预测单元。
作为另一示例,层间视频解码设备20可在被包括在参考画面72中并在第二层当前块71处由视差矢量指示的第一层参考块73中的多个子块单元中获取运动信息,以对当前画面70中包括的当前块71进行帧间预测。例如,当参考块73被划分为九个子块时,可搜索参考块73是否包括针对每个子块的运动信息。在这方面,可按照预定顺序(例如,z字形扫描和光栅扫描)来执行搜索,以确定子块是否包括运动信息。
因此,层间视频解码设备20可获取每个子块所属的编码单元或预测单元的运动信息,但不必受限于此。子块可以是被任意确定以搜索帧间预测候选的单元。
另外,虽然已描述以上参照图4a至图7描述的操作由层间视频解码设备20执行,但是本领域普通技术人员将容易理解,相同的操作可由层间视频编码设备10执行。
在根据实施例的层间视频编码设备10和根据实施例的层间视频解码设备20中,如上所述,视频数据可被划分为具有树结构的编码单元,并且编码单元、预测单元和变换单元被用于对编码单元进行层间预测或帧间预测。在下文中,将参照图8至图20描述根据实施例的基于具有树结构的编码单元的视频编码方法和设备以及视频解码方法和设备。
基本上,在针对多层视频的编码/解码过程中,可单独地执行针对第一层图像的编码/解码过程和针对第二层图像的编码/解码过程。也就是说,当对多层视频执行层间预测时,可相互参考单层视频的编码/解码结果,但单独的编码/解码过程针对每个单层视频被执行。
为了便于描述,由于对单层视频执行将参照图8至图20描述的基于根据树结构的编码单元的视频编码过程和视频解码过程,因此将详细描述帧间预测和运动补偿。然而,如以上参照图1a至图6所描述的,基本层图像与第二层图像之间的层间预测和补偿被执行以对视频流进行编码/解码。
因此,当根据实施例的层间视频编码设备10的视差矢量确定器12对基于根据树结构的编码单元的多层视频进行编码时,为了针对每个单视点视频对视频进行编码,层间视频编码设备10包括与多层视频的层数一样多的图8的视频编码设备100,使得每个视频编码设备100可被控制以对分配的单层视频进行编码。此外,可伸缩视频编码设备1200可通过使用每个视频编码设备100的单独的单个视点的编码结果来执行视点间预测。因此,层间视频编码设备10的视差矢量确定器12可针对每个层次产生记录了针对每个层的编码结果的基本层视频流和第二层视频流。
类似地,当根据实施例的层间视频解码设备20的候选列表确定器26对基于根据树结构的编码单元的多层视频进行解码时,为了针对每个层对接收到的基本层视频流和第二层视频流进行解码,层间视频解码设备20可包括与多视点视频的层数一样多的视频解码设备200,并且视频解码设备200可被控制以对被分别分配给视频解码设备200的单层视频执行解码。另外,层间视频编码设备10可通过使用每个视频解码设备200的单独的单个层的解码结果来执行视点间补偿。因此,层间视频解码设备20的候选列表确定器26可产生针对每个层恢复的第一层图像和第二层图像。
图8是根据一个或更多个实施例的基于根据树结构的编码单元的视频编码设备100的框图。
涉及基于根据树结构的编码单元的视频预测的视频编码设备100包括LCU划分器110、编码单元确定器120和输出器130。
LCU划分器110可基于图像的当前画面的LCU来划分当前画面,其中,LCU是具有最大尺寸的编码单元。如果当前画面大于LCU,则可将当前画面的图像数据划分为至少一个LCU。根据一个或更多个实施例的LCU可以是尺寸为32×32、64×64、128×128或256×256等的数据单元,其中,数据单元的形状是宽度和长度为2的若干次方的正方形。图像数据可根据至少一个LCU被输出到编码单元确定器120。
根据一个或更多个实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从LCU被空间划分的次数,并且随着深度加深,根据深度的较深层编码单元可从LCU被划分到最小编码单元(SCU)。LCU的深度为最高深度,SCU的深度为最低深度。由于随着LCU的深度加深,与每个深度相应的编码单元的尺寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为LCU,并且每个LCU可包括根据深度被划分的较深层编码单元。由于根据深度对根据一个或更多个实施例的LCU进行划分,因此可根据深度对包括在LCU中的空间域的图像数据进行分层分类。
可预先确定编码单元的最大深度和最大尺寸,其中,所述最大深度和最大尺寸限制LCU的高度和宽度被分层划分的总次数。
编码单元确定器120对通过根据深度对LCU的区域进行划分而获取的至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换言之,编码单元确定器120通过根据当前画面的LCU以根据深度的较深层编码单元对图像数据进行编码,并选择具有最小编码误差的深度,来确定深度。将确定的深度和根据确定的深度的编码的图像数据输出到输出器130。
基于与等于或低于最大深度的至少一个深度相应的较深层编码单元,对LCU中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个LCU选择至少一个深度。
随着编码单元根据深度而被分层地划分以及随着编码单元的数量增加,LCU的尺寸被划分。另外,即使在一个LCU中编码单元与同一深度相应,仍通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分到更低深度。因此,即使当图像数据被包括在一个LCU中时,编码误差仍可根据所述一个LCU中的区域而不同,因此深度可根据图像数据中的区域而不同。因此,可在一个LCU中确定一个或更多个深度,并且可根据至少一个深度的编码单元来对LCU的图像数据进行划分。
因此,编码单元确定器120可确定包括在LCU中的具有树结构的编码单元。根据一个或更多个实施例的“具有树结构的编码单元”包括LCU中包括的所有较深层编码单元中的与确定为深度的深度相应的编码单元。可根据LCU的同一区域中的深度来分层地确定最终深度的编码单元,并可在不同区域中独立地确定编码深度的编码单元。类似地,可与另一区域中的最终深度独立地确定当前区域中的深度。
根据一个或更多个实施例的最大深度是与从LCU到SCU的划分次数相关的索引。根据一个或更多个实施例的第一最大深度可表示从LCU到SCU的总划分次数。根据一个或更多个实施例的第二最大深度可表示从LCU到SCU的深度等级的总数。例如,当LCU的深度是0时,对LCU划分一次的编码单元的深度可被设置为1,对LCU划分两次的编码单元的深度可被设置为2。这里,如果SCU是LCU被划分四次的编码单元,则存在深度0、1、2、3和4的5个深度等级,并因此第一最大深度可被设置为4,第二最大深度可被设置为5。
可根据LCU执行预测编码和变换。根据LCU,基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和变换。
由于每当根据深度对LCU进行划分时,较深层编码单元的数量增加,因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述,在LCU中,现在将基于当前深度的编码单元来描述预测编码和变换。
视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
为了在LCU中执行预测编码,可基于与最终深度相应的编码单元(即,基于不再被划分为与更低深度相应的编码单元的编码单元)来执行预测编码。以下,不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元而获取的分区可包括预测单元或通过对预测单元的高度和宽度中的至少一个进行划分而获取的数据单元。分区是编码单元的预测单元被划分的数据单元,并且预测单元可以是具有与编码单元相同的尺寸的分区。
例如,当2N×2N(其中,N是正整数)的编码单元不再被划分并且成为2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区模式的示例包括通过对预测单元的高度或宽度进行对称地划分而获取的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如,1:n或n:1)而获取的分区、通过对预测单元进行几何地划分而获取的分区、以及具有任意形状的分区。
预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如,可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。另外,可仅对2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元,来对编码单元中的图像数据执行变换。为了在编码单元中执行变换,可基于具有小于或等于编码单元的尺寸的数据单元来执行变换。例如,用于变换的数据单元可包括帧内模式的数据单元和帧间模式的数据单元。
以与根据树结构的编码单元类似的方式,编码单元中的变换单元可被递归地划分为更小尺寸的区域。因此,可基于根据变换深度的具有树结构的变换单元,对编码单元中的残差进行划分。
还可在变换单元中设置变换深度,其中,变换深度指示通过对编码单元的高度和宽度进行划分而达到变换单元的划分次数。例如,在2N×2N的当前编码单元中,当变换单元的尺寸是2N×2N时,变换深度可以是0,当变换单元的尺寸是N×N时,变换深度可以是1,当变换单元的尺寸是N/2×N/2时,变换深度可以是2。换句话说,还可根据变换深度设置具有树结构的变换单元。
根据与深度相应的编码单元的编码信息不仅要求关于深度的信息,还要求关于与预测编码和变换相关的信息。因此,编码单元确定器120不仅确定具有最小编码误差的深度,还确定预测单元中的分区模式、根据预测单元的预测模式以及用于变换的变换单元的尺寸。
下面将参照图7至图19详细描述根据一个或更多个实施例的LCU中的根据树构的编码单元以及确定预测单元/分区和变换单元的方法。
编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化来测量根据深度的较深层编码单元的编码误差。
输出器130在比特流中输出LCU的图像数据和关于根据深度的编码模式的信息,其中,所述LCU的图像数据基于由编码单元确定器120确定的至少一个深度而被编码。
可通过对图像的残差进行编码来获取编码图像数据。
关于根据深度的编码模式的信息可包括关于深度的信息、关于预测单元中的分区模式的信息、关于预测模式的信息和关于变换单元的尺寸的信息。
可通过使用根据深度的划分信息来定义关于深度的信息,其中,根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是深度,则对当前编码单元中的图像数据进行编码并输出,因此可将划分信息定义为不将当前编码单元划分到更低深度。可选地,如果当前编码单元的当前深度不是深度,则对更低深度的编码单元执行编码,并因此可将划分信息定义为对当前编码单元进行划分来获取更低深度的编码单元。
如果当前深度不是深度,则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复执行编码,并因此可对具有相同深度的编码单元递归地执行编码。
由于针对一个LCU确定具有树结构的编码单元,并且针对深度的编码单元确定关于至少一个编码模式的信息,因此可针对一个LCU确定关于至少一个编码模式的信息。另外,由于根据深度对图像数据进行分层划分,因此LCU的图像数据的深度可根据位置而不同,因此可针对图像数据设置划分信息。
因此,输出器130可将相应的划分信息分配给包括在LCU中的编码单元、预测单元和最小单元中的至少一个。
根据一个或更多个实施例的最小单元是通过将构成最低深度的SCU划分为4份而获取的正方形数据单元。可选择地,根据实施例的最小单元可以是可包括在LCU中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大正方形数据单元。
例如,通过输出器130输出的编码信息可被分类为根据较深层编码单元的编码信息和根据预测单元的编码信息。根据较深层编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。
根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、序列参数集或画面参数集中。
还可通过比特流的头、序列参数集或画面参数集来输出关于针对当前视频允许的变换单元的最大尺寸的信息、以及关于变换单元的最小尺寸的信息。输出器130可对与以上参照图1a至图14描述的SAO操作相关的SAO参数进行编码并输出。
在视频编码设备100中,较深层编码单元可以是通过将更高深度的编码单元(更高一层)的高度或宽度划分成两份而获取的编码单元。换言之,当当前深度的编码单元的尺寸是2N×2N时,更低深度的编码单元的尺寸是N×N。另外,尺寸为2N×2N的具有当前深度的编码单元可包括最多4个具有更低深度的编码单元。
因此,视频编码设备100可基于考虑当前画面的特征而确定的LCU的尺寸和最大深度,通过针对每个LCU确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外,由于可通过使用各种预测模式和变换中的任意一个对每个LCU执行编码,因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。
因此,如果以传统宏块对具有高分辨率或大数据量的图像进行编码,则每个画面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩的信息,并且数据压缩效率降低。然而,通过使用视频编码设备100,由于在考虑图像的尺寸的同时增加编码单元的最大尺寸,并同时在考虑图像的特征的同时调整编码单元,因此可提高图像压缩效率。
以上参照图1a描述的层间视频编码设备10可包括与层数一样多的视频编码设备100,以便针对多层视频中的每个层对单层图像进行编码。例如,视差矢量确定器12可包括单个视频编码设备100,运动信息获取器14可包括与附加视点的数量一样多的视频编码设备100。
当视频编码设备100对第一层图像进行编码时,编码单元确定器120可针对每个最大编码单元对根据树结构的每个编码单元确定用于帧间预测的预测单元,并可对每个预测单元执行帧间预测。
当视频编码设备100对第二层图像进行编码时,编码单元确定器120可针对每个最大编码单元确定根据树结构的编码单元和预测单元,并可对每个预测单元执行帧间预测。
视频编码设备100可对第一层图像与第二层图像之间的亮度差进行编码,以补偿所述亮度差。然而,可根据编码单元的编码模式来确定是否执行亮度补偿。例如,可仅对2N×2N的预测单元执行亮度补偿。
图9是根据一个或更多个实施例的基于具有树结构的编码单元的视频解码设备200的框图。
涉及基于具有树结构的编码单元的视频预测的视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据解码器230。
用于视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图8和视频编码设备100描述的定义相同。
接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流,针对每个编码单元提取编码的图像数据,并将提取的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个LCU的树结构。图像数据和编码信息提取器220可从关于当前画面的头、序列参数集或画面参数集提取关于当前画面的编码单元的最大尺寸的信息。
另外,图像数据和编码信息提取器220从解析的比特流,根据每个LCU,提取具有树结构的编码单元的划分信息和编码信息。提取的划分信息和编码信息被输出到图像数据解码器230。也就是说,比特流中的图像数据被划分为LCU,使得图像数据解码器230针对每个LCU对图像数据进行解码。
可针对与深度相应的至少一条划分信息设置根据LCU的划分信息和编码信息,根据深度的编码信息可包括关于与深度相应的相应编码单元的分区模式的信息、关于预测模式的信息和变换单元的划分信息。另外,根据深度的划分信息可被提取为关于最终深度的信息。
由图像数据和编码信息提取器220提取的根据每个LCU的划分信息和编码信息是这样的划分信息和编码信息:该划分信息和编码信息被确定为在编码器(诸如,视频编码设备100)根据每个LCU对根据深度的每个较深层编码单元重复地执行编码时产生最小编码误差。因此,视频解码设备200可通过根据产生最小编码误差的深度和编码模式对图像数据进行解码来重建图像。
由于划分信息和编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单元,提取划分信息和编码信息。如果相应LCU的划分信息和编码信息根据预定数据单元被记录,则可将被分配相同的划分信息和编码信息的预定数据单元推断为是包括在同一LCU中的数据单元。
图像数据解码器230基于根据LCU的划分信息和编码信息,通过对每个LCU中的图像数据进行解码来重建当前画面。换言之,图像数据解码器230可基于提取出的关于包括在每个LCU中的具有树结构的编码单元之中的每个编码单元的分区模式、预测模式和变换单元的信息,对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆变换。
图像数据解码器230可基于关于根据深度的编码单元的预测单元的分区模式和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
此外,为了对每个LCU进行逆变换,图像数据解码器230可针对每个编码单元读取关于根据树结构的变换单元的信息,以基于每个编码单元的变换单元来执行逆变换。经过逆变换,可重建编码单元的空间域的像素值。
图像数据解码器230可通过使用根据深度的划分信息来确定当前LCU的编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是最终深度。因此,图像数据解码器230可通过使用用于与深度相应的每个编码单元的关于预测单元的分区模式的信息、关于预测模式的信息和变换单元的划分信息,对当前LCU中的编码数据进行解码。
换言之,可通过观察被分配给编码单元、预测单元和最小单元中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。因此,可通过获取关于每个编码单元的编码模式的信息来对当前编码单元进行解码。
以上参照图2a描述的层间视频解码设备20可包括与视点数一样多的视频解码设备200,以便对接收到的第一层图像流和接收到的第二层图像流进行解码以恢复第一层图像和第二层图像。
当第一层图像流被接收到时,视频解码设备200的图像数据解码器230可将由提取器220从第一层图像流提取的第一层图像的样点划分为最大编码单元的根据树结构的编码单元。图像数据解码器230可针对第一层图像的样点的根据树结构的每个编码单元对用于帧间预测的每个预测单元执行运动补偿,以恢复第一层图像。
当第二层图像流被接收到时,视频解码设备200的图像数据解码器230可将由提取器220从第二层图像流提取的第二层图像的样点划分为最大编码单元的根据树结构的编码单元。图像数据解码器230可对对第二层图像的样点的用于帧间预测的每个预测单元执行运动补偿,以恢复第二层图像。
提取器220可从比特流获取与第一层图像和第二层图像之间的亮度差有关的信息,以补偿所述亮度差。然而,可根据编码单元的编码模式来确定是否执行亮度补偿。例如,可仅对2N×2N的预测单元执行亮度补偿。
视频解码设备200可获取与在对每个最大编码单元递归地执行编码时产生最小编码误差的至少一个编码单元有关的信息,并可使用所述信息来对当前画面进行解码。换句话说,可对每个最大编码单元中的被确定为最优编码单元的具有树结构的编码单元进行解码。此外,考虑分辨率和图像数据量来确定编码单元的最大尺寸。
因此,即使图像数据具有高分辨率或具有大数据量,也可通过使用编码单元的尺寸和编码模式来有效地对图像数据进行解码和恢复,其中,所述编码单元的尺寸和编码模式是通过使用从编码器接收的关于最优编码模式的信息,根据图像数据的特性而被自适应地确定的。
图10是用于描述根据各种实施例的编码单元的构思的示图。
编码单元的尺寸可被表示为宽度×高度,并且可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区,32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区,16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区,8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。
在视频数据310中,分辨率为1920×1080,编码单元的最大尺寸为64,最大深度为2。在视频数据320中,分辨率为1920×1080,编码单元的最大尺寸为64,最大深度为3。在视频数据330中,分辨率为352×288,编码单元的最大尺寸为16,最大深度为1。图17中示出的最大深度表示从LCU到最小解码单元的划分总次数。
如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。
由于视频数据310的最大深度是2,因此由于通过对LCU划分两次,深度加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的LCU和长轴尺寸为32和16的编码单元。由于视频数据330的最大深度是1,因此由于通过对LCU划分一次,深度加深至一层,因此视频数据330的编码单元335可包括长轴尺寸为16的LCU和长轴尺寸为8的编码单元。
由于视频数据320的最大深度是3,因此由于通过对LCU划分三次,深度加深至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的LCU和长轴尺寸为32、16和8的编码单元。随着深度加深,可准确地表达详细信息。
图11是根据一个或更多个实施例的基于编码单元的图像编码器400的框图。
图像编码器400执行视频编码设备100的编码单元确定器120中对图像数据进行编码所需的操作。换言之,帧内预测器420在当前帧405中根据预测单元对帧内模式下的编码单元执行帧内预测,帧间预测器415根据预测单元通过使用当前图像405和从重建画面缓存器410获取的参考图像对帧间模式下的编码单元执行帧间预测。当前图像405可被划分为LCU,然后LCU可被顺序编码。在这方面,可对将被划分为具有树结构的编码单元的LCU进行编码。
通过从与当前图像405的编码的编码单元有关的数据去除从帧内预测器420或帧间预测器415输出的与每个模式的编码单元有关的预测数据来产生残差数据,并且所述残差数据根据变换单元通过变换器425和量化器430被输出为量化后的变换系数。量化后的变换系数通过反量化器445和逆变换器450被重建为空间域中的残差数据。重建的空间域中的残差数据被添加到从帧间预测器420或帧间预测器输出的每个模式的编码单元的预测数据,并因此被重建为当前图像405的编码单元的空间域的数据。重建的空间域中的数据通过去块器455和SAO执行器460被产生为重建图像,重建图像被存储在重建画面缓存器410中。重建画面缓存器410中存储的重建图像可被用作用于另一图像的帧间预测的参考图像。被变换器425和量化器430量化的变换系数可通过熵编码器435被输出为比特流440。
为了将图像编码器400应用于视频编码设备100,图像编码器400的所有元件(即,帧间预测器415、帧内预测器420、变换器425、量化器430、熵编码器435、反量化器445、逆变换器450、去块器455和SAO执行器460)根据每个LCU基于具有树结构的编码单元中的每个编码单元执行操作。
具体地,帧内预测器420和帧间预测器415可在考虑当前LCU的最大尺寸和最大深度的情况下确定具有树结构的编码单元中的每个编码单元的分区模式和预测模式,变换器425可确定是否在具有树结构的编码单元中的每个编码单元中划分具有四叉树结构的变换单元。
图12是根据一个或更多个实施例的基于编码单元的图像解码器500的框图。
熵解码器515从比特流505解析将被解码的编码图像数据和解码所需的关于编码的信息。编码图像数据是量化后的变换系数,其中,残差数据是通过熵解码器520和逆变换器525从所述量化后的变换系数重建的。
帧内预测器540根据每个预测单元对帧内模式下的编码单元执行帧内预测。帧间预测器535通过使用从重建画面缓存器530获取的参考图像,针对每个预测单元对当前图像405中的帧间模式下的编码单元执行帧间预测。
经过帧内预测器540和帧间预测器535的关于每个模式的编码单元的预测数据和残差数据被求和,并因此关于当前图像405的编码单元的空间域中的数据可被重建,重建的空间域中的数据可通过去块器545和SAO执行器550被输出为重建图像560。重建画面缓存器530中存储的重建图像可被输出为参考图像。
为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,可执行根据实施例的图像解码器500的熵解码器515之后的操作。
为了将图像解码器500应用于根据实施例的视频解码设备200中,图像解码器500的所有元件(即,熵解码器515、反量化器520、逆变换器525、帧间预测器535、去块器545和SAO执行器550)可针对每个LCU基于具有树结构的编码单元执行操作。
具体地,SAO执行器550和帧间预测器535可针对具有树结构的编码单元中的每个编码单元确定分区和预测模式,逆变换器525可针对每个编码单元确定是否划分具有四叉树结构的变换单元。
图10的编码操作和图11的编码操作分别描述单层中的视频流编码操作和视频流解码操作。因此,如果图1a的视差矢量确定器12对两个或更多个层的视频流进行编码,可针对每个层设置图像编码器400。类似地,如果图1a的候选列表确定器26对两个或更多个层的视频流进行解码,可针对每个层设置图像解码器500。
图13是示出根据一个或更多个实施例的根据深度的较深层编码单元以及分区的示图。
视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
根据一个或更多个实施例,在编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,最大深度是3。在此情况下,最大深度是指编码单元从LCU到SCU被划分的总次数。由于深度沿着分层结构600的垂直轴加深,因此较深层编码单元的高度和宽度均被划分。另外,预测单元和分区沿着分层结构600的水平轴被示出,其中,所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
换言之,在分层结构600中,编码单元610是LCU,其中,深度为0,尺寸(即,高度乘宽度)为64×64。深度沿着垂直轴加深,存在尺寸为32×32和深度为1的编码单元620、尺寸为16×16和深度为2的编码单元630、尺寸为8×8和深度为3的编码单元640。尺寸为8×8和深度为3的编码单元640是SUC。
编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之,如果尺寸为64×64和深度为0的编码单元610是预测单元,则可将预测单元划分成包括在编码单元610中的分区,即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。
类似地,可将尺寸为32×32和深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区,即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。
类似地,可将尺寸为16×16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区,即,包括在编码度单元630中的尺寸为16×16的分区、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。
类似地,可将尺寸为8×8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区,即,包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。
为了确定构成LCU610的编码单元的最终深度,视频编码设备100的编码单元确定器120对包括在LCU610中的与每个深度相应的编码单元执行编码。
随着深度加深,包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,与深度1相应的编码单元和四个与深度2相应的编码单元均被编码。
为了针对多个深度之中的当前深度执行编码,可沿着分层结构600的水平轴,通过对与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深度,选择最小编码误差。可选地,随着深度沿着分层结构600的垂直轴加深,可通过针对每个深度执行编码来比较根据深度的最小编码误差,以搜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的最终深度和分区模式。
图14是用于描述根据一个或更多个实施例的编码单元710和变换单元720之间的关系的示图。
视频编码设备100或视频解码设备200针对每个LCU,根据具有小于或等于LCU的尺寸的编码单元,对图像进行编码或解码。可基于不大于相应编码单元的数据单元,来选择用于在编码期间进行变换的变换单元的尺寸。
例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行变换。
此外,可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的变换单元中的每一个执行变换,来对尺寸为64×64的编码单元710的数据进行编码,然后可选择具有最小编码误差的变换单元。
图15是用于描述根据一个或更多个实施例的与深度相应的编码单元的编码信息的示图。
视频编码设备100的输出器130可对与最终深度相应的每个编码单元的关于分区模式的信息800、关于预测模式的信息810以及关于变换单元的尺寸的信息820进行编码,并将信息800、信息810以及信息820作为关于编码模式的信息来发送。
信息800指示关于通过划分当前编码单元的预测单元而获取的分区的模式的信息,其中,分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的分区808。这里,关于分区模式的信息800被设置为指示以下分区之一:尺寸为2N×N的分区804、尺寸为N×2N的分区806和尺寸为N×N的分区808。
信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧间变换单元828。
视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元,提取并使用用于解码的信息800、信息810和信息820。
图16是根据一个或更多个实施例的根据深度的较深层编码单元的示图。
划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。
用于对深度为0和尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区模式的分区:尺寸为2N_0×2N_0的分区模式912、尺寸为2N_0×N_0的分区模式914、尺寸为N_0×2N_0的分区模式916和尺寸为N_0×N_0的分区模式918。图23仅示出了通过对称地划分预测单元910而获取的分区模式912至918,但是分区模式不限于此,并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。
根据每种分区模式,对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。
如果在分区模式912至916中的一个分区模式中编码误差最小,则可不将预测单元910划分到更低深度。
如果在分区模式918中编码误差最小,则深度从0改变到1以在操作920中对分区模式918进行划分,并对深度为2和尺寸为N_0×N_0的编码单元930重复地执行编码来搜索最小编码误差。
用于对深度为1和尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进行预测编码的预测单元940可包括以下分区模式的分区:尺寸为2N_1×2N_1的分区模式942、尺寸为2N_1×N_1的分区模式944、尺寸为N_1×2N_1的分区模式946以及尺寸为N_1×N_1的分区模式948。
如果在分区模式948中编码误差最小,则深度从1改变到2以在操作950中对分区模式948进行划分,并对深度为2和尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。
当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成d-1时,并且划分信息可被编码直到深度是0到d-2之一时。换句话说,当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-1时,用于对深度为d-1和尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区模式的分区:尺寸为2N_(d-1)×2N_(d-1)的分区模式992、尺寸为2N_(d-1)×N_(d-1)的分区模式994、尺寸为N_(d-1)×2N_(d-1)的分区模式996和尺寸为N_(d-1)×N_(d-1)的分区模式998。
可对分区模式992至998中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区模式。
即使当分区模式998具有最小编码误差时,由于最大深度是d,因此深度为d-1的编码单元CU_(d-1)也不再被划分到更低深度,用于构成当前LCU900的编码单元的深度被确定为d-1,并且当前LCU900的分区模式可被确定为N_(d-1)×N_(d-1)。此外,由于最大深度是d并且最低深度为d-1的SCU980不再被划分到更低深度,因此不设置SUC980的划分信息。
数据单元999可以是用于当前LCU的“最小单元”。根据一个或更多个实施例的最小单元可以是通过将SCU980划分成4份而获取的正方形数据单元。通过重复地执行编码,视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定深度,并将相应分区模式和预测模式设置为该深度的编码模式。
这样,在所有深度1至d中对根据深度的最小编码误差进行比较,并且具有最小编码误差的深度可被确定为深度。深度、预测单元的分区模式和预测模式可作为关于编码模式的信息被编码并发送。另外,由于编码单元从0的深度被划分到该深度,因此仅将该深度的划分信息设置为“0”,并且将除了该深度以外的深度的划分信息设置为“1”。
视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的深度和预测单元的信息,来对分区912进行解码。视频解码设备200可通过使用根据深度的划分信息,将划分信息为“0”的深度确定为深度,并且使用关于相应深度的编码模式的信息来进行解码。
图17至图19是用于描述根据一个或更多个实施例的在编码单元1010、预测单元1060和变换单元1070之间的关系的示图。
编码单元1010是LCU中的与由视频编码设备100确定的深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010的预测单元的分区,变换单元1070是每个编码单元1010的变换单元。
当在编码单元1010中LCU的深度是0时,编码单元1012和1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
在预测单元1060中,通过划分编码单元1010中的编码单元来获取一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说,编码单元1014、1022、1050和1054中的分区模式的尺寸是2N×N,编码单元1016、1048和1052中的分区模式的尺寸是N×2N,编码单元1032的分区模式的尺寸为N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。
在小于编码单元1052的数据单元中的变换单元1070中,对编码单元1052的图像数据执行变换或逆变换。另外,在尺寸和形状方面,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050和1052。换句话说,视频编码设备100和视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。
因此,对LCU的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元,从而可获取具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区模式的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由视频编码设备100和视频解码设备200设置的编码信息。
[表1]
视频编码设备100的输出器130可输出关于具有树结构的编码单元的编码信息,视频解码设备200的图像数据和编码信息提取器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。
划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0,则当前编码单元不再被划分成更低深度的深度是最终深度,从而可针对所述最终深度来定义关于分区模式、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分,则对更低深度的四个划分编码单元独立地执行编码。
预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可在所有分区模式中定义帧内模式和帧间模式,仅在尺寸为2N×2N的分区模式中定义跳过模式。
关于分区模式的信息可指示通过对称地划分预测单元的高度或宽度而获取的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区模式,以及通过非对称地划分预测单元的高度或宽度而获取的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的非对称分区模式。可通过按1:3和3:1来划分预测单元的高度来分别获取尺寸为2N×nU和2N×nD的非对称分区模式,可通过按1:3和3:1来划分预测单元的宽度来分别获取尺寸为nL×2N和nR×2N的非对称分区模式。
可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换句话说,如果变换单元的划分信息是0,则变换单元的尺寸可以是2N×2N,即当前编码单元的尺寸。如果变换单元的划分信息是1,则可通过对当前编码单元进行划分来获取变换单元。另外,如果尺寸为2N×2N的当前编码单元的分区模式是对称分区模式,则变换单元的尺寸可以是N×N,如果当前编码单元的分区模式是非对称分区模式,则变换单元的尺寸可以是N/2×N/2。
关于具有树结构的编码单元的编码信息可包括与深度相应的编码单元、预测单元和最小单元中的至少一个。与深度相应的编码单元可包括包含相同编码信息的预测单元和最小单元中的至少一个。
因此,通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与深度相应的同一编码单元中。另外,通过使用数据单元的编码信息来确定与深度相应的相应编码单元,并因此可确定LCU中的深度的分布。
因此,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。
可选地,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元,并可参考搜索到的邻近编码单元以对当前编码单元进行预测。
图20是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。
LCU1300包括多个深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里,由于编码单元1318是一个深度的编码单元,因此划分信息可被设置成0。可将关于尺寸为2N×2N的编码单元1318的分区模式的信息设置成以下分区模式中的一种:尺寸为2N×2N的分区模式1322、尺寸为2N×N的分区模式1324、尺寸为N×2N的分区模式1326、尺寸为N×N的分区模式1328、尺寸为2N×nU的分区1332、尺寸为2N×nD的分区模式1334、尺寸为nL×2N的分区模式1336和尺寸为nR×2N的分区模式1338。
变换单元的划分信息(TU尺寸标志)是一种类型的变换索引。与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区模式而改变。
例如,当分区模式被设置为对称(即,分区模式1322、1324、1326或1328)时,如果变换单元的TU尺寸标志是0,则设置尺寸为2N×2N的变换单元1342,如果TU尺寸标志是1,则设置尺寸为N×N的变换单元1344。
当分区模式被设置成非对称(即分区模式1332、1334、1336或1338)时,如果TU尺寸标志是0,则设置尺寸为2N×2N的变换单元1352,如果TU尺寸标志是1,则设置尺寸为N/2×N/2的变换单元1354。
参照图19,TU尺寸标志是具有值0或1的标志,但是TU尺寸标志不限于1比特,并且变换单元可在TU尺寸标志从0增加时被分层划分为具有树结构。变换单元的划分信息(TU尺寸标志)可以是变换索引的示例。
在这种情况下,可通过使用根据一个或更多个实施例的变换单元的TU尺寸标志以及变换单元的最大尺寸和最小尺寸来表示实际上已使用的变换单元的尺寸。视频编码设备100能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标志进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标志进行编码的结果可被插入SPS。视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标志来对视频进行解码。
例如,(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32,则(a-1)当TU尺寸标志为0时,变换单元的尺寸可以是32×32,(a-2)当TU尺寸标志为1时,变换单元的尺寸可以是16×16,(a-3)当TU尺寸标志为2时,变换单元的尺寸可以是8×8。
作为另一示例,(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32,则(b-1)当TU尺寸标志为0时,变换单元的尺寸可以是32×32。这里,由于变换单元的尺寸不能够小于32×32,因此TU尺寸标志不能够被设置为除了0以外的值。
作为另一示例,(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标志为1,则TU尺寸标志可以是0或1。这里,TU尺寸标志不能够被设置为除了0或1以外的值。
因此,如果定义最大TU尺寸标志为“MaxTransformSizeIndex”,最小变换单元尺寸为“MinTransformSize”,当TU尺寸标志为0时的变换单元尺寸为“RootTuSize”,则可通过等式(1)来定义可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”:
CurrMinTuSize=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))…(1)
与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比,当TU尺寸标志为0时的变换单元尺寸“RootTuSize”可指示可在系统中选择的最大变换单元尺寸。在等式(1)中,“RootTuSize/(2^MaxTransformSizeIndex)”指示当TU尺寸标志为0时,变换单元尺寸“RootTuSize”被划分了与最大TU尺寸标志相应的次数时的变换单元尺寸,“MinTransformSize”指示最小变换尺寸。因此,“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中较小的值可以是可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。
根据一个或更多个实施例,最大变换单元尺寸RootTuSize可根据预测模式的类型而改变。
例如,如果当前预测模式是帧间模式,则可通过使用以下的等式(2)来确定“RootTuSize”。在等式(2)中,“MaxTransformSize”指示最大变换单元尺寸,“PUSize”指示当前预测单元尺寸。
RootTuSize=min(MaxTransformSize,PUSize)……(2)
也就是说,如果当前预测模式是帧间模式,则当TU尺寸标志为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中较小的值。
如果当前分区单元的预测模式是帧内模式,则可通过使用以下的等式(3)来确定“RootTuSize”。在等式(3)中,“PartitionSize”指示当前分区单元的尺寸:
RootTuSize=min(MaxTransformSize,PartitionSize)……(3)
也就是说,如果当前预测模式是帧内模式,则当TU尺寸标志为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元的尺寸之中较小的值。
然而,根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸“RootTuSize”仅是示例,并且实施例不限于此。
根据如参照图8至图20描述的基于具有树结构的编码单元的视频编码方法,可针对树结构的每个编码单元对空间域中的图像数据进行编码。根据基于具有树结构的编码单元的视频解码方法,对每个LCU执行解码来重建空间域的的图像数据。因此,画面和作为画面序列的视频可被重建。重建的视频可由再现设备来再现,可存储在存储介质中,或可通过网络来发送。
实施例可被编写为计算机程序,并可实现在使用计算机可读记录介质执行程序的通用数字计算机中。计算机可读记录介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)和光学记录介质(例如,CD-ROM或DVD)等。
为了便于描述,以上参照图1a至图20描述的层间视频编码方法和/或视频编码方法将被称为“根据各种实施例的视频编码方法”。另外,以上参照图1a至图20描述的层间视频解码方法和/或视频解码方法将被称为“根据各种实施例的视频解码方法”。
以上参照图1a至图20描述的包括层间视频编码设备10、视频编码设备100或图像编码器400的视频编码设备将被称为“根据各种实施例的视频编码设备”。另外,以上参照图1a至图20描述的包括层间视频解码设备20、视频解码设备200或图像解码器500的视频解码设备将被称为“根据各种实施例的视频解码设备”。
现在将详细描述根据各种实施例的存储程序的计算机可读记录介质(例如,盘26000)。
图21是根据一个或更多个实施例的存储程序的盘26000的物理结构的示图。作为存储介质的盘26000可以是硬盘驱动器、致密盘只读存储器(CD-ROM)盘、蓝光盘或数字多功能盘(DVD)。盘26000包括多个同心磁道Tr,每个同心磁道Tr沿盘26000的圆周方向被划分成特定数量的扇区Se。在盘26000的特定区域中,可分配并存储执行以上所描述的量化参数确定方法、视频编码方法和视频解码方法的程序。
现在将参照图29来描述使用存储用于执行如上所述的视频编码方法和视频解码方法的程序的存储介质来实现的计算机系统。
图22是通过使用盘26000来记录并读取程序的盘驱动器26800的示图。计算机系统26700可经由盘驱动器26800将执行根据一个或更多个实施例的视频编码方法和视频解码方法中的至少一个的程序存储在盘26000中。为了在计算机系统26700中运行存储在盘26000中的程序,可通过使用盘驱动器26800从盘26000读取程序并将程序发送到计算机系统26700。
执行根据一个或更多个实施例的视频编码方法和视频解码方法中的至少一个的程序不仅可被存储在图21或图22中示出的盘26000中,还可被存储在存储卡、ROM卡带或固态驱动器(SSD)中。
以下将描述应用以上所描述的视频编码方法和视频解码方法的系统。
图23是用于提供内容分布服务的内容供应系统11000的整体结构的示图。将通信系统的服务区域划分成预定尺寸的小区,并将无线基站11700、11800、11900和12000分别安装在这些小区中。
内容供应系统11000包括多个独立装置。例如,诸如计算机12100、个人数字助理(PDA)12200、视频相机12300和移动电话12500的多个独立装置经由互联网服务提供商11200、通信网络11400和无线基站11700、11800、11900和12000连接到互联网11100。
然而,内容供应系统11000不限于如图23中所示,并且装置可选择性地被连接到内容供应系统11000。多个独立装置可不经由无线基站11700、11800、11900和12000而直接连接到通信网络11400。
视频相机12300是能够捕捉视频图像的成像装置,例如,数字视频相机。移动电话12500可利用各种协议(例如,个人数字通信(PDC)、码分多址(CDMA)、宽带码分多址(W-CDMA)、全球移动通信系统(GSM)和个人手持电话系统(PHS))中的至少一种通信方法。
视频相机12300可经由无线基站11900和通信网络11400连接到流服务器11300。流服务器11300允许经由视频相机12300从用户接收到的内容经由实时广播被流传输。可使用视频相机12300或流服务器11300来对从视频相机12300接收到的内容进行编码。通过视频相机12300捕捉到的视频数据可经由计算机12100被发送到流服务器11300。
通过相机12600捕捉到的视频数据也可经由计算机12100被发送到流服务器11300。与数字相机类似,相机12600是能够捕捉静止图像和视频图像两者的成像装置。可使用相机12600或计算机12100对通过相机12600捕捉到的视频数据进行编码。可将对视频执行编码和解码的软件存储在可由计算机12100访问的计算机可读记录介质(例如,CD-ROM盘、软盘、硬盘驱动器、SSD或存储卡)中。
如果视频数据通过内置在移动电话12500中的相机被捕捉到,则可从移动电话12500接收视频数据。
还可通过安装在视频相机12300、移动电话12500或相机12600中的大规模集成电路(LSI)系统来对视频数据进行编码。
内容供应系统11000可对由用户使用视频相机12300、相机12600、移动电话12500或另一成像装置所记录的内容数据(例如,在音乐会期间记录的内容)进行编码,并将编码后的内容数据发送到流服务器11300。流服务器11300可将编码后的内容数据以流传输内容的类型发送到请求内容数据的其它客户端。
客户端是能够对编码后的内容数据进行解码的装置,例如,计算机12100、PDA12200、视频相机12300或移动电话12500。因此,内容供应系统11000允许客户端接收并再现编码后的内容数据。此外,内容供应系统11000允许客户端实时接收编码后的内容数据并对编码后的内容数据进行解码和再现,从而能够进行个人广播。
包括在内容供应系统11000中的多个独立装置的编码和解码操作可类似于根据一个或更多个实施例的视频编码设备和视频解码设备的编码和解码操作。
现在将参照图24和图25更加详细地描述包括在根据一个或更多个实施例的内容供应系统11000中的移动电话12500。
图24示出根据一个或更多个实施例的应用视频编码方法和视频解码方法的移动电话12500的外部结构。移动电话12500可以是智能电话,所述智能电话的功能不受限,并且所述智能电话的大多数功能可被改变或扩展。
移动电话12500包括可与图21的无线基站12000交换射频(RF)信号的内部天线12510,并包括用于显示由相机12530捕捉到的图像或经由天线12510接收到的并被解码的图像的显示屏12520(例如,液晶显示器(LCD)或有机发光二极管(OLED)屏幕)。移动电话12500包括包含有控制按钮和触摸面板的操作面板12540。如果显示屏12520是触摸屏,则操作面板12540还包括显示屏12520的触摸感测面板。移动电话12500包括用于输出语音和声音的扬声器12580或另一类型声音输出器、以及用于输入语音和声音的麦克风12550或另一类型声音输入器。移动电话12500还包括用于捕捉视频和静止图像的相机12530,诸如电荷耦合器件(CCD)相机。移动电话12500还可包括:存储介质12570,用于存储通过相机12530捕捉到的、经由电子邮件接收到的、或根据各种方式获取的编码/解码数据(例如,视频或静止图像);插槽12560,存储介质12570经由插槽12560被装入移动电话12500中。存储介质12570可以是闪存,例如,包括在塑料壳中的安全数字(SD)卡或电可擦和可编程只读存储器(EEPROM)。
图25示出根据一个或更多个实施例的移动电话12500的内部结构。为了系统地控制包括显示屏12520和操作面板12540的移动电话12500的部件,供电电路12700、操作输入控制器12640、图像编码器12720、相机接口12630、LCD控制器12620、图像解码器12690、复用器/解复用器12680、记录器/读取器12670、调制器/解调器12660和声音处理器12650经由同步总线12730被连接到中央控制器12710。
如果用户操作电源按钮,并从“电源关闭”状态设置为“电源开启”状态,则供电电路12700从电池组向移动电话12500的所有部件供电,从而将移动电话12500设置为操作模式。
中央控制器12710包括中央处理器(CPU)、ROM和RAM。
在移动电话12500将通信数据发送到外部的同时,在中央控制器12710的控制下,由移动电话12500产生数字信号。例如,声音处理器12650可产生数字声音信号,图像编码器12720可产生数字图像信号,并且消息的文本数据可经由操作面板12540和操作输入控制器12640被产生。当数字信号在中央控制器12710的控制下被传送到调制器/解调器12660时,调制器/解调器12660对数字信号的频带进行调制,并且通信电路12610对频带调制后的数字声音信号执行数模转换(DAC)和频率转换。从通信电路12610输出的发送信号可经由天线12510被发送到语音通信基站或无线基站12000。
例如,当移动电话12500处于通话模式时,在中央控制器12710的控制下,经由麦克风12550获取的声音信号通过声音处理器12650被变换成数字声音信号。数字声音信号可经由调制器/解调器12660和通信电路12610被变换成变换信号,并可经由天线12510被发送。
当文本消息(例如,电子邮件)在数据通信模式下被发送时,文本消息的文本数据经由操作面板12540被输入,并经由操作输入控制器12640被发送到中央控制器12710。在中央控制器12710的控制下,文本数据经由调制器/解调器12660和通信电路12610被变换成发送信号,并经由天线12510被发送到无线基站12000。
为了在数据通信模式下发送图像数据,由相机12530捕捉到的图像数据经由相机接口12630被提供给图像编码器12720。捕捉到的图像数据可经由相机接口12630和LCD控制器12620被直接显示在显示屏12520上。
图像编码器12720的结构可与根据一个或更多个实施例的上述视频编码设备的结构相应。图像编码器12720可基于根据一个或更多个实施例的上述视频编码方法,将从相机12530接收到的图像数据变换为压缩和编码后的图像数据,并随后将编码后的图像数据输出到复用器/解复用器12680。在相机12530的记录操作期间,由移动电话12500的麦克风12550获取的声音信号可经由声音处理器12650被变换成数字声音数据,并且数字声音数据可被发送到复用器/解复用器12680。
复用器/解复用器12680对从图像编码器12720接收到的编码后的图像数据与从声音处理器12650接收到的声音数据一起进行复用。对数据进行复用的结果可经由调制器/解调器12660和通信电路12610被变换成发送信号,然后可经由天线12510被发送。
当移动电话12500从外部接收通信数据时,可对经由天线12510接收到的信号执行频率恢复和ADC以将信号变换成数字信号。调制器/解调器12660对数字信号的频带进行调制。根据频带调制后的数字信号的类型,将所述数字信号发送到视频解码单元12690、声音处理器12650或LCD控制器12620。
在通话模式下,移动电话12500对经由天线12510接收到的信号进行放大,并通过对放大后的信号执行频率转换和ADC来获取数字声音信号。在中央控制器12710的控制下,接收到的数字声音信号经由调制器/解调器12660和声音处理器12650被变换成模拟声音信号,并且模拟声音信号经由扬声器12580被输出。
当在数据通信模式下时,接收在互联网网站上访问的视频文件的数据,经由调制器/解调器12660将经由天线12510从无线基站12000接收到的信号输出为复用数据,并将复用数据发送到复用器/解复用器12680。
为了对经由天线12510接收到的复用数据进行解码,复用器/解复用器12680将复用数据解复用成编码后的视频数据流和编码后的音频数据流。经由同步总线12730,编码后的视频数据流和编码后的音频数据流分别被提供给视频解码解码12690和声音处理器12650。
图像解码器12690的结构可与根据一个或更多个实施例的上述视频解码设备的结构相应。图像解码器12690可通过使用根据一个或更多个实施例的上述视频解码方法,对编码后的视频数据进行解码来获取重建的视频数据,并经由LCD控制器12620将重建的视频数据提供给显示屏12520。
因此,可将在互联网网站上访问的视频文件的数据显示在显示屏12520上。同时,声音处理器12650可将音频数据变换成模拟声音信号,并将模拟声音信号提供给扬声器12580。因此,也可经由扬声器12580再现在互联网网站上访问的视频文件中包含的音频数据。
移动电话12500或另一类型的通信终端可以是包括根据一个或更多个实施例的视频编码设备和视频解码设备两者的收发终端,可以是仅包括视频编码设备的收发终端,或者可以是仅包括视频解码设备的收发终端。
根据一个或更多个实施例的通信系统不限于以上参照图24描述的通信系统。例如,图26示出根据一个或更多个实施例的采用通信系统的数字广播系统。图26的数字广播系统可通过使用根据一个或更多个实施例的视频编码设备和视频解码设备来接收经由卫星或地面网络发送的数字广播。
具体地,广播站12890通过使用无线电波将视频数据流发送到通信卫星或广播卫星12900。广播卫星12900发送广播信号,广播信号经由家用天线12860被发送到卫星广播接收器。在每个房屋中,可通过TV接收器12810、机顶盒12870或其它装置对编码后的视频流进行解码并再现。
当根据一个或更多个实施例的视频解码设备被实现在再现设备12830中时,再现设备12830可对记录在存储介质12820(诸如盘或存储卡)上的编码后的视频流进行解析和解码,以重建数字信号。因此,可在例如监视器12840上再现重建的视频信号。
在被连接到用于卫星/地面广播的天线12860或用于接收有线电视(TV)广播的线缆天线12850的机顶盒12870中,可安装根据一个或更多个实施例的视频解码设备。从机顶盒12870输出的数据也可被再现在TV监视器12880上。
作为另一示例,可将根据一个或更多个实施例的视频解码设备安装在TV接收器12810中,而不是机顶盒12870中。
具有适当天线12910的汽车12920可接收从图21的卫星12900或无线基站11700发送的信号。可在安装在汽车12920中的汽车导航系统12930的显示屏上再现解码后的视频。
视频信号可由根据一个或更多个实施例的视频编码设备来编码,然后可被存储在存储介质中。具体地,可由DVD记录器将图像信号存储在DVD盘12960中,或可由硬盘记录器12950将图像信号存储在硬盘中。作为另一示例,可将视频信号存储在SD卡12970中。如果硬盘记录器12950包括根据一个或更多个实施例的视频解码设备,则记录在DVD盘12960、SD卡12970或另一存储介质上的视频信号可在TV监视器12880上被再现。
汽车导航系统12930可不包括图26的相机12530以及图26的相机接口12630和图像编码器12720。例如,计算机12100和TV接收器12810可不包括相机12530、相机接口12630和图像编码器12720。
图27是示出根据一个或更多个实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。
云计算系统可包括云计算服务器14000、用户数据库(DB)14100、多个计算资源14200和用户终端。
响应于来自用户终端的请求,云计算系统经由数据通信网络(例如,互联网)提供多个计算资源14200的点播外包服务。在云计算环境下,服务提供商通过使用虚拟技术组合位于不同的物理位置的数据中心处的计算资源,来为用户提供想要的服务。服务用户不必将计算资源(例如,应用、存储器、操作系统(OS)和安全软件)安装在他/她自己的终端中以使用它们,但可在想要的时间点在通过虚拟技术产生的虚拟空间中从服务中选择和使用想要的服务。
被指定的服务用户的用户终端经由包括互联网和移动电信网络的数据通信网络被连接到云计算服务器14000。可从云计算服务器14100向用户终端提供云计算服务,特别是视频再现服务。用户终端可以是能够被连接到互联网的各种类型的电子装置,例如,桌上型PC14300、智能TV14400、智能电话14500、笔记本计算机14600、便携式多媒体播放器(PMP)14700、平板PC14800等。
云计算服务器14000可组合分布在云网络中的多个计算资源14200,并向用户终端提供组合的结果。所述多个计算资源14200可包括各种数据服务,并可包括从用户终端上载的数据。如上所描述的,云计算服务器14000可通过根据虚拟技术组合分布在不同区域中的视频数据库来向用户终端提供想要的服务。
将关于已经订购云计算服务的用户的用户信息存储在用户DB14100中。用户信息可包括用户的注册信息、地址、姓名和个人信用信息。用户信息还可包括视频的索引。这里,所述索引可包括已经被再现的视频的列表、正在被再现的视频的列表、之前正在被再现的视频的暂停点等。
可在用户装置之间共享存储在用户DB14100中的关于视频的信息。例如,当响应于来自笔记本计算机14600的请求将视频服务提供给笔记本计算机14600时,视频服务的再现历史被存储在用户DB14100中。当从智能电话14500接收到用于再现此视频服务的请求时,云计算服务器14000基于用户DB14100搜索并再现此视频服务。当智能电话14500从云计算服务器14000接收到视频数据流时,通过对视频数据流进行解码来再现视频的处理与以上参照图24描述的移动电话12500的操作类似。
云计算服务器14000可参考存储在用户DB14100中的想要的视频服务的再现历史。例如,云计算服务器14000从用户终端接收用于再现存储在用户DB14100中的视频的请求。如果此视频被再现过,则由云计算服务器14000执行的对此视频进行流传输的方法可根据来自用户终端的请求(即,根据是将从视频的起点还是视频的暂停点开始再现视频)而不同。例如,如果用户终端请求从视频的起点开始再现视频,则云计算服务器14000将从视频的第一帧开始的视频的流数据发送到用户终端。如果用户终端请求从视频的暂停点开始再现视频,则云计算服务器14000将从与暂停点相应的帧开始的视频的流数据发送到用户终端。
在此情况下,用户终端可包括如以上参照图1a至图20描述的视频解码设备。作为另一示例,用户终端可包括如以上参照图1a至图20描述的视频编码设备。可选地,用户终端可包括如以上参照图1a至图20描述的视频解码设备和视频编码设备两者。
以上参照图21至图27描述了以上参照图1a至图20描述的根据一个或更多个实施例的视频编码方法、视频解码方法、视频编码设备和视频解码设备的各种应用。然而,根据各种实施例的将以上参照图1a至图20描述的视频编码方法和视频解码方法存储在存储介质中的方法或者将以上参照图1a至图20描述的视频编码设备和视频解码设备实现在装置中的方法不限于以上参照图21至图27描述的实施例。
应理解,这里描述的示例性实施例仅被认为是说明性意义,而不是为了限制的目的。在每个实施例内的特征或方面的描述通常应被认为可用于其它实施例中的其它类似特征或方面。虽然已经参照附图描述了本发明的一个或更多个实施例,但是本领域的普通技术人员将理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可作出形式和细节上的各种改变。

Claims (15)

1.一种层间视频解码方法,包括:
确定用于参考第一层图像对第二层当前块执行层间预测的视差矢量;
与第二层当前块的位置相关地确定与所确定的视差矢量相应的第一层参考位置;
获取位于第一层参考位置周围的一个或更多个周围块的运动信息;
将获取的运动信息中的至少一个添加到用于帧间预测的候选列表。
2.如权利要求1所述的层间视频解码方法,其中,获取运动信息的步骤包括:
确定与第一层参考位置相应的第一层参考块;
从第一层参考块的一个或更多个周围块获取一条或更多条运动信息。
3.如权利要求2所述的层间视频解码方法,其中,获取一条或更多条运动信息的步骤包括:根据预定扫描顺序从与第一层参考位置相应的第一层参考块的左下方块获取所述一条或更多条运动信息。
4.如权利要求2所述的层间视频解码方法,其中,获取一条或更多条运动信息的步骤包括:根据预定扫描顺序从第一层参考块的所述一个或更多个周围块获取所述一条或更多条运动信息。
5.如权利要求1所述的层间视频解码方法,其中,当与第一层参考位置相应的块包括多个子块时,所述一个或更多个周围块包括所述多个子块。
6.如权利要求1所述的层间视频解码方法,还包括:
确定与第一层参考位置相应的第一层参考块;
将第一层参考块划分为多个子块,并从所述多个子块获取一条或更多条运动信息。
7.如权利要求1所述的层间视频解码方法,其中,将获取的运动信息中的至少一个添加到候选列表的步骤包括:
将所述一个或更多个周围块中的运动信息被获取的一个周围块确定为预测候选;
将确定的预测候选的运动信息添加到候选列表。
8.如权利要求7所述的层间视频解码方法,其中,将所述一个或更多个周围块中的运动信息被获取的一个周围块确定为预测候选的步骤包括:将所述一个或更多个周围块之中的具有最大大小的运动矢量的周围块确定为预测候选。
9.如权利要求7所述的层间视频解码方法,其中,将所述一个或更多个周围块中的运动信息被获取的一个周围块确定为预测候选的步骤包括:将所述一个或更多个周围块之中的具有与第二层当前块的参考画面顺序计数(POC)相同的参考POC的周围块确定为预测候选。
10.如权利要求7所述的层间视频解码方法,其中,将所述一个或更多个周围块中的运动信息被获取的一个周围块确定为预测候选的步骤包括:优先考虑所述一个或更多个周围块之中的使用双向预测的周围块,并将使用双向预测的所述周围块确定为预测候选。
11.一种层间视频编码方法,包括:
确定用于参考第一层图像对第二层当前块执行层间预测的视差矢量;
与第二层当前块的位置相关地确定与所确定的视差矢量相应的第一层参考位置;
获取位于第一层参考位置周围的一个或更多个周围块的运动信息;
将获取的运动信息中的至少一个添加到用于帧间预测的候选列表。
12.如权利要求11所述的层间视频编码方法,其中,获取运动信息的步骤包括:
确定与第一层参考位置相应的第一层参考块;
从第一层参考块的一个或更多个周围块获取一条或更多条运动信息。
13.如权利要求12所述的层间视频编码方法,其中,获取一条或更多条运动信息的步骤包括:根据预定扫描顺序从与第一层参考位置相应的第一层参考块的左下方块获取所述一条或更多条运动信息。
14.一种层间视频解码设备,包括:
视差矢量确定器,确定用于参考第一层图像对第二层当前块执行层间预测的视差矢量;
运动信息获取器,与第二层当前块的位置相关地确定与所确定的视差矢量相应的第一层参考位置,并获取位于第一层参考位置周围的一个或更多个周围块的运动信息;
候选列表确定器,将获取的运动信息中的至少一个添加到用于帧间预测的候选列表。
15.一种记录有用于执行权利要求1的层间视频解码方法的计算机程序的非暂时性计算机可读记录介质。
CN201480032434.8A 2013-04-05 2014-04-07 针对层间解码和编码方法以及设备的确定帧间预测候选的方法 Pending CN105264894A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361808922P 2013-04-05 2013-04-05
US61/808,922 2013-04-05
PCT/KR2014/003002 WO2014163458A1 (ko) 2013-04-05 2014-04-07 인터 레이어 복호화 및 부호화 방법 및 장치를 위한 인터 예측 후보 결정 방법

Publications (1)

Publication Number Publication Date
CN105264894A true CN105264894A (zh) 2016-01-20

Family

ID=51658672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480032434.8A Pending CN105264894A (zh) 2013-04-05 2014-04-07 针对层间解码和编码方法以及设备的确定帧间预测候选的方法

Country Status (5)

Country Link
US (1) US20160073115A1 (zh)
EP (1) EP2981090A4 (zh)
KR (1) KR20140122195A (zh)
CN (1) CN105264894A (zh)
WO (1) WO2014163458A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108616758A (zh) * 2016-12-15 2018-10-02 北京三星通信技术研究有限公司 多视点视频编码、解码方法及编码器、解码器
CN109005412A (zh) * 2017-06-06 2018-12-14 北京三星通信技术研究有限公司 运动矢量获取的方法及设备
CN111095926A (zh) * 2017-09-12 2020-05-01 三星电子株式会社 用于对运动信息进行编码和解码的方法以及用于对运动信息进行编码和解码的装置
CN112997489A (zh) * 2018-11-06 2021-06-18 北京字节跳动网络技术有限公司 具有几何分割的帧间预测的边信息信令
CN113382234A (zh) * 2018-11-08 2021-09-10 Oppo广东移动通信有限公司 视频信号编码/解码方法以及用于所述方法的设备
US11956431B2 (en) 2018-12-30 2024-04-09 Beijing Bytedance Network Technology Co., Ltd Conditional application of inter prediction with geometric partitioning in video processing

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11438609B2 (en) * 2013-04-08 2022-09-06 Qualcomm Incorporated Inter-layer picture signaling and related processes
KR102149827B1 (ko) * 2015-01-21 2020-08-31 삼성전자주식회사 인터 레이어 비디오 복호화 방법 및 그 장치 및 인터 레이어 비디오 부호화 방법 및 그 장치
CN106254878B (zh) 2015-06-14 2020-06-12 同济大学 一种图像编码及解码方法、图像处理设备
US9883137B2 (en) 2015-11-03 2018-01-30 Qualcomm Incorporated Updating regions for display based on video decoding mode
WO2020004879A1 (ko) * 2018-06-25 2020-01-02 엘지전자 주식회사 영상 코딩 시스템에서 복수의 주변 블록들을 사용하는 인터 예측에 따른 영상 디코딩 방법 및 장치
WO2020048205A1 (zh) 2018-09-04 2020-03-12 华为技术有限公司 应用于双向帧间预测中的参考帧获取方法及装置
KR20200032657A (ko) * 2018-09-18 2020-03-26 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2020094038A1 (en) 2018-11-07 2020-05-14 Mediatek Inc. Method and apparatus of encoding or decoding video blocks by current picture referencing coding

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101198064A (zh) * 2007-12-10 2008-06-11 武汉大学 一种分辨率分层技术中的运动矢量预测方法
CN101473655A (zh) * 2006-06-19 2009-07-01 Lg电子株式会社 用于处理视频信号的方法和装置
CN101867813A (zh) * 2010-04-23 2010-10-20 南京邮电大学 面向交互式应用的多视点视频编码方法
WO2012005549A2 (en) * 2010-07-09 2012-01-12 Samsung Electronics Co., Ltd. Methods and apparatuses for encoding and decoding motion vector
US20120008690A1 (en) * 2010-07-09 2012-01-12 Samsung Electronics Co., Ltd. Methods and apparatuses for encoding and decoding motion vector
WO2012096173A1 (ja) * 2011-01-12 2012-07-19 パナソニック株式会社 動画像符号化方法および動画像復号化方法
WO2012108700A2 (ko) * 2011-02-09 2012-08-16 엘지전자 주식회사 영상 부호화 및 복호화 방법과 이를 이용한 장치
KR20120107386A (ko) * 2011-03-21 2012-10-02 한국전자통신연구원 스케일러블 영상 부호화 공간 계층간 예측 움직임 벡터를 이용한 고속 모드 결정 방법
WO2012164924A1 (ja) * 2011-05-31 2012-12-06 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム
CN102946536A (zh) * 2012-10-09 2013-02-27 华为技术有限公司 候选矢量列表构建的方法及装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7460468B2 (en) * 2004-04-22 2008-12-02 At&T Intellectual Property I, L.P. Method and system for automatically tracking the rerouting of logical circuit data in a data network
ES2416314T3 (es) * 2004-08-27 2013-07-31 Chevron Phillips Chemical Company Lp Procesos de producción de poliolefinas
KR101370899B1 (ko) * 2006-10-24 2014-03-10 엘지전자 주식회사 비디오 신호 디코딩 방법 및 장치
KR20110007928A (ko) * 2009-07-17 2011-01-25 삼성전자주식회사 다시점 영상 부호화 및 복호화 방법과 장치
US20140016117A1 (en) * 2009-09-23 2014-01-16 Syracuse University Noninvasive, continuous in vitro simultaneous measurement of turbidity and concentration
JP5252029B2 (ja) * 2011-05-31 2013-07-31 株式会社Jvcケンウッド 動画像復号装置、動画像復号方法、動画像復号プログラム、受信装置、受信方法、及び受信プログラム
CN107105228B (zh) * 2011-06-30 2020-03-20 Jvc建伍株式会社 图像编码装置、图像编码方法、图像解码装置及图像解码方法
KR20130037161A (ko) * 2011-10-05 2013-04-15 한국전자통신연구원 스케일러블 비디오 코딩을 위한 향상된 계층간 움직임 정보 예측 방법 및 그 장치
KR101960761B1 (ko) * 2011-11-24 2019-03-22 에스케이텔레콤 주식회사 모션 벡터의 예측 부호화/복호화 방법 및 장치
DE102012219855A1 (de) * 2012-03-02 2013-09-05 Robert Bosch Gmbh Verfahren zur Herstellung von zumindest einem Schneidstrangsegment eines Schneidstrangs
WO2013176485A1 (ko) * 2012-05-22 2013-11-28 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
US20140098880A1 (en) * 2012-10-05 2014-04-10 Qualcomm Incorporated Prediction mode information upsampling for scalable video coding
US9648319B2 (en) * 2012-12-12 2017-05-09 Qualcomm Incorporated Device and method for scalable coding of video information based on high efficiency video coding
KR20160015843A (ko) * 2014-07-31 2016-02-15 삼성전자주식회사 디스플레이 장치 및 그 디스플레이 장치를 제어하는 방법

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101473655A (zh) * 2006-06-19 2009-07-01 Lg电子株式会社 用于处理视频信号的方法和装置
CN101198064A (zh) * 2007-12-10 2008-06-11 武汉大学 一种分辨率分层技术中的运动矢量预测方法
CN101867813A (zh) * 2010-04-23 2010-10-20 南京邮电大学 面向交互式应用的多视点视频编码方法
WO2012005549A2 (en) * 2010-07-09 2012-01-12 Samsung Electronics Co., Ltd. Methods and apparatuses for encoding and decoding motion vector
US20120008690A1 (en) * 2010-07-09 2012-01-12 Samsung Electronics Co., Ltd. Methods and apparatuses for encoding and decoding motion vector
WO2012096173A1 (ja) * 2011-01-12 2012-07-19 パナソニック株式会社 動画像符号化方法および動画像復号化方法
WO2012108700A2 (ko) * 2011-02-09 2012-08-16 엘지전자 주식회사 영상 부호화 및 복호화 방법과 이를 이용한 장치
KR20120107386A (ko) * 2011-03-21 2012-10-02 한국전자통신연구원 스케일러블 영상 부호화 공간 계층간 예측 움직임 벡터를 이용한 고속 모드 결정 방법
WO2012164924A1 (ja) * 2011-05-31 2012-12-06 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム
CN102946536A (zh) * 2012-10-09 2013-02-27 华为技术有限公司 候选矢量列表构建的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JUNGHAK NAM ET AL.: "Advanced motion and disparity prediction for 3D video coding", 《MOTION PICTURE EXPERT GROUP OR ISO/IEC JTC1/SC29/WG11》 *
LI ZHANG EA TL: "3D-CE5.h: Merge candidates derivation from disparity vector", 《JOINT COLLABORATIVE TEAM ON 3D VIDEO CODING EXTENSION DEVELOPMENT》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108616758A (zh) * 2016-12-15 2018-10-02 北京三星通信技术研究有限公司 多视点视频编码、解码方法及编码器、解码器
CN108616758B (zh) * 2016-12-15 2023-09-29 北京三星通信技术研究有限公司 多视点视频编码、解码方法及编码器、解码器
CN109005412A (zh) * 2017-06-06 2018-12-14 北京三星通信技术研究有限公司 运动矢量获取的方法及设备
CN109005412B (zh) * 2017-06-06 2022-06-07 北京三星通信技术研究有限公司 运动矢量获取的方法及设备
CN111095926A (zh) * 2017-09-12 2020-05-01 三星电子株式会社 用于对运动信息进行编码和解码的方法以及用于对运动信息进行编码和解码的装置
CN112997489A (zh) * 2018-11-06 2021-06-18 北京字节跳动网络技术有限公司 具有几何分割的帧间预测的边信息信令
CN112997489B (zh) * 2018-11-06 2024-02-06 北京字节跳动网络技术有限公司 具有几何分割的帧间预测的边信息信令
CN113382234A (zh) * 2018-11-08 2021-09-10 Oppo广东移动通信有限公司 视频信号编码/解码方法以及用于所述方法的设备
US11956431B2 (en) 2018-12-30 2024-04-09 Beijing Bytedance Network Technology Co., Ltd Conditional application of inter prediction with geometric partitioning in video processing

Also Published As

Publication number Publication date
US20160073115A1 (en) 2016-03-10
EP2981090A4 (en) 2016-11-02
KR20140122195A (ko) 2014-10-17
WO2014163458A1 (ko) 2014-10-09
EP2981090A1 (en) 2016-02-03

Similar Documents

Publication Publication Date Title
CN105532001B (zh) 用于使用基于深度的视差矢量对视频进行层间编码方法以及解码方法和设备
CN105264894A (zh) 针对层间解码和编码方法以及设备的确定帧间预测候选的方法
CN105308966B (zh) 视频编码方法及其设备以及视频解码方法及其设备
CN106063271B (zh) 用于执行基于子块的预测的层间视频解码方法及其设备以及用于执行基于子块的预测的层间视频编码方法及其设备
CN104813665A (zh) 用于对层间预测误差进行编码的sao补偿的方法和设备
CN104488272A (zh) 用于预测用于对视频进行编码或用于对视频进行解码的运动矢量的方法和设备
CN104620578A (zh) 用于随机访问的多层视频编码的方法和设备以及用于随机访问的多层视频解码的方法和设备
CN104396252A (zh) 使用用于多视点视频预测的参考画面集的多视点视频编码方法及其装置、使用用于多视点视频预测的参考画面集的多视点视频解码方法及其装置
CN105340271A (zh) 用于随机访问的多层视频编码方法及其装置以及用于随机访问的多层视频解码方法及其装置
CN104754356A (zh) 用于在视频编码或解码中的运动矢量确定的方法和设备
CN104365104A (zh) 用于基于树结构编码单元进行多视点视频编码的方法和设备以及用于基于树结构编码单元进行多视点视频解码的方法和设备
CN105532004B (zh) 层间视频解码方法及设备
CN105103552A (zh) 用于补偿亮度差的对层间视频进行编码的方法及其装置以及用于对视频进行解码的方法及其装置
CN107409214A (zh) 用于对层间视频进行解码的方法和设备以及用于对层间视频进行编码的方法和设备
CN105191313A (zh) 使用考虑相移的上采样的可伸缩视频编码方法和设备以及可伸缩视频解码方法和设备
CN105556970A (zh) 使用修正矢量推导的视频编码方法及其设备、视频解码方法及其设备
CN105325002A (zh) 使用视点合成预测的多视点视频编码方法及其设备以及多视点视频解码方法及其设备
CN105144713A (zh) 用于解码器设置的对视频进行编码的方法及其装置以及基于解码器设置对视频进行解码的方法及其装置
CN106464889A (zh) 执行基于子块的预测的层间视频解码方法和层间视频编码方法及其设备
CN105340275A (zh) 使用视点合成预测的多视点视频编码方法及其设备以及多视点视频解码方法及其设备
CN106031175B (zh) 使用亮度补偿的层间视频编码方法及其装置、以及视频解码方法及其装置
CN105556972A (zh) 用于层间视频解码和编码设备和方法的对深度图像的场景内预测方法
CN105165011A (zh) 用于考虑存储器带宽和计算量的可伸缩视频编码的装置和方法以及用于可伸缩视频解码的装置和方法
CN104396251A (zh) 使用用于多视点视频预测的参考列表对多视点视频进行编码的方法及其装置以及使用用于多视点视频预测的参考列表对多视点视频进行解码的方法及其装置
CN105340274A (zh) 深度图编码方法及其设备以及深度图解码方法及其设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20190809

AD01 Patent right deemed abandoned