CN104396252B - 使用用于多视点视频预测的参考画面集的多视点视频编解码方法及其装置 - Google Patents
使用用于多视点视频预测的参考画面集的多视点视频编解码方法及其装置 Download PDFInfo
- Publication number
- CN104396252B CN104396252B CN201380033884.4A CN201380033884A CN104396252B CN 104396252 B CN104396252 B CN 104396252B CN 201380033884 A CN201380033884 A CN 201380033884A CN 104396252 B CN104396252 B CN 104396252B
- Authority
- CN
- China
- Prior art keywords
- picture
- current
- reproduction order
- vid
- collection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 230000007774 longterm Effects 0.000 claims abstract description 34
- 230000033001 locomotion Effects 0.000 claims description 74
- 230000008859 change Effects 0.000 claims description 34
- 239000013598 vector Substances 0.000 claims description 34
- 241000208340 Araliaceae Species 0.000 claims description 19
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 19
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 19
- 235000008434 ginseng Nutrition 0.000 claims description 19
- 239000012141 concentrate Substances 0.000 claims description 6
- 238000010276 construction Methods 0.000 description 47
- 238000010586 diagram Methods 0.000 description 40
- 238000006243 chemical reaction Methods 0.000 description 37
- 210000004027 cell Anatomy 0.000 description 34
- 238000004891 communication Methods 0.000 description 19
- 230000000007 visual effect Effects 0.000 description 18
- 230000004048 modification Effects 0.000 description 16
- 238000012986 modification Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 16
- 238000013139 quantization Methods 0.000 description 16
- 230000009466 transformation Effects 0.000 description 12
- 238000000605 extraction Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 8
- 238000013500 data storage Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 210000000352 storage cell Anatomy 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013316 zoning Methods 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/58—Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Abstract
提供了一种通过根据视点对多视点视频的每个画面执行帧间预测和视点间预测来对多视点视频编码和解码的方法。一种对多视点视频进行编码的预测编码方法,包括:在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个短期重建画面的参考画面集以及包括至少一个长期重建画面的参考画面集,在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个短期重建画面的参考画面集;在第一参考列表与第二参考列表之间确定至少一个参考列表,其中,第一参考列表包括在确定的多个参考画面集之中的具有早于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有小于当前画面的视点标识符VID的VID的至少一个重建画面,第二参考列表包括具有与当前画面的再现顺序相同的再现顺序并具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有大于当前画面的VID的VID的至少一个重建画面;通过使用确定的至少一个参考列表确定用于当前画面的当前块的至少一个参考画面和参考块;通过使用参考块执行从用于当前块的帧间预测和视点间预测中选择的至少一个操作。
Description
技术领域
本发明涉及多视点视频编码和解码。
背景技术
随着用于再现和存储高分辨率或高质量视频内容的硬件的开发和提供,对于用于有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。根据传统的视频编解码器,根据基于具有预定尺寸的宏块的受限的编码方法来对视频进行编码。
空间域的图像数据经由频率变换被变换为频率域的系数。根据视频编解码器,将图像划分为具有预定尺寸的块,对每个各块执行离散余弦变换 (DCT),并在块单元中对频率系数进行编码,以进行频率变换的快速计算。与空间域的图像数据相比,频率域的系数容易被压缩。具体地,由于根据经由视频编解码器的帧间预测或帧内预测的预测误差来表示空间域的图像像素值,因此当对预测误差执行频率变换时,大量数据可被变换为0。根据视频编解码器,可通过使用少量数据来代替连续并重复产生的数据,来减少数据量。
尽管存在对多视点捕获的视频的增长的需求,但是随着视点的数量而同样增加的视频数据的量会造成问题。因此,对有效地对多视点视频进行编码的努力在继续。
发明内容
技术问题
本发明提供了一种通过根据视点对多视点视频的每个图像执行帧间预测和视点间预测来对多视点视频进行编码和解码的方法。
技术方案
根据本发明的一方面,提供了一种对多视点视频进行编码的预测编码方法,包括:在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个短期重建画面的参考画面集以及包括至少一个长期重建画面的参考画面集,在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个短期重建画面的参考画面集;在第一参考列表与第二参考列表之间确定至少一个参考列表,其中,第一参考列表包括确定的多个参考画面集之中的具有早于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有小于当前画面的视点标识符 (VID)的VID的至少一个重建画面,第二参考列表包括具有与当前画面的视点相同的视点并具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并且具有大于当前画面的 VID的VID的至少一个重建画面;通过使用确定的至少一个参考列表确定用于当前画面的当前块的至少一个参考画面和参考块;通过使用参考块执行从用于当前块的帧间预测和视点间预测中选择的至少一种预测。
有益效果
根据本发明的用于多视点视频的预测编码设备和预测解码设备可建立用于多视点视频的帧间预测和视点间预测的参考画面列表。一个参考画面列表可包括用于帧间预测的参考图像和用于视点间预测的参考图像两者。
可通过序列参数集和条带头来发送和接收关于明确反映解码画面集的状态的参考画面集的信息。可根据参考画面集来确定参考列表,从而可在考虑当前解码画面集的状态确定的参考列表中确定参考图像,并且参考图像可用于帧间预测/运动补偿和视点间预测/视差补偿。
附图说明
图1a是根据实施例的多视点视频预测编码设备的框图;
图1b是根据实施例的多视点视频预测编码方法的流程图;
图2a是根据实施例的多视点视频预测解码设备的框图;
图2b是根据实施例的多视点视频预测解码方法的流程图;
图3示出根据实施例的用于当前画面的帧间预测和视点间预测的参考对象;
图4示出根据实施例的基于图3的参考对象配置的参考列表;
图5a和图5b是用于解释根据实施例的改变L0列表的处理的示图;
图6a示出根据实施例的序列画面参数集的语法;
图6b示出根据实施例的画面参数集的语法;
图7示出根据实施例的条带头的语法;
图8a示出根据实施例的用于视点间预测的参考画面集的参数集;
图8b示出根据实施例的用于改变参考列表的参数的语法;
图9示出根据实施例的组合的参考列表;
图10和图11是用于解释根据实施例的用于改变组合的参考列表的处理的示图;
图12是根据实施例的包括多视点视频预测编码设备的多视点视频编码设备的框图;
图13是根据实施例的包括多视点视频预测解码设备的多视点视频解码设备的框图;
图14是根据本发明的实施例的基于根据树结构的编码单元的视频编码设备的框图;
图15是根据本发明的实施例的基于根据树结构的编码单元的视频解码设备的框图;
图16是用于描述根据本发明的实施例的编码单元的概念的示图;
图17是根据本发明的实施例的基于编码单元的图像编码器的框图;
图18是根据本发明的实施例的基于编码单元的图像解码器的框图;
图19是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图;
图20是用于描述根据本发明的实施例的编码单元与变换单元之间的关系的示图;
图21是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图;
图22是根据本发明的实施例的根据深度的较深层编码单元的示图;
图23至图25是用于描述根据本发明的实施例的编码单元、预测单元和变换单元之间的关系的示图;
图26是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图;
图27是根据本发明的实施例的存储程序的盘的物理结构的示图;
图28是通过使用盘来记录和读取程序的盘驱动器的示图;
图29是提供内容分配服务的内容供应系统的整体结构的示图;
图30和图31是根据本发明的实施例的应用了视频编码方法和视频解码方法的移动电话的内部结构和外部结构各自的示图;
图32是根据本发明的实施例的采用通信系统的数字广播系统的示图;
图33是示出根据本发明的实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。
最佳实施方式
根据本发明的一方面,提供了一种对多视点视频进行编码的预测编码方法,包括:在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个短期重建画面的参考画面集以及包括至少一个长期重建画面的参考画面集,在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个短期重建画面的参考画面集;在第一参考列表与第二参考列表之间确定至少一个参考列表,其中,第一参考列表包括确定的多个参考画面集之中的具有早于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有小于当前画面的视点标识符 (VID)的VID的至少一个重建画面,第二参考列表包括具有与当前画面的视点相同的视点并具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有大于当前画面的 VID的VID的至少一个重建画面;通过使用确定的至少一个参考列表确定用于当前画面的当前块的至少一个参考画面和参考块;通过使用参考块执行从用于当前块的帧间预测和视点间预测中选择的至少一种预测。
确定参考画面集的步骤可包括:在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个非参考重建画面的参考画面集;在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个非参考重建画面的参考画面集。
根据本发明的另一方面,提供了一种对多视点视频进行解码的预测解码方法,所述预测解码方法包括:在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个短期重建画面的参考画面集以及包括至少一个长期重建画面的参考画面集,在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个短期重建画面的参考画面集;在第一参考列表与第二参考列表之间确定至少一个参考列表,其中,第一参考列表包括确定的多个参考画面集之中的具有早于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有小于当前画面的VID的VID的至少一个重建画面,第二参考列表包括具有与当前画面的视点相同的视点并具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有大于当前画面的VID的VID的至少一个重建画面;通过使用确定的至少一个参考列表确定用于当前画面的当前块的至少一个参考画面和参考块;通过使用参考块执行从用于当前块的运动补偿和视差补偿中选择的至少一种补偿。
确定参考画面集的步骤可包括:在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个非参考重建画面的参考画面集;在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个非参考重建画面的参考画面集。
根据本发明的另一方面,提供了一种对多视点视频进行编码的预测编码设备,所述预测编码设备包括:参考画面集确定器,用于在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个短期重建画面的参考画面集以及包括至少一个长期重建画面的参考画面集,在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个短期重建画面的参考画面集;参考列表确定器,用于在第一参考列表与第二参考列表之间确定至少一个参考列表,其中,第一参考列表包括确定的多个参考画面集之中的具有早于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有小于当前画面的VID的VID的至少一个重建画面,第二参考列表包括具有与当前画面的视点相同的视点并具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有大于当前画面的VID的VID的至少一个重建画面;预测器,用于通过使用确定的至少一个参考列表确定用于当前画面的当前块的至少一个参考画面和参考块,并且通过使用参考块执行从用于当前块的帧间预测和视点间预测中选择的至少一种预测。
根据本发明的另一方面,提供了一种对多视点视频进行解码的预测解码设备,所述预测解码设备包括:参考画面集确定器,用于在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个短期重建画面的参考画面集以及包括至少一个长期重建画面的参考画面集,在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个短期重建画面的参考画面集;参考列表确定器,用于在第一参考列表与第二参考列表之间确定至少一个参考列表,其中,第一参考列表包括确定的多个参考画面集之中的具有早于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有小于当前画面的VID的VID的至少一个重建画面,第二参考列表包括具有与当前画面的视点相同的视点并具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有大于当前画面的VID的VID的至少一个重建画面;补偿器,用于通过使用确定的至少一个参考列表确定用于当前画面的当前块的至少一个参考画面和参考块,并且通过使用参考块执行从用于当前块的运动补偿和视差补偿中选择的至少一种补偿。
根据实施例的另一方面,提供了一种计算机可读记录介质,在所述计算机可读记录介质上记录用于执行预测编码方法的程序。根据本发明的另一方面,提供了一种计算机可读记录介质,在所述计算机可读记录介质上记录用于执行预测解码方法的程序。
具体实施方式
以下,将参照图1A至图11描述根据实施例的多视点视频预测编码设备、多视点视频预测编码方法、多视点视频预测解码设备和多视点视频预测解码方法。还将参照图12和图13描述包括多视点视频预测编码设备的多视点视频编码设备和包括多视点视频预测解码设备的多视点视频解码设备。还将参照图14至图26描述基于具有树结构的编码单元的多视点视频编码设备、多视点视频解码设备、多视点视频编码方法和多视点视频解码方法。最后,将参照图27至图33描述根据实施例的多视点视频编码方法、多视点视频解码方法、视频编码方法和视频解码方法可应用到的各种实施例。以下,“图像”可以指视频的静止图像或运动图像,或者可以指的是视频本身。
将参照图1A至图11描述根据实施例的多视点视频预测编码设备、多视点视频预测编码方法、多视点视频预测解码设备和多视点视频预测解码方法。
图1A是根据实施例的多视点视频预测编码设备10的框图.
根据实施例的多视点视频预测编码设备10包括参考画面集确定器12、参考列表确定器14和预测器16。
根据实施例的多视点视频预测编码设备10对基本视点图像和附加视点图像进行编码。例如,中心视点图像、左视点图像和右视点图像被编码,其中,中心视点图像可被编码为基本视点图像,左视点图像可被编码为第一附加视点图像,右视点图像可被编码为第二附加视点图像。根据视点,通过对图像进行编码而产生的数据可作为单独的比特流被输出。
当附加视点的数量为至少三个时,基本视点图像、第一附加视点的第一附加视点图像、第二附加视点的第二附加视点图像、…….、第K附加视点的第K附加视点图像可被编码。因此,基本视点图像的编码结果可作为基本视点比特流输出,第一附加视点图像、第二附加视点图像、……、和第K附加视点图像的编码结果可分别作为第一附加视点比特流、第二附加视点比特流、……、和第K附加视点比特流输出。
例如,多视点视频预测编码设备10可对基本视点图像进行编码以输出包括编码符号和样点(sample)的基本层流。多视点视频预测编码设备10还可通过参照通过对基本视点图像进行编码而产生的编码符号和样点,对附加视点图像进行编码以输出附加层比特流。
根据实施例的多视点视频预测编码设备10根据视频的每个图像的块来执行编码。块可具有正方形形状、矩形形状或任何几何形状,并且不限于具有预定尺寸的数据单元。根据实施例的块可以是根据树结构的编码单元之中的最大编码单元、编码单元、预测单元或变换单元。稍后将参照图14至图 26来描述基于根据树结构的编码单元的视频编码和解码方法。
根据实施例的多视点视频预测编码设备10可执行交叉参考相同视点图像的帧间预测。通过执行帧间预测,可产生指示用于当前画面的参考画面的参考索引、指示当前画面和参考画面之间的运动信息的运动矢量以及作为当前画面和参考画面之间差分量的残差数据。
另外,根据实施例的多视点视频预测编码设备10可执行通过参照不同的视点图像预测当前视点图像的多视点预测。通过执行视点间预测,可产生指示当前视点的当前画面的参考画面的参考索引、当前画面和不同视点的参考画面之间的视差以及作为当前画面和不同视点参考画面之间的差分量的残差数据。
根据实施例的多视点视频预测编码设备10可对当前视点的图像执行从相同视点图像之间的帧间预测以及不同视点图像之间的视点间预测中选择的一个操作。可基于编码单元、预测单元或变换单元的数据单元来执行帧间预测和视点间预测。
下文中,为了便于说明,将针对对于一个视点的图像的预测来描述根据实施例的多视点视频预测编码设备10的操作。然而,多视点视频预测编码设备10的操作不仅可对一个视点的图像执行,还可应用到不同视点图像。
对于其它相同视点图像的预测可被参考的重建画面可根据视点被存储在解码画面缓冲器(DPB)中。然而,存储在DPB中的用于当前画面的重建画面可被部分或全部用于确定用于当前画面的帧间预测和/或视点间预测的参考列表。
根据实施例的多视点视频预测编码设备10可参考相同视点图像之中的先于当前画面被重建的图像,以对当前图像执行帧间预测。指示再现顺序的号码(即,画面顺序计数(POC))可分配给每个图像。尽管低于当前图像的POC 的POC分配给一个图像,但是如果该图像先于当前画面被重建,则可通过参照该重建的画面来对当前画面执行帧间预测。
根据实施例的多视点视频预测编码设备10可通过执行帧间预测产生指示与不同图像相应的块之间的位置差的运动矢量。
根据实施例的多视点视频预测编码设备10可参考相同再现顺序的不同视点图像之中的先于当前画面被重建的图像,以便对当前图像执行视点间预测。用于交叉识别的视点识别符(VID)可分配给每个视点。例如,向左离当前视点越远,则VID越小,而向右离当前视点越远,则VID越大。可通过参照具有与当前视点的当前画面的再现顺序相同的再现顺序的不同视点图像之中的先前重建画面,对当前画面执行视点间预测。
根据实施例的多视点视频预测编码设备10通过视点间预测来产生多个视点图像之间的视差信息。根据实施例的多视点视频预测编码设备10可产生深度图,深度图指示作为与相同场景(即相同再现顺序)相应的不同视点图像的视差信息的视点间视差矢量或视点间深度。
图1B是根据实施例的多视点视频预测编码方法的流程图。参照图1B,下面现在将描述根据实施例的多视点视频预测编码设备10的元件的操作。
在操作11,根据实施例的参考画面集确定器12可确定参考画面集,其中,参考画面集是存储在DPB中先于当前画面被重建的多个重建画面之中的当前画面可参考的重建画面的集合,重建画面的集合可以是候选图像。
根据实施例的参考画面集可根据存储在DPB中的重建画面的状态包括三个子集,这三个子集包括作为用于帧间预测的参考对象的相同视点的重建画面。第一子集可以是包括至少一个重建画面的短期参考画面集,其中,所述至少一个重建画面可以是存储在DPB中的相同视点重建画面之中的短期参考画面。第二子集可以是包括至少一个相同视点重建画面的长期参考画面集,其中,所述至少一个相同视点重建画面可以是长期参考画面集。第三子集可以是包括没有被用作参考画面的相同视点重建画面的未使用参考画面集。
根据实施例的用于帧间预测的短期参考画面集可包括具有早于当前画面的再现顺序的再现顺序的在前重建画面以及具有晚于当前画面的再现顺序的再现顺序的在后重建画面。因此,短期参考画面集可被分为包括可被参考的在前重建画面的子集、包括可不被参考的在前重建画面的子集、包括可被参考的在后重建画面的子集以及包括可不被参考的在后重建画面的子集。
用于当前图像的帧间预测参考画面需要是先于当前图像被解码的图像。根据实施例的用于帧间预测的参考画面可被分类为短期参考画面和长期参考画面。DPB存储通过对先前图像执行运动补偿而产生的重建画面。先前产生的重建画面可被用作用于不同图像的帧间预测的参考画面。因此,在存储在 DPB中的重建图像之中可选择用于当前图像的帧间预测的至少一个短期参考画面或至少一个长期参考画面。短期参考画面可以是根据短期参考画面和当前画面的解码顺序正好在之前或最近解码的图像,而长期参考画面可以是在当前画面很久以前被解码并且在被选择作为用于其他图像的帧间预测的参考画面之后被存储在DPB中的图像。
在存储在DPB中的重建画面之中,短期参考画面和长期参考画面可在被彼此分类之后被选择。长期参考画面是可对于多个图像的帧间预测而被参考并且因此可被长期存储在DPB中的图像。
通过对当前画面和下一图像执行帧间预测对于每个图像所必需的短期参考画面可被更新,因此短期参考画面可在DPB中被更新。因此,当新的短期参考画面被存储在DPB中时,可从最长期存储的图像中顺序地删除先前存储的短期参考画面。
作为根据实施例的指示长期参考画面的长期参考索引,长期参考画面的画面顺序计数(POC)信息的最低有效位(LSB)信息可被确定。根据实施例,长期参考画面的POC信息可被分成最高有效位(MSB)信息和LSB信息。仅LSB 信息可被用作指示长期参考画面的长期参考索引。
根据实施例的参考画面集可根据存储在DPB中的重建画面的状态包括短期参考画面集,该短期参考画面集包括作为用于视点间预测的参考对象的不同视点重建画面。根据实施例的用于不同视点间预测的短期参考画面集可包括在存储在DPB中的不同视点重建画面之中的分配有与当前画面的再现顺序相同的再现顺序的重建画面。
根据实施例的多视点视频预测编码设备10可对当前画面执行视点间预测和帧间预测。根据实施例的DPB可存储也具有与当前画面的再现顺序相同的再现顺序的不同视点重建画面。
因此,在存储在DPB中具有与当前画面的再现顺序相同的再现顺序并且具有与当前画面的视点不同的视点的重建画面之中,用于视点间预测的短期参考画面可包括具有小于当前画面的视点号码的视点号码的负(-)视点重建画面以及具有大于当前画面的VID的VID的正(+)视点重建画面。因此,短期参考画面集可被分为包括可被参考的负(-)视点重建画面的子集和包括可被参考的正(+)视点重建画面的子集。
根据实施例的参考画面集确定器12可在包括先于当前画面被重建的相同视点重建画面之中,确定包括具有与存储在DPB中的当前画面的再现顺序不同的再现顺序的至少一个短期重建画面的参考画面集以及包括至少一个长期重建画面的参考画面集。根据实施例的参考画面集确定器12可在先于当前画面被重建的不同视点重建画面之中,确定包括具有与存储在DPB中的当前画面的再现顺序相同的再现顺序的至少一个短期重建画面。
根据实施例的参考画面集确定器12可在根据实施例的先于当前画面被重建的相同视点重建画面之中,确定包括具有与存储在DPB中的当前画面的再现顺序不同的再现顺序的至少一个非参考重建画面的参考画面集。
根据实施例的参考画面集确定器12还可在先于当前画面被重建的不同视点重建画面之中,确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个不同视点非参考重建画面的参考画面集。
根据实施例的参考画面集确定器12可确定在当前条带中是否使用对于当前画面确定的参考画面集之一。
如果确定使用对于当前画面确定的参考画面集之一,则根据实施例的参考画面集确定器12可从参考画面集中选择索引。
如果确定不使用对于当前画面确定的参考画面集之一,则根据实施例的参考画面集确定器12可直接确定用于当前条带的参考画面集。
作为用于帧间预测的参考画面集,具有小于当前视点的VID的VID的画面的第一数量以及具有大于当前视点的VID的VID的画面的第二数量可被确定,具有小于当前视点的VID的VID的画面的VID之间的差值以及具有大于当前视点的VID的VID的画面的VID之间的差值可被确定。
在操作13,根据实施例的参考画面确定器14可确定记录可被用作参考画面的候选图像的参考列表,以便确定用于从当前画面的帧间预测和视点间预测中选择的至少一种预测的参考画面。用于当前画面的参考列表可记录关于在存储在DPB中的重建画面之中当前画面参考的参考画面的顺序的信息。
根据实施例的参考画面确定器14可根据画面模式来产生一个参考列表或两个参考列表。当当前画面是能够前向预测的P条带类型图像或能够双预测的B条带类型图像时,参考列表确定器14可产生L0列表作为第一参考列表。
在操作13,根据实施例的参考画面确定器14可在当前画面的相同视点图像之中确定L0列表,L0列表包括具有早于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并且 VID小于当前画面的VID的至少一个重建画面。
根据实施例的参考画面确定器14可通过使用参考画面集的重建画面以这样的顺序来产生L0列表:相同视点短期参考画面集之中的包括可被参考的在前重建画面的子集和包括可被参考的在后重建画面的子集、不同视点短期参考画面集之中的包括可被参考的负(-)视点重建画面的子集和包括正(+)视点重建画面的子集、长期参考画面集。
在操作13,当当前画面是B条带类型图像时,根据实施例的参考画面确定器14还可产生L1列表作为第二参考列表。根据实施例的参考画面确定器 14可确定L1列表,L1列表包括具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并且具有大于当前画面的VID的VID的至少一个重建画面。
根据实施例的参考画面确定器14可通过使用参考画面集的重建画面以这样的顺序来产生L0列表:相同视点短期参考画面集之中的包括可被参考的在后重建画面的子集和包括可被参考的在前重建画面的子集、不同视点短期参考画面集之中的包括可被参考的正(+)视点重建画面的子集和包括负(-)视点重建画面的子集、长期参考画面集。
然而,在相同视点的图像之中,L0列表可优选地包括具有早于当前画面的再现顺序的再现顺序的重建画面,而可不包括具有晚于当前画面的再现顺序的再现顺序的重建画面。同样,在具有相同再现顺序的不同视点图像之中, L0列表可优先地包括具有小于当前画面的VID的VID的重建画面并且可包括具有大于当前画面的VID的VID的重建画面。
类似地,在相同视点的图像之中,L1列表可优选地包括具有晚于当前画面的再现顺序的再现顺序的重建画面,而可不包括具有早于当前画面的再现顺序的再现顺序的重建画面。同样,在具有相同再现顺序的不同视点图像之中,L1列表可优先地包括具有大于当前画面的VID的VID的重建画面并且可包括具有小于当前画面的VID的VID的重建画面。
因此,根据实施例的参考画面确定器14可将从L0列表和L1列表中选择的至少一个列表确定为用于从当前画面的帧间预测和视点间预测中选择的一个的参考列表。
在操作15,根据实施例的预测器16可通过使用由参考列表确定器14确定的至少一个参考列表来确定用于当前画面的当前块的至少一个参考画面和参考块。在操作17,根据实施例的预测器16可通过使用在操作15中确定的参考块来执行从用于当前画面的帧间预测和视点间预测中选择的至少一种预测。
根据实施例的参考列表确定器14可确定在当前画面中是否选择性地修改确定的至少一个参考列表的参考索引的参考顺序。
当能够在当前画面中选择性地修改参考顺序时,参考列表确定器14可修改用于属于当前画面的当前条带的至少一个参考列表的参考索引的参考顺序。
根据实施例的参考列表确定器14可针对当前画面在第一参考列表之中确定具有早于当前画面的再现顺序的再现顺序的至少一个重建画面的第一基本数量以及具有小于当前画面的VID的VID的至少一个重建画面的第二基本数量。根据实施例的参考列表确定器14可针对当前画面在第二参考列表之中确定晚于当前画面的再现顺序的再现顺序的至少一个重建画面的第三基本数量以及具有大于当前画面的VID的VID的至少一个重建画面的第四基本数量。
根据实施例的参考列表确定器14可确定是否单独地替换从针对当前画面设置的第一参考列表的第一基本数量和第二基本数量以及第二参考画面的第三基本数量和第四基本数量中选择的一个。
当属于每个参考列表的重建画面的基本数量能够被单独替换时,根据实施例的参考列表确定器14可确定在当前条带中可独立应用的从第一参考列表的重建画面的数量和第二参考列表的重建画面的数量中选择的至少一个。
也就是说,当属于每个参考画面的重建画面的基本数量能够在当前条带中被独立地替换时,根据实施例的参考列表确定器14可将第一参考列表之中的与当前画面的视点相同并且具有早于当前画面的再现顺序的再现顺序的相同视点重建画面的数量替换为可独立应用于当前条带的第一有效数量(来代替通常应用于当前画面的第一基本数量)。
同样,根据实施例的参考列表确定器14可将第一参考列表之中的与当前画面的视点相同并且具有小于当前画面的VID的VID的至少一个相同视点重建画面的数量替换为可独立应用于当前条带的第二有效数量(来代替通常应用于当前画面的第二基本数量)。
同样,根据实施例的参考列表确定器14可将第二参考列表之中的与当前画面的视点相同并且具有晚于当前画面的再现顺序的再现顺序的至少一个相同视点重建画面的数量替换为可独立应用于当前条带的第三有效数量(来代替通常应用于当前画面的第三基本数量)。
同样,根据实施例的参考列表确定器14可将第二参考列表之中的与当前画面的视点相同并且具有大于当前画面的VID的VID的一个相同视点重建画面的数量替换为可独立应用于当前条带的第四有效数量(来代替通常应用于当前画面的第四基本数量)。
根据实施例的属于第一参考列表的参考索引的最大数量可以是第一参考列表之中的具有早于当前画面的再现顺序的再现顺序的至少一个重建画面的第一基本数量与具有小于当前画面的VID的VID的至少一个重建画面的第二基本数量之和。
根据实施例的属于第二参考列表的参考索引的最大数量可以是第二参考列表之中的跟随在当前画面之后的至少一个重建画面的第三基本数量与具有大于当前画面的VID的VID的至少一个重建画面的第四基本数量之和。
根据实施例的预测器16可通过基于从由参考列表确定器14确定的L0 列表和L1列表中选择的至少一个列表来根据参考顺序将当前画面与存储在 DPB中的重建画面进行比较,确定用于当前画面的预测的参考画面。参考列表确定器14可通过在参考画面内检测与当前块最类似的块来确定参考块。
根据实施例的预测器16可确定指示先前确定的参考画面的参考索引,并确定作为当前块与参考块之间的位置差的运动矢量或视差矢量。对于每个像素的当前块和参考块之间的差值可被确定为残差数据。
当根据实施例的预测器16执行帧间预测时,预测器16可在从第一参考列表中的具有早于当前画面的再现顺序的至少一个重建画面以及第二参考列表中的具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面中选择的至少一个重建画面中确定参考画面和参考块。通过对当前块执行帧间预测确定的参考块和当前块之间的第一残差数据、指示参考块的第一运动矢量和指示参考画面的第一参考索引可被产生作为帧间预测的结果数据。
当根据实施例的预测器16执行视点间预测时,预测器16可在从第一参考列表中的具有小于当前画面的VID的VID的至少一个重建画面和第二参考列表中的具有大于当前画面的VID的VID的至少一个重建画面中选择的至少一个重建画面中确定参考画面和参考块。通过对当前块执行视点间预测确定的参考块和当前块之间的第二残差数据、指示参考块的第二视差矢量和指示参考画面的第二参考索引可被产生作为视点间预测的结果数据。
根据实施例的多视点视频预测编码设备10可包括用于总体控制参考列表确定器14和预测器16的中央处理器(未显示)。可选择地,参考列表确定器 14和预测器16可通过它们的处理器(未显示)操作,这些处理器可相互有机地操作,使得多视点视频预测编码设备10进行一般操作。可选择地,参考列表确定器14和预测器16可被多视点视频预测编码设备10的外部处理器(未显示)控制。
根据实施例的多视点视频预测编码设备10可包括用于存储参考列表确定器14和预测器16的输入和输出数据的一个或更多个数据存储单元(未显示)。多视点视频预测编码设备10可包括用于控制将数据输入到数据存储单元/从数据存储单元输出数据的存储器控制器(未显示)。
现在将参照图2A和图2B描述用于重建根据以上参照图1A和图1B描述的实施例被预测编码的多视点视频比特流的多视点视频解码设备和多视点视频解码方法。
图2A是根据实施例的多视点视频预测解码设备20的框图,图2B是根据实施例的多视点视频预测解码方法的框图的流程图。
根据实施例的多视点视频预测解码设备20包括参考列表确定器24和比较器26。
根据实施例的多视点视频预测解码设备20可接收从每个视点的图像编码的比特流。可与记录有基本视点图像的编码数据的比特流分离地接收记录有附加视点图像的编码数据的比特流。
例如,多视点视频预测解码设备20可通过对基本层比特流解码来重建基本视点图像。多视点视频预测解码设备20也可选择性地对附加层比特流进行解码。可通过参照从基本层比特流重建的编码符号和样点对附加层比特流进行解码来重建附加视点图像。对附加层比特流进行选择性地解码,从而仅从多视点视频重建期望的视点视频。
例如,根据实施例的多视点视频预测解码设备20可对基本视点比特流进行解码来重建中心视点图像,对第一附加视点比特流进行解码来重建左视点图像,对第二附加视点比特流解码来重建右视点图像。
当附加视点的数量是至少三个时,可从第一附加视点比特流重建第一附加视点的第一附加视点图像,可从第二附加视点比特流重建第二附加视点的第二附加视点图像,并可从第K附加视点比特流重建第K附加视点的第K附加视点图像。
根据实施例的多视点视频预测解码设备20根据视频的每个对象的块执行解码。根据实施例的块可以是具有树结构的编码单元之中的最大编码单元、编码单元、预测单元或变换单元。
根据实施例的多视点视频预测解码设备20可接收经由帧间预测产生的运动矢量以及经由视点间预测产生的视差信息、连同包括根据视点的图像的编码数据的比特流。
根据实施例的多视点视频预测解码设备20可通过执行相互参考经由相同视点帧间预测而预测的图像的运动补偿来重建图像。运动补偿是将通过使用当前图像的运动矢量确定的参考画面与当前图像的残差数据合成并且重新配置当前图像的重建图像的操作。
根据实施例的多视点视频预测解码设备20可通过参考不同视点图像执行视差补偿,以便重建经由视点间预测而预测的附加视点图像。视差补偿是将通过使用当前图像的视差信息确定的不同视点参考图像与当前图像的残差数据合成并且重建当前图像的重建图像的操作。根据实施例的多视点视频预测解码设备20可执行视差补偿以重建通过参考不同视点图像预测的当前视点图像。
可基于编码单元或预测单元,通过帧间运动补偿和视点间视差补偿来执行重建。
根据实施例的补偿器26可经由参考从不同视点比特流重建的不同视点图像的视点间预测以及参考相同视点图像的帧间预测来重建当前识别图像,以便根据视点对比特流解码。
根据实施例的补偿器26可经由参考不同视点重建画面之中再现顺序与当前画面的再现顺序相同的重建画面的视点间视差补偿来重建当前视点图像。根据情况,可经由参考两个或更多个不同视点图像的视点间视差补偿来重建当前视点图像。参考列表确定器24可确定参考列表,从而补偿器26可确定用于当前画面的运动补偿或视差补偿的精确参考画面。
下文中,现在将参照图2B来描述确定用于帧间预测和视点间预测的参考列表并且通过使用参考列表最终执行从帧间预测和视点间预测中选择的至少一个的方法。
在操作21,根据实施例的参考画面集确定器22可确定参考画面集,其中,参考画面集是当前画面可参考的、先于存储在DPB中的当前画面被重建的重建画面之中的重建画面的集合,重建画面的集合可以是候选图像。
根据实施例的多视点视频预测编码设备10可对当前画面执行视点间预测和帧间预测。根据实施例的DPB可存储具有与当前画面的再现顺序相同的再现顺序的不同视点重建画面。
根据实施例的参考画面集可包括用于帧间预测的短期参考画面集。根据实施例的用于帧间预测的短期参考画面集可包括存储在DPB中的相同视点重建画面之中的分配有与当前画面的再现顺序不同的再现顺序的重建画面。
因此,用于帧间预测的短期参考画面集可包括具有与存储在DPB中的当前画面的视点相同的视点并且具有与当前画面的再现顺序不同的再现顺序的重建画面之中的这样的在前重建画面和在后重建画面,其中,所述在前重建画面具有早于当前画面的再现顺序的再现顺序,所述在后重建画面具有晚于当前画面的再现顺序的再现顺序。因此,短期参考画面集可分为包括可被参考的在前重建画面的子集、包括可不被参考的在前重建画面的子集、包括可被参考的在后重建画面的子集以及包括可不被参考的在后重建画面的子集。
根据实施例的参考画面集可包括用于视点间预测的短期参考画面集。根据实施例的用于视点间预测的短期参考画面集可包括存储在DPB中的不同视点重建画面之中的分配有与当前画面的再现顺序相同的再现顺序的重建画面。
因此,用于视点间预测的短期参考画面集可包括具有与存储在DPB中的当前画面的再现顺序相同的再现顺序的不同视点重建画面之中的这样的负(-) 视点重建画面和正(+)视点重建画面,其中,所述所述负(-)视点重建画面具有小于当前画面的VID的VID,所述正(+)视点重建画面具有大于当前画面的 VID的VID的正(+)视点重建画面。因此,短期参考画面集可被分为包括可被参考的负(-)视点重建画面的子集以及包括可被参考的正(+)视点重建画面的子集。
根据实施例的参考画面集确定器22可在先于存储在DPB中的当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个短期重建画面的参考画面集以及包括至少一个长期重建画面的参考画面集。根据实施例的参考画面集确定器22可在先于存储在DPB 中的当前画面重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个短期重建画面的参考画面集。
根据实施例的参考画面集确定器22可在根据实施例的先于当前画面重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个非参考重建画面的参考画面集。
根据实施例的参考画面集确定器22可还包括先于当前画面重建的不同视点重建画面之中的这样的参考画面集,其中,所述参考画面集包括具有与当前画面的再现顺序相同的再现顺序的至少一个非参考不同视点重建画面。
根据实施例的参考画面集确定器22可确定在当前条带中是否使用对于当前画面确定的参考画面集之一。
如果使用对于当前画面确定的参考画面集之一,则根据实施例的参考画面集确定器22可从参考画面集中选择索引。
如果不使用对于当前画面确定的参考画面集之一,则根据实施例的参考画面集确定器22可直接确定用于当前条带的参考画面集。
作为用于视点间预测的参考画面集,具有小于当前视点的VID的VID 的画面的第一数量以及具有大于当前视点的VID的VID的画面的第二数量可被确定,具有小于当前视点的VID的VID的画面的VID之间的差值以及具有大于当前视点的VID的VID的画面的VID之间的差值可被确定。
在操作S23,根据实施例的参考列表确定器24可确定用于前向预测和双预测的L0列表和用于双预测的L1列表。
根据实施例的参考列表确定器24可在当前画面的相同视点图像之中确定包括具有早于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并且具有小于当前画面的VID的 VID的至少一个重建画面的第一参考列表,即L0列表。
根据实施例的参考列表确定器24可确定包括具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并且具有大于当前画面的VID的VID的至少一个重建画面的第二参考列表,即L1列表。
然而,在相同视点图像之中,当L0列表优选地包括具有早于当前画面的再现顺序的再现顺序的重建画面并且有效参考索引有剩余时,L0列表可包括具有晚于当前画面的再现顺序的重建画面。同样,在具有相同再现顺序的不同视点图像之中,当L0列表优选地包括具有小于当前画面的VID的VID 的重建画面并且有效参考索引有剩余时,L0列表可包括具有大于当前画面的VID的VID的重建画面。
类似地,在相同视点图像之中,当L1列表优选地包括具有晚于当前画面的再现顺序的再现顺序的重建画面并且有效参考索引有剩余时,L1列表可包括具有早于当前画面的再现顺序的再现顺序的重建画面。同样,在具有相同再现顺序的不同视点图像之中,当L1列表优选地包括具有大于当前画面的 VID的VID的重建画面并且有效参考索引有剩余时,L1列表可包括具有小于当前画面的VID的VID的重建画面。
多视点视频预测设备20可将重建画面存储在DPB中。参考列表上记录有关于存储在DPB中的被参考用于当前画面的运动补偿或视差补偿的重建画面的顺序的信息。
在操作25,根据实施例的补偿器26可通过使用由参考列表确定器24确定的至少一个参考列表来确定用于当前画面的当前块的至少一个参考画面和参考块。
在操作27,根据实施例的补偿器26可针对当前比特流执行从参考具有相同再现顺序的不同视点重建画面的视差补偿和参考相同视点重建画面的运动补偿中选择的至少一种,以重建当前画面的当前块。
更详细地讲,根据实施例的多视点视频预测设备20可解析当前比特流以获得用于视点间预测的参考索引、视差信息和残差数据。根据实施例的补偿器26可通过使用参考索引来确定不同视点图像之中的参考画面,并且通过使用视差信息来确定参考画面的参考块。参考块被补偿残差数据,从而重建当前画面。
根据实施例的补偿器26可执行参考相同视点重建画面的运动补偿,以重建当前画面。
更加详细地讲,多视点视频预测设备20可解析比特流来获得用于当前画面的运动补偿的参考索引、运动矢量和残差数据。补偿器26可通过使用参考索引来确定相同视点重建画面之中的参考画面,通过使用运动矢量确定参考画面内的参考块,并且用残差数据补偿参考块,从而重建当前画面。
根据实施例的参考列表确定器24可确定是否在当前画面中选择性地修改至少一个参考列表的参考索引的参考顺序。基本上,由于参考列表的参考索引指示与参考索引相应的重建画面的参考顺序,因此如果参考索引被修改,则与参考索引相应的重建画面的参考顺序可被修改。
当根据实施例的在当前画面中选择性地修改参考列表的参考顺序时,根据实施例的参考列表确定器24可修改用于属于当前画面的当前条带的至少一个参考列表的参考索引的参考顺序。
根据实施例的参考列表确定器24也可针对当前画面确定第一参考列表之中的具有先于当前画面的再现顺序的再现顺序的至少一个重建画面的第一基本数量、第一参考列表之中的具有小于当前画面的VID的VID的至少一个重建画面的第二基本数量、第二参考列表之中的晚于当前画面的再现顺序的再现顺序的至少一个重建画面的第三基本数量、第二参考列表之中的具有大于当前画面的VID的VID的至少一个重建画面的第四基本数量。
根据实施例的参考列表确定器24可在当前条带中单独地替换针对当前画面设置的第一参考列表的第一基本数量和第二基本数量以及第二参考列表的第三基本数量和第四基本数量中选择的至少一个。
也就是,如果在当前条带中单独地替换属于每个参考列表的重建画面的基本数量,则根据实施例的参考列表确定器24可用仅应用于当前条带的第一有效数量替换第一参考列表之中的具有与当前画面的视点相同视点并且再现顺序在当前画面的再现顺序之前的重建画面的数量,来代替通常应用于当前画面的第一基本数量。
同样,根据实施例的参考列表确定器24可用仅应用于当前条带的第二有效数量替换第一参考列表之中的具有与当前画面的视点相同并且具有小于当前画面的VID的VID的至少一个重建画面的数量,来代替通常应用于当前画面的第二基本数量。
同样,根据实施例的参考列表确定器24可用仅应用于当前条带的第三有效数量替换第二参考列表之中的具有与当前画面的视点相同的视点并且具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面的数量,来代替通常应用于当前画面的第三基本数量。
同样,根据实施例的参考列表确定器24可用仅应用于当前条带的第四有效数量替换第二参考列表之中的具有与当前画面的视点相同的视点并且具有大于当前画面的VID的VID的至少一个重建画面的数量,来代替通常应用于当前画面的第四基本数量。
根据实施例的属于第一参考列表的参考索引的最大数量可以是第一参考列表之中的具有早于当前画面的再现顺序的再现顺序的至少一个重建画面的第一基本数量与第一参考列表之中的具有小于当前画面的VID的VID的至少一个重建画面的第二基本数量之和。
根据实施例的属于第二参考列表的参考索引的最大数量可以是第二参考列表之中的具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面的第三基本数量与第二参考列表之中的具有大于当前画面的VID的VID的至少一个重建画面的第四基本数量之和。
补偿器26可通过使用确定的参考列表执行从运动补偿和视差补偿中选择的至少一种操作。根据实施例的参考列表可在其上记录用于帧间预测的重建画面和用于视点间预测的重建画面的信息。因此,补偿器26可通过使用一个参考列表执行从运动补偿和视差补偿中选择的至少一种操作。
根据实施例的多视点视频预测解码设备20可接收用于当前画面的当前块的参考索引和残差数据,并且接收运动矢量或视差矢量。根据接收的参考画面索引指示的是参考列表之中的相同视点重建画面还是不同视点的相同 POC图像,可确定接收的矢量是运动矢量还是视差矢量。
因此,根据实施例的补偿器26可确定参考列表之中的由参考索引指示的参考画面,如果确定的参考画面是相同视点重建画面,则根据实施例的补偿器26可确定重建画面之中的由运动矢量指示的参考块,并且针对参考块补偿残差数据,从而重建当前块。
根据实施例的补偿器26可确定参考列表之中的由参考索引指示的参考画面,如果确定的参考画面是不同视点的重建画面,则根据实施例的补偿器 26可确定重建画面之中的由运动矢量指示的参考块,并且针对参考块补偿残差数据,从而重建当前块。
与如上所述的从当前视点比特流重建当前视点图像相同,可从第二视点比特流重建第二视点图像。
根据实施例的多视点视频预测解码设备20可包括用于总体控制参考列表确定器24和补偿器26的中央处理器(未显示)。可选择地,参考列表确定器 24和补偿器26可通过它们的处理器(未显示)操作,这些处理器可相互有机地操作,使得多视点视频预测解码设备20进行一般操作。可选择地,参考列表确定器24和补偿器26可被多视点视频预测解码设备20的外部处理器(未显示)控制。
根据实施例的多视点视频预测解码设备20可包括用于存储参考列表确定器24和补偿器26的输入和输出数据的一个或更多个数据存储单元(未显示)。多视点视频预测解码设备20可包括用于控制将数据输入到数据存储单元/从数据存储单元输出数据的存储器控制器(未显示)。
现在将参照图3、图4、图5A和图5B通过使用针对参考列表的用于帧间预测的三个重建块和用于视点间预测的三个重建块的示例来详细地描述本发明的操作。
图3示出根据实施例的用于当前画面31的帧间预测和视点间预测的参考对象。
例如,四个视点的图像30被编码,并且用于具有视点号VID 5、再现顺序号POC 18的当前画面31的帧间预测的参考列表被确定。假设当前画面31 可参考具有VID 5的图像之中的先于当前画面31被重建的三个图像32、33 和34来进行帧间预测。还假设当前画面31可参考具有POC 18的不同视点图像之中的先于当前画面31被重建的三个图像35、36和37来进行视点间预测。
图4示出根据实施例的基于图3的参考对象配置的参考列表。
图3之后,可由当前画面31参考的用于预测的重建画面32、33、34、 35、36和37可被存储在用于当前画面31的DPB 40中。
在根据实施例的基本L0列表41中,优选参考顺序可被分配给用于帧间预测之中的前向预测的重建画面,优先的参考顺序可被分配给更接近当前画面31的重建画面。优先的参考顺序可被分配给用于帧间预测的重建画面而非用于视点间预测的重建画面。优先的参考顺序可被分配给根据视点的用于视点间预测的重建画面之中的具有小于当前视点的VID的VID的重建画面而非具有大于当前视点的VID的VID的重建画面。
就像基本L0列表41,在根据实施例的基本L1列表45中,优先的参考顺序可被分配给较接近当前画面31的重建画面。优先的参考顺序可被分配给用于帧间预测的重建画面而非用于视点间预测的重建画面。然而,在基本L1 列表45中,优选参考顺序可被分配给用于帧间预测之中的后向预测的重建画面。优先的参考顺序可被分配给根据视点的用于视点间预测的重建画面之中的具有大于当前画面的VID的VID的重建画面,而非具有小于当前视点的 VID的重建画面。
为了描述方便,具有VID A和POC B的图像被命名为VID A/POC B图像。
因此,属于基本L0列表41的重建画面按照参考顺序可以是相同视点 VID 5/POC17画面32、VID 5/POC 16画面33、VID 5/POC 19画面34,、VID 3/POC 18画面35、VID 1/POC18画面36和VID 7/POC 18画面37。
属于基本L1列表45的重建画面按照参考顺序可以是VID 5/POC 19画面34、VID 5/POC 17画面32、VID 5/POC 16画面33、VID 7/POC 18画面 37、VID 3/POC 18画面35和VID1/POC 18画面36。
图5A和图5B是用于解释根据实施例的改变L0列表的处理的示图。
在根据实施例的参考索引表50中,参考索引Idx 51通常是指示在参考列表中的重建画面的基本顺序的号码。参考索引可基本上指示参考列表中的参考顺序。因此,在参考索引的顺序中,与参考索引相应的重建画面可被参考。
然而,可通过参考顺序的选择性修改来选择性地修改在当前条带中由参考索引指示的参考顺序。在当前图像中,根据实施例的参考索引表50的修改索引List_entry_l0 55可被定义为选择性地修改在基本L0列表41中设置的参考索引。
在这点上,基本L0列表41的Idx 0、1、2、3、4和5顺序地指示VID 5/POC 17画面32、VID 5/POC 16画面33、VID 5/POC 19画面34、VID 3/POC 18 画面35、VID 1/POC 18画面36和VID 7/POC 18画面37。
也就是,由于参考顺序根据修改的索引List_entry_l0 55被修改为Idx 0、 3、1、2、4和5,因此属于修改的L0列表59的重建画面按照参考顺序可被修改为VID 5/POC 17画面32、VID 3/POC 18画面35、VID 5/POC 16画面 33、VID 5/POC 19画面34、VID 1/POC 18画面36和VID 7/POC 18画面37。
因此,在基本L0列表41中,作为可被初始参考用于帧间预测的重建画面的VID 5/POC 17画面32的下一参考顺序可以是用于帧间预测的VID 5/POC 16画面33,在用于帧间预测的所有相同视点重建画面被参考之后,用于视点间预测的不同视点的重建画面可被参考。
然而,在根据实施例的修改的索引List_entry_l0 55的修改的L0列表59 中,可被初始参考用于帧间预测的跟随在相同的视点VID 5/POC 17画面32 之后的参考顺序可以是可被初始参考用于视点间预测的不同视点VID 5/POC 17画面32。
然而,尽管以上描述三个相同视点重建画面32、33和34以及三个不同视点重建画面35、36和37属于用于当前画面的预测编码的一个L0列表41 的示例中,根据实施例的属于参考列表的重建画面的数量不应限于此。
图6A示出根据实施例的序列参数集65的语法。
根据实施例的多视点视频预测编码设备10可产生包括关于通常应用于当前画面序列内的默认设置的信息的序列参数集65。具体的讲,关于用于视点间预测的参考列表,关于可被用于属于当前序列的每个画面的参考画面集可被包括在序列参数集65中。
根据实施例的序列参数集65包括参数“num_interview_ref_pic_sets”66,参数“num_interview_ref_pic_sets”66指示属于当前序列的每个画面可允许的参考画面集的数量。例如,如果“num_interview_ref_pic_sets”66被确定为从0 到64的数,则可针对每个画面设置与相应数一样多的参考画面的数量。
根据实施例的序列参数集65与作为用于定义每个参考画面集的详细参数的参考画面集的参数集的“interview_ref_pic_set(i)”67相关。将参照图8A 更加详细地描述参考画面集的“interview_ref_pic_set(i)”67的参数集。图8A 示出作为根据实施例的用于视点间预测的参考画面集的参数集的“interview_ref_pic_set(i)”67。
根据实施例的参考画面集“interview_ref_pic_set(i)”67的参数集可包括信息“num_negative_interview_pics”93和信息“num_positive_interview_pics”94,其中,信息“num_negative_interview_pics”93指示位于从当前画面的视点开始 VID更小的方向(负(-)视点方向)上的不同视点重建画面的数量,信息“num_positive_interview_pics”94指示位于从当前画面的视点开始VID更大的方向(正(+)视点方向)上的不同视点重建画面的数量。
根据实施例的参考画面集“interview_ref_pic_set(i)”67的参数集还可包括“delta_view_idx_s0_minus1[i]”95和“delta_view_idx_s1_minus1[i]”96,其中,“delta_view_idx_s0_minus1[i]”95指示:与位于负(-)视点方向上的每个重建图像的当前视点的VID相比,相应视点的VID减小;“delta_view_idx_s1_minus1[i]”96指示:与位于正(+)视点方向上的每个重建图像的当前视点的VID相比,相应视点的VID增大。
参照回图6A的序列参数集65,根据实施例的多视点视频预测解码设备 20可从序列参数集65解析“num_interview_ref_pic_sets”66,以读取可用于属于当前序列的画面的参考画面集的数量。
根据实施例的多视点视频预测解码设备20可解析用于每个参考画面集的“interview_ref_pic_set(i)”67,以从“num_negative_interview_pics”93读取位于负(-)视点方向上的不同视点重建图像的数量,并从“num_positive_ interview_pics”94读取位于正(+)视点方向上的不同视点重建图像的数量。
根据实施例的多视点视频预测解码设备20可解析根据实施例的参考画面集“interview_ref_pic_set(i)”67的参数集,以从“delta_view_idx _s0_minus1[i]”95读取位于负(-)视点方向上的每个重建图像的相应视点的VID与当前视点的VID之间的差值,从而读取位于负(-)视点方向上的重建图像的VID。
类似地,根据实施例的多视点视频预测解码设备20可解析根据实施例的参考画面集“interview_ref_pic_set(i)”67的参数集,以从“delta_view_idx_s1_minus1[i]”96读取位于正(+)视点方向上的每个重建图像的相应视点的VID与当前视点的VID之间的差值,从而读取位于正(+)视点方向上的重建图像的VID。
图6B示出根据实施例的画面参数集60的语法。
根据实施例的多视点视频预测编码设备10可产生包括关于可通常应用于当前画面内的默认设置的信息的画面参数集60。具体地讲,关于参考列表,关于属于L0列表和L1列表的重建画面的基本数量的信息可被包括在画面参数集60中,其中,由每个预测块使用所述重建画面在当前画面内进行从帧间预测和视点间预测中选择的至少一种。
例如,“num_ref_idx_l0_default_active_minus1”61指示L0列表中的具有先于当前画面的再现顺序的再现顺序的相同视点有效重建画面的基本数量。“num_interview_ref_idx_l0_default_active_minus1”62指示L0列表中的具有与当前画面的再现顺序相同的再现顺序并且VID小于当前视点的VID的有效重建画面的基本数量。“num_ref_idx_l1_default_active_minus1”63指示L1列表中的具有晚于当前画面的再现顺序的再现顺序的相同视点有效重建画面的基本数量。“num_interview_ref_idx_l1_default_active_minus1”64指示L1列表中的具有与当前画面的再现顺序相同的再现顺序并且VID大于当前视点的VID 的有效重建画面的基本数量。
根据实施例的多视点视频预测解码设备20可从接收的比特流提取画面参数集60。根据实施例的多视点视频预测解码设备20可从画面参数集60解析“num_ref_idx_l0_default_active_minus1”61,以读取L0列表中的具有先于当前画面的再现顺序的再现顺序的相同视点有效重建画面的基本数量。根据实施例的多视点视频预测解码设备20可解析“num_interview_ref_idx_l0_default_active_minus1”62,以读取L0列表中具有与当前画面的再现顺序相同的再现顺序并且VID小于当前视点的VID的有效重建画面的基本数量。根据实施例的多视点视频预测解码设备20可解析“num_ref_idx_l1_default_active_minus1”63,以读取L1列表中的具有晚于当前画面的再现顺序的再现顺序的相同视点有效重建画面的基本数量。根据实施例的多视点视频预测解码设备20可解析“num_interview_ref_idx_l1_default_active_minus1”64,以读取L1列表中的具有与当前画面的再现顺序相同的再现顺序并且VID大于当前视点的VID的有效重建画面的基本数量。
图7示出根据实施例的条带头70的语法。
根据实施例的多视点视频预测编码设备10可产生包括关于通常应用于当前条带的设置的信息的条带头70。
根据实施例的条带头70可包括用于帧间预测的短期参考画面集的参数 90、用于视点间预测的参考画面集的参数91以及用于帧间预测的长期参考画面集的参数92。
根据实施例的用于帧间预测的短期参考画面集的参数90可包括关于是否使用在序列参数集65中确定的短期参考画面集的信息“short_term_ref_pic_set_sps_flag”87。
如果在当前条带中不使用在序列参数集65中确定的短期参考画面集,则参数90可包括参数集“short_term_ref_pic_set(num_short_term_ref_pic_sets)” 80,以定义用于当前条带的短期参考画面集。
同时,如果在当前条带中使用在序列参数集65中确定的短期参考画面集,则参数90可包括将用于当前条带并且在序列参数集65中确定的短期参考画面集的索引“short_term_ref_pic_set_idx”88。
用于视点间预测的参考画面集的参数91可包括信息“interview_ref_pic_set_sps_flag”97,其中,“interview_ref_pic_set_sps_flag”97 指示是否使用在序列参数集65中确定的用于视点间预测的参考画面集。
如果在当前条带中不使用在序列参数集65中确定的用于视点间预测的参考画面集,则参数91可包括参数集“interview_ref_pic_set(num_interview_ref_pic_sets)”67,以定义用于当前条带的视点间预测的参考画面集。
如果在当前条带中使用在序列参数集65中确定的用于视点间预测的参考画面集,则参数91可包括将用于当前条带并且在序列参数集65中确定的用于视点间预测的参考画面集的索引“interview_ref_pic_set_idx”98。
用于帧间预测的长期参考画面集的参数92可包括长期参考画面的数量“num_long_term_pics”89以及关于长期参考画面的POC的信息。
关于参考列表,在当前条带中选择性地修改的信息(而非当前画面的基本设置)可被包括在条带头70中。
当当前条带是前向预测模式的P条带类型或双预测模式的B条带类型时,条带头70可包括“num_ref_idx_active_override_flag”71。“num_ref_idx_active_override_flag”71指示是否在当前条带中用另一值来替换从在当前画面参数集60中确定的“num_ref_idx_l0_default_active_minus1”61, “num_interview_ref_idx_l0_default_active_minus1”62、“num_ref_idx_l1_default_active_minus1”63和“num_interview_ref_idx_l1_default_active_minus1”64的重建画面的基本数量中选择的至少一个。
如果通过使用“num_ref_idx_active_override_flag”71可在当前条带中用其他值来替换重建画面的基本数量,则“num_ref_idx_active_override_flag”72 可被包括在条带头70中,其中,“num_ref_idx_active_override_flag”72指示 L0列表中的用于帧间预测的有效重建画面的数量。如果针对当前nal单元允许3D视频的编码和解码,则“num_interview_ref_idx_l0_active_minus1”73可被包括在条带头70中,其中,“num_interview_ref_idx_l0_active_minus1”73 指示L0列表中的用于视点间预测的有效重建画面的数量。
如果通过使用“num_ref_idx_active_override_flag”71可在当前条带中用其他值来替换重建画面的基本数量并且当前条带是B条带类型,则“num_ref_idx_l1_active_minus1”74可被包括在条带头70中,其中,“num_ref_idx_l1_active_minus1”74指示L1列表中的用于帧间预测的有效重建画面的数量。如果针对当前nal单元允许3D视频的编码和解码,则“num_interview_ref_idx_l1_active_minus1”75可被包括在条带头70中,其中,“num_interview_ref_idx_l1_active_minus1”75指示L1列表中的用于视点间预测的有效重建画面的数量。
根据实施例的多视点视频预测解码设备20可从接收的比特流提取条带头70。当当前条带是前向预测模式的P条带类型或双预测模式的B条带类型时,多视点视频预测解码设备20可从条带头70解析“num_ref_idx_active_override_flag”71,以读取是否用另一值替换当前画面中的参考列表集的重建画面的基本数量。
根据实施例的多视点视频预测解码设备20可解析根据实施例的条带头 70的短期参考画面集的参数90,以从“short_term_ref_pic_set_sps_flag”87读取是否使用在短期参考画面集(在序列参数集65中确定)中确定的短期参考画面集。
如果在当前条带中不使用在序列参数集65中确定的短期参考画面集,则可从“short_term_ref_pic_set(num_short_term_ref_pic_sets)”80提取用于定义用于当前条带的短期参考画面集的参数。
同时,如果在当前条带中使用在序列参数集65中确定的短期参考画面集,则可从“short_term_ref_pic_set_idx”88读取将在当前条带使用的在参考参数集65中确定的短期参考画面集的索引。
根据实施例的多视点视频预测解码设备20可解析根据实施例的用于条带头70的视点间预测的参考画面集的参数91,以从“interview_ref_pic_set_sps_flag”97读取是否使用在序列参数集65中确定的用于视点间预测的参考画面集。
如果在当前条带中不使用在序列参数集65中确定的短期参考画面集,则可从“short_term_ref_pic_set(num_short_term_ref_pic_sets)”80提取用于定义用于当前条带的视点间预测的参考画面集的参数集。
同时,如果在当前条带中使用在序列参数集65中确定的短期参考画面集,则可从“interview_ref_pic_set_idx”98读取将在当前条带中使用的在序列参数集65中确定的用于视点间预测的参考画面集的索引。
根据实施例的长期参考画面集的参数92可读取长期参考画面的数量“num_long_term_pics”89以及关于长期参考画面的POC的信息。
如果用另一值来替换参考列表集的重建画面的基本数量,则多视点视频预测解码设备20可从条带头70解析“num_ref_idx_active_override_flag”72,以读取L0列表中的用于帧间预测的有效重建画面的数量。如果针对当前nal 单元允许3D视频的编码和解码,则多视点视频预测解码设备20可从条带头 70解析“num_interview_ref_idx_l0_active_minus1”73,以读取L0列表中的用于视点间预测的有效重建画面的数量。
如果通过使用“num_ref_idx_active_override_flag”71在当前条带中用其他值来替换重建画面的基本数量并且当前条带是B条带类型,则多视点视频预测解码设备20可从条带头70解析“num_ref_idx_l1_active_minus1”74,以读取L1列表中的用于帧间预测的有效重建画面的数量。如果针对当前nal单元允许3D视频的编码和解码,则多视点视频预测解码设备20可从条带头70 解析“num_interview_ref_idx_l1_active_minus1”75,以读取L1列表中的用于视点间预测的有效重建画面的数量。
多视点视频预测编码设备10和多视点视频预测解码设备20可确定76 在当前条带中是否修改在参考列表中先前确定的参考顺序。如果可在当前条带中修改参考列表的参考顺序并且针对当前nal单元允许3D视频的编码和解码,则参考列表修改参数集77可被调用。
图8B示出根据实施例的用于改变参考列表的参数的语法。
当当前条带是前向预测模式的P条带类型或双预测模式的B条带类型时,根据实施例的参考列表修改参数集77可包括“ref_pic_list_modification_flag_l0”81,其中,该信息指示是否选择性地修改属于L0参考列表的重建画面的参考顺序。
当在当前条带中选择性地修改参考顺序时,用于当前条带的前向预测或双预测的L0列表的参考索引(“list_entry_l0”82)可被选择性地修改。在这点上,属于L0列表的参考索引的最大数量83可以是L1列表中的具有先于当前画面的再现顺序的再现顺序的至少一个重建画面的基本数量61与具有小于当前画面的VID的VID至少一个重建画面的基本数量62之和。因此,新的参考索引可与L0列表的参考索引(“list_entry_l0”82)匹配达到属于L0列表的参考索引的最大数量83一样多,使得与每个参考索引相应的重建画面的参考顺序可在当前条带中被选择性地修改。
当当前条带是双预测模式的B条带类型时,根据实施例的参考列表修改参数集84可包括“ref_pic_list_modification_flag_l1”84,该信息指示是否选择性地修改属于L1参考列表的重建画面的参考顺序。
当在当前条带中选择性地修改参考顺序时,用于当前条带的前向预测或双预测的L1列表的参考索引(“list_entry_l1”85)可被选择性地修改。在这点上,属于L1列表的参考索引的最大数量86可以是L1列表中的具有先于当前画面的再现顺序的再现顺序的至少一个重建画面的基本数量63与具有小于当前画面的VID的VID的至少一个重建画面的基本数量64之和。因此,信道参考索引可与L1列表的参考索引(“list_entry_l1”85)匹配达到属于L1列表的参考索引的最大数量86一样多,使得与每个参考索引相应的重建画面的参考顺序在当前条带中可被选择性地修改。
因此,根据实施例的多视点视频预测解码设备20可从参考列表修改参数集77解析“ref_pic_list_modification_flag_l0”81或“ref_pic_list_modification_flag_l1”84,以读取参考顺序是否在L0列表或L1 列表中被选择性地修改。如果确定L0列表的参考顺序被选择性地修改,则可根据作为在当前条带中选择性修改的参考索引的“list_entry_l0”82来修改L0 列表的参考顺序,其中,改变量与属于L0列表的参考索引的最大数量83一样多。同样,如果确定L1列表的参考顺序被选择性地修改,则可根据作为在当前条带中选择性修改的参考索引的“list_entry_l1”85来修改L1列表的参考顺序,其中,改变量与属于L1列表的参考索引的最大数量86一样多。
根据实施例的多视点视频预测编码设备10和多视点视频预测解码设备 20可通过使用与现有参考列表组合的新的参考列表来执行帧间预测或视点间预测。
图9示出根据实施例的组合的参考列表。
也就是,可通过组合属于基本L0列表41的重建画面与属于基本L1参考列表45的重建画面来产生新的基本LC列表90。
可以以Z字型顺序交替地参考属于基本L0列表41和基本L1参考列表 45的重建画面的顺序来确定根据另一实施例的属于基本LC列表90的重建画面的参考顺序。
例如,可以按照从作为基本L0列表41的第一重建画面的VID 5/POC 17 画面32开始的基本L1列表45的VID 5/POC 19画面34、基本L0列表 41的VID 5/POC 16画面33、基本L1列表45的VID 5/POC 17画面32、基本L1列表41的VID 5/POC 19画面34、基本L1列表45的VID5/POC 16画面33、基本L0列表41的VID 3/POC 18画面35、基本L1列表45 的VID 7/POC 18画面37的参考顺序来确定基本LC列表90。
图10和图11是用于解释根据实施例的改变组合的参考列表的处理的示图。
根据另一实施例的多视点视频预测编码设备10和多视点视频预测解码设备20可在当前条带中选择性地修改组合的参考列表,即属于基本LC列表 90的重建画面的参考顺序。因此,基本LC列表90不用于当前条带。代替地,多视点视频预测编码设备10和多视点视频预测解码设备20可通过参考图10 的参考索引表来使用基本L0列表40和基本L1列表41的重建画面,从而产生修改LC列表11。
在根据实施例的参考索引表50中,参考索引101Idx是修改LC列表111 中的重建画面的参考顺序的号码。“pic_from_list_0_flag”103可指示属于修改 LC列表111的每个重建画面是属于基本L0列表41还是属于基本L1列表45。“ref_idx_list_curr”105可指示基本L0列表41或基本L1列表45中的相应重建画面的参考索引。
因此,属于修改LC列表111的重建画面可根据pic_from_list_0_flag”103 或“ref_idx_list_curr”105被确定为按照参考顺序的基本L0列表41的VID 5/POC 17画面32、基本L1列表45的VID 5/POC 19画面34、基本L0列表41的VID 3/POC 18画面35、基本L1列表45的VID 7/POC 18画面 37、基本L0列表41的VID 5/POC 16画面33和基本L0列表41的VID5/POC 19画面34。
因此,当根据另一实施例的多视点视频预测编码设备10和多视点视频预测解码设备20使用LC列表时,如果针对当前nal单元允许3D视频的编码和解码,则参考列表组合参数集“ref_pic_list_3D_combination”和参考列表修改参数集77“ref_pic_list_3D_modification”可被记录在用于当前条带的条带头上。根据另一实施例的参考列表组合参数集“ref_pic_list_3D_combination”可包括用于确定组合的参考列表的参数。
根据另一实施例的多视点视频预测解码设备20可从条带头解析参考列表组合参数集“ref_pic_list_3D_combination”,以从“ref_pic_list_3D_combination”读取是否组合L0列表和L1列表并且使用LC列表。如果确定使用LC列表,则属于LC列表的参考索引的最大数量可被读取。 L0列表和L1列表的重建画面基本上属于Z字型顺序的LC列表,因此如果属于LC列表的参考索引的最大数量被确定,则属于LC列表的重建画面及其再现顺序可被确定。
根据另一实施例的多视点视频预测解码设备20可从条带头读取属于LC 列表的重建画面的参考顺序是否被修改。如果属于LC列表的重建画面的参考顺序被修改,则可在每个参考索引的修改LC列表中按照与属于来自条带头的LC列表的参考索引的最大数量一样多的数量来重新设置当前参考顺序。
图12是根据实施例的包括多视点视频预测编码设备10的多视点视频编码设备121的框图。
根据实施例的多视点视频编码设备121包括DPB 42、多视点视频预测编码设备10、转换量化器46和熵编码器48。
根据实施例的DPB 42存储与当前画面的视点相同的先前重建画面以及与当前画面的POC数相同并且与当前画面的视点不同的先前重建画面。可在存储在DPB 42中的重建画面之中确定用于帧间预测和视点间预测的参考画面。可由多视点视频编码设备121来执行以上参照图1A、图1B以及图3至图8描述的根据实施例的多视点视频预测编码设备10的操作。
根据实施例的多视点视频预测编码设备10可在作为P条带类型或B条带类型的当前画面的相同视点图像之中确定L0列表,其中,L0列表包括分配有先于当前画面的POC的至少一个重建画面和分配有与当前画面的POC 相同的POC并且具有小于当前画面的VID的VID的至少一个重建画面。多视点视频预测编码设备10可在作为B条带类型的当前画面的相同视点图像之中确定L1列表,其中,L1列表包括分配有跟随在当前画面之后的POC的至少一个重建画面和分配有与当前画面的POC相同的POC并且具有大于当前画面的VID的VID的至少一个重建画面。
因此,多视点视频预测编码设备10可通过使用存储在DPB 42中的重建画面来确定用于多视点视频的帧间预测和视点间预测的L0列表和L1列表。根据情况,在L0列表和L1列表中定义的重建画面的参考顺序可被选择性地修改。
多视点视频预测编码设备10可通过参考L0列表或参考L0列表和L1列表来确定当前画面的参考画面,并且确定参考画面的参考块以执行从帧间预测和视点间预测中选择的至少一个。
根据实施例的多视点视频预测编码设备10可通过使用存储在DPB 42中的重建画面来配置参考列表,通过使用从参考列表选择的参考画面来对当前图像执行帧间预测和视点间预测,并且产生残差数据。
根据实施例的转换量化器46可对由多视点视频预测编码设备10产生的残差数据执行转换和量化,并且产生量化转换系数。根据实施例的熵编码器 48可对量化转换系数以及包括运动矢量和参考索引的符号执行熵编码。
根据实施例的多视点视频编码设备121可针对每个块对视频的图像执行帧间预测,通过对通过帧间预测或视点间预测产生的每个块的残差数据执行转换和量化来产生每个块的量化转换系数,并且通过对量化转换系数执行熵编码来输出比特流,从而对视频编码。
多视点视频编码设备121可通过参考存储在DPB 42中的先前重建画面来执行当前画面的运动补偿或视差补偿,并且产生当前画面的重建画面。当前画面的重建画面可被用作用于不同图像的帧间预测或视点间预测的参考画面。因此,多视点视频编码设备121还可执行多视点视频预测解码设备20的操作,其中,多视点视频预测解码设备20执行用于帧间预测或视点间预测的运动补偿或视差补偿。
根据实施例的多视点视频编码设备121可与嵌入在其中的内部视频编码处理器或外部视频编码处理器交互,以输出视频编码结果,从而执行包括帧内预测、帧间预测、转换和量化的视频编码操作。当根据实施例的多视点视频编码设备121包括内部视频编码处理器并且多视点视频编码设备121或控制多视点视频编码设备121的中央处理单元(CPU)或图形处理单元(GPU)包括视频编码处理模块时,视频编码操作可被执行。
图13是根据实施例的包括多视点视频预测解码设备20的多视点视频解码设备131的框图。
根据实施例的多视点视频解码设备131可包括接收器52、反量化逆变换器54、DPB56、多视点视频预测解码设备20和环路滤波器59。
根据实施例的接收器52可接收比特流,对接收的比特流执行熵解码,并且对编码图像数据进行解析。
反量化逆变换器54可对由接收器52解析的编码图像数据执行反量化和逆变换,并且重建残差数据。
根据实施例的接收器52可从比特流解析运动矢量和/或视差矢量。根据实施例的DPB 56可存储可用作另一图像的运动补偿或视差补偿的参考画面的先前重建画面。根据实施例的多视点视频预测解码设备20可通过使用存储在DPB 56中的重建画面来配置参考列表,并且通过使用参考列表来执行使用运动矢量和残差数据的运动补偿或使用视差矢量和残差数据的视差补偿。
根据实施例的多视点视频预测解码设备20可执行与参照图2A和图2B 描述的多视点视频预测解码设备20的操作相同的操作。
根据实施例的多视点视频预测解码设备20可针对作为P条带类型或B 条带类型的当前画面在相同视点图像之中确定L0列表,其中,L0列表包括分配有先于当前画面的POC的至少一个重建画面和分配有与当前画面的 POC相同的POC并且具有小于当前画面的VID的VID的至少一个重建画面。
多视点视频预测解码设备20可在作为B条带类型的当前画面的相同视点图像之中确定L1列表,其中,L1列表包括分配有跟随在当前画面之后的 POC的至少一个重建画面和分配有与当前画面的POC相同的POC并且具有大于当前画面的VID的VID的至少一个重建画面。
因此,多视点视频预测解码设备20可确定用于多视点视频的帧间预测和视点间预测的L0列表和L1列表。根据情况,在L0列表和L1列表中定义的重建画面的参考顺序可被选择性地修改。
多视点视频预测解码设备20可通过参考L0列表或参考L0列表和L1列表来确定当前画面的参考画面,并且确定参考画面的参考块以执行从帧间预测和视点间预测中选择的至少一种。
根据实施例的多视点视频解码设备131可根据视点执行对视频的每个图像的块的解码并且重建视频。接收器52可解析每个块的编码数据以及运动矢量或视差信息。反量化逆变换器54可对每个块的编码数据执行反量化和逆变换,并且重建每个块的残余数据。多视点视频预测解码设备20可确定参考画面之中的由每个块的运动矢量或视差矢量指示的参考块,并且将参考块与残差数据合成,从而重新产生重建块。
环路滤波器59对由多视点视频预测解码设备20输出的重建画面执行去块滤波和采样自适应偏移(SAO)滤波。环路滤波器59可针对每个块执行去块滤波和SAO滤波,并且输出最终重建画面。环路滤波器559的输出图像可被存储在DPB 56中并且用作用于下一图像的运动补偿的参考画面。
根据实施例的多视点视频解码设备131可与嵌入在其中的内部视频解码处理器或外部视频解码处理器交互,以输出视频解码结果,从而执行包括反量化、逆变换、帧内预测和运动补偿的视频解码操作。当根据实施例的多视点视频解码设备131包括内部视频解码处理器并且多视点视频解码设备131 或控制多视点视频解码设备131的CPU包括视频解码处理模块时,视频解码操作可被执行。
以上参照图1A至图13描述的多视点视频预测编码设备10、多视点视频预测解码设备20、多视点视频编码设备121和多视点视频解码设备131可根据用于本发明的多视点视频的预测编码设备来配置用于多视点视频的帧间预测和视点间预测的参考列表。用于帧间预测的参考图像和用于视点间预测的参考图像可被包括在一个参考列表中。
可通过序列参数集和条带头来发送和接收关于明显地反映解码画面集的状态的参考画面集的信息。根据参考画面集来确定参考列表,并且因此在考虑解码画面集的状态确定的参考列表中,参考图像可被确定并用于帧间预测/ 运动补偿和视点间预测/视差补偿。
根据本发明的用于多视点视频的预测解码设备可产生包括用于帧间预测的参考图像和用于视点间预测的参考图像的至少一个参考列表。用于多视点视频的预测解码设备可通过参考一个参考列表来确定当前图像的参考图像,在参考图像之中确定参考块,并且执行从运动补偿和视差补偿中选择的至少一种。
根据实施例的多视点视频预测编码设备10、多视点视频预测解码设备 20、多视点视频编码设备121和多视点视频解码设备131可将视频数据的块划分为具有树结构的编码单元,并且预测单元可被用于如上所述的编码单元的帧间预测。下文中,将参照图16至图18描述基于具有树结构的编码单元和变换单元的视频编码方法、视频编码设备、视频解码方法和视频解码设备。
根据实施例的多视点视频预测编码设备10、根据实施例的多视点视频预测解码设备20、多视点视频编码设备121和多视点视频解码设备131可将视频数据的块划分为具有树结构的编码单元,并且编码单元、预测单元和变换单元可被用于上述的编码单元的视点间预测或帧间预测。下文中,将参照图 14至图26描述基于具有树结构的编码单元和变换单元的视频编码方法、视频编码设备、视频解码方法和视频解码设备。
原则上,在用于多视点视频的编码和解码处理期间,用于基本视点图像的编码和解码处理以及用于附加视点图像的编码和解码处理可被单独地执行。换句话说,当对多视点视频执行视点间预测时,单视点视频的编码和解码结果可被相互参考,但是根据单视点视频执行单独的编码和解码处理。
因此,由于以下参照图14至图26描述的基于具有树结构的编码单元的视频编码和解码处理是用于处理单视点视频的视频编码和解码处理,因此仅执行帧间预测和运动补偿。然而,如以上参照图1A至图13所述,为了对多视点视频编码和解码,对基本视点图像和附加视点图像执行视点间预测和视点间视差补偿。
因此,为了使根据实施例的多视点视频预测编码设备10和根据实施例的多视点视频编码设备121基于具有树结构的编码单元对多视点视频预测编码,多视点视频预测编码设备10和多视点视频编码设备121可包括与视点数量一样多的图14的视频编码设备100,以便根据每个单个视点视频执行视频编码,从而控制每个视频编码设备100对分配的单视点视频编码。另外,用于对单视点视频编码的视频编码设备100可通过使用用于对不同的视点视频编码的每个视频编码设备100的各自单个视点的编码结果来执行视点间预测。多视点视频预测编码设备10和多视点视频编码设备121的每个都可根据视点产生包括根据视点的编码结果的比特流。
类似地,为了使得根据实施例的多视点视频预测解码设备20和根据实施例的多视点视频解码设备131基于具有树结构的编码单元对多视点视频预测解码,多视点视频预测解码设备20和多视点视频解码设备131可包括与多视点视频的视点的数量一样多的图15的视频编码设备200,以便针对接收的基本视点图像流和接收的附加视点图像流根据视点执行视频解码,从而控制每个视频解码设备200对分配的单视点视频解码。另外,用于对单视点视频解码的视频解码设备200可通过使用用于对不同视点视频解码的每个视频解码设备200的各自单视点的解码结果来执行视点间预测。因此,多视点视频预测解码设备20和多视点视频解码设备131每个都可根据视点产生包括根据视点的解码结果的比特流。
图14是根据本发明的实施例的基于根据树结构的编码单元的视频编码设备100的框图。
根据实施例的基于根据树结构的编码单元执行视频预测的视频编码设备 100包括最大编码单元划分器110、编码单元确定器120和输出单元130。在下文中,为了方便描述,将根据实施例的基于根据树结构的编码单元执行视频预测的视频编码设备100称为“视频编码设备100”。
最大编码单元划分器110可基于作为具有图像的当前画面的最大尺寸的编码单元的最大编码单元,来对当前画面进行划分。如果当前画面大于最大编码单元,则可将当前画面的图像数据划分为至少一个最大编码单元。根据本发明的实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、 256×256等的数据单元,其中,数据单元的形状是宽度和长度为2的若干次方的正方形。图像数据可按照至少一个最大编码单元被输出到编码单元确定器120。
根据本发明的实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元在空间上被划分的次数,并且随着深度加深,根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度,最小编码单元的深度为最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根据本发明的实施例的最大编码单元进行划分,因此可根据深度对包括在最大编码单元中的空间域的图像数据进行分层地分类。
可预先确定编码单元的最大深度和最大尺寸,所述最大深度和最大尺寸限制对最大编码单元的高度和宽度进行分层划分的次数。
编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换句话说,编码单元确定器120通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码,选择具有最小编码误差的深度,来确定编码深度。确定的编码深度和根据确定的编码深度的被编码的图像数据被输出到输出单元130。
基于与等于或低于最大深度的至少一个深度相应的较深层编码单元,对最大编码单元中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对与较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
随着编码单元根据深度而被分层地划分并且编码单元的数量增加,最大编码单元的尺寸被划分。另外,即使在一个最大编码单元中编码单元与同一深度相应,也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分为更低深度。因此,即使图像数据被包括在一个最大编码单元中,在一个最大编码单元中编码误差根据区域而不同,因此在图像数据中编码深度可根据区域而不同。因此,可在一个最大编码单元中确定一个或更多个编码深度,并且可根据至少一个编码深度的编码单元来对最大编码单元的图像数据进行划分。
因此,根据实施例的编码单元确定器120可确定包括在最大编码单元中的具有树结构的编码单元。根据本发明的实施例的“具有树结构的编码单元”包括在最大编码单元中包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。可根据最大编码单元的相同区域中的深度来分层地确定编码深度的编码单元,并可在不同区域中独立地确定编码深度的编码单元。类似地,可从另一区域的编码深度独立地确定当前区域中的编码深度。
根据本发明的实施例的最大深度是与从最大编码单元到最小编码单元的划分的次数有关的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单元的总划分次数。根据本发明的实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如,当最大编码单元的深度是0时,对最大编码单元划分一次的编码单元的深度可被设置为1,对最大编码单元划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是对最大编码单元划分四次的编码单元,则存在深度0、1、 2、3和4的5个深度等级,并因此第一最大深度可被设置为4,第二最大深度可被设置为5。
可根据最大编码单元执行预测编码和变换。还根据最大编码单元,基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和变换。
由于每当根据深度对最大编码单元进行划分时,较深层编码单元的数量增加,因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述,在最大编码单元中,现在将基于当前深度的编码单元来描述预测编码和变换。
根据实施例的视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
为了在最大编码单元执行预测编码,可基于与编码深度相应的编码单元 (即,不再被划分成与更低深度相应的编码单元的编码单元)来执行预测编码。以下,不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元获得的分区可包括预测单元以及通过对预测单元的高度和宽度中选择的至少一个进行划分而获得的数据单元。分区是编码单元的预测单元被划分的数据单元,预测单元可以是具有与编码单元相同的尺寸的分区。
例如,当2N×2N(其中,N是正整数)的编码单元不再被划分,并且成为2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如,1:n或 n:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。
预测单元的预测模式可以是从帧内模式、帧间模式和跳过模式中选择的至少一个。例如,可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。另外,可仅对2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
根据实施例的视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元,来对编码单元中的图像数据执行变换。为了对编码单元执行变换,可基于具有小于或等于编码单元的尺寸的数据单元,来执行变换。例如,用于变换的数据单元可包括帧内模式的数据单元和帧间模式的数据单元。
与根据本实施例的根据树结构的编码单元类似,编码单元中的变换单元可被递归地划分为更小尺寸的区域。因此,可基于根据变换深度的具有树结构的变换单元,对编码单元中的残差数据进行划分。
根据实施例,还可在变换单元中设置变换深度,其中,变换深度表示对编码单元的高度和宽度进行划分以获得变换单元的划分的次数。例如,在 2N×2N的当前编码单元中,当变换单元的尺寸是2N×2N时,变换深度可以为0,而当变换单元的尺寸是N×N时,变换深度可以为1,当变换单元的尺寸是N/2×N/2时,变换深度可以为2。换句话说,还可根据变换深度设置具有树结构的变换单元。
根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需要关于与预测编码和变换相关的信息的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式和用于变换的变换单元的尺寸。
稍后将参照图16至图26详细描述根据本发明的实施例的最大编码单元中的根据树结构的编码单元和确定预测单元/分区以及变换单元的方法。
编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化,来测量根据深度的较深层编码单元的编码误差。
输出单元130在比特流中输出最大编码单元的图像数据和关于根据编码深度的编码模式的信息,其中,所述最大编码单元的图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。
可通过对图像的残差数据进行编码来获得编码图像数据。
关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于在预测单元中的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。
可通过使用根据深度的划分信息来定义关于编码深度的信息,其中,根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则对当前编码单元中的图像数据进行编码并输出,因此可定义划分信息以不将当前编码单元划分到更低深度。选择性地,如果当前编码单元的当前深度不是编码深度,则对更低深度的编码单元执行编码,并因此可定义划分信息以对当前编码单元进行划分来获得更低深度的编码单元。
如果当前深度不是编码深度,则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复执行编码,并因此可对具有相同深度的编码单元递归地执行编码。
由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编码单元确定关于至少一个编码模式的信息,所以可针对一个最大编码单元确定关于至少一个编码模式的信息。另外,由于根据深度对图像数据进行分层划分,因此最大编码单元的图像数据的编码深度可根据位置而不同,因此可针对图像数据设置关于编码深度和编码模式的信息。
因此,根据实施例的输出单元130可将关于相应的编码深度和编码模式的编码信息分配给从包括在最大编码单元中的编码单元、预测单元和最小单元中选择的至少一个。
根据本发明的实施例的最小单元是通过将构成最低深度的最小编码单元划分为4份而获得的正方形数据单元。可选择地,根据实施例的最小单元可以是最大正方形数据单元,其中,最大正方形数据单元可包括在包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中。
例如,由输出单元130输出的编码信息可被分类为根据更深层编码单元的编码信息和根据预测单元的编码信息。根据更深层编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。
根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、序列参数集或画面参数集。
还可经由比特流的头、序列参数集或画面参数集输出关于当前视频允许的关于变换单元的最大尺寸的信息和关于变换单元的最小尺寸的信息。输出单元130可对与预测有关的参考信息、预测信息和条带类型信息进行编码,并输出这些信息。
在视频编码设备100中,较深层编码单元可以是通过将更高深度的编码单元(更高一层)的高度或宽度划分成两份而获得的编码单元。换言之,当当前深度的编码单元的尺寸是2N×2N时,更低深度的编码单元的尺寸是 N×N。另外,尺寸为2N×2N的当前深度的编码单元可包括最多4个更低深度的编码单元。
因此,视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度,通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外,由于可通过使用各种预测模式和变换中的任意一个对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。
因此,如果以传统宏块对具有高分辨率或大数据量的图像进行编码,则每个画面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩的信息,并且数据压缩效率降低。然而,通过使用视频编码设备100,由于考虑图像的尺寸,在增加编码单元的最大尺寸的同时,基于图像的特征来调整编码单元,因此可增加图像压缩效率。
以上参照图1A描述的多视点视频编码设备10可包括与视点的数量一样多的视频编码设备100,以根据多视点视频的视点对单视点图像进行编码。
当视频编码设备100对单视点图像进行编码时,编码单元确定器120可针对每个最大编码单元,确定根据具有树结构的编码单元进行帧间预测的预测单元,并根据预测单元执行帧间预测。
具体地讲,编码单元确定器120可执行参考相同视点重建画面的帧间预测以及参考不同视点重建画面的视点间预测。根据实施例的编码单元确定器 120可在作为P条带类型或B条带类型的当前画面的相同视点图像之中确定 L0列表,其中,L0列表包括分配有先于当前画面的POC的至少一个重建画面和分配有与当前画面的POC相同的POC并且具有小于当前画面的VID的 VID的至少一个重建画面。编码单元确定器120可在作为B条带类型的当前画面的相同视点图像之中确定L1列表,其中,L1列表包括分配有跟随在当前画面之后的POC的至少一个重建画面和分配有与当前画面的POC相同的 POC并且具有大于当前画面的VID的VID的至少一个重建画面。
因此,编码单元确定器120可通过使用存储在DPB中的重建画面来确定用于多视点视频的帧间预测和视点间预测的L0列表和L1列表。根据情况,在L0列表和L1列表中定义的重建画面的参考顺序可在预定条带中被选择性地修改。
根据实施例的编码单元确定器120可通过参考L0列表或参考L0列表和 L1列表来确定当前画面的参考画面,并且确定参考画面的参考块以执行从帧间预测和视点间预测中选择的至少一种。
图15是根据本发明的实施例的基于根据树结构的编码单元的视频解码设备200的框图。
根据实施例的执行基于具有树结构的编码单元的视频预测的视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据解码器 230。在下文中,为了便于描述,根据实施例的基于根据树结构的编码单元执行视频预测的视频解码设备200被称为“视频解码设备200”。
用于视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图14和视频编码设备100描述的定义相同。
接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器 220从解析的比特流,针对每个编码单元提取编码图像数据,并随后将提取的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头、序列参数集或序列参数集提取关于当前画面的编码单元的最大尺寸的信息。
另外,图像数据和编码信息提取器220从解析的比特流,根据最大编码单元,提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换言之,比特流中的图像数据被划分为最大编码单元,使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。
可针对关于与编码深度相应的至少一个编码深度的信息设置关于根据最大编码单元的编码深度和编码模式的信息,关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外,根据深度的划分信息可被提取为关于编码深度的信息。
关于由图像数据和编码信息提取器220提取的根据每个最大编码单元的编码深度和编码模式的信息是关于在以下情况下被确定为产生最小编码误差的编码深度和编码模式的信息,即,在编码端(诸如,视频编码设备100) 根据最大编码单元对根据深度的每个较深层编码单元重复地执行编码的时候。因此,视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。
由于根据实施例的关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单元,提取关于编码深度和编码模式的信息。如果关于相应最大编码单元的编码深度和编码模式的信息根据预定数据单元被记录,则可将被分配了相同的关于编码深度和编码模式的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。
图像数据解码器230基于关于根据最大编码单元的编码深度和编码模式的信息,通过对每个最大编码单元中的图像数据进行解码,来恢复当前画面。换言之,图像数据解码器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息,对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆变换。
图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
另外,为了对每个最大编码单元执行逆变换,图像数据解码器230可读取每个编码单元的根据树结构的变换单元信息,从而基于每个编码单元的变换单元执行逆变换。通过逆变换,可恢复编码单元的空间域的像素值。
图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是编码深度。因此,图像数据解码器230可通过使用关于与编码深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息,对当前最大编码单元中的编码数据进行解码。
换言之,可通过观察分配给编码单元、预测单元和最小单元中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。这样,通过获得关于针对每个编码单元的编码模式的信息来对当前编码单元进行解码。
以上参照图1A和图12描述的多视点视频预测编码设备10和多视点视频编码设备121可包括与视点的数量一样多的图像数据解码器230,以便根据多视点视频的视点来产生用于帧间预测和视点间预测的参考画面。
另外,以上参照图2A和图13描述的多视点视频预测解码设备20和多视点视频解码设备131可包括与视点的数量一样多的视频解码设备200,以便通过对接收的比特流解码根据视点恢复图像。
当多视点视频之中的预定视点视频的比特流被接收到时,视频解码设备 200的图像数据解码器230可将由图像数据和编码信息提取器230从比特流提取的图像的样点划分为具有树结构的编码单元。图像数据解码器230可通过对通过对画面图像的样点进行划分而获得的具有树结构的编码单元,根据对于帧间预测的预测单元执行运动补偿来恢复图像。
具体地讲,图像数据解码器230可执行参考相同视点重建画面的帧间预测和参考不同视点重建画面的视点间预测。根据实施例的图像数据解码器230 可在作为P条带类型或B条带类型的当前画面的相同视点图像之中确定L0 列表,其中,L0列表包括分配有先于当前画面的POC的至少一个重建画面和分配有与当前画面的POC相同的POC并且具有小于当前画面的VID的 VID的至少一个重建画面。图像数据解码器230可在作为B条带类型的当前画面的相同视点图像之中确定L1列表,其中,L1列表包括分配有跟随在当前画面之后的POC的至少一个重建画面和分配有与当前画面的POC相同的 POC并且具有大于当前画面的VID的VID的至少一个重建画面。
因此,图像数据解码器230可通过使用存储在DPB中的重建画面来确定用于多视点视频的帧间预测和视点间预测的L0列表和L1列表。根据情况,在L0列表和L1列表中定义的重建画面的参考顺序可在预定条带中被选择性地修改。
根据实施例的图像数据解码器230可通过参考L0列表或参考L0列表和 L1列表来确定当前画面的参考画面。图像数据解码器230可通过使用由图像数据和编码信息提取器220解析的运动矢量或视差矢量来确定参考图像的参考预测单元。可通过经由从运动补偿和视差补偿中选择的至少一个对参考预测单元补偿残差数据,来重建当前预测单元。
因此,视频解码设备200可获得关于当针对每个最大编码单元递归地执行编码时产生最小编码误差的至少一个编码单元的信息,并且可使用所述信息来对当前画面进行解码。换言之,被确定为最大编码单元中的最优编码单元的具有树结构的编码单元可被解码。
因此,即使图像数据具有高分辨率和大数据量,也可通过使用编码单元的尺寸和编码模式,对图像数据进行有效地解码和恢复,其中,通过使用从编码器接收到的关于最优编码模式的信息,根据图像数据的特征自适应地确定所述编码单元的尺寸和编码模式。
图16是用于描述根据本发明的实施例的编码单元的概念的示图。
编码单元的尺寸可被表示为宽度×高度,并可以是64×64、32×32、16×16 和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区,32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区, 16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区,8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。
在视频数据310中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是2。在视频数据320中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是3。在视频数据330中,分辨率是352×288,编码单元的最大尺寸是16,最大深度是1。图16中示出的最大深度表示从最大编码单元到最小编码单元的划分总次数。
如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。
由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。由于视频数据330 的最大深度是1,因此由于通过对最大编码单元划分一次,深度加深至一层,因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。
由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度加深至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深,详细信息可被精确地表示。
图17是根据本发明的实施例的基于编码单元的图像编码器400的框图。
根据实施例的图像编码器400执行视频编码设备100的编码单元确定器 120的操作来对图像数据进行编码。换言之,帧内预测器410在帧内模式下对当前帧405中的编码单元执行帧内预测,运动估计器420和运动补偿器425 通过使用当前帧405和参考帧495,在帧间模式下对当前帧405中的编码单元分别执行帧间预测和运动补偿。
从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆变换器470被恢复为空间域中的数据,恢复的空间域中的数据在通过去块单元480和偏移调整单元490后处理之后被输出为参考帧 495。量化后的变换系数可通过熵编码器450被输出为比特流455。
为了将图像编码器400应用到根据实施例的视频编码设备100中,图像编码器400的所有元件(即,帧内预测器410、运动估计器420、运动补偿器 425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块单元480和偏移调整单元490)在考虑每个最大编码单元的最大深度的同时,基于具有树结构的编码单元中的每个编码单元执行操作。
具体地,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时,确定具有树结构的编码单元中的每个编码单元的分区和预测模式,变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。
运动补偿器420可根据预测单元执行参考相同视点图像的帧间预测并且估计帧间运动。运动补偿器420还可根据预测单元执行参考具有相同再现顺序的不同视点图像的视点间预测,并且估计视点间视差。
运动补偿器425可根据预测单元执行参考相同视点图像的运动补偿,并且重建预测单元。运动补偿器425还可根据预测单元执行参考具有相同再现顺序的不同视点图像的视差补偿,并且重建预测单元。
运动估计器420和运动补偿器425确定参考列表的方法与以上参考图1A 至图11描述的相同。
图18是根据本发明的实施例的基于编码单元的图像解码器500的框图。
解析器510从比特流505解析将被解码的编码图像数据和解码所需的编码信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据,反量化的数据通过逆变换器540被恢复为空间域中的图像数据。
针对空间域中的图像数据,帧内预测器550在帧内模式下对编码单元执行帧内预测,运动补偿器560通过使用参考帧585在帧间模式下编码单元执行运动补偿。
通过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和偏移调整器580后处理之后被输出为恢复帧595。另外,通过去块单元570和偏移调整器580后处理的图像数据可被输出为参考帧585。
为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,图像解码器500可执行在解析器510执行操作之后执行的操作。
为了将图像解码器500应用到视频解码设备200中,图像解码器500的所有元件(即,解析器510、根据实施例的熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块单元570和偏移调整器 580)针对每个最大编码单元,基于具有树结构的编码单元执行操作。
具体地,帧内预测器550和运动补偿器560基于具有树结构的每个编码单元的分区和预测模式来执行操作,逆变换器540基于每个编码单元的变换单元的尺寸来执行操作。
运动补偿器560可根据预测单元执行参考相同视点图像的运动补偿并且重建预测单元。运动补偿器560还可根据预测单元执行参考具有相同再现顺序的不同视点图像的视差补偿,并且重建预测单元。运动补偿器560确定参考列表的方法与以上参照图1A至图11描述的相同。
图19是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。
根据实施例的视频编码设备100和根据实施例的视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
根据本发明的实施例,在根据实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,最大深度是4。在这种情况下,最大深度表示编码单元从最大编码单元被划分到最小编码单元的总次数。由于根据实施例沿着分层结构600的垂直轴深度加深,因此较深层编码单元的高度和宽度均被划分。另外,预测单元和分区沿着分层结构600的水平轴被示出,其中,所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
换言之,在分层结构600中,编码单元610是最大编码单元,其中,深度为0,尺寸为64×64(即,高度乘宽度)。随着深度沿着垂直轴加深,存在尺寸为32×32和深度为1的编码单元620、尺寸为16×16和深度为2的编码单元630、尺寸为8×8和深度为3的编码单元640。尺寸为8×8和深度为3 的编码单元640是最小编码单元。
编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之,如果尺寸为64×64和深度为0的编码单元610是预测单元,则可将预测单元划分成包括在编码单元610中的分区,即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。
类似地,可将尺寸为32×32和深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区,即,尺寸为32×32的分区620、尺寸为32×16 的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。
类似地,可将尺寸为16×16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区,即,包括在编码度单元630中的尺寸为16×16 的分区630、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8 的分区636。
类似地,可将尺寸为8×8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区,即,包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区 646。
为了确定构成最大编码单元610的编码单元的至少一个编码深度,根据实施例的视频编码设备100的编码单元确定器120对包括在最大编码单元610 中的与每个深度相应的编码单元执行编码。
随着深度加深,包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,与深度1相应的编码单元和四个与深度2相应的编码单元均被编码。
为了针对深度之中的当前深度执行编码,可沿着分层结构600的水平轴,通过对与当前深度相应的编码单元中的每个预测单元执行编码,来将针对当前深度选择最小编码误差。选择性地,随着深度沿着分层结构600的垂直轴加深,可通过针对每个深度执行编码,比较根据深度的最小编码误差,来搜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。
图20是用于描述根据本发明的实施例的在编码单元710和变换单元720 之间的关系的示图。
根据实施例的视频编码设备100或根据实施例的视频解码设备200针对每个最大编码单元,根据具有小于或等于最大编码单元的尺寸的编码单元,对图像进行编码或解码。可基于不大于相应的编码单元的数据单元,来选择用于在编码期间进行变换的变换单元的尺寸。
例如,在根据实施例的视频编码设备100或根据实施例的视频解码设备 200中,如果编码单元710的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行变换。
此外,可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的每个变换单元执行变换,来对尺寸为64×64的编码单元710的数据进行编码,然后可选择具有最小编码误差的变换单元。
图21是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。
根据实施例的视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行编码,并将信息800、信息810和信息820 作为关于编码模式的信息来发送。
信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。这里,关于分区类型的信息800被设置来指示尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808中的一个。
信息810指示每个分区的预测模式。例如,信息810可指示对由信息800 指示的分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧内变换单元828。
视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元,提取并使用用于解码的信息800、810和820。
图22是根据本发明的实施例的根据深度的较深层编码单元的示图。
划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。
用于对深度为0和尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916和尺寸为N_0×N_0的分区类型918。图9仅示出了通过对称地划分预测单元910 而获得的分区类型912至918,但是分区类型不限于此,并且预测单元910 的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。
根据每种分区类型,对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0 的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和 N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。可仅对尺寸为 2N_0×2N_0的分区执行跳过模式下的预测编码。
如果在分区类型912至916中的一个分区类型中编码误差最小,则可不将预测单元910划分到更低深度。
如果在分区类型918中编码误差最小,则深度从0改变到1以在操作920 中划分分区类型918,并对深度为2和尺寸为N_0×N_0的编码单元930重复地执行编码来搜索最小编码误差。
用于对深度为1和尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进行预测编码的预测单元940可包括以下分区类型的分区:尺寸为2N_1×2N_1 的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946以及尺寸为N_1×N_1的分区类型948。
如果在分区类型948中编码误差最小,则深度从1改变到2以在操作950 中划分分区类型948,并对深度为2和尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。
当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成 d-1,并且划分信息可被编码直到深度是0到d-2中的一个。换句话说,当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-1时,用于对深度为d-1和尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-1)×2N(d-1)的分区类型992、尺寸为2N_(d-1)×N(d-1)的分区类型994、尺寸为N_(d-1)×2N(d-1)的分区类型996和尺寸为N_(d-1)×N(d-1)的分区类型 998。
可对分区类型992至998中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区类型。
即使当分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-1的编码单元CU_(d-1)也不再被划分到更低深度,构成当前最大编码单元900的编码单元的编码深度被确定为d-1,并且当前最大编码单元900的分区类型可被确定为N_(d-1)×N(d-1)。此外,由于最大深度是d,并且具有最低深度d-1的最小编码单元980不再被划分到更低深度,因此不设置最小编码单元980的划分信息。
数据单元999可以是用于当前最大编码单元的“最小单元”。根据本发明的实施例的最小单元可以是通过将最小编码单元980划分成4份而获得的正方形数据单元。通过重复地执行编码,视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度,并将相应分区类型和预测模式设置为编码深度的编码模式。
这样,在所有深度1至d中对根据深度的最小编码误差进行比较,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码并发送。另外,由于编码单元从0的深度被划分到编码深度,因此仅编码深度的划分信息被设置为0,并且除了编码深度以外的深度的划分信息被设置为1。
根据实施例的视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度和预测单元的信息,来对分区912进行解码。根据实施例的视频解码设备200可通过使用根据深度的划分信息,将划分信息为0的深度确定为编码深度,并且使用关于相应深度的编码模式的信息来进行解码。
图23至图25是用于描述根据本发明的实施例的编码单元1010、预测单元1060和变换单元1070之间的关系的示图。
编码单元1010是最大编码单元中的与由视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010中的预测单元的分区,变换单元1070是每个编码单元1010的变换单元。
当在编码单元1010中最大编码单元的深度是0时,编码单元1012和编码单元1054的深度是1,编码单元1014、1016、1018、1028、1050和1052 的深度是2,编码单元1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
在预测单元1060中,通过划分编码单元1010中的编码单元来获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说,编码单元1014、1022、1050和1054中的分区类型的尺寸是2N×N,编码单元1016、1048和1052中的分区类型的尺寸是N×2N,编码单元1032的分区类型的尺寸就N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。
在小于编码单元1052的数据单元中的变换单元1070中,对编码单元 1052的图像数据执行变换或逆变换。另外,在尺寸和形状方面,变换单元1070 中的编码单元1014、1016、1022、1032、1048、1050和1052不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050和1052。换句话说,根据实施例的视频编码设备100和视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。
因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元,从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由根据实施例的视频编码设备100和视频解码设备200设置的编码信息。
[表1]
根据实施例的视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息,根据实施例的视频解码设备200的图像数据和编码信息提取器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。
划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0,则当前编码单元不再被划分成更低深度的的深度是编码深度,从而可针对所述编码深度来定义关于分区类型、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分,则对更低深度的四个划分编码单元独立地执行编码。
预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可针对所有分区类型定义帧内模式和帧间模式,仅针对尺寸为2N×2N的分区类型定义跳过模式。
关于分区类型的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型,以及通过非对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和 nR×2N的非对称分区类型。可通过按1:3和3:1来划分预测单元的高度来分别获得尺寸为2N×nU和2N×nD的非对称分区类型,可通过按1:3和3:1来划分预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的非对称分区类型。
可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换句话说,如果变换单元的划分信息是0,则变换单元的尺寸可以是 2N×2N,即当前编码单元的尺寸。如果变换单元的划分信息是1,则可通过对当前编码单元进行划分来获得变换单元。另外,如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型时,则变换单元的尺寸可以是N×N,如果当前编码单元的分区类型是非对称分区类型,则变换单元的尺寸可以是 N/2×N/2。
关于根据实施例的具有树结构的编码单元的编码信息可包括从与编码深度相应的编码单元、预测单元和最小单元中选择的至少一个。与编码深度相应的编码单元可包括从包含相同编码信息的预测单元和最小单元中选择的至少一个。
因此,通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与编码深度相应的同一编码单元中。另外,通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元,并因此可确定最大编码单元中的编码深度的分布。
因此,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。
选择性地,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元,并可参考搜索到的邻近编码单元以对当前编码单元进行预测。
图26是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。
最大编码单元1300包括编码深度的编码单元1302、1304、1306、1312、 1314、1316和1318。这里,由于编码单元1318是编码深度的编码单元,因此划分信息可以被设置成0。可将关于尺寸为2N×2N的编码单元1318的分区类型的信息设置成以下分区类型中的一种:尺寸为2N×2N的分区类型 1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326、尺寸为N×N的分区类型1328、尺寸为2N×nU的分区类型1332、尺寸为2N×nD 的分区类型1334、尺寸为nL×2N的分区类型1336以及尺寸为nR×2N的分区类型1338。
变换单元的划分信息(TU尺寸标记)是一类变换索引。与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区类型而改变。
例如,当分区类型被设置成对称(即,分区类型1322、1324、1326或 1328)时,如果变换单元的TU尺寸标记是0,则设置尺寸为2N×2N的变换单元1342,如果TU尺寸标记是1,则设置尺寸为N×N的变换单元1344。
当分区类型被设置成非对称(例如,分区类型1332、1334、1336或1338) 时,如果TU尺寸标记是0,则设置尺寸为2N×2N的变换单元1352,如果TU 尺寸标记是1,则设置尺寸为N/2×N/2的变换单元1354。
参照图20,TU尺寸标记是具有值0或1的标记,但是TU尺寸标记不限于1比特,在TU尺寸标记从0增加的同时,变换单元可被分层划分以具有树结构。变换单元的划分信息(TU尺寸标记)可以是变换索引的示例。
在这种情况下,根据本发明的实施例,可通过使用变换单元的TU尺寸标记以及变换单元的最大尺寸和最小尺寸来表示实际上已使用的变换单元的尺寸。视频编码设备100能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码的结果可被插入SPS。视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU 尺寸标记来对视频进行解码。
例如,(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是 32×32,则(a-1)当TU尺寸标记为0时,变换单元的尺寸可以是32×32,(a-2) 当TU尺寸标记为1时,变换单元的尺寸可以是16×16,(a-3)当TU尺寸标记为2时,变换单元的尺寸可以是8×8。
作为另一示例,(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32,则(b-1)当TU尺寸标记为0时,变换单元的尺寸可以是 32×32。这里,由于变换单元的尺寸不能够小于32×32,因此TU尺寸标记不能够被设置为除了0以外的值。
作为另一示例,(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标记为1,则TU尺寸标记可以是0或1。这里,TU尺寸标记不能够被设置为除了0或1以外的值。
因此,当TU尺寸标记为0时,如果定义最大TU尺寸标记为“MaxTransformSizeIndex”,最小变换单元尺寸为“MinTransformSize”,变换单元尺寸为“RootTuSize”,则可通过等式(1)来定义可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”:
CurrMinTuSize=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex)) …(1)
与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比,当TU尺寸标记为0时,变换单元尺寸“RootTuSize”可指示可在系统中选择的最大变换单元尺寸。在等式(1)中,“RootTuSize/(2∧MaxTransformSizeIndex)”指示当TU尺寸标记为0时,变换单元尺寸“RootTuSize”被划分了与最大TU尺寸标记相应的次数时的变换单元尺寸,“MinTransformSize”指示最小变换尺寸。因此,“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”中较小的值可以是可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。
根据本发明的实施例,最大变换单元尺寸RootTuSize可根据预测模式的类型而改变。
例如,如果当前预测模式是帧间模式,则可通过使用以下的等式(2)来确定“RootTuSize”。在等式(2)中,“MaxTransformSize”指示最大变换单元尺寸,“PUSize”指示当前预测单元尺寸:
RootTuSize=min(MaxTransformSize,PUSize)……(2)
也就是说,如果当前预测模式是帧间模式,则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中较小的值。
如果当前分区单元的预测模式是帧内模式,则可通过使用以下的等式(3) 来确定“RootTuSize”。在等式(3)中,“PartitionSize”指示当前分区单元的尺寸:
RootTuSize=min(MaxTransformSize,PartitionSize)……(3)
也就是说,如果当前预测模式是帧内模式,则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元的尺寸之中较小的值。
然而,根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸“RootTuSize”仅是示例,本发明不限于此。
根据如上参照图14至图26描述的基于具有树结构的编码单元的视频编码方法,针对树结构的每个编码单元对空间域的图像数据进行编码。根据基于具有树结构的编码单元的视频解码方法,针对每个最大编码单元执行解码以恢复空间域的图像数据。因此,可恢复画面和视频(即,画面序列)。恢复后的视频可通过再现设备被再现,可被存储在存储介质中,或者可通过网络被发送。
根据本发明的实施例可被编写为计算机程序,并可在使用计算机可读记录介质执行程序的通用数字计算机中被实现。计算机可读记录介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)和光记录介质(例如,CD-ROM 或DVD)。
为了便于解释,以上参照图1A至图20描述的根据多视点视频预测方法、多视点视频预测恢复方法或多视点视频编码方法的视频编码方法将被统称为“根据本发明的视频编码方法”。另外,以上参照图1A至图20描述的根据多视点视频预测恢复方法或多视点视频解码方法将被称为“根据本发明的视频解码方法”。
另外,已参照图1A至图26描述的视频编码设备(包括多视点视频预测编码设备10、多视点视频编码设备121、视频编码设备100或图像编码器400) 将被称为“根据本发明的视频编码设备”。另外,已参照图1A至图26描述的视频解码设备(包括多视点视频预测解码设备20、多视点视频解码设备131、视频解码设备200或图像解码器500)将被称为“根据本发明的视频解码设备”。
现在将详细描述根据本发明的实施例的存储程序的计算机可读记录介质 (例如,盘26000)。
图27是根据本发明的实施例的存储程序的盘26000的物理结构。作为存储介质的盘26000可以是硬盘驱动器、致密盘只读存储器(CD-ROM)盘、蓝光盘或数字多功能盘(DVD)。盘26000包括多个同心磁道Tr,每个同心磁道Tr沿盘26000的圆周方向被划分成特定数量的扇区Se。在盘26000的特定区域中,可分配并存储执行如上所描述的量化参数确定方法、视频编码方法和视频解码方法的程序。
现在将参照图28来描述使用存储以下程序的存储介质来实现的计算机系统,其中,所述程序用于执行如上所述的视频编码方法和视频解码方法。
图28是通过使用盘26000来记录并读取程序的盘驱动器26800的示图。计算机系统27000可经由盘驱动器26800将执行从根据本发明的实施例的视频编码方法和视频解码方法中选择的至少一个的程序存储在盘26000中。为了在计算机系统27000中运行存储在盘26000中的程序,可通过使用盘驱动器26800从盘26000读取程序并将程序发送到计算机系统27000。
执行从根据本发明的实施例的视频编码方法和视频解码方法中选择的至少一个的程序不仅可被存储在图27或图28中示出的盘26000中,还可被存储在存储卡、ROM卡带或固态驱动器(SSD)中。
以下将描述应用以上所描述的视频编码方法和视频解码方法的系统。
图29是提供内容分布服务的内容供应系统11000的整体结构的示图。将通信系统的服务区域划分成预定尺寸的小区,并将无线基站11700、11800、 11900和12000分别安装在这些小区中。
内容供应系统11000包括多个独立装置。例如,诸如计算机12100、个人数字助理(PDA)12200、视频相机12300和移动电话12500的多个独立装置经由互联网服务提供商11200、通信网络11400和无线基站11700、11800、 11900和12000连接到互联网11100。
然而,内容供应系统11000不限于如图29中所示,并且装置可选择性地被连接到内容供应系统11000。多个独立装置可不经由无线基站11700、11800、 11900和12000而直接连接到通信网络11400。
视频相机12300是能够捕捉视频图像的成像装置,例如,数字视频相机。移动电话12500可利用各种协议(例如,个人数字通信(PDC)、码分多址 (CDMA)、宽带码分多址(W-CDMA)、全球移动通信系统(GSM)和个人手持电话系统(PHS))中的至少一种通信方法。
视频相机12300可经由无线基站11900和通信网络11400连接到流服务器11300。流服务器11300允许经由视频相机12300从用户接收到的内容经由实时广播被流传输。可使用视频相机12300或流服务器11300来对从视频相机12300接收到的内容进行编码。通过视频相机12300捕捉到的视频数据可经由计算机12100被发送到流服务器11300。
通过相机12600捕捉到的视频数据也可经由计算机12100被发送到流服务器11300。与数码相机类似,相机12600是能够捕捉静止图像和视频图像两者的成像装置。可使用相机12600或计算机12100对通过相机12600捕捉到的视频数据进行编码。可将对视频执行编码和解码的软件存储在可由计算机12100访问的计算机可读记录介质(例如,CD-ROM盘、软盘、硬盘驱动器、SSD或存储卡)中。
如果视频数据通过内置在移动电话12500中的相机被捕捉到,则可从移动电话12500接收视频数据。
还可通过安装在视频相机12300、移动电话12500或相机12600中的大规模集成电路(LSI)系统来对视频数据进行编码。
内容供应系统1100可对由用户使用视频相机12300、相机12600、移动电话12500或另一成像装置所记录的内容数据(例如,在音乐会期间记录的内容)进行编码,并将编码后的内容数据发送到流服务器11300。流服务器 11300可将编码后的内容数据以流内容的形式发送到请求内容数据的其它客户端。
客户端是能够对编码后的内容数据进行解码的装置,例如,计算机 12100、PDA12200、视频相机12300或移动电话12500。因此,内容供应系统11000允许客户端接收并再现编码后的内容数据。此外,内容供应系统 11000允许客户端实时接收编码后的内容数据并对编码后的内容数据进行解码和再现,从而能够进行个人广播。
包括在内容供应系统11000中的多个独立装置的编码和解码操作可类似于根据本发明的实施例的视频编码设备和视频解码设备的编码和解码操作。
现在将参照图30和图31更加详细地描述包括在根据本发明的实施例的内容供应系统11000中的移动电话12500。
图30示出根据本发明的实施例的应用视频编码方法和视频解码方法的移动电话12500的外部结构。移动电话12500可以是智能电话,所述智能电话的功能不受限,并且所述智能电话的大量功能可被改变或扩展。
移动电话12500包括可与图21的无线基站12000交换射频(RF)信号的内部天线12510,并包括用于显示由相机12530捕捉到的图像或经由天线 12510接收到的和解码的图像的显示屏12520(例如,液晶显示器(LCD)或有机发光二极管(OLED)屏幕)。移动手机12500包括包含有控制按钮和触摸面板的操作面板12540。如果显示屏12520是触摸屏,则操作面板12540 还包括显示屏12520的触摸感测面板。移动电话12500包括用于输出语音和声音的扬声器12580或另一类型声音输出单元、以及用于输入语音和声音的麦克风12550或另一类型声音输入单元。移动电话12500还包括用于捕捉视频和静止图像的相机12530,诸如电荷耦合器件(CCD)相机。移动电话12500 还可包括:存储介质12570,用于存储例如通过相机12530捕捉到的视频或静止图像、经由电子邮件接收到的编码/解码数据、或根据各种方式获得的编码/解码数据;插槽12560,存储介质12570经由插槽12560被装入移动电话12500中。存储介质12570可以是闪存,例如,包括在塑料壳中的安全数字 (SD)卡或电可擦和可编程只读存储器(EEPROM)。
图31示出根据本发明的实施例的移动电话12500的内部结构。为了系统地控制包括显示屏12520和操作面板12540的移动电话12500的部件,供电电路12700、操作输入控制器12640、图像编码单元12720、相机接口12630、 LCD控制器12620、图像解码单元12690、复用器/解复用器12680、记录/读取单元12670、调制/解调单元12660以及声音处理器12650经由同步总线 12730被连接到中央控制器12710。
如果用户操作电源按钮,并从“电源关闭”状态设置为“电源开启”状态,则供电电路12700从电池组向移动电话12500的所有部件供电,从而将移动电话12500设置为操作模式。
中央控制器12710包括CPU、ROM和RAM。
在移动电话12500将通信数据发送到外部的同时,在中央控制器12710 的控制下,由移动电话12500产生数字信号。例如,声音处理器12650可产生数字声音信号,图像编码单元12720可产生数字图像信号,并且消息的文本数据可经由操作面板12540和操作输入控制器12640被产生。当在中央控制器12710的控制下数字信号被发送到调制/解调单元12660时,调制/解调单元12660对数字信号的频带进行调制,并且通信电路12610对频带调制数字声音信号执行数模转换(DAC)和频率转换。从通信电路12610输出的发送信号可经由天线12510被发送到语音通信基站或无线基站12000。
例如,当移动电话12500处于通话模式时,在中央控制器12710的控制下,经由麦克风12550获得的声音信号通过声音处理器12650被变换成数字声音信号。数字声音信号可经由调制/解调单元12660和通信电路12610被变换成发送信号,并可经由天线12510被发送。
当文本消息(例如,电子邮件)在数据通信模式下被发送时,文本消息的文本数据经由操作面板12540被输入,并经由操作输入控制器12640被发送到中央控制器12610。在中央控制器12610的控制下,文本数据经由调制/ 解调单元12660和通信电路12610被变换成发送信号,并经由天线12510被发送到无线基站12000。
为了在数据通信模式下发送图像数据,由相机12530捕捉到的图像数据经由相机接口12630被提供给图像编码单元12720。捕捉到的图像数据可经由相机接口12630和LCD控制器12620被直接显示在显示屏12520上。
图像编码单元12720的结构可与以上描述的视频编码设备100的结构相应。图像编码单元12720可根据由以上描述的视频编码方法,将从相机12530 接收到的图像数据变换为压缩和编码后的图像数据,并然后将编码后的图像数据输出到复用器/解复用器12680。在相机12530的记录操作期间,由移动电话12500的麦克风12550获得的声音信号可经由声音处理器12650被变换成数字声音数据,并且数字声音数据可被发送到复用器/解复用器12680。
复用器/解复用器12680对从图像编码单元12720接收到的编码后的图像数据与从声音处理器12650接收到的声音数据一起进行复用。对数据进行复用的结果可经由调制/解调单元12660和通信电路12610被变换成发送信号,然后可经由天线12510被发送。
当移动电话12500从外部接收通信数据时,可对经由天线12510接收到的信号执行频率恢复和ADC以将信号变换成数字信号。调制/解调单元12660 对数字信号的频带进行调制。根据频带调制后的数字信号的类型将所述数字信号发送到视频解码单元12690、声音处理器12650或LCD控制器12620。
在通话模式下,移动电话12500对经由天线12510接收到的信号进行放大,并通过对放大后的信号执行频率转换和ADC来获得数字声音信号。在中央控制器12710的控制下,接收到的数字声音信号经由调制/解调单元12660 和声音处理器12650被变换成模拟声音信号,并且模拟声音信号经由扬声器 12580被输出。
当在数据通信模式下时,接收在互联网网站上访问的视频文件的数据,经由调制/解调单元12660将经由天线12510从无线基站12000接收到的信号输出为复用数据,并将复用数据发送到复用器/解复用器12680。
为了对经由天线12510接收到的复用数据进行解码,复用器/解复用器 12680将复用数据解复用成编码后的视频数据流和编码后的音频数据流。经由同步总线12730,编码后的视频数据流和编码后的音频数据流分别被提供给视频解码单元12690和声音处理器12650。
图像解码单元12690的结构可与以上描述的视频解码设备200的结构相应。图像解码单元12690可根据由以上描述的视频解码设备200或图像解码器500所使用的视频解码方法,对编码后的视频数据进行解码来获得恢复后的视频数据,并经由LCD控制器12620将恢复后的视频数据提供给显示屏12520。
因此,可将在互联网网站上访问的视频文件的数据显示在显示屏12520 上。同时,声音处理器12650可将音频数据变换成模拟声音信号,并将模拟声音信号提供给扬声器12580。因此,也可经由扬声器12580再现在互联网网站上访问的视频文件中包含的音频数据。
移动电话12500或另一类型的通信终端可以是包括根据本发明的实施例的视频编码设备和视频解码设备两者的收发终端,可以是仅包括视频编码设备的收发终端,或者可以是仅包括视频解码设备的收发终端。
根据本发明的通信系统不限于以上参照图30描述的通信系统。例如,图 32示出根据本发明的实施例的采用通信系统的数字广播系统。图32的数字广播系统可通过使用根据本发明的实施例的视频编码设备和视频解码设备来接收经由卫星或地面网络发送的数字广播。
具体地,广播站12890通过使用无线电波将视频数据流发送到通信卫星或广播卫星12900。广播卫星12900发送广播信号,广播信号经由家用天线 12860被发送到卫星广播接收器。在每个房屋中,可通过TV接收器12810、机顶盒12870或另一装置对编码后的视频流进行解码并再现。
当根据本发明的实施例的视频解码设备被实现在再现设备12830中时,再现设备12830可对记录在存储介质12820(诸如用于恢复数字信号的盘或存储卡)上的编码后的视频流进行解析和解码。因此,可在例如监视器12840 上再现恢复后的视频信号。
在被连接到用于卫星/地面广播的天线12860或用于接收有线电视(TV) 广播的线缆天线12850的机顶盒12870中,可安装根据本发明的实施例的视频解码设备。从机顶盒12870输出的数据也可被再现在TV监视器12880上。
如另一示例,可将根据本发明的实施例的视频解码设备安装在TV接收器12810中,而不是机顶盒12870中。
具有适当天线12910的汽车12920可接收从卫星12900或无线基站11700 发送的信号。可在安装在汽车12920中的汽车导航系统12930的显示屏上再现解码后的视频。
视频信号可由根据本发明的实施例的视频编码设备来编码,然后可被存储在存储介质中。具体地,可由DVD记录器将图像信号存储在DVD盘12960 中,或可由硬盘记录器12950将图像信号存储在硬盘中。如另一示例,可将视频信号存储在SD卡12970中。如果硬盘记录器12950包括根据本发明的实施例的视频解码设备,则记录在DVD盘12960、SD卡12970或另一存储介质上的视频信号可被再现于TV监视器12880上。
汽车导航系统12930可不包括图31的相机12530、相机接口12630和图像编码单元12720。例如,计算机12100和TV接收器12810可不包括在图 31的相机12530、相机接口12630和图像编码单元12720中。
图33是示出根据本发明的实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。
云计算系统可包括云计算服务器14000、用户数据库(DB)14100、多个计算资源14200和用户终端。
响应于来自用户终端的请求,云计算系统经由数据通信网络(例如,互联网)提供多个计算资源14200的点播外包服务。在云计算环境下,服务提供商通过使用虚拟技术组合位于不同的物理位置的数据中心处的计算资源,来为用户提供想要的服务。服务用户不必将计算资源(例如,应用、存储器、操作系统(OS)和安全)安装在他/她拥有的终端中以使用它们,但可在想要的时间点在通过虚拟技术产生的虚拟空间中从服务中选择和使用想要的服务。
被指定的服务用户的用户终端经由包括互联网和移动通信网络的数据通信网络被连接到云计算服务器14000。可从云计算服务器14000向用户终端提供云计算服务,特别是视频再现服务。用户终端可以是能够被连接到互联网的各种类型的电子装置,例如,桌上型PC 14300、智能TV 14400、智能电话14500、笔记本计算机14600、便携式多媒体播放器(PMP)14700、平板 PC 14800等。
云计算服务器14000可组合分布在云网络中的多个计算资源14200,并向用户终端提供组合的结果。所述多个计算资源14200可包括各种数据服务,并可包括从用户终端上载的数据。如上所描述的,云计算服务器14000可通过根据虚拟技术组合分布在不同区域中的视频数据库来向用户终端提供想要的服务。
将关于已经订购云计算服务的用户的用户信息存储在用户DB 14100中。用户信息可包括用户的注册信息、地址、姓名和个人信用信息。用户信息还可包括视频的索引。这里,所述索引可包括已经被再现的视频的列表、正在被再现的视频的列表,之前被再现的视频的暂停点等。
可在用户装置之间共享存储在用户DB 14100中的关于视频的信息。例如,当响应于来自笔记本计算机14600的请求将视频服务提供给笔记本计算机14600时,视频服务的再现历史被存储在用户DB 14100中。当从智能电话 14500接收到用于再现此视频服务的请求时,云计算服务器14000基于用户 DB 14100搜索并再现此视频服务。当智能电话14500从云计算服务器14000 接收到视频数据流时,通过对视频数据流进行解码来再现视频的处理与以上参照图30描述的移动电话12500的操作类似。
云计算服务器14000可参考存储在用户DB 14100中的想要的视频服务的再现历史。例如,云计算服务器14000从用户终端接收用于再现存储在用户DB 14100中的视频的请求。如果此视频之前被再现过,则由云计算服务器 14000执行的对此视频进行流传输的方法可根据来自用户终端的请求(即,根据是将从视频的起点还是视频的暂停点来再现视频)而不同。例如,如果用户终端请求从视频的起点开始再现视频,则云计算服务器14000将从视频的第一帧开始的视频的流数据发送到用户终端。如果用户终端请求从视频的暂停点开始再现视频,则云计算服务器14000将从与暂停点相应的帧开始的视频的流数据发送到用户终端。
在此情况下,用户终端可包括如以上参照图1A至图26描述的视频解码设备。如另一示例,用户终端可包括如以上参照图1A至图26描述的视频编码设备。选择性地,用户终端可包括如以上参照图1A至图26描述的视频解码设备和视频编码设备两者。
以上已经参照图27至图33描述了以上参照图1A至图26描述的根据本发明的实施例的视频编码方法、视频解码方法、视频编码设备和视频解码设备的各种应用。然而,根据本发明的各种实施例的将视频编码方法和视频解码方法存储在存储介质中的方法,或者将视频编码设备和视频解码设备实现在装置中的方法不限于以上参照图27至图33描述的实施例。
虽然已参照本发明的实施例具体示出并描述了本发明,但是本领域的普通技术人员将理解,在不脱离由所附权利要求书限定的本发明的精神和范围的情况下,可在其中进行形式和细节上的各种改变。实施例应该仅被认为是描述意义的而不是限制的目的。因此,本发明的范围不是由本发明的详细描述来限定,而是所附权利要求限定,并且落在范围内的所有差别将被解释为包括在本发明中。
Claims (12)
1.一种对多视点视频进行编码的预测编码方法,所述预测编码方法包括:
在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个短期重建画面的参考画面集以及包括至少一个长期重建画面的参考画面集,在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个短期重建画面的参考画面集;
在第一参考列表与第二参考列表之间确定至少一个参考列表,其中,第一参考列表包括确定的多个参考画面集之中的具有与当前画面的视点相同的视点并且具有早于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有小于当前画面的视点标识符VID的VID的至少一个重建画面,第二参考列表包括具有与当前画面的视点相同的视点并且具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有大于当前画面的VID的VID的至少一个重建画面;
通过使用确定的至少一个参考列表确定用于当前画面的当前块的至少一个参考画面和参考块;
通过使用参考块针对当前块执行从帧间预测和视点间预测中选择的至少一种预测,
其中,确定参考画面集的步骤包括:
确定在当前条带中是否使用针对当前画面确定的所述多个参考画面集之一;
如果确定使用针对当前画面确定的所述多个参考画面集之一,则从所述多个参考画面集中选择索引;
如果确定不使用针对当前画面确定的所述多个参考画面集之一,则确定用于当前条带的参考画面集。
2.如权利要求1所述的对多视点视频进行编码的预测编码方法,其中,确定参考画面集的步骤包括:
在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个非参考重建画面的参考画面集;
在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个非参考重建画面的参考画面集。
3.如权利要求1所述的对多视点视频进行编码的预测编码方法,其中,确定用于当前条带的参考画面集的步骤包括:
确定具有小于当前视点的VID的VID的画面的第一数量以及具有大于当前视点的VID的VID的画面的第二数量;
确定具有小于当前视点的VID的VID的画面的VID之间的差值以及具有大于当前视点的VID的VID的画面的VID之间的差值。
4.如权利要求1所述的对多视点视频进行编码的预测编码方法,其中,确定至少一个参考列表的步骤包括:
确定在当前条带中是否选择性地改变确定的至少一个参考列表的参考索引的参考顺序;
当确定在当前条带中选择性地改变参考顺序时,选择性地改变用于属于当前画面的当前条带的至少一个参考列表的参考索引的参考顺序。
5.如权利要求1所述的对多视点视频进行编码的预测编码方法,其中:
当执行帧间预测时,从自包括在第一参考列表中的具有早于当前画面的再现顺序的再现顺序的至少一个重建画面和包括在第二参考列表中的具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面中选择的至少一个重建画面中确定参考画面和参考块;通过使用确定的参考块对当前块执行帧间预测;确定通过执行帧间预测产生的当前块的第一残差数据、指示确定的参考块的第一运动矢量以及指示确定的参考画面的第一参考索引;
当执行视点间预测时,从自包括在第一参考列表中的具有小于当前画面的VID的VID的至少一个重建画面和包括在第二参考列表中的具有大于当前画面的VID的VID的至少一个重建画面中选择的至少一个重建画面中确定参考画面和参考块;通过使用确定的参考块对当前块执行视点间预测;确定通过执行视点间预测产生的当前块的第二残差数据、指示确定的参考块的第二视差矢量以及指示确定的参考画面的第二参考索引。
6.一种对多视点视频进行解码的预测解码方法,所述预测解码方法包括:
在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个短期重建画面的参考画面集以及包括至少一个长期重建画面的参考画面集,在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个短期重建画面的参考画面集;
在第一参考列表与第二参考列表之间确定至少一个参考列表,其中,第一参考列表包括确定的多个参考画面集之中的具有与当前画面的视点相同的视点并且具有早于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有小于当前画面的VID的VID的至少一个重建画面,第二参考列表包括具有与当前画面的视点相同的视点并且具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有大于当前画面的VID的VID的至少一个重建画面;
通过使用确定的至少一个参考列表确定用于当前画面的当前块的至少一个参考画面和参考块;
通过使用参考块针对当前块执行从运动补偿和视差补偿中选择的至少一种补偿,
其中,确定参考画面集的步骤包括:
确定在当前条带中是否使用针对当前画面确定的所述多个参考画面集之一;
如果确定使用针对当前画面确定的所述多个参考画面集之一,则从所述多个参考画面集中选择索引;
如果确定不使用针对当前画面确定的所述多个参考画面集之一,则确定用于当前条带的参考画面集。
7.如权利要求6所述的对多视点视频进行解码的预测解码方法,其中,确定参考画面集的步骤包括:
在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个非参考重建画面的参考画面集;
在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个非参考重建画面的参考画面集。
8.如权利要求6所述的对多视点视频进行解码的预测解码方法,其中,确定用于当前条带的参考画面集的步骤包括:
确定具有小于当前视点的VID的VID的画面的第一数量以及具有大于当前视点的VID的VID的画面的第二数量;
确定具有小于当前视点的VID的VID的画面的VID之间的差值以及具有大于当前视点的VID的VID的画面的VID之间的差值。
9.如权利要求6所述的对多视点视频进行解码的预测解码方法,其中,确定至少一个参考列表的步骤包括:
确定在当前条带中是否选择性地改变确定的至少一个参考列表的参考索引的参考顺序;
当确定在当前条带中选择性地改变参考顺序时,选择性地改变用于属于当前画面的当前条带的至少一个参考列表的参考索引的参考顺序。
10.如权利要求6所述的对多视点视频进行解码的预测解码方法,其中,执行从运动补偿和视差补偿中选择的至少一种补偿的步骤包括:
接收用于当前画面的当前块的参考索引、残差数据以及运动矢量或视差矢量;
从自以下重建画面中选择的至少一个重建画面确定由参考索引指示的参考画面:包括在第一参考列表中的具有早于当前画面的再现顺序的再现顺序的至少一个重建画面和包括在第二参考列表中的具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面;
从确定的参考画面确定由当前块的运动矢量或视差矢量指示的参考块;
对确定的参考块补偿残差数据。
11.一种用于对多视点视频进行编码的预测编码设备,所述预测编码设备包括:
参考画面集确定器,用于在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个短期重建画面的参考画面集以及包括至少一个长期重建画面的参考画面集,在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个短期重建画面的参考画面集;
参考列表确定器,用于在第一参考列表与第二参考列表之间确定至少一个参考列表,其中,第一参考列表包括确定的多个参考画面集之中的具有与当前画面的视点相同的视点并且具有早于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有小于当前画面的VID的VID的至少一个重建画面,第二参考列表包括具有与当前画面的视点相同的视点并且具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有大于当前画面的VID的VID的至少一个重建画面;
预测器,用于通过使用确定的至少一个参考列表确定用于当前画面的当前块的至少一个参考画面和参考块,并通过使用参考块针对当前块执行从帧间预测和视点间预测中选择的至少一种预测,
其中,参考画面集确定器被配置以:
确定在当前条带中是否使用针对当前画面确定的所述多个参考画面集之一;
如果确定使用针对当前画面确定的所述多个参考画面集之一,则从所述多个参考画面集中选择索引;
如果确定不使用针对当前画面确定的所述多个参考画面集之一,则确定用于当前条带的参考画面集。
12.一种用于对多视点视频进行解码的预测解码设备,所述预测解码设备包括:
参考画面集确定器,用于在先于当前画面被重建的相同视点重建画面之中确定包括具有与当前画面的再现顺序不同的再现顺序的至少一个短期重建画面的参考画面集以及包括至少一个长期重建画面的参考画面集,在先于当前画面被重建的不同视点重建画面之中确定包括具有与当前画面的再现顺序相同的再现顺序的至少一个短期重建画面的参考画面集;
参考列表确定器,用于在第一参考列表与第二参考列表之间确定至少一个参考列表,其中,第一参考列表包括确定的多个参考画面集之中的具有与当前画面的视点相同的视点并且具有早于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有小于当前画面的VID的VID的至少一个重建画面,第二参考列表包括具有与当前画面的视点相同的视点并且具有晚于当前画面的再现顺序的再现顺序的至少一个重建画面以及具有与当前画面的再现顺序相同的再现顺序并具有大于当前画面的VID的VID的至少一个重建画面;
补偿器,用于通过使用确定的至少一个参考列表确定用于当前画面的当前块的至少一个参考画面和参考块,并通过使用参考块针对当前块执行从运动补偿和视差补偿中选择的至少一种补偿,
其中,参考画面集确定器被配置以:
确定在当前条带中是否使用针对当前画面确定的所述多个参考画面集之一;
如果确定使用针对当前画面确定的所述多个参考画面集之一,则从所述多个参考画面集中选择索引;
如果确定不使用针对当前画面确定的所述多个参考画面集之一,则确定用于当前条带的参考画面集。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261638101P | 2012-04-25 | 2012-04-25 | |
US61/638,101 | 2012-04-25 | ||
PCT/KR2013/003579 WO2013162311A1 (ko) | 2012-04-25 | 2013-04-25 | 다시점 비디오 예측을 위한 참조픽처세트를 이용하는 다시점 비디오 부호화 방법 및 그 장치, 다시점 비디오 예측을 위한 참조픽처세트를 이용하는 다시점 비디오 복호화 방법 및 그 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104396252A CN104396252A (zh) | 2015-03-04 |
CN104396252B true CN104396252B (zh) | 2018-05-04 |
Family
ID=49483525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380033884.4A Expired - Fee Related CN104396252B (zh) | 2012-04-25 | 2013-04-25 | 使用用于多视点视频预测的参考画面集的多视点视频编解码方法及其装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20150124877A1 (zh) |
EP (1) | EP2843946A4 (zh) |
KR (1) | KR102106536B1 (zh) |
CN (1) | CN104396252B (zh) |
WO (1) | WO2013162311A1 (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2838264A4 (en) * | 2012-04-23 | 2016-01-06 | Samsung Electronics Co Ltd | METHOD FOR ENCODING MULTIVUE VIDEO USING A MULTIVUE VIDEO PREDICTION REFERENCE LIST AND DEVICE THEREFOR, AND METHOD FOR DECODING MULTIVUE VIDEO USING A MULTIVUE VIDEO PREDICTION REFERENCE LIST AND DEVICE THEREOF |
US9357195B2 (en) * | 2012-08-16 | 2016-05-31 | Qualcomm Incorporated | Inter-view predicted motion vector for 3D video |
WO2014075236A1 (en) * | 2012-11-14 | 2014-05-22 | Mediatek Singapore Pte. Ltd. | Methods for residual prediction with pseudo residues in 3d video coding |
CN106105210B (zh) | 2014-01-03 | 2019-04-26 | 三星电子株式会社 | 管理用于对多层视频进行编码和解码的缓冲器的方法和设备 |
US10715833B2 (en) * | 2014-05-28 | 2020-07-14 | Apple Inc. | Adaptive syntax grouping and compression in video data using a default value and an exception value |
CN111147845B (zh) | 2014-11-27 | 2023-10-10 | 株式会社Kt | 对视频信号进行解码的方法和对视频信号进行编码的方法 |
CN111031323B (zh) | 2014-11-27 | 2023-11-28 | 株式会社Kt | 视频信号处理方法 |
US20170006219A1 (en) | 2015-06-30 | 2017-01-05 | Gopro, Inc. | Image stitching in a multi-camera array |
US9992502B2 (en) | 2016-01-29 | 2018-06-05 | Gopro, Inc. | Apparatus and methods for video compression using multi-resolution scalable coding |
US10291910B2 (en) | 2016-02-12 | 2019-05-14 | Gopro, Inc. | Systems and methods for spatially adaptive video encoding |
US10484621B2 (en) | 2016-02-29 | 2019-11-19 | Gopro, Inc. | Systems and methods for compressing video content |
US10645362B2 (en) * | 2016-04-11 | 2020-05-05 | Gopro, Inc. | Systems, methods and apparatus for compressing video content |
US10163029B2 (en) | 2016-05-20 | 2018-12-25 | Gopro, Inc. | On-camera image processing based on image luminance data |
US10462466B2 (en) | 2016-06-20 | 2019-10-29 | Gopro, Inc. | Systems and methods for spatially selective video coding |
US10553029B1 (en) | 2016-09-30 | 2020-02-04 | Amazon Technologies, Inc. | Using reference-only decoding of non-viewed sections of a projected video |
US10609356B1 (en) * | 2017-01-23 | 2020-03-31 | Amazon Technologies, Inc. | Using a temporal enhancement layer to encode and decode stereoscopic video content |
US10198862B2 (en) | 2017-01-23 | 2019-02-05 | Gopro, Inc. | Methods and apparatus for providing rotated spherical viewpoints |
MX2021001743A (es) * | 2018-08-17 | 2021-06-23 | Huawei Tech Co Ltd | Gestión de imágenes de referencia en codificación de video. |
US11463736B2 (en) * | 2018-09-21 | 2022-10-04 | Sharp Kabushiki Kaisha | Systems and methods for signaling reference pictures in video coding |
EP3629584A1 (en) * | 2018-09-25 | 2020-04-01 | Koninklijke Philips N.V. | Apparatus and method for generating and rendering a video stream |
CN113826390B (zh) * | 2019-05-16 | 2024-03-08 | 字节跳动有限公司 | 屏幕内容编解码的帧内块复制 |
WO2024077616A1 (zh) * | 2022-10-14 | 2024-04-18 | Oppo广东移动通信有限公司 | 编解码方法、装置、设备、及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080022063A (ko) * | 2006-09-05 | 2008-03-10 | 엘지전자 주식회사 | 비디오 신호 디코딩 방법 및, 비디오 신호 디코딩 장치 |
KR20090006132A (ko) * | 2006-04-04 | 2009-01-14 | 퀄컴 인코포레이티드 | 비디오 압축에서의 강화된 프레임 보간의 장치 및 방법 |
CN101455084A (zh) * | 2006-03-30 | 2009-06-10 | Lg电子株式会社 | 用于解码/编码视频信号的方法和装置 |
CN101653001A (zh) * | 2006-10-13 | 2010-02-17 | 汤姆逊许可公司 | 用于多视点视频编码的参考图像列表管理语法 |
KR20120027194A (ko) * | 2009-04-21 | 2012-03-21 | 엘지전자 주식회사 | 다시점 비디오 신호 처리 방법 및 장치 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8532178B2 (en) * | 2006-08-25 | 2013-09-10 | Lg Electronics Inc. | Method and apparatus for decoding/encoding a video signal with inter-view reference picture list construction |
JP5184539B2 (ja) * | 2006-10-13 | 2013-04-17 | トムソン ライセンシング | 多視点ビデオ符号化のための参照ピクチャ・リスト管理方法 |
KR100941608B1 (ko) * | 2006-10-17 | 2010-02-11 | 경희대학교 산학협력단 | 다시점 영상의 부호화 및 복호화 방법과 그를 위한 장치 |
KR100902353B1 (ko) * | 2007-11-16 | 2009-06-12 | 광주과학기술원 | 깊이맵 추정장치와 방법, 이를 이용한 중간 영상 생성 방법및 다시점 비디오의 인코딩 방법 |
KR20240027889A (ko) * | 2011-11-11 | 2024-03-04 | 지이 비디오 컴프레션, 엘엘씨 | 깊이-맵 추정 및 업데이트를 사용한 효율적인 멀티-뷰 코딩 |
US9258559B2 (en) * | 2011-12-20 | 2016-02-09 | Qualcomm Incorporated | Reference picture list construction for multi-view and three-dimensional video coding |
JP5944013B2 (ja) * | 2012-01-17 | 2016-07-05 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | 参照画像リストの取り扱い |
EP2838264A4 (en) * | 2012-04-23 | 2016-01-06 | Samsung Electronics Co Ltd | METHOD FOR ENCODING MULTIVUE VIDEO USING A MULTIVUE VIDEO PREDICTION REFERENCE LIST AND DEVICE THEREFOR, AND METHOD FOR DECODING MULTIVUE VIDEO USING A MULTIVUE VIDEO PREDICTION REFERENCE LIST AND DEVICE THEREOF |
-
2013
- 2013-04-25 CN CN201380033884.4A patent/CN104396252B/zh not_active Expired - Fee Related
- 2013-04-25 US US14/397,307 patent/US20150124877A1/en not_active Abandoned
- 2013-04-25 WO PCT/KR2013/003579 patent/WO2013162311A1/ko active Application Filing
- 2013-04-25 EP EP13780603.0A patent/EP2843946A4/en not_active Withdrawn
- 2013-04-25 KR KR1020130046215A patent/KR102106536B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101455084A (zh) * | 2006-03-30 | 2009-06-10 | Lg电子株式会社 | 用于解码/编码视频信号的方法和装置 |
KR20090006132A (ko) * | 2006-04-04 | 2009-01-14 | 퀄컴 인코포레이티드 | 비디오 압축에서의 강화된 프레임 보간의 장치 및 방법 |
KR20080022063A (ko) * | 2006-09-05 | 2008-03-10 | 엘지전자 주식회사 | 비디오 신호 디코딩 방법 및, 비디오 신호 디코딩 장치 |
CN101653001A (zh) * | 2006-10-13 | 2010-02-17 | 汤姆逊许可公司 | 用于多视点视频编码的参考图像列表管理语法 |
KR20120027194A (ko) * | 2009-04-21 | 2012-03-21 | 엘지전자 주식회사 | 다시점 비디오 신호 처리 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR102106536B1 (ko) | 2020-05-06 |
EP2843946A4 (en) | 2016-01-20 |
US20150124877A1 (en) | 2015-05-07 |
WO2013162311A1 (ko) | 2013-10-31 |
EP2843946A1 (en) | 2015-03-04 |
KR20130120423A (ko) | 2013-11-04 |
CN104396252A (zh) | 2015-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104396252B (zh) | 使用用于多视点视频预测的参考画面集的多视点视频编解码方法及其装置 | |
CN103931192B (zh) | 用于在视频编码或解码中的运动矢量确定的方法和设备 | |
CN104081779B (zh) | 用于帧间预测的方法及其装置和用于运动补偿的方法及其装置 | |
CN105144713B (zh) | 用于解码器设置的对视频进行编码的方法及其装置以及基于解码器设置对视频进行解码的方法及其装置 | |
CN104365101B (zh) | 用于确定用于帧间预测的参考图像的方法及设备 | |
CN104488272B (zh) | 用于预测用于对视频进行编码或用于对视频进行解码的运动矢量的方法和设备 | |
CN104620578B (zh) | 用于随机访问的多层视频编码的方法和设备以及用于随机访问的多层视频解码的方法和设备 | |
CN105027568B (zh) | 用于对条带段进行熵编码的方法及其设备以及用于对条带段进行熵解码的方法及其设备 | |
CN105340271B (zh) | 用于随机访问的多层视频编码方法及其装置以及用于随机访问的多层视频解码方法及其装置 | |
CN105103552B (zh) | 用于补偿亮度差的对层间视频进行编码的方法及其装置以及用于对视频进行解码的方法及其装置 | |
CN104365104B (zh) | 用于多视点视频编码和解码的方法和设备 | |
CN104541510B (zh) | 参考画面列表能够被改变的帧间预测方法及其设备 | |
CN103875249B (zh) | 用于多视点视频预测编码的方法和装置以及用于多视点视频预测解码的方法和装置 | |
CN105594212B (zh) | 用于确定运动矢量的方法及其设备 | |
CN105308966A (zh) | 视频编码方法及其设备以及视频解码方法及其设备 | |
CN106031175B (zh) | 使用亮度补偿的层间视频编码方法及其装置、以及视频解码方法及其装置 | |
CN106105210B (zh) | 管理用于对多层视频进行编码和解码的缓冲器的方法和设备 | |
CN104396251A (zh) | 使用用于多视点视频预测的参考列表对多视点视频进行编码的方法及其装置以及使用用于多视点视频预测的参考列表对多视点视频进行解码的方法及其装置 | |
CN107005711A (zh) | 逐样本预测编码设备和方法 | |
CN106416256B (zh) | 用于对深度图像进行编码或解码的方法和设备 | |
CN105165011A (zh) | 用于考虑存储器带宽和计算量的可伸缩视频编码的装置和方法以及用于可伸缩视频解码的装置和方法 | |
CN107690806A (zh) | 视频编码方法和视频编码设备以及视频解码方法和视频解码设备 | |
CN105340274A (zh) | 深度图编码方法及其设备以及深度图解码方法及其设备 | |
CN107005710A (zh) | 多视点图像编码/解码方法和装置 | |
CN105308958A (zh) | 用于使用视点合成预测的层间视频编码方法和设备以及用于使用视点合成预测的层间视频解码方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180504 |
|
CF01 | Termination of patent right due to non-payment of annual fee |