CN102984515B - 用于解码多视图图像的装置 - Google Patents
用于解码多视图图像的装置 Download PDFInfo
- Publication number
- CN102984515B CN102984515B CN201210389146.0A CN201210389146A CN102984515B CN 102984515 B CN102984515 B CN 102984515B CN 201210389146 A CN201210389146 A CN 201210389146A CN 102984515 B CN102984515 B CN 102984515B
- Authority
- CN
- China
- Prior art keywords
- picture
- view image
- view
- prediction
- inter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
提供一种用于解码多视图图像的装置,该装置包括:提取单元,接收比特流,该比特流包括关于多视图图像序列中使用视图间预测和时间预测编码的图片的信息以及关于该多视图图像序列的数据,以及从接收到的比特流中提取该信息和关于该多视图图像序列的数据;以及解码单元,基于所提取的信息来解码关于该多视图图像序列的数据,其中,在多视图图像序列中,仅仅对被其他图片参考用于视图间预测的参考图片进行视图间预测和时间预测,对其余图片进行时间预测。
Description
本案是申请日为2008年3月6日、申请号为200880019798.7、发明名称为“编码和解码多视图图像的方法和装置”的发明专利申请的分案申请。
技术领域
与本发明一致的方法和装置一般涉及编码和解码多视图图像,更具体地,涉及编码和解码多视图图像以便执行高速编码和解码所需的视图间预测和时间预测。
背景技术
在多视图图像编码中,同时编码从提供多视图图像的多个照相机输入的图像。使用时间相关性和视图间空间相关性来压缩编码多视图图像。
图1示出了根据现有技术的多视图图像的序列。
在图1中,水平轴为时间轴,垂直轴为视图轴。在多视图图像编码中,对于来自于基本视图和时间预测的图像周期性地产生内(I)图片(picture),或者基于产生的I图片执行视图间预测,从而预测编码其它的图片。
使用同一视图(即,同一行)中的图像之间的时间相关性来执行时间预测。使用同一时间点(即,同一列)处的图像之间的空间相关性来执行视图间预测。
在图1中,每行示出了多视图图像的每个视图随时间的图像序列,每列自上而下依次示出了视图0、1、2到7的图像序列。视图0为基本视图,以及第一行中的图像序列来自于该基本视图。仅仅使用时间预测而不使用视图间预测来对包括在来自于基本视图的图像序列中的图片进行预测编码。
每列示出了同一时间点处的多视图图像。包括在列110、120和130中的图片(其中,来自于基本视图的图像为I图片)被称为锚(anchor)图片。仅仅使用视图间预测来对锚图片进行编码。
除了包括I图片的列110、120和130之外的其余列中包括的图片被称为非锚图片。使用时间预测和视图间预测二者来对非锚图片进行预测编码。
在图1所示的序列当中,将以第二行和第五列中的图片141作为示例。使用视图间预测和时间预测二者来对包括在图片141中的每个块进行预测。由于预测方法可以对于每个块都不同,因此将参考位于邻近于图片141处的奇数行中的图片142和143以及在时间上在图片141之前或之后的图片111和121,以便预测图片141。
相似地,根据现有技术,将不得不使用需要参考四个图片的视图间预测和时间预测来预测编码非锚图片,结果导致低速的多视图图像编码。
发明内容
技术方案
本发明提供一种用于对多视图图像进行编码和解码的方法和装置以及其上记录有用于执行该方法的程序的计算机可读记录介质,其中可以高效地对多视图图像序列进行高速编码和解码。
具体地,本发明提供一种用于解码多视图图像的装置,该装置包括:提取单元,接收比特流,该比特流包括关于多视图图像序列中使用视图间预测和时间预测编码的图片的信息以及关于该多视图图像序列的数据,以及从接收到的比特流中提取该信息和关于该多视图图像序列的数据;以及解码单元,基于所提取的信息来解码关于该多视图图像序列的数据,其中,在多视图图像序列中,仅仅对被其他图片参考用于视图间预测的参考图片进行视图间预测和时间预测,对其余图片进行时间预测。
有益效果
在预测中,基于提取的信息确定不是用于视图间预测的参考图像的图片不被参考用于视图间预测。由于可以高效地以高速执行视图间预测,因此多视图图像解码的速度也提高了。
如上所述,根据本发明,在多视图图像的编码和解码期间,使用视图间预测来对包括在多视图图像序列中的仅仅一些图片进行预测编码和解码,从而加速了编码和解码。
此外,当预测不使用视图间预测的图片时,仅参考少量图片,从而使得可以有效利用预测编码和解码所需的存储器。
附图说明
通过下面参考附图对本发明的示范性实施例的详细描述,本发明的上述及其它方面将变得更加明显,其中:
图1示出了根据现有技术的多视图图像的序列;
图2是示出了根据本发明的示范性实施例的用于编码多视图图像的装置的框图;
图3示出了根据本发明的示范性实施例的多视图图像的序列的时间级别(temporallevel);
图4A示出了根据本发明的示范性实施例的多视图图像的序列;
图4B示出了根据本发明的示范性实施例的多视图图像的序列和它们的时间级别;
图5示出了根据本发明的示范性实施例的网络提取层(NAL)单元报头的语法;
图6A和6B示出了根据本发明的示范性实施例的序列参数集的语法;
图6C和6D示出了根据本发明的示范性实施例的补充增强信息(SEI)消息的语法;
图7是根据本发明的示范性实施例的编码多视图图像的方法的流程图;
图8是根据本发明的另一个示范性实施例的编码多视图图像的方法的流程图;
图9是示出了根据本发明的示范性实施例的用于解码多视图图像的装置的框图;以及
图10是根据本发明的示范性实施例的解码多视图图像的方法的流程图。
具体实施方式
根据本发明的一方面,提供一种编码多视图图像的方法。该方法包括:确定包括在该多视图图像的序列(以下将被称为多视图图像序列)中的每个图片是否为被包括在该多视图图像序列中的其它图片参考用于视图间预测的参考图片;以及基于确定结果使用视图间预测和时间预测中的至少一个来编码该图片。
该图片的编码可以包括编码每个图片的参数,其指示每个图片是否为该参考图片。
根据本发明的另一方面,提供一种用于编码多视图图像的装置。该装置包括:确定单元,确定包括在该多视图图像序列中的每个图片是否为被包括在该多视图图像序列中的其它图片参考用于视图间预测的参考图片;以及编码单元,基于确定结果使用视图间预测和时间预测中的至少一个来编码该图片。
该编码单元可以基于该确定结果编码关于被每个图片参考以用于视图间预测和时间预测中的至少一个的参考图片的信息。
根据本发明的另一方面,提供一种解码多视图图像的方法。该方法包括:接收比特流,该比特流包括指示包括在多视图图像序列中的每个图片是否为被包括在该多视图图像序列中的其它图片参考以用于视图间预测的参考图片的信息和关于该多视图图像序列的数据;从接收到的比特流中提取该信息和关于该多视图图像序列的数据;以及基于提取的信息解码该关于多视图图像序列的数据。
该信息可以包括在每个图片的参数中。
根据本发明的另一方面,提供一种用于解码多视图图像的装置。该装置包括:提取单元,接收比特流,该比特流包括指示包括在多视图图像序列中的每个图片是否为被包括在该多视图图像序列中的其它图片参考以用于视图间预测的参考图片的信息和关于该多视图图像序列的数据,以及从接收到的比特流中提取该信息和关于该多视图图像序列的数据;以及解码单元,基于提取的信息解码该关于多视图图像序列的数据。
根据本发明的另一方面,提供一种编码多视图图像的方法。该方法包括:基于时间级别从多视图图像序列中选择要使用视图间预测和时间预测编码的图片;以及使用视图间预测和时间预测编码所选择的图片,并且使用视图间预测和时间预测中的一个来编码包括在该多视图图像序列中的其余图片。
所述选择图片可以包括从包括在该多视图图像序列中的所有图片当中选择时间级别小于预定值的非锚图片。
所述编码选择的图片可以包括编码关于选择的图片的信息。
根据本发明的另一方面,提供一种用于编码多视图图像的装置。该装置包括:选择单元,基于时间级别从多视图图像序列中选择要被使用视图间预测和时间预测编码的图片;以及编码单元,使用视图间预测和时间预测编码所选择的图片,并且使用视图间预测和时间预测中的一个来编码包括在该多视图图像序列中的其余图片。
根据本发明的另一方面,提供一种解码多视图图像的方法。该方法包括:接收比特流,该比特流包括关于多视图图像序列中使用视图间预测和时间预测编码的图片的信息和关于该多视图图像序列的数据;从接收到的比特流中提取该信息;以及基于所提取的信息来解码关于该多视图图像序列的数据。
该信息可以包括在序列参数中或补充增强信息(SEI)消息中。
根据本发明的另一方面,提供一种用于解码多视图图像的装置。该装置包括:提取单元,接收比特流,该比特流包括关于多视图图像序列中使用视图间预测和时间预测编码的图片的信息和关于该多视图图像序列的数据,以及从接收到的比特流中提取该信息;以及解码单元,基于所提取的信息来解码关于该多视图图像序列的数据。
根据本发明的另一方面,提供一种计算机可读记录介质,其上记录有用于执行编码多视图图像的方法和解码多视图图像的方法的程序。
在下文中,将参考附图详细描述本发明的示范性实施例。应当注意,相似的参考数字指代一个或多个附图中所示的相似的元件。在本发明的以下描述中,为了简明清楚,将略去合并于此的已知功能和配置的详细说明。
图2是示出了根据本发明的示范性实施例的用于编码多视图图像的装置200的框图。
参考图2,装置200包括控制单元210和编码单元220。
根据本发明的示范性实施例,控制单元210确定包括在多视图图像的序列(以下将被称为多视图图像序列)中的图片是否为被包括在该多视图图像序列中的其它图片参考以用于视图间预测的参考图片。
使用时间上相邻的图片之间的时间相关性和相邻的视图中的图片之间的空间相关性来预测编码多视图图像序列。多视图图像序列中的一些可以具有高的时间相关性和低的空间相关性。在这种情况下,对于如图1所示的所有非锚图片使用空间相关性进行的视图间预测仅仅增加了多视图图像编码所需的时间,而并未有助于压缩率的改善。
因而,根据本发明的示范性实施例的用于编码多视图图像的装置200通过仅仅对一些非锚图片执行视图间预测而不是对所有非锚图片执行视图间预测来执行预测编码。为此,控制单元210确定包括在多视图图像序列中的每个图片是否充当用于视图间预测的参考图片。换句话说,控制单元210确定每个图片是否被其它图片参考以通过视图间预测进行预测编码。
根据本发明的另一个示范性实施例,控制单元210基于时间级别从多视图图像序列中选择要被使用视图间预测和时间预测编码的图片。控制单元210选择哪一个图片将被使用视图间预测编码,而不是确定每个图片是否被其它图片参考以用于视图间预测。根据现有技术,使用视图间预测和时间预测来预测编码所有非锚图片。但是,根据本发明,为了使用视图间预测编码仅仅一些非锚图片,基于时间级别从多视图图像序列中选择要被使用视图间预测和时间预测编码的图片。
时间级别是用于通过将图像序列分割成多个电平(level)来提供时间可分级的参数,以便使得在图像解码期间仅仅选择一些电平并解码,下面将参考图3进行详细描述。
图3示出了根据本发明的示范性实施例的多视图图像序列的时间级别。
参考图3,多视图图像序列中的锚图片310和312的时间级别为‘0’。插入在锚图片310和锚图片312之间的图片314的时间级别为‘1’。插入在时间级别为‘0’的图片和时间级别为‘1’的图片之间的图片316和318的时间级别为‘2’。多视图图像序列的其余图片的时间级别为‘3’。
图4A示出了根据本发明的示范性实施例的多视图图像序列。
图4A所示的多视图图像序列是通过控制单元210确定包括在多视图图像序列中的每个图片是否被参考以用于视图间预测或通过控制单元210选择要被使用视图间预测和时间预测编码的图片来产生的。因而,图4A所示的多视图图像序列不同于根据图1所示的现有技术的多视图图像序列。
例如,在根据图1所示的现有技术的多视图图像序列中,第二行和第二列中的图片144参考第一行和第二列中的图片145以及第三行和第二列中的图片146用于视图间预测。换句话说,第一行和第二列中的图片145以及第三行和第二列中的图片146为用于图片144的视图间预测的参考图片。
但是,在根据图4A所示的本发明的示范性实施例的多视图图像中,第二行和第二列中的图片420不参考第一行和第二列中的图片422以及第三行和第二列中的图片用于视图间预测。取而代之,图片420仅参考第二行和第三列中的图片426以及第二行和第一列中的图片428用于时间预测。
在根据图1所示的现有技术的多视图图像序列中,非锚图片当中的所有奇数行的图片被其它图片参考用于视图间预测。但是,在根据图4A所示的本发明的示范性实施例的多视图图像序列中,非锚图片当中的奇数行的图片中的仅仅一些被其它图片参考用于视图间预测。换句话说,在图4A中,奇数行的非锚图片当中的仅仅奇数列的非锚图片使用视图间预测来编码。
图4B示出了根据本发明的示范性实施例的多视图图像序列和时间级别。
现在将参考图4B来描述选择包括在多视图图像序列中的一些图片以用于如图4A所示的使用视图间预测来编码仅仅选择的图片的方式。
在图4B中,基于时间级别来确定要被参考以用于视图间预测的图片。在图4B中,确定时间级别‘3’中的非锚图片不使用视图间预测来编码。换句话说,从非锚图片当中仅仅选择时间级别小于预定值的图片来使用视图间预测和时间预测编码。
充当控制单元210的确定或选择的准则的时间级别根据多视图图像序列的特征而变化,不局限于图4B所示的那些。例如,当由于拍摄多视图图像的照相机之间的距离很大导致视图之间的空间相关性不高时,没有必要使用视图间预测来预测所有非锚图片。在这种情况下,可以使用视图间预测仅仅预测时间级别为1或更小的图片,以及在极端情况下,可以不使用视图间预测来预测非锚图片。
反回来参考图2,根据本发明的示范性实施例,编码单元220基于控制单元210的确定或选择结果来编码多视图图像序列。换句话说,编码单元220基于控制单元210的确定或选择结果使用视图间预测和时间预测中的至少一个来预测编码该多视图图像序列。
编码单元220预测包括在多视图图像序列中的每个图片,并从原始图片中减去每个图片的预测值,从而产生多视图图像序列的残差数据。
为了预测,编码单元220将参考图片存储在预定存储器中,并通过参考存储的参考图片来执行视图间预测或时间预测。根据现有技术,当预测非锚图片时,用于视图间预测和时间预测的所有图片应当被存储在该存储器中。但是,根据本发明,对于由控制单元210确定不使用视图间预测编码的图片,没有必要将用于视图间预测的参考图片存储在该存储器中。
例如,为了编码图4A中第二行和第二列中的图片420,位于与图片420的视图相邻的视图处且在图片420之上和之下的图片422和424不是用于视图间预测的参考图片,因而不需要被存储在存储器中,从而使得能够有效利用存储器。
由控制单元210确定不被参考用于视图间预测的图片不被参考用于视图间预测,从而加速了预测。
反回来参考图2,根据本发明的示范性实施例,当编码单元220预测编码多视图图像序列时,它也编码指示控制单元210的关于每个图片是否为用于视图间预测的参考图片的确定结果的参数,并且将编码的参数插入到比特流中。一旦控制单元210确定每个图片是否被参考用于视图间预测,则编码单元220编码关于控制单元210的确定结果的信息。
由于执行确定以确定每个图片是否被其它图片参考用于视图间预测,因此在每个图片的参数中包括关于每个图片是否被其它图片参考用于视图间预测的信息。
图5示出了根据本发明的示范性实施例的网络提取层(NAL)单元报头的语法。
NAL单元是图像数据的分组化的单位。由于一个NAL单元一般包括关于单个图片的数据,因此在NAL单元报头中包括关于每个图片是否被其它图片参考用于视图间预测的信息,以便被编码。
参考图5,根据现有技术,将语法元素‘nal_ref_idc_view’添加到NAL单元报头,从而指示每个图片是否被其它图片参考以用于视图间预测。例如,‘nal_ref_idc_view=l’意思是相应的图片被其它图片参考用于视图间预测,以及‘nal_ref_idc_view=0’意思是该图片不被其它图片参考用于视图间预测。
由于新的比特分配给‘nal_ref_idc_view’,因此也添加语法元素‘reserved_zero_four_bits’以改变预留比特的数目。
反回来参考图2,当编码单元220执行编码时,它也编码关于被每个图片参考以用于视图间预测和时间预测的参考图片的信息。语法元素‘RefPicList’指示这样的信息。由于控制单元210确定是否每个图片充当用于视图间预测的参考图片,因此当编码单元220编码多视图图像序列时,不充当参考图片用于视图间预测的图片不被其它图片参考。
因而,当编码单元220编码关于用于每个图片的参考图片的信息时,它可以产生‘RefPicList’,以排除由控制单元210确定为不被参考用于视图间预测的图片。
例如,当根据现有技术编码图4A所示的图片420时,在与图片420的视图相邻的视图处、位于图片420之上和之下的图片422和424是参考图片,以及关于图片422和424的信息包括在‘RefPicList’中。但是,根据本发明的示范性实施例,关于由控制单元210确定为不是图片420的参考图片的图片422和424的信息不包括在‘RefPicList’中。
根据本发明的另一个示范性实施例,编码单元220也编码关于由控制单元210选择的要使用视图间预测和时间预测编码的图片的信息,并且将编码的信息插入到比特流中,下面将参考图6A和6B进行详细描述。
图6A示出了根据本发明的示范性实施例的序列参数集的语法。
参考图6A,编码单元220可以在序列参数集中包括用于指明由控制单元210选择的图片的信息并且编码该序列参数集。根据本发明的序列参数集包括语法元素‘temporal_level_max’和语法元素‘use_interview_pred_temporal_level[i]’。
‘temporal_level_max’是指示由用于编码多视图图像的装置200编码的多视图图像序列的不同时间级别的数目的信息。图3B所示的多视图图像序列具有从‘0’到‘3’的时间级别,因而‘temporal_level_max’为‘3’。
‘use_interview_pred_temporal_level[i]’是用于指明要使用视图间预测和时间预测预测编码的图片的信息。当仅仅对如图4B所示的时间级别为‘1’或‘2’的图片执行视图间预测时,‘use_interview_pred_temporal_level[1]’为‘1’,以及‘use_interview_pred_temporal_level[2]’为‘1’。
‘use_interview_pred_temporal_level[3]’可以被设置为‘0’。值‘0’和‘1’为指示是否使用视图间预测来预测相应时间级别的图片的标志信息。
时间级别为‘0’的图片是锚图片。由于仅仅使用视图间预测来预测编码锚图片,因此不单独设置‘use_interview_pred_temporal_level[0]’。
图6B示出了根据本发明的另一个示范性实施例的序列参数集的语法。
在图4B中,控制单元210基于时间级别选择要被使用视图间预测和时间预测进行预测编码的图片。换句话说,特定时间级别的图片不被时间预测。但是,也可以基于视图以及时间级别来选择那些图片。
例如,视图1的多视图图像序列的图片当中的时间级别为‘1’或‘2’的图片被视图间预测和时间预测,以及视图3的多视图图像序列的图片当中的时间级别为1的图片被视图间预测和时间预测。换句话说,对于每个视图单独地选择要被视图间预测和时间预测的图片。在这种情况下,需要用于指明对于每个视图的选择的图片的语法元素。
参考图6B,序列参数集包括语法元素‘temporal_level_max’和‘use_interview_pred_temporal_level[i][j]’。
‘temporal_level_max’与图6A所示的‘temporal_level_max’相同,但是‘use_interview_pred_temporal_level[i][j]’不同于图6A所示的‘use_interview_pred_temporal_level[i]’。
在‘use_interview_pred_temporal_level[i][j]’中,‘i’指示视图,‘j’指示时间级别。如上所述,假定视图1的多视图图像序列的图片当中的时间级别为‘1’或‘2’的图片被视图间预测和时间预测,以及视图3的多视图图像序列的图片当中的时间级别为‘1’的图片被视图间预测和时间预测。
在这种情况下,‘use_interview_pred_temporal_level[1][1]’为‘1’,‘use_interview_pred_temporal_level[1][2]’为‘1’,‘use_interview_pred_temporal_level[1][3]’为‘0’,‘use_interview_pred_temporal_level[3][1]’为‘1’,‘use_interview_pred_temporal_level[3][2]’为‘0’,以及‘use_interview_pred_temporal_level[3][3]’为‘0’。值‘0’和‘1’为指示相应视图的多视图图像序列中相应时间级别的图片是否使用视图间预测来预测的标志信息,如图6A所示。
图6C示出了根据本发明的示范性实施例的补充增强信息(SEI)消息。
参考图6C,编码单元220可以在SEI消息中包括用于指明由控制单元210选择的图片的信息并且编码该SEI消息。
SEI消息是解码视频编码层所需的附加信息,以及可以包括每个图片的定时信息、关于pan/scan功能的信息、和随机存取所需的信息。SEI消息也可以包括用户单独定义的信息。根据本发明的示范性实施例的SEI消息包括用于指明由控制单元210选择的用于视图间预测的图片的信息。
在图6C中,‘temporal_level_max’和‘use_interview_prediction_temporal_level[i]’与图6A的相同。
图6D示出了根据本发明的另一个示范性实施例的SEI消息。
在图6D中,‘temporal_level_max’和‘use_interview_prediction_temporal_level[i][j]’与图6B的相同。
图7是示出了根据本发明的示范性实施例的编码多视图图像的方法的流程图。
参考图7,在操作710,图2所示的用于编码多视图图像的装置200确定包括在多视图图像序列中的每个图片是否是用于视图间预测的参考图片。换句话说,确定每个图片是否被包括在该多视图图像序列中的其它图片参考用于视图间预测。
在根据本发明的示范性实施例的编码多视图图像的方法中,使用视图间预测来预测仅仅一些非锚图片,而不是使用视图间预测来预测编码所有非锚图片。因而,仅仅一些图片被其它图片参考用于视图间预测。为此,在操作710中确定是否每个图片被其它图片参考用于视图间预测。可以基于时间级别来确定用于视图间预测的参考图片。
在操作720,装置200基于操作710的确定,使用视图间预测和时间预测中的至少一个来编码多视图图像序列中的图片。
使用视图间预测和时间预测中的至少一个来预测多视图图像序列中的每个图片,并且从原始图片中减去每个图片的预测值,从而产生多视图图像序列的残差数据。
不用参考在操作710中确定为不是用于视图间预测的参考图片的图片而执行视图间预测,从而加速了预测并且使得能够高效使用存储器。
在多视图图像序列编码中,关于在操作710中确定为用于视图间预测的参考图片的图片的信息也被编码并且被插入到比特流中。更具体地说,将指示每个图片是否为用于视图间预测的参考图片的信息插入到每个图片的参数中。该信息可以包括在NAL单元报头中以便被编码,如上所述。
图8是示出了根据本发明的另一个示范性实施例的编码多视图图像的方法的流程图。
参考图8,在操作810,图2所示的用于编码多视图图像的装置200基于时间级别选择要被使用视图间预测和时间预测编码的图片。装置200也可以对于多视图图像序列的每个视图,选择要被使用视图间预测和时间预测编码的图片。更具体地说,时间级别小于预定值的非锚图片被选择作为要被使用视图间预测和时间预测编码的图片。
在操作820,装置200基于操作810的选择结果来编码多视图图像序列。更具体地说,使用视图间预测和时间预测来预测编码在操作810中选择的图片,以及使用视图间预测和时间预测中的一个来预测编码多视图图像序列中的其余图片。根据现有技术使用视图间预测和时间预测来预测编码多视图图像序列中的所有非锚图片,而根据本发明的示范性实施例,则使用视图间预测和时间预测来预测编码非锚图片中的仅仅一些图片,从而加速了多视图图像编码。
在多视图图像序列编码期间,关于在操作810中选择用于视图间预测的图片的信息也被编码并被插入到比特流中。如前所述,该信息可以按照序列参数或SEI消息的形式被编码并被插入到比特流中。
图9是示出了根据本发明的示范性实施例的用于解码多视图图像的装置900的框图。
参考图9,装置900包括提取单元910和解码单元920。
提取单元910接收比特流,该比特流包括关于通过根据本发明的编码多视图图像的方法编码的多视图图像序列的数据。这里,关于多视图图像序列的数据是多视图图像序列的残差数据,以及该比特流包括关于多视图图像序列中的每个图片是否为用于视图间预测的参考图片的信息或关于每个图片是否已被视图间预测和时间预测编码的信息。
在接收到比特流后,提取单元910从接收的比特流中提取信息。更具体地说,提取单元910提取指示每个图片是用于视图间预测的参考图片的参数或指示每个图片已被使用视图间预测和时间预测编码的参数。优选地,但不是必须地,提取单元910提取包括在NAL单元报头、序列参数或SEI消息中的信息。
解码单元920基于提取单元910提取的信息解码关于多视图图像序列的数据。包括在比特流中的关于多视图图像序列的数据是多视图图像序列的残差数据。
因而,解码单元920基于提取单元910提取的信息,使用视图间预测和时间预测中的至少一个,来预测多视图图像序列中的每个图片,并且将预测结果添加到多视图图像序列的残差数据中,从而重构多视图图像序列。
为了预测,解码单元920将参考图片存储在预定存储器中并执行预测。但是,对于视图间预测,装置900基于提取单元910提取的信息,在存储器中不存储不是用于视图间预测的参考图片的图片。因而,在预测期间降低了要被存储在存储器中的参考图片的数目,从而使得能够有效地利用存储器。
此外,不是所有的非锚图片都被视图间预测,从而提高了预测速度。此外,可以进行快速的随机存取。例如,当图4A中第二行和第二列中的图片420被随机存取时,不必要解码位于与图片420的视图相邻的视图处且在图片420之上和之下的图片422和424,因为已经确定它们不是用于视图间预测的参考图片。因而,可以进行快速的预测和随机存取。
图10是根据本发明的示范性实施例的解码多视图图像的方法的流程图。
参考图10,在操作1010,图9中用于解码多视图图像的装置900接收包括关于多视图图像序列的数据的比特流。关于多视图图像序列的数据是多视图图像序列的残差数据。
在操作1020,装置900从接收的比特流中提取指示包括在多视图图像序列中的每个图片是否为用于视图间预测的参考图片的信息或指示每个图片是否已被使用视图间预测和时间预测编码的信息。也提取关于该多视图图像序列的数据,即残差数据。为此,可以提取包括在NAL单元报头、序列参数或SEI消息中的信息。
在操作1030,装置900基于在操作1020中提取的信息来解码多视图图像序列。更具体地说,基于提取的信息使用视图间预测和时间预测中的至少一个来预测多视图图像序列,并且将在操作1020中提取的残差数据添加到预测结果,从而重构多视图图像序列。
同时,本发明的示范性实施例可以被写为计算机程序并且可以被使用计算机可读记录介质或其它传输介质执行该程序的通用数字计算机实现。计算机可读记录介质的例子包括磁存储介质(例如,ROM、软盘、硬盘等)和光记录介质(例如,CD-ROM、或DVD)。其它传输介质可以包括载波(例如,通过互联网的传输)。计算机可读记录介质也可以被分布在网络耦合的计算机系统之上以使得计算机可读代码以分布式被存储和执行。
尽管已经参考本发明的示范性实施例对本发明进行了具体图示和描述,但是本领域技术人员应当理解,在不脱离由以下权利要求书所定义的本发明的精神和范围的情况下,可以对本发明做出形式和细节上的各种修改。
Claims (2)
1.一种用于解码多视图图像的装置,该装置包括:
提取单元,接收比特流,该比特流包括指示多视图图像序列中包括的一个视图图像序列中的图片是否是被多视图图像序列中包括的另一个视图图像序列中的其它图片参考以用于基于多视图图像序列的视图间预测的参考图片的信息以及关于该多视图图像序列的数据;其中,仅在多视图图像序列中包括的图片中的一些图片上执行通过执行视图间预测的预测编码,以及从接收到的比特流中提取该信息和关于该多视图图像序列的数据;以及
解码单元,基于所提取的信息来解码关于该多视图图像序列的数据,
其中,所述信息是用于每一图片的网络提取层NAL单元报头,以及
其中作为被另一个视图图像序列中的其它图片参考以用于视图间预测的参考图片的图片被包括在参考图片列表中,并且不是被另一个视图图像序列中的其它图片参考以用于视图间预测的参考图片的图片不被包括在参考图片列表中。
2.如权利要求1所述的装置,其中该信息包括在序列参数中或补充增强信息SEI消息中。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US90761407P | 2007-04-11 | 2007-04-11 | |
US60/907,614 | 2007-04-11 | ||
US90775307P | 2007-04-16 | 2007-04-16 | |
US60/907,753 | 2007-04-16 | ||
KR1020070065664A KR101301181B1 (ko) | 2007-04-11 | 2007-06-29 | 다시점 영상의 부호화, 복호화 방법 및 장치 |
KR10-2007-0065664 | 2007-06-29 | ||
KR10-2007-0068186 | 2007-07-06 | ||
KR1020070068186A KR100996850B1 (ko) | 2007-04-11 | 2007-07-06 | 다시점 영상의 부호화, 복호화 방법 및 장치 |
CN200880019798.7A CN101682779B (zh) | 2007-04-11 | 2008-03-06 | 编码和解码多视图图像的方法和装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880019798.7A Division CN101682779B (zh) | 2007-04-11 | 2008-03-06 | 编码和解码多视图图像的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102984515A CN102984515A (zh) | 2013-03-20 |
CN102984515B true CN102984515B (zh) | 2016-03-09 |
Family
ID=40152508
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210390787.8A Active CN102892003B (zh) | 2007-04-11 | 2008-03-06 | 用于解码多视图图像的装置 |
CN201210389146.0A Active CN102984515B (zh) | 2007-04-11 | 2008-03-06 | 用于解码多视图图像的装置 |
CN201210389751.8A Active CN102984516B (zh) | 2007-04-11 | 2008-03-06 | 编码多视图图像的方法及装置 |
CN200880019798.7A Active CN101682779B (zh) | 2007-04-11 | 2008-03-06 | 编码和解码多视图图像的方法和装置 |
CN201210390786.3A Active CN102892002B (zh) | 2007-04-11 | 2008-03-06 | 解码多视图图像的方法 |
CN201210389088.1A Active CN102984514B (zh) | 2007-04-11 | 2008-03-06 | 解码多视图图像的方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210390787.8A Active CN102892003B (zh) | 2007-04-11 | 2008-03-06 | 用于解码多视图图像的装置 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210389751.8A Active CN102984516B (zh) | 2007-04-11 | 2008-03-06 | 编码多视图图像的方法及装置 |
CN200880019798.7A Active CN101682779B (zh) | 2007-04-11 | 2008-03-06 | 编码和解码多视图图像的方法和装置 |
CN201210390786.3A Active CN102892002B (zh) | 2007-04-11 | 2008-03-06 | 解码多视图图像的方法 |
CN201210389088.1A Active CN102984514B (zh) | 2007-04-11 | 2008-03-06 | 解码多视图图像的方法 |
Country Status (6)
Country | Link |
---|---|
EP (5) | EP2464119B1 (zh) |
JP (7) | JP2010524381A (zh) |
KR (6) | KR101301181B1 (zh) |
CN (6) | CN102892003B (zh) |
MX (1) | MX2009010933A (zh) |
SG (6) | SG179464A1 (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101301181B1 (ko) * | 2007-04-11 | 2013-08-29 | 삼성전자주식회사 | 다시점 영상의 부호화, 복호화 방법 및 장치 |
KR101158491B1 (ko) | 2008-12-08 | 2012-06-20 | 한국전자통신연구원 | 다시점 영상 부호화, 복호화 방법 및 그 장치. |
JP5614900B2 (ja) * | 2009-05-01 | 2014-10-29 | トムソン ライセンシングThomson Licensing | 3d映像符号化フォーマット |
US8780999B2 (en) * | 2009-06-12 | 2014-07-15 | Qualcomm Incorporated | Assembling multiview video coding sub-BITSTREAMS in MPEG-2 systems |
US8411746B2 (en) | 2009-06-12 | 2013-04-02 | Qualcomm Incorporated | Multiview video coding over MPEG-2 systems |
US20130162774A1 (en) | 2010-09-14 | 2013-06-27 | Dong Tian | Compression methods and apparatus for occlusion data |
WO2012096176A1 (en) | 2011-01-12 | 2012-07-19 | Panasonic Corporation | Methods and apparatuses for encoding and decoding video using multiple reference pictures |
RU2480941C2 (ru) | 2011-01-20 | 2013-04-27 | Корпорация "Самсунг Электроникс Ко., Лтд" | Способ адаптивного предсказания кадра для кодирования многоракурсной видеопоследовательности |
WO2012108181A1 (en) * | 2011-02-08 | 2012-08-16 | Panasonic Corporation | Methods and apparatuses for encoding and decoding video using multiple reference pictures |
US9105076B2 (en) | 2011-03-08 | 2015-08-11 | Sony Corporation | Image processing apparatus, image processing method, and program |
KR101626683B1 (ko) * | 2011-08-30 | 2016-06-01 | 인텔 코포레이션 | 멀티뷰 비디오 코딩 방안 |
KR102057194B1 (ko) * | 2012-01-19 | 2019-12-19 | 삼성전자주식회사 | 시점 변환을 위한 다시점 비디오 예측 방법 및 그 장치, 시점 변환을 위한 다시점 비디오 예측 복원 방법 및 그 장치 |
WO2013115562A1 (ko) * | 2012-01-30 | 2013-08-08 | 삼성전자 주식회사 | 시점변환을 위한 예측구조에 기초한 다시점 비디오 부호화 방법 및 그 장치, 시점변환을 위한 예측구조에 기초한 다시점 비디오 복호화 방법 및 그 장치 |
JP5743968B2 (ja) * | 2012-07-02 | 2015-07-01 | 株式会社東芝 | 動画像復号方法及び動画像符号化方法 |
CA2892477C (en) * | 2012-12-04 | 2020-12-22 | Sectago Gmbh | Security device |
WO2014092445A2 (ko) * | 2012-12-11 | 2014-06-19 | 엘지전자 주식회사 | 영상 복호화 방법 및 이를 이용하는 장치 |
BR112015017059A2 (pt) * | 2013-01-17 | 2018-09-25 | Samsung Electronics Co., Ltd. | método decodificador de vídeo, método codificador de vídeo, aparelho decodificador de vídeo, aparelho codificador de vídeo, e mídia de gravação legível por computador. |
FR3042368A1 (fr) * | 2015-10-08 | 2017-04-14 | Orange | Procede de codage et de decodage multi-vues, dispositif de codage et de decodage multi-vues et programmes d'ordinateur correspondants |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100760258B1 (ko) * | 2004-12-10 | 2007-09-19 | 한국전자통신연구원 | 범용적 다시점 동영상 부호화/복호화 장치 및 방법 |
US7728878B2 (en) * | 2004-12-17 | 2010-06-01 | Mitsubishi Electric Research Labortories, Inc. | Method and system for processing multiview videos for view synthesis using side information |
KR100779875B1 (ko) * | 2005-01-14 | 2007-11-27 | 주식회사 휴맥스 | 다-시점 코딩을 위한 참조 프레임 순서 설정 방법 및 그방법을 기록한 기록매체 |
KR100732961B1 (ko) * | 2005-04-01 | 2007-06-27 | 경희대학교 산학협력단 | 다시점 영상의 스케일러블 부호화, 복호화 방법 및 장치 |
US8228994B2 (en) * | 2005-05-20 | 2012-07-24 | Microsoft Corporation | Multi-view video coding based on temporal and view decomposition |
KR100728009B1 (ko) | 2005-08-22 | 2007-06-13 | 삼성전자주식회사 | 다시점 동영상을 부호화하는 방법 및 장치 |
US8559515B2 (en) * | 2005-09-21 | 2013-10-15 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-view video |
KR101174901B1 (ko) * | 2005-11-28 | 2012-08-17 | 세종대학교산학협력단 | 다시점 영상에서 적응적 움직임 벡터 예측 장치 및 방법 |
US7903737B2 (en) * | 2005-11-30 | 2011-03-08 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for randomly accessing multiview videos with known prediction dependency |
PL2008460T3 (pl) * | 2006-03-30 | 2017-10-31 | Lg Electronics Inc | Sposób i urządzenie do dekodowania/kodowania sygnału wideo |
KR20070098429A (ko) * | 2006-03-30 | 2007-10-05 | 엘지전자 주식회사 | 비디오 신호의 디코딩 방법 |
KR20080007086A (ko) * | 2006-07-14 | 2008-01-17 | 엘지전자 주식회사 | 비디오 신호의 디코딩/인코딩 방법 및 장치 |
KR101301181B1 (ko) * | 2007-04-11 | 2013-08-29 | 삼성전자주식회사 | 다시점 영상의 부호화, 복호화 방법 및 장치 |
JP5660904B2 (ja) * | 2011-01-19 | 2015-01-28 | 株式会社平和 | 遊技機の基板ユニット |
-
2007
- 2007-06-29 KR KR1020070065664A patent/KR101301181B1/ko not_active IP Right Cessation
- 2007-07-06 KR KR1020070068186A patent/KR100996850B1/ko active IP Right Grant
-
2008
- 2008-03-06 SG SG2012017091A patent/SG179464A1/en unknown
- 2008-03-06 CN CN201210390787.8A patent/CN102892003B/zh active Active
- 2008-03-06 EP EP12153703.9A patent/EP2464119B1/en active Active
- 2008-03-06 EP EP12153708.8A patent/EP2464123B1/en active Active
- 2008-03-06 JP JP2010502926A patent/JP2010524381A/ja active Pending
- 2008-03-06 MX MX2009010933A patent/MX2009010933A/es active IP Right Grant
- 2008-03-06 EP EP12153707.0A patent/EP2464122B1/en active Active
- 2008-03-06 CN CN201210389146.0A patent/CN102984515B/zh active Active
- 2008-03-06 SG SG2012017059A patent/SG179461A1/en unknown
- 2008-03-06 CN CN201210389751.8A patent/CN102984516B/zh active Active
- 2008-03-06 EP EP12153706.2A patent/EP2464121B1/en active Active
- 2008-03-06 SG SG2012017109A patent/SG179465A1/en unknown
- 2008-03-06 SG SG2012017067A patent/SG179462A1/en unknown
- 2008-03-06 SG SG2012017125A patent/SG179467A1/en unknown
- 2008-03-06 SG SG2012017117A patent/SG179466A1/en unknown
- 2008-03-06 EP EP12153705.4A patent/EP2464120B1/en active Active
- 2008-03-06 CN CN200880019798.7A patent/CN101682779B/zh active Active
- 2008-03-06 CN CN201210390786.3A patent/CN102892002B/zh active Active
- 2008-03-06 CN CN201210389088.1A patent/CN102984514B/zh active Active
-
2010
- 2010-08-12 KR KR1020100077821A patent/KR101144874B1/ko active IP Right Grant
- 2010-10-21 KR KR1020100103141A patent/KR101217635B1/ko active IP Right Grant
- 2010-10-21 KR KR1020100103140A patent/KR101266169B1/ko active IP Right Grant
-
2012
- 2012-01-11 KR KR1020120003241A patent/KR101266170B1/ko active IP Right Grant
- 2012-03-14 JP JP2012057575A patent/JP5667110B2/ja not_active Expired - Fee Related
- 2012-03-14 JP JP2012057576A patent/JP2012124961A/ja active Pending
- 2012-03-14 JP JP2012057574A patent/JP2012147471A/ja active Pending
- 2012-03-14 JP JP2012057573A patent/JP2012124959A/ja active Pending
- 2012-03-14 JP JP2012057572A patent/JP2012165403A/ja active Pending
- 2012-03-14 JP JP2012057571A patent/JP5647161B2/ja not_active Expired - Fee Related
Non-Patent Citations (3)
Title |
---|
Hannuksela and Miska;Li,Houqiang.ON MVC reference.picture.marking.《Joint Video Team(JVT) of ISO/IEC MPEG& ITU-T VCEG(ISO/IECJTC1/SC29/WG11 and ITU-T SG16 Q.6) JVT-V044》.http://wftp3.itu.int/av-arch/jvt-site/2007_01_marrakech/JVT-V044.zip3.,2007,图1、3及相关文字部分. * |
Joint Draft 2.0 on Multiview Video.Coding;Vetro,Anthony et al.;《Joint Video Team (JVT) of ISO/IEC MPEG& ITU-T VCEG. (ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6) JVT-V209》;http://wftp3.itu.int/av-arch/jvt-site/2007_01_Marrakech/JVT-V209..zip.;20070306;全文 * |
MVC Reference Picture Management;Chen,Ying;Wang,Ye-Kui;Hannuksela,Miska.;《JOINT VIDEO TEAM (JVT) of ISO/IEC MPEG& ITU-T VCEG. (ISO/IECJTC1/SC29/WG11.) and ITU-T SG 16 Q.6.JVT-U》;http://wftp3.itu.int/av-arch/jvt-site/2006_10_Hangzhou/JVT-U105.zip2.;20061020;图1、3及相关文字部分 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102984515B (zh) | 用于解码多视图图像的装置 | |
US9088779B2 (en) | Method and apparatus for encoding and decoding and multi-view image |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |