CN106105218A - 在3d视频编码中处理相机参数的方法和设备 - Google Patents

在3d视频编码中处理相机参数的方法和设备 Download PDF

Info

Publication number
CN106105218A
CN106105218A CN201580011518.8A CN201580011518A CN106105218A CN 106105218 A CN106105218 A CN 106105218A CN 201580011518 A CN201580011518 A CN 201580011518A CN 106105218 A CN106105218 A CN 106105218A
Authority
CN
China
Prior art keywords
camera parameter
scale
value
grammer
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580011518.8A
Other languages
English (en)
Other versions
CN106105218B (zh
Inventor
柳先美
南廷学
芮世薰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN106105218A publication Critical patent/CN106105218A/zh
Application granted granted Critical
Publication of CN106105218B publication Critical patent/CN106105218B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/194Transmission of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0085Motion estimation from stereoscopic image signals

Abstract

本发明涉及用于编码3D视频的设备和方法,按照本发明的解码方法,包括步骤:经由第一语法接收用于将深度值转换为视差值的相机参数;确定应用于先前片段或者图片的相机参数是否应用于当前片段或者图片;和如果相机参数应用于当前片段或者图片,则基于相机参数导出当前块的视差值。按照本发明,某个间隔的片段或者图片可以共享相同的相机参数,可以防止重叠信息的传输,并且可以改善编码效率。

Description

在3D视频编码中处理相机参数的方法和设备
技术领域
本发明涉及与视频编码相关的技术,尤其是,涉及用于在3维(3D)视频编码中处理相机参数的方法和装置。
背景技术
近年来,对高分辨率和高质量视频的需求已经在各种应用领域中增加。但是,视频数据的分辨率和质量变得越高,视频数据的量变得越大。
因此,当使用诸如现有的有线或者无线宽带线路的介质传送视频数据,或者视频数据被存储在现有的存储介质中时,传送成本及其存储成本增加。高效率的视频压缩技术能够被用于有效地传送、存储和再现高分辨率和高质量视频数据。
另一方面,随着处理高分辨率/大容量视频能力的实现,使用3D视频的数字广播服务已经作为下一代广播服务引起注意。3D视频能够使用多视图信道提供真实感觉和沉浸感觉。
3D视频可以在各种领域中使用,诸如自由视点视频(FVV)、自由视点TV(FTV)、3DTV、监视和家庭娱乐。
与单个视图视频不同,使用多视图的3D视频具有在具有相同的图片顺序计数(POC)的视图之间高的相关性。因为以多个邻近的相机拍摄相同的场景,即,多视图,多视图视频除视差和微小的照度差别之外,具有近似相同的信息,并且因此,差别视图在其间具有高的相关性。
因此,在不同的视图之间的相关性可以考虑用于编码/解码多视图视频,并且能够获得用于当前视图的编码和/或解码所需的信息。例如,能够参考在另一个视图中的块预测或者解码在当前视图中要解码的块。
发明内容
技术问题
本发明提供在3维(3D)视频编码中用于预测当前块的方法和装置。
本发明提供在3维(3D)视频编码中用于将深度值变换为视差值的方法和装置。
本发明提供在3D视频编码中用于在特定时段的片段或者图片之间共享相同的相机参数的方法和装置。
本发明提供用于避免当前重叠的相机参数传输的方法和装置。
技术方案
按照本发明的一个实施例,提供了一种3D解码方法。该解码方法包括:经由第一语法接收用于将深度值变换为视差值的相机参数,确定要应用于先前片段或者图片的相机参数应用于是否当前片段或者图片,和如果相机参数应用于当前片段或者图片,则基于相机参数导出用于当前块的视差值。
按照本发明的另一个实施例,提供了一种3D视频解码装置。该解码装置包括:解码器,用于经由第一语法接收用于将深度值变换为视差值的相机参数,和预测器,用于确定要应用于先前片段或者图片的相机参数是否应用于当前片段或者图片,和如果相机参数应用于当前片段或者图片,则基于相机参数导出用于当前块的视差值。
有益效果
按照本发明,基于在3维(3D)视频编码中接收的相机参数深度值可以被变换为视差值。
按照本发明,特定时段的片段或者图片能够共享相同的相机参数,从而能够避免重叠的信息传输,并且能够改善编码效率。
附图说明
图1简要地图示本发明可应用于的3维(3D)视频编码和解码处理。
图2简要地图示本发明可应用于的视频编码设备的结构。
图3简要地图示本发明可应用于的视频解码设备的结构。
图4a和图4b图示能够在本发明中使用的相机参数。
图5图示相对于多个相机参数集对于每个片段设置的参考目标相机参数集的示例。
图6是按照本发明的一个实施例简要地图示参数编码方法的流程图。
图7是按照本发明的一个实施例简要地图示参数解码方法的流程图。
具体实施方式
本发明可以以各种形式不同地修改,并且可以具有各种实施例,并且其特定的实施例将在附图和详细描述中说明。但是,这些实施例不意欲用于限制本发明。在以下的描述中使用的术语仅用于描述特定的实施例,但是不意欲用于限制本发明的技术精神。单数的表示包括复数的表示,只要其不同地清楚地读取。在本说明书中存在的术语,诸如“包括”和“具有”意欲用于表示在以下的描述中使用的特点、数目、步骤、操作、单元、部件或者其组合存在,并且因应该理解,不排除存在或者添加一个或多个不同的特点、数目、步骤、操作、元件、部件或者其组合的可能性。
另一方面,为了对不同的特定功能解释便利的目的,在本发明中描述的附图的元件被单独地绘制,并且不意欲该单元通过单独的硬件或者单独的软件实施。例如,在这些元件以外的两个或更多个元件可以被合并以形成单个元件,或者一个元件可以被分割为多个元件。不脱离本发明的概念,这些元件被组合和/或分割的实施例属于本发明的范围。
在下文中将参考伴随的附图详细描述本发明的实施例。此外,相同的参考数字被用于在整个附图表示相同的元件,并且对相同的元件相同的描述将被省略。
在本说明书中,图片通常地指的是表示特定时区的一个图像的单元,并且片段是在编码时构成图片的一部分的单元。一个图片可以由多个片段组成。选择性地,图片和片段可以与术语混合。
像素或者像元可以指的是构成一个图片(或者图像)的最小单位。此外,“采样”可以用作表示特定的像素值的术语。采样可以通常地表示像素的值,可以仅表示亮度分量的像素值,并且可以仅表示色度分量的像素值。
单元表示图像处理的基本单元。单元可以包括特定区域和与该区域相关的信息中的至少一个。可选地,单元可以与术语,诸如块、区域等等混合。在典型情形下,M×N块可以表示以M列和N行排列的一组采样或者变换系数。
图1简要地图示本发明可应用于的3维(3D)视频编码和解码过程。
参考图1,3D视频编码器可以编码视频图片、深度图和相机参数以输出比特流。
深度图可以由相对于相应的视频图片(纹理图片)的图片,在相机和对象之间的距离信息(深度信息)构成。例如,深度图可以是通过按照位深度标准化深度信息获得的图像。在这种情况下,深度图可以由没有色差表示记录的深度信息构成。深度图可以被称作深度图图片或者深度图片。
通常,到对象的距离和视差互相成反比。因此,表示视图间相关性的视差信息可以通过使用相机参数从深度图的深度信息导出。
与典型的彩色图像,即,视频图片(纹理图片)一起包括深度图和相机参数的比特流可以经由网络或者存储介质发送给解码器。
从解码器侧,比特流可以被接收以重建视频。如果在解码器侧使用3D视频解码器,则3D视频解码器可以从比特流解码视频图片、深度图和相机参数。对于多视图显示所需的视图可以基于解码的视频图片、深度图和相机参数合成。在这种情况下,如果使用中的显示器是立体显示器,则3D图像可以通过使用在重建的多个视图之中用于两个视图的图片显示。
如果使用立体视频解码器,则立体视频解码器可以从比特流中重建入要射到两只眼睛的两个图片。在立体显示中,立体图像可以通过使用者入射到左眼的左图像和入射到右眼的右图像的视图差或视差显示。当多视图显示器与立体视频解码器一起使用时,多视图可以通过基于重建的两个图片产生不同的视图显示。
如果使用2D解码器,则2D图像可以被重建以将图像输出到2D显示器。如果使用2D显示器,但是,3D视频解码器或者立体视频解码器用作解码器,则重建的图像的一个可以被输出到2D显示器。
在图1的结构中,视图合成可以在解码器侧执行,或者可以在显示器侧执行。此外,解码器和显示器可以是一个设备,或者可以是单独的设备。
虽然为了方便起见,在图1中所描述的是3D视频解码器和立体视频解码器以及2D视频解码器是单独的解码器,但一个解码设备可以执行3D视频解码、立体视频解码和2D视频解码的全部。此外,3D视频解码设备可以执行3D视频解码,立体视频解码设备可以执行立体视频解码,和2D视频解码设备可以执行2D视频解码。此外,多视图显示器可以输出2D视频,或者可以输出立体视频。
图2简要地图示本发明可应用于的视频编码设备的结构。
参考图2,视频编码设备200包括图片分解器205、预测器210、减法器215、变换器220、量化器225、重新排序器230、熵编码器235、去量化器240、反变换器245、加法器250、滤波器255和存储器260。
图片分解器205可以将输入图片分解为至少一个处理单元块。在这种情况下,处理单元块可以是编码单元块、预测单元块,或者变换单元块。作为编码的单元块,该编码单元块可以按照四树结构从最大的编码单元块分解。作为从编码单元块分割的块,该预测单元块可以是采样预测的单元块。在这种情况下,该预测单元块可以被划分为子块。该变换单元块可以是按照四树结构从编码单元块分解,并且可以是用于按照变换系数导出的单元块,或者用于从变换系数导出残留信号的单元块。
在下文中,编码单元块可以被称作编码块(CB)或者编码单元(CU),预测单元块可以被称作预测块(PB)或者预测单元(PU),并且变换单元块可以被称作变换块(TB)或者变换单元(TU)。
预测块或者预测单元可以指的是在图片中具有块形状的特定区域,并且可以包括预测采样的阵列。此外,变换块或者变换单元可以指的是在图片中具有块形状的特定区域,并且可以包括变换系数或者残留采样的阵列。
预测器210可以对处理目标块(在下文中,当前块)执行预测,并且可以产生包括用于当前块的预测采样的预测块。在预测器210中执行的预测的单元可以是编码块,或者可以是变换块,或者可以是预测块。
预测器210可以确定对于当前块适用内部预测还是中间预测。例如,预测器210可以确定以CU为单位适用内部预测还是中间预测。
在内部预测的情况下,预测器210可以基于在当前块所属的图片(在下文中,当前图片)中在当前块外面的参考采样导出用于当前块的预测采样。在这种情况下,预测器210可以基于平均值,或者当前块的邻近参考采样的内插导出预测采样(情形(i)),或者可以基于存在于特定的(预测)方向的参考采样作为在当前块的邻近参考采样之中的预测采样导出预测采样(情形(ii))。情形(i)可以被称作非定向的模式,并且情形(ii)可以被称作定向的模式。预测器210可以通过使用应用于邻近块的预测模式确定要应用于当前块的预测模式。
在中间预测的情况下,预测器210可以基于由在参考图片上的运动矢量指定的采样导出用于当前块的预测采样。预测器210可以通过适用跳过模式、合并模式和运动矢量预测(MVP)模式的任何一个导出用于当前块的预测采样。在跳过模式和合并模式的情况下,预测器210可以将邻近块的运动信息用作当前块的运动信息。在跳过模式的情况下,与合并模式不同,不发送在预测采样和原始采样之间的差值(残留)。在MVP模式的情况下,邻近块的运动矢量用作运动矢量预测器,并且因此,用作当前块的运动矢量预测器以导出当前块的运动矢量。
在中间预测的情况下,邻近块包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。包括时间邻近块的参考图片也可以被称作共位的图片(colPic)。运动信息可以包括运动矢量和参考图片。如果以跳过模式和合并模式使用时间邻近块的运动信息,则在参考图片列表上的顶端图片可以用作参考图片。
多视图可以被划分为无关视图和相关视图。在对无关视图编码的情况下,预测器210可以不仅执行中间预测,而且执行视图间预测。
预测器210可以通过包括不同的视图的图片配置参考图片列表。对于视图间预测,预测器210可以导出视差矢量。与在指定在当前视图中的不同图片中对应于当前块的块的运动矢量中不同,视差矢量可以指定在相同的接入单元(AU)的另一个视图中对应于当前块的块作为当前图片。在多视图中,例如,AU可以包括视频图片和对应于相同的时间实例的深度图。在此,AU可以指的是一组具有相同的图片顺序计数(POC)的图片。POC对应于显示顺序,并且可以不同于编码顺序。
预测器210可以基于视差矢量指定在深度视图中的深度块,并且可以执行合并列表配置、视图间运动预测、残留预测、照度补偿(IC)、视图合成等。
用于当前块的视差矢量可以通过使用相机参数从深度值导出,或者可以从运动矢量或者在当前或者不同的视图中的邻近块的视差矢量导出。
例如,预测器210可以将对应于参考视图的时间运动信息的视图间合并候选(IvMC)、对应于视差矢量的视图间视差矢量候选(IvDC)、通过视差矢量的移位导出的移位IvMC、当当前块是在深度图上的块时从相应的纹理图片导出的纹理合并候选(T)、通过使用视差从纹理合并候选导出的视差导出的合并候选(D)、基于视图合成等导出的视图合成预测候选(VSP)等添加到合并候选列表。
在这种情况下,包括在要应用于相关视图的合并候选列表中的候选的数目可以限于特定值。
此外,预测器210可以通过适用视图间运动矢量预测,基于视差矢量预测当前块的运动矢量。在这种情况下,预测器210可以基于在相应的深度块中最大的深度值的变换导出视差矢量。当在参考视图中参考采样的位置通过将视差矢量添加到在参考视图中当前块的采样位置指定时,包括参考采样的块可以用作参考块。预测器210可以将参考块的运动矢量作为当前块的候选运动参数,或者运动矢量预测器候选使用,并且可以将视差矢量作为用于视差补偿的预测(DCP)的候选视差矢量使用。
减法器215产生残留采样,其是在原始采样和预测采样之间的差值。如果适用跳过模式,则可能不产生如上所述的残留采样。
变换器220以变换块为单位变换残留采样以产生变换系数。量化器225可以量化变换系数以产生量化的变换系数。
重新排序器230重新排序量化的变换系数。重新排序器230可以通过使用扫描方法重新排序具有以1D矢量形式的块形状的量化的变换系数。
熵编码器235可以对量化的变换系数执行熵编码。熵编码可以包括,例如,指数Golomb、上下文自适应的可变长度编码(CAVLC)、上下文自适应的二进制算术编码(CABAC)等的编码方法。熵编码器235可以一起或者分别地对除了量化的变换系数之外用于视频重建需要的信息(例如,语法元素值等)执行编码。熵编码的信息可以以比特流形式发送或者存储在网络抽象化层(NAL)的单元中。
加法器250将残留采样和预测采样相加以重建图片。残留采样和预测采样可以以块为单位相加以产生重建块。虽然在此处所描述的是加法器250被分开地配置,但加法器250可以是预测器210的一部分。
滤波器255可以将去块滤波和/或采样自适应的偏移应用于重建的图片。在重建的图片中。块边缘的大气噪声或者在量化过程中的失真可以经由去块滤波和/或采样自适应的偏移校正。采样自适应的偏移可以以采样为单位适用,并且可以在完成去块滤波的过程之后适用。
存储器260可以存储重建的图片或者用于编码/解码需要的信息。例如,存储器260可以存储在中间预测/视图间预测中使用的(参考)图片。在这种情况下,在中间预测/视图间预测中使用的图片可以由参考图片集或者参考图片列表指定。
虽然在此处所描述的是一个编码设备编码无关视图和相关视图,但这是为了解释的方便起见。因此,单独的编码设备可以被配置用于每个视图,或者单独的内部模块(例如,用于每个视图的预测模块)可以被配置用于每个视图。
图3简要地图示本发明可应用于的视频解码设备的结构。
参考图3,视频解码设备300包括熵解码器310、重新排序器320、去量化器330、反变换器340、预测器350、加法器360、滤波器370和存储器380。
当输入包括视频信息的比特流时,视频解码设备300可以与通过其视频信息在视频编码设备中处理的过程相关联地重建视频。
例如,视频解码设备300可以通过使用在视频编码设备中适用的处理单元执行视频解码。因此,视频解码的处理单元块可以是编码单元块、预测单元块,或者变换单元块。作为解码的单元块,编码单元块可以按照四树结构从最大的编码单元块分解。作为从编码单元块分割的块,预测单元块可以是采样预测的单元块。在这种情况下,预测单元块可以被划分为子块。作为编码单元块,变换单元块可以按照四树结构分解,并且可以是用于导出变换系数的单元块,或者用于从变换系数导出残留信号的单元块。
熵解码器310可以解析比特流以输出对于视频重建或者图片重建需要的信息。例如,熵解码器310可以基于编码方法,诸如指数Golomb编码、CAVLC、CABAC等解码在比特流中的信息,并且可以输出对于视频重建需要的语法元素的值和关于残留的变换系数的量化的值。
如果多个视图被处理以再现3D视频,可以对于每个视图输入比特流。做为选择,关于每个视图的信息可以在比特流中被多路复用。在这种情况下,熵解码器310可以解多路复用该比特流以对于每个视图对其解析。
重新排序器320可以以2D块的形式重新排序量化的变换系数。重新排序器320可以与在编码设备中执行的系数扫描相关联地执行重新排序。
去量化器330可以基于(去)量化参数对量化的变换系数去量化以输出变换系数。在这种情况下,用于导出量化参数的信息可以从编码设备示意。
反变换器340可以反变换该变换系数以导出残留采样。
预测器350可以对当前块执行预测,并且可以产生包括用于当前块的预测采样的预测块。在预测器350中执行的预测单元可以是编码块,或者可以是变换块,或者可以是预测块。
预测器350可以确定适用内部预测还是中间预测。在这种情况下,用于确定将在内部预测和中间预测之间使用哪一个的单元可以不同于用于产生预测采样的单元。此外,在中间预测和内部预测中用于产生预测采样的单元也可以不同。例如,可以以CU为单位确定将在中间预测和内部预测之间适用哪一个。此外,例如,在中间预测中,预测采样可以以PU为单位通过确定预测模式产生,并且在内部预测中,预测采样可以通过以PU为单位确定预测模式以TU为单位产生。
在内部预测的情况下,预测器350可以基于在当前图片中的邻近参考采样导出用于当前块的预测采样。预测器350可以基于当前块的邻近参考采样,通过适用定向模式或者非定向的模式导出用于当前块的预测采样。在这种情况下,要应用于当前块的预测模式可以通过使用邻近块的内部预测模式确定。
在中间预测的情况下,预测器350可以基于通过在参考图片上的运动矢量对参考图片指定的采样导出用于当前块的预测采样。预测器350可以通过适用跳过模式、合并模式和MVP模式的任何一个导出用于当前块的预测采样。
在跳过模式和合并模式的情况下,邻近块的运动信息可以用作当前块的运动信息。在这种情况下,邻近块可以包括空间邻近块和时间邻近块。
预测器350可以通过使用可用的邻近块的运动信息构成合并候选列表,并且可以将由在合并候选列表上的合并索引表示的信息用作当前块的运动矢量。合并索引可以从编码设备示意。运动信息可以包括运动矢量和参考图片。当以跳过模式和合并模式使用时间邻近块的运动信息时,在参考图片列表上的最高的图片可以用作参考图片。
在跳过模式的情况下,与合并模式不同,在预测采样和原始采样之间的差值(残留)不发送。
在MVP模式的情况下,当前块的运动矢量可以通过将邻近块的运动矢量用作运动矢量预测器导出。在这种情况下,邻近块可以包括空间邻近块和时间邻近块。
在相关视图的情况下,预测器350可以执行视图间预测。在这种情况下,预测器350可以通过包括不同视图的图片配置参考图片列表。
对于视图间预测,预测器350可以导出视差矢量。预测器350可以基于视差矢量指定在深度视图中的深度块,并且可以执行合并列表配置、视图间运动预测、残留预测、照度补偿(IC)、视图合成等等。
用于当前块的视差矢量可以通过使用相机参数从深度值导出,或者可以从运动矢量或者在当前或者不同的视图中的邻近块的视差矢量导出。相机参数可以从编码设备示意。
当合并模式应用于相关视图的当前块时,预测器350可以将对应于参考视图的时间运动信息的IvMC、对应于视差矢量的IvDC、通过视差矢量的移位导出的移位的IvMC、当当前块是在深度图上的块时,从相应的纹理图片导出的纹理合并候选(T)、通过使用来自纹理合并候选的视差导出的视差导出的合并候选(D)、基于视图合成导出的视图合成预测候选(VSP)等添加到合并候选列表。
在这种情况下,包括在要应用于相关视图的合并候选列表中的候选的数目可以限于特定值。
此外,预测器350可以通过适用视图间运动矢量预测,基于视差矢量预测当前块的运动矢量。在这种情况下,预测器350可以将在由视差矢量指定的参考视图中的块作为参考块使用。预测器350可以将参考块的运动矢量作为当前块的运动矢量预测器候选或者候选运动参数使用,并且可以将视差矢量作为用于视差补偿的预测(DCP)的候选矢量使用。
加法器360可以残留采样和预测采样以相加重建当前块或者当前图片。加法器360可以以块为单位相加残留采样和预测采样以重建当前图片。当适用跳过模式时,残留不发送,并且因此,预测采样可以是重建采样。虽然在此处所描述的是加法器360被单独地配置,但加法器360可以是预测器350的一部分。
滤波器370可以将去块滤波和/或采样自适应的偏移应用于重建的图片。在这种情况下,采样自适应的偏移可以以采样为单位适用,并且可以在去块滤波之后适用。
存储器380可以存储重建的图片和在解码时需要的信息。例如,存储器380可以存储在中间预测/视图间预测时使用的图片。在这种情况下,在中间预测/视图间预测中使用的图片可以由参考图片集或者参考图片列表指定。重建的图片可以用作用于不同的图片的参考图片。
此外,存储器380可以按照输出顺序输出重建的图片。虽然未示出,但输出单元可以显示多个不同的视图去再现3D图像。
虽然在图3的示例中所描述的是无关视图和相关视图被在一个解码设备中解码,但这仅是为了示范的目的,并且本发明不受限于此。例如,每个解码设备可以对于每个视图操作,并且内部模块(例如,预测模块)可以在一个解码设备中与每个视图相关联地提供。
多视图视频编码可以通过使用属于与当前图片相同的接入单元(AU)的不同的视图的解码数据对当前图片执行编码以提高对于当前视图的视频编码效率。
在多视图视频解码中,视图可以以AU为单位编码,并且图片可以以视图为单位编码。在视图之间按照确定的顺序执行编码。无需参考另一个视图可以编码的视图可以被称作基础视图或者无关视图。此外,参考无关视图或者在无关视图之后的另一个视图能够编码的视图可以被称作相关视图或者扩展的视图。此外,如果当前视图是相关视图,在当前视图的编码中用作参考的视图可以被称作参考视图。在此处,视图的编码包括属于该视图的视频图片、深度图等的编码。
3D视频包括具有典型的彩色图像信息的视频图片(或者纹理图片),和具有关于视频图片的深度信息的深度图。在3D视频中,具有不同的时间实例的多个视频图片可以存在于相同的POC中,并且对应于多个视频图片的每个的深度图可以存在。此外,多个视频图片可以从具有不同的时间实例的多个相机中获得。
3D视频可以表示为多视图视频加深度格式。在编码设备中,几个捕捉的视图和相关的深度图被编码,并且所得到的比特流分组可以被多路复用为3D视频比特流。在解码设备中,关于视频图片和深度图的数据被解码,并且必要时,附加的中间视图可以通过使用基于深度图像的渲染(DIBR)方案合成。对于视图合成,相机参数可以另外包括在比特流中。相机参数可以包括ZFar、Znear、焦距等等。
图4a和图4b图示可以在本发明中使用的相机参数。可以在3D视频中使用的相机模型的实施例在图4a和图4b中示出。
如上所述,相机参数可用于合成用于VSP的参考图片,并且也可以在解码设备中用于产生中间时间实例图像。因此,解码设备可以编码用于每个时间实例的相机参数以经由网络或者存储介质将其发送给解码设备。
参考图4A,由W指示的坐标系可以隐含被用于指定在空间上相机位置的“参考坐标系”。此外,由C指示的坐标系可以隐含“相机坐标系”,其具有作为起点对应于在图4A中图示的相机参数的相机的焦点410。此外,显示由相机获得的图像的图像平面由图4A的420指示。
在图4A的实施例中,f指示从相机的焦点410到图像平面420的距离(在Z轴上的距离),即,焦距。此外,(u0,v0)可以指示在其处相机的光轴满足图像平面420的点的坐标,即,基点的坐标。光轴可以隐含在相机坐标系中图像平面420的垂直坐标轴,并且在图4a中示出为Z轴。因此,从相机的焦点410到基点的距离可以对应于焦距。前面提到的三个参数(f,u0,v0)可以被称作固有相机参数。
同时,相机参数可以是3×3旋转矩阵R和用于指示相对于参考坐标系W的相机坐标系C的3×1平移矢量T。在此处,3×3旋转矩阵R指示相对于参考坐标系通过其相机坐标系在3D空间上转动的旋转度。即,3×3旋转矩阵R指示相对于参考坐标系的相机坐标系的3D旋转。此外,3×1平移矢量T是指示相对于参考坐标系的相机坐标系位置的矢量。3×3旋转矩阵R和3×1平移矢量T可以指示参考坐标系和相机坐标系的几何关系。因此,两个参数可以被称作非固有的相机参数。
图4b图示与相机的光轴正交的三个平面。相机的焦点,即,相机坐标系的起点由图4b的410指示,并且图像平面由420指示。
由一个相机捕捉的场景可以具有各种深度值。在这种情况下,具有最小的深度值的点可以是距离上最靠近于相机的点,并且具有最大的深度值的点可以是距离上离相机最远的点。在由具有焦点410的相机捕捉的场景中对应于最小的深度值的平面可以由图4b的430表示,并且可以被称作近裁剪平面。此外,在由具有焦点410的相机捕捉的场景中对应于最大的深度值的平面可以由图4b的440表示,并且可以被称作远裁剪平面。
在由相机捕捉的任意场景中,最小的深度值可以由Znear(Zn)指示,并且可以对应于近裁剪平面430的深度值。最大的深度值可以由Zfar(Zn)表示,并且可以对应于远裁剪平面440的深度值。值Znear和Zfar对应于相机参数,并且可以被称作Z裁剪参数。
在编码设备中处理并且发送给解码设备的深度数据可以具有基于位深度的值。例如,如果位深度是8,则在深度图中的深度采样值可以具有在0至255的范围内的值。在这种情况下,深度采样值可以对应于在Z裁剪参数Znear和Zfar的范围内的深度值。因此,量化的深度采样值可以基于Z裁剪参数Znear和Zfar被变换为真实的深度值。这可以例如由以下的公式表示。
[公式1]
z = 1 v 255 · ( 1 Z n e a r - 1 Z f a r ) + 1 Z f a r
在此处,Znear表示近裁剪参数,并且Zfar表示远裁剪参数。此外,z表示真实的深度值,并且v表示包括在深度图中的深度采样值的强度。
此外,相机参数也可用于在VSP中将深度值变换为视差值,其通过将基于DIBR合成的视图的图片用作参考图片,并且在基于相应的深度块对视差矢量候选执行的深度细化等对当前图片(或者块)执行预测。用于这样的变换的相机参数可以被称作变换参数,并且可用于配置深度对视差表。将深度值变换为视差值需要的相机参数可以包括在比特流中,并且相机参数(或者变换参数)可以包括关于比例因子和偏移的参数。视差矢量的垂直分量可以被设置为0,和视差矢量的水平分量可以基于以下的公式导出。
[公式2]
dv=(s*v+o)>>n,
在此处,v是深度采样值,s是比例因子,o是偏移,并且n是基于视差矢量需要的精度的移位参数。在用于导出在当前视图和具有视图索引j和具有深度采样的视图之间的视差矢量的向后变换中,比例因子可以基于cp_scale[j]导出,并且偏移可以基于cp_off[j]导出。此外,在用于导出在具有视图索引j的视图和具有深度采样的当前视图之间的视差矢量的向前变换中,比例因子可以基于cp_inv_scale_plus_scale[j]导出,并且偏移可以基于cp_inv_off_plus_off[j]导出。
在本发明中,相机参数可以包括多个参数,并且可以被称作相机参数集。相机参数可以随着时间在视图的图片之间共享或者改变。例如,如果相机的位置被固定直到3D视频结束为止,或者如果多视图相机的相对位置没有变化,视图的每个图片可以共享一个相机参数。在这种情况下,视图的代表性相机参数可以经由视频参数集(VPS)语法发送。在这种情况下,VPS语法可以例如表示如下。
[表1]
...
cp_in_slice_segment_header_flag[i] u(1)
if(!cp_in_slice_segment_header_flag[i])
for(j=0;j<i;j++){
vps_cp_scale[i][j] se(v)
vps_cp_off[i][j] se(v)
vps_cp_inv_scale_plus_scale[i][j] se(v)
vps_cp_inv_off_plus_off[i][j] se(v)
}
在此处,cp_in_slice_segment_header_flag是表示相机参数是否存在于关于第i个视图的片段分割头部中的标记信息。
cp_in_slice_segment_header_flag[i]等于0的值指定相机参数相关的语法元素vps_cp_scale[i][j]、vps_cp_off[i][j]、vps_cp_inv_scale_plus_scale[i][j],和vps_cp_inv_off_plus_off[i][j]存在于VPS中,并且cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j]和cp_inv_off_plus_off[j]不存在于具有等于layerId的nuh_layer_id和具有等于i的VpsViewIdx[layerId]的片段分割头部中。
在此处,vps_cp_scale[i][j]、vps_cp_off[i][j]、vps_cp_inv_scale_plus_scale[i][j],和vps_cp_inv_off_plus_off[i][j]指定用于将深度值变换为视差值的参数。vps_cp_scale[i][j]、vps_cp_off[i][j]、vps_cp_inv_scale_plus_scale[i][j],和vps_cp_inv_off_plus_off[i][j]可用于导出作为在VPS中指定的关于第i个视图的cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j],和cp_inv_off_plus_off[j]的值。
对于另一个示例,由于相机的运动,相机参数的值可以随着时间而变化。在这种情况下,相机参数可以在一个视图的图片之间变化,并且相机参数可以被经由片段分割头部发送。在这种情况下,片段分割头部可以例如表示如下。
[表2]
...
if(nuh_layer_id>0&&cp_in_slice_segment_header_flag[ViewIdx])
for(j=0;j<Viewldx;j++){
cp_scale[j] se(v)
cp_off[j] se(v)
cp_inv_scale_plus_scale[j] se(v)
cp_inv_off_plus_off[j] se(v)
}
即,cp_in_slice_segment_header_flag[i]等于1的值指定cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j],和cp_inv_off_plus_off[j](其是用于将深度值变换为视差值的参数)存在于具有等于i的VpsViewIdx[layerId]的片段分割头部中。
即,按照以上所述的描述,如果相机参数在一个视图中改变甚至一次,相机参数可以被经由片段分割头部发送。在这种情况下,如果没有额外的限制,可以对于每个片段发送相机参数。
但是,甚至在相同的相机参数被在特定时段使用,而不是改变用于每个POC的相机参数的情形下,如果对于每个片段发送相机参数,则相同的信息可能不必要地以重叠方式发送,并且编码效率可能劣化。
按照如下所述本发明的实施例,可以避免相机参数的重叠传输,并且在视图中特定时段的图片(或者片段)可以共享相同的相机参数。按照本发明,如果当前片段(或者图片)使用与先前片段(或者图片)相同的相机参数,则可以使用先前片段(或者图片)的相机参数代替重新发送相同的值。
在一个实施例中,可以发送指示在先前片段中使用的相机参数在片段分割头部中是否使用的标记信息。例如,如果标记信息是1,则相机参数(例如,cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j],和cp_inv_off_plus_off[j]不被通过包括在片段分割头部中发送。如果标记信息是0,则新的相机参数可以通过包括在片段分割头部中发送,并且解码设备可以解析和使用该变换参数。做为选择,相反地,如果标记信息是0,则新的参数不被通过包括在片段分割头部中发送,并且如果标记信息是1,则相机参数可以通过包括在片段分割头部中发送。在这种情况下,如果当前要解码的图片是随机接入点,则相机参数可以无条件地解析。片段分割头部可以例如表示如下。
[表3]
slice segment header(){ 描述符
if(nuh_layer_id>0&&cp_in_slice_segment_header_flag[ViewIdx])
prev_cp_in_slice_segment_header_flag[ViewIdx] u(1)
if(!prev_cp_in_slice_segment_header_flag[ViewIdx])
for(j=0;j<ViewIdx;j++){
cp_scale[j] se(v)
cp_off[j] se(v)
cp_inv_scale_plus_scale[j] se(v)
cp_inv_off_plus_off[j] se(v)
}
}
在此处,prev_cp_in_slice_segment_header_flag是指示在先前片段中使用的相机参数是否在当前片段中被使用的标记信息。
prev_cp_in_slice_segment_header_flag[ViewIdx]等于0的值指定语法元素cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j],和cp_inv_off_plus_off[j]存在于片段分割头部中。
prev_cp_in_slice_segment_header_flag[ViewIdx]等于1的值指定cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j],和cp_inv_off_plus_off[j]在片段分割头部中不存在,并且cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j],和cp_inv_off_plus_off[j]从与具有等于ViewIdx的视图索引的先前片段分割头部相对应的语法元素导出。
如果prev_cp_in_slice_segment_header_flag[ViewIdx]不存在,则prev_cp_in_slice_segment_header_flag[ViewIdx]的值可以推断为等于1。如果在具有nuh_layer_id等于0的接入单元上的图片是内部随机接入点(IRAP)图片,则在片段分割头部中的prev_cp_in_slice_segment_header_flag[ViewIdx]的值可以等于0。
cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j]和cp_inv_off_plus_off[j]指定用于将深度值变换为视差值的参数。如果参数不存在,并且prev_cp_in_slice_segment_header_flag[ViewIdx]的值等于0,则cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j],和cp_inv_off_plus_off[j]可以推断为分别地等于vps_cp_scale[ViewIdx][j]、vps_cp_off[ViewIdx][j]、vps_cp_inv_scale_plus_scale[ViewIdx][j],和vps_cp_inv_off_plus_off[ViewIdx][j]。在此处,如果ViewIdxA等于ViewIdxB,则在具有ViewIdx等于ViewIdxA的片段分割头部中的cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j],和cp_inv_off_plus_off[j]在具有ViewIdx等于ViewIdxB的片段分割头部中等于cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j],和cp_inv_off_plus_off[j]。
对于另一个实施例,当相机参数随着时间而变化时,默认相机参数可以经由VPS发送,并且指示是否更新相机参数的标记信息可以经由片段分割头部发送。以这种方式,解码设备可以确定是否去解析新的相机参数。如果标记信息指示0,则相机参数不包括在片段分割头部中,并且使用存储在解码设备中的当前时间实例的相机参数。即,如果相机参数不更新甚至一次,默认相机参数将存储在解码设备中。如果相机参数被更新,并且因此,标记信息指示1,则解码设备解析包括在片段分割头部中的新的相机参数值,并且更新对于当前时间实例共享的相机参数。在这种情况下,如果当前要解码的图片是随机接入点,则相机参数可以无条件地解析。
在这种情况下,VPS和片段分割头部可以分别地如以下的表4和5所示指示。
[表4]
vps extension2(){ 描述符
cp_precision ue(v)
for(i=1;i<NumViews;i++){
cp_present_flag[i] u(1)
if(cp_present_flag[i]){
cp_in_slice_segment_header_flag[i] u(1)
for(j=0;j<i;j++){
vps_cp_scale[i][j] se(v)
vps_cp_off[i][j] se(v)
vps_cp_inv_scale_plus_scale[i][j] se(v)
vps_cp_inv_off_plus_off[i][j] se(v)
}
}
}
}
在此处,vps_cp_scale[i][j]、vps_cp_off[i][j]、vps_cp_inv_scale_plus_scale[i][j],和vps_cp_inv_off_plus_off[i][j]指定用于将深度值变换为视差值的(默认)参数。如果纹理层和具有ViewIdx等于i的深度层都存在,则该参数与纹理层相关联。
在这种情况下,当前相机参数可以表示为CpScale[i][j]、CpOff[i][j]、CpInvScalePlusScale[i][j],和CpInvOffPlusOff[i][j]。
CpScale[i][j]、CpOff[i][j]、CpInvScalePlusScale[i][j],和CpInvOffPlusOff[i][j]可以如下适用。
-CpScale[i][j]=vps_cp_scale[i][j]
-CpOff[i][j]=vps_cp_off[i][j]
-CpInvScalePlusScale[i][j]=vps_cp_inv_scale_plus_scale[i][j]
-CpInvOffPlusOff[i][j]=CpInvOffPlusOff[i][j]
[表5]
在此处,cu_update_flag是指示是否更新相机参数的标记信息。
cu_update_flag[ViewIdx]等于1的值指定语法元素cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j],和cp_inv_off_plus_off[j]存在于片段分割头部中。
cu_update_flag[ViewIdx]等于0的值指定cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j],和cp_inv_off_plus_off[j]不存在在片段分割头部中,并且cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j],和cp_inv_off_plus_off[j]从对应于先前片段分割头部的语法元素导出。
如果cu_update_flag[ViewIdx]不存在,则cu_update_flag[ViewIdx]的值可以推断为等于0。如果在具有nuh_layer_id等于0的接入单元上的图片是内部随机接入点(IRAP)图片,则在片段分割头部中的cu_update_flag[ViewIdx]的值可以等于0。
cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j]和cp_inv_off_plus_off[j]指定用于将深度值变换为视差值的参数。在此处,如果ViewIdxA等于ViewIdxB,则在具有ViewIdx等于ViewIdxA的片段分割头部中的cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j]和cp_inv_off_plus_off[j]等于在具有ViewIdx等于ViewIdxB的片段分割头部中的cp_scale[j]、cp_off[j]、cp_inv_scale_plus_scale[j]和cp_inv_off_plus_off[j]。
如果cu_update_flag[ViewIdx]的值等于1,则CpScale[i][j]、CpOff[i][j]、CpInvScalePlusScale[i][j]和CpInvOffPlusOff[i][j]可以更新如下。
-CpScale[ViewIdx][j]=cp_scale[j]
-CpOff[ViewIdx][j]=cp_off[j]
-CpInvScalePlusScale[ViewIdx][j]=cp_inv_scale_plus_scale[j]
-CpInvOffPlusOff[ViewIdx][j]=cp_inv_off_plus_off[j]
如果当前相机参数表示为如上所述的CpScale、CpOff、CpInvScalePlusScale和CpInvOffPlusOff,则在前面提到的公式2中在向后变换中的比例因子可以基于CpScale导出,并且偏移可以基于CpOff导出。此外,在向前变换中的缩放因子可以基于CpInvScalePlusScale导出,并且偏移可以基于CpInvOffPlusOff导出。
对于另一个实施例,默认相机参数被经由VPS发送,并且指示是否相机参数经由片段分割头部被更新的标记信息被发送,并且如果相机参数在这种情况下被更新,则相对于默认相机参数的差分值可以被发送。如果标记信息指示0,相机参数不包括在片段分割头部中,并且使用存储在解码设备中的当前时间实例的相机参数。即,如果相机参数不更新甚至一次,默认相机参数将存储在解码设备中。如果相机参数被更新,并且因此,标记信息指示1,则解码设备解析包括在片段分割头部中的相机参数差分值以将其添加到默认相机参数,并且因此,更新对于当前时间实例共享的相机参数。在这种情况下,如果当前要解码的图片是随机接入点,则相机参数可以无条件地解析。
在这种情况下,VPS和片段分割头部可以分别地如以下的表6和7所示表示。
[表6]
vps extension2(){ 描述符
cp_precision ue(v)
for(i=1;i<NumViews;i++){
cp_present_flag[i] u(1)
if(cp_present_flag[i]){
cp_in_slice_segment_header_flag[i] u(1)
for(j=0;j<i;j++){
vps_cp_scale[i][j] se(v)
vps_cp_off[i][j] se(v)
vps_cp_inv_scale_plus_scale[i][j] se(v)
vps_cp_inv_off_plus_off[i][j] se(v)
}
}
}
}
在此处,vps_cp_scale[i][j]、vps_cp_off[i][j]、vps_cp_inv_scale_plus_scale[i][j],和vps_cp_inv_off_plus_off[i][j]指定用于将深度值变换为视差值的(默认)参数。如果纹理层和具有ViewIdx等于i的深度层都存在,则该参数与纹理层相关联。
在这种情况下,当前相机参数可以表示为CpScale[i][j]、CpOff[i][j]、CpInvScalePlusScale[i][j],和CpInvOffPlusOff[i][j]。
CpScale[i][j]、CpOff[i][j]、CpInvScalePlusScale[i][j],和CpInvOffPlusOff[i][j]可以如下适用。
-CpScale[i][j]=vps_cp_scale[i][j]
-CpOff[i][j]=vps_cp_off[i][j]
-CpInvScalePlusScale[i][j]=vps_cp_inv_scale_plus_scale[i][j]
-CpInvOffPlusOff[i][j]=vps_cp_inv_off_plus_off[i][j]
[表7]
slice segment header(){ 描述符
if(nuh_layer_id>0&&cp_in_slice_segment_header_flag[ViewIdx])
cu_update_flag[ViewIdx] u(1)
if(cu_update_flag[ViewIdx])
for(j=0;j<ViewIdx;j++){
delta_cp_scale[j] se(v)
delta_cp_off[j] se(v)
delta_cp_inv_scale_plus_scale[j] se(v)
delta_cp_inv_off_plus_off[j] se(v)
}
}
在此处,cu_update_flag是指示是否更新相机参数的标记信息。
cu_update_flag[ViewIdx]等于1的值指定语法元素delta_cp_scale[j]、delta_cp_off[j]、delta_cp_inv_scale_plus_scale[j],和delta_cp_inv_off_plus_off[j]存在于片段分割头部中。
cu_update_flag[ViewIdx]等于0的值指定delta_cp_scale[j]、delta_cp_off[j]、delta_cp_inv_scale_plus_scale[j],和delta_cp_inv_off_plus_off[j]在片段分割头部中不存在,并且delta_cp_scale[j]、delta_cp_off[j]、delta_cp_inv_scale_plus_scale[j],和delta_cp_inv_off_plus_off[j]从对应于先前片段分割头部的语法元素导出。
如果cu_update_flag[ViewIdx]不存在,则cu_update_flag[ViewIdx]的值可以推断为等于0。如果在具有nuh_layer_id等于0的接入单元上的图片是内部随机接入点(IRAP)图片,则在片段分割头部中的cu_update_flag[ViewIdx]的值可以等于0。
delta_cp_scale[j]、delta_cp_off[j]、delta_cp_inv_scale_plus_scale[j],和delta_cp_inv_off_plus_off[j]指定用于将深度值变换为视差值的参数。在此处,如果ViewIdxA等于ViewIdxB,则在具有ViewIdx等于ViewIdxA的片段分割头部中的delta_cp_scale[j]、delta_cp_off[j]、delta_cp_inv_scale_plus_scale[j],和delta_cp_inv_off_plus_off[j]等于在具有ViewIdx等于ViewIdxB的片段分割头部中的delta_cp_scale[j]、delta_cp_off[j]、delta_cp_inv_scale_plus_scale[j],和delta_cp_inv_off_plus_off[j]。
如果cu_update_flag[ViewIdx]的值等于1,则CpScale[i][j]、CpOff[i][j]、CpInvScalePlusScale[i][j],和CpInvOffPlusOff[i][j]可以更新如下。
-CpScale[ViewIdx][j]=vps_cp_scale[ViewIdx][j]+delta_cp_scale[j]
-CpOff[ViewIdx][j]=vps_cp_off[ViewIdx][j]+delta_cp_off[j]
-CpInvScalePlusScale[ViewIdx][j]=vps_cp_inv_scale_plus_scale[ViewIdx][j]+cp_inv_scale_plus_scale[j]
-CpInvOffPlusOff[ViewIdx][j]=CpInvOffPlusOff[i][j]+cp_inv_off_p lus_off[j]
在这种情况下,在前面提到的公式2中在向后变换中的比例因子可以基于CpScale导出,并且偏移可以基于CpOff导出。此外,在向前变换中的缩放因子可以基于CpInvScalePlusScale导出,并且偏移可以基于CpInvOffPlusOff导出。
对于另一个实施例,仅相对于对于当前片段的相机参数的差分值通过使用最近作为预测器发送的相机参数发送。在这种情况下,为了防止德尔塔(delta)值被无限地增加,如果delt的绝对值达到预先确定的大小,则可以更新要作为预测器使用的相机参数。在这种情况下,要作为基础(或者参考)使用的相机参数可以通过考虑计算负载和编码效率,经由序列参数集(SPS)语法、视频参数集(VPS)语法,或者图片参数集(PPS)发送。
在这种情况下,要作为基础使用的相机参数经由其发送的语法,和相机参数差分值经由其发送的片段分割头部可以例如如以下的表8和9所示表示。
[表8]
在此处,cp_scale[i][j]、cp_off[i][j]、cp_inv_scale_plus_scale[i][j],和cp_inv_off_plus_off[i][j]指定用于将深度值变换为视差值的(默认)参数。如果纹理层和具有ViewIdx等于i的深度层都存在,该参数与纹理层相关联。
在这种情况下,参考相机参数可以表示为RefCpScale[i][j]、RefCpOff[i][j]、RefCpInvScalePlusScale[i][j]和RefCpInvOffPlusOff[i][j]。
RefCpScale[i][j]、RefCpOff[i][j]、RefCpInvScalePlusScale[i][j]和RefCpInvOffPlusOff[i][j]可以如下适用。
-RefCpScale[i][j]=cp_scale[i][j]
-RefCpOff[i][j]=cp_off[i][j]
-RefCpInvScalePlusScale[i][j]=cp_inv_scale_plus_scale[i][j]
-RefCpInvOffPlusOff[i][j]=cp_inv_off_plus_off[i][j]
[表9]
slice segment header(){ 描述符
delta_cp_flag u(1)
if(nuh_layer_id>0&&delta_cp_flag)
for(j=0;j<ViewIdx;j++){
delta_cp_scale[j] se(v)
delta_cp_off[j] se(v)
delta_cp_inv_scale_plus_scale[j] se(v)
delta_cp_inv_off_plus_off[j] se(v)
}
}
在此处,delta_cp_flag是指示是否存在相机参数的差分值(或者delta值)的标记信息。
delta_cp_flag等于1的值指定语法元素delta_cp_scale[j]、delta_cp_off[j]、delta_cp_inv_scale_plus_scale[j],和delta_cp_inv_off_plus_off[j]存在于片段分割头部中。即,这指定当前相机参数通过将存在于片段分割头部中的相机参数差分值添加到现有的(参考)相机参数导出,并且当前相机参数用于当前片段。
如果cu_update_flag[ViewIdx]的值等于0,则delta_cp_scale[j]、delta_cp_off[j]、delta_cp_inv_scale_plus_scale[j]和delta_cp_inv_off_plus_off[j]在片段分割头部中不存在。即,这指定相机参数在这个比特流中不更新。
在这种情况下,用于当前片段的当前相机参数(变换参数)可以表示为CurrCpScale[i][j]、CurrCpOff[i][j]、CurrCpInvScalePlusScale[i][j],和CurrCpInvOffPlusOff[i][j]。
CurrCpScale[i][j]、CurrCpOff[i][j]、CurrCpInvScalePlusScale[i][j],和CurrCpInvOffPlusOff[i][j]可以如下导出。
-CurrCpScale[i][j]=RefCpScale[i][j]+delta_cp_scale[j]
-CurrCpOff[i][j]=RefCpOff[i][j]+delta_cp_off[j]
-CurrCpInvScalePlusScale[i][j]=RefCpInvScalePlusScale[i][j]+cp_in v_scale_plus_scale[j]
-CurrCpInvOffPlusOff[i][j]=RefCpInvOffPlusOff[i][j]+cp_inv_off_plus_off[j]
如果当前相机参数表示为如上所述的CurrCpScale[i][j]、CurrCpOff[i][j]、CurrCpInvScalePlusScale[i][j],和CurrCpInvOffPlusOff[i][j],则在前面提到的公式2中在向后变换中的比例因子可以基于CurrCpScale[i][j]导出,并且偏移可以基于CurrCpOff[i][j]导出。此外,在向前变换中的缩放因子可以基于CurrCpInvScalePlusScale[i][j]m导出,并且偏移可以基于CurrCpInvOffPlusOff[i][j]导出。
如果delta_cp_scale[j]、delta_cp_off[j]、delta_cp_inv_scale_plus_scale[j],或者delta_cp_inv_off_plus_off[j]达到阈值,则RefCpScale[i][j]、RefCpOff[i][j]、RefCpInvScalePlusScale[i][j],或者RefCpInvOffPlusOff[i][j]可以如下更新。在此处,阈值可以明确地示意或者可以隐含地报告。
-RefCpScale[i][j]=CurrCpScale[i][j]
-RefCpOff[i][j]=CurrCpOff[i][j]
-RefCpInvScalePlusScale[i][j]=CurrCpOff[i][j]
-RefCpInvOffPlusOff[i][j]=CurrCpInvOffPlusOff[i][j]
对于另一个实施例,解码设备可以将在多个相机参数集之中的任何一个相机参数集确定为参考目标相机参数集。例如,不是一个相机参数集,而是多个相机参数集可以从编码器发送。在这种情况下,对于当前片段或者图片的解码,可以通过接收指示在多个相机参数集之中的任何一个相机参数集的索引(或者ID)信息,或者通过基于不同的信息导出来确定为参考目标的相机参数集。多个相机参数集可以在解码多个片段时参考。
图5图示相对于多个相机参数集用于每个片段的参考目标相机参数集的示例。
参考图5,片段0至片段2可以指的是相机参数集0,片段3可以指的是相机参数集1,并且片段4和片段5可以指的是相机参数集2。
解码设备可以从编码设备接收相机参数集,并且基于在以后的时间里要发送的索引信息,可以确定相对于片段适用在多个相机参数集之中的哪个相机参数集。
相机参数集例如被经由PPS发送。例如,PPS可以如以下的表10所示表示。
[表10]
pps_3d_extension(){ 描述符
for(i=1;i<NumViews;i++){
cp_present_flag[i] u(1)
if(cp_present_flag[i]){
for(j=0;j<i;j++){
cp_scale[i][j] se(v)
cp_off[i][j] se(v)
cp_inv_scale_plus_scale[i][j] se(v)
cp_inv_off_plus_off[i][j] se(v)
}
}
}
}
高达64个不同的PPS可以被从编码设备发送给解码设备。解码设备可以基于包括在片段分割头部中的索引信息(或者PPS的ID)指定具有要在相应的片段中参考的相机参数集的PPS,并且因此,可以从多个相机参数中找到适当的相机参数,并且可以在解码时利用其。
在这种情况下,片段分割头部可以例如由以下的表11表示。
[表11]
在此处,slice_pic_parameter_set_id指定以PSS的ID的格式指示适用在多个相机参数集之中的哪个相机参数集的索引信息作为当前片段。
slice_pic_parameter_set_id指定用于使用中的PPS的pps_pic_parameter_set的值,并且slice_pic_parameter_set_id可以是在0至63(含63)的范围之内。
在这种情况下,参考相机参数集可以包括RefCpScale[i][j]、RefCpOff[i][j]、RefCpInvScalePlusScale[i][j]和RefCpInvOffPlusOff[i][j]。
如果nuh_layer_id大于0,则PPS由片段分割头部的slice_pic_parameter_set_id参考(或者指示),并且包括在PPS中的cp_present_flag[i]等于1,因而,RefCpScale[i][j]、RefCpOff[i][j]、RefCpInvScalePlusScale[i][j],和RefCpInvOffPlusOff[i][j]可以如下适用。
-RefCpScale[i][j]=cp_scale[i][j]
-RefCpOff[i][j]=cp_off[i][j]
-RefCpInvScalePlusScale[i][j]=cp_inv_scale_plus_scale[i][j]
-RefCpInvOffPlusOff[i][j]=cp_inv_off_plus_off[i][j]
对于另一个实施例,解码设备可以选择在多个相机参数集之中的任何一个相机参数集作为默认相机参数集。在这种情况下,对于校正变换,选择的默认相机参数集可以通过对其添加差分值在当前片段或者图片中使用。
例如,解码设备可以选择在多个相机参数集之中的一个默认相机参数集,并且可以通过将delta值添加到包括在选择的默认相机参数集中的参数获得用于当前片段的参考相机参数。
例如,相机参数集可以经由PPS发送。在这种情况下,PPS和片段分割头部可以如以下的表12和13所示表示。
[表12]
pps_3d_extension(){ 描述符
for(i=1;i<NumViews;i++){
cp_present_flag[i] u(1)
if(cp_present_flag[i]){
for(j=0;j<i;j++){
cp_scale[i][j] se(v)
cp_off[i][j] se(v)
cp_inv_scale_plus_scale[i][j] se(v)
cp_inv_off_plus_off[i][j] se(v)
}
}
}
}
[表13]
在此处,delta_cp_flag是指示是否存在相机参数集的差分值(或者delta值)的标记信息。
等于1的delta_cp_flag通过对其添加差分值指定在经由PPS(或者VPS,SPS)发送的相机参数集中的参数用于此片段。
即,如果delta_cp_flag的值等于1,指示差分值的语法元素,即,delta_cp_scale[j]、delta_cp_off[j]、delta_cp_inv_scale_plus_scale[j]和delta_cp_inv_off_plus_off[j]存在于片段分割头部中。
等于0的delta_cp_flag的值指定在经由PPS(或者VPS,SPS)发送的相机参数集中的参数不更新,而是用于此片段。
delta_cp_scale[j]、delta_cp_off[j]、delta_cp_inv_scale_plus_scale[j]和delta_cp_inv_off_plus_off[j]指定用于供将深度值变换为视差值的参数的当前片段的差分值。
在这种情况下,用于当前片段的当前相机参数(变换参数)可以表示为CurrCpScale[i][j]、CurrCpOff[i][j]、CurrCpInvScalePlusScale[i][j],和CurrCpInvOffPlusOff[i][j]。
CurrCpScale[i][j]、CurrCpOff[i][j]、CurrCpInvScalePlusScale[i][j],和CurrCpInvOffPlusOff[i][j]可以如下导出。
-CurrCpScale[i][j]=RefCpScale[i][j]+delta_cp_scale[j]
-CurrCpOff[i][j]=RefCpOff[i][j]+delta_cp_off[j]
-CurrCpInvScalePlusScale[i][j]=RefCpInvScalePlusScale[i][j]+cp_in v_scale_plus_scale[j]
-CurrCpInvOffPlusOff[i][j]=RefCpInvOffPlusOff[i][j]+cp_inv_off_plus_off[j]
如果delta_cp_scale[j]、delta_cp_off[j]、delta_cp_inv_scale_plus_scale[j],或者delta_cp_inv_off_plus_off[j]达到阈值,则RefCpScale[i][j]、RefCpOff[i][j]、RefCpInvScalePlusScale[i][j],或者RefCpInvOffPlusOff[i][j]可以如下更新。在此处,阈值可以明确地示意或者可以隐含地报告。
-RefCpScale[i][j]=CurrCpScale[i][j]
-RefCpOff[i][j]=CurrCpOff[i][j]
-RefCpInvScalePlusScale[i][j]=CurrCpOff[i][j]
-RefCpInvOffPlusOff[i][j]=CurrCpInvOffPlusOff[i][j]
对于另一个实施例,附加的语法可用于发送相机参数集。在这种情况下,语法可以被称作相机参数集语法或者相机变换参数集语法。通过以这种方式使用用于相机参数集的语法,相机参数集通过包括在VPS、SPS或者PPS中发送,并且因此,可以避免当传输被执行若干次时可能出现的重叠信息传输。此外,在这种情况下,索引或者ID被指派给每个相机参数集,并且因此,即使接收到若干个相机参数集,也可以指示期望的相机集。
例如,相机变换参数集语法可以如以下的表14所示表示。
[表14]
camera_conversion_parameter_set(){ 描述符
camera_conversion_parameter_set_id ue(v)
for(i=1;i<NumViews;i++){
cp_present_flag[i] u(1)
if(cp_present_flag[i]){
for(j=0;j<i;j++){
cp_scale[i][j] se(v)
cp_off[i][j] se(v)
cp_inv_scale_plus_scale[i][j] se(v)
cp_inv_off_plus_off[i][j] se(v)
}
}
}
}
在此处,camera_conversion_parameter_set_id指定指派给相机(变换)参数集的特定ID。
在这种情况下,如在前面提到的实施例中公开的,特定ID的相机参数集可以经由片段分割头部指定。此外,用于当前片段的最后的(或者参考或者当前)相机参数集的参数值可以通过将经由片段分割头部发送的delta值(或者差分值)添加到指定的相机参数集导出。
同时,解码设备的存储器是有限的,并且如果解码设备接收多个相机参数集,则在存储器中的某些或者所有相机参数集可以按照特定的条件被删除或者排列。
首先,在存储器中可能存在用于删除相机参数集的若干种方法。例如,可以基于输入命令删除相机参数集。即,当存储器不足时,首先输入给存储器的相机参数集可以首先删除。对于另一个示例,相机参数集的参考计数可以在特定的计数或者时间段期间计数,并且此后,具有最小参考计数的相机参数集可以从存储器中删除。对于另一个示例,关于要由编码设备删除的相机参数集的信息可以发送给解码设备,并且解码设备可以从存储器中删除由该信息指示的相机参数集。对于另一个示例,当相机参数集通过包括在较高的参数集,诸如PPS、SPS、VPS等等中发送时,可以使用较高的参数集的缓存器管理方案。
此外,为了有效的编索引,相机参数集可以重新排序和使用。例如,相机参数集可以以用作相机参数集基础的参数变量(例如,偏移)的升序或者降序重新排序。对于另一个示例,相机参数集可以以参考计数的降序或者升序重新排序。对于另一个示例,解码设备可以从编码设备接收关于相机参数集的顺序的信息,并且可以基于该信息重新排序相机参数集。对于另一个示例,当相机参数集通过包括在较高的参数集,诸如PPS、SPS、VPS等等中发送时,相机参数集可以以包括相机参数集的较高的参数集的ID的升序或者降序重新排序。
图6是按照本发明的一个实施例简要地图示参数编码方法的流程图。图6的方法可以由图2的前面提到的视频编码设备执行。
参考图6,基于用于将深度值变换为视差值的相机参数在特定时段的片段或者图片之间是否共享,编码设备产生相机参数(S600)。特定时段的片段或者图片可以共享相机参数,并且可以避免重叠的相机参数传输。相机参数可以被称作如上所述的变换参数。
编码设备可以编码相机参数以产生比特流,并且可以经由网络或者存储介质将其发送给解码设备(S610)。相机参数可以以语法形式表示。相机参数可以通过例如包括在前面提到的表1至14中描述的一个或多个语法中被发送。
图7是按照本发明的一个实施例简要地图示参数解码方法的流程图。图7的方法可以由图3的前面提到的视频解码设备执行。
参考图7,接收和解码用于将深度值变换为视差值的相机参数(S700)。解码设备可以接收比特流和对其执行熵解码,并且可以获得关于视频参数的信息。相机参数可以通过包括在VPS语法、PPS语法、SPS语法、片段分割头部语法,和相机变换参数集语法的任何一个中接收。
解码设备确定要应用于先前片段或者图片的相机参数是否应用于当前片段或者图片(S710)。相机参数可以由整个视频共享,并且即使其不被整个视频共享,可也以按照特定条件在特定时段中对于片段或者图片共享。
例如,如果相机参数用于先前片段或者图片,则解码设备可以接收指示相机参数是否经由语法用于当前图片的标记信息。如果标记信息是1,则相机参数可以应用于(或者共享)当前片段或者当前图片。如果标记信息是0,则相机参数不应用于当前图片,并且通过包括在语法中接收的新的相机参数可以应用于当前片段或者当前图片。在这种情况下,其中包括相机参数的语法(第一语法)和其中包括用于当前片段或者图片的新的相机参数的语法(第二语法)可以彼此相等或者可以彼此不同。例如,第一语法可以是VPS语法,并且第二语法可以是片段分割头部语法。对于另一个示例,第一语法可以是第一PPS语法,并且第二语法可以是第二PPS语法。大约64个不同的PPS可以从编码设备发送给解码设备,并且在这种情况下,第一PPS语法和第二PPS语法可以具有不同的ID。
对于另一个示例,指示相机参数对于当前片段或者当前图片是否被更新的标记信息可以经由语法接收。如果标记信息是0,则相机参数不被更新,并且如果标记信息是1,则相机参数可以基于通过包括在第二语法中接收的参数值更新。在这种情况下,更新的相机参数可用于当前片段或者图片。在这种情况下,参数值可以是相对于相机参数的差分值。
对于另一个示例,可以经由语法接收指示相对于现有的相机参数的差分值对于当前片段或者当前图片是否存在的标记信息。如果标记信息是0,则相机参数可以应用于当前片段或者当前图片,并且如果标记信息是1,则基于相机参数导出的新的相机参数和通过包括在语法中接收的差分值可以应用于当前片段或者当前图片。
按照前面提到的方法,解码设备可以避免重叠相机参数接收,并且可以在视图中在特定时段中共享用于图片(或者片段)的相同的相机参数。
同时,相机参数的值可以基于cp_scale、cp_off、cp_inv_scale_plus_scale和cp_inv_off_plus_off语法元素的至少一个导出。
当相机参数应用于当前片段或者图片时,当前块的视差值基于相机参数导出(S720)。解码设备可以基于前面提到的公式2导出视差值。
解码设备可以基于视差值对相应的块(例如,当前块)执行视图间预测以产生相应的块的预测采样。解码设备可以基于该预测重建相应的块和(当前)图片。
虽然参考其示例性实施例已经特别示出和描述了本发明,但那些本领域技术人员应理解,在不脱离在所附权利要求中所限定的本发明的精神和范围,可以在其中在形式和细节方面进行各种变化。该示例性实施例将认为仅是描述性的含义,且不用于限制目的,并且不意欲限制本发明的技术范围。因此,本发明的范围是由所附权利要求限定的。
当在本发明中以软件实现以上描述的实施例时,以上描述的方案可以使用执行上述功能的模块(过程或者功能)实现。模块可以存储在存储器中,并且由处理器执行。存储器可以内部地或者外部地布置到处理器,并且使用各种公知的装置连接到处理器。

Claims (10)

1.一种3维(3D)解码方法,包括:
经由第一语法接收用于将深度值变换为视差值的相机参数;
确定应用于先前片段或者图片的相机参数是否应用于当前片段或者图片;和
如果所述相机参数被应用于所述当前片段或者图片,则基于所述相机参数导出用于当前块的视差值。
2.根据权利要求1所述的3D解码方法,进一步包括:
经由第二语法接收指示用于所述先前片段或者图片的所述相机参数是否用于所述当前片段或者所述当前图片的标记信息,
其中,如果所述标记信息是1,则所述相机参数应用于所述当前片段或者所述当前图片,和
其中,如果所述标记信息是0,则用于所述当前片段或者所述当前图片的新的相机参数通过被包括在所述第二语法中而接收。
3.根据权利要求2所述的3D解码方法,其中,所述第一语法是视频参数集(VPS)语法,并且所述第二语法是片段分割语法。
4.根据权利要求2所述的3D解码方法,其中,所述第一语法是第一图片参数集(PPS)语法,并且所述第二语法是第二PPS语法。
5.根据权利要求1所述的3D解码方法,进一步包括:
经由第二语法接收指示所述相机参数是否对于所述当前片段或者所述当前图片被更新的标记信息,
其中,如果所述标记信息是0,则所述相机参数不被更新,而是被应用于所述当前片段或者图片,和
其中,如果所述标记信息是1,则基于通过被包括在所述第二语法中接收的参数值更新所述相机参数,并且所述更新的相机参数被应用于所述当前片段或者图片。
6.根据权利要求5所述的3D解码方法,其中,通过被包括在第二语法中接收的参数值是相对于所述相机参数的差分值。
7.根据权利要求1所述的3D解码方法,进一步包括:
经由第二语法接收指示相对于现有的相机参数的差分值对于所述当前片段或者所述当前图片是否存在的标记信息,
其中,如果所述标记信息是0,则所述相机参数被应用于所述当前片段或者当前图片,以及如果所述标记信息是1,则基于所述相机参数和通过被包括在所述第二语法中而接收的差分值导出的新的相机参数被应用于所述当前片段或者所述当前图片。
8.根据权利要求1所述的3D解码方法,其中,基于经由所述第一语法接收的cp_scale、cp_off、cp_inv_scale_plus_scale和cp_inv_off_plus_off语法元素中的至少一个导出所述相机参数值。
9.根据权利要求8所述的3D解码方法,其中,基于以下的公式计算所述视差:
dv=(s*v+o)>>n,
这里dv是视差值,s是比例因子,o是偏移,n是移位参数,其中所述比例因子基于cp_scale语法元素的值或者cp_inv_off_plus_off语法元素的值确定,并且所述偏移基于cp_off语法元素的值或者cp_inv_off_plus_off语法元素的值确定。
10.根据权利要求9所述的3D解码方法,其中,在用于导出在当前视图和具有视图索引j和具有深度采样的视图之间的视差矢量的向后变换的情况下,所述缩放因子基于所述cp_scale语法元素的值确定,以及所述偏移基于所述cp_off语法元素的值确定,和在用于导出在具有视图索引j的视图和具有深度采样的当前视图之间的视差矢量的向前变换的情况下,所述缩放因子基于所述cp_inv_scale_plus_scale语法元素的值确定,以及所述偏移基于所述cp_inv_off_plus_off语法元素的值确定。
CN201580011518.8A 2014-10-08 2015-09-24 在3维视频编码中处理相机参数的方法 Expired - Fee Related CN106105218B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462061161P 2014-10-08 2014-10-08
US62/061,161 2014-10-08
US201462092273P 2014-12-16 2014-12-16
US62/092,273 2014-12-16
PCT/KR2015/010129 WO2016056779A1 (ko) 2014-10-08 2015-09-24 3d 비디오 코딩에서 카메라 파라미터 처리 방법 및 장치

Publications (2)

Publication Number Publication Date
CN106105218A true CN106105218A (zh) 2016-11-09
CN106105218B CN106105218B (zh) 2019-04-09

Family

ID=55653343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580011518.8A Expired - Fee Related CN106105218B (zh) 2014-10-08 2015-09-24 在3维视频编码中处理相机参数的方法

Country Status (6)

Country Link
US (1) US10419779B2 (zh)
EP (1) EP3206401A4 (zh)
JP (1) JP6445026B2 (zh)
KR (1) KR20170069957A (zh)
CN (1) CN106105218B (zh)
WO (1) WO2016056779A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104469167B (zh) * 2014-12-26 2017-10-13 小米科技有限责任公司 自动对焦方法及装置
JP2019535202A (ja) * 2016-10-06 2019-12-05 エルジー エレクトロニクス インコーポレイティド インター予測モードベースの画像処理方法及びそのための装置
CN108184053B (zh) * 2017-12-27 2020-05-26 深圳进化动力数码科技有限公司 嵌入式图像处理方法及装置
EP3554074A1 (en) * 2018-04-13 2019-10-16 Thomson Licensing Methods and apparatus for depth encoding and decoding
CN110876050B (zh) * 2018-08-31 2021-08-20 盎锐(上海)信息科技有限公司 基于3d摄像机的数据处理装置及方法
WO2022211374A1 (ko) * 2021-03-31 2022-10-06 현대자동차주식회사 매핑 기반 비디오 코딩방법 및 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1954606A (zh) * 2004-05-21 2007-04-25 韩国电子通信研究院 通过使用三维立体视频附加数据来发送/接收三维立体数字广播信号的装置和方法
US20110023066A1 (en) * 2009-07-27 2011-01-27 Samsung Electronics Co., Ltd. Method and apparatus for generating 3-dimensional image datastream including additional information for reproducing 3-dimensional image, and method and apparatus for receiving the 3-dimensional image datastream
CN103139588A (zh) * 2011-11-22 2013-06-05 三星电子株式会社 用于3d视频的补充信息编码设备和方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101199498B1 (ko) * 2005-03-31 2012-11-09 삼성전자주식회사 카메라 파라미터를 이용한 다시점 영상의 부호화 장치 및생성 장치, 그 방법과, 이를 수행하기 위한 프로그램이기록된 기록 매체
EP2604036B1 (en) * 2010-08-11 2018-03-07 GE Video Compression, LLC Multi-view signal codec
US9565449B2 (en) * 2011-03-10 2017-02-07 Qualcomm Incorporated Coding multiview video plus depth content
US20130188013A1 (en) 2011-07-22 2013-07-25 Qualcomm Incorporated Mvc based 3dvc codec supporting inside view motion prediction (ivmp) mode
US9007441B2 (en) * 2011-08-04 2015-04-14 Semiconductor Components Industries, Llc Method of depth-based imaging using an automatic trilateral filter for 3D stereo imagers
JP2014528190A (ja) 2011-08-12 2014-10-23 テレフオンアクチーボラゲット エル エム エリクソン(パブル) カメラおよび/または深度パラメータのシグナリング
CN103096047B (zh) * 2011-11-01 2018-06-19 中兴通讯股份有限公司 一种分片层参数集解码及编码方法和装置
US20130127987A1 (en) * 2011-11-18 2013-05-23 Qualcomm Incorporated Signaling depth ranges for three-dimensional video coding
KR20130056808A (ko) 2011-11-22 2013-05-30 삼성전자주식회사 3차원 영상의 부가정보를 부호화/복호화 하는 장치 및 방법
CN103379333B (zh) * 2012-04-25 2018-12-04 浙江大学 编解码方法、视频序列码流的编解码方法及其对应的装置
KR20130120730A (ko) * 2012-04-26 2013-11-05 한국전자통신연구원 변이 공간 영상의 처리 방법
US9596486B2 (en) * 2013-04-05 2017-03-14 Qualcomm Incorporated IRAP access units and bitstream switching and splicing
US9591321B2 (en) * 2013-04-07 2017-03-07 Dolby International Ab Signaling change in output layer sets
KR101357755B1 (ko) 2013-04-15 2014-02-05 세종대학교산학협력단 카메라 파라미터를 이용한 다시점 영상의 부호화 장치 및 생성 장치, 그 방법과, 이를 수행하기 위한 프로그램이 기록된 기록 매체
JP2016523483A (ja) * 2013-06-18 2016-08-08 ヴィド スケール インコーポレイテッド Hevc拡張のためのレイヤ間パラメータセット
WO2015007242A1 (en) * 2013-07-19 2015-01-22 Mediatek Inc. Method and apparatus of camera parameter signaling in 3d video coding
US9906768B2 (en) * 2013-07-26 2018-02-27 Qualcomm Incorporated Use of a depth condition in 3DV codec

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1954606A (zh) * 2004-05-21 2007-04-25 韩国电子通信研究院 通过使用三维立体视频附加数据来发送/接收三维立体数字广播信号的装置和方法
US20110023066A1 (en) * 2009-07-27 2011-01-27 Samsung Electronics Co., Ltd. Method and apparatus for generating 3-dimensional image datastream including additional information for reproducing 3-dimensional image, and method and apparatus for receiving the 3-dimensional image datastream
CN103139588A (zh) * 2011-11-22 2013-06-05 三星电子株式会社 用于3d视频的补充信息编码设备和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GERHARD TECH: "3D-HEVC Draft Text 5", 《JOINT COLLABORATIVE TEAM ON 3D VIDEO CODING EXTENSIONS OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 9TH MEETING: SAPPORO JP》 *

Also Published As

Publication number Publication date
EP3206401A1 (en) 2017-08-16
WO2016056779A1 (ko) 2016-04-14
CN106105218B (zh) 2019-04-09
JP6445026B2 (ja) 2018-12-26
US20160337665A1 (en) 2016-11-17
EP3206401A4 (en) 2018-06-06
US10419779B2 (en) 2019-09-17
KR20170069957A (ko) 2017-06-21
JP2017508371A (ja) 2017-03-23

Similar Documents

Publication Publication Date Title
CN105379282B (zh) 用于纹理译码的先进残余预测(arp)的方法和设备
CN105637870B (zh) 使用不对称运动分割的视频译码技术
CN105122812B (zh) 用于三维(3d)视频译码的高级合并模式
KR102254599B1 (ko) 멀티-뷰 비디오 코딩에 있어서, 뷰 합성 예측 방법 및 이를 이용한 머지 후보 리스트 구성 방법
CN103650505B (zh) 视频译码中的运动向量预测
CN105874799B (zh) 用于3d视频译码的基于块的高级残差预测
CN105556969B (zh) 视频译码中使用视差向量的块识别
CN104025602B (zh) 三维视频译码中用信号通知视图合成预测支持
CN105027571B (zh) 三维视频译码中导出的视差向量
CN105191317B (zh) 视图内以及跨越视图的深度查找表的预测性译码
CN109792533A (zh) 在视频译码中用于仿射运动模型的运动向量预测
CN105122811B (zh) 3d视频译码中的相邻块视差向量导出
CN106105218B (zh) 在3维视频编码中处理相机参数的方法
CN105325001A (zh) 面向深度的视图间运动向量预测
CN104662909A (zh) 用于3d视频的视图间运动预测
JP6542206B2 (ja) マルチビュービデオをデコードするビデオデコード方法及び装置
CN104685883A (zh) 用于3d视频的经视图间预测运动向量
CN105637874B (zh) 解码多视图视频的视频解码装置和方法
CN106063262A (zh) 3d视频译码中的增量dc残差译码的简化
CN104838651A (zh) 可缩放及多视角视频译码中的高级残差预测
CN104769949A (zh) 用于视差向量导出的图片的选择
CN104272741A (zh) 多视图译码和3d译码中的视图相依性
CN104126305A (zh) 用于多视图视频译码mvc兼容三维视频译码3dvc的序列等级信息
CN105850135A (zh) 用于视频译码的视差向量和/或高级残差预测
CN105874788A (zh) 对3d视频译码中较大预测块的逐段dc译码的简化

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190409

Termination date: 20210924