CN118317113A - 全向视频的编码和解码 - Google Patents
全向视频的编码和解码Info
- Publication number
- CN118317113A CN118317113A CN202410246938.5A CN202410246938A CN118317113A CN 118317113 A CN118317113 A CN 118317113A CN 202410246938 A CN202410246938 A CN 202410246938A CN 118317113 A CN118317113 A CN 118317113A
- Authority
- CN
- China
- Prior art keywords
- image
- view
- data
- encoded
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 229
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 abstract description 89
- 230000008569 process Effects 0.000 abstract description 30
- 230000015572 biosynthetic process Effects 0.000 description 18
- 238000003786 synthesis reaction Methods 0.000 description 18
- 238000001914 filtration Methods 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 6
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 239000003550 marker Substances 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000012447 hatching Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 102200158768 rs121908410 Human genes 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 101100183118 Solanum tuberosum 2MBCD gene Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
Abstract
本发明涉及一种用于对来自多个视图的视图的图像(IVk)进行编码的过程,该过程包括以下步骤:选择(C1)第一编码方法或第二编码方法来对来自所述图像的图像数据进行编码;生成(C10、C12a;C10、C12b、C10、C12c)包含指示已选择的是该第一编码方法还是该第二编码方法的信息(flag_proc)的数据信号,以及,如果它是该第一编码方法,则对原始图像数据进行编码(C11a)以便提供编码的原始数据,以及,如果它是该第二编码方法,则对来自通过对这些原始图像数据的图像处理获得的所述图像的处理后图像数据进行编码(C11b),以便提供编码的处理后数据;以及,对描述已应用的图像处理的信息进行编码(C11b)。
Description
本专利申请是下列发明专利申请的分案申请:
申请号:201980064753.X
申请日:2019年09月25日
发明名称:全向视频的编码和解码
技术领域
本发明总体上涉及全向视频领域,比如具体地360°、180°等视频。更具体地,本发明涉及被捕获以生成此类视频的360°、180°等视图的编码和解码,并且涉及未捕获的中间视点的合成。
本发明可以具体但非排他地应用于在AVC和HEVC当前视频编码器及其扩展(MVC、3D-AVC、MV-HEVC、3D-HEVC等)中所实施的视频编码,并且应用于相应的视频解码。
背景技术
为了生成全向视频,比如例如360°视频,通常的做法是使用360°相机。这种360°相机由安装在球形平台上的多个2D(二维)相机形成。每个2D相机捕获3D(三维)场景的特定角度,相机捕获的一组视图使得可以生成代表360°×180°视野的3D场景的视频。也可以使用单个360°相机来捕获360°×180°视野的3D场景。这种视野当然可以更小,例如270°×135°。
随后,此类360°视频允许用户观看场景,就好像他们位于该场景的中心,并在360°范围内环顾四周,从而提供了一种观看视频的新方式。此类视频通常在虚拟现实头戴式耳机(也称为“头戴式设备”HMD)上再现。然而,它们也可以在配备有合适的用户交互装置的2D屏幕上显示。用于捕获360°场景的2D相机的数量取决于使用的平台变化。
为了生成360°视频,将各种2D相机捕获的发散视图首尾相连放置,并考虑到视图之间的重叠,以便创建全景2D图像。此步骤也称为“拼接”。例如,等矩形投影(ERP)是用于获得这种全景图像的一种可能的投影。根据此投影,每个2D相机捕获的视图被投射到球形表面上。其他类型的投影也是可能的,比如立方体映射类型的投影(到立方体面上的投影)。随后,将投射到表面上的视图投射到2D平面上,以便获得2D全景图像,该图像包括在给定时间已捕获的场景的所有视图。
为了增加沉浸感,可以同时使用上述类型的多个360°相机来捕获场景,这些相机以任意方式定位在场景中。360°相机可以是实际相机(也就是说物理对象)或者虚拟相机(在这种情况下,视图是通过视图生成软件获得的)。具体地,这种虚拟相机使得可以生成代表未被实际相机捕获的3D场景的视点的视图。
随后,使用例如以下设备对使用单个360°相机获得的360°视图的图像或使用多个360°相机(实际和虚拟)获得的360°视图的图像进行编码:
-常规的2D视频编码器,例如符合HEVC(“高效视频编码”的缩写)标准的编码器,
-常规的3D视频编码器,例如符合MV-HEVC和3D-HEVC标准的编码器。
考虑到要被编码的一个360°视图的图像的数据量非常大,更不用说要被编码的多个360°视图的图像了,而且使用此类360°视图的3D场景的360°表示具有特定的几何形状,这种编码器在压缩方面不够高效。此外,由于360°相机的2D相机捕获的视图是发散的,上述编码器不适合对360°视图的不同图像进行编码,因为这些编码器几乎不会使用图像间预测。具体而言,在分别由两个2D相机捕获的两个视图之间,几乎没有可以预测的类似内容。因此,360°视图的所有图像以相同的方式压缩。具体地,对于要被编码的当前360°视图的图像,没有在这些编码器中执行分析以确定作为未捕获的中间视图图像合成的一部分,对此图像的全部数据还是此图像的一些数据进行编码是有意义的,该合成将使用编码随后解码的视图的此图像。
发明内容
本发明的目的之一是改正上述现有技术的缺点。
为此,本发明的一个主题涉及一种由编码设备实施的用于对形成多个视图的一部分的视图的图像进行编码的方法,该多个视图同时从不同视角或位置表示3D场景,该方法包括以下:
-选择第一编码方法或第二编码方法用于对所述视图的该图像进行编码,
-生成包含指示选择的是该第一编码方法还是该第二编码方法的信息的数据信号,
-如果选择了该第一编码方法,则对所述视图的该图像的原始数据进行编码,所述第一编码方法提供编码的原始数据,
-如果选择了该第二编码方法:
·则对所述视图的该图像的处理后数据进行编码,所述处理后数据与所述视图的该图像的至少一个剩余区域对应,所述剩余区域是通过对所述视图的该图像的该原始数据应用裁剪获得的,所述第二编码方法提供至少一个编码的剩余区域,
·对所述裁剪的描述信息进行编码,所述描述信息是关于所述剩余区域在所述视图的该图像中的位置的信息,
-所述生成的数据信号进一步包含:
·如果已选择了该第一编码方法,则所述视图的该图像的所述编码的原始数据,
·如果已选择了该第二编码方法,则所述视图的该图像的所述编码的剩余区域以及所述裁剪的编码的所述描述信息。
借助于本发明,在上述类型的要被编码的当前视图的多个图像中,所述图像表示要被编码并因此要信传的非常大数量的数据,对于要被编码的每个视图的每个图像,可能组合两种编码技术:
-第一编码技术,根据该第一编码技术,按常规方式(例如,HEVC,MVC-HEVC,3D-HEVC)对一个或多个视图的图像进行编码,以便分别获得形成质量非常好的视图的重建图像,
-第二创新编码技术,根据该第二创新编码技术,对一个或多个其他视图的图像的处理后数据进行编码,以便在解码时获得不对应于这些图像的原始数据的处理后图像数据,但是具有显著降低这些图像的编码的处理后数据的信传成本的益处。
随后,对于每个其他视图的每个图像(已根据该第二编码方法对其处理后数据进行编码),在解码时将获得的是视图的图像的相应处理后数据,以及在编码时应用于视图的图像的原始数据的图像处理的描述信息。随后可以使用相应的图像处理描述信息来处理这样的处理后数据,以便形成视图的图像,该视图的图像将与根据常规解码的第一方法重建的视图的图像中的至少一个一起使用,使得可以以特别有效且高效的方式合成未捕获的中间视图的图像。
本发明还涉及一种用于由解码设备实施的对代表形成多个视图的一部分的视图的图像的数据信号进行解码的方法,该多个视图同时从不同视角或位置表示3D场景,该方法包括以下:
-在该数据信号中,读取指示将根据第一解码方法还是第二解码方法对所述视图的该图像进行解码的信息,
-如果它是该第一解码方法:
·则在该数据信号中读取与所述视图的该图像相关联的编码数据,
·基于所述编码数据重建所述视图的图像,该重建的视图的所述图像包含所述视图的该图像的原始数据,
-如果它是该第二解码方法:
·则在该数据信号中读取:
-与所述视图的该图像相关联的编码数据,所述编码数据与已经被编码的所述视图的该图像的至少一个剩余区域对应,所述剩余区域是通过对所述视图的当前图像的该原始数据应用裁剪而获得的,
-所述裁剪的描述信息,所述编码描述信息是所述剩余区域在所述视图的该图像中的位置的信息,
·基于编码的所述剩余区域以及所述裁剪的描述信息,重建所述视图的该图像。
应用于所述视图的图像的这种裁剪处理使得可以避免对其原始数据的一部分进行编码,具有显著降低与所述视图的图像相关联的编码数据的传输速率的益处,因为属于已被裁剪的一个或多个区域的数据既不被编码也不被信传到解码器。速率的降低将取决于裁剪的一个或多个区域的尺寸。因此在解码、随后使用相应图像处理描述信息可能处理其处理后数据之后将被重建的视图的图像将不包含其原始数据的全部或者至少将相对于视图的原始图像是不同的。然而,获得以这种方式裁剪的视图的这种图像不会损害中间图像的合成的有效性,该中间图像一旦被重建就将使用所述裁剪视图的这种图像。确实,使用利用常规解码器(例如,HEVC、MVC-HEVC、3D-HEVC)重建的一个或多个图像的这种合成,可以通过所述视图的图像和常规重建的图像在中间视图中检索原始区域。
根据另一个具体实施例:
-该视图的该图像的这些处理后数据是该视图的该图像的至少一个区域的数据,该至少一个区域已根据给定的采样因子并在至少一个给定方向上经历了采样,
-该图像处理的该描述信息包括关于该至少一个采样区域在该视图的该图像中的位置的至少一项信息。
这种处理有利于所述视图的图像的均匀降级,再次此目的是优化由于应用的采样而导致的数据速率的降低,随后对其进行编码。以这种方式采样的视图的这种图像的后续重建不损害中间图像的合成的有效性(该中间图像将使用所述重建的采样视图的这种图像),即使该重建提供与视图的原始图像降级/不同的视图的重建图像,它的原始数据已被采样随后被编码。确实,使用利用常规解码器(例如,HEVC、MVC-HEVC、3D-HEVC)重建的一个或多个图像的这种合成,可以在这些一个或多个常规重建图像中检索对应于所述视图的图像的滤波区域的原始区域。
根据另一个具体实施例:
-该视图的该图像的这些处理后数据是已经历滤波的该视图的该图像的至少一个区域的数据,
-该图像处理的该描述信息包括关于该至少一个滤波区域在该视图的该图像中的位置的至少一项信息。
这种处理有利于删除被认为不必要编码的所述视图的图像的数据,为了优化编码数据的速率的降低,这些编码数据有利地是仅由图像的滤波数据形成的。
以这种方式滤波的视图的这种图像的后续重建不损害中间图像的合成的有效性(该中间图像将使用所述重建的滤波视图的这种图像),即使该重建提供相对于视图的原始图像降级/不同的视图的重建图像,它的原始数据已被滤波随后被编码。确实,使用利用常规解码器(例如,HEVC、MVC-HEVC、3D-HEVC)重建的一个或多个图像的这种合成,可以通过所述视图的图像和常规重建的图像的滤波区域在中间视图中检索原始区域。
根据另一个具体实施例:
-该视图的该图像的这些处理后数据是该视图的该图像的像素,这些像素对应于使用该多个视图中的另一个视图的图像检测到的遮挡,
-该图像处理的该描述信息包括在另一视图的该图像中找到的该视图的该图像的这些像素的指示符。
类似于前述实施例,这种处理有利于删除被认为不必要编码的所述视图的图像的数据,为了优化编码数据的速率的降低,这些编码数据有利地是仅由所述视图的图像的像素形成的,已在所述多个视图中的当前视图的另一图像中检测到它的缺失。
该视图的这种图像的后续重建不损害中间图像的合成的有效性(该中间图像将使用所述视图的这种重建图像),即使该重建提供相对于视图的原始图像降级/不同的视图的重建图像,仅对它的遮挡区域进行编码。确实,使用利用常规解码器(例如,HEVC、MVC-HEVC、3D-HEVC)重建的一个或多个图像的这种合成,可以通过当前视图的图像和常规重建的图像在中间视图中检索原始区域。
根据另一个具体实施例:
-已被编码/解码的视图的图像的处理后数据是通过以下方式计算的像素:
-基于该视图的该图像的这些原始数据,
-基于使用该第一编码/解码方法编码/解码的至少一个其他视图的图像的原始数据,
-并且可能基于至少一个其他视图的图像的原始数据,使用该第二编码/解码方法对该至少一个其他视图的图像的处理后数据进行编码/解码,
-所述图像处理的描述信息包括:
-已计算的视图图像的像素的指示符,
-关于已被用于计算视图图像的像素的原始数据在至少一个其他视图的图像中的位置的信息,已使用该第一编码/解码方法对该至少一个其他视图的图像进行编码/解码,
-并且可能,关于已被用于计算视图图像的像素的原始数据在至少一个其他视图的图像中的位置的信息,已对该至少一个其他视图的处理后数据进行编码/解码,
根据另一具体实施例,将第一视图的图像的处理后数据和至少一个第二视图的图像的处理后数据组合成单个图像。
相应地,相对于上述实施例,根据第二解码方法获得的视图的图像的处理后数据包括第一视图的图像的处理后数据和至少一个第二视图的图像的处理后数据。
根据一个具体实施例:
-视图的图像的编码/解码处理后数据是图像类型数据,
-图像处理的编码/解码的描述信息是图像类型和/或文本类型的数据。
本发明还涉及一种用于对形成多个视图的一部分的视图的图像进行编码的设备,该多个视图同时从不同视角或位置表示3D场景,该编码设备包括处理器,该处理器被配置用于在当前时间实施以下操作:
-选择第一编码方法或第二编码方法用于对所述视图的该图像的数据进行编码,
-生成包含指示选择的是该第一编码方法还是该第二编码方法的信息的数据信号,
-如果选择了该第一编码方法,则对所述视图的该图像的原始数据进行编码,所述第一编码方法提供编码的原始数据,
-如果选择了该第二编码方法:
·则对所述视图的该图像的处理后数据进行编码,所述处理后数据与所述视图的该图像的至少一个剩余区域对应,所述剩余区域是通过对所述视图的该图像的该原始数据应用裁剪获得的,所述第二编码方法提供至少一个编码的剩余区域,
·对所述裁剪的描述信息进行编码,所述描述信息是关于所述剩余区域在所述视图的该图像中的位置的信息,
-所述生成的数据信号进一步包含:
·如果已选择了该第一编码方法,则所述视图的该图像的所述编码的原始数据,
·如果已选择了该第二编码方法,则所述视图的该图像的所述编码的剩余区域以及所述裁剪的编码的所述描述信息。
这种编码设备具体能够实施前述编码方法。
本发明还涉及一种用于对代表形成多个视图的一部分的视图的图像的数据信号进行解码的设备,该多个视图同时从不同视角或位置表示3D场景,该解码设备包括处理器,该处理器被配置用于在当前时间实施以下操作:
-在该数据信号中,读取指示将根据第一解码方法还是第二解码方法对所述视图的该图像进行解码的信息,
-如果它是该第一解码方法:
·则在该数据信号中读取与所述视图的该图像相关联的编码数据,
·基于已读取的所述编码数据重建所述视图的图像,该重建视图的所述图像包含所述视图的该图像的原始数据,
-如果它是该第二解码方法:
·则在该数据信号中读取:
-与所述视图的该图像相关联的编码数据,所述编码数据与已经被编码的所述视图的该图像的至少一个剩余区域对应,所述剩余区域是通过对所述视图的当前图像的该原始数据应用裁剪而获得的,
-所述裁剪的描述信息,所述编码描述信息是所述剩余区域在所述视图的该图像中的位置的信息,
·基于编码的所述剩余区域以及所述裁剪的描述信息,重建所述视图的该图像。
这种解码设备具体能够实施前述解码方法。
本发明还涉及一种包含根据上述编码方法编码的数据的数据信号。
本发明还涉及一种计算机程序,该计算机程序包括用于在处理器执行所述程序时实施根据上述具体实施例中任一项所述的根据本发明的该解码方法或该编码方法的指令。
此程序可以使用任何编程语言,并且可以是源代码、目标代码、或在源代码与目标代码之间的中间代码的形式,诸如呈部分编译的形式或呈任何其他令人期望的形式。
本发明还针对一种计算机可读记录介质或信息介质,该介质包含如以上所提及的计算机程序指令。
该记录介质可以是能够存储程序的任何实体或设备。例如,该介质可以包括存储装置,比如ROM,例如CD ROM或微电子电路ROM,或其他磁记录装置,例如USB密匙或硬盘。
此外,该记录介质可以是可经由电缆或光缆、通过无线电或通过其他装置输送的可传输介质(比如电信号或光信号)。具体地,可以从互联网类型的网络下载根据本发明的程序。
替代性地,该存储介质可以是该程序所并入的集成电路,该电路被适配用于执行或用于执行上述编码方法或解码方法。
附图说明
通过阅读以下仅通过说明性且非限制性示例给出并且以下参照附图描述的若干优选实施例,其他特征和优点将变得更加清晰明显,在附图中:
-图1示出了根据本发明的一个实施例的由编码方法执行的主要动作,
-图2A示出了能够在实施图1的编码方法之后生成的第一类型的数据信号,
-图2B示出了能够在实施图1的编码方法之后生成的第二类型的数据信号,
-图2C示出了能够在实施图1的编码方法之后生成的第三类型的数据信号,
-图3A示出了用于对当前时间可用的视图的所有图像进行编码的方法的第一实施例,
-图3B示出了用于对当前时间可用的视图的所有图像进行编码的方法的第二实施例,
-图4A至图4E各自示出了根据第一实施例的应用于视图图像的处理的示例,
-图5A至图5D各自示出了根据第二实施例的应用于视图图像的处理的示例,
-图6示出了根据第三实施例的应用于视图图像的处理的示例,
-图7示出了根据第四实施例的应用于视图图像的处理的示例,
-图8示出了根据第五实施例的应用于视图图像的处理的示例,
-图9示出了根据第六实施例的应用于视图图像的处理的示例,
-图10示出了实施图1的编码方法的编码设备,
-图11示出了根据本发明的一个实施例的由解码方法执行的主要动作,
-图12A示出了用于对当前时间可用的视图的所有图像进行解码的方法的第一实施例,
-图12B示出了用于对当前时间可用的视图的所有图像进行解码的方法的第二实施例,
-图13示出了实施图11的解码方法的解码设备,
-图14示出了合成视图图像的一个实施例,在该实施例中使用根据图11的解码方法重建的视图图像,
-图15A至图15D各自示出了根据第一实施例的在重建视图图像之后应用于该视图图像的处理的示例,
-图16示出了根据第二实施例的在重建视图图像之后应用于该视图图像的处理的示例,
-图17示出了根据第三实施例的在重建视图图像之后应用于该视图图像的处理的示例,
-图18示出了根据第四实施例的在重建视图图像之后应用于该视图图像的处理的示例。
具体实施方式
本发明主要提出了一种用于对多个视图相应的当前图像进行编码的方案,该多个视图在当前时间表示根据给定位置或给定视角的3D场景,其中两种编码技术可用:
-第一编码技术,根据该第一编码技术,使用常规编码模式,比如例如HEVC、MV-HEVC、3D-HEVC对视图的至少一个当前图像进行编码,
-第二创新编码技术,根据该第二创新编码技术,使用上述类型的常规编码模式和/或任何其他合适的编码模式对视图的至少一个当前图像的处理数据进行编码,以便显著降低该图像的编码数据的信传成本(这是由于在编码步骤之前实施了处理),这些处理数据是由于使用特定图像处理对该图像的原始数据应用了处理得到的。
相应地,本发明提出了一种解码方案,该方案使得可以组合两种解码技术:
-第一解码技术,根据该第一解码技术,使用比如例如HEVC、MV-HEVC、3D-HEVC并且对应于在编码中使用且已被信传给解码器的常规编码模式的常规解码模式重建了编码视图的至少一个当前图像,以便获得质量非常好的视图的至少一个重建图像,
-第二创新解码技术,根据该第二创新解码技术,使用对应于信传给解码器的编码模式即常规编码模式和/或另一合适的编码模式的解码模式对视图的至少一个图像的编码的处理数据进行解码,以便获得处理后图像数据和图像处理的描述信息,该获得的处理后数据源自该图像处理。因此,不同于根据第一解码技术解码的图像数据,在解码时针对该图像获得的处理后数据不对应于其原始数据。
随后将基于此类解码的处理后图像数据和图像处理描述信息重建的视图的图像与该视图的原始图像不同,即,在处理之前,随后对其原始数据进行编码。然而,视图的这种重建图像将构成视图的图像,其与根据第一常规解码技术重建的其他视图的图像一起使用,将使得可以以特别有效且高效的方式合成中间视图的图像。
6.示例性编码方案实施方式
下面描述用于对360°、180°或其他全向视频进行编码的方法,该方法可以使用任何类型的多视图视频编码器,例如,符合3D-HEVC或MV-HEVC标准等。
参考图1,这种编码方法应用于形成多个视图V1……VN的一部分的视图的当前图像,该多个视图表示分别根据多个视角或多个位置/取向的3D场景。
根据一个常见示例,在使用三个全向相机生成视频(例如360°视频)的情况下:
-例如,可以将第一全向相机放置在3D场景的中心,其视角为360°×180°,
-例如,可以将第二全向相机放置在3D场景的左侧,其视角为360°×180°,
-例如,可以将第三全向相机放置在3D场景的右侧,其视角为360°×180°。
根据另一个更非典型示例,在使用三个全向相机生成α°视频(其中0°<α≤360°)的情况下:
-例如,可以将第一全向相机放置在3D场景的中心,其视角为360°×180°,
-例如,可以将第二全向相机放置在3D场景的左侧,其视角为270°×135°,
-例如,可以将第三全向相机放置在3D场景的右侧,其视角为180°×90°。
当然,其他配置也是可能的。
所述多个视图中的至少两个视图可以从同一或不同视角表示3D场景。
根据本发明的编码方法包括在当前时间对以下进行编码:
-视图V1的图像IV1,
-视图V2的图像IV2,
-……,
-视图Vk的图像IVk,
-……,
-视图VN的图像IVN,
所讨论的视图的图像可以同样是纹理图像或深度图像。所讨论的视图的图像,例如图像IVk,包含数量Q(Q≥1)的原始数据(d1k……dQk),比如例如Q个像素。
对于视图Vk的至少一个图像IVk,该编码方法随后包括以下要被编码的:
在C1中,选择用于图像IVk的第一编码方法MC1或第二编码方法MC2。
如果选择了第一编码方法MC1,则在C10中,例如在设置为0的位上对信息flag_proc进行编码,以指示已选择了编码方法MC1。
在C11a中,使用比如例如符合HEVC、MV-HEVC、3D-HEVC等标准的常规编码器对图像IVk的Q个原始数据(像素)d1k……dQk进行编码。完成编码C11a后,获得视图Vk的编码图像IVCk。随后,编码图像IVCk包含Q个编码的原始数据dc1k、dc2k……、dcQk。
在C12a中,生成数据信号F1k。如图2A所示,数据信号F1k包含与第一编码方法MC1的选择有关的信息flag_proc=0,以及编码的原始数据dc1k、dc2k……dcQk。
如果选择了第二编码方法MC2,则在C10中,例如在设置为1的位上对信息flag_proc进行编码,以指示已选择了编码方法MC2。
在C11b中,将编码方法MC2应用于在编码步骤之前进行的图像IVk的处理所得到的数据DTk。
此类数据DTk包括:
-对应于图像IVk的原始数据的全部或一些的图像类型的数据(像素),在编码步骤之前已使用特定图像处理对该图像的原始数据进行处理,在描述中将进一步描述这些数据的各种详细示例,
-在编码步骤C11b之前已应用于图像IVk的图像处理的描述信息,此描述信息例如是文本和/或图像类型。
在完成编码C11b后,获得编码的处理后数据DTCk。它们代表编码的处理后图像IVTCk。
因此,处理后数据DTk不对应于图像IVk的原始数据。
例如,这些处理后数据DTk对应于一图像,该图像的分辨率高于或低于处理之前的图像IVk的分辨率。因此,处理后图像IVk可以例如更大,因为它是基于其他视图的图像获得的,或者相反,可以更小,因为它是由于从图像IVk中删除了一个或多个原始像素而得到的。
根据另一示例,这些处理后数据DTk对应于一图像,该图像的处理后图像IVk的表示格式(YUV、RGB等)与处理之前的图像IVk的原始格式不同,以及用于表示像素的位数(16位、10位、8位等)。
根据又一个示例,这些处理后数据DTk对应于相对于处理之前的图像IVk的原始纹理或颜色分量降级的颜色或纹理分量。
根据又一个示例,这些处理后数据DTk对应于处理之前的图像IVk的原始内容的特定表示,例如图像IVk的滤波后原始内容的表示。
在处理后数据DTk仅是图像数据的情况下,也就是说例如以像素网格的形式,编码方法MC2可以由类似于实施第一编码方法MC1的编码器的编码器来实施。它可以是有损或无损编码器。在处理后数据DTk与图像数据不同,比如例如文本类型的数据,或者包括图像数据和除图像数据之外的类型的数据的情况下,可以通过以下实施编码方法MC2:
-通过无损编码器以便专门对文本类型的数据进行编码,
-通过有损或无损编码器以便专门对图像数据进行编码,这种编码器可能与实施第一编码方法MC1的编码器相同或不同。
在C12b中,生成数据信号F2k。如图2B所示,数据信号F2k包含与第二编码方法MC2的选择有关的信息flag_proc=1以及编码的处理后数据DTCk,在这些数据都是图像数据的情况下。
作为替代方案,在C12c中,在编码的处理后数据DTCk包括图像数据和文本类型的数据两者的情况下,生成两个信号F3k和F'3k。
如图2C所示:
-数据信号F'3包含与第二编码方法MC2的选择有关的信息flag_proc=1以及图像类型的编码的处理后数据DTCk,
-数据信号F'3k包含文本类型的编码的处理后数据DTCk。
随后可以针对可用的要被编码的N个视图的每个图像IV1、IV2……IVN实施上面刚刚描述的编码方法,仅针对这些图像中的一些,或者可能仅限于图像IVk,其中例如k=1。
根据图3A和图3B所示的两个示例性实施例,例如,假设在要被编码的N个图像IV1……IVN中:
-使用第一编码技术MC1对n个第一图像IV1……IVn进行编码:n个第一视图V1到Vn被称为主视图,因为一旦重建,n个主视图的图像将包含其所有原始数据,并且适合与N-n个其他视图中的一个或多个一起使用,以便合成用户所需的任意视图的图像,
-在使用第二编码方法MC2对N-n个其他图像IVn+1……IVN进行编码之前,对这些图像进行处理:处理的这些N-n个其他图像属于所谓的另外视图。
如果n=0,则处理所有视图的所有图像IV1……IVN。如果n=N-1,则处理N个视图中单个视图的图像,例如第一视图的图像。
在完成对N-n个其他图像IVn+1……IVN的处理之后,获得了M-n个处理后数据。如果M=N,则有与要处理的视图一样多的处理后数据。如果M<N,则在处理期间已删除N-n个视图中的至少一个。在这种情况下,在完成根据第二编码方法MC2的编码C11b后,使用无损编码器对与删除的视图的该图像有关的处理后数据进行编码,该无损编码器仅包括指示该图像和该视图的不存在的信息。随后,对于通过处理删除的该图像,使用第二编码方法MC2,使用HEVC、MVC-HEVC、3D-HEVC等类型的编码器,将不对像素进行编码。
在图3A的示例中,在C11a中,使用HEVC类型的常规编码器对n个第一图像IV1……IVn彼此独立地进行编码。在完成编码C11a后,分别获得n个编码图像IVC1……IVCn。在C12a中,分别生成n个数据信号F11……F1n。在C13a中,将这些n个数据信号F11……F1n级联,生成数据信号F1。
如虚线箭头所示,可以在处理N-n个其他图像IVn+1……IV N期间使用图像IV1……IVn。
仍然参考图3A,在C11b中,如果这些M-n个处理后数据都是图像类型,则使用HEVC类型的常规编码器对该M-n个处理后数据DTn+1……DTM彼此独立地进行编码,或者如果它们是图像类型和文本类型两者,则对于图像类型的处理后数据使用HEVC类型的常规编码器对其彼此独立地进行编码,并且对于文本类型的处理后数据通过无损编码器对其进行编码。在完成编码C11b后,获得N-n个编码的处理后数据DTCn+1……DTCN,分别作为分别与N-n个图像IVn+1……IVN相关联的N-n个编码数据。在C12b中,在M-n个处理后数据都是图像类型的情况下,分别生成分别包含N-n个编码的处理后数据DTCn+1……DTCN的N-n个数据信号F2n+1……F2N。在C12c中,在M-n个处理后数据是图像类型和文本类型两者的情况下:
-生成分别包含图像类型的N-n个编码的处理后数据的N-n个数据信号F3n+1……F3N,以及
-生成分别包含文本类型的N-n个编码的处理后数据的N-n个数据信号F'3n+1……F'3N。
在C13c中,将数据信号F3n+1……F3N和F'3n+1……F'3N级联,生成数据信号F3。
在C14中,将信号F1和F2级联,或者将信号F1和F3级联,提供了能够通过解码方法被解码的数据信号F,该解码方法将在说明书中进一步描述。
在图3B的示例中,在C11a中,使用MV-HEVC或3D-HEVC类型的常规编码器同时对n个第一图像IV1……IVn进行编码。在完成编码C11a后,分别获得n个编码图像IVC1……IVCn。在C12a中,生成单个信号F1,该单个信号包含与这n个编码图像中的每一个相关联的编码的原始数据。
如虚线箭头所示,可以在处理N-n个其他图像IVn+1……IV N的过程中使用第一图像IV1……IVn。
仍然参考图3B,在C11b中,如果这些M-n个处理后数据都是图像类型,则使用MV-HEVC或3D-HEVC类型的常规编码器对图像类型的M-n个处理后数据DTn+1……DTM同时进行编码,或者如果它们是图像类型和文本类型两者,则对于图像类型的处理后数据使用MV-HEVC或3D-HEVC类型的常规编码器对其同时进行编码,并且对于文本类型的处理后数据通过无损编码器对其进行编码。在完成编码C11b后,分别获得N-n个编码的处理后数据DTCn+1……DTCN,分别作为分别与已被处理的N-n个图像IVn+1……IVN相关联的N-n个编码的处理后数据。在C12b中,在M-n个处理后数据都是图像类型的情况下,生成包含图像类型的N-n个编码的处理后数据DTCn+1……DTCN的单个信号F2。在C12c中,在M-n个处理后数据是图像类型和文本类型两者的情况下:
-生成信号F3,该信号包含图像类型的编码的处理后数据,
-生成信号F'3,该信号包含文本类型的编码的处理后数据。
在C14中,将信号F1和F2级联,或者将信号F1、F3和F'3级联,提供了能够通过解码方法被解码的数据信号F,该解码方法将在说明书中进一步描述。
当然,编码方法的其他组合是可能的。
根据图3A的一个可能变型,实施编码方法MC1的编码器可以是HEVC类型的编码器,并且实施编码方法MC2的编码器可以是MV-HEVC或3D-HEVC类型的编码器,或者包括MV-HEVC或3D-HEVC类型的编码器和有损编码器。
根据图3B的一个可能变型,实施编码方法MC1的编码器可以是MV-HEVC或3D-HEVC类型的编码器,并且实施编码方法MC2的编码器可以是HEVC类型的编码器,或者包括HEVC类型的编码器和有损编码器。
现在将参考图4A至图4E给出在根据第二编码方法MC2的编码步骤C11b(图1)之前应用于图像IVk的原始数据的处理的第一实施例的描述。
在这些附图所示的示例中,应用于图像IVk的原始数据的处理是在水平或竖直方向上或者同时在两个方向上对该图像的一个或多个区域的裁剪。
在图4A的示例中,图像IVk的左手边界B1和右手边界B2被裁剪,这意味着删除了由边界B1和B2中的每一个形成的图像IVk的矩形区域的像素。
在图4B的示例中,图像IVk的顶边界B3和底边界B4被裁剪,这意味着删除了由边界B3和B4中的每一个形成的图像IVk的矩形区域的像素。
在图4C的示例中,在竖直方向上将裁剪应用于位于图像IVk中的矩形区域Z1。
在图4D的示例中,在水平方向上将裁剪应用于位于图像IVk中的矩形区域Z2。
在图4E的示例中,在水平和竖直方向上将裁剪应用于位于图像IVk中的矩形区域Z3。
要被编码的处理后数据DTk包括:
-图像IVk的剩余区域ZR的像素,这些像素在裁剪(图4A、图4B、图4E)之后未被删除,或者图像IVk的剩余区域Z1R和Z2R(图4C、图4D)的像素,这些像素在裁剪之后未被删除,
-描述所应用裁剪的信息。
在例如图4A、图4B、图4E的情况下,描述所应用裁剪的信息是文本类型,并且包含:
-位于图像IVk的剩余区域ZR中的顶部、最远处为左侧的像素的坐标,
-位于图像IVk的剩余区域ZR中的底部、最远处为右侧的像素的坐标。
在例如图4C和图4D的情况下,描述所应用裁剪的信息包含:
-位于图像IVk的剩余区域Z1R中的顶部、最远处为左侧的像素的坐标,
-位于图像IVk的剩余区域Z1R中的底部、最远处为右侧的像素的坐标,
-位于图像IVk的剩余区域Z2R中的顶部、最远处为左侧的像素的坐标,
-位于图像IVk的剩余区域Z2R中的底部、最远处为右侧的像素的坐标。
随后在C11b(图1)中,由HEVC、3D-HEVC、MV-HEVC等类型的编码器对由位于剩余区域ZR(分别为Z1R和Z2R)中的顶部、最远处为左侧的像素的坐标以及由位于剩余区域ZR(分别为Z1R和Z2R)中的底部、最远处为右侧的像素的坐标限定的矩形区域的原始数据(像素)进行编码。在C11b(图1)中,由无损编码器对所应用裁剪的描述信息的一部分进行编码。
作为变型,描述所应用的裁剪的信息包含要删除的像素的行和/或列的数量,以及这些行和/或列在图像IVk中的位置。
根据一个实施例,要通过裁剪删除的数据的量是固定的。例如,可以决定从所讨论的视图的图像中系统地删除×行和/或Y列。在这种情况下,描述信息仅包含关于针对每个视图是否裁剪的信息。
根据另一个实施例,要通过裁剪删除的数据的量在视图Vk的图像IVk和可用的另一视图的图像之间是可变的。
例如,要通过裁剪删除的数据的量还可能取决于已捕获图像IVk的相机在3D场景中的位置。因此,例如,如果所述N个视图中的另一视图的图像已经由在3D场景中具有与已捕获图像IVk的相机的位置/取向不同的位置/取向的相机捕获,则将例如使用不同于针对图像IVk删除的数据的量的要删除的一定量的数据。
裁剪的应用可以进一步取决于对图像IVk进行编码的时间。在当前时间,例如,可以决定对图像IVk应用裁剪,而在当前时间之前或之后的时间,可以决定不对图像IVk应用这种裁剪或就此而言的任何处理。
最后,在当前时间,裁剪可以应用于一个或多个视图的图像。视图Vk的图像IVk中的裁剪区域可以与当前时间要被编码的另一视图的图像的裁剪区域相同或不同。
现在将参考图5A至图5D给出在根据第二编码方法MC2的编码步骤C11b(图1)之前应用于图像IVk的原始数据的处理的第二实施例的描述。
在这些附图所示的示例中,应用于图像IVk的原始数据的处理是在水平或竖直方向上对该图像的一个或多个区域的下采样。
在图5A的示例中,在竖直方向上将下采样应用于图像IVk的区域Z4。
在图5B的示例中,在水平方向上将下采样应用于图像IVk的区域Z5。
在图5C的示例中,将下采样应用于整个图像IVk。
在图5D的示例中,在水平方向和竖直方向两者上将下采样应用于图像IVk的区域Z6。
要被编码的处理后数据DTk包括:
-下采样的图像数据(像素),
-描述所应用的下采样的信息,比如例如:
-使用的下采样因子,
-使用的下采样方向,
-在图5A、图5B、图5D的情况下,滤波后的区域Z4、Z5、Z6在图像IVk中的位置,或者,
-在图5C的情况下,因此限定该图像的完整区域的位于图像IVk中的顶部、最远处为左侧的像素的坐标以及位于图像IVk中的底部、最远处为右侧的像素的坐标。
随后,在C11b(图1)中,通过HEVC、3D-HEVC、MV-HEVC等类型的编码器对下采样的图像数据(像素)进行编码。在C11b(图1)中,由无损编码器对所应用下采样的描述信息的一部分进行编码。
下采样因子的值可以是固定的或者取决于已捕获图像IVk的相机在3D场景中的位置。因此,例如,如果所述N个视图中的另一视图的图像已经由在3D场景中具有与已捕获图像IVk的相机的位置/取向不同的位置/取向的相机捕获,则将例如使用另一采样因子。
下采样的应用可以进一步取决于对视图Vk的图像进行编码的时间。在当前时间,例如,可以决定对图像IVk应用下采样,而在当前时间之前或之后的时间,可以决定不对视图Vk的图像应用这种下采样或就此而言的任何处理。
最后,在当前时间,下采样可以应用于一个或多个视图的图像。图像IVk中的下采样区域可以与当前时间要被编码的另一视图的图像的下采样区域相同或不同。
现在将参考图6给出在根据第二编码方法MC2的编码步骤C11b(图1)之前应用于图像IVk的原始数据的处理的第三实施例的描述。
在图6所示的示例中,应用于图像IVk的原始数据的处理是通过对该图像进行滤波对轮廓的检测。在图像IVk中例如存在两个轮廓ED1和ED2。以本身已知的方式,这种滤波例如包括以下:
-将轮廓检测滤波器应用于轮廓ED1和ED2,
-应用轮廓ED1和ED2的扩展,以便扩大围绕每个轮廓ED1和ED2的区域,这种区域在图6中用阴影线表示,
-将所有原始数据从图像IVk删除,这些原始数据不形成阴影区域的部分,并因此被认为不需要编码。
随后在此类滤波的情况下,要被编码的处理后数据DTk包括:
-阴影区域中包含的原始像素,
-描述所应用滤波的信息,比如例如不包括在阴影区域中的每个像素的预定义值,例如由预定义值YUV=000表示。
随后,在C11b(图1)中,通过HEVC、3D-HEVC、MV-HEVC等类型的编码器对对应于阴影区域的图像数据(像素)进行编码。在C11b(图1)中,由无损编码器对所应用滤波的描述信息的一部分进行编码。
刚刚关于图像IVk描述的滤波可以应用于所述N个视图中的其他视图的一个或多个图像、从视图的一个图像到视图的另一个图像可以是不同的这些一个或多个图像的区域。
现在将参考图7给出在根据第二编码方法MC2的编码步骤C11b(图1)之前应用于图像IVk的原始数据的处理的第四实施例的描述。
在图7所示的示例中,应用于图像IVk的原始数据的处理是使用N个视图中的另一视图Vp的至少一个图像IVp(1≤p≤N)来检测图像IVk的至少一个区域ZOC的遮挡。
以本身已知的方式,这种遮挡检测包括使用例如视差估计来基于图像IVp寻找图像IVk的区域ZOC。随后例如使用数学形态学算法来扩展被遮挡的区域ZOC。因此扩展的区域ZOC在图7中用阴影线表示。将图像IVk的所有原始数据删除,这些原始数据不形成阴影区域ZOC的部分,并因此被认为不需要编码。
随后在这种遮挡删除的情况下,要被编码的处理后数据DTk包括:
-阴影区域中包含的原始像素,
-描述所应用遮挡删除的信息,比如例如不包括在阴影区域中的每个像素的预定义值,例如由预定义值YUV=000表示。
随后,在C11b(图1)中,通过HEVC、3D-HEVC、MV-HEVC等类型的编码器对对应于阴影区域的图像数据(像素)进行编码。在C11b(图1)中,由无损编码器对所应用遮挡删除的描述信息的一部分进行编码。
现在将参考图8给出在根据第二编码方法MC2的编码步骤C11b(图1)之前应用于图像IVk的原始数据的处理的第五实施例的描述。
在图8所示的示例中,应用于图像IVk的原始数据的处理包括计算像素:
-基于图像IVk的原始像素,
-基于在C11a(图1)中使用第一编码方法MC1编码的一个或多个其他视图的图像IVj(1≤j≤n)的原始像素,
-并且可能基于至少一个其他视图的图像IVl(n+1≤l≤N)的原始像素,在C11b(图1)中使用第二编码方法MC2对该图像的处理后像素进行编码。
随后在这种计算的情况下,要被编码的处理后数据DTk包括:
-已计算的所述视图的图像IVk的像素的指示符,
-关于已用于计算图像IVk的像素的原始像素在图像IVj中的位置的信息,
-以及可能关于已用于计算图像IVk的像素的原始像素在图像IVj中的位置的信息,
前述计算例如包括将视图的图像IVk的原始像素和可能的图像IVl的原始像素从图像IVj的原始像素减去。
现在将参考图9给出在根据第二编码方法MC2的编码步骤C11b(图1)之前应用于图像IVk的原始数据的处理的第六实施例的描述。
在图9所示的示例中,应用于图像IVk的原始数据的处理包括:
-处理图像IVk的原始像素,提供处理后数据DT'k,
-处理视图VS(1≤s≤N)的图像IVs的原始像素,提供处理后数据DTs,
-将图像IVk的处理后数据DT'k和图像IVs的处理后数据DTs合并到单个图像IVone中,在C11b(图1)中使用第二编码方法MC2对该单个图像的获得的原始处理后数据DTk进行编码。
图10示出了编码设备COD的简化结构,该编码设备旨在实施根据本发明的具体实施例中的任一个的编码方法。
根据本发明的一个具体实施例,通过该编码方法执行的动作由计算机程序指令实施。为此,编码设备COD具有计算机的常规架构,并且具体地包括存储器MEM_C、处理单元UT_C,该处理单元配备有例如处理器PROC_C,并且由存储在存储器MEM_C中的计算机程序PG_C驱动。计算机程序PG包括用于在程序由处理器PROC_C执行时实施比如以上描述的编码方法的动作的指令。
在初始化时,计算机程序PG_C的代码指令例如在由处理器PROC_C执行之前被加载到RAM存储器(未示出)中。处理单元UT_C的处理器PROC_C具体地根据计算机程序PG_C的指令实施以上描述的编码方法的动作。
7.示例性解码方案实施方式
下面描述用于对360°、180°或其他全向视频进行解码的方法,该方法可以使用任何类型的多视图视频解码器,例如,符合3D-HEVC或MV-HEVC标准等。
参考图11,这种解码方法应用于代表形成所述多个视图V1……VN的一部分的视图的当前图像的数据信号。
根据本发明的解码方法包括对以下进行解码:
-代表与视图V1的图像IV1相关联的编码数据的数据信号,
-代表与视图V2的图像IV2相关联的编码数据的数据信号,
-……,
-代表与视图Vk的图像IVk相关联的编码数据的数据信号,
-……,
-代表与视图VN的图像IVN相关联的编码数据的数据信号。
要使用前述解码方法重建的所讨论的视图的图像可以同样是纹理图像或深度图像。
该解码方法包括以下:对于代表要重建的视图Vk的至少一个图像IVk的数据信号F1k、F2k或F3k和F'3k:
在D1中,在如分别在图2A、图2B和图2C中示出的数据信号F1k、F2k或F3k和中F'3k读取信息flag_proc,该信息指示已使用第一编码方法MC1还是第二编码方法MC2对图像IVk进行编码。
如果它是信号F1k,则信息flag_proc为0。
在D11a中,在数据信号F1k中读取与编码图像IVCk相关联的编码数据dc1k、dc2k……dcQk。
在D12a中,使用对应于在图1的C11a中应用于编码的编码方法MC1的解码方法MD1,基于在D11a中读取的编码数据dc1k、dc2k……dcQk来重建图像IVDk。为此,使用比如例如符合HEVC、MVC-HEVC、3D-HEVC等标准的常规解码器来重建图像IVk。
在完成解码D12a后,如此重建的图像IVDk包含已在图1的C11a中编码的图像IVk的原始数据d1k、d2k……dQk。
由于图像IVDk与原始图像IVk保持一致,它构成了例如在合成中间视图的上下文中适合使用的主图像。
在D1中,如果它是信号F2k或F3k,则确定的信息flag_proc为1。
如果它是信号F2k,则在D11b中,在数据信号F2k中读取与如图1的C11b中获得的编码的处理后图像IVTCk相关联的编码的处理后数据DTCk。
读取的这些编码的处理后数据DTCk仅是图像类型的数据。
在D12b中,使用对应于在图1的C11b中应用于编码的编码方法MC2的解码方法MD2,基于在D11b中读取的编码数据DTCk来重建处理后图像IVTDk。为此,使用比如例如符合HEVC、MVC-HEVC、3D-HEVC等标准的常规解码器来对编码的数据DTCk进行解码。
在完成解码D12b后,对应于解码数据DTCk的如此重建的处理后图像IVTDk包含在图1的C11b中进行编码之前的图像IVk的处理后数据DTk。
重建的处理后图像IVTDk包含对应于已使用特定图像处理被处理的图像IVk的原始数据的全部或一些的图像数据(像素),已参考图4至图9描述了其各种详细示例。
如果它是信号F3k,则在D11c中读取与编码的处理后图像IVTCk相关联的编码的处理后数据DTCk。
为此:
-在信号F3k中读取图像类型的编码的处理后数据DTCk,
-在信号F′3k中读取编码的处理后数据DTCk,该数据与图像数据不同,比如例如文本类型的数据,或者包括图像数据和除图像数据之外的类型的数据。
使用解码方法MD2在D12b中对编码的处理后数据DTCk进行解码,该方法可以实施为:
-通过有损或无损解码器以便专门对图像数据进行解码,这种解码器可能与实施第一解码方法MD1的解码器相同或不同,
-通过无损解码器以便专门对文本类型的数据进行解码。
在完成解码D12b后,获得以下:
-对应于已解码的图像类型的数据DTCk的如此重建的处理后图像IVTDk,
-对应于在编码C11b(图1)之前应用于图像IVk的处理的描述信息的文本类型的处理后数据。
根据第二解码方法MD2的这种重建的处理后图像IVTDk在处理随后在C11b中编码之前不包含图像IVk的所有原始数据。然而,例如在合成中间图像的上下文中,除了已使用第一解码方法MD1重建的主视图的图像之外,还可以使用根据第二解码方法MD2的视图的这种重建图像,以便获得高质量的视图的合成图像。
随后可以在当前时间针对可用的要被重建的编码图像IVC1、IVC2……IVCN中的每一个实施上面刚刚描述的解码方法,仅针对这些编码图像中的一些,或者可能仅限于图像IVk,其中例如k=1。
根据图12A和图12B所示的两个示例性实施例,例如,假设在要被重建的N个编码图像IVC1……IVCN中:
-使用第一解码技术MD1重建n个第一编码图像IVC1……IVCn,以便分别获得n个主视图中的每一个的图像,
-使用第二解码方法MD2重建N-n个其他编码图像IVCn+1……IVCN,以便分别获得N-n个另外视图中的每一个的图像。
如果n=0,则使用第二解码方法MD2来重建从1到N的视图的图像IVC1……IVCN。如果n=N-1,则使用第二解码方法MD2重建单个视图的图像。
在图12A的示例中,在D100中,在图3A的C14中生成的数据信号F被分为:
-两个数据信号:在图3A中的C13a中生成的数据信号F1和在图3A中的C13b中生成的数据信号F2,
-或者三个数据信号:在图3A中的C13a中生成的数据信号F1和在图3A中的C13c中生成的数据信号F3和F'3。
在信号F1和F2的情况下,在D110a中,数据信号F1进而被分为分别代表视图IVC1……IVCn的n个编码图像的n个数据信号F11……F1n。
在D11a中,在n个数据信号F11……F1n的每一个中,分别确定与这n个编码图像中的每一个相关联的编码的原始数据dc11……dcQ1……dc1n……dcQn。
在D12a中,使用HEVC类型的常规解码器,基于在D11a中读取的图像IVD1……IVDn的各自编码的原始数据来彼此独立地重建这些图像。
仍然参考图12A,在D110b中,数据信号F2进而被分为分别代表N-n个编码的处理后数据DTCn+1……DTCN的N-n个数据信号F2n+1……F2N。
在D11b中,在N-n个数据信号F2n+1……F2N的每一个中,分别读取N-n个编码的处理后数据DTCn+1……DTCN,这些数据分别对应于要被重建的N-n个图像IVn+1……IVN中的每一个。
在D12b中,使用HEVC类型的常规解码器,基于在D11b中读取的N-n个编码的处理后数据DTCn+1……DTCN,彼此独立地分别重建处理后图像。随后获得重建的处理后图像IVTDn+1……IVTDN。
在信号F1、F3和F'3的情况下,在D110a中,数据信号F1进而被分为分别代表n个编码图像IVC1……IVCn的n个数据信号F11……F1n。
在D11a中,在n个数据信号F11……F1n的每一个中,分别读取与这n个编码图像中的每一个相关联的编码的原始数据dc11……dcQ1……dc1n……dcQn。
在D12a中,使用HEVC类型的常规解码器,基于在D11a中读取的图像IVD1……IVDn的各自编码的原始数据来彼此独立地重建这些图像。
在D110c中:
-数据信号F3进而被分为分别代表图像类型的N-n个编码的处理后数据DTCn+1……DTCN的N-n个数据信号F3n+1……F3N。
-数据信号F'3进而被分为分别代表文本或另一类型的N-n个编码的处理后数据DTCn+1……DTCN的N-n个数据信号F'3n+1……F'3N。
在D11c中:
-在N-n个数据信号F3n+1……F3N的每一个中,分别读取图像类型的N-n个编码的处理后数据DTCn+1……DTCN,这些数据分别对应于要被重建的N-n个图像IVn+1……IVN中的每一个,
-在N-n个数据信号F'3n+1……F'3N的每一个中,分别读取文本或另一类型的N-n个编码的处理后数据DTCn+1……DTCN,这些数据分别对应于用于要被重建的N-n个图像IVn+1……IVN中的每一个的处理的描述信息。
在D12b中,使用HEVC类型的常规解码器,基于在D11b中读取的N-n个编码的处理后数据DTCn+1……DTCN,彼此独立地分别重建N-n个处理后图像。随后获得重建的处理后图像IVTDn+1……IVTDN。
同样在D12b中,存在应用于图像IVn+1……IVN中的每一个的处理的重建描述信息,该处理在C11b(图3A)对这些图像进行编码之前,基于使用对应于在编码中使用的无损编码器的解码器在D11c中读取的文本或其他类型的N-n个编码的处理后数据DTCn+1……DTCN。
在图12B的示例中,在D100中,在图3B的C14中生成的数据信号F被分为:
-两个数据信号:在图3B中的C12a中生成的数据信号F1和在图3B中的C12b中生成的数据信号F2,
-或者三个数据信号:在图3B中的C12a中生成的数据信号F1和在图3B中的C12c中生成的数据信号F3和F'3。
在信号F1和F2的情况下,在D11a中,在数据信号F1中,读取编码的原始数据dc11……dcQ1……dc1n……dcQn,这些数据分别与n个编码视图的图像IVC1,i……IVCn,i中的每一个相关联。
在D12a中,使用MV-HEVC或3D-HEVC类型的常规解码器,基于在D11a中读取的图像IVD1,i……IVDn,i的各自编码的原始数据来同时重建这些图像。
在D11b中,在图12B中,在数据信号F2中,读取N-n个编码的处理后数据DTCn+1……DTCN,这些数据分别与要被重建的N-n个视图的图像IVn+1……IVN中的每一个相关联。
在D12b中,使用MV-HEVC或3D-HEVC类型的常规解码器,基于在D11b中读取的N-n个编码的处理后数据DTCn+1……DTCN,同时分别重建N-n个处理后图像。随后获得重建的处理后图像IVTDn+1……IVTDN。
在信号F1、F3和F'3的情况下,在D11a中,在数据信号F1中,读取编码的原始数据dc11……dcQ1……dc1n……dcQn,这些数据分别与n个编码视图的图像IVC1……IVCn中的每一个相关联。
在D12a中,使用MV-HEVC或3D-HEVC类型的常规解码器,基于在D11a中读取的图像IVD1……IVDn的各自编码的原始数据来同时重建这些图像。
在D11c中,在图12B中,在数据信号F3中,读取N-n个编码的处理后数据DTCn+1……DTCN,这些数据分别与要被重建的N-n个图像IVn+1……IVN中的每一个相关联。
在D12b中,使用MV-HEVC或3D-HEVC类型的常规解码器,基于在D11c中读取的N-n个编码的处理后数据DTCn+1……DTCN,同时分别重建处理后图像。随后获得视图的重建的处理后图像IVTDn+1……IVTDN。
同样在D12b中,在图12B中,存在应用于图像IVn+1……IVN中的每一个的处理的重建描述信息,该处理在C11b(图3B)对这些图像进行编码之前,基于在D11c中读取并使用对应于在编码中使用的无损编码器的解码器解码的文本或其他类型的N-n个编码的处理后数据DTCn+1……DTCN。
当然,解码方法的其他组合是可能的。
根据图12A的一个可能变型,实施解码方法MD1的解码器可以是HEVC类型的解码器,并且实施解码方法MD2的解码器可以是MV-HEVC或3D-HEVC类型的解码器。
根据图12B的一个可能变型,实施解码方法MD1的解码器可以是MV-HEVC或3D-HEVC类型的解码器,并且实施解码方法MD2的解码器可以是HEVC类型的编码器。
图13示出了解码设备DEC的简化结构,该解码设备旨在实施根据本发明的具体实施例中的任一个的解码方法。
根据本发明的一个具体实施例,通过该解码方法执行的动作由计算机程序指令实施。为此,解码设备DEC具有计算机的常规架构,并且具体地包括存储器MEM_D、处理单元UT_D,该处理单元配备有例如处理器PROC_D,并且由存储在存储器MEM_D中的计算机程序PG_D驱动。计算机程序PG_D包括用于在程序由处理器PROC_D执行时实施比如以上描述的解码方法的动作的指令。
在初始化时,计算机程序PG_D的代码指令例如在由处理器PROC_D执行之前被加载到RAM存储器(未示出)中。处理单元UT_D的处理器PROC_D具体地根据计算机程序PG_D的指令实施以上描述的解码方法的动作。
根据一个实施例,解码设备DEC例如包括在终端中。
8.本发明在图像处理中的示例性应用
如上面已经解释的,N个重建图像IVD1……IVDn和IVTDn+1……IVTDN可以用于合成用户所需的中间视图的图像。
如图14所示,在用户需要合成任意视图的图像的情况下,在S1中将被认为是主视图的视图的n个第一重建图像IVD1……IVDn传输到图像合成模块。
视图的N-n个重建的处理后图像IVTDn+1……IVTDN为了能够在合成图像中用作视图的另外图像,可能需要在S2中使用分别与这些图像相关联的解码的图像处理描述信息进行处理。
在完成处理S2后,获得视图的N-n个重建图像IVDn+1……IVDN。
随后在S3中将N-n个重建图像IVDn+1……IVDN传输到图像合成模块。
在S4中,使用n个第一重建视图的图像IVD1……IVDn中的至少一个以及可能的N-n个重建视图的N-n个图像IVDn+1……IVDN中的至少一个来合成视图的图像。
随后,在合成S4完成时获得合成视图IVSY的图像。
应当注意的是,n个重建图像IVD1……IVDn也可以经历处理S2。在用户UT需要表示的视角不对应于n个重建图像IVD1……IVDn的一个或多个视角的视图的图像的情况下,这种处理S2可能被证明是必要的。用户UT可以例如请求表示120×90视野的视图的图像,而n个重建图像IVD1……IVDn各自表示360×180的视角。图14中的虚线箭头表示处理重建图像IVD1……IVDn的这种可能性。另外,关于参考图8和图9描述的处理类型,可以在对N-n个其他图像IVn+1……IVN的处理期间使用重建图像IVD1……IVDn。
现在将参考图15A至图15C描述应用于重建的处理后图像IVTDk的数据的处理的第一实施例。这种处理包括获得相应视图的图像IVk的初始分辨率,该图像在图1的C11b中被编码之前已被采样。
在图15A的示例中,假设在编码之前应用的处理是如图5A所示的在竖直方向上对图像IVk的区域Z4的下采样。
应用于重建的处理后图像IVTDk的处理包括对应于图5A中应用的下采样将上采样应用于区域Z4,以便使用描述应用的下采样的信息回到图像IVk的初始分辨率,比如具体地:
-使用的下采样因子,该下采样因子使得可以确定相应的上采样因子,
-使用的下采样方向,该下采样方向使得可以确定相应的上采样方向,
-下采样的区域Z4在图像IVk中的位置。
在图15B的示例中,假设在编码之前应用的处理是如图5B所示的在水平方向上对图像IVk的区域Z5的下采样。
应用于重建的处理后图像IVTDk的处理包括对应于图5B中应用的下采样将上采样应用于区域Z5,以便使用描述应用的下采样的信息回到图像IVk的初始分辨率,比如具体地:
-使用的下采样因子,该下采样因子使得可以确定相应的上采样因子,
-使用的下采样方向,该下采样方向使得可以确定相应的上采样方向,
-下采样的区域Z5在图像IVk中的位置。
在图15C的示例中,假设在编码之前应用的处理是如图5C所示的对整个图像IVk的下采样。
应用于重建的处理后图像IVTDk的处理包括对应于图5C中应用的下采样将上采样应用于图像IVTDk的所有图像数据,以便使用描述应用的下采样的信息回到图像IVk的初始分辨率,比如具体地:
-使用的下采样因子,该下采样因子使得可以确定相应的上采样因子,
-使用的下采样方向,该下采样方向使得可以确定相应的上采样方向。
在图15D的示例中,假设在编码之前应用的处理是如图5D所示的在水平方向和竖直方向两者上对图像IVk的区域Z6的下采样。
应用于重建的处理后图像IVTDk的处理包括对应于图5D中应用的下采样将上采样应用于区域Z6,以便使用描述应用的下采样的信息回到图像IVk的初始分辨率,比如具体地:
-使用的下采样因子,该下采样因子使得可以确定相应的上采样因子,
-使用的下采样方向,该下采样方向使得可以确定相应的上采样方向,
-下采样的区域Z6在图像IVk中的位置。
参考图16,现在将描述应用于重建的处理后图像IVTDk的数据的处理的第二实施例。这种处理包括恢复视图的图像IVk的一个或多个轮廓,该图像在进行编码之前已被滤波。
在图16的示例中,假设在编码之前应用的处理是如图6所示的对图像IVk的轮廓ED1和ED2的滤波。
随后,应用于重建的处理后视图的图像IVTDk的处理包括使用描述应用的滤波的信息来恢复图像IVk的轮廓ED1和ED2,该信息比如具体地每个未滤波像素的预定义值,具体地预定义值YUV=000。
参考图17,现在将描述应用于重建的处理后图像IVTDk的数据的处理的第三实施例。这种处理包括重建视图的图像IVk的像素,在编码之前已根据图8的处理的实施例计算这些像素。
随后,应用于重建的处理后图像IVTDk的处理包括:
-使用已被计算的视图图像IVk的像素的指示符来检索已在编码中计算的所述视图图像IVk的像素,这种指示符是在数据信号中读取的,
-使用关于已用于计算图像IVk的像素的像素在图像IVj(1≤j≤n)中的位置的信息,来检索已使用第一解码方法MD1重建的至少一个其他视图的图像IVj的像素,
-并且可能检索至少一个其他视图的图像IVl(n+1≤l≤N)的像素,已使用第二解码方法MD2对该图像的处理后像素进行解码。
对处理后数据DTk的解码随后包括计算图像IVk的像素:
-基于至少一个其他视图的图像IVj(1≤j≤n)的像素,
-并且可能基于至少一个其他视图的图像IVl(n+1≤l≤N)的像素。
前述计算包括例如将图像IVk的像素与重建图像IVj的像素以及可能地重建图像IVl的像素组合起来。
参考图18,现在将描述应用于重建的处理后图像IVTDk的数据的处理的第四实施例。这种处理包括重建视图的图像IVk的像素,在编码之前已根据图9的处理的实施例计算这些像素。
首先根据第二解码方法MD2将处理应用于重建图像IVDone。它随后包括基于图像IVDone重建图像IVk的像素:
-基于已根据第二解码方法MD2解码的图像IVk的处理后数据DT'k,
-基于已解码的视图VS(1≤s≤N)的图像IVDs的处理后数据DTs。
9.本发明的示例性具体应用
根据第一示例,考虑通过360°类型的六个相机分别捕获具有4096×2048像素的分辨率的视图的六个图像。应用深度估计方法来提供六个相应的360°深度图。
按常规使用第一编码方法MC1对视图V0的图像IV0进行编码,而视图V1、V2、V3、V4、V5的五个其他图像IV1、IV2、IV3、IV4、IV5在编码之前经历了裁剪。应用于图像IV1、IV2、IV3、IV4、IV5中的每一个的处理包括在这些图像中的每一个的右侧和左侧移除固定数量的列,例如200。已选择要移除的列数,使得视角从360°减小到120°。类似地,应用于图像IV1、IV2、IV3、IV4、IV5中的每一个的处理包括分别从这些图像中的每一个的顶部和底部删除固定数量的行,例如100。已选择要删除的行数,使得视角从180°减小到120°。
与图像IV0相关联地将信息flag_proc设置为0,并且与图像IV1、IV2、IV3、IV4、IV5相关联地将信息flag_proc设置为1。
使用HEVC编码器对视图的图像IV0进行编码。生成单个数据信号F10,所述数据信号包含图像IV0的编码的原始数据,并且信息flag_proc=0。
使用HEVC编码器对图像IV1、IV2、IV3、IV4、IV5中的每一个的裁剪之后剩余的区域的数据进行编码。与信息flag_proc=1相关联地生成五个数据信号F21、F22、F23、F24、F25,这五个数据信号分别包含图像IV1、IV2、IV3、IV4、IV5中的每一个的裁剪之后剩余的区域的编码数据。将数据信号F10、F21、F22、F23、F24、F25级联,随后传输到解码器。
五个数据信号F21、F22、F23、F24、F25可以通过以下方式另外包括裁剪区域的坐标:
IV1、IV2、IV3、IV4、IV5:flag_proc=1,点top_left(h,v)=(0+200,0+100),点bot_right(h,v)=(4096-200,2048-100),其中“h”代表水平并且“v”代表竖直。
在解码器处,读取信息flag_proc。
如果flag_proc=0,则使用HEVC解码器重建视图的图像IV0。
如果flag_proc=1,则使用HEVC解码器重建对应于编码的处理后数据的图像IV1、IV2、IV3、IV4、IV5。不对已重建的图像IV1、IV2、IV3、IV4、IV5进行任何处理,因为不可能重建已通过裁剪删除的这些图像的数据。然而,合成算法使用已重建的六个图像IV0、IV1、IV2、IV3、IV4、IV5,以便生成用户所需的任意视图的图像。
在五个数据信号F21、F22、F23、F24、F25另外包括裁剪区域的坐标的情况下,合成算法使用这些坐标来生成用户所需的视图的图像。
根据第二示例,考虑由计算机生成的具有各自分辨率4096×2048像素的10个图像IV0……IV9,以便模拟360°类型的10个相机。决定不处理图像IV0和IV9。图像IV1至IV8的纹理分量本身经历水平方向上2倍且竖直方向上2倍的下采样,并且相应的深度分量本身经历水平方向上4倍且竖直方向上4倍的下采样。因此,图像IV1至IV8的纹理分量的分辨率变为2048×1024,并且图像IV1至IV8的深度分量的分辨率变为1024×512。
处理数据,比如与图像IV1至IV8有关的图像数据,包含图像IV1至IV8的分辨率为2048×1024的8个下采样的纹理分量和图像IV1至IV8的分辨率为1025×512的8个下采样的深度分量。
另外,前述处理数据包含文本类型的数据,该文本类型的数据指示对于视图1至8的每个图像IV1至IV8的下采样因子。它们编写如下:
-IV1至IV8纹理:se_h=2,se_v=2(“se”代表下采样,“h”代表水平,并且“v”代表竖直),
-IV1至IV8深度:se_h=4,ss_v=4。
与图像IV0和IV9相关联地将信息flag_proc设置为0,并且与图像IV1至IV8相关联地将信息flag_proc设置为1。
使用MV-HEVC类型的编码器同时对图像IV0和IV9进行编码,该编码器生成包含信息flag_proc=0以及图像IV0和IV9的编码的原始数据的单个数据信号F1。
与编码的下采样的纹理和深度数据相关联地,使用MV-HEVC类型的编码器也同时对处理数据(比如与图像IV1至IV8有关的图像数据)进行编码,这些处理数据包含图像IV1至IV8的分辨率为2048×1024的8个下采样的纹理分量和图像IV1至IV8的分辨率为1025×512的8个下采样的深度分量,该编码器生成包含信息flag_proc=1的单个数据信号F2。指示视图1至8的每个图像IV1至IV8的下采样因子的文本类型的数据本身进行了无损编码。将数据信号F1和F2级联,随后传输到解码器。
在解码器处,读取信息flag_proc。
如果flag_proc=0,则使用MV-HEVC解码器同时重建图像IV0和IV9。随后获得处于其初始分辨率的重建图像IVD0和IVD9。
如果flag_proc=1,则使用MV-HEVC解码器同时重建图像IV1至IV8,这些图像对应于它们各自编码的下采样的纹理和深度数据。随后获得重建的下采样图像IVDT1至IVDT8。还对对应于8个图像IV1至IV8中的每一个的文本类型的数据进行解码,提供了已用于每个图像IV1至IV8的下采样因子。
随后,使用重建的下采样图像IVDT1至IVDT8的对应下采样因子来处理这些图像。完成处理后,获得重建图像IVD1至IVD8,这些重建图像的8个各自的纹理分量处于其初始分辨率4096×2048,并且其8个各自的深度分量处于其初始分辨率4096×2048。
合成算法使用以其初始分辨率如此重建的10个视图的图像,以便生成用户所需的视图的图像。
根据第三示例,考虑由计算机生成的具有各自分辨率4096×2048像素的3个图像IV0至IV2,以便模拟360°类型的4个相机。随后获得3个纹理分量和3个相应的深度分量。决定不处理图像IV0并且分别提取图像IV1和IV2的遮挡图。为此,在图像IV1与图像IV0之间进行视差估计,以便生成图像IV1的遮挡掩模,也就是说,在图像IV0中未找到的图像IV1的像素。还在图像IV2与图像IV0之间进行视差估计,以便生成图像IV2的遮挡掩模。
处理数据,比如与图像IV1和IV2有关的图像数据,包含图像IV1和IV2的遮挡掩膜的2个纹理分量和图像IV1和IV2的遮挡掩膜的2个深度分量。
与图像IV0相关联地将信息flag_proc设置为0,并且与图像IV1和IV2相关联地将信息flag_proc设置为1。
使用HEVC编码器对图像IV0进行编码。生成单个数据信号F10,所述数据信号包含图像IV0的编码的原始数据,并且信息flag_proc=0。
使用HEVC编码器来对图像IV1、IV2中的每一个的遮挡掩模的图像数据(纹理和深度)进行编码。与信息flag_proc=1相关联地生成两个数据信号F21、F22,这两个数据信号分别包含图像IV1、IV2中的每一个的遮挡掩膜的编码图像数据。将数据信号F10、F21、F22级联,随后传输到解码器。
在解码器处,读取信息flag_proc。
如果flag_proc=0,则使用HEVC解码器重建图像IV0。
如果flag_proc=1,则对应于图像IV1、IV2中的每一个的遮挡掩模的编码图像数据(纹理和深度),使用HEVC解码器重建图像IV1、IV2。不对已重建的图像IV1、IV2进行任何处理,因为不可能重建在完成遮挡删除后已删除的这些图像的数据。然而,合成算法可以使用已重建的图像IV0、IV1、IV2,以便生成用户所需的视图的图像。
根据第四示例,考虑通过360°类型的两个相机分别捕获具有4096×2048像素的分辨率的两个图像IV0和IV1。按常规使用第一编码方法MC1对第一视图的图像IV0进行编码,而在根据第二编码方法MC2对第二视图的图像IV1进行编码之前对其进行处理。这种处理包括以下:
-使用滤波器(比如例如Sobel滤波器)提取图像IV1的轮廓,
-例如使用数学形态学运算符将扩展应用于轮廓,以便增加轮廓周围的区域。
处理数据,比如与图像IV1有关的图像数据,包括轮廓周围的区域内的像素以及分别对应于位于轮廓周围的区域外的像素的被设置为0的像素。
另外,例如以标记信息的形式(例如:YUV=000)生成文本类型的数据,该标记信息指示位于轮廓周围区域之外的像素设置为0。设置为0的像素既不被编码也不被信传给解码器。
使用HEVC编码器对图像IV0进行编码,该编码器生成包含信息flag_proc=0以及图像IV0的编码的原始数据的数据信号F1。
使用HEVC编码器对图像IV1的轮廓周围的区域的图像数据进行编码,而使用无损编码器对标记信息进行编码。随后生成数据信号F2,所述信号包含信息flag_proc=1、图像IV1的轮廓周围的区域的编码像素、以及编码标记信息。
在解码器处,读取信息flag_proc。
如果flag_proc=0,则使用HEVC解码器以图像IV0的原始分辨率重建该图像。
如果flag_proc=1,则对应于图像IV1的轮廓周围的区域的图像数据,通过HEVC解码器使用标记信息来重建图像IV1,该标记信息使得可以恢复所述区域周围的像素的设置为0的值。
合成算法可以使用已重建的两个图像IV0和IV1,以便生成用户所需的视图的图像。
根据第五示例,考虑通过360°类型的四个相机分别捕获具有4096×2048像素的分辨率的四个图像IV0至IV3。按常规使用第一编码方法MC1对图像IV0进行编码,而在根据第二编码方法MC2对图像IV1至IV3进行编码之前对其进行处理。这种处理是对图像IV1至IV3的滤波,在滤波期间,计算感兴趣区域ROI。感兴趣区域包含每个图像IV1至IV3的一个或多个区域,这些区域被认为是最相关的,例如,因为它们包含许多细节。
例如,根据以下两种方法之一执行这种滤波:
-通过滤波计算每个图像IV1至IV3的显着图,
-对每个图像IV1至IV3的深度图进行滤波:对于每个纹理像素,深度图的特征在于3D场景中的近或远深度值。定义阈值,使得位于该阈值以下的图像IV1、IV2、IV3的每个像素与场景中接近相机的对象相关联。随后,将位于该阈值以下的所有像素视为感兴趣的区域。
处理数据,比如与图像IV1至IV3有关的图像数据,包括其感兴趣的各自区域内的像素以及分别对应于位于这些感兴趣区域外的像素的被设置为0的像素。
另外,例如以标记信息的形式生成文本类型的数据,该标记信息指示位于感兴趣区域之外的像素设置为0。设置为0的像素既不被编码也不被信传给解码器。
使用HEVC编码器对图像IV0进行编码,该编码器生成包含信息flag_proc=0以及图像IV0的编码的原始数据的数据信号F10。
使用HEVC编码器对每个图像IV1、IV2、IV3的感兴趣区域的图像数据进行编码,而使用无损编码器对标记信息进行编码。与信息flag_proc=1相关联地生成三个数据信号F21、F22、F23以及相应的编码标记信息,这些数据信号分别包含图像IV1、IV2、IV3中的每一个的感兴趣区域的编码图像数据。将数据信号F10、F21、F22、F23级联,随后传输到解码器。
在解码器处,读取信息flag_proc。
如果flag_proc=0,则使用HEVC解码器以图像IV0的原始分辨率重建该图像。
如果flag_proc=1,则对应于每个图像IV1至IV3的各自感兴趣区域的图像数据,通过HEVC解码器使用标记信息来重建这些图像,该标记信息使得可以恢复所述区域周围的像素的设置为0的值。
合成算法可以直接使用已重建的四个图像IV0、IV1、IV2、IV3,以便生成用户所需的视图的图像。
不言而喻,已经仅以完全非限制性指示的方式给出了上文中所描述的实施例,并且本领域的技术人员可以容易地进行许多修改,而不另外以其他方式脱离本发明的范围。
Claims (12)
1.一种由编码设备实施的用于对形成多个视图的一部分的视图的图像进行编码的方法,该多个视图同时从不同视角或位置表示3D场景,该方法包括以下:
-选择(C1)第一编码方法或第二编码方法用于对所述视图的该图像进行编码,
-生成(C10、C12a;C10、C12b;C10、C12c)包含指示选择的是该第一编码方法还是该第二编码方法的信息的数据信号,
-如果选择了该第一编码方法,则对所述视图的该图像的原始数据进行编码(C11a),所述第一编码方法提供编码的原始数据,
-如果选择了该第二编码方法:
·则对所述视图的该图像的处理后数据进行编码(C11b),所述处理后数据与所述视图的该图像的至少一个剩余区域对应,所述剩余区域是通过对所述视图的该图像的该原始数据应用裁剪获得的,所述第二编码方法提供至少一个编码的剩余区域,
·对所述裁剪的描述信息进行编码(C11b),所述描述信息是关于所述剩余区域在所述视图的该图像中的位置的信息,
-所述生成的数据信号进一步包含:
·如果已选择了该第一编码方法,则所述视图的该图像的所述编码的原始数据,
·如果已选择了该第二编码方法,则所述视图的该图像的所述编码的剩余区域以及所述裁剪的编码的所述描述信息。
2.如权利要求1所述的方法,其中:
-所述视图的该图像的该剩余区域与对所述视图的该图像应用所述裁剪之后尚未删除的所述视图的该图像的像素对应。
3.如权利要求1所述的方法,其中所述裁剪的描述信息包括位于所述视图的该图像的所述剩余区域中顶部最左侧的像素的一些坐标,以及位于所述视图的该图像的剩余区域中底部最右侧的另一像素的一些坐标。
4.如权利要求1所述的方法,其中所述裁剪的该描述信息包含在所述视图的该图像中删除的多个像素的行和/或列,以及在所述视图的该图像中的所述行和/或列的位置。
5.如权利要求1所述的方法,其中所述裁剪被配置为删除所述视图的当前图像的固定数量的像素。
6.一种由解码设备实施的用于对代表形成多个视图的一部分的视图的图像的数据信号进行解码的方法,该多个视图同时从不同视角或位置表示3D场景,该方法包括以下:
-在该数据信号中,读取(D1)指示将根据第一解码方法还是第二解码方法对所述视图的该图像进行解码的信息,
-如果它是该第一解码方法:
·则在该数据信号中读取(D11a)与所述视图的该图像相关联的编码数据,
·基于所述编码数据重建(D12a)所述视图的图像,该重建的视图的所述图像包含所述视图的该图像的原始数据,
-如果它是该第二解码方法:
·则在该数据信号中读取(D11b;D11c):
-与所述视图的该图像相关联的编码数据,所述编码数据与已经被编码的所述视图的该图像的至少一个剩余区域对应,所述剩余区域是通过对所述视图的当前图像的该原始数据应用裁剪而获得的,
-所述裁剪的描述信息,所述编码描述信息是所述剩余区域在所述视图的该图像中的位置的信息,
·基于编码的所述剩余区域以及所述裁剪的描述信息,重建(D12b)所述视图的该图像。
7.如权利要求6所述的方法,其中该剩余区域与对所述视图的该图像应用所述裁剪之后尚未删除的所述视图的该图像的像素对应。
8.如权利要求6所述的方法,其中所述裁剪的描述信息包括位于所述视图的该图像的所述剩余区域中顶部最左侧的像素的一些坐标,以及位于所述视图的该图像的剩余区域中底部最右侧的另一像素的一些坐标。
9.如权利要求6所述的方法,其中所述裁剪的该描述信息包含在所述视图的该图像中删除的多个像素的行和/或列,以及在所述视图的该图像中的所述行和/或列的位置。
10.一种用于对形成多个视图的一部分的视图的图像进行编码的设备,该多个视图同时从不同视角或位置表示3D场景,所述设备包括处理器,该处理器被配置用于实施以下操作:
-选择第一编码方法或第二编码方法用于对所述视图的该图像的数据进行编码,
-生成包含指示选择的是该第一编码方法还是该第二编码方法的信息的数据信号,
-如果选择了该第一编码方法,则对所述视图的该图像的原始数据进行编码,所述第一编码方法提供编码的原始数据,
-如果选择了该第二编码方法:
·则对所述视图的该图像的处理后数据进行编码,所述处理后数据与所述视图的该图像的至少一个剩余区域对应,所述剩余区域是通过对所述视图的该图像的该原始数据应用裁剪获得的,所述第二编码方法提供至少一个编码的剩余区域,
·对所述裁剪的描述信息进行编码,所述描述信息是关于所述剩余区域在所述视图的该图像中的位置的信息,
-所述生成的数据信号进一步包含:
·如果已选择了该第一编码方法,则所述视图的该图像的所述编码的原始数据,
·如果已选择了该第二编码方法,则所述视图的该图像的所述编码的剩余区域以及所述裁剪的编码的所述描述信息。
11.一种用于对代表形成多个视图的一部分的视图的图像的数据信号进行解码的设备,该多个视图同时从不同视角或位置表示3D场景,所述设备包括处理器,该处理器被配置用于实施以下操作:
-在该数据信号中,读取指示将根据第一解码方法还是第二解码方法对所述视图的该图像进行解码的信息,
-如果它是该第一解码方法:
·则在该数据信号中读取与所述视图的该图像相关联的编码数据,
·基于已读取的所述编码数据重建所述视图的图像,该重建视图的所述图像包含所述视图的该图像的原始数据,
-如果它是该第二解码方法:
·则在该数据信号中读取:
-与所述视图的该图像相关联的编码数据,所述编码数据与已经被编码的所述视图的该图像的至少一个剩余区域对应,所述剩余区域是通过对所述视图的当前图像的该原始数据应用裁剪而获得的,
-所述裁剪的描述信息,所述编码描述信息是所述剩余区域在所述视图的该图像中的位置的信息,
·基于编码的所述剩余区域以及所述裁剪的描述信息,重建所述视图的该图像。
12.一种存储介质,该存储介质是计算机可读取的,并且包括计算机程序,当该计算机程序在计算机上执行时,实施如权利要求1至9中任一项所述的方法的步骤。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1859067 | 2018-10-01 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980064753.XA Division CN112806015B (zh) | 2018-10-01 | 2019-09-25 | 全向视频的编码和解码 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118317113A true CN118317113A (zh) | 2024-07-09 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6630891B2 (ja) | 明視野画像ファイルを符号化および復号するためのシステムおよび方法 | |
US20240007653A1 (en) | Method and apparatus for reconstructing 360-degree image according to projection format | |
US10904570B2 (en) | Method for encoding/decoding synchronized multi-view video by using spatial layout information and apparatus of the same | |
CN109997358B (zh) | 用于自由视点视频流式传输的以解码器为中心的uv编解码器 | |
EP3669333A1 (en) | Sequential encoding and decoding of volymetric video | |
RU2729966C1 (ru) | Способы, устройства и машиносчитываемый носитель для кодирования и декодирования видеосигнала | |
US20150237323A1 (en) | 3d video representation using information embedding | |
US11973981B2 (en) | Coding and decoding of an omnidirectional video | |
US20200267385A1 (en) | Method for processing synchronised image, and apparatus therefor | |
KR20180101123A (ko) | 영상 부호화 또는 복호화하기 위한 장치 및 방법 | |
JP2021510281A (ja) | ビデオビットストリームの復号化、生成方法および装置、記憶媒体、電子機器 | |
CN111034198B (zh) | 图像编码和解码方法、编码和解码设备及对应计算机程序 | |
US20150326873A1 (en) | Image frames multiplexing method and system | |
US20230308682A1 (en) | Methods and devices for coding and decoding a multi-view video sequence | |
KR20200144401A (ko) | 3차원 데이터를 압축하는 방법 및 장치 및 3차원 데이터를 재구성하는 방법 및 장치 | |
CN118317113A (zh) | 全向视频的编码和解码 | |
CN111630862B (zh) | 用于对表示全向视频的多视图视频序列进行编码和解码的方法和设备 | |
CN115428456A (zh) | 用于编码和解码多视图视频序列的方法和设备 | |
CN114731416A (zh) | 用于对体积视频进行编码、传输和解码的方法和装置 | |
US20230065861A1 (en) | Method and device for processing multi-view video data | |
US11064218B2 (en) | Method and apparatus for encoding/decoding image for virtual view synthesis | |
KR20240089176A (ko) | 인코딩 및 디코딩 방법, 인코더, 디코더 및 저장 매체 | |
CN114208151A (zh) | 用于处理多视图视频数据的方法及设备 | |
CN114731424A (zh) | 用于对体积视频进行编码、传输和解码的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication |