CN111034202A - 图像编码和解码方法、编码和解码设备及对应计算机程序 - Google Patents
图像编码和解码方法、编码和解码设备及对应计算机程序 Download PDFInfo
- Publication number
- CN111034202A CN111034202A CN201880055133.5A CN201880055133A CN111034202A CN 111034202 A CN111034202 A CN 111034202A CN 201880055133 A CN201880055133 A CN 201880055133A CN 111034202 A CN111034202 A CN 111034202A
- Authority
- CN
- China
- Prior art keywords
- region
- current block
- encoding
- decoding
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及对被分割成多个块的图像(ICj)进行编码,所述图像包含不同的第一区域和第二区域(Z1,Z2)。该编码的特征在于该编码针对该图像的至少一个当前块(Bu)实施以下操作:确定(C4)该当前块属于该第一区域和该第二区域中的哪个区域;如果该当前块属于该第一区域(Z1),则借助于第一编码方案(MC1)对该当前块进行编码(C5a));如果该当前块属于该第二区域(Z2),则借助于第二编码方案(MC2)对该当前块进行编码(C5b)),该第二编码方案包括以下操作:根据该当前块在该第二区域中的位置,标识(C51b))位于该图像的第一区域中的先前已被编码然后被解码的块(B参考);以及复制与所标识的块相关联的至少一个编码参数(PRC1)的值。
Description
技术领域
本发明总体上涉及图像处理领域,并且更确切地涉及对数字图像的参数的编码和解码,无论这些数字图像是固定的还是形成数字图像序列的一部分。
对此类图像参数的编码/解码尤其适用于由至少一个视频序列产生的图像,该至少一个视频序列包括:
-由同一个相机产生且在时间上彼此相接的图像(2D类型的编码/解码),
-由根据不同视图定向的各个相机产生的图像(3D类型的编码/解码),
-相应的纹理分量和深度分量(3D类型的编码/解码),
-通过360°视频投影获得的图像,
-等…
本发明以类似的方式适用于对2D类型或3D类型的图像参数的编码/解码。
本发明可以尤其但不排他地适用于当前AVC(“Advanced Video Coding(高级视频编码)”的英文缩写)视频编码器和HEVC(“High Efficiency Video Coding(高效视频编码)”的英文缩写)视频编码器及其扩展(MVC、3D-AVC、MV-HEVC、3D-HEVC等)中实施的视频编码,并且适用于相应的解码。
背景技术
当前视频编码器(MPEG、H.264、HEVC、…)使用对视频序列的分块表示。图像被分割成多个块,这些块可以以例如如HEVC标准中的递归方式被再次分割。
对于要被编码的当前块,借助于由编码器(诸如例如其目的是在无损的情况下对与这个块相关联的图像参数进行编码的熵编码器)实施的适当编码方案以位的形式对这些参数进行编码。
此类参数例如是:
-当前块的像素的残差预测系数,
-当前块的预测模式(帧内预测、帧间预测、执行不向解码器传输信息的预测的默认预测(英文为“skip(跳过)”),
-指定当前块的预测类型的信息(定向、参考图像、…),
-当前块的分割类型,
-当前块的运动信息(如果需要的话)
-等。
在熵编码之后获得的位被写入旨在被传输至解码器的数据信号中。
一旦已编码数据信号已经被解码器接收,则逐图像地并且针对每个图像逐块地完成解码。对于每个块,读取表示与块相关联的图像参数的位,并且然后借助于由解码器实施的解码方案对这些位进行解码。
针对所考虑的每种图像类型或图像格式实施特定的编码。因此例如,AVC和HEVC编码器/解码器被适配成用于对由同一个相机产生且在时间上彼此相接的2D图像进行编码/解码。这种编码器/解码器还被适配成用于对以下内容进行编码/解码:
-通过立体视频的投影获得的图像,并且每个图像包括表示同一个场景的两个视图,这两个视图旨在分别通过用户的左眼和右眼观看;
-通过360°立体视频的二维投影获得的图像等…。
根据另一示例,3D-HEVC编码器/解码器被适配成用于对3D图像(诸如由根据不同视图定向的各个相机产生的3D图像、相应的纹理分量和深度分量、由单一的360°视频产生的图像等…)进行编码/解码。
通过针对所考虑的图像格式或图像类型如此提出非常特定类型的编码/解码,当前的编码器/解码器获得的编码/解码性能不是令人满意的。
因此,本发明设想了一种编码器/解码器,该编码器/解码器提出针对由给定类型或给定格式的视频内容产生的当前图像使用两种不同的编码/解码方案,同时使得可以优化当前图像的编码/解码性能。
发明内容
本发明的目的之一是补救前述现有技术的缺点。
为此,本发明的主题涉及一种用于对被分割成多个块的图像进行编码的方法,所述图像包含第一不同区域和第二不同区域。
这种编码方法值得注意的是其针对该图像的至少一个当前块实施以下操作:
-确定该当前块属于该第一区域和该第二区域中的哪个区域,
-如果该当前块属于该第一区域,则借助于第一编码方案对该当前块进行编码,
-如果该当前块属于该第二区域,则借助于第二编码方案对该当前块进行编码,该第二编码方案包括以下操作:
-基于该当前块在该第二区域中的位置,标识位于该图像的第一区域中的先前已被编码然后被解码的块,
-复制与所标识的块相关联的至少一个编码参数的值。
这种规定使得能够在同一个编码器中选择编码方案,该编码方案最适合于最初捕捉该图像所表示的场景的方式。
例如,如果当前图像是二维图像,则决定:
-在此图像源自包括在时间上彼此相接的2D图像的视频的情况下,选择在编码器中实施的第一编码方案,诸如AVC或HEVC类型的常规方案;
-在该图像是通过根据覆盖例如360°角度的多个视角捕获的立体视频的投影而获得的情况下(该图像由与用户的左眼和右眼相对应的两个图像区域形成),根据当前块是位于该图像的第一区域还是第二区域来在编码器中选择前述第一编码方案或第二编码方案。
凭借本发明,因此可以提出对视频内容进行的自适应编码(该自适应编码考虑了视频内容格式)。此外,针对某些类型的内容格式,本发明有利地使得可以根据当前时刻要被编码的图像区域对当前图像应用自适应编码,第一区域的至少一个当前块根据第一编码方案来编码,并且此图像的第二区域的至少一个当前块根据第二编码方案来编码。
有利地,使用的第二编码方案使得可以利用当前图像的第二区域与第一区域之间存在的空间相关性,针对第二区域的当前块复制位于第一区域中的块的至少一个编码参数的值。因此,没有必要对当前块的这种编码参数的值进行编码。这导致图像的较高性能编码,因为这种编码的比特率更精确、复杂性更小并且更便宜。
根据特定实施例,将该第二编码方案应用于该当前图像的第二区域中的所有块。
这种规定使得可以就在编码器处实施的编码的比特率而言,优化了复杂性的降低和成本的降低。
根据另一特定实施例,该编码方法实施以下操作:
-借助于该第一编码方案对该图像的第二区域中的所述至少一个当前块进行编码,
-根据预先确定的编码性能标准选择该第一编码方案或该第二编码方案,
-对表示所述选择的信息项进行编码。
考虑到第一编码方案和第二编码方案被置于竞争状态的事实,尽管在当前块已经将第二编码方案初始地应用于编码器,但是使得编码方法更加灵活,从而提高了编码效率。
根据又另一特定实施例,该图像的第一区域和第二区域具有相同的形状,该第一区域位于该第二区域的上方、并且通过沿着该图像的中间延伸的水平边界与该第二区域分开。
当前图像的第一区域和第二区域的这种空间布置使得可以通过根据第二区域的当前块的位置精确地预先定义该图像的第一区域的已经被编码然后被解码的块的位置来优化编码性能。
实施例的各种前述模式或特性可以独立地或彼此组合地添加到在诸如上文所定义的编码方法的过程中实施的操作中。
相关地,本发明涉及一种用于对被分割成多个块的至少一个图像进行编码的设备,所述图像包含第一不同区域和第二不同区域。
这种编码设备值得注意的是其包括处理电路,该处理电路被设计用于针对该图像的至少一个当前块实施以下操作:
-确定该当前块属于该第一区域和该第二区域中的哪个区域,
-如果该当前块属于该第一区域,则借助于第一编码方案对该当前块进行编码,
-如果该当前块属于该第二区域,则借助于第二编码方案对该当前块进行编码,该第二编码方案包括以下操作:
-基于该当前块在该第二区域中的位置,标识位于该图像的第一区域中的先前已被编码然后被解码的块,
-复制与所标识的块相关联的至少一个编码参数的值。
以相对应的方式,本发明还涉及一种用于对表示被分割成多个块的已经被编码的图像的数据信号进行解码的方法,所述至少一个图像包含第一不同区域和第二不同区域。
这种解码方法值得注意的是其针对该图像的要被解码的至少一个当前块实施以下操作:
-确定该当前块属于该第一区域和该第二区域中的哪个区域,
-如果该当前块属于该第一区域,则借助于第一解码方案对该当前块进行解码,
-如果该当前块属于该第二区域,则借助于第二解码方案对该当前块进行解码,该第二解码方案包括以下操作:
-基于该当前块在该第二区域中的位置,标识位于该图像的第一区域中的先前已被解码的块,
-向该当前块指派与所述标识的块相关联的至少一个解码参数。
根据特定实施例,将该第二解码方案应用于该当前图像的第二区域中的所有块。
根据另一特定实施例,如果针对该第二区域中的当前块在该数据信号中读取到关于选择该第二解码方案的信息项,则将该第二解码方案应用于该当前块;如果针对该第二区域中的当前块在该数据信号中读取到关于选择所述第一解码方案的信息项,则将该第一解码方案应用于该当前块。
根据又另一特定实施例,该图像的第一区域和第二区域具有相同的形状,该第一区域位于该第二区域的上方、并且通过沿着该图像的中间延伸的水平边界与该第二区域分开。
实施例的各种前述模式或特性可以独立地或彼此组合地添加到在诸如上文所定义的解码方法的过程中实施的操作中。
相关地,本发明涉及一种用于对表示被分割成多个块的已经被编码的图像的数据信号进行解码的设备,所述至少一个图像包含第一不同区域和第二不同区域。
这种解码设备的特征在于该解码设备包括处理电路,该处理电路被设计用于针对该图像的要被解码的至少一个当前块实施以下操作:
-确定该当前块属于该第一区域和该第二区域中的哪个区域,
-如果该当前块属于该第一区域,则借助于第一解码方案对该当前块进行解码,
-如果该当前块属于该第二区域,则借助于第二解码方案对该当前块进行解码,该第二解码方案包括以下操作:
-基于该当前块在该第二区域中的位置,标识位于该图像的第一区域中的先前已被解码的块,
-向该当前块指派与所述标识的块相关联的至少一个解码参数。
本发明进一步涉及一种计算机程序,该计算机程序包括指令,当该计算机程序在计算机上执行时,这些指令用于实施根据本发明的编码方法和解码方法之一。
这种程序可以使用任何编程语言,并且可以采用源代码、目标代码、或在源代码与目标代码之间的中间代码的形式,诸如,采用部分编译的形式或者采用任何其他期望的形式。
本发明的又另一主题还设想了一种记录介质,该记录介质可由计算机读取并且包括如上文所提及的计算机程序指令。
该记录介质可以是能够存储程序的任何实体或设备。例如,该介质可以包括存储装置(诸如ROM(例如,CD ROM或微电子电路ROM))或其他磁记录装置、数字记录装置(例如,USB密钥或硬盘)。
而且,这种记录介质可以是可以经由电缆或光缆、通过无线电或通过其他手段输送的可传输介质(诸如电信号或光信号)。根据本发明的程序可以具体地通过互联网类型的网络进行下载。
可替代地,这种记录介质可以是该程序所并入的集成电路,该电路被适配成用于执行正在讨论的方法或者在该方法执行时使用。
附图说明
其他特性和优点将在阅读参考附图所描述的优选实施例后变得明显,在附图中:
-图1A表示根据本发明的第一实施例的编码方法的进展,
-图1B表示根据本发明的第二实施例的编码方法的进展,
-图2A表示根据本发明的第一实施例的编码设备,
-图2B表示根据本发明的第二实施例的编码设备,
-图3A至3C各自表示当前图像中要被编码或要被解码的不同区域的示例,
-图4表示在图1A和1B的编码方法中实施的示例性常规编码方案,
-图5A和5B各自表示在将根据本发明的(诸如在图1A和1B的编码方法中或者在图6A和6B的解码方法中实施的)编码方案或解码方案应用于当前块期间,对当前图像中参考块的标识的两个不同示例,
-图6A表示根据本发明的第一实施例的解码方法的进展,
-图6B表示根据本发明的第二实施例的解码方法的进展,
-图7A表示根据本发明的第一实施例的解码设备,
-图7B表示根据本发明的第二实施例的解码设备,
-图8表示在图6A和6B的解码方法中实施的示例性常规解码方案。
具体实施方式
编码部分的具体实施方式
现在将对本发明的第一实施例进行描述,在该实施例中,根据本发明的编码方法用于根据二进制流对图像或图像序列进行编码,该二进制流与通过在符合当前或未来视频编码标准中的任何一项的编码器中实施的编码而获得的二进制流相近。
在此实施例中,例如采用软件或硬件方式通过对这种编码器进行修改来实施根据本发明的编码方法。采用包括诸如图1A中所表示的操作C1至C6a)或操作C1至C6b)的算法的形式来表示根据本发明的第一实施例的编码方法。
根据本发明的第一实施例,在图2A中所表示的编码设备或编码器CO中实施该编码方法。
如在图2A中所展示的,编码器CO包括存储器MEM_C(该存储器包括缓冲存储器MT_C)、由计算机程序PG_C驱动的处理器PROC_C,该处理器实施根据本发明的编码方法。在初始化时,计算机程序PG_C的代码指令例如在由处理器PROC_C执行之前被加载到RAM存储器(表示为MR_C)中。
图1A中所表示的编码方法适用于任何当前图像ICj,该当前图像是固定的或者形成要被编码的L个图像IC1、…、ICj、…、ICL(1≤j≤L)的序列的一部分。
当前图像ICj由至少一个视频序列产生,通过非详尽示例的方式,该至少一个视频序列包括:
-由同一个相机产生且在时间上彼此相接的图像(2D类型的编码/解码),
-由根据不同视图定向的各个相机产生的图像(3D类型的编码/解码),
-相应的纹理分量和深度分量,即这些纹理分量和深度分量表示同一场景(3D类型的编码/解码),
-通过单一的360°视频的投影获得的图像,
-通过立体视频的投影获得的图像,并且每个图像包括表示同一场景的至少两个视图,
-“屏幕内容”类型的非自然图像,诸如例如通过屏幕视频捕捉而获得的图像,
-等…
参考图1A,在C1处以本身已知的方式进行将当前图像ICj分割成多个块B1、B2、…、Bu、…、BS(1≤u≤S)。该划分由图2A中所表示的划分设备MP_C实施,该设备由处理器PROC_C驱动。
应当注意的是,在本发明的含义内,术语“块”表示编码单元。后一个术语尤其在HEVC标准“ISO/IEC/23008-2推荐ITU-T H.265高效视频编码(HEVC)”中使用。
具体地,这种编码单元将矩形形状或正方形形状(也被称为块、宏块)的像素集合或其他呈其他几何形状的像素集合分组在一起。
所述块B1、B2、…、Bu、…、BS旨在根据预先确定的遍历顺序被编码,该预先确定的遍历顺序例如是词典编辑类型的。这表示这些块是一个接一个地、从左到右被编码的。
其他类型的遍历当然也是可能的。因此,有可能将图像ICj分割成若干个被称为切片的子图像并且单独地针对每个子图像而应用这种类型的分割。如上文所解释的,还可以不是逐行地而是逐列地进行编码。还可以在任一方向上遍历行或列。
根据示例,块B1、B2、…、Bu、…、BS具有正方形形状并且均包含K个像素,其中,K≥1。通过非详尽示例的方式,这些块具有64×64个像素和/或32×32个像素和/或16×16个像素和/或8×8个像素的大小。
根据其不必是块大小的倍数的图像大小,左边的最后块和底部的最后块可能不是正方形。在替代性实施例中,这些块可以例如具有矩形大小和/或彼此并不对齐。
以可选的方式,如图1A中的虚线所表示,在C2处,对与当前图像ICj的特性相关联的语法元素activateStereoReuse进行编码。
语法元素activateStereoReuse是包括当前图像ICj的视频序列的高级语法元素。为此,根据编码上下文,此元素可以在以下情况下被编码:
-在对视频序列的每个图像的编码开始时,
-或在对图像序列的编码开始时进行一次,
-或在对视频序列的编码开始时进行一次。
语法元素activateStereoReuse旨在指示要被编码的当前图像的格式类型。根据优选实施例,如果已经通过360°、180°或其他角度的立体视频的投影获得要被编码的当前图像,并且如果当前图像由在同一时刻捕捉并且布置在当前图像中以形成单个视图(像素的矩形)的若干视图组成,则语法元素activateStereoReuse被编码为值1。用于组成这种图像的方法使用例如被称为“帧封装”(FP)的技术。另一方面,如果要被编码的当前图像是2D类型或者是通过360°、180°或其他角度的单一视频的投影获得的,则语法元素activateStereoReuse被编码为值0。
编码C2例如是CABAC(英文为“Context Adaptive Binary Arithmetic Coding(上下文自适应二进制算术编码)”)类型的熵编码或者算术类型或哈夫曼类型的熵编码。这种编码由图2A中所表示的编码设备MC_C实施,该设备由处理器PROC_C驱动。
这种编码C2在编码器CO以自主方式在以下内容之间进行区分的情况下不是必需的:
-2D类型的或者通过360°、180°或其他角度的单一视频的投影获得的要被编码的当前图像,
-以及通过360°、180°或其他角度的立体视频的投影获得的并且根据FP类型的技术组成的要被编码的当前图像。
在随后的描述中,考虑已经通过360°、180°或其他角度的立体视频的投影获得要被编码的当前图像,并且考虑当前图像由在同一时刻捕捉并且布置在当前图像中以形成单个视图(像素的矩形)的若干视图组成。
参考图1A,图2A的编码器CO在C3处选择图像ICj的要被编码的当前块Bu。
在C4处,例如通过确定图像ICj的当前块Bu相对于位于图像ICj的左上角并且坐标为(0,0)的第一像素的坐标来进行对该当前块的定位。这种定位的作用是确定当前块属于当前图像ICj的第一区域还是第二区域,该第一区域和该第二区域是不同的。根据本发明,在第一区域和第二区域不重叠的意义上,第一区域和第二区域是不同的。
定位C4由诸如图2A中所表示的计算设备CAL1_C实施,该设备由处理器PROC_C驱动。
根据图3A中所表示的第一实施例(该实施例是优选实施例),当前图像ICj包括在图像的顶半部分上延伸的第一区域Z1以及在图像的底半部分上延伸的第二区域Z2。区域Z1和Z2具有相同的形状并且通过沿着该图像的中间延伸的水平边界FH彼此分开。
根据图3B中所表示的第二实施例,当前图像ICj包括在图像的左半部分上延伸的第一区域Z1以及在图像的右半部分上延伸的第二区域Z2。区域Z1和Z2具有相同的形状并且通过沿着该图像的中间延伸的竖直边界FV彼此分开。
根据图3C中所表示的第三实施例,当前图像ICj包括在图像的第一左上四分之一上延伸的第一区域Z1以及在图像的第二左上四分之一上延伸的第二区域Z2。区域Z1和Z2具有相同的形状并且通过在该图像的四分之一上延伸的水平边界FH彼此分开。
当然,其他配置也是可能的。例如,区域Z1和Z2可以被调换。此外,区域Z1和Z2可以具有或可以不具有相同的形状。
如果当前块Bu属于图像ICj的第一区域Z1,则参考图1A,在C5a)处借助于第一编码方案MC1进行对当前块的编码。第一编码方案MC1是常规方案,其示例在图4中展示。将编码方案MC1应用于区域Z1的任何当前块。
参考图4,诸如这样的常规编码方案MC1通过常规预测技术(例如帧内和/或帧间和/或跳过和/或合并等…)来实施对当前块Bu的预测C51a)。为此,根据属于刚刚已经提到的预测技术之一的预测模式关于至少一个预测子块对当前块Bu进行预测。
以本身已知的方式,关于多个候选预测子块对当前块Bu进行预测。候选预测子块中的每一个为已经被编码并且然后被解码的像素块。
在预测C51a)完成时,在将所述预先确定的预测技术置于竞争状态之后,根据预先确定的编码性能标准例如通过将本领域技术人员众所周知的失真比特率标准最小化而获得最优预测子块BP最优。块BP最优被认为是近似当前块Bu。与此预测有关的信息旨在以语法元素的形式被写入要传输至解码器的数据信号或流中。
在此之后,在C52a)处常规地进行与当前块Bu有关的数据同预测子块BP最优的数据的比较。这种比较在于计算获得的预测子块BP最优与当前块Bu之间的差。
然后获得被称为残差块Bru的数据集。
操作C51a)和C52a)由图2A中所表示的预测编码设备PRED_C实施,该设备由处理器PROC_C驱动。
再次参考图4,在C53a)处以常规方式对当前残差块Bru的数据进行编码。
根据非限制性示例性实施例,这种编码C53a)实施对当前残差块Bru的像素进行变换的应用C531a)。
以本身已知的方式,根据上下文或所使用的编码标准,这种变换例如是DCT(“Discrete Cosine Transform(离散余弦变换)”的英文缩写)类型、DST(“Discrete SineTransform(离散正弦变换)”的英文缩写)类型、DWT(“Discrete Wavelet Transform(离散小波变换)”的英文缩写)类型、或LT(“Lapped Transform(重叠变换)”的英文缩写)类型的变换。这些变换先前存储在列表LTS1中,该列表存储在图2A的编码器CO的缓冲存储器MT_C中。
在这种变换的应用完成时,获得当前经变换的数据块Btu。
这种操作由诸如图2A中所表示的变换计算设备MTR_C执行,该设备由处理器PROC_C驱动。
此外,编码C53a)根据常规量化操作(诸如例如标量量化或矢量量化)来实施对经变换块Btu的数据的量化C532a)。然后获得量化系数块Bqu。
量化C532a)由诸如图2A中所表示的量化设备MQ_C实施,该设备由处理器PROC_C驱动。
变换计算设备MTR_C和量化设备MQ_C包含在图2A中所表示的用于对块进行编码的设备MCB_C中,该设备由处理器PROC_C驱动。
此外,编码C53a)实施对量化系数块Bqu的数据的编码C533a)。编码C533a)由图2A的编码设备MC_C实施。在编码C53a)完成时,获得当前块Bu的已编码数据DCu的集合。
参考图1A,在C6a)处进行对信号部分F的构建,该信号部分常规地包含:
-在C5a)处获得的已编码数据DCu,
-由编码器CO编码的某些信息,诸如例如:
·应用于当前块Bu的预测类型(帧间、帧内、跳过或合并),并且在相关的情况下,所选择的预测模式、获得的预测子块的索引,
·在当前块Bu已经被划分的情况下,该当前块的划分类型,
·对当前块Bu的数据应用的变换类型,
-等…。
根据本发明,如果语法元素activateStereoReuse在图像级别被编码,则流F可选地包含该语法元素的值0/1。
流F的构建由诸如图2A中所表示的数据信号构建设备MCF实施。
如果在定位C4完成时当前块Bu属于图像ICj的第二区域Z2,则在C5b)处借助于第二编码方案MC2进行对当前块的编码。根据第一实施例,将第二编码方案MC2应用于位于第二区域Z2的任何当前块。
根据本发明,参考图1A,在C51b)处进行对先前已经被编码并且然后被解码并且位于当前图像ICj的第一区域Z1的参考块B参考的标识。
标识C51b)由诸如图2A中所表示的计算设备CAL2_C实施,该设备由处理器PROC_C驱动。
根据优选实施例,如果已经位于第二区域Z2中的当前块的第一像素位于左上角并且该第一像素在当前图像ICj中的坐标为(xu,yu),则在第一区域Z1中确定参考块B’参考作为其位于左上角的第一像素p’参考的坐标为(x’参考,y’参考)的块,使得x’参考=xu并且y’参考=yu-h/2,其中h是当前图像ICj的高度。
图5A表示在所确定的参考块B’参考与当前图像ICj的第一区域Z1中的其他相邻参考块不重叠的情况下这种确定的示例,该当前图像例如与图3A中所展示的当前图像类似。在图5A中,相邻的参考块是利用点表示的参考块。根据这种配置,于是认为块B’参考是所标识的块B参考。
图5B表示在所确定的参考块B’参考与当前图像ICj的第一区域Z1中的其他相邻参考块r1、r2、r3、r4重叠的情况下这种确定的另一示例,该当前图像例如与图3A中所展示的当前图像类似。根据这种配置,根据示例性实施例,确定相邻参考块r1、r2、r3、r4中的哪个参考块是具有最多与块B’参考共同的像素的参考块。在图5B中,于是认为参考块r4是所标识的块B参考。
当然,当块B’参考与当前图像ICj的第一区域Z1中的相邻参考块重叠时,存在用于选择相邻参考块的其他方案。
根据另一示例,在图5B的情况下,可以确定相邻参考块r1、r2、r3、r4中的哪个参考块是包含块B’参考的中心的参考块。
根据又另一示例性实施例,在第一区域Z1中确定参考块B’参考作为包含坐标为x’参考=xc并且y’参考=yc-h/2的像素的块,其中(xc,yc)是当前块的中心的坐标。
在已经在第一区域Z1中标识出参考块B参考的情况下,参考图1A,在C52b)处进行对与参考块B参考相关联的至少一个编码参数PRC1的读取。这种编码参数PRC1存储在图2A的编码器的缓冲存储器MT_C的列表LST2中。
读取C52b)由诸如图2A中所表示的读取设备LEC_C实施,该设备由处理器PROC_C驱动。
通过非详尽示例的方式,列表LST2包含与所标识的参考块B参考相关联的数目为K的编码参数PRC1、PRC2、…、PRCK,这些编码参数是:
-被选择用于预测块B参考的预测类型(帧内、帧间、跳过、合并等…),
-在块B参考的编码期间已经将帧内预测应用于该块的情况下已经选择的帧内预测方向,
-在应用于块B参考的预测为帧间类型的情况下运动矢量的索引,
-在块B参考的编码期间应用于该块的预测的残差的无效性,
-在块B参考的编码期间应用于该块的划分类型,
-所选择的变换类型,
-所选择的量化区间的值,
-应用于块B参考的滤波类型,诸如例如在HEVC标准中使用的SAO(样本自适应偏移(Sample Adaptive Offset))模式,
-等…。
因此,在读取C52b)的过程中,可以读取与块B参考相关联的前述编码参数中的一个或多个。
参考图1A,在C53b)处为当前块进行对在C52b)处读取的编码参数PRC1的值的复制。因此,有利地是,不需要对编码参数PRC1进行编码。
根据一个实施例,在C54b)处进行对语法元素ES_PRC1的编码,该语法元素指示参考块B参考的编码参数PRC1是否为其值已经针对当前块被复制的参数。
编码C54b)为例如CABAC类型的熵编码或者算术类型或哈夫曼类型的熵编码。此编码由图2A的编码设备MC_C实施。
例如,语法元素ES_PRC1被编码为:
-值1,以指示已经针对当前块复制了编码参数PRC1的值,
-值0,以指示尚未针对当前块复制编码参数PRC1的值并且因此已经按常规进行编码。
在语法元素ES_PRC1被编码为值0的情况下,以常规方式对编码参数PRC1进行编码。
根据一个实施例,在编码C54b)的过程中,对K个语法元素ES_PRC1、ES_PRC2、…、ES_PRCK进行编码,这些语法元素指示与参考块B参考相关联的编码参数PRC1、PRC2、…、PRCK中的每一个是否为其值已经针对当前块被复制的参数。
当然,可以决定仅对上文K个语法元素中的一些进行编码。根据一个实施例,通过假设语法元素activateStereoReuse已经在C2处被编码为值1,则二进制序列1101表示例如:
-语法元素activateStereoReuse已经在C2处被编码为值1,
-已经针对当前块复制了已经应用于参考块B参考的划分类型的值,
-尚未针对当前块复制已经应用于参考块B参考的变换类型的值,然后以常规方式对应用于该当前块的变换类型进行编码,
-已经针对当前块复制了在对参考块B参考的编码期间所使用的量化区间的值。
参考图1A,图2A的设备MCF在C6a)处进行对信号部分F的构建,该信号部分根据本发明包含所述至少语法元素ES_PRC1的值0/1。
信号部分F还包含已经以常规方式编码的、当前块的所有数据。
根据本发明,如果语法元素activateStereoReuse在图像级别被编码,则流F可选地包含该语法元素的值0/1。
自此之后,通过通信网络(未表示出)将数据信号F传输至远程终端。该远程终端包括图7A中所表示的解码器DO。
根据刚刚已经参考图1A描述的第一实施例:
-针对当前图像ICj的第一区域Z1的每个块实施编码操作C1至C6a),
-针对当前图像ICj的第二区域Z2的每个块实施编码操作C1至C6b)。
现在将参考图1B来描述根据本发明的编码方法的第二实施例。
根据本发明的这个第二实施例,该编码方法在图2B中所表示的编码设备或编码器CO’中实施,该编码设备或编码器包括与图2A的编码器CO的元件类似的元件。出于简化的原因,利用与图2A中相同的附图标记在图2B中重复诸如此类的类似元件。
根据第二实施例,将第一编码方案MC1以与图1A的第一实施例中完全相同的方式应用于位于第一区域Z1中的任何当前块。该第二实施例与图1A的实施例的区别在于,参考图1B,除了针对位于第二区域Z2中的当前块实施的编码C5b),在C100b)处,借助于应用于当前图像的第一区域Z1的任何块的第一编码方案MC1(诸如例如图4中所表示的编码方案)对当前块Bu进行编码。这种编码100b)由在图2B中展示的预测编码设备PRED_C、用于对块进行编码的设备MCB_C以及编码设备MC_C实施。
参考图1B,根据预先确定的编码性能标准(例如通过将本领域技术人员众所周知的失真比特率标准最小化),在C200b)处将分别在C5b)处和C100b)处应用于当前块的编码方案MC1和MC2置于竞争状态。
置于竞争状态C200b)由诸如图2B中所表示的计算设备CPT实施,该设备由处理器PROC_C驱动。
在置于竞争状态C200b)完成时,获得最优编码方案MC最优,使得MC最优=MC1或者MC最优=MC2。然后在C300b)处对语法元素ES_MC最优进行编码。
编码C300b)为例如CABAC类型的熵编码或者算术类型或哈夫曼类型的熵编码。此编码由图2B的编码设备MC_C实施。
例如,语法元素ES_MC最优被编码为:
-值0,以指示第二区域Z2的当前块Bu是使用在置于竞争状态C200b)之后选择的第一常规编码方案MC1来编码的,
-值1,以指示第二区域Z2的当前块Bu是使用根据本发明的第二编码方案MC2来编码的,该第二编码方案是在置于竞争状态C200b)之后选择的。
参考图1B,图2B的设备MCF在C400b)处进行对信号部分F’的构建,该信号部分包含:
-如果在置于竞争状态C200b)之后选择了第一常规编码方案MC1:
·在C100b)处获得的已编码数据DCu,
·由编码器CO’编码的某些信息,诸如例如:
ο应用于当前块Bu的预测类型(帧间、帧内、跳过或合并),并且在相关的情况下,所选择的预测模式、获得的预测子块的索引,
ο在当前块Bu已经被划分的情况下,该当前块的划分类型,
ο对当前块Bu的数据应用的变换类型,
ο等…。
-如果在置于竞争状态C200b)之后选择了根据本发明的第二编码方案MC2:
·所述至少语法元素ES_PRC1的值0/1,
·已经以常规方式编码的、当前块的所有数据。
自此之后,通过通信网络(未表示出)将信号部分F’传输至远程终端。该远程终端包括图7B中所表示的解码器DO。
根据刚刚已经描述的编码方法的第二实施例:
-针对当前图像ICj的第一区域Z1的每个块实施编码操作C1至C6a),
-针对当前图像ICj的第二区域Z2的每个块实施编码操作C1至C400b)。
解码部分的具体实施方式
现在将对本发明的第一实施例进行描述,在该实施例中,根据本发明的解码方法用于对数据信号或流进行解码,该数据信号或流表示能够由符合当前或未来视频解码标准中的任何一项的解码器来解码的图像或图像序列。
在这个实施例中,例如采用软件或硬件方式通过对这种解码器进行修改来实施根据本发明的解码方法。
采用包括诸如图6A中所表示的操作D1至D7a)或操作D1至D7b)的算法的形式来表示根据本发明的第一实施例的解码方法。
根据此第一实施例,根据本发明的解码方法在图7A中所表示的解码设备或解码器DO中实施。
如图7A中所展示的,根据本发明的第一实施例,解码器DO包括存储器MEM_D(该存储器本身包括缓冲存储器MT_D)、由计算机程序PG_D驱动的处理器PROC_D,该处理器实施根据本发明的解码方法。在初始化时,计算机程序PG_C的代码指令例如在由处理器PROC_D执行之前被加载到RAM存储器(表示为RAM_D)中。
图6A中所表示的解码方法适用于任何已编码的当前图像ICj,该已编码的当前图像是固定的或者形成要被解码的L个图像IC1、…、ICj、…、ICL(1≤j≤L)的序列的一部分。
要被解码的当前图像ICj由至少一个视频序列产生,通过非详尽示例的方式,该至少一个视频序列包括:
-由同一个相机产生且在时间上彼此相接的图像(2D类型的编码/解码),
-由根据不同视图定向的各个相机产生的图像(3D类型的编码/解码),
-相应的纹理分量和深度分量,即这些纹理分量和深度分量表示同一场景(3D类型的编码/解码),
-通过单一的360°视频的投影获得的图像,
-通过立体视频的投影获得的图像,并且每个图像包括表示同一个场景的两个视图,这两个视图旨在分别通过用户的左眼和右眼观看;
-“屏幕内容”类型的非自然图像,诸如例如通过屏幕视频捕捉而获得的图像,
-等…
以可选的方式,如图6A中的虚线所表示,在D1处,在数据信号F中进行对与要被解码的当前图像ICj的特性相关联的语法元素activateStereoReuse的已编码值0或1的读取。读取D1仅在此语法元素已经在当前图像ICj级别被编码的情况下实施。
根据优选实施例,所读取的语法元素activateStereoReuse例如取以下值:
-值1,如果已经通过360°、180°或其他角度的立体视频的投影获得要被编码的当前图像,并且如果已经根据前述FP技术组成要被解码的当前图像,
-值0,如果要被解码的当前图像是2D类型或者是通过360°、180°或其他角度的单一视频的投影获得的。
读取D1由诸如图7A中所表示的流分析设备PARS_D实施,所述设备由处理器PROC_D驱动。
在标识的情况下,参考图6A,在D2处进行对语法元素activateStereoReuse所取的已编码值0或1的解码。
这种解码D2由图7A中所表示的解码设备MD_D实施,该设备由处理器PROC_D驱动。
这种解码例如为CABAC类型的熵解码或者算术类型或哈夫曼类型的熵解码。
这种解码D2在解码器DO以自主方式在以下内容之间进行区分的情况下不是必需的:
-2D类型的或者通过360°、180°或其他角度的单一视频的投影获得的要被解码的当前图像,
-以及通过360°、180°或其他角度的立体视频的投影获得的并且根据FP类型的技术组成的要被解码的当前图像。
在随后的描述中,考虑已经通过360°、180°或其他角度的立体视频的投影获得要被解码的当前图像,并且考虑当前图像由在同一时刻捕捉并且布置在当前图像中以形成单个视图(像素的矩形)的若干视图组成。
参考图6A,在D3处,在信号F中进行对分别与先前根据前述词典顺序编码的块B1、B2、…、Bu、…、BS相关联的已编码数据DC1、DC2、…、DCu、…、DCS(1≤u≤S)的标识,该前述词典顺序是在图1A的编码操作C5a)或C5b)完成时获得的。这表示这些块是以与以上提到的编码顺序相对应的方式从左到右逐个进行解码的。
这种标识D3由图7A的流分析设备PARS_D实施。
除了上文刚刚已经描述的遍历类型之外的其他遍历类型当然也是可能的并且取决于在编码时所选择的遍历顺序。
根据示例,块B1、B2、…、Bu、…、BS具有正方形形状并且均包含K个像素,其中,K≥1。通过非详尽示例的方式,这些块具有64×64个像素和/或32×32个像素和/或16×16个像素和/或8×8个像素的大小。
根据其不必是块大小的倍数的图像大小,左边的最后块和底部的最后块可能不是正方形。在替代性实施例中,这些块可以例如具有矩形大小和/或彼此并不对齐。
参考图6A,在D4处,图7A的解码器DO选择图像ICj的已编码数据DCu的当前集合作为要被解码的当前块,该集合与要被解码的块Bu相关联。
在D5处,例如通过确定图像ICj的要被解码的当前块Bu相对于图像ICj的第一重构像素的坐标来进行对该当前块的定位,该像素位于该图像的左上角并且坐标为(0,0)。
定位D5由诸如图7A中所表示的计算设备CAL1_D实施,该设备由处理器PROC_C驱动。
如果当前块Bu属于图像ICj的第一区域Z1,则参考图6A,在D6a)处借助于第一解码方案MD1进行对当前块的解码,该第一解码方案对应于在图1A中的C5a)处应用于编码的编码方案MC1。第一解码方案MD1是常规方案,其示例在图8中展示。将解码方案MD1应用于区域Z1的任何当前块。
参考图8,诸如这样的常规解码方案MD1在D61a)处实施对先前在信号F中读取到的预测信息(诸如在已经对编码实施的预测C51a)(图4)期间应用于当前块Bu的预测类型(帧间、帧内、跳过或合并),并且在相关的情况下,在此期间所选择的预测模式、已经获得的预测子块BP最优的索引)的解码。
在解码D61a)完成时,获得与已解码的索引相关联的预测子块BP最优。
在D62a)处对当前块Bu的已编码数据DCu进行解码。这种解码由图7A中所表示的用于对块进行解码的设备MDB_D实施,该设备由处理器PROC_D驱动。
解码D62a)在D621a)处实施对与要被解码的并且已经在图1A中的C5a)处编码的当前块Bu相关联的数据DCu的解码。在这种解码完成时,获得数字信息集合,该数字信息集合与在图4的C532a)处获得的量化系数Bqu块相关联。
解码D621a)由图7A中所表示的解码设备MD_D实施。
此外,解码D62a)根据常规去量化操作实施对量化系数Bqu块的去量化D622a),该去量化操作是与图4的量化C532a)相反的操作。然后,获得去量化系数BDqu的当前集合。这种去量化是例如标量类型或矢量类型,并且借助于诸如图7A中所表示的逆量化设备MQ-1_D实施,该设备由处理器PROC_D驱动。
此外,解码D62a)实施对在D622a)处获得的去量化系数BDqu的当前集合的变换的应用D623a)。以本身已知的方式,这种变换是与在图4的C531a)处应用于编码的变换(诸如例如DCT、DST、DWT、LT、或其他变换)相逆的变换。以与图2A的编码器CO相对应的方式,这些变换形成了先前存储在图7A的解码器DO的缓冲存储器MT_D中的变换列表LTS1-1的一部分。通常可以通过在数据信号F中读取应用于编码的变换的索引在解码器处确定要应用的变换的类型。
变换应用D623a)由诸如图7A中所表示的变换计算设备MTR-1_D执行,该设备由处理器PROC_C驱动。
逆量化设备MQ-1_D和变换计算设备MTR-1_D包含在图7A中所表示的用于对块进行解码的设备MDB_D中,该设备由处理器PROC_D驱动。
在对当前块的数据的解码D62a)完成时获得当前已解码的残差块BDru。
参考图8,在D63a)处,将当前已解码的残差块BDru添加至在D61a)处获得的预测子块BP最优。
操作D63a)由图7A中所表示的预测解码设备PRED_D实施,该设备由处理器PROC_D驱动。
在操作D63a)完成时获得当前已解码块BDu。
再次参考图6A,在D7a)处进行将当前已解码块BDu写入已解码图像IDj中。
写入D7a)由诸如图7A中所表示的图像重构设备URI实施,该设备URI由处理器PROC_D驱动。
参考图6A,如果在定位D5完成时当前块Bu属于图像ICj的第二区域Z2,则在D6b)处借助于第二解码方案MD2进行对当前块的解码,该第二解码方案对应于在图1A中的C5b)处应用于编码的编码方案MC2。根据第一实施例,将第二解码方案MD2应用于位于第二区域Z2中的要被解码的任何当前块。
根据本发明,参考图6A,在D61b)处进行对先前已经被解码并且位于正在解码的、当前图像ICj的第一区域Z1的参考块B参考的标识。
标识D61b)由诸如图7A中所表示的计算设备CAL2_D实施,该设备由处理器PROC_C驱动。标识D61b)与参考图1A对编码执行的标识C51b)相同。
根据优选实施例,如果已经位于第二区域Z2中的当前块的第一像素位于左上角并且该第一像素在当前图像ICj中的坐标为(xu,yu),则在第一区域Z1中确定参考块B’参考作为其位于左上角的第一像素p’参考的坐标为(x’参考,y’参考)的块,使得x’参考=xu并且y’参考=yu-h/2,其中h是当前图像ICj的最高。
已经参考图5A和5B解释了确定参考块B’参考的示例,并且在此将不再描述。
在已经在第一区域Z1中标识出参考块B参考的情况下,参考图6A,图7A的设备PARS_D在D62b)处在信号F中进行对至少一个语法元素ES_PRC1的读取,该语法元素指示参考块B参考的编码参数PRC1是否为其值已经针对当前块Bu被复制的参数。
然后在D63b)处进行对语法元素ES_PRC1的解码。
解码D63b)例如为CABAC类型的熵解码或者算术类型或哈夫曼类型的熵解码。此解码由图7A的编码设备MD_D实施。
例如:
-如果语法元素ES_PRC1的已解码值等于1,则编码参数PRC1直接用作当前块的解码参数PRD1,
-如果语法元素ES_PRC1的已解码值等于0,则借助于常规解码方案对编码参数PRC1进行解码。
根据一个实施例,在编码D63b)的过程中,对K个语法元素ES_PRC1、ES_PRC2、…、ES_PRCK进行解码,这些语法元素指示与参考块B参考相关联的编码参数PRC1、PRC2、…、PRCK中的每一个是否为在对当前块进行编码期间其值已经被复制的参数。
当然,如果在(图1A)C54b)处的编码仅对上文K个语法元素中的一些进行了编码,则可以决定仅对这K个语法元素中的一些进行解码。根据一个实施例,通过假设语法元素activateStereoReuse的在D2处获得的已解码值具有值1,则二进制序列1101表示例如:
-语法元素activateStereoReuse已经在C2处被编码为值1,
-已经应用于参考块B参考的划分类型直接用作当前块的解码参数,
-已经应用于参考块B参考的变换类型不直接用作当前块的解码参数并且以常规方式解码,
-在对参考块B参考的编码期间所使用的量化区间的值直接用作当前块的解码参数。
参考图7A,与参考块B参考相关联的至少一个解码参数PRD1存储在解码器DO的缓冲存储器MT_D的列表LST2中。
通过非详尽示例的方式,图7A的解码器DO的列表LST2包含与所标识的参考块B参考相关联的数目为K的解码参数PRD1、PRD2、…、PRDK,并且这些解码参数分别与存储在图2A的编码器CO的列表LST2中的K个编码参数PRC1、PRC2、…、PRCK相同。在图1A的编码方法期间已经描述了此类参数的示例,并且此处将不再描述。
参考图6A,在D64b)处针对当前块Bu进行对与语法元素ES_PRC1相关联的编码参数PRC1的值的复制。为此,将解码参数PRD1的在D63b)处解码的值指派给当前块Bu。
在将第二解码方案MD2应用于当前块完成时,获得当前已解码块BDu。
图7A的图像重构设备URI在D7b)处进行将当前已解码块BDu写入已解码图像IDj中。
根据刚刚已经参考图6A描述的第一实施例:
-针对当前图像ICj的第一区域Z1的每个块实施解码操作D1至D7a),
-针对当前图像ICj的第二区域Z2的每个块实施解码操作D1至D7b)。
现在将参考图6B来描述根据本发明的解码方法的第二实施例。
根据本发明的这个第二实施例,该解码方法在图7B中所表示的解码设备或解码器DO’中实施,该解码设备或解码器包括与图7A的解码器DO的元件类似的元件。出于简化的原因,利用与图7A中相同的附图标记在图7B中重复诸如此类的类似元件。
根据第二实施例,将第一解码方案MD1以与图6A的第一实施例中完全相同的方式应用于位于第一区域Z1中的任何当前块。第二实施例与图6A的实施例的区别在于没有将第二解码方案MD2系统地应用于位于第二区域Z2中的每个当前块。为此,一旦当前块Bu已经位于要被解码的当前图像的第二区域Z2中,则在D100b)处在信号F’中进行对语法元素ES_MC最优的读取,该语法元素指示在对图1B中的C200b)处的编码实施的竞争之后选择了哪种编码方案MC1或MC2。读取D100b)由图7B的设备PARS_D实施。
然后在D200b)处进行对语法元素ES_MC最优的解码。
解码D200b)例如为CABAC类型的熵解码或者算术类型或哈夫曼类型的熵解码。此解码由图7B的编码设备MD_D实施。
如果语法元素ES_MC最优的已解码值等于1,则根据第一实施例借助于第二解码方案MD2以与在图6A中的D5b)处完全相同的方式对当前块进行解码。
如果语法元素ES_MC最优的已解码值等于0,则在D300b)处根据第一实施例借助于已经被应用于当前图像的第一区域Z1的每个当前块的第一解码方案MD1以与在图6A中的D5a)处完全相同的方式对当前块进行解码。
解码方案MD1例如是图8中所表示的解码方案。这种解码300b)由在图7B中展示的解码设备MD_D、用于对块进行解码的设备MDB_D以及预测解码设备PRED_D实施。
在将第一解码方案MD1或第二解码方案MD2应用于当前块完成时,获得当前已解码块BDu。
图7B的图像重构设备URI在D400b)处进行将当前已解码块BDu写入已解码图像IDj中。
根据刚刚已经参考图6B描述的第二实施例:
-针对当前图像ICj的第一区域Z1的每个块实施解码操作D1至D7a),
-针对当前图像ICj的第二区域Z2的每个块实施解码操作D1至D400b)。
不言而喻,仅以完全非限制性指示的方式给出了上文中已经描述的实施例,然而,并且在不脱离本发明的范围的情况下,本领域的技术人员可以容易地进行许多修改。
Claims (14)
1.一种用于对被分割成多个块的图像(ICj)进行编码的方法,所述图像包含第一不同区域和第二不同区域(Z1,Z2),
所述编码方法的特征在于,该编码方法针对该图像的至少一个当前块(Bu)实施以下操作:
-确定(C4)该当前块属于该第一区域和该第二区域中的哪个区域,
-如果该当前块属于该第一区域(Z1),则借助于第一编码方案(MC1)对该当前块进行编码(C5a)),
-如果该当前块属于该第二区域(Z2),则借助于第二编码方案(MC2)对该当前块进行编码(C5b)),该第二编码方案包括以下操作:
-基于该当前块在该第二区域中的位置,标识(C51b))位于该图像的第一区域中的先前已被编码然后被解码的块(B参考),
-复制与所标识的块相关联的至少一个编码参数(PRC1)的值。
2.如权利要求1所述的编码方法,其中,将该第二编码方案应用于该当前图像的第二区域中的所有块。
3.如权利要求1所述的编码方法,实施以下操作:
-借助于该第一编码方案(MC1)对该图像的第二区域中的所述至少一个当前块进行编码(C100b)),
-根据预先确定的编码性能标准选择(C200b))该第一编码方案或该第二编码方案,
-对表示所述选择的信息项(ES_MC最优)进行编码(C300b))。
4.如权利要求1至3中任一项所述的编码方法,其中,该图像的第一区域和第二区域具有相同的形状,该第一区域位于该第二区域的上方、并且通过沿着该图像的中间延伸的水平边界与该第二区域分开。
5.一种用于对被分割成多个块的至少一个图像(ICj)进行编码的设备(CO),所述图像包含第一不同区域和第二不同区域,该设备的特征在于该设备包括处理电路(CT_C),该处理电路被设计用于针对该图像的至少一个当前块实施以下操作:
-确定该当前块属于该第一区域和该第二区域中的哪个区域,
-如果该当前块属于该第一区域(Z1),则借助于第一编码方案(MC1)对该当前块进行编码,
-如果该当前块属于该第二区域(Z2),则借助于第二编码方案(MC2)对该当前块进行编码,该第二编码方案包括以下操作:
-基于该当前块在该第二区域中的位置,标识位于该图像的第一区域中的先前已被编码然后被解码的块(B参考),
-复制与所标识的块相关联的至少一个编码参数(PRC1)的值。
6.一种计算机程序,包括程序代码指令,当所述程序在计算机上执行时,这些程序代码指令用于执行如权利要求1至4中任一项所述的编码方法的步骤。
7.一种可由计算机读取的记录介质,该记录介质上记录有计算机程序,该计算机程序包括程序代码指令,当所述程序由计算机执行时,这些程序代码指令用于执行如权利要求1至4中任一项所述的编码方法的步骤。
8.一种用于对表示被分割成多个块的已经被编码的图像(ICj)的数据信号(F)进行解码的方法,所述至少一个图像包含第一不同区域和第二不同区域(Z1,Z2),
所述解码方法的特征在于,该解码方法针对该图像的要被解码的至少一个当前块(Bu)实施以下操作:
-确定(D5)该当前块属于该第一区域和该第二区域中的哪个区域,
-如果该当前块属于该第一区域(Z1),则借助于第一解码方案(MD1)对该当前块进行解码(D6a)),
-如果该当前块属于该第二区域(Z2),则借助于第二解码方案对该当前块进行解码(D6b)),该第二解码方案包括以下操作:
-基于该当前块在该第二区域中的位置,标识(D61b))位于该图像的第一区域中的先前已被解码的块,
-向该当前块指派(D64b))与所述标识的块相关联的至少一个解码参数(PRD1)。
9.如权利要求8所述的解码方法,其中,将该第二解码方案应用于该当前图像的第二区域中的所有块。
10.如权利要求8所述的解码方法,其中,如果针对该第二区域中的当前块在该数据信号(F’)中读取(D100b))到关于选择所述第二解码方案的信息项,则将该第二解码方案应用于所述当前块;如果针对该第二区域中的当前块在该数据信号中读取到关于选择所述第一解码方案的信息项,则将该第一解码方案应用于所述当前块。
11.如权利要求8至10中任一项所述的解码方法,其中,该图像的第一区域和第二区域具有相同的形状,该第一区域位于该第二区域的上方、并且通过沿着该图像的中间延伸的水平边界与该第二区域分开。
12.一种用于对表示被分割成多个块的已经被编码的图像(ICj)的数据信号(F)进行解码的设备,所述至少一个图像包含第一不同区域和第二不同区域,该设备的特征在于该设备包括处理电路(CT_D),该处理电路被设计用于针对该图像的要被解码的至少一个当前块实施以下操作:
-确定该当前块属于该第一区域和该第二区域中的哪个区域,
-如果该当前块属于该第一区域(Z1),则借助于第一解码方案(MD1)对该当前块进行解码,
-如果该当前块属于该第二区域(Z2),则借助于第二解码方案对该当前块进行解码,该第二解码方案包括以下操作:
-基于该当前块在该第二区域中的位置,标识位于该图像的第一区域中的先前已被解码的块,
-向该当前块指派与所述标识的块相关联的至少一个解码参数(PRD1)。
13.一种计算机程序,包括程序代码指令,当所述程序在计算机上执行时,所述程序代码指令用于执行如权利要求8至11中任一项所述的解码方法的步骤。
14.一种可由计算机读取的记录介质,该记录介质上记录有计算机程序,该计算机程序包括程序代码指令,当所述程序由计算机执行时,这些程序代码指令用于执行如权利要求8至11中任一项所述的解码方法的步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1756317 | 2017-07-05 | ||
FR1756317A FR3068558A1 (fr) | 2017-07-05 | 2017-07-05 | Procede de codage et decodage d'images,dispositif de codage et decodage et programmes d'ordinateur correspondants |
PCT/FR2018/051579 WO2019008253A1 (fr) | 2017-07-05 | 2018-06-28 | Procédé de codage et décodage d'images, dispositif de codage et décodage et programmes d'ordinateur correspondants |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111034202A true CN111034202A (zh) | 2020-04-17 |
CN111034202B CN111034202B (zh) | 2023-08-22 |
Family
ID=59579774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880055133.5A Active CN111034202B (zh) | 2017-07-05 | 2018-06-28 | 图像编码和解码方法、编码和解码设备及对应计算机程序 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11284085B2 (zh) |
EP (1) | EP3649786A1 (zh) |
JP (1) | JP2020526119A (zh) |
KR (1) | KR102701711B1 (zh) |
CN (1) | CN111034202B (zh) |
FR (1) | FR3068558A1 (zh) |
WO (1) | WO2019008253A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020030183A1 (en) * | 2018-08-10 | 2020-02-13 | Huawei Technologies Co., Ltd. | Coding method, device, system with merge mode |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140354771A1 (en) * | 2013-05-29 | 2014-12-04 | Ati Technologies Ulc | Efficient motion estimation for 3d stereo video encoding |
CN104396244A (zh) * | 2012-04-16 | 2015-03-04 | 诺基亚公司 | 用于视频编码和解码的装置、方法和计算机程序 |
WO2015120823A1 (zh) * | 2014-02-16 | 2015-08-20 | 同济大学 | 使用多种形式的参考像素存储空间的图像压缩方法和装置 |
CN105745928A (zh) * | 2013-10-15 | 2016-07-06 | 奥兰治 | 用于对图像进行编码和解码的方法、用于对图像进行编码和解码的设备以及相应的计算机程序 |
CN105794208A (zh) * | 2013-11-29 | 2016-07-20 | 奥兰治 | 编码解码图像方法、编码解码图像设备及相应计算机程序 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02130094A (ja) * | 1988-11-10 | 1990-05-18 | Nippon Telegr & Teleph Corp <Ntt> | ステレオ動画像の動きベクトル情報符号化方式 |
US6215898B1 (en) | 1997-04-15 | 2001-04-10 | Interval Research Corporation | Data processing system and method |
PL2594077T3 (pl) | 2010-07-15 | 2016-04-29 | Ge Video Compression Llc | Hybrydowe kodowanie wideo obsługujące syntezę widoku pośredniego |
CN104247432B (zh) * | 2011-11-11 | 2019-06-11 | Ge视频压缩有限责任公司 | 使用深度图估计和更新的高效多视点编码 |
US9979960B2 (en) | 2012-10-01 | 2018-05-22 | Microsoft Technology Licensing, Llc | Frame packing and unpacking between frames of chroma sampling formats with different chroma resolutions |
US9544612B2 (en) | 2012-10-04 | 2017-01-10 | Intel Corporation | Prediction parameter inheritance for 3D video coding |
CN105917650B (zh) | 2014-01-03 | 2019-12-24 | 微软技术许可有限责任公司 | 视频和图像编/解码的方法、计算设备及计算机可读介质 |
CN106233725B (zh) | 2014-03-31 | 2019-08-02 | 英迪股份有限公司 | 用于对图像进行解码的装置及其方法 |
US20160234510A1 (en) | 2014-06-20 | 2016-08-11 | Mediatek Inc. | Method of Coding for Depth Based Block Partitioning Mode in Three-Dimensional or Multi-view Video Coding |
GB2531001B (en) | 2014-10-06 | 2019-06-05 | Canon Kk | Method and apparatus for vector encoding in video coding and decoding |
US20170310994A1 (en) | 2014-10-08 | 2017-10-26 | Lg Electronics Inc. | 3d video coding method and device |
US10638140B2 (en) | 2015-05-29 | 2020-04-28 | Qualcomm Incorporated | Slice level intra block copy and other video coding improvements |
-
2017
- 2017-07-05 FR FR1756317A patent/FR3068558A1/fr not_active Withdrawn
-
2018
- 2018-06-28 US US16/628,467 patent/US11284085B2/en active Active
- 2018-06-28 WO PCT/FR2018/051579 patent/WO2019008253A1/fr unknown
- 2018-06-28 CN CN201880055133.5A patent/CN111034202B/zh active Active
- 2018-06-28 KR KR1020207002968A patent/KR102701711B1/ko active IP Right Grant
- 2018-06-28 JP JP2019572201A patent/JP2020526119A/ja active Pending
- 2018-06-28 EP EP18752538.1A patent/EP3649786A1/fr active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104396244A (zh) * | 2012-04-16 | 2015-03-04 | 诺基亚公司 | 用于视频编码和解码的装置、方法和计算机程序 |
US20140354771A1 (en) * | 2013-05-29 | 2014-12-04 | Ati Technologies Ulc | Efficient motion estimation for 3d stereo video encoding |
CN105745928A (zh) * | 2013-10-15 | 2016-07-06 | 奥兰治 | 用于对图像进行编码和解码的方法、用于对图像进行编码和解码的设备以及相应的计算机程序 |
CN105794208A (zh) * | 2013-11-29 | 2016-07-20 | 奥兰治 | 编码解码图像方法、编码解码图像设备及相应计算机程序 |
WO2015120823A1 (zh) * | 2014-02-16 | 2015-08-20 | 同济大学 | 使用多种形式的参考像素存储空间的图像压缩方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2020526119A (ja) | 2020-08-27 |
EP3649786A1 (fr) | 2020-05-13 |
KR20200022492A (ko) | 2020-03-03 |
KR102701711B1 (ko) | 2024-08-30 |
US20200128251A1 (en) | 2020-04-23 |
WO2019008253A1 (fr) | 2019-01-10 |
US11284085B2 (en) | 2022-03-22 |
FR3068558A1 (fr) | 2019-01-04 |
CN111034202B (zh) | 2023-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12108158B2 (en) | Image data encoding/decoding method and apparatus | |
US11831914B2 (en) | Method and apparatus of encoding/decoding image data based on tree structure-based block division | |
US20190238888A1 (en) | Image data encoding/decoding method and apparatus | |
US20240357240A1 (en) | Image data encoding/decoding method and apparatus | |
JP7507913B2 (ja) | 画像をエンコーディング及びデコーディングする方法、エンコーディング及びデコーディング装置、並びに、対応するコンピュータプログラム | |
CN116684582A (zh) | 解码设备、编码设备和数据发送设备 | |
CN114424548A (zh) | 基于调色板编码的图像或视频编码 | |
CN109845259B (zh) | 编码和解码图像参数的方法、编码和解码图像参数的设备 | |
CN111034202B (zh) | 图像编码和解码方法、编码和解码设备及对应计算机程序 | |
CN111630862B (zh) | 用于对表示全向视频的多视图视频序列进行编码和解码的方法和设备 | |
CN110431844B (zh) | 用于对图像进行编码和解码的方法、编码和解码设备以及相应的计算机记录介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |