CN112789857A - 用于信号增强编码的变换 - Google Patents

用于信号增强编码的变换 Download PDF

Info

Publication number
CN112789857A
CN112789857A CN201980063323.6A CN201980063323A CN112789857A CN 112789857 A CN112789857 A CN 112789857A CN 201980063323 A CN201980063323 A CN 201980063323A CN 112789857 A CN112789857 A CN 112789857A
Authority
CN
China
Prior art keywords
residual data
frame
encoding
encoded
sets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980063323.6A
Other languages
English (en)
Inventor
吉多·米尔迪
I·达姆亚诺维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
V-Nova Ltd
V Nova International Ltd
Original Assignee
V-Nova Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB1812708.4A external-priority patent/GB201812708D0/en
Priority claimed from GBGB1812710.0A external-priority patent/GB201812710D0/en
Priority claimed from GBGB1812709.2A external-priority patent/GB201812709D0/en
Priority claimed from GBGB1903844.7A external-priority patent/GB201903844D0/en
Priority claimed from GBGB1904014.6A external-priority patent/GB201904014D0/en
Priority claimed from GBGB1904492.4A external-priority patent/GB201904492D0/en
Priority claimed from GBGB1905325.5A external-priority patent/GB201905325D0/en
Application filed by V-Nova Ltd filed Critical V-Nova Ltd
Publication of CN112789857A publication Critical patent/CN112789857A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Abstract

提供了对信号进行编码的措施。接收输入帧(102)并对其进行下采样以获得下采样帧(103)。将所述下采样帧(103)传递到编码模块(104),所述编码模块(104)对所述下采样帧(103)进行编码以生成编码帧(105)。从解码模块(106)获得解码帧,所述解码模块(106)通过对所述编码帧(105)进行解码来生成所述解码帧。通过取得所述解码帧与所述下采样帧(103)之间的差来生成一组残差数据(113),并且对所述一组残差数据(113)进行编码以生成一组编码残差数据。所述编码包括将所述一组残差数据变换成一组变换残差数据。将所述一组编码残差数据输出到解码器,以使得所述解码器能够重建所述输入帧。还提供了对信号进行解码的措施。

Description

用于信号增强编码的变换
技术领域
本公开涉及用于对信号进行编码和/或解码的方法和设备。更特别地,本公开涉及对视频信号和图像信号进行编码和解码,但是可扩展到要压缩和解压缩的任何其他类型的数据。
背景技术
本文所描述的方法和设备基于整体算法,所述整体算法建立在现有编码和/或解码算法(其用作增强层的基线)之上并且根据不同的编码和/或解码算法工作。现有编码和/或解码算法的实例包括但不限于:MPEG标准,诸如AVC/H.264、HEVC/H.265等;和非标准算法,诸如VP9、AV1等;以及其他算法。
发明内容
所附权利要求中限定根据本公开所提供的各种措施(例如,编码和解码方法和设备)。
从以下仅以实例方式给出的参考附图进行的描述中,另外的特征和优点将变得显而易见。
附图说明
图1示出描绘LOQ-1残差编码的实例的图;
图2示出描绘LOQ-0残差编码的实例的图;
图3示出描绘解码过程和系统的实例的图;
图4示出描绘变换残差的数据结构的实例的图;
图5示出描绘压缩误差计算的实例的图;
图6示出描绘平均分解过程的实例的图;
图7示出描绘横向分解过程的实例的图;
图8示出描绘纵向分解过程的实例的图;
图9示出描绘对角分解过程的实例的图;
图10示出描绘LoQ-0平均分解计算的实例的图;
图11示出描绘逆直接分解(DD)变换过程(LOQ-1)的实例的图;并且
图12示出描绘如何在解码器处从编码的平均值Aenc开始重建平均分量的实例的图。
具体实施方式
与使用如在MPEG系列算法中使用的基于块的方法不同,本文所描述的整体算法对视频帧进行分层编码和/或解码。本文所描述的对帧进行分层编码的方法包括:生成全帧的残差,然后生成抽取帧等。分层中的不同等级可涉及不同分辨率(本文称为质量等级—LOQ)并且可针对不同等级生成残差数据。在实例中,全大小视频帧的视频压缩残差数据可称为“LOQ-0”(例如,对于高清(HD)视频帧来说为1920×1080),而抽取帧的视频压缩残差数据可称为“LOQ-×”。在这些情况下,“×”标示分层抽取的数量。在本文所描述的某些实例中,变量“×”具有最大值“1”,并且因此存在将针对其生成压缩残差的恰好两个分层等级(例如,×=0和×=1)。
图1示出如何在编码装置处生成质量等级1(LOQ-1)的编码数据的实例。
使用AVC/H.264编码/解码算法作为示例性基线算法来描述整体算法和方法。然而,在不对整体算法的工作方式造成任何影响的情况下,可使用其他编码/解码算法作为基线算法。图1示出针对LOQ-1分层等级生成熵编码残差的过程100。
第一步101是按两倍对传入的未压缩视频进行抽取。这可涉及对高度为H且宽度为W的输入帧102(在图1中标记为“输入帧”)进行下采样以生成高度为H/2且宽度为W/2的抽取帧103(在图1中标记为“半2D大小”)。下采样过程涉及使每个轴线按两倍减小,并且下采样过程通过使用2×2网格块有效地完成。下采样可以各种方式进行,这各种方式的实例包括但不限于求平均和Lanczos重采样。
然后,使抽取帧103通过基编码算法(在此实例中为AVC/H.264编码算法),在所述算法中,然后由在图1中标记为“H.264编码”的实体104生成高度为H/2且宽度为W/2的熵编码参考帧105(在图1中标记为“半2D大小基”),并且将其存储为H.264熵编码数据。实体104可包括基编码器-解码器(例如,基编解码器或基编码/解码算法)的编码部件。基编码的数据流可输出为熵编码参考帧105,其中基编码的数据流的分辨率低于供应输入帧102的输入数据流的分辨率。
在本实例中,编码器然后模拟对实体104的输出的解码。然后,由图1中标记为“H.264解码”的实体106生成编码参考帧105的解码版本。实体106可包括基编解码器的解码部件。编码参考帧105的解码版本可表示抽取帧103的将由解码器在接收到熵编码参考帧105之后产生的版本。
在图1的实例中,计算由实体106输出的解码参考帧与抽取帧103之间的差。此差在本文中称为“LOQ-1残差”。差形成到变换块107的输入。
变换块107使用的变换(在此实例中,基于哈达玛的变换)将差转换为四个分量。变换块107可执行定向(或方向)分解以产生与一组残差的不同方面有关的一组系数或分量。在图1中,变换块107生成A(平均)、H(横向)、V(纵向)以及D(对角)系数。在这种情况下,变换块107利用LOQ-1残差之间的方向相关性,除了针对更高质量等级(LOQ-0等级)执行变换操作之外,或者作为其替代方案,所述方向相关性据发现出奇地有效。下面更详细地描述LOQ-0变换。特别地,已经确认:除了利用LOQ-0下的方向相关性之外,在LOQ-1下也可存在方向相关性并且出奇有效地利用以提供比单独利用LOQ-0下的方向相关性或根本不利用LOQ-0下的方向相关性更有效的编码。
然后,由量化块108对由变换块107生成的系数(A、H、V和D)进行量化。量化可通过使用称为“步宽”(也称为“步长”)的变量来执行,以产生量化的变换残差109。每个量化的变换残差109具有高度H/4和宽度W/4。例如,如果将输入帧的4×4块视为参考,则每个量化的变换残差109在高度和宽度上可以是一个像素。量化涉及使分解分量(A、H、V和D)按预定因子(步宽)减小。减小可通过除法(例如,用例如表示用于量化的箱宽的步宽除以系数值)来执行。量化可生成一组系数值,所述系数值的值的范围小于进入量化块108的值的范围(例如,可使用为7的步宽将0至21范围内的变换值减小到0与3之间的值的范围)。在硬件实现方式中,可预先计算一组步宽值的倒数并且将其用于通过乘法(例如,乘以步宽的倒数)来执行减小,这可比除法更快。
然后对量化的残差109进行熵编码,以便去除任何冗余信息。熵编码可涉及例如使数据通过游程长度编码器(RLE)110,然后通过霍夫曼编码器111。
然后将量化的编码分量(Ae、He、Ve和De)放置在串行流中,所述串行流在流的开始处插入有定义分组。定义分组也可称为标头信息。定义分组可按帧插入。此最终阶段可使用文件序列化例程112来完成。定义分组数据可包括诸如以下的信息:霍夫曼编码器111的规格、要采用的上采样的类型、是否丢弃A系数和D系数、以及使得解码器能够对流进行解码的其他信息。因此,对输出残差数据113进行熵编码和序列化。
参考数据105(半大小的基线熵编码帧)和熵编码LOQ-1残差数据113两者都是为了在重建过程中由解码器进行解码而生成的。在一种情况下,可存储和/或缓存参考数据105和熵编码LOQ-1残差数据113。可将参考数据105和熵编码LOQ-1残差数据113传达到解码器以用于解码。
在图1的实例中,执行多个另外的操作,以便在另一(例如,更高)质量等级LOQ-0产生一组残差。在图1中,在编码器处模拟针对LOQ-1流的多个解码器操作。
首先,将量化输出109分叉,并且执行反量化114(或“去量化”)。这生成由变换块107输出的系数值的表示。然而,由于将存在由于量化过程而引入的误差,由去量化块109输出的表示将与变换块107的输出不同。例如,如果步宽为7,则可将7至14范围内的多个值替换为单个量化值1。在去量化期间,可通过乘以步宽将此单个值1去量化以生成值7。因此,在8至14范围内的任何值在去量化块109的输出处都将会有误差。当使用去量化值(例如,包括解码器的操作的模拟)生成更高质量等级LOQ-0时,LOQ-0残差也可对量化/去量化误差的校正进行编码。
第二,将逆变换块115应用于由去量化块114输出的去量化系数值。逆变换块115应用变换,所述变换为由变换块107执行的变换的逆变换。在此实例中,变换块115执行逆哈达玛变换,但也可使用其他变换。逆变换块115将去量化系数值(例如,编码块或单元中的A、H、V和D的值)转换回对应的残差值(例如,表示到变换块107的输入的重建版本)。逆变换块115的输出是一组重建LOQ-1残差(例如,表示LOQ-1的解码器解码过程的输出)。将重建LOQ-1残差与解码参考数据(例如,解码实体106的输出)相加,以便生成高度为H/2且宽度为W/2的重建视频帧116(在图1中标记为“半2D大小重建(至LOQ-0)”)。重建视频帧116非常类似于原始抽取的输入帧103,因为它是从解码实体106的输出重建的,但加上了LoQ-1重建残差。重建视频帧116是到LOQ-0引擎的临时输出。此过程模仿解码过程,并且因此是不使用原始抽取的帧103的原因。将重建LOQ-1残差与解码基流(即,解码实体106的输出)相加允许LOQ-0残差也校正例如通过量化(并且在某些情况下通过变换)引入到LOQ-1流中的误差以及与下采样和上采样有关的误差。
图2示出如何在编码装置处生成200LOQ-0的实例。
为了导出LOQ-0残差,导出重建LOQ-1大小的帧216(在图2中标记为“半2D大小重建(自LOQ-1)”),如以上参考图1所描述。例如,重建LOQ-1大小的帧216包括重建视频帧116。
下一步是对重建帧216执行上采样以达到全大小W×H。在此实例中,升频按两倍进行。此时,可使用各种算法来增强上采样过程,所述算法的实例包括但不限于:最近算法、双线性算法、锐化算法或三次算法。重建的全大小帧217在图2中标记为“预测帧”,因为它表示对如由解码器解码的具有全宽和全高的帧的预测。然后,从原始未压缩视频输入202中减去高度为H且宽度为W的重建全大小帧217,这产生一组残差,在本文中称为“LOQ-0残差”。LOQ-0残差是在高于LOQ-1残差的质量等级(例如,分辨率)下产生的。
与以上描述的LOQ-1过程类似,由变换块218对LOQ-0残差进行变换。这可包括使用定向分解诸如哈达玛变换来产生A、H、V和D系数或分量。然后,通过量化块219对变换块218的输出进行量化。这可基于如针对第一质量等级(LOQ-1)描述的定义的步宽来执行。量化块219的输出是一组量化系数,并且在图2中,然后对这些量化系数进行熵编码220、221和文件序列化222。同样地,熵编码可包括应用游程长度编码220和霍夫曼编码221。熵编码的输出是一组熵编码输出残差223。这些输出残差形成可由编码器输出的LOQ-0流,以及LOQ-1流(即,113)和基流(即,105)。可在稍后通过解码器进行解码之前存储和/或缓存流。
如在图2中可看出,可在上采样过程之前使用来自(LOQ-1)重建视频帧116的数据导出“预测平均”分量224(在下面更详细地描述并且在下面标示为Aenc)。这可代替变换块218内的A(平均)分量使用以进一步提高编码算法的效率。
图3示意性地示出如何执行解码过程300的实例。此解码过程300可由解码器执行。
解码过程300开始于三个输入数据流。因此,解码器输入包括熵编码数据305、LOQ-1熵编码残差数据313和LOQ-0熵编码残差数据323(在图3中表示为文件序列化编码数据)。熵编码数据305包括减小大小的编码基,例如,如图1中输出的数据105。熵编码数据305是例如相对于尺寸为W和H的全帧的尺寸为W/2和H/2的半大小。
由基解码器306使用对应于已经用于对那些数据进行编码的算法的解码算法(在此实例中为AVC/H.264解码算法)对熵编码数据305进行解码。这可对应于图1中的解码实体106。在此步骤结束时,产生具有减小大小(例如,半大小)的解码视频帧325(在本实例中指示为AVC/H.264视频)。这可被视为标准分辨率视频流。
并行地,对LOQ-1熵编码残差数据313进行解码。如上所解释,将LOQ-1残差编码成四个分量(A、V、H和D),如图3所示,这四个分量的尺寸为全帧尺寸的四分之一,即,W/4和H/4。这是因为(同样如下文以及内容通过引用并入本文的先前专利申请US 13/893,669和PCT/EP2013/059847中所描述):这四个分量包含与未变换残差内的特定方向相关联的所有信息(例如,所述分量是相对于未变换残差的块定义的)。如上所描述,这四个分量可通过对残差(对于LOQ-1来说,其尺寸将为W/2和H/2,换句话说,与减小大小的熵编码数据305相同的尺寸)应用2×2变换核来生成。在解码过程300中,如图4所示,在熵解码块326处对四个分量进行熵解码,然后在去量化块314处进行去量化,之后通过逆变换块315应用逆变换以生成原始LOQ-1残差的表示(例如,到图1中的变换块107的输入)。逆变换可包括例如如应用于残差数据的2×2块的哈达玛逆变换。去量化块314与以上参考图1描述的量化块108反向。在此阶段,将量化值(即,熵解码块326的输出)乘以步宽(即,步长)因子以生成重建变换残差(即,分量或系数)。可看出,图1中的块114和115与图3中的块314和315成镜像。
然后将例如如由逆变换块315输出的解码LOQ-1残差与解码视频帧(例如,基解码块306的输出)相加,以产生减小大小(在此实例中,半大小)的重建视频帧316,其在图3中标识为“半2D大小重建”。然后使用诸如双线性、双三次、锐化等上采样滤波器对此重建视频帧316进行上采样以使其达到全分辨率(例如,从第1质量等级至第0质量等级)。在此实例中,将重建视频帧316从半宽(W/2)和半高(H/2)上采样至全宽(W)和全高(H)。
上采样重建视频帧317将是LOQ-0下的预测帧(全大小,W×H),LOQ-0解码残差然后将与之相加。
在图3中,使用熵解码块327、去量化块328和逆变换块329对LOQ-0编码的残差数据323进行解码。如上所描述,使用四个分量对LOQ-0残差数据323进行编码(即,将其变换成A、V、H和D分量),如图3所示,这四个变量的尺寸为全帧尺寸的一半,即W/2和H/2。这是因为(如本文和内容通过引用并入本文的先前专利申请US13/893,669和PCT/EP2013/059847中所描述):这四个分量包含关于残差的所有信息,并且是通过对残差(对于LOQ-0来说,其尺寸将为W和H,换句话说,全帧的相同尺寸)应用2×2变换核生成的。由熵解码块327对四个分量进行熵解码,然后由去量化块328进行去量化,并且最终由逆变换块329变换329回原始LOQ-0残差,变换(例如,在此实例中为2×2哈达玛逆变换)。
然后将解码LOQ-0残差与预测帧317相加以产生重建全视频帧330。帧330是高度为H且宽度为W的输出帧。因此,图3中的解码过程300能够输出用户数据的两个元素:在第一质量等级下的基解码视频流325(例如,在LOQ-1下的半分辨率流)和在最高质量等级下的全分辨率或更高分辨率视频流330(例如,在LOQ-0下的全分辨率流)。
以上描述是参考特定大小和基线算法进行的。然而,以上方法也适用于其他大小和/或基线算法。以上描述仅通过本文所描述的更一般概念的实例给出。
图4示出示例性残差数据结构400的表示。
在以上所描述的编码/解码算法中,通常有三个平面(例如,YUV或RGB),在每一平面中具有两个质量等级(LOQ),它们被描述为LOQ-0(或最高等级、全分辨率)和LOQ-1(或更低等级、减小大小的分辨率(诸如半分辨率))。每个平面可涉及视频数据的不同颜色分量。每个LOQ包含四个分量,即A、H、V和D。在某些实例中,这些分量可被视为每个平面内的不同层。因此,可通过一组平面来定义给定质量等级下的视频数据帧,其中每个平面具有一组层。在图1至图3的实例中,总共有2×3×4=24个表面,即,2个质量等级、3个颜色分量和4个分量层或系数层。如参考图1和图2所描述,这些表面中的12个是全大小的(例如,对于LOQ-0来说为W×H),并且12个是减小大小的(例如,对于LOQ-1来说为W/2×H/2)。
如以上所描述,可使用定向分解变换(DD-变换)将下采样输入帧103与同一帧的解码的、基线减小大小的版本(例如,如由解码实体106输出)之间的误差分量(即,差或残差)分解成四个不同的分量;平均值(A)、横向(H)、纵向(V)和对角(D)。此操作可在2×2块的网格大小中执行。每个网格都不从属于其邻近网格。因此,它适合于高效实现方式,诸如全并行操作。然而,由于用于分解的所有操作都是线性的,因此使用实时(JIT)处理范例(即时)执行此操作是可行的。
图5示出可针对第一质量等级(LOQ-1)执行的压缩误差计算500的实例。
在图5中,将一组LOQ-1残差计算为基线参考解码帧531(例如,图1中的解码实体106的输出)与下采样输入帧503(例如,图1中的下采样帧103)之间的差。在图5中,基线解码帧531是从下采样帧503中减去以获得一组LOQ-1残差532的基于H.264的帧。所述一组LOQ-1残差可被视为“压缩误差”,因为它们表示到基编码器的输入与相同基编码器的解码输出之间的差,即,数据503与数据531之间的差可被视为是由于对基流的编码和解码过程造成的,其中这些差通常是由基编码器应用的有损编码算法的结果。除了压缩误差之外,LOQ-1残差532还可表示通过基编码和基解码过程生成的其他伪像,所述其他伪像可包括运动校正伪像、块伪像、量化伪像、符号编码伪像等。
图6示出可用于第一质量等级(LOQ-1)的平均分解过程600的实例。例如,平均分解过程600可用于确定如以上所描述的平均值A分量。在图6中,平均分解被计算为压缩误差632帧的当前2×2网格中的所有压缩误差像素(残差)的平均值。可针对压缩误差632帧内的多个2×2网格重复平均分解,例如,图6示出所述帧的第一个和最后一个2×2网格或编码块。平均分解可以与图1中的箭头101所示的下采样类似的方式执行。
图7示出可用于第一质量等级(LoQ-1)的横向分解过程700的实例。例如,横向分解过程700可用于确定如以上所描述的横向H分量。在图7中,所述操作计算压缩误差帧732的2×2网格中的残差之间在横向平面中的归一化差。例如,如图7所示,将2×2网格的第一列中的残差值(D00和D10)相加,然后从总和中减去2×2网格的第二列中的残差值(D01和D11)。在图7中,按4应用归一化除法以生成横向H分量。导出横向分解的操作是线性过程,并且因此可根据需要即时执行。在视觉上,如果整个平面上存在任何明显的误差(残差),则此操作的结果在本质上看起来将是主要地纵向的。理想地,平面中将存在类似的误差(残差)(不增加熵),并且因此将导致通过熵编码器压缩的数据量减小。
图8示出可用于第一质量等级(LoQ-1)的纵向分解过程800的实例。例如,纵向分解过程800可用于确定如以上所描述的纵向V分量。此操作计算压缩误差帧832的2×2网格中的残差之间在纵向平面中的归一化差。例如,如图8所示,将2×2网格的第一行中的残差值(D00和D01)相加,然后从总和中减去2×2网格的第二行中的残差值(D10和D11)。在图8中,按4应用归一化除法以生成纵向V分量。导出纵向分解的操作是线性过程,并且因此可根据需要(例如,在变换块诸如107处接收到一组2×2残差时)即时执行。
图9示出可用于第一质量等级(LoQ-1)的对角分解过程900的实例。例如,对角分解过程900可用于确定如以上所描述的对角D分量。此操作计算压缩误差帧932的2×2网格中的残差之间在对角平面中的归一化差。例如,如图9所示,确定2×2网格的第一行中的残差值(D00和D01)的差,然后添加2×2网格的第二行中的残差值(D10和D11)的差。在图9中,按4应用归一化除法以生成对角D分量。
图10示出可在高质量等级(LoQ-0)下执行的示例性定向分解(DD)变换过程1000。在图10中,对LoQ-1重建帧1016进行上采样。如参考图1和图2所描述的,重建帧1016可包括解码LOQ-1残差(例如,如由逆变换块115输出)和解码基编码帧(例如,如由解码实体106输出)之和。在这种情况下,上采样采用单个重建帧像素R0并且将其转换为上采样LOQ-1预测的2×2块(参见上文)。这可针对LoQ-1重建帧1016中的所有重建帧像素值执行。在图10中,然后从全大小输入帧1002中减去上采样LOQ-1预测,以便生成用于LoQ-0处理阶段的残差1033。针对LoQ-0的横向、纵向和对角分解可以与以上针对LOQ-1描述的方式类似的方式计算。然而,可以不同方式计算平均分解以减小要编码的量化变换LOQ-0残差的熵。
在图10中,使用来自先前阶段(LoQ-1)的重建像素值R0计算LOQ-0变换残差数据的平均分量1024,而不是根据重建误差1033重新计算平均值。例如,在图2中的变换块218处,可不使用关于H、V和D分量的来自217和202之和的输入数据来确定平均值A值。通过使用图10的配置,如果使用预上采样数据1016,则计算可产生更少的误差(残差)。这有效地排除由于上采样滤波器引起的任何额外误差,并且因此将导致熵编码器的输入处的熵减小。
特别地,R0是如以上所描述的通过将解码的减小大小的帧与LOQ-1残差相加而获得的在等级LOQ-1下的重建元素。假设从半大小到全大小进行上采样,那么当上采样时,单个元素R0将在上采样LOQ-1预测帧1017中产生四个元素,即H00、H01、H10和H11。在图10中,从原始图像1002中的四个元素(即,I00、I01、I10和I11)的平均值中减去重建元素R0,这四个元素在位置上对应于上采样LoQ-1预测帧1017中的四个元素H00、H01、H10和H11。例如,可以与图6的计算方式类似的方式生成块1030处的平均值。然后,对所得的平均值(标示为“Aenc”)1024进行量化和编码,以便传输到解码器,例如,代替LOQ-0变换块1018的平均值A输出。在原始图像1002中的四个元素(即,I00、I01、I10和I11)的平均值标示为AI的情况下,则Aenc=AI-R0。可针对整个完整帧中的多个2×2块或网格生成所得编码平均值1024。
使用Aenc而不是标准平均值A(其将是1033中所示的2×2块中的重建误差D00至D11的平均值)是有效的,因为Aenc的熵含量低于平均值(A)的熵含量,并且因此这样可产生更有效的编码。这是因为如果已经正确重建R0(例如,已经通过LOQ-1残差正确校正编码器和解码器引入的误差),则R0与输入帧1002的四个原始元素的平均值之间的差在大多数情况下应为零。另一方面,由于将考虑上采样器和下采样器的影响,标准平均值(A)将包含显著更少的零值。
图11示出逆DD变换1100的实例。例如,这可用于执行图1和图3中的块115、块314中的一者处的逆变换。
此过程1100的目标在于将(方向)分解值转换回原始残差。残差是通过从理想输入(或下采样)帧中减去重建视频帧而导出的值。图11所示的逆DD变换1100是在LoQ-1下执行的LoQ-1逆变换。在使用预测平均值的情况下,在LoQ-0下执行的LoQ-0逆变换可能会有所不同。下面参考图12描述不同实现方式的一个实例。
图12示出可使用参考图10描述的编码平均值1024的LoQ-0逆变换1200的实例。
由于用于分解成平均分量的方法,与LoQ-1相比,针对LoQ-0计算逆变换存在差异。特别地,使用额外的步骤来重组平均分量,使得其符合‘输入减去预测残差’格式。使用它以使得可执行逆计算。
如以上所描述,Aenc分量对应于通过从原始输入帧中的对应元素(I00至I11)的平均值减去R0(LOQ-1重建元素)而计算出的平均值(A)分量,其可表达为Aenc=AI–R0。在上采样并重建的LoQ-1帧的2×2网格的平均值标示为AU的情况下,则A=AI-AU,因为在LoQ-0下的平均值(A)是基于原始输入帧中的元素与上采样并重建的LoQ-1帧中的元素之间的差。这可重写为A={AI–R0}+{R0–AU},或者使用以上针对Aenc的方程,可重写为A=Aenc+{R0–AU}。因此,重组的平均值(A重组)包括:将LOQ-1重建元素R0与解码Aenc(在图12中称为AinvvQ,即,经过熵解码和去量化的Aenc)相加;以及减去上采样且重建的LoQ-1帧的2×2网格的平均值AU。这样,在解码器侧,A重组=AinvvQ+R0-AU。如从图12所示的公式中可看出,所得方程对应于本应是要在编码器处编码的实际平均值(A)分量。此后,执行与图11中所描述相同的步骤(其中反变换中的A被A重组取代),以便生成残差D00至D11
本公开描述了一种用于对信号、特别地视频信号和/或图像信号进行编码和解码的方法。
描述了一种对信号进行编码的方法,所述方法包括:接收输入帧;以及处理所述输入帧以生成至少一个第一组残差数据,所述残差数据使得解码器能够从参考重建帧重建所述原始帧。
在一些实例中,所述方法包括:从自解码模块获得的解码帧获得重建帧,其中所述解码模块被配置来通过对已经根据第一编码方法编码的第一编码帧进行解码来生成所述解码帧。所述方法还包括:对所述输入帧进行下采样以获得下采样帧;以及将所述下采样帧传递到编码模块,所述编码模块被配置来根据所述第一编码方法对所述下采样帧进行编码,以便生成所述第一编码帧。获得所述重建帧还可包括:对所述解码帧进行上采样以生成所述重建帧。
在一些实例中,所述方法包括:从第二组残差数据和自解码模块获得的解码帧的组合获得所述重建帧,其中所述解码模块被配置来通过对已经根据第一编码方法编码的第一编码帧进行解码来生成所述解码帧。所述方法还包括:对所述输入帧进行下采样以获得下采样帧;以及将所述下采样帧传递到编码模块,所述编码模块被配置来根据所述第一编码方法对所述下采样帧进行编码,以便生成所述第一编码帧。所述方法还包括:通过取得所述解码帧与所述下采样帧之间的差来生成所述第二组残差数据。所述方法还包括:对所述第二组残差数据进行编码以生成第一组编码残差数据。对所述第二组残差数据进行编码可根据第二编码方法执行。所述第二编码方法包括:将所述第二组残差数据变换成第二组变换残差数据。对所述第二组残差数据进行变换包括:选择所述第二组残差数据的子集;以及对所述子集应用变换以生成第二组变换残差数据的对应子集。所述第二组变换残差数据的所述子集中的一个可通过对所述第二组残差数据的所述子集求平均来获得。获得所述重建帧还可包括:对所述第二组残差数据和所述解码帧的所述组合进行上采样以生成所述重建帧。
在一些实例中,生成所述至少一组残差数据包括:取得所述参考重建帧与所述输入帧之间的差。所述方法还包括:对所述第一组残差数据进行编码以生成第一组编码残差数据。对所述第一组残差数据进行编码可根据第三编码方法执行。所述第三编码方法包括:将所述第一组残差数据变换成第一组变换残差数据。对所述第一组残差数据进行变换包括:选择所述第一组残差数据的子集;以及对所述子集应用变换以生成第一组变换残差数据的对应子集。所述第一组变换残差数据的所述子集中的一个可通过所述输入帧的子集的平均值与所述第二组残差数据和所述解码帧的所述组合的对应元素之间的差获得。
还描述了一种对信号进行解码的方法,所述方法包括:接收编码帧和至少一组编码残差数据。可使用第一编码方法对所述第一编码帧进行编码。可使用第二和/或第三编码方法对所述至少一组残差数据进行编码。
所述方法还包括:将所述第一编码帧传递到解码模块,其中所述解码模块被配置来通过对已经根据第一编码方法编码的所述编码帧进行解码来生成解码帧。
所述方法还包括:根据用于对所述至少一组编码残差数据进行编码的相应编码方法来对所述至少一组编码残差数据进行解码。
在一些实例中,通过应用对应于所述第二编码方法的第二解码方法来对第一组编码残差数据进行解码,以获得第一组解码残差数据。所述方法还包括:将所述第一组残差数据与所述解码帧组合以获得组合帧。所述方法还包括:对所述组合帧进行上采样以获得参考解码帧。
所述方法还包括:通过应用对应于所述第三编码方法的第三解码方法来对第二组编码残差数据进行解码,以获得第二组解码残差数据。所述方法还包括:将所述第二组解码残差数据与所述参考解码帧组合以获得重建帧。
在一些实例中,所述方法包括:对所述解码帧进行上采样以获得参考解码帧。
所述方法还包括:通过应用对应于所述第二或第三编码方法的第二或第三解码方法来对一组编码残差数据进行解码,以获得一组解码残差数据。所述方法还包括:将所述一组解码残差数据与所述参考解码帧组合以获得重建帧。
以上实施方案应被理解为说明性实例。设想到另外的实施方案。
应理解,关于任一个实施方案描述的任何特征都可单独使用,或者与所描述的其他特征结合使用,并且还可与任何其他实施方案的一个或多个特征结合使用,或者与任何其他实施方案的任何组合结合使用。此外,在不脱离所附权利要求限定的本发明的范围的情况下,还可采用以上未描述的等效物和修改。

Claims (20)

1.一种对信号进行编码的方法,所述方法包括:
接收输入帧;
对所述输入帧进行下采样以获得下采样帧;
将所述下采样帧传递到编码模块,所述编码模块被配置来对所述下采样帧进行编码以生成编码帧;
从解码模块获得解码帧,所述解码模块被配置来通过对所述编码帧进行解码来生成所述解码帧;
通过取得所述解码帧与所述下采样帧之间的差来生成第一组残差数据;
对所述第一组残差数据和所述解码帧的组合进行上采样以生成参考重建帧;
通过取得所述参考重建帧与所述输入帧之间的差来生成第二组残差数据;
对所述第一组残差数据和所述第二组残差数据进行编码以分别生成第一组编码残差数据和第二组编码残差数据,其中所述编码包括将所述第一组残差数据和所述第二组残差数据分别变换成第一组变换残差数据和第二组变换残差数据;以及
为解码器输出所述编码帧以及所述第一组编码残差数据和所述第二组编码残差数据,其中所述编码帧以及所述第一组残差数据和所述第二组残差数据使得所述解码器能够重建所述输入帧。
2.根据权利要求1所述的方法,其中所述编码模块被配置来根据第一编码方法对所述下采样帧进行编码,以便生成所述编码帧,并且其中:
所述第一组残差数据的所述编码是根据第二编码方法执行的,所述第二编码方法不同于所述第一编码方法;并且/或者
所述第二组残差数据的所述编码是根据第三编码方法执行的,所述第三编码方法不同于所述第一编码方法。
3.根据权利要求1或2所述的方法,其中所述编码模块和所述解码模块被配置来使用基于块的编码算法。
4.根据权利要求1至3中任一项所述的方法,其中所述第一组残差数据表示与所述编码模块和/或所述解码模块相关联的压缩误差。
5.根据权利要求1至5中任一项所述的方法,其中所述第二组残差数据表示与所述下采样和所述上采样相关联的重建误差。
6.根据权利要求1至6中任一项所述的方法,其中所述方法在具有恰好两个分层等级的分层编码系统中执行。
7.根据权利要求6的方法,其中所述两个分层等级中的一者对应于基线层,并且所述两个分层等级中的另一者对应于增强层。
8.根据权利要求1至7中任一项所述的方法,其中所述变换使用基于哈达玛的变换。
9.根据权利要求1至8中任一项所述的方法,其中所述变换使用2×2变换核。
10.根据权利要求1至9中任一项所述的方法,其中所述第一组残差数据的所述变换包括:
选择所述第一组残差数据的子集;以及
对所述第一组残差数据的所述子集应用变换以生成所述第一组变换残差数据的对应子集。
11.根据权利要求10所述的方法,其中所述第一组变换残差数据的所述子集中的一个是通过对所述第一组残差数据的所述子集求平均获得的。
12.根据权利要求1至11所述的方法,其中所述第二组残差数据的所述变换包括:
选择所述第二组残差数据的子集;以及
对所述第二组残差数据的所述子集应用变换以生成所述第二组变换残差数据的对应子集。
13.根据权利要求12所述的方法,其中所述第二组变换残差数据的所述子集中的一个是通过以下两者之间的差获得的:
所述输入帧的子集的平均值;以及
所述第一组残差数据和所述解码帧的所述组合的对应元素。
14.根据权利要求1至13中任一项所述的方法,其中所述编码包括:将所述第一组变换残差数据和所述第二组残差数据中的至少一些分别量化成第一组量化残差数据和第二组量化残差数据。
15.根据权利要求14所述的方法,其中所述编码包括:将所述第一组量化残差数据和所述第二组量化残差数据分别熵编码成第一组熵编码残差数据和第二组熵编码残差数据。
16.根据权利要求1至15中任一项所述的方法,其中所述信号包括视频信号和/或图像信号。
17.一种对信号进行编码的方法,所述方法包括:
生成第一组残差数据和第二组残差数据;以及
对所述第一组残差数据和所述第二组残差数据进行编码以分别生成第一组编码残差数据和第二组编码残差数据,其中所述编码包括将所述第一组残差数据和所述第二组残差数据分别变换成第一组变换残差数据和第二组变换残差数据,并且其中所述变换包括:
选择所述第一组残差数据和所述第二组残差数据的子集;以及
对所述子集应用变换以分别生成所述第一组变换残差数据和所述第二组变换残差数据的对应子集,
其中所述第一组变换残差数据的所述子集中的一个是通过对所述第一组残差数据的所述子集求平均获得的;并且
其中所述第二组变换残差数据的所述子集中的一个是通过以下两者之间的差获得的:
所述输入帧的子集的平均值;以及
所述第一组残差数据和所述解码帧的组合的对应元素。
18.一种对信号进行编码的方法,所述方法包括:
接收输入帧;
对所述输入帧进行下采样以获得下采样帧;
将所述下采样帧传递到编码模块,所述编码模块被配置来对所述下采样帧进行编码以生成编码帧;
从解码模块获得解码帧,所述解码模块被配置来通过对所述编码帧进行解码来生成所述解码帧;
通过取得所述解码帧与所述下采样帧之间的差来生成第一组残差数据;
对所述第一组残差数据进行编码以生成第一组编码残差数据,其中所述编码包括将所述第一组残差数据变换成第一组变换残差数据;以及
为解码器输出包括至少所述第一组编码残差数据的数据,其中所述输出数据使得所述解码器能够重建所述输入帧。
19.一种对信号进行解码的方法,所述方法包括:
接收编码帧以及第一组编码残差数据和第二组编码残差数据;
将所述解码帧传递到解码模块,所述解码模块被配置来通过对所述编码帧进行解码来生成所述解码帧;
对所述第一组编码残差数据和所述第二组编码残差数据进行解码以生成第一组重建残差数据和第二组重建残差数据,其中所述解码包括将所述第一组编码残差数据和所述第二组编码残差数据分别变换成第一组重建残差数据和第二组重建残差数据;
将所述第一组重建残差数据与所述解码帧组合以获得组合帧;
对所述组合帧进行上采样以获得参考解码帧;以及
将所述第二组重建残差数据与所述参考解码帧组合以获得重建帧。
20.一种设备,其被配置来执行根据权利要求1至19中任一项所述的方法。
CN201980063323.6A 2018-08-03 2019-08-01 用于信号增强编码的变换 Pending CN112789857A (zh)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
GB1812708.4 2018-08-03
GBGB1812708.4A GB201812708D0 (en) 2018-08-03 2018-08-03 Encoding and Decoding methods and apparatuses
GB1812710.0 2018-08-03
GBGB1812710.0A GB201812710D0 (en) 2018-08-03 2018-08-03 Encoding and Decoding methods and apparatuses
GBGB1812709.2A GB201812709D0 (en) 2018-08-03 2018-08-03 Encoding and Decoding methods and Apparatuses
GB1812709.2 2018-08-03
GBGB1903844.7A GB201903844D0 (en) 2019-03-20 2019-03-20 A method of encoding and decoding a video
GB1903844.7 2019-03-20
GBGB1904014.6A GB201904014D0 (en) 2019-03-23 2019-03-23 Video coding technology
GB1904014.6 2019-03-23
GBGB1904492.4A GB201904492D0 (en) 2019-03-29 2019-03-29 Video coding technology
GB1904492.4 2019-03-29
GB1905325.5 2019-04-15
GBGB1905325.5A GB201905325D0 (en) 2019-04-15 2019-04-15 Video coding technology
PCT/GB2019/052154 WO2020025957A1 (en) 2018-08-03 2019-08-01 Transformations for signal enhancement coding

Publications (1)

Publication Number Publication Date
CN112789857A true CN112789857A (zh) 2021-05-11

Family

ID=67551571

Family Applications (4)

Application Number Title Priority Date Filing Date
CN201980060140.9A Pending CN112703738A (zh) 2018-08-03 2019-08-01 针对信号增强编码的上采样
CN201980064342.0A Pending CN113228668A (zh) 2018-08-03 2019-08-01 用于信号增强编码的熵编码
CN201980060214.9A Active CN112771868B (zh) 2018-08-03 2019-08-01 信号增强编码结构
CN201980063323.6A Pending CN112789857A (zh) 2018-08-03 2019-08-01 用于信号增强编码的变换

Family Applications Before (3)

Application Number Title Priority Date Filing Date
CN201980060140.9A Pending CN112703738A (zh) 2018-08-03 2019-08-01 针对信号增强编码的上采样
CN201980064342.0A Pending CN113228668A (zh) 2018-08-03 2019-08-01 用于信号增强编码的熵编码
CN201980060214.9A Active CN112771868B (zh) 2018-08-03 2019-08-01 信号增强编码结构

Country Status (9)

Country Link
US (7) US20210329246A1 (zh)
EP (5) EP4376418A2 (zh)
CN (4) CN112703738A (zh)
AU (3) AU2019315029A1 (zh)
BR (2) BR112021001807A2 (zh)
CA (2) CA3108454A1 (zh)
MX (2) MX2021001341A (zh)
WO (4) WO2020025957A1 (zh)
ZA (1) ZA202101059B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021209748A1 (en) * 2020-04-14 2021-10-21 V-nova International Ltd. Transformed coefficient ordering for entropy coding
US11863318B2 (en) * 2020-08-31 2024-01-02 Frontiir Pte Ltd. Error correction for network packets
US20220383554A1 (en) * 2021-05-18 2022-12-01 Tencent America LLC Substitutional quality factor learning for quality-adaptive neural network-based loop filter
WO2023135410A1 (en) 2022-01-11 2023-07-20 V-Nova International Ltd Integrating a decoder for hierarchical video coding
WO2023167502A1 (ko) * 2022-03-02 2023-09-07 엘지전자 주식회사 피쳐 부호화/복호화 방법, 장치, 비트스트림을 저장한 기록 매체 및 비트스트림 전송 방법
CN116193113B (zh) * 2022-12-07 2024-06-14 辉羲智能科技(上海)有限公司 数据解压和压缩方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006080797A1 (en) * 2005-01-27 2006-08-03 Samsung Electronics Co., Ltd. Multilayer video encoding/decoding method using residual re-estimation and apparatus using the same
CN102196256A (zh) * 2010-03-11 2011-09-21 中国科学院微电子研究所 一种视频编码方法及装置
CN104641643A (zh) * 2012-05-14 2015-05-20 卢卡·罗萨托 在分层层级中信号编码、解码和重构期间残差数据的分解
GB2553556A (en) * 2016-09-08 2018-03-14 V Nova Ltd Data processing apparatuses, methods, computer programs and computer-readable media

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0162197B1 (ko) * 1992-05-30 1998-12-15 강진구 영상데이타의 가변장부호와/복호화방법 및 장치
JP3242788B2 (ja) * 1994-03-29 2001-12-25 三菱電機株式会社 信号処理装置及び信号処理方法
US5654702A (en) * 1994-12-16 1997-08-05 National Semiconductor Corp. Syntax-based arithmetic coding for low bit rate videophone
US6014694A (en) * 1997-06-26 2000-01-11 Citrix Systems, Inc. System for adaptive video/audio transport over a network
US6658056B1 (en) * 1999-03-30 2003-12-02 Sony Corporation Digital video decoding, buffering and frame-rate converting method and apparatus
US6674479B2 (en) * 2000-01-07 2004-01-06 Intel Corporation Method and apparatus for implementing 4:2:0 to 4:2:2 and 4:2:2 to 4:2:0 color space conversion
AUPR192700A0 (en) * 2000-12-06 2001-01-04 Canon Kabushiki Kaisha Storing coding image data in storage of fixed memory size
US7016547B1 (en) * 2002-06-28 2006-03-21 Microsoft Corporation Adaptive entropy encoding/decoding for screen capture content
US6781528B1 (en) * 2002-10-24 2004-08-24 Apple Computer, Inc. Vector handling capable processor and run length encoding
US7483577B2 (en) * 2004-03-02 2009-01-27 Mitsubishi Electric Research Laboratories, Inc. System and method for joint de-interlacing and down-sampling using adaptive frame and field filtering
KR100679022B1 (ko) * 2004-10-18 2007-02-05 삼성전자주식회사 계층간 필터링을 이용한 비디오 코딩 및 디코딩방법과,비디오 인코더 및 디코더
KR20070012201A (ko) 2005-07-21 2007-01-25 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
US8340179B2 (en) * 2006-03-21 2012-12-25 Canon Kabushiki Kaisha Methods and devices for coding and decoding moving images, a telecommunication system comprising such a device and a program implementing such a method
US8170101B2 (en) * 2006-10-27 2012-05-01 Sharp Laboratories Of America, Inc. Methods and systems for low-complexity data compression
FR2913163A1 (fr) * 2007-02-27 2008-08-29 Canon Kk Procede et dispositif de transmission de donnees video
US20080225952A1 (en) * 2007-03-15 2008-09-18 Nokia Corporation System and method for providing improved residual prediction for spatial scalability in video coding
US8848787B2 (en) 2007-10-15 2014-09-30 Qualcomm Incorporated Enhancement layer coding for scalable video coding
US8179974B2 (en) * 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
EP2128822B1 (en) * 2008-05-27 2012-01-04 TELEFONAKTIEBOLAGET LM ERICSSON (publ) Index-based pixel block processing
US9571856B2 (en) * 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
CN101742324A (zh) * 2008-11-14 2010-06-16 北京中星微电子有限公司 视频编解码方法、视频编解码系统及编解码器
JP2010239288A (ja) * 2009-03-30 2010-10-21 Sony Corp 情報処理装置および方法
WO2010127692A1 (en) * 2009-05-05 2010-11-11 Telefonaktiebolaget Lm Ericsson (Publ) Scalable video coding method, encoder and computer program
US8325186B2 (en) * 2009-05-21 2012-12-04 Sony Computer Entertainment America Llc Method and apparatus for rendering shadows
US9069713B2 (en) * 2009-06-05 2015-06-30 Qualcomm Incorporated 4X4 transform for media coding
US8913040B2 (en) * 2010-11-05 2014-12-16 Apple Inc. Downsampling data for crosstalk compensation
EP2479994B1 (en) * 2011-01-19 2017-03-15 BlackBerry Limited Method and device for improved multi-layer data compression
US10397577B2 (en) * 2011-03-08 2019-08-27 Velos Media, Llc Inverse scan order for significance map coding of transform coefficients in video coding
US8948248B2 (en) * 2011-07-21 2015-02-03 Luca Rossato Tiered signal decoding and signal reconstruction
CN104380745B (zh) * 2012-06-22 2018-04-27 联发科技股份有限公司 图层间与视图间自适应帧内预测方法及其装置
WO2014025741A2 (en) 2012-08-06 2014-02-13 Vid Scale, Inc. Sampling grid information for spatial layers in multi-layer video coding
EP2941872B1 (en) * 2013-01-02 2018-09-26 Dolby Laboratories Licensing Corporation Backward-compatible coding for ultra high definition video signals with enhanced dynamic range
JP6205000B2 (ja) * 2013-03-11 2017-09-27 ドルビー ラボラトリーズ ライセンシング コーポレイション 階層符号化を用いたマルチフォーマットハイダイナミックレンジビデオの配信
AU2014231403A1 (en) * 2013-03-12 2015-07-16 Hfi Innovation Inc. Inter-layer motion vector scaling for scalable video coding
KR102301083B1 (ko) 2013-04-15 2021-09-10 루카 로사토 하이브리드 백워드-호환가능 신호 인코딩 및 디코딩
EP2816805B1 (en) 2013-05-29 2020-12-30 BlackBerry Limited Lossy data compression with conditional reconstruction reinfinement
US9143797B2 (en) * 2013-05-29 2015-09-22 Blackberry Limited Lossy data compression with conditional reconstruction refinement
US10244223B2 (en) * 2014-01-10 2019-03-26 Ostendo Technologies, Inc. Methods for full parallax compressed light field 3D imaging systems
EP3200156B1 (en) * 2014-09-26 2020-12-23 LG Electronics Inc. Method and device for processing graph-based signal using geometric primitives
US20170064298A1 (en) * 2015-09-02 2017-03-02 Blackberry Limited Video coding with delayed reconstruction
US10440401B2 (en) * 2016-04-07 2019-10-08 Dolby Laboratories Licensing Corporation Backward-compatible HDR codecs with temporal scalability
CN109511284B (zh) * 2016-05-26 2023-09-01 Vid拓展公司 视窗自适应360度视频传送的方法和设备
US10616583B2 (en) * 2016-06-30 2020-04-07 Sony Interactive Entertainment Inc. Encoding/decoding digital frames by down-sampling/up-sampling with enhancement information
WO2018041843A1 (en) * 2016-08-29 2018-03-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder for Encoding, and Decoder for Decoding, a Digital Image Representation into a Data Stream using Indicating a Number of Leading Zero Bit Planes
US9922432B1 (en) * 2016-09-02 2018-03-20 Artomatix Ltd. Systems and methods for providing convolutional neural network based image synthesis using stable and controllable parametric models, a multiscale synthesis framework and novel network architectures
US10855997B2 (en) * 2017-04-14 2020-12-01 Mediatek Inc. Secondary transform kernel size selection
US10560723B2 (en) * 2017-05-08 2020-02-11 Qualcomm Incorporated Context modeling for transform coefficient coding
US10291925B2 (en) * 2017-07-28 2019-05-14 Intel Corporation Techniques for hardware video encoding
EP3489901A1 (en) * 2017-11-24 2019-05-29 V-Nova International Limited Signal encoding
US10855986B2 (en) * 2018-05-29 2020-12-01 Qualcomm Incorporated Bandwidth compression for neural network systems
EP3806475B1 (en) * 2018-07-06 2023-05-10 LG Electronics, Inc. Transform-based image coding method and device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006080797A1 (en) * 2005-01-27 2006-08-03 Samsung Electronics Co., Ltd. Multilayer video encoding/decoding method using residual re-estimation and apparatus using the same
CN102196256A (zh) * 2010-03-11 2011-09-21 中国科学院微电子研究所 一种视频编码方法及装置
CN104641643A (zh) * 2012-05-14 2015-05-20 卢卡·罗萨托 在分层层级中信号编码、解码和重构期间残差数据的分解
GB2553556A (en) * 2016-09-08 2018-03-14 V Nova Ltd Data processing apparatuses, methods, computer programs and computer-readable media

Also Published As

Publication number Publication date
US11546634B2 (en) 2023-01-03
CN113228668A (zh) 2021-08-06
AU2019315029A1 (en) 2021-03-11
EP3831068A1 (en) 2021-06-09
ZA202101059B (en) 2022-09-28
CA3108454A1 (en) 2020-02-06
WO2020025955A1 (en) 2020-02-06
US20210235120A1 (en) 2021-07-29
AU2019315758B2 (en) 2023-04-06
US20230239505A1 (en) 2023-07-27
AU2019315758A1 (en) 2021-02-25
EP4376418A2 (en) 2024-05-29
US11611777B2 (en) 2023-03-21
EP3831065A1 (en) 2021-06-09
MX2021001341A (es) 2021-05-27
US20210306676A1 (en) 2021-09-30
AU2023204360A1 (en) 2023-07-27
US20230171430A1 (en) 2023-06-01
BR112021001807A2 (pt) 2021-04-27
US20210329246A1 (en) 2021-10-21
US11570473B2 (en) 2023-01-31
EP3831066A1 (en) 2021-06-09
CN112703738A (zh) 2021-04-23
CN112771868B (zh) 2024-04-05
WO2020025954A1 (en) 2020-02-06
CN112771868A (zh) 2021-05-07
US20210329244A1 (en) 2021-10-21
US20230421815A1 (en) 2023-12-28
MX2021001370A (es) 2021-09-10
WO2020025957A1 (en) 2020-02-06
EP3831065B1 (en) 2024-04-10
CA3108402A1 (en) 2020-02-06
WO2020025964A1 (en) 2020-02-06
EP3831067A1 (en) 2021-06-09
BR112021001958A2 (pt) 2021-04-27

Similar Documents

Publication Publication Date Title
CN112789857A (zh) 用于信号增强编码的变换
US8767823B2 (en) Method and apparatus for frame memory compression
KR101425602B1 (ko) 영상 부호화/복호화 장치 및 그 방법
KR20150129715A (ko) 향상 레이어 차분들에 대한 세컨더리 변환을 적용하기 위한 방법 및 장치
US20220217372A1 (en) Modified upsampling for video coding technology
US20130272391A1 (en) Method and Apparatus of Quantization Matrix Coding
US8199820B2 (en) Intermediate compression of reference frames for transcoding
US8594189B1 (en) Apparatus and method for coding video using consistent regions and resolution scaling
KR100651316B1 (ko) 정보 스트림 디코더에서 메모리 자원 이용을 증가시키는 방법 및 장치
US8824812B2 (en) Method and apparatus for data compression using error plane coding
US20240040160A1 (en) Video encoding using pre-processing
JP2022536512A (ja) 符号化器及び一連のフレームを符号化する方法
CN114531952A (zh) 视频编码中的残差的量化
JP2008306510A (ja) 画像符号化方法、画像符号化装置、画像復号化方法及び画像復号化装置
JP6792360B2 (ja) 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム
JP3853708B2 (ja) デジタル画像符号化装置および符号化方法ならびにプログラム
JP2004266794A (ja) マルチ・リゾルーション・ビデオ符号化および復号化
EA040654B1 (ru) Преобразования для кодирования улучшения сигнала
JP2018198402A (ja) 符号化装置、復号装置、及びプログラム
US20230319323A1 (en) Video Coding With Embedded Motion
TW202348027A (zh) 用於應用預測平均值修改之上取樣濾波器
JP2015138995A (ja) 符号化装置、復号装置、及びプログラム
Tin A LOSSY CODING SCHEME FOR IMAGES BY USING THE HAAR WAVELET TRANSFORM AND THE THEORY OF IDEAL CROSS-POINTS REGIONS
Matsuda et al. Rate-distortion optimized image coding allowing lossless conversion to JPEG compliant bitstreams
JP2012129949A (ja) 画像符号化方法及び装置、画像復号化方法及び装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination