CN103222263B - 基于改进的拉普拉斯求和滤波器标引与四叉树分割的组合的多输入自适应滤波器 - Google Patents
基于改进的拉普拉斯求和滤波器标引与四叉树分割的组合的多输入自适应滤波器 Download PDFInfo
- Publication number
- CN103222263B CN103222263B CN201180042433.8A CN201180042433A CN103222263B CN 103222263 B CN103222263 B CN 103222263B CN 201180042433 A CN201180042433 A CN 201180042433A CN 103222263 B CN103222263 B CN 103222263B
- Authority
- CN
- China
- Prior art keywords
- wave filter
- coefficient
- filter
- value
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/439—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using cascaded computational arrangements for performing a single operation, e.g. filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
在视频编码器处应用滤波,且在位流中编码滤波器信息以使视频解码器能够识别在所述视频编码器处应用的所述滤波。所述视频解码器接收包含所述滤波器信息的经编码视频数据,解码所述视频数据,且基于所述滤波信息应用滤波。以此方式,所述解码器应用在所述编码器处应用的相同滤波。可利用针对使用四叉树分割方案分割的经译码单元的多个输入使用拉普拉斯滤波器标引的多个滤波器来编码视频。
Description
技术领域
本发明涉及用于压缩视频数据的基于块的数字视频译码,且更特定来说涉及用于确定用于对视频块的滤波的滤波器的技术。
背景技术
数字视频能力可并入到广泛的装置中,包含数字电视、数字直播系统、例如无线电电话手持机等无线通信装置、无线广播系统、个人数字助理(PDA)、膝上型计算机、桌上型计算机、平板计算机、数码相机、数字记录装置、视频游戏装置、视频游戏控制台等。数字视频装置实施视频压缩技术,例如MPEG-2、MPEG-4或ITU-TH.264/MPEG-4第十部分(高级视频译码(AVC)),以更高效地发射及接收数字视频。视频压缩技术执行空间和时间预测以减少或移除视频序列中固有的冗余。例如由“联合协作团队-视频译码”(JCTVC)开发的高效视频译码(HEVC)标准(其是MPEG与ITU-T之间的协作)等新的视频标准持续出现和发展。此新的HEVC标准有时也称为H.265。
基于块的视频压缩技术可执行空间预测和/或时间预测。帧内译码依赖于空间预测来减少或移除给定经译码视频单元(其可包括视频帧、视频帧的切片等)内的视频块之间的空间冗余。与此相对,帧间译码依赖于时间预测来减少或去除视频序列的连续经译码单元的视频块之间的时间冗余。对于帧内译码,视频编码器执行空间预测来基于同一经译码视频单元内的其它数据而压缩数据。对于帧间译码,视频编码器执行运动估计和运动补偿来跟踪两个或两个以上邻近经译码视频单元的对应视频块的移动。
经译码的视频块可由可用于创建或识别预测块的预测信息及指示正被译码的块与预测块之间的差异的残余数据块表示。在帧间译码的情况下,一个或一个以上运动向量用以从前一或后一经译码单元识别预测性数据块,而在帧内译码的情况下,预测模式可用以基于与正被译码的视频块相关联的经译码单元内的数据产生预测性块。帧内译码及帧间译码两者可界定若干不同预测模式,所述预测模式可界定译码中所使用的不同块大小及/或预测技术。还可包括额外类型的语法元素作为经编码视频数据的一部分,以便控制或界定译码过程中所使用的译码技术或参数。
在基于块的预测译码之后,视频编码器可应用变换、量化及熵译码过程以进一步减小与残余块的通信相关联的位速率。变换技术可包含离散余弦变换(DCT)或概念上类似的过程,例如小波变换(wavelettransform)、整数变换或其它类型的变换。在离散余弦变换过程中,例如,变换过程将一组像素值转换成变换系数,其可表示像素值在频域中的能量。将量化应用于变换系数,且量化通常涉及限制与任何给定变换系数相关联的位的数目的过程。熵译码包含共同地压缩经量化变换系数的序列的一个或一个以上过程。
可应用视频块的滤波作为编码及解码循环的一部分,或作为对经重建的视频块的后滤波过程的一部分。滤波通常用以(例如)减少成块效应(blockiness)或基于块的视频译码所共有的其它假影。滤波器系数(有时称为滤波器分接头)可经界定或选择以便促进可减少成块效应的所要等级的视频块滤波及/或以其它方式改进视频质量。举例来说,一组滤波器系数可界定如何沿视频块的边缘或视频块内的其它位置应用滤波。不同滤波器系数可引起关于视频块的不同像素的不同等级的滤波。举例来说,滤波可平滑化或锐化邻近像素值的强度差异,以便帮助消除不想要的假影。
发明内容
本发明描述与视频编码及/或视频解码过程中的视频数据的滤波相关联的技术。根据本发明,在编码器处应用滤波,且在位流中编码滤波器信息以使解码器能够识别编码器处应用的滤波。解码器接收包含滤波器信息的经编码视频数据,解码所述视频数据,且基于所述滤波信息应用滤波。以此方式,解码器应用在编码器处应用的相同滤波。
根据本发明的技术,可以称为经译码单元(CU)的单元对视频数据进行译码。经译码单元可使用四叉树分割方案分割为较小经译码单元或子单元。针对特定经译码单元识别四叉树分割方案的语法可从编码器发射到解码器。与每一子单元相关联的多个输入可在解码和重建经编码视频数据的过程期间滤波。解码器接收的位流中的语法可识别针对特定子单元在编码器处使用的滤波器。用于特定输入的滤波器可基于活动-度量滤波器标引来选择,其中针对活动度量的某些值经标引到一组滤波器内的特定滤波器。在使用改进的拉普拉斯求和值来确定活动度量的情况下,活动-度量滤波器标引有时称为改进的拉普拉斯求和标引或简称为拉普拉斯标引。
可基于针对视频数据所确定的活动度量而应用不同类型的滤波。活动度量可量化与视频数据内的一个或一个以上像素块相关联的活动。活动度量可包括指示一组像素内的像素方差的方差度量。举例来说,活动度量可包含改进的拉普拉斯求和函数值,如下文更详细阐释。根据本发明的技术,例如自适应环路中滤波器等滤波器单元可经配置以基于改进的拉普拉斯求和滤波器标引而针对多个输入利用多个滤波器。如下文将更详细描述,本发明中描述的多个输入大体指代在编码和解码过程期间产生的中间视频块数据或图像数据。多个输入可包含(例如)经重建块或图像(RI)、经预解块的经重建块或图像(pRI)、预测块或图像(PI),和/或经量化预测误差图像(EI)。并且,如下文更详细阐释,本发明的滤波技术可使用四叉树分割方案应用于各种大小的经译码单元。通过利用针对使用四叉树分割方案分割的经译码单元的多个输入使用拉普拉斯滤波器标引的多个滤波器,如通过压缩率和经重建视频质量中的一者或两者所测量的视频译码性能可能得到改善。
如本发明中预期的多输入多滤波器方法可产生较大数目的滤波器,且因此需要较大数目的滤波器系数从编码器传递到解码器。然而,对于一些滤波器,所有系数可能为零。举例来说,在4输入情境中,编码器可确定仅通过使用四个输入中的三者获得最佳图像。在解码器处,仅基于四个输入中的三者重建图像可通过将全部为零的滤波器应用于第四输入来实现。因此,具有全部为零的系数的滤波器的使用可在多输入滤波方案中比在单输入滤波方案中更频繁发生。然而,发射全部为零的滤波器可需要较大数目的位。为减少将滤波器系数从编码器传递到解码器所需的经译码位的数目,本发明的方面包含使用零旗标,其可为视频块的帧、切片、最大经译码单元、经译码单元或其它系列的标头中的1位语法元素。如果针对特定滤波器的所有系数均为零,那么编码器可将设定为第一值的零旗标发射到解码器。在接收到设定为第一值的零旗标后,解码器可即刻在未实际上从编码器接收到识别所有零系数的数据的情况下重建滤波器。如果针对特定滤波器的系数包含至少一个非零系数,那么编码器可将设定为第二值的零旗标发射到解码器。在接收到设定为第二值的零旗标后,解码器可即刻基于随后从编码器接收的系数重建滤波器。因此,为了重建滤波器,编码器可仅需针对至少一个滤波器系数为非零的那些情况将滤波器系数发射到解码器。
在一个实例中,一种对视频数据进行译码的方法包含:基于活动度量将来自一组滤波器的第一滤波器应用于第一输入以产生第一经滤波结果;将第二滤波器应用于第二输入以产生第二经滤波结果,其中第二输入不同于第一输入;以及基于第一经滤波结果和第二经滤波结果产生经滤波图像。
在另一实例中,一种译码装置包含:滤波器单元,其经配置以基于活动度量将来自一组滤波器的第一滤波器应用于第一输入以产生第一经滤波结果,且将第二滤波器应用于第二输入以产生第二经滤波结果,其中第二输入不同于第一输入;以及存储器,其经配置以存储基于第一经滤波结果和第二经滤波结果的经滤波图像。
在另一实例中,一种设备包含:用于基于活动度量将来自一组滤波器的第一滤波器应用于第一输入以产生第一经滤波结果的装置;用于将第二滤波器应用于第二输入以产生第二经滤波结果的装置,其中第二输入不同于第一输入;以及用于基于第一经滤波结果和第二经滤波结果产生经滤波图像的装置。
本发明中所描述的技术可以硬件、软件、固件或其任一组合来实施。如果以硬件实施,那么设备可作为集成电路、处理器、离散逻辑或其任何组合而实现。如果以软件来实施,则可在例如微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或数字信号处理器(DSP)等一个或一个以上处理器中执行软件。可最初将执行所述技术的软件存储于计算机可读媒体中且在处理器中加载并执行。
因此,本发明还预期一种有形地存储一个或一个以上指令的非暂时性计算机可读存储媒体,所述指令在由一个或一个以上处理器执行时致使所述一个或一个以上处理器:基于活动度量将来自一组滤波器的第一滤波器应用于第一输入以产生第一经滤波结果;将第二滤波器应用于第二输入以产生第二经滤波结果,其中第二输入不同于第一输入;且基于第一经滤波结果和第二经滤波结果产生经滤波图像。
附图说明
图1为说明示范性视频编码和解码系统的框图。
图2A和2B为说明应用于最大译码单元(LCU)的四叉树分割的实例的概念图。
图2C和2D为说明用于视频块系列的滤波器图的实例的概念图。
图3为说明与本发明一致的示范性视频编码器的框图。
图4为说明与本发明一致的示范性视频解码器的框图。
图5为说明用于活动度量的值的范围的概念图。
图6为说明与本发明一致的示范性滤波器单元的框图。
图7为说明与本发明一致的编码技术的流程图。
图8为说明与本发明一致的解码技术的流程图。
图9为说明与本发明一致的编码技术的流程图。
图10为说明与本发明一致的解码技术的流程图。
具体实施方式
本发明描述与视频编码及/或视频解码过程中的视频数据的滤波相关联的技术。根据本发明,在编码器处应用滤波,且在位流中编码滤波器信息以使解码器能够识别编码器处应用的滤波。解码器接收包括滤波器信息的经编码视频数据,解码所述视频数据且基于所述滤波信息应用滤波。以此方式,解码器应用曾在编码器处应用的相同滤波。
根据本发明的技术,可以称为经译码单元(CU)的单元对视频数据进行译码。经译码单元可使用四叉树分割方案分割为较小经译码单元或子单元。针对特定经译码单元识别四叉树分割方案的语法可从编码器发射到解码器。与每一子单元相关联的多个输入可在解码和重建经编码视频数据的过程期间被滤波。解码器接收的位流中的语法可识别针对特定子单元在编码器处使用的滤波器。用于特定输入的滤波器可基于活动-度量滤波器标引来选择,其中针对活动度量的某些值被标引到一组滤波器内的特定滤波器。在使用改进的拉普拉斯求和值来确定活动度量的情况下,活动-度量滤波器标引有时称为改进的拉普拉斯求和标引或简称为拉普拉斯标引。
可基于针对视频数据所确定的活动度量而应用不同类型的滤波。活动度量可量化与视频数据内的一个或一个以上像素块相关联的活动。活动度量可包含指示一组像素内的像素方差的方差度量。举例来说,活动度量可包含改进的拉普拉斯求和函数值,如下文更详细阐释。根据本发明的技术,例如自适应环路中滤波器等滤波器单元可经配置以基于改进的拉普拉斯求和滤波器标引而针对多个输入利用多个滤波器。如下文将更详细描述,本发明中描述的多个输入大体指代在编码和解码过程期间产生的中间视频块数据或图像数据。多个输入可包含(例如)经重建块或图像(RI)、经预解块的经重建块或图像(pRI)、预测块或图像(PI),和/或经量化预测误差图像(EI)。并且,如下文更详细阐释,本发明的滤波技术可使用四叉树分割方案应用于各种大小的经译码单元。通过利用针对使用四叉树分割方案分割的经译码单元的多个输入使用拉普拉斯滤波器标引的多个滤波器,如通过压缩速率和经重建视频质量中的一者或两者所测量的视频译码性能可能得到改善。
如本发明中预期的多输入多滤波器方法可产生较大数目的滤波器,且因此需要较大数目的滤波器系数从编码器传递到解码器。然而,对于一些滤波器,所有系数可能为零。举例来说,在4输入情境中,编码器可确定仅通过使用四个输入中的三者来获得最佳图像。在解码器处,仅基于四个输入中的三者重建图像可通过将全部为零的滤波器应用于第四输入来实现。因此,具有全部为零的系数的滤波器的使用可在多输入滤波方案中比在单输入滤波方案中更频繁发生。然而,发射全部为零的滤波器可需要较大数目的位。举例来说,在每一滤波器系数使用5位发射的9×9滤波器的情况下,将滤波器的所有系数从编码器发射到解码器可花费超过400位。
为减少将滤波器系数从编码器传递到解码器所需的经译码位的数目,本发明的方面包含使用零旗标,其可为视频块的帧、切片、最大经译码单元、经译码单元或其它系列的标头中的1位语法元素。如果针对特定滤波器的所有系数均为零,那么编码器可将设定为第一值的零旗标发射到解码器。在接收到设定为第一值的零旗标后,解码器可即刻在未实际上从编码器接收到识别所有零系数的数据的情况下重建滤波器。如果针对特定滤波器的系数包含至少一个非零系数,那么编码器可将设定为第二值的零旗标发射到解码器。在接收到设定为第二值的零旗标后,解码器可即刻基于随后从编码器接收的系数重建滤波器。因此,为了重建滤波器,编码器可仅需针对至少一个滤波器系数为非零的那些情况将滤波器系数发射到解码器。
编码器发射的零旗标可例如包含在一系列视频块的标头中,例如切片标头、图片群组标头、序列标头或其它标头中。尽管出于阐释的目的本发明将大体将零旗标论述为包含在标头中,但零旗标或者可包含在脚注或其中可包含语法的其它数据结构中。标头可每滤波器每输入包含一个零旗标。作为一实例,假定fm(l,n)等于第m输入的第l滤波器的第n系数的滤波器系数。假定四个输入(即,m=0到3)且每输入四个滤波器(即,l=0到3),那么经译码单元可能包含总共16个零旗标,16个滤波器中的每一者各一个。如果zero_flagm(l)=1,表示第m输入的第l滤波器的所有系数均等于零,那么针对所述滤波器不需要将任何系数从编码器发送到解码器。如果zero_flagm(l)=0,表示第m输入的第l滤波器的至少一个系数不等于零,那么将识别第m输入的第l滤波器的系数的额外数据从编码器发射到解码器。如下文将更详细描述,所述额外数据可包含一些或所有滤波器系数的实际值,或可包含允许解码器基于额外数据与解码器已知的其它信息的组合来重建滤波器的例如差异信息等信息。
尽管本发明的技术将大体参考环路中滤波来描述,但所述技术可应用于环路中滤波、环路后滤波和例如切换式滤波等其它滤波方案。环路中滤波指代其中经滤波数据为编码及解码环路的一部分,使得经滤波数据用于预测性帧内译码或帧间译码的滤波。环路后滤波指代在编码环路之后应用于经重建视频数据的滤波。在后滤波的情况下,将未经滤波的数据用于预测性帧内译码或帧间译码。本发明的技术不限于环路内滤波或后滤波,且可应用于在视频译码期间应用的各种各样的滤波。
本发明中,术语“译码”指代编码或解码。类似地,术语“译码器”大体指代任何视频编码器、视频解码器,或组合式编码器/解码器(codec)。因而,术语“译码器”在本文中用以指代执行视频编码或视频解码的专用计算机装置或设备。
另外,本发明中,术语“滤波器”大体指代一组滤波器系数。举例来说,3×3滤波器由一组9个滤波器系数界定,5×5滤波器由一组25个滤波器系数界定,等等。因此,对滤波器进行编码大体指代对将使解码器能够确定或重建所述组滤波器系数的位流中的信息进行编码。虽然编码滤波器可包含直接编码整个一组滤波器系数,但其也可包含仅直接编码一部分组滤波器系数或完全不编码任何滤波器系数而是对使解码器能够基于解码器已知或可获得的其它信息重建滤波器系数的信息进行编码。举例来说,编码器可对描述如何更改一组现有滤波器系数以产生一组新的滤波器系数的信息进行编码。
术语“滤波器组”大体指代一组一个以上滤波器。举例来说,一组2个3×3滤波器可包含第一组9个滤波器系数以及第二组9个滤波器。根据本发明中描述的技术,对于一系列视频块(例如,帧、切片,或最大译码单元),识别滤波器组的信息在针对所述系列的视频块的标头中从编码器发射到解码器。所述组滤波器中的每一滤波器可具有在所述标头中的对应零旗标以指示所述滤波器含有全部为零的系数还是含有至少一个非零系数。
图1为说明可实施本发明的技术的示范性视频编码及解码系统110的框图。如图1中所示,系统110包含经由通信信道115将经编码视频数据发射到目的地装置116的源装置112。源装置112及目的地装置116可包括各种各样的装置中的任一者。在一些情况下,源装置112及目的地装置116可包括无线通信装置手持机,例如所谓的蜂窝式或卫星无线电话。然而,更一般来说应用于视频数据的滤波的本发明的技术不一定限于无线应用或环境,且可应用于包含视频编码和/或解码能力的非无线装置。
在图1的实例中,源装置112包含视频源120、视频编码器122、调制器/解调器(调制解调器)123和发射器124。目的地装置116包含接收器126、调制解调器127、视频解码器128和显示装置130。根据本发明,源装置112的视频编码器122可经配置以在视频块滤波过程中针对多个输入选择一组或一组以上滤波器系数,且接着编码所述选定的一组或一组以上滤波器系数。可基于针对一个或一个以上输入的活动度量而选择来自所述一组或一组以上滤波器系数的特定滤波器,且所述滤波器系数可用于对所述一个或一个以上输入进行滤波。本发明的滤波技术大体与用于从编码器向解码器译码或以信号发送滤波器系数的任何技术兼容。
根据本发明的技术,视频编码器122可将帧或切片的一组或一组以上滤波器系数发射到视频解码器128。对于帧或切片,视频编码器122可例如发射待与所有输入一起使用的一组滤波器,或可发射待与多个输入一起使用的多组滤波器(例如,每输入一组)。所述帧或切片内的每一视频块或经译码单元可因而含有额外语法来识别所述组滤波器中哪个(些)滤波器将用于所述视频块的每一输入,或可基于与所述输入中的一者或一者以上相关联的活动度量来确定将使用所述组滤波器中哪个(些)滤波器。
更特定来说,源装置112的视频编码器122可针对帧或切片选择一组或一组以上滤波器,在编码过程期间将来自所述组的滤波器应用于与切片或帧的经译码单元相关联的输入,且接着编码所述组滤波器(即,所述组滤波器系数)以传送到目的地装置116的视频解码器128。视频编码器122可确定与经译码单元的输入相关联的活动度量以便选择来自所述组滤波器的哪个(些)滤波器将与所述特定经译码单元一起使用。在解码器侧,目的地装置116的视频解码器128还可确定针对与经译码单元相关联的一个或一个以上输入的活动度量,使得视频解码器128可确定将来自所述组滤波器的哪个(些)滤波器应用于像素数据,或在一些例子中,视频解码器128可直接依据在位流语法中接收的滤波器信息来确定滤波器系数。视频解码器128可依据滤波器系数曾如何编码而基于直接解码或预测性解码来解码滤波器系数,滤波器系数曾如何编码可作为位流语法的一部分而用信号发送。另外,所述位流可包含针对每一滤波器的零旗标以指示一滤波器是否具有非零滤波器系数。如果零旗标指示滤波器不具有任何非零系数,那么解码器128可在未从源装置112接收到进一步语法的情况下重建全部为零系数的滤波器。图1的所说明系统110仅是示范性的。本发明的滤波技术可由任何编码装置或解码装置执行。源装置112及目的地装置116仅为可支持此些技术的译码装置的实例。
源装置112的视频编码器122可使用本发明的技术对从视频源120接收到的视频数据进行编码。视频源120可包含例如摄像机等视频捕捉装置、含有先前捕捉到的视频的视频档案,或来自视频内容提供者的视频馈送。作为另一替代方案,视频源120可产生基于计算机图形的数据作为源视频,或直播视频(livevideo)、存档视频与计算机产生的视频的组合。在一些情况下,如果视频源120为摄像机,那么源装置112及目的地装置116可形成所谓的相机电话或视频电话。在每一情况下,视频编码器122可对所捕捉、所预捕捉或计算机产生的视频进行编码。
一旦视频编码器122对视频数据进行编码,调制解调器123就可接着根据例如码分多址(CDMA)等通信标准或另一通信标准或技术来调制经编码的视频信息,且经由发射器124将其发射到目的地装置116。调制解调器123可包含各种混频器、滤波器、放大器或经设计以用于信号调制的其它组件。发射器124可包含经设计以用于发射数据的电路,包含放大器、滤波器及一个或一个以上天线。
目的地装置116的接收器126经由信道115接收信息,且调制解调器127解调所述信息。由视频解码器128执行的视频解码过程可包含滤波,例如作为环路中解码的一部分或作为解码环路之后的后滤波步骤。不管怎样,视频解码器128针对特定切片或帧所应用的所述组滤波器可使用本发明的技术来解码。如果举例来说,零旗标指示滤波器包含非零系数且将预测性译码用于所述滤波器系数,那么可利用不同滤波器系数之间的相似性来减少在信道115上传达的信息量。特定来说,滤波器(即,一组滤波器系数)可预测性译码为相对于与一不同滤波器相关联的另一组滤波器系数的差值。不同滤波器可例如与不同切片或帧相关联。在此情况下,视频解码器128可能接收经编码位流,所述经编码位流包括视频块和识别不同滤波器对于其为相关联滤波器的不同帧或切片的滤波器信息。滤波器信息还包含相对于不同经译码单元的滤波器界定当前滤波器的差值。明确地说,所述差值可包括相对于用于不同经译码单元的不同滤波器的滤波器系数界定用于当前滤波器的滤波器系数的滤波器系数差值。
视频解码器128解码视频块,产生滤波器系数,且基于所产生的滤波器系数对经解码的视频块进行滤波。经解码及滤波的视频块可经组合为视频帧以形成经解码的视频数据。显示装置128向用户显示经解码的视频数据,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
通信信道115可包括任何无线或有线通信媒体,例如射频(RF)频谱或者一个或一个以上物理传输线,或无线媒体与有线媒体的任何组合。通信信道115可形成例如局域网、广域网或例如因特网的全球网络的基于包的网络的部分。通信信道115通常表示用于将视频数据从源装置112发射到目的地装置116的任何合适的通信媒体或不同通信媒体的集合。
视频编码器122和视频解码器128可根据例如ITU-TH.264标准(或者称为MPEG-4第10部分,高级视频译码(AVC),其将出于阐释的目的在本发明的部分中使用)等视频压缩标准而操作。然而,本发明的许多技术可容易应用于多种其它视频译码标准中的任一者,包含新出现的HEVC标准。一般来说,允许编码器和解码器处的滤波的任何标准可从本发明的教示的各个方面受益。
尽管图1中未展示,但在一些方面中,视频编码器122及视频解码器128可各自与音频编码器及解码器集成,且可包含适当的多路复用器-多路分用器(MUX-DEMUX)单元或其它硬件及软件,以处理对共同数据流或单独数据流中的音频与视频两者的编码。如果适用,则MUX-DEMUX单元可符合ITUH.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。
视频编码器122及视频解码器128各自可经实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。视频编码器122和视频解码器128中的每一者可包含在一个或一个以上编码器或解码器中,其任一者可作为组合式编码器/解码器(CODEC)的部分集成在相应移动装置、订户装置、广播装置、服务器或类似装置中。
在一些情况下,装置112、116可以大体对称的方式操作。举例来说,装置112、116中的每一者可包含视频编码和解码组件。因此,系统110可支持视频装置112、116之间的单向或双向视频发射,例如用于视频流式传输、视频重放、视频广播或视频电话。
在编码过程期间,视频编码器122可执行若干译码技术或步骤。一般来说,视频编码器122对个别视频帧内的视频块操作以便编码视频数据。在一个实例中,视频块可对应于宏块或宏块的分区。宏块是由ITUH.264标准和其它标准界定的一种类型的视频块。宏块通常指代16×16数据块,但所述术语有时也一般用于指代N×N大小的任何视频块。ITU-TH.264标准支持例如针对亮度分量的16×16、8×8或4×4和针对色度分量的8×8等各种块大小的帧内预测,以及例如针对亮度分量的16×16、16×8、8×16、8×8、8×4、4×8和4×4和针对色度分量的对应成比例大小等各种块大小的帧间预测。在本发明中,“N×N”指代依据垂直和水平尺寸的块的像素尺寸,例如16×16像素。一般来说,16×16块将具有在垂直方向上的16个像素和在水平方向上的16个像素。同样,N×N块一般具有垂直方向上的N个像素和水平方向上的N个像素,其中N表示正整数值。一块中的像素可布置成若干行和若干列。
新兴的HEVC标准界定视频块的新术语。特定来说,视频块(或其分区)可称为“经译码单元”(或CU)。遵照HEVC标准,最大经译码单元(LCU)可根据四叉树分割方案划分为较小CU,且所述方案中界定的不同CU可进一步分割为所谓的预测单元(PU)。LCU、CU和PU在本发明的含义内全部为视频块。也可使用与HEVC标准或其它视频译码标准一致的其它类型的视频块。因此,短语“视频块”指代任何大小的视频块。可针对给定像素的亮度分量和色度分量的成比例大小而包含单独的CU,但也可使用其它色彩空间。
视频块可具有固定或可变大小,且可根据指定译码标准而大小不同。每一视频帧可包含多个切片。每一切片可包含多个视频块,其可布置成若干分区,也称为子块。根据上文参考且下文中更详细描述的四叉树分割方案,N/2×N/2第一CU可包括N×NLCU的子块,N/4×N/4第二CU也可包括第一CU的子块。N/8×N/8PU可包括第二CU的子块。类似地,作为另一实例,小于16×16的块大小可称为16×16视频块的分区或16×16视频块的子块。同样,针对N×N块,小于N×N的块大小可称为N×N块的分区或子块。视频块可包括像素域中的像素数据的块,或(例如)在对表示经译码的视频块与预测视频块之间的像素差异的残余视频块数据应用例如离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换等变换之后的在变换域中的变换系数的块。在一些情况下,视频块可包括变换域中的经量化的变换系数的块。
位流内的语法数据可界定帧或切片的LCU,其是依据所述帧或切片的像素的数目的最大译码单元。一般来说,LCU或CU具有与根据H.264译码的宏块类似的用途,只是LCU和CU不具有特定大小区别。事实上,LCU大小可以逐帧或逐切片为基础来界定,且LCU可分裂为若干CU。一般来说,本发明中对CU的参考可指代LCU的图片或子CU的最大经译码单元。LCU可分裂为若干子CU,且每一子CU可分裂为若干子CU。位流的语法数据可界定LCU可分裂的最大次数,称为CU深度。因此,位流还可界定最小译码单元(SCU)。本发明还使用术语“块”和“视频块”来指代LCU、CU、PU、SCU或TU中的任一者。
如上文介绍,LCU可与四叉树数据结构相关联。一般来说,四叉树数据结构包含每CU一个节点,其中根节点对应于LCU。如果CU分裂为四个子CU,那么对应于CU的节点包含四个叶节点,其每一者对应于子CU中的一者。四叉树数据结构的每一节点可提供对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,从而指示对应于节点的CU是否分裂为子CU。CU的语法元素可以递归方式界定,且可取决于CU是否分裂为子CU。
不分裂的CU可包含一个或一个以上预测单元(PU)。一般来说,PU表示对应CU的全部或一部分,且包含用于检索PU的参考样本的数据。举例来说,当对PU进行帧内模式编码时,PU可包含描述PU的帧内预测模式的数据。作为另一实例,当对PU进行帧间模式编码时,PU可包含界定PU的运动向量的数据。界定运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考帧,和/或运动向量的参考列表(例如,列表0或列表1)。界定PU的CU的数据还可描述(例如)CU分割为一个或一个以上PU。分割模式可依据CU是未经译码、经帧内预测模式编码还是经帧间预测模式编码而不同。
具有一个或一个以上PU的CU还可包含一个或一个以上变换单元(TU)。在使用PU的预测之后,视频编码器可计算CU的对应于所述PU的部分的残余值。所述残余值可经变换、量化和扫描。TU不一定限于PU的大小。因此,TU可比同一CU的对应PU大或小。在一些实例中,TU的最大大小可为对应CU的大小。TU可包括包含与给定CU相关联的残余变换系数的数据结构。
图2A和2B是说明实例四叉树250和对应的最大译码单元272的概念图。图2A描绘实例四叉树250,其包含以层级方式布置的节点。四叉树(例如,四叉树250)中的每一节点可为无子代的叶节点,或具有四个子节点。在图2A的实例中,四叉树250包含根节点252。根节点252具有四个子节点,包含叶节点256A–256C(叶节点256)和节点254。因为节点254不是叶节点,所以节点254包含四个子节点,其在此实例中为叶节点258A–258D(叶节点258)。
四叉树250可包含描述对应的最大译码单元(LCU)(例如,在此实例中为LCU272)的特性的数据。举例来说,四叉树250依据其结构可描述LCU分裂为子CU。假定LCU272具有大小2N×2N。在此实例中,LCU272具有四个子CU276A–276C(子CU276)和274,每一者大小为N×N。子CU274进一步分裂为四个子CU278A–278D(子CU278),每一者大小为N/2×N/2。在此实例中,四叉树250的结构对应于LCU272的分裂。即,根节点252对应于LCU272,叶节点256对应于子CU276,节点254对应于子CU274,且叶节点258对应于子CU278。
四叉树250的节点的数据可描述对应于节点的CU是否分裂。如果CU分裂,那么四个额外节点可呈现在四叉树250中。在一些实例中,可类似于以下伪码来实施四叉树的节点:
split_flag值可为表示对应于当前节点的CU是否分裂的1位值。如果CU不分裂,那么split_flag值可为'0',而如果CU分裂,那么split_flag值可为'1'。参看四叉树250的实例,分裂旗标值的阵列可为101000000。
在一些实例中,子CU276和子CU278中的每一者可使用相同帧内预测模式进行帧内预测编码。因此,视频编码器122可提供根节点252中的帧内预测模式的指示。此外,某些大小的子CU可具有针对特定帧内预测模式的多个可能变换。根据本发明的技术,视频编码器122可提供在根节点252中用于此类子CU的变换的指示。举例来说,大小N/2×N/2的子CU可具有多个可能的可用变换。视频编码器122可用信号表示将在根节点252中使用的变换。因此,视频解码器128可基于根节点252中用信号表示的帧内预测模式和根节点252中用信号表示的变换来确定将应用于子CU278的变换。
如此,视频编码器122无需用信号表示将在叶节点256和叶节点258中应用于子CU276和子CU278的变换,而是可改为根据本发明的技术仅用信号表示帧内预测模式,且在一些实例中用信号表示将在根节点252中应用于某些大小的子CU的变换。以此方式,这些技术可减少用信号表示LCU(例如,LCU272)的每一子CU的变换函数的开销成本。
在一些实例中,针对子CU276和/或子CU278的帧内预测模式可不同于LCU272的帧内预测模式。视频编码器122和视频解码器128可配置有将根节点252处用信号表示的帧内预测模式映射到针对子CU276和/或子CU278的可用帧内预测模式的功能。所述功能可提供LCU272可用的帧内预测模式到针对子CU276和/或子CU278的帧内预测模式的多对一映射。
切片可划分为视频块(或LCU),且每一视频块可根据参看图2A-B描述的四叉树结构来分割。另外,如图2C所示,“开”指示的四叉树子块可由本文描述的环路滤波器滤波,而“关”指示的四叉树子块可不滤波。是否对给定块或子块进行滤波的决策可在编码器处通过将经滤波结果和未经滤波结果与正译码的原始块进行比较来确定。图2D是表示产生图2C所示的四叉树分割的分割决策的决策树。
特定来说,图2C可表示根据四叉树分割方案分割为可变大小的较小视频块的相对大的视频块。每一视频块在图2C中经标记(开或关)以说明应针对所述视频块应用还是避免滤波。视频编码器122可通过将每一视频块的经滤波和未经滤波版本与正译码的原始视频块进行比较来界定此滤波器映射。
再次,图2D是对应于产生图2C所示的四叉树分割的分割决策的决策树。在图2D中,每一圆圈可对应于一CU。如果圆圈包含“1”旗标,那么所述CU进一步分割为另外四个CU,但如果圆圈包含“0”旗标,那么所述CU不进行进一步分割。每一圆圈(例如,对应于CU)还包含相关联三角形。如果给定CU的三角形中的旗标设定为1,那么针对所述CU接通滤波,但如果给定CU的三角形中的旗标设定为0,那么切断滤波。以此方式,图2C和2D可个别或统一地视为可在编码器处产生且传送到解码器(经编码视频数据的每切片至少一次以便传送针对给定视频块(例如,LCU)是否将滤波应用于每一经分割视频块(例如,LCU内的每一CU)的四叉树分割的水平)的滤波器映射。
较小视频块可提供较好分辨率,且可用于包含高细节水平的视频帧的位置。较大视频块可提供较高译码效率,且可用于包含低细节水平的视频帧的位置。切片可视为多个视频块和/或子块。每一切片可为视频帧的可独立解码的视频块系列。或者,帧本身可为可解码视频块系列,或帧的其它部分可界定为可解码的视频块系列。术语“视频块系列”可指代视频帧的任何可独立解码部分,例如整个帧、帧的切片、图片群组(GOP)(也称为序列)或根据适用的译码技术界定的另一可独立解码单元。本发明的方面可能参考帧或切片来描述,但此类参考仅为示范性的。应理解,一般来说,可使用任何视频块系列代替帧或切片。
可在每经译码单元基础上界定语法数据,使得每一经译码单元包含相关联的语法数据。本文描述的滤波器信息可为针对经译码单元的此语法的部分,但可能更有可能为视频块系列(例如,帧、切片、GOP或视频帧的序列)的语法的部分而非经译码单元。语法数据可指示待与切片或帧的经译码单元一起使用的滤波器组。所述语法可另外描述用于对切片或帧的经译码单元进行滤波的滤波器的其它特性(例如,滤波器类型)。举例来说,滤波器类型可为线性的、双线性的、二维的、双三次的(bicubic),或可大体上界定任何形状的滤波器支持。有时,滤波器类型可由编码器及解码器推定,在此情况下滤波器类型不包含于位流中,但在其它情况下,滤波器类型可连同如本文中描述的滤波器系数信息一起编码。语法数据还可向解码器用信号表示滤波器是如何编码的(例如,滤波器系数是如何编码的),以及应针对其而使用不同滤波器的活动度量的范围。
在一些例子中,对于一组滤波器中的每一滤波器,语法数据可包含指示所述滤波器是否具有任何非零系数的零旗标。如果零旗标设定为第一值,那么解码器可在未接收到来自编码器的进一步信息的情况下重建全部为零的滤波器。如果零旗标设定为第二值,那么解码器可接收用于重建滤波器的额外语法。零旗标可例如为单一位,其中0指示滤波器仅含有零滤波器系数,且1指示滤波器含有至少一个非零滤波器系数。
在零旗标指示滤波器含有至少一个非零滤波器系数的情况下,额外语法可例如描述用于对切片或帧的经译码单元进行滤波的滤波器的其它特性(例如,滤波器类型),以及包含使解码器能够重建滤波器的系数的信息。举例来说,滤波器类型可为线性的、双线性的、二维的、双三次的(bicubic),或可大体上界定任何形状的滤波器支持。有时,滤波器类型可由编码器及解码器推定,在此情况下滤波器类型不包含于位流中,但在其它情况下,滤波器类型可连同如本文中描述的滤波器系数信息一起编码。语法数据还可向解码器用信号表示滤波器是如何编码的(例如,滤波器系数是如何编码的),以及应针对其而使用不同滤波器的活动度量的范围。
视频编码器122可执行将正被译码的视频块与预测帧(或其它经译码单元)进行比较以便识别预测块的预测译码。正被译码的当前视频块与预测块之间的差异被译码作为残余块,且使用预测语法来识别预测块。可对残余块进行变换及量化。变换技术可包括DCT过程或概念上类似的过程、整数变换、小波变换或其它类型的变换。在DCT过程中,例如,变换过程将一组像素值转换为变换系数,其可表示像素值在频域中的能量。通常对变换系数应用量化,且量化通常涉及限制与任何给定变换系数相关联的位的数目的过程。
在变换及量化之后,可对经量化及经变换的残余视频块执行熵译码。语法元素(例如在编码期间界定的滤波器信息及预测向量)也可包含于用于每一经译码单元的经熵译码的位流中。一般来说,熵译码包括共同压缩一连串经量化的变换系数及/或其它语法信息的一个或一个以上过程。对经量化的变换系数执行例如Z形扫描技术(zig-zagscanningtechnique)等扫描技术(例如,作为熵译码过程的一部分),以便从二维视频块界定一个或一个以上串行化一维系数向量。还可使用包含其它扫描次序或自适应扫描的其它扫描技术,且其可能在经编码位流中用信号表示。在任何情况下,经扫描系数接着连同任何语法信息一起例如经由内容自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码过程进行熵译码。
作为编码过程的一部分,可解码经编码的视频块以便产生用于后续视频块的后续基于预测的译码的视频数据。在此阶段,可使用滤波以便改进视频质量,且(例如)去除来自经解码视频的成块效应假影。经滤波的数据可用于其它视频块的预测,在所述情况下,滤波被称作“环路中”滤波。或者,其它视频块的预测可基于未经滤波的数据,在所述情况下,滤波被称作“后滤波”。
以逐帧、逐切片或逐LCU为基础,编码器可选择一组或一组以上滤波器,且以逐经译码单元为基础可从所述组选择一个或一个以上滤波器。在一些例子中,还可以逐像素为基础或以子CU为基础(例如,以4×4块为基础)选择滤波器。滤波器组的选择和应用来自所述组的哪个滤波器的选择两者均可以促进视频质量的方式进行。此类滤波器组可从预界定的滤波器组选择,或可自适应地经界定以促进视频质量。作为一实例,视频编码器122可针对给定帧或切片选择或界定若干滤波器组,使得不同滤波器用于所述帧或切片的经译码单元的不同像素。特定来说,对于与经译码单元相关联的每一输入,可界定若干组滤波器系数,且可使用与经译码单元的像素相关联的活动度量来确定来自滤波器组的哪个滤波器将与此类像素一起使用。在一些情况下,视频编码器122可应用若干组滤波器系数且选择产生依据经译码块与原始块之间的失真量的最佳质量视频和/或最高压缩水平的一个或一个以上组。在任何情况下,一旦选定,就可编码由视频编码器122对每一经译码单元应用的滤波系数组,并将其传送到目的地装置118的视频解码器128,使得视频解码器128可应用曾在针对每一给定经译码单元的编码过程期间应用的相同滤波。
如本发明中论述,零旗标可用于减少重建含有全部为零的系数的滤波器所需的位数目。当活动度量用于确定哪个滤波器将与针对经译码单元的特定输入一起使用时,针对所述特定经译码单元的滤波器的选择不一定需要传送到视频解码器128。事实上,视频解码器128还可计算针对经译码单元的活动度量,且基于视频编码器122先前提供的滤波器信息,使所述活动度量与特定滤波器匹配。
图3为说明与本发明一致的视频编码器350的框图。视频编码器350可对应于装置120的视频编码器122或不同装置的视频编码器。如图3中所示,视频编码器350包含预测单元332、加法器348及351,以及存储器334。视频编码器350还包含变换单元338及量化单元340,以及逆量化单元342及逆变换单元344。视频编码器350还包含解块滤波器347和自适应滤波器单元349。视频编码器350还包含熵编码单元346。视频编码器350的滤波器单元349可执行滤波操作且还可包含用于识别待用于解码的最佳或优选滤波器或滤波器组的滤波器选择单元(FSU)353。滤波器单元349还可产生识别选定滤波器的滤波器信息,使得选定滤波器可作为滤波器信息有效传送到另一装置以在解码操作期间使用。
在编码过程期间,视频编码器350接收待译码的视频块(例如,LCU),且预测单元332对视频块执行预测性译码技术。使用上文论述的四叉树分割方案,预测单元332可分割视频块且对不同大小的译码单元执行预测性译码技术,对于帧间译码,预测单元332将待编码的视频块(包含视频块的子块)与一个或一个以上视频参考帧或切片中的各个块进行比较以便界定预测块。对于帧内译码,预测单元332基于同一经译码单元内的相邻数据而产生预测性块。预测单元332输出预测块,且加法器348从正被译码的视频块减去所述预测块以便产生残余块。
对于帧间译码,预测单元332可包括运动估计及运动补偿单元,其识别指向预测块的运动向量且基于所述运动向量而产生所述预测块。通常,将运动估计视为产生运动向量的过程,其估计运动。举例来说,运动向量可指示预测帧内的预测块相对于当前帧内正译码的当前块的位移。通常将运动补偿视为基于由运动估计确定的运动向量提取或产生预测块的过程。对于帧内译码,预测单元332基于同一经译码单元内的相邻数据而产生预测性块。一个或一个以上帧内预测模式可界定可界定帧内预测块的方式。
在预测单元332输出预测块且加法器48从正被译码的视频块减去所述预测块以便产生残余块之后,变换单元38将变换应用于残余块。所述变换可包括离散余弦变换(DCT)或例如由例如HEVC标准等译码标准界定的概念上类似的变换。也可使用小波变换、整数变换、子带变换或其它类型的变换。在任何状况下,变换单元338均将变换应用于残余块,从而产生残余变换系数的块。变换可将残余信息从像素域转换为频域。
量化单元340接着量化残余变换系数以进一步减小位速率。量化单元340(例如)可限制用于对系数中的每一者进行译码的位的数目。在量化之后,熵编码单元346将经量化系数块从二维表示形式扫描为一个或一个以上串行化一维向量。扫描次序可经预先编程为以经界定次序发生(例如,Z形扫描、水平扫描、垂直扫描、组合,或另一预界定的次序),或可能基于先前译码统计而自适应地界定。
在此扫描过程之后,熵编码单元346根据例如CAVLC或CABAC等熵译码方法来编码经量化的变换系数(连同任何语法元素),以进一步压缩数据。包含于经熵译码的位流中的语法元素可包含来自预测单元332的预测语法,例如用于帧间译码的运动向量或用于帧内译码的预测模式。包含于经熵译码的位流中的语法元素还可包含来自滤波器单元349的滤波器信息,其可以本文所描述的方式编码。
CAVLC是由ITUH.264/MPEG4,AVC标准支持的一种类型的熵译码技术,其可由熵编码单元346以向量化基础而应用。CAVLC以有效地压缩变换系数及/或语法元素的串行化“行程(run)”的方式使用可变长度译码(VLC)表。CABAC是由ITUH.264/MPEG4,AVC标准支持的另一类型的熵译码技术,其可由熵编码单元346以向量化基础而应用。CABAC涉及若干阶段,包含二值化运算(binarization,)、上下文模型选择和二进制算术译码。在此情况下,熵编码单元346根据CABAC对变换系数和语法元素进行译码。与ITUH.264/MPEG4,AVC标准一样,新兴的HEVC标准也可支持CAVLC和CABAC熵译码两者。此外,还存在许多其它类型的熵译码技术,且新的熵译码技术将可能在将来出现。本发明不限于任何特定熵译码技术。
在由熵编码单元346熵译码之后,可将经编码的视频发射到另一装置或存档以供日后发射或检索。此外,经编码的视频可包括经熵译码的向量及各种语法,其可由解码器使用以恰当地配置解码过程。逆量化单元342及逆变换单元344分别应用逆量化及逆变换,以在像素域中重建残余块。加法器351将经重建残余块加上由预测单元332产生的预测块以产生经预解块的经重建视频块,有时称为经预解块的经重建图像。解块滤波器347可将滤波应用于经预解块的经重建视频块以通过移除成块效应或其它假影而改进视频质量。解块滤波器347的输出可称为后解块视频块、经重建视频块,或经重建图像。
滤波器单元349可经配置以接收多个输入。在图3的实例中,滤波器单元349接收经后解块的经重建图像(RI)、经预解块的经重建图像(pRI)、预测图像(PI)和经重建残余块(EI)作为输入。滤波器单元349可个别地或组合地使用这些输入中的任一者来产生经重建图像以存储在存储器334中。另外,如下文将更详细论述,基于活动度量,可选择一个或一个以上滤波器以应用于所述输入。在一个实例中,滤波器单元349的输出可为应用于RI的一个额外滤波器。在另一实例中,滤波器单元349的输出可为应用于pRI的一个额外滤波器。然而,在其它实例中,滤波器单元349的输出可基于多个输入。举例来说,滤波器单元349可将第一滤波器应用于pRI,且接着使用pRI的经滤波版本结合EI和PI的经滤波版本来产生经重建图像。在滤波器单元349的输出是正应用于单一输入的一个额外滤波器的产物的例子中,滤波器单元349可实际上将滤波器应用于其它输入,但那些滤波器可能具有全部为零的系数。类似地,如果滤波器单元349的输出是将三个滤波器应用于三个输入的产物,那么滤波器单元349可实际上将滤波器应用于第四输入,但所述滤波器可能具有全部为零的系数。如下文将更详细论述,滤波器单元349将同一滤波器序列应用于针对待滤波的所有经译码单元的多个输入的技术可减小在装置中实施滤波器单元349的复杂性。具有全部为零的系数的滤波器的应用可增加滤波器单元349可处理多个输入的可能方式的数目,且因此可潜在地改进译码质量。
滤波器单元349进行的滤波可通过产生比未经滤波的预测性视频块更紧密地匹配正译码的视频块的预测性视频块来改进压缩。在滤波之后,经重建的视频块可由预测单元332用作参考块以帧间译码后续视频帧或其它经译码单元中的块。尽管将滤波器单元349展示为“环路中”,但本发明的技术还可与后滤波器一起使用,在所述情况下,未经滤波的数据(而非经滤波数据)将用于预测后续经译码单元中的数据的目的。
对于切片或帧,滤波器单元349可以促进视频质量的方式选择针对每一输入的滤波器组。举例来说,滤波器单元349可从预界定组的系数中选择滤波器组,或可自适应地界定滤波器以便促进视频质量或改进压缩。每一组的滤波器中的一者或一者以上可为具有全部为零的系数的滤波器。滤波器单元349可选择或界定针对给定经译码单元的一组或一组以上滤波器,使得相同组滤波器用于所述经译码单元的不同视频块的像素。对于特定帧、切片或LCU,滤波器单元349可将若干组滤波器应用于多个输入,且FSU353可选择产生最佳质量视频或最高压缩水平的组。或者,FSU353可通过分析多个输入与原始图像之间的自相关和交叉相关来训练新滤波器。一组新的滤波器可例如通过基于自相关和交叉相关对Wienter-Hopt方程式求解来确定。不管训练一组新的滤波器还是选择一组现有滤波器,滤波器单元349均产生用于包含在位流中以使得解码器能够还识别待用于特定帧或切片的滤波器组的语法。
根据本发明,对于帧或切片内的经译码单元的每一像素,滤波器单元349可基于使与经译码单元内的一组或一组以上像素相关联的活动量化的活动度量而选择将使用来自滤波器组的哪个滤波器。以此方式,FSU353可确定针对例如帧或切片等较高级经译码单元的滤波器组,同时滤波器单元349基于与较低级经译码单元的像素相关联的活动而选择将来自所述组的哪个(些)滤波器用于所述较低级经译码单元的特定像素。活动可在经译码单元内的像素值方差方面得以指示。经译码单元中的像素值中的较大方差可指示较高像素活动等级,而像素值中的较小方差可指示较低像素活动等级。不同滤波器(即,不同滤波器系数)可依据像素方差水平(即,活动)产生较好滤波(例如,较高图像质量)。像素方差可由活动度量量化,所述活动度量可包括改进的拉普拉斯求和值,如下文更详细地论述。然而,还可使用其它类型的活动度量。
代替于针对每一输入的单一滤波器,可针对每一输入使用一组M个滤波器。依据设计偏好,M可为例如小至2或大至16,或甚至更高。每输入较大数目的滤波器可改进视频质量,但也可增加与从编码器向解码器用信号表示滤波器组相关联的开销。所述组M个滤波器可针对每一帧或切片由如上文描述的FSU353确定且发射到解码器。分段图可用于指示经译码单元如何分段以及是否将对经译码单元的特定子单元进行滤波。分段图可例如针对经译码单元包含如上文描述的分裂旗标的阵列以及用信号表示是否将对每一子译码单元进行滤波的额外位。对于与待滤波的经译码单元的像素相关联的每一输入,可基于活动度量而选择来自滤波器组的特定滤波器。活动度量可使用针对像素(i,j)的改进的拉普拉斯求和来计算,如下:
作为一个实例,周围像素的7×7(K,L=3)群组可用于计算改进的拉普拉斯求和值。还可将来自待用于特定范围的改进的拉普拉斯求和值的所述组M个滤波器中的特定滤波器与所述组M个滤波器一起发送到解码器。可使用来自针对先前帧发射的系数的预测或其它技术对滤波器系数进行译码。可能使用各种形状和大小的滤波器,包含例如具有菱形支撑或正方形支撑的1×1、3×3、5×5、7×7和9×9滤波器。
针对到滤波器的输入的改进的拉普拉斯求和值的标引可以多种方式实施。举例来说,在一些实施方案中,每一输入可能具有一组唯一的滤波器,而在一些实施方案中,输入共享一组共同滤波器。另外,在一些实施方案中,针对每一输入的改进的拉普拉斯求和值可能用于识别针对每一输入的特定滤波器。然而,在其它实施方案中,针对单一输入的改进的拉普拉斯求和值可能用于识别针对所有输入的滤波器。在另外其它实施方案中,针对第一输入的改进的拉普拉斯求和值可能用于识别针对第二不同输入的滤波器。
根据本发明,滤波器单元349执行关于滤波器信息的译码技术,其可减少编码滤波器信息及将滤波器信息从编码器350传达到另一装置所需的数据的量。再次,针对每一帧或切片,滤波器单元349可界定或选择将应用于针对所述帧或切片的经译码单元的像素的一组或一组以上滤波器系数。滤波器单元349应用所述滤波器系数以便对存储在存储器334中的经重建视频帧的视频块进行滤波,其可用于与环路中滤波一致的预测性译码。滤波器单元349可将滤波器系数编码为滤波器信息,其转发到熵编码单元346以供包含在经编码位流中。
滤波器信息可包含针对每一滤波器的零旗标以减少将滤波器系数从视频编码器350传递到解码器所需的经译码位的数目。零旗标可为帧、切片、最大经译码单元、经译码单元或视频块的其它系列的标头中的1位语法元素。如果针对特定滤波器的所有系数均为零,那么视频编码器350可将设定为第一值的零旗标发射到解码器。在接收到设定为第一值的零旗标后,解码器可即刻在未实际上从编码器接收到识别所有零系数的数据的情况下重建滤波器。如果针对特定滤波器的系数包含至少一个非零系数,那么视频编码器350可将设定为第二值的零旗标发射到解码器。在接收到设定为第二值的零旗标后,解码器可即刻基于随后从编码器接收的系数重建滤波器。因此,为了重建一组滤波器中的滤波器的所有系数,视频编码器350可仅需针对至少一个滤波器系数为非零的那些情况将滤波器系数发射到解码器。
另外,针对确实含有非零系数的滤波器,本发明的技术还可利用由FSU353界定或选择的滤波器系数中的一些滤波器系数可能非常类似于相对于另一帧或切片的经译码单元的像素应用的其它滤波器系数的事实。可针对不同帧或切片(例如,相同滤波器支持)应用相同类型的滤波器,但所述滤波器可依据与滤波器支持的不同索引相关联的滤波器系数值而不同。因而,为了减少传达此些滤波器系数所需的数据的量,滤波器单元349可基于另一经译码单元的滤波器系数,利用所述滤波器系数之间的任何相似性来预测性地编码待用于滤波的一个或一个以上滤波器系数。然而,在一些情况下,直接编码所述滤波器系数(例如,不使用任何预测)可能更理想。各种技术(例如,利用活动度量的使用来界定何时使用预测性译码技术编码滤波器系数以及何时在无任何预测性译码的情况下直接编码滤波器系数的技术)可用于将滤波器系数有效传送到解码器。另外,还可强加对称性以使得解码器已知的系数的子集(例如,5,-2,10)可用于界定完整的系数组(例如,5,-2,10,10,-2,5)。可在直接及预测性译码情形两者中强加对称性。
图4为说明视频解码器460的实例的框图,视频解码器460对以本文中所描述的方式进行编码的视频序列进行解码。所接收的视频序列可包括一组经编码图像帧、一组帧切片、共同译码的图片群组(GOP),或包含经编码视频块和用以界定如何解码此类视频块的语法的多种类型的视频块系列。
视频解码器460包含熵解码单元452,熵解码单元452执行由图3的熵编码单元346执行的编码的互逆解码功能。明确地说,熵解码单元452可执行CAVLC或CABAC解码,或由视频编码器350使用的任何其它类型的熵解码。呈一维串行化格式的经熵解码的视频块可经逆扫描以将系数的一个或一个以上一维向量转换回到二维块格式中。向量的数目及大小,以及为视频块界定的扫描次序可界定如何重建二维块。经熵解码的预测语法可从熵解码单元452发送到预测单元454,且经熵解码的滤波器信息可从熵解码单元452发送到滤波器单元459。
视频解码器460还包含预测单元454、逆量化单元456、逆变换单元458、存储器及求和器464。另外,视频解码器460还包含对加法器464的输出进行滤波的解块滤波器457。依据本发明,滤波器单元459可接收包含待应用于一个或一个以上输入的一个或一个以上滤波器的经熵解码滤波器信息。尽管图4未图示,但解块滤波器457也可接收包含待应用的一个或一个以上滤波器的经熵解码的滤波器信息。
由滤波器单元459应用的滤波器可由滤波器系数组界定。滤波器单元459可经配置以基于从熵解码单元452接收的滤波器信息而产生所述滤波器系数组。对于一组滤波器中的每一滤波器,滤波器信息可包含零旗标,其可为视频块系列的标头(例如,LCU标头、帧标头、切片标头、GOP标头、序列标头等)中的1位语法元素。在其它实例中,界定滤波器信息的语法元素还可包含在脚注或其它数据结构中。如果滤波器单元459接收到设定为第一值从而指示滤波器不含有非零系数的零旗标,那么滤波器单元459可在未实际上从编码器接收到识别所有零系数的数据的情况下重建滤波器。如果滤波器单元459接收到设定为第二值从而指示特定滤波器的系数包含至少一个非零系数的零旗标,那么滤波器单元459可基于后续滤波器信息重建滤波器。因此,为了重建滤波器,编码器可仅需针对至少一个滤波器系数为非零的那些情况将滤波器系数发射到视频解码器460。
滤波器信息可包含向解码器用信号表示用于任何给定系数组的编码的方式的额外信令语法。在一些实施方案中,滤波器信息可例如还包含任何给定系数组应针对其使用的活动度量范围。在滤波器的解码之后,滤波器单元459可基于一个或一个以上滤波器系数组及包含应针对其使用不同滤波器系数组的活动度量范围的信令语法而对经解码的视频块的像素值进行滤波。所述活动度量范围可由一组活动值界定,所述组活动值界定用以界定所使用的编码的类型(例如,预测性或直接)的活动度量的范围。
滤波器单元459可在位流中接收针对每一帧或切片的一组滤波器。对于帧或切片内的每一经译码单元,滤波器单元459可计算与针对多个输入(即,PI、EI、pRI和RI)的经译码单元的经解码像素相关联的一个或一个以上活动度量,以便确定所述组中的哪个(些)滤波器将应用于每一输入。对于第一范围的活动度量,滤波器单元459可应用第一滤波器,针对第二范围的活动度量,滤波器单元459可应用第二滤波器,等等。在一些实施方案中,四个范围可映射到四个不同滤波器,但可使用任何数目的范围和滤波器。所述滤波器通常可采用任何类型的滤波器支持形状或布置。滤波器支持指代相对于正被滤波的给定像素的滤波器的形状,且滤波器系数可根据滤波器支持而界定应用于相邻像素值的加权。有时,滤波器类型可由编码器及解码器推定,在此情况下滤波器类型不包含于位流中,但在其它情况下,滤波器类型可连同如本文中描述的滤波器系数信息一起编码。语法数据还可向解码器用信号表示滤波器是如何编码的(例如,滤波器系数是如何编码的),以及应针对其而使用不同滤波器的活动度量的范围。
预测单元454从熵解码单元452接收预测语法(例如,运动向量)。使用所述预测语法,预测单元454产生曾用以译码视频块的预测块。逆量化单元456执行逆量化,且逆变换单元458执行逆变换以将残余视频块的系数改变回到像素域。加法器464将每一预测块与由逆变换单元458输出的对应残余块组合以便重建视频块。
滤波器单元459产生待应用于经译码单元的每一输入的滤波器系数,且接着应用此类滤波器系数以便对所述经译码单元的经重建视频块进行滤波。所述滤波例如可包括使边缘平滑且/或消除与视频块相关联的假影的额外解块滤波、用以减少量化噪声的去噪滤波,或可改进译码质量的任何其它类型的滤波。将经滤波的视频块累积在存储器462中,以便重建视频信息的经解码帧(或其它可解码单元)。经解码单元可从视频解码器460输出以向用户呈现,但也可经存储以用于后续预测性解码中。
在视频译码的领域中,在编码器及解码器处应用滤波以便增强经解码的视频信号的质量是常见的。滤波可经由后滤波器而应用,在所述情况下,经滤波的帧不用于将来帧的预测。或者,可“环路中”应用滤波,在所述情况下,经滤波的帧可用以预测将来帧。可通过最小化原始信号与经解码的经滤波信号之间的误差来设计所要的滤波器。通常,此滤波已基于将一个或一个以上滤波器应用于经重建图像。举例来说,解块滤波器可能在图像被存储在存储器中之前应用于经重建图像,或解块滤波器和一个额外滤波器可能在图像被存储在存储器中之前应用于经重建图像。本发明的技术包含将滤波器应用于除仅仅经重建图像以外的输入。另外,如下文将更详细论述,可基于拉普拉斯滤波器标引来选择针对那些多个输入的滤波器。
以与变换系数的量化类似的方式,滤波器的系数h(k,l)(其中k=-K,...,K且l=-L,...,L)也可量化。K及L可表示整数值。滤波器的系数h(k,l)可量化为:
f(k,l)=round(normFact·h(k,l))
其中normFact是正规化因子且round是经执行以实现到所要位深度的量化的舍入操作。滤波器系数的量化可由图3的滤波器单元349在编码期间执行,且解量化或逆量化可由图4的滤波器单元459对经解码滤波器系数执行。滤波器h(k,l)希望一般地表示任何滤波器。举例来说,滤波器h(k,l)可应用于多个输入中的任一者。在一些例子中,与视频块相关联的多个输入将利用不同滤波器,在此情况下类似于h(k,l)的多个滤波器可如上文描述经量化和解量化。
经量化的滤波器系数经编码且作为经编码位流的一部分从与编码器350相关联的源装置发送到与解码器460相关联的目的地装置。在以上实例中,normFact的值通常等于2n,但可使用其它值。normFact的较大值产生较精确量化,使得经量化滤波器系数f(k,l)提供较好性能。然而,normFact的较大值可产生需要更多位发射到解码器的系数f(k,l)。
在解码器460处,可将经解码滤波器系数f(k,l)应用于适当输入。举例来说,如果经解码滤波器系数将应用于RI,那么滤波器系数可应用于经后解块的经重建图像RI(i,j),其中i=0,…,M且j=0,..,N,如下:
变量M、N、K和L可表示整数。K及L可界定横跨从-K到K及从-L到L的两个维度的像素块。应用于其它输入的滤波器可以相似方式应用。
本发明的技术可改进后滤波器或环路中滤波器的性能,且还可减少发射滤波器系数f(k,l)所需的位数目。在一些情况下,针对每一视频块系列(例如,针对每一帧、切片、帧的一部分、帧群组(GOP)等)将若干不同后滤波器或环路中滤波器发射到解码器。对于每一滤波器,额外信息包含于位流中以识别应针对其应用给定滤波器的经译码单元、宏块及/或像素。
所述帧可由帧数目及/或帧类型(例如,I帧、P帧或B帧)识别。I帧指代经帧内预测的帧内帧。P帧指代具有基于一个数据列表(例如,一个先前帧)而预测的视频块的预测性帧。B帧指代基于两个数据列表(例如,前一帧及后一帧)而预测的双向预测性帧。可通过列出宏块类型及/或用以重建宏块的量化参数(QP)值的范围来识别宏块。
滤波器信息还可指示只有图像的局部特性的给定量度的值(称为活动度量)在指定范围内的像素应当用特定滤波器来滤波。举例来说,对于像素(i,j),活动度量可包括如下计算的改进的拉普拉斯求和值:
其中针对横跨从-K到K及从-L到L的二维窗口,k表示从-K到K的像素值的求和的值,且l表示从-L到L的求和的值,其中i和j表示像素数据的像素坐标,RI(i,j)表示坐标i和j处的给定像素值,且var(i,j)是活动度量。可类似地针对pRI(i,j)、PI(i,j)和EI(i,j)找到活动度量。
可使用来自针对先前经译码单元发射的系数的预测对针对任何输入的滤波器系数f(k,l)进行译码。对于经译码单元m(例如,每一帧、切片或GOP)的每一输入,编码器可编码和发射一组M个滤波器:
其中i=0,…,M-1。
对于每一滤波器,可编码位流以识别应针对其使用滤波器的活动度量值var的值的范围。
举例来说,编码器350的滤波器单元349可指示滤波器:
应当用于活动度量值var针对其在区间[0,var0)内(即,var≥0且var<var0)的像素。此外,编码器350的滤波器单元349可指示滤波器:
其中i=1,..,M-2,
应当用于活动度量值var针对其在区间[vari-1,vari)内的像素。另外,编码器350的滤波器单元349可指示滤波器:
应当用于活动度量var满足var>varM-2的像素。如上文描述,滤波器单元349可针对所有输入使用一组滤波器,或者可针对每一输入使用一组唯一滤波器。
可使用用于前一经译码单元中的经重建的滤波器系数来预测滤波器系数。先前滤波器系数可表示为:
其中i=0,…,N-1,
在此情况下,经译码单元的数目n可用于识别用于当前滤波器的预测的一个或一个以上滤波器,且数目n可作为经编码位流的一部分发送到解码器。另外,信息可经编码且发射到解码器以识别针对其使用预测性译码的活动度量var的值。
举例来说,假定针对当前经译码帧m,系数:
针对活动度量值[varr-1,varr)而发射。根据帧n的滤波器系数预测帧m的滤波器系数。假定滤波器
针对活动度量针对其在区间[vars-1,vars)内(其中vars-1==varr-1且vars>varr)的像素而在帧n中使用。在此情况下,区间[varr-1,varr)包含在区间[vars-1,vars)内。另外,可向解码器发射指示滤波器系数的预测应当用于活动值[vart-1,vart),而不用于活动值[vart,vart+1)的信息,其中vart-1==varr-1且vart+1==varr。
区间[varr-1-1,varr)、[vars-1,vars)、[vart-1,vart)与[vart,vart+1)之间的关系描绘于图5中。在此情况下,用于对具有区间[vart-1,vart)内的活动度量的像素进行滤波的滤波器系数的最终值:
等于以下系数的和:
和
因此:
另外,用于具有活动度量[vart,vart+1)的像素的滤波器系数:
等于滤波器系数:
因此:
滤波器系数g(k,l)的振幅取决于k和l的值。通常,具有最大振幅的系数为系数g(0,0)。预期具有大振幅的其它系数为k或l的值等于0的系数。可利用此现象来进一步减少发射所述系数所需的位的量。索引值k和l可界定已知滤波器支持内的位置。
用于每一帧m的系数:
可使用例如根据参数p界定的Golomb或exp-Golomb码等参数化可变长度码来译码。通过改变界定参数化可变长度码的参数p的值,这些码可用于有效表示源分布的较宽范围。系数g(k,l)的分布(即,其具有大或小的值的似然性)取决于k和l的值。因此,为增加译码效率,对于每一帧m,针对每一对(k,l)发射参数p的值。当编码以下系数时,参数p可用于经参数化的可变长度译码:
其中k=-K,...,K,l=-L,...,L。
图6展示经配置以实施本发明的技术的滤波器单元600的实例,滤波器单元600的功能性可例如并入到图3的滤波器单元349或图4的滤波器单元459中。滤波器单元600包含多个滤波器模块610A-C(统称为“滤波器模块610”)。每一滤波器模块可经配置以接收一个或一个以上输入。在此特定实例中,滤波器模块610A接收输入pRI且应用滤波器以产生pRI的经滤波版本,在图6上展示为pRI'。滤波器模块610B接收PI和EI作为输入pRI'。使用这三个输入,滤波器模块2610B可通过如下应用以下三个滤波器而产生输出,在图6处展示为R':
滤波器模块610C可通过如下应用两个滤波器而产生输出(R''):
通过应用全部为零的滤波器,可实现不同输出。举例来说,如果滤波器模块610A将全部为零的滤波器应用于pRI,且滤波器模块610B将全部为零的滤波器应用于PI和EI,那么滤波器模块610B的输出将类似地为零,意味着滤波器模块610C的输出将简单地为RI的经滤波版本。在另一实施方案中,应用于各个输入的所有滤波器可基于活动度量例如经由拉普拉斯滤波器标引而从一组滤波器中选择。如先前提及,到滤波器的输入的改进的拉普拉斯求和值的标引可以多种方式实施。举例来说,在一些实施方案中,每一输入可能具有一组唯一滤波器,而在一些实施方案中,输入共享一组共同滤波器。另外,在一些实施方案中,每一输入的改进的拉普拉斯求和值可能用于识别针对每一输入的特定滤波器。然而,在其它实施方案中,单一输入的改进的拉普拉斯求和值可能用于识别针对所有输入的滤波器。在另外其它实施方案中,第一输入的改进的拉普拉斯求和值可能用于识别针对第二不同输入的滤波器。
图7为说明与本发明一致的编码技术的流程图。如图3所示,视频编码器350编码视频块系列的像素数据。所述视频块系列可包括帧、切片、图片群组(GOP)或另一可独立解码的单元。像素数据可布置在经译码单元中,且视频编码器350可通过根据例如HEVC标准等视频编码标准编码经译码单元来编码像素数据。对于帧或切片,FSU353可识别待用于所述帧或切片的一组滤波器(710)。FSU353可识别针对所有输入的一组滤波器或可识别针对每一输入的一组滤波器。
作为视频编码过程的一部分,预测单元332执行基于预测的译码且确定针对特定经译码单元的基于四叉树的分割方案(720)。此外,作为视频编码过程的一部分,视频编码器350的滤波器单元349基于拉普拉斯滤波器标引而从滤波器组选择一个或一个以上滤波器以用于帧、切片或LCU的特定经译码单元的子译码单元(730)。所述一个或一个以上滤波器可应用于一个或一个以上输入,如上文描述。此滤波可用于通过通常使经解码图像较类似于原始图像来改进视频译码。将滤波器单元349展示为在环路中,这意味着经滤波的数据是用于后面视频块的预测性编码。然而,滤波器单元349可替代地应用后滤波,在所述情况下,未经滤波的数据将用于后面视频块的预测性编码。
视频编码器350针对经译码单元输出经编码位流(740),其包含经编码像素数据和经编码滤波器数据。经编码滤波器数据可包含用于识别待使用的滤波器组的信令信息,且还可包含识别滤波器如何经编码以及应针对其应用不同滤波器的活动度量的范围的信令信息。经编码像素数据可包含针对特定经译码单元的分段图,以及其它类型的数据。
图8为说明与本发明一致的解码技术的流程图。如图8所示,视频解码器460接收包含经编码视频数据和经编码滤波器数据的经编码位流(810)。视频解码器460解码滤波器数据以重建一组或一组以上滤波器和用于确定何时应用来自滤波器组的特定滤波器的活动度量的范围(820)。如上文论述,滤波器数据可包含待与所有输入一起使用的一组滤波器,或可包含针对每一输入的一组滤波器。如上文参看图4描述,重建过程可产生针对滤波器单元459的多个输入(即,RI、pRI、PI和EI)。视频解码器460解码视频数据以产生像素数据块(830)。像素数据可包含分段图,以及其它类型的数据。特定来说,视频解码器460可通过执行符合例如新兴的HEVC标准等视频标准或类似的基于块的视频译码标准的基于块的视频重建来产生像素数据。
基于针对经译码单元的分段图,视频解码器460可确定经译码单元的子译码单元是否应由滤波器单元459滤波。如果将对子单元进行滤波,那么滤波器单元459可确定针对子译码单元的一个或一个以上改进的拉普拉斯求和值,且基于拉普拉斯滤波器标引,识别待与子译码单元的一个或一个以上输入一起使用的一个或一个以上滤波器(840)。
图9为说明与本发明一致的编码技术的流程图。如图3所示,视频编码器350编码视频块系列的像素数据。所述视频块系列可包括帧、切片、图片群组(GOP)、整个视频数据序列,或另一组可解码的视频数据。像素数据可布置在经译码单元中,且视频编码器350可通过根据例如HEVC标准等视频编码标准编码经译码单元来编码像素数据。对于帧或切片,FSU353可识别待用于所述帧或切片的一组滤波器(910)。FSU353可识别针对所有输入的一组滤波器或可识别针对每一输入的一组滤波器。在一些例子中,滤波器中的一者或一者以上可包含全部为零的系数。
作为视频编码过程的一部分,预测单元332执行基于预测的译码且确定针对特定经译码单元的基于四叉树的分割方案(920)。此外,作为视频编码过程的一部分,视频编码器350的滤波器单元349基于拉普拉斯滤波器标引而从滤波器组选择一个或一个以上滤波器以用于帧、切片或LCU的特定经译码单元的子译码单元(930)。所述一个或一个以上滤波器可应用于一个或一个以上输入,如上文描述。此滤波可用于通过通常使经解码图像较类似于原始图像来改进视频译码。将滤波器单元349展示为在环路中,这意味着经滤波的数据是用于后面视频块的预测性编码。然而,滤波器单元349可替代地应用后滤波,在所述情况下,未经滤波的数据将用于后面视频块的预测性编码。
视频编码器350针对经译码单元输出经编码位流,其包含经编码像素数据和具有一个或一个以上零旗标的经编码滤波器数据(940)。经编码滤波器数据可包含用于识别待使用的滤波器组的信令信息(包含针对每一滤波器的零旗标),且还可包含识别滤波器如何经编码以及应针对其应用不同滤波器的活动度量的范围的信令信息。经编码像素数据可包含针对特定经译码单元的分段图,以及其它类型的数据。
图10为说明与本发明一致的解码技术的流程图。如图8所示,视频解码器460接收包含经编码视频数据和具有一个或一个以上零旗标的经编码滤波器数据的经编码位流(1010)。视频解码器460解码滤波器数据以重建一组或一组以上滤波器以及用于确定何时应用来自滤波器组的特定滤波器的活动度量的范围(1020)。如上文描述,滤波器数据可包含待与所有输入一起使用的一组滤波器,或可包含针对每一输入的一组滤波器。如上文参看图4描述,重建过程可产生针对滤波器单元459的多个输入(即,RI、pRI、PI和EI)。视频解码器460解码视频数据以产生像素数据块(1030)。像素数据可包含分段图,以及其它类型的数据。特定来说,视频解码器460可通过执行符合例如新兴的HEVC标准等视频标准或类似的基于块的视频译码标准的基于块的视频重建来产生像素数据。
基于针对经译码单元的分段图,视频解码器460可确定经译码单元的子译码单元是否应由滤波器单元459滤波。如果将对子单元进行滤波,那么滤波器单元459可确定针对子译码单元的一个或一个以上改进的拉普拉斯求和值,且基于拉普拉斯滤波器标引,识别待与子译码单元的一个或一个以上输入一起使用的一个或一个以上滤波器(1040)。
前述揭示内容在某种程度上已简化以便表达细节。举例来说,本发明大体描述正以每帧或每切片为基础发射的滤波器组,但滤波器组也可以每序列为基础、以每图片群组为基础、以每切片群组为基础、以每CU为基础、以每LCU为基础或以其它此类为基础发射。一般来说,滤波器可针对一个或一个以上经译码单元的任何分组而发射。另外,在实施方案中,每经译码单元每输入可存在许多滤波器,每滤波器可存在许多系数,且针对不同方差范围界定的滤波器中的每一者可存在许多不同方差水平。举例来说,在一些情况下,可存在针对经译码单元的每一输入界定的十六个或更多滤波器以及对应于每一滤波器的十六个不同方差范围。
针对每一输入的滤波器中的每一者可包含许多系数。在一个实例中,滤波器包括具有针对在两个维度上延伸的滤波器支持而界定的81个不同系数的二维滤波器。然而,在一些情况下,针对每一滤波器而发射的滤波器系数的数目可少于81个。举例来说,可强加系数对称性以使得一个维度或象限中的滤波器系数可对应于相对于其它维度或象限中的系数的反转值或对称值。系数对称性可允许81个不同系数由较少系数表示,在所述情况下,编码器及解码器可假定系数的反转值或镜像值界定其它系数。举例来说,可编码系数(5,-2,10,10,-2,5),且将其作为系数子集(5,-2,10)而发射。在此情况下,解码器可知晓这三个系数界定较大的对称系数集合(5,-2,10,10,-2,5)。
本发明的技术可实施于各种各样的装置或设备中,包含无线手持机及集成电路(IC)或一组IC(即,芯片组)。提供已描述的任何组件、模块或单元是为了强调功能方面,且未必要求通过不同硬件单元来实现。
因此,本文中所描述的技术可以硬件、软件、固件或其任何组合来实施。如果以硬件实施,那么描述为模块、单元或组件的任何特征可一起实施于集成逻辑装置中或单独作为离散但可互操作的逻辑装置而实施。如果以软件实施,那么所述技术可至少部分地由包括指令的计算机可读媒体实现,当在处理器中执行时,所述指令执行上述方法中的一者或一者以上。计算机可读媒体可包括计算机可读存储媒体,且可形成计算机程序产品(其可包含封装材料)的一部分。计算机可读存储媒体可包括例如同步动态随机存取存储器(SDRAM)等随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪存储器、磁性或光学数据存储媒体等。另外或替代地,所述技术可至少部分由载运或传送呈指令或数据结构的形式的代码且可由计算机存取、读取和/或执行的计算机可读通信媒体来实现。
所述代码可由一个或一个以上处理器执行,例如,一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散的逻辑电路。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可提供于经配置以用于编码及解码的专用软件模块或硬件模块内,或并入于组合式视频编解码器中。并且,可将所述技术完全实施于一个或一个以上电路或逻辑元件中。
Claims (48)
1.一种对视频数据进行解码的方法,所述方法包括:
接收语法元素,其中所述语法元素的第一值指示滤波器的系数包括至少一个非零系数,且所述语法元素的第二值指示所述滤波器的所述系数包括全部为零的系数;
基于所述语法元素的值被设定为所述第二值,以全部为零的系数重建所述滤波器;
基于第一活动度量将来自第一组滤波器的第一滤波器应用于第一输入以产生第一经滤波结果,所述第一输入包括经后解块的经重建图像,所述第一组滤波器包含系数全部为零的滤波器;以及
基于所述第一经滤波结果产生经滤波图像。
2.根据权利要求1所述的方法,其进一步包括:
基于第二活动度量将第二滤波器应用于第二输入以产生第二经滤波结果,其中所述第二滤波器不同于所述第一滤波器,且其中所述第一输入和所述第二输入对应于针对在视频译码过程期间产生的单一视频块产生的中间视频块数据;以及
基于所述第一经滤波结果和所述第二经滤波结果产生经滤波图像。
3.根据权利要求2所述的方法,其中所述第二输入包括经预解块图像、预测图像、经量化预测误差图像或其组合。
4.根据权利要求1所述的方法,其中所述第一活动度量包括改进的拉普拉斯求和值。
5.根据权利要求4所述的方法,其中所述改进的拉普拉斯求和值包括大致根据以下等式而界定的var(i,j):
其中针对横跨从-K到K及从-L到L的二维窗口,k表示从-K到K的求和的值,且l表示从-L到L的求和的值,其中i和j表示像素数据的像素坐标,R(i,j)表示坐标i和j处的给定像素值,且var(i,j)是所述第一活动度量。
6.根据权利要求1所述的方法,其中所述第一活动度量是所述经后解块的经重建图像的活动度量。
7.根据权利要求2所述的方法,其中所述第二活动度量是所述第二输入的活动度量。
8.根据权利要求1所述的方法,其中将所述第一活动度量的值的第一范围标引到所述第一滤波器,且将所述第一活动度量的值的不同范围标引到所述第一组滤波器中的不同滤波器。
9.根据权利要求2所述的方法,其中所述第二滤波器来自所述第一组滤波器。
10.根据权利要求2所述的方法,其中所述第二滤波器来自第二组滤波器。
11.根据权利要求1所述的方法,其进一步包括:
响应于所述语法元素的所述值被设定为所述第一值,基于从视频编码器接收的额外信息重建所述滤波器的所述系数,所接收的额外信息识别所述滤波器的所述系数。
12.根据权利要求1所述的方法,其中所述语法元素是单一位。
13.根据权利要求1所述的方法,其中所述语法元素是视频块系列的标头的一部分。
14.一种对视频数据进行编码的方法,所述方法包括:
产生滤波器语法元素,所述滤波器语法元素的第一值指示滤波器的系数包括至少一个非零系数,且所述滤波器语法元素的第二值指示滤波器的所述系数包括全部为零的系数;
基于所述滤波器语法元素被设定为所述第一值,产生所述滤波器语法元素和识别所述滤波器的所述系数的额外信息以供包含在经编码位流中;
基于第一活动度量将来自第一组滤波器的第一滤波器应用于第一输入以产生第一经滤波结果,所述第一输入包括经后解块的经重建图像,所述第一组滤波器包含系数全部为零的滤波器;以及
基于所述第一经滤波结果产生经滤波图像。
15.根据权利要求14所述的方法,其进一步包括:
响应于所述滤波器语法元素被设定为所述第二值,在无识别所述滤波器的所述系数的额外信息的情况下产生所述滤波器语法元素以供包含在所述经编码位流中。
16.根据权利要求14所述的方法,其进一步包括:
基于第二活动度量将第二滤波器应用于第二输入以产生第二经滤波结果,其中所述第二滤波器不同于所述第一滤波器,且其中所述第一输入和所述第二输入对应于针对在视频译码过程期间产生的单一视频块产生的中间视频块数据;以及
基于所述第一经滤波结果和所述第二经滤波结果产生经滤波图像。
17.一种用于解码视频数据的装置,所述装置包括:
滤波器单元,其经配置以:
接收语法元素,其中所述语法元素的第一值指示滤波器的系数包括至少一个非零系数,且所述语法元素的第二值指示所述滤波器的所述系数包括全部为零的系数;
基于所述语法元素的值被设定为所述第二值,以全部为零的系数重建所述滤波器;
基于第一活动度量将来自第一组滤波器的第一滤波器应用于第一输入以产生第一经滤波结果,所述第一输入包括经后解块的经重建图像,所述第一组滤波器包含系数全部为零的滤波器;以及
存储器,其经配置以存储基于所述第一经滤波结果的经滤波图像。
18.根据权利要求17所述的装置,其中
所述滤波器单元进一步经配置以基于第二活动度量将第二滤波器应用于第二输入以产生第二经滤波结果,其中所述第二滤波器不同于所述第一滤波器,且其中所述第一输入和所述第二输入对应于针对在视频译码过程期间产生的中间视频块数据;以及
所述存储器进一步经配置以存储基于所述第一经滤波结果和所述第二经滤波结果的经滤波图像。
19.根据权利要求18所述的装置,其中所述第二输入包括经预解块图像、预测图像、经量化预测误差图像或其组合。
20.根据权利要求17所述的装置,其中所述第一活动度量包含改进的拉普拉斯求和值。
21.根据权利要求20所述的装置,其中所述改进的拉普拉斯求和值包括大致根据以下等式而界定的var(i,j):
其中针对横跨从-K到K及从-L到L的二维窗口,k表示从-K到K的求和的值,且l表示从-L到L的求和的值,其中i和j表示像素数据的像素坐标,R(i,j)表示坐标i和j处的给定像素值,且var(i,j)是所述第一活动度量。
22.根据权利要求17所述的装置,其中所述第一活动度量是所述经后解块的经重建图像的活动度量。
23.根据权利要求18所述的装置,其中所述第二活动度量是所述第二输入的活动度量。
24.根据权利要求17所述的装置,其中所述第一活动度量的值的第一范围经标引到所述第一滤波器,且所述第一活动度量的值的不同范围经标引到所述第一组滤波器中的不同滤波器。
25.根据权利要求18所述的装置,其中所述第二滤波器来自所述第一组滤波器。
26.根据权利要求18所述的装置,其中所述第二滤波器来自第二组滤波器。
27.根据权利要求17所述的装置,其中所述滤波器单元进一步经配置以:
响应于所述语法元素的所述值被设定为所述第一值,基于从视频编码器接收的额外信息重建所述滤波器的所述系数,其中所接收的额外信息识别所述滤波器的所述系数。
28.根据权利要求17所述的装置,其中所述语法元素是单一位。
29.根据权利要求17所述的装置,其中所述语法元素是视频块系列的标头的一部分。
30.一种用于编码视频数据的装置,所述装置包括:
滤波器单元,其经配置以:
产生滤波器语法元素的值,其中所述滤波器语法元素的第一值指示滤波器的系数包括至少一个非零系数,且所述滤波器语法元素的第二值指示滤波器的所述系数包括全部为零的系数;
发射单元,其经配置以:
响应于所述滤波器语法元素被设定为所述第一值,产生所述滤波器语法元素和识别所述滤波器的所述系数的额外信息以供包含在经编码位流中,其中所述滤波器单元进一步经配置以基于第一活动度量将来自第一组滤波器的第一滤波器应用于第一输入以产生第一经滤波结果,所述第一输入包括经后解块的经重建图像,所述第一组滤波器包含系数全部为零的滤波器;以及
存储器,其经配置以存储基于所述第一经滤波结果的经滤波图像。
31.根据权利要求30所述的装置,其中所述发射单元进一步经配置以:
响应于所述滤波器语法元素被设定为所述第二值,在无识别所述滤波器的所述系数的额外信息的情况下产生所述滤波器语法元素以供包含在所述经编码位流中。
32.根据权利要求30所述的装置,其中所述滤波器单元进一步经配置以基于第二活动度量将第二滤波器应用于第二输入以产生第二经滤波结果,其中所述第二滤波器不同于所述第一滤波器,且其中所述第一输入和所述第二输入对应于针对在视频译码过程期间产生的中间视频块数据;以及所述存储器进一步经配置以存储基于所述第一经滤波结果和所述第二经滤波结果的经滤波图像。
33.一种对视频数据进行解码的设备,其包括:
用于接收语法元素的装置,其中所述语法元素的第一值指示滤波器的系数包括至少一个非零系数,且所述语法元素的第二值指示所述滤波器的所述系数包括全部为零的系数;
用于基于所述语法元素的值被设定为所述第二值,以全部为零的系数重建所述滤波器的装置;
用于基于第一活动度量将来自第一组滤波器的第一滤波器应用于第一输入以产生第一经滤波结果的装置,其中所述第一输入包括经后解块的经重建图像,所述第一组滤波器包含系数全部为零的滤波器;以及
用于基于所述第一经滤波结果产生经滤波图像的装置。
34.根据权利要求33所述的设备,其进一步包括:
用于基于第二活动度量将第二滤波器应用于第二输入以产生第二经滤波结果的装置,其中所述第二滤波器不同于所述第一滤波器,且其中所述第一输入和所述第二输入对应于针对在视频译码过程期间产生的单一视频块产生的中间视频块数据;以及
用于基于所述第一经滤波结果和所述第二经滤波结果产生经滤波图像的装置。
35.根据权利要求34所述的设备,其中所述第二输入包括经预解块图像、预测图像、经量化预测误差图像或其组合。
36.根据权利要求33所述的设备,其中所述第一活动度量包括改进的拉普拉斯求和值。
37.根据权利要求36所述的设备,其中所述改进的拉普拉斯求和值包括大致根据以下等式而界定的var(i,j):
其中针对横跨从-K到K及从-L到L的二维窗口,k表示从-K到K的求和的值,且l表示从-L到L的求和的值,其中i和j表示像素数据的像素坐标,R(i,j)表示坐标i和j处的给定像素值,且var(i,j)是所述第一活动度量。
38.根据权利要求33所述的设备,其中所述第一活动度量是所述经后解块的经重建图像的活动度量。
39.根据权利要求35所述的设备,其中所述第二活动度量是所述经预解块图像的活动度量。
40.根据权利要求33所述的设备,其中所述第一活动度量的值的第一范围经标引到所述第一滤波器,且所述第一活动度量的值的不同范围经标引到所述第一组滤波器中的不同滤波器。
41.根据权利要求34所述的设备,其中所述第二滤波器来自所述第一组滤波器。
42.根据权利要求34所述的设备,其中所述第二滤波器来自第二组滤波器。
43.根据权利要求33所述的设备,其进一步包括:
用于响应于所述语法元素的所述值被设定为所述第一值基于从视频编码器接收的额外信息重建所述滤波器的所述系数的装置,其中所接收的额外信息识别所述滤波器的所述系数。
44.根据权利要求33所述的设备,其中所述语法元素是单一位。
45.根据权利要求33所述的设备,其中所述语法元素是视频块系列的标头的一部分。
46.一种对视频数据进行编码的设备,所述设备包括:
用于产生滤波器语法元素的装置,所述滤波器语法元素的第一值指示滤波器的系数包括至少一个非零系数,且所述滤波器语法元素的第二值指示滤波器的所述系数包括全部为零的系数;
用于基于所述滤波器语法元素被设定为所述第一值,产生所述滤波器语法元素和识别所述滤波器的所述系数的额外信息以供包含在经编码位流中的装置;
用于基于第一活动度量将来自第一组滤波器的第一滤波器应用于第一输入以产生第一经滤波结果的装置,所述第一输入包括经后解块的经重建图像,所述第一组滤波器包含系数全部为零的滤波器;以及
用于基于所述第一经滤波结果产生经滤波图像的装置。
47.根据权利要求46所述的设备,其进一步包括:
用于响应于所述滤波器语法元素被设定为所述第二值,在无识别所述滤波器的所述系数的额外信息的情况下产生所述滤波器语法元素以供包含在所述经编码位流中的装置。
48.根据权利要求46所述的设备,其进一步包括:
用于基于第二活动度量将第二滤波器应用于第二输入以产生第二经滤波结果的装置,其中所述第二滤波器不同于所述第一滤波器,且其中所述第一输入和所述第二输入对应于针对在视频译码过程期间产生的单一视频块产生的中间视频块数据;以及
用于基于所述第一经滤波结果和所述第二经滤波结果产生经滤波图像的装置。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US37925310P | 2010-09-01 | 2010-09-01 | |
US37925510P | 2010-09-01 | 2010-09-01 | |
US61/379,253 | 2010-09-01 | ||
US61/379,255 | 2010-09-01 | ||
US201161487231P | 2011-05-17 | 2011-05-17 | |
US61/487,231 | 2011-05-17 | ||
US13/178,399 | 2011-07-07 | ||
US13/178,399 US9247265B2 (en) | 2010-09-01 | 2011-07-07 | Multi-input adaptive filter based on combination of sum-modified Laplacian filter indexing and quadtree partitioning |
PCT/US2011/043445 WO2012030433A1 (en) | 2010-09-01 | 2011-07-08 | Multi-input adaptive filter based on combination of sum-modified laplacian filter indexing and quadtree partitioning |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103222263A CN103222263A (zh) | 2013-07-24 |
CN103222263B true CN103222263B (zh) | 2016-06-01 |
Family
ID=45697236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180042433.8A Active CN103222263B (zh) | 2010-09-01 | 2011-07-08 | 基于改进的拉普拉斯求和滤波器标引与四叉树分割的组合的多输入自适应滤波器 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9247265B2 (zh) |
EP (2) | EP3754984A1 (zh) |
JP (1) | JP5755744B2 (zh) |
CN (1) | CN103222263B (zh) |
DK (1) | DK2612497T3 (zh) |
ES (1) | ES2824828T3 (zh) |
HU (1) | HUE050358T2 (zh) |
WO (1) | WO2012030433A1 (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9819966B2 (en) | 2010-09-01 | 2017-11-14 | Qualcomm Incorporated | Filter description signaling for multi-filter adaptive filtering |
GB201119206D0 (en) | 2011-11-07 | 2011-12-21 | Canon Kk | Method and device for providing compensation offsets for a set of reconstructed samples of an image |
US9258564B2 (en) | 2012-02-07 | 2016-02-09 | Stmicroelectronics S.R.L. | Visual search system architectures based on compressed or compact feature descriptors |
KR101749297B1 (ko) * | 2012-04-12 | 2017-06-21 | 미디어텍 싱가폴 피티이. 엘티디. | 크로마 서브샘플링 포맷들의 블록 파티션을 위한 방법 및 장치 |
KR102192991B1 (ko) | 2014-04-23 | 2020-12-18 | 삼성전자주식회사 | 가변적인 디지털 필터를 포함하는 아날로그-디지털 컨버터 및 이를 포함하는 이미지 센서 |
WO2016204524A1 (ko) * | 2015-06-16 | 2016-12-22 | 엘지전자(주) | 영상의 부호화/복호화 방법 및 이를 위한 장치 |
CN105049846B (zh) * | 2015-08-14 | 2019-05-21 | 广东中星微电子有限公司 | 图像和视频编解码的方法和设备 |
US9883183B2 (en) * | 2015-11-23 | 2018-01-30 | Qualcomm Incorporated | Determining neighborhood video attribute values for video data |
US11563938B2 (en) | 2016-02-15 | 2023-01-24 | Qualcomm Incorporated | Geometric transforms for filters for video coding |
US10382766B2 (en) * | 2016-05-09 | 2019-08-13 | Qualcomm Incorporated | Signalling of filtering information |
US20180343449A1 (en) * | 2017-05-26 | 2018-11-29 | Ati Technologies Ulc | Application specific filters for high-quality video playback |
CN111213383B (zh) * | 2017-11-13 | 2022-04-05 | 华为技术有限公司 | 用于视频编码的环内滤波装置及方法 |
US10958928B2 (en) * | 2018-04-10 | 2021-03-23 | Qualcomm Incorporated | Decoder-side motion vector derivation for video coding |
CN114173116A (zh) * | 2021-11-26 | 2022-03-11 | 中山大学 | 一种基于拉普拉斯滤波器的自适应量化方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101796847A (zh) * | 2008-07-03 | 2010-08-04 | 松下电器产业株式会社 | 运动图像编码方法、运动图像解码方法、运动图像编码装置、运动图像解码装置、程序以及集成电路 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI103003B1 (fi) * | 1997-06-13 | 1999-03-31 | Nokia Mobile Phones Ltd | Suodatusmenetelmä, suodatin ja matkaviestinpääte |
AU717480B2 (en) * | 1998-08-01 | 2000-03-30 | Korea Advanced Institute Of Science And Technology | Loop-filtering method for image data and apparatus therefor |
US6847684B1 (en) | 2000-06-01 | 2005-01-25 | Hewlett-Packard Development Company, L.P. | Zero-block encoding |
US20020172431A1 (en) * | 2001-03-07 | 2002-11-21 | Atkins C. Brian | Digital image appearance enhancement and compressibility improvement method and system |
WO2004008773A1 (ja) | 2002-07-11 | 2004-01-22 | Matsushita Electric Industrial Co., Ltd. | フィルタリング強度の決定方法、動画像符号化方法、および動画像復号化方法 |
US7366238B2 (en) * | 2004-05-07 | 2008-04-29 | Micronas Usa, Inc. | Noise filter for video processing |
KR100647295B1 (ko) * | 2004-11-10 | 2006-11-23 | 삼성전자주식회사 | 비디오 디코더에서의 인접 정보 처리 장치 및 방법과 그방법을 수행하기 위한 프로그램이 저장된 기록 매체 |
EP1886502A2 (en) * | 2005-04-13 | 2008-02-13 | Universität Hannover | Method and apparatus for enhanced video coding |
US7680355B2 (en) * | 2005-05-02 | 2010-03-16 | Intel Corporation | Detection of artifacts resulting from image signal decompression |
FR2889778A1 (fr) | 2005-08-12 | 2007-02-16 | Thomson Licensing Sas | Procede de codage et de decodage d'images video avec echelonnabilite spatiale |
EP1841230A1 (en) * | 2006-03-27 | 2007-10-03 | Matsushita Electric Industrial Co., Ltd. | Adaptive wiener filter for video coding |
US20080084932A1 (en) | 2006-10-06 | 2008-04-10 | Microsoft Corporation | Controlling loop filtering for interlaced video frames |
US9014280B2 (en) | 2006-10-13 | 2015-04-21 | Qualcomm Incorporated | Video coding with adaptive filtering for motion compensated prediction |
CN105357529A (zh) | 2006-11-08 | 2016-02-24 | 汤姆逊许可证公司 | 用于环内去伪影滤波的方法和设备 |
US8942505B2 (en) * | 2007-01-09 | 2015-01-27 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive filter representation |
US8107571B2 (en) * | 2007-03-20 | 2012-01-31 | Microsoft Corporation | Parameterized filters and signaling techniques |
DE102007037857A1 (de) * | 2007-08-10 | 2009-02-12 | Micronas Gmbh | Verfahren zur Reduktion von Bildartefakten |
EP2048886A1 (en) | 2007-10-11 | 2009-04-15 | Panasonic Corporation | Coding of adaptive interpolation filter coefficients |
US8625672B2 (en) | 2008-01-07 | 2014-01-07 | Thomson Licensing | Methods and apparatus for video encoding and decoding using parametric filtering |
US8638852B2 (en) * | 2008-01-08 | 2014-01-28 | Qualcomm Incorporated | Video coding of filter coefficients based on horizontal and vertical symmetry |
US8736751B2 (en) * | 2008-08-26 | 2014-05-27 | Empire Technology Development Llc | Digital presenter for displaying image captured by camera with illumination system |
US8150191B2 (en) * | 2008-10-14 | 2012-04-03 | Interra Systems Inc. | Method and system for calculating blur artifacts in videos using user perception threshold |
US8792564B2 (en) * | 2008-10-28 | 2014-07-29 | Sony Corporation | Adaptive preprocessing method using feature-extracted video maps |
US8774541B2 (en) * | 2008-11-05 | 2014-07-08 | Sony Corporation | Intra prediction with adaptive interpolation filtering for image compression |
US8761538B2 (en) * | 2008-12-10 | 2014-06-24 | Nvidia Corporation | Measurement-based and scalable deblock filtering of image data |
US8611435B2 (en) | 2008-12-22 | 2013-12-17 | Qualcomm, Incorporated | Combined scheme for interpolation filtering, in-loop filtering and post-loop filtering in video coding |
US9143803B2 (en) | 2009-01-15 | 2015-09-22 | Qualcomm Incorporated | Filter prediction based on activity metrics in video coding |
US8761268B2 (en) | 2009-04-06 | 2014-06-24 | Intel Corporation | Selective local adaptive wiener filter for video coding and decoding |
US20100329361A1 (en) * | 2009-06-30 | 2010-12-30 | Samsung Electronics Co., Ltd. | Apparatus and method for in-loop filtering of image data and apparatus for encoding/decoding image data using the same |
JP5233897B2 (ja) * | 2009-07-31 | 2013-07-10 | ソニー株式会社 | 画像処理装置および方法 |
EP2559238B1 (en) | 2010-04-13 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Adaptive image filtering method and apparatus |
US20120044992A1 (en) | 2010-08-17 | 2012-02-23 | Qualcomm Incorporated | Low complexity adaptive filter |
US9819966B2 (en) | 2010-09-01 | 2017-11-14 | Qualcomm Incorporated | Filter description signaling for multi-filter adaptive filtering |
US9008180B2 (en) | 2011-04-21 | 2015-04-14 | Intellectual Discovery Co., Ltd. | Method and apparatus for encoding/decoding images using a prediction method adopting in-loop filtering |
-
2011
- 2011-07-07 US US13/178,399 patent/US9247265B2/en active Active
- 2011-07-08 EP EP20189936.6A patent/EP3754984A1/en active Pending
- 2011-07-08 WO PCT/US2011/043445 patent/WO2012030433A1/en active Application Filing
- 2011-07-08 ES ES11735938T patent/ES2824828T3/es active Active
- 2011-07-08 DK DK11735938.0T patent/DK2612497T3/da active
- 2011-07-08 EP EP11735938.0A patent/EP2612497B1/en active Active
- 2011-07-08 HU HUE11735938A patent/HUE050358T2/hu unknown
- 2011-07-08 JP JP2013527074A patent/JP5755744B2/ja active Active
- 2011-07-08 CN CN201180042433.8A patent/CN103222263B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101796847A (zh) * | 2008-07-03 | 2010-08-04 | 松下电器产业株式会社 | 运动图像编码方法、运动图像解码方法、运动图像编码装置、运动图像解码装置、程序以及集成电路 |
Also Published As
Publication number | Publication date |
---|---|
US9247265B2 (en) | 2016-01-26 |
JP5755744B2 (ja) | 2015-07-29 |
US20120051425A1 (en) | 2012-03-01 |
EP2612497A1 (en) | 2013-07-10 |
CN103222263A (zh) | 2013-07-24 |
EP2612497B1 (en) | 2020-08-19 |
EP3754984A1 (en) | 2020-12-23 |
JP2013539287A (ja) | 2013-10-17 |
ES2824828T3 (es) | 2021-05-13 |
HUE050358T2 (hu) | 2020-12-28 |
DK2612497T3 (da) | 2020-09-14 |
WO2012030433A1 (en) | 2012-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103081467B (zh) | 用于多滤波器自适应滤波的滤波器描述信令 | |
CN103222263B (zh) | 基于改进的拉普拉斯求和滤波器标引与四叉树分割的组合的多输入自适应滤波器 | |
CN102369731B (zh) | 基于视频译码中的活动度量的滤波预测 | |
CN103380621B (zh) | 多度量滤波 | |
CN104221373B (zh) | 用于采样自适应偏移代码化和/或信号通知的设备和方法 | |
CN103460695B (zh) | 视频译码中基于单预测相邻者的双预测合并模式 | |
CN104094597B (zh) | 基于帧内预测的自适应变换方法及使用该方法的装置 | |
CN102870413B (zh) | 用于视频数据译码的可变长度码 | |
CN103718551B (zh) | 在视频译码中用信号发出图片大小 | |
CN103718554B (zh) | 用于视频译码的变换系数的译码 | |
CN102342101B (zh) | 用于在视频译码中进行内插滤波、环路内滤波和环路后滤波的组合方案 | |
CN103299620B (zh) | 在视频译码中使用最可能扫描次序对用于视频块的扫描次序信息进行有效译码 | |
CN108141597A (zh) | 用于具有重组的视频译码的非可分离二次变换 | |
CN103004196B (zh) | 在经压缩位流中包含切换式内插滤波器系数 | |
CN104429072B (zh) | 自适应差域空间和时间参考重构及平滑 | |
CN103636207B (zh) | 用于明度及色度块的可变长度译码系数译码 | |
CN103270754A (zh) | 对视频数据块的系数的模式相依扫描 | |
CN103283230B (zh) | 使用一维切换滤波器与一维自适应滤波器的组合的视频滤波 | |
CN106105206A (zh) | 用于使用置零系数的低复杂度正变换的系统和方法 | |
CN105379270A (zh) | 颜色分量间残余预测 | |
CN103250414A (zh) | 用于内插视频译码的子像素的值的自适应支持 | |
CN103098463A (zh) | 视频压缩中的经译码块模式(cbp)的可变长度译码 | |
CN103141100A (zh) | 用于视频译码的帧内平滑滤波器 | |
CN104604224A (zh) | 可缩放视频译码中的变换基底调整 | |
CN105165010A (zh) | 基于位深度的样本自适应偏移缩放 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |