CN101803386A - 用于视频译码的自适应系数扫描 - Google Patents

用于视频译码的自适应系数扫描 Download PDF

Info

Publication number
CN101803386A
CN101803386A CN200880103221A CN200880103221A CN101803386A CN 101803386 A CN101803386 A CN 101803386A CN 200880103221 A CN200880103221 A CN 200880103221A CN 200880103221 A CN200880103221 A CN 200880103221A CN 101803386 A CN101803386 A CN 101803386A
Authority
CN
China
Prior art keywords
coefficient
scan order
value
predictive mode
count value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880103221A
Other languages
English (en)
Inventor
叶琰
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN101803386A publication Critical patent/CN101803386A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

本发明描述用于扫描视频块的系数的技术。明确地说,本发明的所述技术调适用以基于与一个或一个以上先前经译码块相关联的统计资料而将二维系数块扫描为一维系数向量的扫描次序。举例来说,可针对一个或一个以上先前经译码块来收集指示二维块的每一位置中的给定系数值为零或非零的可能性的统计资料。在某一点处,可进行对所述扫描次序的调整,以便更好地确保将非零系数共同分组在靠近所述一维系数向量的前部处,其可改进熵译码的有效性。可针对每一可能的预测模式而单独地进行统计资料的所述收集及扫描次序的调整。

Description

用于视频译码的自适应系数扫描
相关申请案
本申请案主张2007年6月15日申请的美国临时申请案第60/944,470号及2007年10月12日申请的美国临时申请案第60/979,762号的权利,所述申请案中的每一者的全部内容以引用的方式并入本文中。
技术领域
本发明涉及数字视频译码,且更明确地说涉及视频块系数的熵译码。
背景技术
可将数字视频能力并入广泛范围的装置中,所述装置包括数字电视、数字直接广播系统、无线通信装置(例如无线电话手持机)、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、视频游戏装置、视频游戏控制台等。数字视频装置实施视频压缩技术(例如MPEG-2、MPEG-4或H.264/MPEG-4(第10部分,高级视频译码(AVC)),以更有效地发射及接收数字视频。视频压缩技术执行空间与时间预测以减少或移除视频序列中所固有的冗余。
视频压缩大体包括空间预测及/或时间预测。明确地说,帧内译码依赖于空间预测以减少或移除给定译码单元内的视频块之间的空间冗余,所述译码单元可包含视频帧、视频帧的切片(slice)等。相比来说,帧间译码依赖于时间预测以减少或移除视频序列的连续译码单元的视频块之间的时间冗余。对于帧内译码来说,视频编码器执行空间预测以基于同一译码单元内的其它数据来压缩数据。对于帧间译码来说,视频编码器执行运动估计及运动补偿以追踪两个或两个以上邻近译码单元的匹配视频块的移动。
在空间或时间预测之后,通过从所译码的原始视频块减去在预测过程期间所产生的预测视频块而产生残差块(residual block)。所述残差块因此指示预测块与所译码的当前块之间的差异。视频编码器可应用变换、量化及熵译码过程以进一步减小与残差块的通信相关联的位速率。变换技术可将像素值集合改变为变换系数,所述变换系数表示频域中像素值的能量。将量化应用于所述变换系数,且所述量化大体涉及限制与任何给定系数相关联的位数目的过程。在熵编码之前,视频编码器将经量化的系数块扫描为一维系数向量。视频编码器对经量化的变换系数的向量进行熵编码以进一步压缩残差数据。
视频解码器可执行逆熵译码操作以检索系数。还可在解码器处执行逆扫描以从所接收的一维系数向量形成二维块。视频解码器接着对系数进行逆量化及逆变换以获得经重构的残差块。视频解码器接着基于预测信息及运动信息来解码预测视频块。视频解码器接着将所述预测视频块添加到对应残差块以便产生经重构的视频块及产生视频信息的经解码序列。
发明内容
本发明描述用于扫描视频块的系数的技术。明确地说,本发明的技术调适用以基于与一个或一个以上先前经译码块相关联的统计资料而将二维系数块扫描为一维系数向量的扫描次序。举例来说,可针对一个或一个以上先前经译码块来收集指示二维块的每一位置中的给定系数值为零或非零的可能性的统计资料。可进行对扫描次序的调整,以便更好地确保将非零系数分组在靠近一维系数向量的前部处,其可改进熵译码的效率。可针对译码过程的每一可能预测模式而单独地进行统计资料的收集及扫描次序的调整。
在一方面中,一种对视频数据进行译码的方法包含使用系数扫描次序来扫描第一视频块的系数值。所述方法还包括收集与系数值的至少一部分相关联的统计资料,及根据所收集统计资料来调整系数扫描次序。所述方法进一步包括在至少一个后续视频块存在于第一视频块的译码单元中时使用经调整系数扫描次序来扫描至少一个后续视频块的系数值。所述方法还包括对系数值进行熵译码。
在另一方面中,一种对视频数据进行译码的装置包含扫描单元及熵译码单元。扫描单元使用系数扫描次序来扫描第一视频块的系数值、收集与系数值的至少一部分相关联的统计资料,且根据所收集统计资料来调整系数扫描次序。扫描单元还在至少一个后续视频块存在于第一视频块的译码单元中时使用经调整系数扫描次序来扫描至少一个后续视频块的系数值。熵译码对系数值进行熵译码。
在另一方面中,一种计算机可读媒体包含在视频译码装置中执行时致使装置对视频块进行译码的指令。明确地说,指令致使装置使用系数扫描次序来扫描第一视频块的系数值、收集与系数值的至少一部分相关联的统计资料,且根据所收集统计资料来调整系数扫描次序。指令还致使装置在至少一个后续视频块存在于第一视频块的译码单元中时使用经调整系数扫描次序来扫描至少一个后续视频块的系数值。指令进一步致使装置对系数值进行熵译码。
在另一方面中,一种对视频数据进行译码的装置包含用于使用系数扫描次序来扫描第一视频块的系数值的装置;用于收集与系数值的至少一部分相关联的统计资料的装置;用于根据所收集统计资料来调整系数扫描次序的装置。系数扫描装置在至少一个后续视频块存在于第一视频块的译码单元中时使用经调整系数扫描次序来扫描至少一个后续视频块的系数值。装置进一步包括用于对系数值进行熵译码的装置。
可以硬件、软件、固件或其任何组合来实施本发明中所描述的技术。如果以软件来实施,则可在处理器中执行软件,所述处理器可指一个或一个以上处理器,例如微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或数字信号处理器(DSP),或其它等效集成或离散逻辑电路。包含用以执行技术的指令的软件可最初被存储于计算机可读媒体中并由处理器加载及执行。
因此,本发明还涵盖计算机可读媒体,其包含用以致使处理器执行如本发明中所描述的多种技术中的任一者的指令。在一些情况下,计算机可读媒体可形成可被出售给制造者及/或用于装置中的计算机程序产品的一部分。计算机程序产品可包括计算机可读媒体,且在一些情况,计算机程序产品还可包括封装材料。
在下文的附图及描述中阐述了本发明的一个或一个以上方面的细节。本发明中所描述的技术的其它特征、目的及优点将从描述及图式以及从权利要求书中显而易见。
附图说明
图1为说明视频编码及解码系统的框图,所述视频编码及解码系统执行本发明中所描述的译码技术。
图2为进一步详细说明图1的视频编码器的实例的框图。
图3为进一步详细说明图1的视频解码器的实例的框图。
图4为说明与本发明一致的调整扫描次序的假设实例的概念图。
图5为说明译码装置的实例操作的流程图,所述译码装置经配置以自适应地调整变换系数的扫描次序。
图6为说明编码单元的实例操作的流程图,所述编码单元经配置以编码视频块的标头信息。
图7为说明用于编码及解码信息的实例译码上下文选择的流程图。
图8为说明解码单元的实例操作的流程图,所述解码单元经配置以解码视频块的标头信息。
具体实施方式
图1为说明视频编码及解码系统10的框图,所述视频编码及解码系统10执行如本发明中所描述的译码技术。如图1中所示,系统10包括源装置12,所述源装置12经由通信信道16而将经编码视频数据发射到目的装置14。源装置12产生经译码视频数据以用于发射到目的装置14。源装置12可包括视频源18、视频编码器20及发射器22。源装置12的视频源18可包括视频捕捉装置(例如视频相机、含有先前捕捉的视频的视频档案或来自视频内容提供者的视频馈送器)。作为进一步替代方案,视频源18可产生基于计算机图形的数据作为源视频,或现场视频与计算机产生的视频的组合。在一些情况下,源装置12可为所谓的相机电话或视频电话,在此情况下,视频源18可为视频相机。在每一情况下,经捕捉、经预先捕捉或计算机产生的视频可由视频编码器20来编码以用于经由发射器22及通信信道16而从源装置12发射到目的装置14。
视频编码器20从视频源18接收视频数据。从视频源18接收的视频数据可为一系列视频帧。视频编码器20将所述系列帧划分为若干译码单元并处理所述译码单元以编码所述系列视频帧。所述译码单元可(例如)为全部帧或所述帧的若干部分(即,切片)。因此,在一些例项中,可将帧划分为若干切片。视频编码器20将每一译码单元划分为若干像素块(本文中称作视频块)且对个别译码单元内的视频块进行操作以便编码视频数据。因而,译码单元(例如,帧或切片)可含有多个视频块。换句话说,视频序列可包括多个帧,帧可包括多个切片,且切片可包括多个视频块。
视频块可具有固定或变化的大小,且其大小可根据指定的译码标准而不同。作为实例,国际电信联盟标准化部门(ITU-T)H.264/MPEG-4(第10部分,高级视频译码(AVC))(下文中为“H.264/MPEG-4第10部分AVC”标准)支持呈各种块大小(例如亮度(luma)分量的16×16、8×8或4×4及色度(chroma)分量的8×8)的帧内预测以及呈各种块大小(例如亮度分量的16×16、16×8、8×16、8×8、8×4、4×8及4×4与色度分量的对应的经缩放大小)的帧间预测。在H.264中,举例来说,16×16像素的每一视频块(经常称作宏块(MB))可被再分为更小大小的子块并以子块对其进行预测。大体来说,可认为MB及各种子块为视频块。因此,可认为MB为视频块,且如果加以分割或子分割,则可认为MB自身界定若干视频块集合。
对于视频块中的每一者来说,视频编码器20针对所述块选择块类型。所述块类型可指示是使用帧间预测还是帧内预测来预测所述块以及所述块的分割大小。举例来说,H.264/MPEG-4第10部分AVC标准支持若干帧间预测及帧内预测块类型(包括帧间16×16、帧间16×8、帧间8×16、帧间8×8、帧间8×4、帧间4×8、帧间4×4、帧内16×16、帧内8×8及帧内4×4)。如下文所详细描述,视频编码器20可针对所述视频块中的每一者选择所述块类型中的一者。
视频编码器20还针对所述视频块中的每一者选择预测模式。在经帧内译码的视频块的情况下,预测模式可确定使用一个或一个以上先前经编码视频块来预测当前视频块的方式。在H.264/MPEG-4第10部分AVC标准中,举例来说,视频编码器20可针对每一帧内4×4块选择九个可能的单向性预测模式中的一者;垂直预测模式、水平预测模式、DC预测模式、对角线下/左预测模式、对角线下/右预测模式、垂直-右预测模式、水平-下预测模式、垂直-左预测模式及水平-上预测模式。使用类似的预测模式来预测每一帧内8×8块。对于帧内16×16块来说,视频编码器20可选择四个可能的单向性模式中的一者;垂直预测模式、水平预测模式、DC预测模式及平面预测模式。在一些例项中,视频编码器20可从预测模式集合选择预测模式,所述预测模式集合不仅包括单向性预测模式,而且包括界定所述单向性模式的组合的一个或一个以上多向性预测模式。举例来说,所述一个或一个以上多向性预测模式可为组合两个单向性预测模式的双向性预测模式,如下文进一步详细描述。
在针对视频块选择预测模式之后,视频编码器20使用所选预测模式来产生经预测视频块。从原始视频块减去所述经预测视频块以形成残差块。所述残差块包括像素差值集合,所述像素差值量化原始视频块的像素值与所产生的预测块的像素值之间的差。可以二维块格式(例如,像素差值的二维矩阵或阵列)来表示残差块。
在产生残差块之后,视频编码器20可在编码所述残差块之前对所述块执行若干其它操作。视频编码器20可将变换(例如整数变换、DCT变换、方向性变换或小波(wavelet)变换)应用于像素值的残差块以产生变换系数块。因此,视频编码器20将残差像素值转换为变换系数(还称作残差变换系数)。可将所述残差变换系数称作变换块或系数块。当应用非可分离变换时,所述变换或系数块可为所述系数的一维表示,或当应用可分离变换时,所述变换或系数块可为所述系数的二维表示。非可分离变换可包括非可分离方向性变换。可分离变换可包括可分离方向性变换、DCT变换、整数变换及小波变换。
在变换之后,视频编码器20执行量化以产生经量化的变换系数(还称作量化系数或量化残差系数)。又,可以一维向量格式或二维块格式来表示量化系数。量化大体指其中系数经量化以可能减小用以表示所述系数的数据量的过程。量化过程可减小与所述系数中的一些或全部相关联的位深度。如本文中所使用,术语“系数”可表示变换系数、量化系数或其它类型的系数。在一些例项中,可将本发明的技术应用于残差像素值以及变换系数与量化变换系数。然而,出于说明的目的,将以量化变换系数为背景描述本发明的技术。
当使用可分离变换并以二维块格式来表示系数块时,视频编码器20将所述系数从二维格式扫描到一维格式。换句话说,视频编码器20可扫描来自二维块的系数以将所述系数串行化为系数的一维向量。根据本发明的方面中的一者,视频编码器20可基于所收集的统计资料来调整用以将系数块转换为一维的扫描次序。所述统计资料可包含对在二维块的每一位置中的给定系数值为零或非零的可能性的指示,且可(例如)包含与二维块的系数位置中的每一者相关联的计数、概率或其它统计资料度量。在一些例项中,可仅针对块的系数位置子集来收集统计资料。当评估扫描次序时(例如,在特定数目的块之后),可改变扫描次序,使得在块内的被确定为具有较低的具有非零系数概率的系数位置之前扫描所述块内的被确定为具有较高的具有非零系数概率的系数位置。以此方式,初始扫描次序可适合于更有效地将非零系数分组在一维系数向量的开始处及将零值系数分组在一维系数向量的结尾处。此又可减少在熵译码上所消耗的位数目,因为在位于一维系数向量的开始处的非零系数之间存在若干较短的零游程且在一维系数向量的结尾处存在一个较长的零游程。
在扫描系数之后,视频编码器20使用多种熵译码方法(例如上下文自适应可变长度译码(context adaptive variable length coding,CAVLC)、上下文自适应二进制算术译码(context adaptive binary arithmetic coding,CABAC)、游程长度译码(run length coding)等)中的任一者来编码所述译码单元的视频块中的每一者。源装置12经由发射器22及信道16而将经编码视频数据发射到目的装置14。通信信道16可包含任何无线或有线通信媒体,例如射频(RF)频谱或一个或一个以上物理发射线,或无线与有线媒体的任何组合。通信信道16可形成基于包的网络(例如局域网络、广域网络或全球网络(例如因特网))的一部分。通信信道16大体表示用于将经编码视频数据从源装置12发射到目的装置14的任何合适的通信媒体或不同通信媒体的集合。
目的装置14可包括接收器24、视频解码器26及显示装置28。接收器24经由信道16而从源装置12接收经编码视频位流。视频解码器26应用熵解码来解码经编码视频位流以获得经译码单元的经译码视频块的标头信息与量化残差系数。如上文所描述,由源装置12编码的量化残差系数被编码为一维向量。视频解码器26因此扫描经译码视频块的量化残差系数以将系数的一维向量转换为量化残差系数的二维块。如同视频编码器20,视频解码器26可收集统计资料,所述统计资料指示视频块中的给定系数位置为零或非零的可能性且因此以与用于编码过程中的方式相同的方式来调整扫描次序。因此,可由视频解码器26应用互逆自适应扫描次序以便将经串行化的量化变换系数的一维向量表示改变回到量化变换系数的二维块。
视频解码器26使用经解码标头信息及经解码残差信息来重构译码单元的块中的每一者。明确地说,视频解码器26可针对当前视频块产生预测视频块并将所述预测块与对应残差视频块组合以重构视频块中的每一者。目的装置14可经由显示装置28而向用户显示所述经重构的视频块。显示装置28可包含多种显示装置(例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、发光二极管(LED)显示器、有机LED显示器或另一类型的显示单元)中的任一者。
在一些情况下,源装置12与目的装置14可以实质上对称的方式来操作。举例来说,源装置12与目的装置14可各自包括视频编码及解码组件。因此,系统10可支持装置12、14之间的单向或双向视频发射(例如,用于视频串流、视频广播或视频电话)。包括视频编码及解码组件的装置还可形成共同编码、成档及回放装置(例如数字视频记录器(DVR))的一部分。
视频编码器20及视频解码器26可根据多种视频压缩标准(例如由MPEG-1、MPEG-2及MPEG-4中的运动图片专家组(MPEG)界定的标准、ITU-T H.263标准、运动图片及电视工程师协会(SMPTE)421M视频编解码器标准(通常称作“VC-1”)、由中国音频视频译码标准工作组界定的标准(通常称作“AVS”)以及由标准团体界定或由组织发展为专有标准的任何其它视频译码标准)中的任一者来操作。尽管图1中未展示,但在一些方面中,视频编码器20及视频解码器26可各自分别与音频编码器及解码器集成,且可包括适当的多路复用-解多路复用单元或其它硬件与软件以处置共同数据流或单独数据流中的音频与视频两者的编码。以此方式,源装置12与目的装置14可对多媒体数据进行操作。如果可适用,则多路复用-解多路复用单元可符合ITU H.223多路复用器协议或其它协议(例如用户数据报协议(UDP))。
在一些方面中,对于视频广播来说,可将本发明中所描述的技术应用于增强型H.264视频译码,以用于在使用仅前向链路(FLO)空中接口规范的陆地移动多媒体多播(TM3)系统中递送实时视频服务(2007年7月被公开为技术标准TIA-1099的“陆地移动多媒体多播的仅前向链路(FLO)空中接口规范(Forward Link OnlyAir Interface Specificationfor Terrestrial Mobile Multimedia Multicast)”(“FLO规范”))。即,通信信道16可包含用以根据FLO规范来广播无线视频信息的无线信息信道等。FLO规范包括界定位流语法及语义的实例及适合用于FLO空中接口的解码过程。
或者,可根据其它标准(例如DVB-H(数字视频广播-手持式)、ISDB-T(集成服务数字广播-陆地)或DMB(数字媒体广播))来广播视频。因此,源装置12可为移动无线终端、视频串流服务器或视频广播服务器。然而,本发明中所描述的技术并不限于任何特定类型的广播、多播或点对点系统。在广播的情况下,源装置12可将视频数据的若干信道广播到多个目的装置,所述目的装置中的每一者可类似于图1的目的装置14。因此,尽管图1中展示单个目的装置14,但对于视频广播应用来说,源装置12将通常同时将视频内容广播到许多目的装置。
在其它实例中,发射器22、通信信道16及接收器24可经配置以用于根据任何有线或无线通信系统(包括以太网、电话(例如,POTS)、电缆、电力线及光纤系统中的一者或一者以上)及/或无线系统来通信,所述无线系统包含以下各项中的一者或一者以上:码分多址(CDMA或CDMA2000)通信系统、频分多址(FDMA)系统、正交频分多(OFDM)址系统、时分多址(TDMA)系统(例如GSM(全球移动通信系统)、GPRS(通用包无线电服务)或EDGE(增强型数据GSM环境))、TETRA(陆地集群无线电)移动电话系统、宽带码分多址(WCDMA)系统、高数据速率1xEV-DO(仅第一代演进数据)或1xEV-DO金多播系统、IEEE 802.18系统、MediaFLOTM系统、DMB系统、DVB-H系统,或用于在两个或两个以上装置之间进行数据通信的另一方案。
视频编码器20与视频解码器26各自可实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。可将视频编码器20与视频解码器26中的每一者包括于一个或一个以上编码器或解码器中,其任一者可集成为相应移动装置、订户装置、广播装置、服务器等中的组合式编码器/解码器(编解码器)的一部分。另外,源装置12与目的装置14各自可包括适当的调制、解调制、频率转换、滤波及放大器组件以用于发射及接收经编码视频(如可适用),其包括射频(RF)无线组件及足以支持无线通信的天线。然而,出于说明的简易性起见,将此类组件概述为图1中的源装置12的发射器22及目的装置14的接收器24。
图2为进一步详细说明图1的实例视频编码器20的框图。视频编码器20执行对视频帧内的块的帧内译码及帧间译码。帧内译码依赖于空间预测以减少或移除给定视频译码单元(例如,帧或切片)内的视频数据中的空间冗余。对于帧内译码来说,视频编码器20基于与所译码的块相同的译码单元内的一个或一个以上先前经编码块而形成空间预测块。帧间译码依赖于时间预测以减少或移除视频序列的邻近帧内的时间冗余。对于帧间译码来说,视频编码器20执行运动估计以追踪两个或两个以上邻近帧之间的密切匹配的视频块的移动。
在图2的实例中,视频编码器20包括块分割单元30、预测单元32、帧存储件34、变换单元38、量化单元40、系数扫描单元41、逆量化单元42、逆变换单元44及熵编码单元46。视频编码器20还包括加法器48A及48B(“加法器48”)。可将环路内解块滤波器(未展示)应用于经重构的视频块以减少或移除成块假影。将图2中的不同特征描绘为单元是希望突出所说明的装置的不同功能方面且未必暗示此类单元必须由单独硬件或软件组件来实现。而是,可将与一个或一个以上单元相关联的功能性集成于共用或单独硬件或软件组件内。
块分割单元30从视频源18(图1)接收(例如)呈视频帧序列形式的视频信息(标记为图2中的“视频输入(VIDEO IN)”)。块分割单元30将所述视频帧中的每一者划分为若干包括多个视频块的译码单元。如上文所描述,所述译码单元可为整个帧或帧的一部分(例如,帧的切片)。在一个例项中,块分割单元30可最初将译码单元中的每一者划分为具有16×16的分割大小的多个视频块(即,划分为宏块)。块分割单元30可进一步将所述16×16视频块中的每一者再分为更小块(例如8×8视频块或4×4视频块)。
视频编码器20基于块的块类型针对译码单元的视频块中的每一者在逐块的基础上执行帧内译码或帧间译码。预测单元32将块类型指派给视频块中的每一者,所述块类型可指示块的所选分割大小以及将使用帧间预测还是帧内预测来预测所述块。在帧间预测的情况下,预测单元32还决定运动向量。在帧内预测的情况下,预测单元32还决定用以产生预测块的预测模式。
预测单元32接着产生预测块。所述预测块可为当前视频块的预测型式。当前视频块指当前正被译码的视频块。在帧间预测的情况下(例如,当块被指派帧间块类型时),预测单元32可执行时间预测以用于进行当前视频块的帧间译码。预测单元32可(例如)将当前视频块与一个或一个以上邻近视频帧中的块相比较以识别邻近帧中的最密切匹配当前视频块的块(例如,邻近帧中的具有最小MSE、SSD、SAD或其它差异度量的块)。预测单元32将邻近帧中的已识别块选择为预测块。
在帧内预测的情况下(即,当块被指派帧内块类型时),预测单元32可基于共同译码单元(例如,帧或切片)内的一个或一个以上先前经编码相邻块而产生预测块。预测单元32可(例如)执行空间预测以通过使用当前帧内的一个或一个以上先前经编码相邻块来执行内插而产生预测块。可(例如)从帧存储件34检索当前帧内的所述一个或一个以上邻近块,所述帧存储件34可包含任何类型的存储器或数据存储装置以存储一个或一个以上先前经编码帧或块。
预测单元32可根据预测模式集合中的一者来执行内插。如上文所描述,所述预测模式集合可包括单向性预测模式及/或多向性预测模式。多向性预测模式界定单向性预测模式的组合。在一个实例中,所述预测模式集合可包括界定于H.264/MPEG-4第10部分AVC标准中的单向性预测模式及界定两个单向性预测模式的各种组合的双向性预测模式。
对于帧内4×4块类型来说,举例来说,所述预测模式集合可包括九个界定于H.264/MPEG-4第10部分AVC标准中的单向性预测模式及所述单向性预测模式的可能组合的子集。因此,替代于支持单向性预测模式的所有36个可能组合,视频编码器20可仅支持单向性预测模式的可能组合的一部分。如此做法可能不会产生许多译码降级。下文提供了帧内预测模式的一个实例集合,其包括总计18个帧内预测模式。
模式0:垂直
模式1:水平
模式2:DC
模式3:对角线下/左
模式4:对角线下/右
模式5:垂直右
模式6:水平下
模式7:垂直左
模式8:水平上
模式9:垂直+水平(模式0+模式1)
模式10:DC+垂直(模式2+模式0)
模式11:DC+水平(模式2+模式1)
模式12:对角线下/左+水平(模式3+模式1)
模式13:对角线下/右+垂直(模式4+模式0)
模式14:垂直右+水平(模式5+模式1)
模式15:水平下+垂直(模式6+模式0)
模式16:垂直左+水平(模式7+模式1)
模式17:水平上+垂直(模式8+模式0)
在上文所说明的实例集合中,模式0到8为单向性预测模式且模式9到17为双向性预测模式。明确地说,模式0到8为界定于H.264/MPEG-4第10部分AVC标准中的帧内4×4预测模式。模式9到17为可能的双向性预测模式的子集。所提供的实例中的可能的双向性预测模式的子集包括并入有每一单向性预测模式的至少一个组合。除包括DC预测模式的双向性预测模式(例如,模式10与11)之外,每一双向性预测模式组合具有为非平行且在一些例项中实质上彼此正交的内插方向的单向性预测模式。换句话说,双向性预测模式的子集包括大体将来自“垂直”类别的预测模式与来自“水平”类别的预测模式组合的双向性预测模式。此类双向性预测模式允许帧内预测过程组合来自相隔较远的位置的可用预测像素,因此改进当前视频块内的较多像素位置的预测质量。
出于说明的目的而描述上文所描述的预测模式集合。所述预测模式集合可包括更多或更少的预测模式。举例来说,所述预测模式集合可包括更多或更少的双向性预测模式,或不具有双向性预测模式。在其它例项中,所述预测模式集合可仅包括单向性预测模式的子集。另外,除双向性预测模式之外或替代于双向性预测模式,所述预测模式集合可包括组合两个以上单向性预测模式的多向性预测模式。此外,尽管上文关于帧内4×4块类型而描述,但本发明的技术可应用于其它帧内块类型(例如,帧内8×8块类型或帧内16×16块类型)或帧间块类型。
为确定针对特定块选择所述多个预测模式中的哪一者,预测单元32可估计用于所述集合的预测模式中的每一者的译码成本(例如,拉格朗日(Lagrangian)成本),并选择具有最小译码成本的预测模式。在其它例项中,预测单元32可估计用于可能的预测模式的集合的仅一部分的译码成本。举例来说,预测模式32可基于针对一个或一个以上相邻视频块所选择的预测模式来选择所述集合的预测模式的部分。预测单元32使用所选预测模式来产生预测块。
在产生预测块之后,视频编码器20通过在加法器48A处从当前视频块减去由预测单元32产生的预测块而产生残差块。所述残差块包括像素差值集合,所述像素差值量化当前视频块的像素值与预测块的像素值之间的差。可以二维块格式(例如,像素值的二维矩阵或阵列)来表示残差块。换句话说,所述残差块为像素值的二维表示。
变换单元38将变换应用于残差块以产生残差变换系数。变换单元38可(例如)应用DCT、整数变换、方向性变换、小波变换或其组合。变换单元38可基于由预测单元32所选择的用以产生预测块的预测模式而将变换选择性地应用于残差块。换句话说,应用于残差信息的变换可视由预测单元32针对所述块所选择的预测模式而定。
变换单元38可保持多个不同变换并基于残差块的预测模式而将所述变换选择性地应用于所述块。所述多个不同变换可包括DCT、整数变换、方向性变换、小波变换或其组合。在一些例项中,变换单元38可保持DCT或整数变换及多个方向性变换,并基于针对当前视频块所选择的预测模式而选择性地应用所述变换。变换单元38可(例如)将DCT或整数变换应用于具有展现有限方向性的预测模式的残差块并将方向性变换中的一者应用于具有展现显著方向性的预测模式的残差块。
使用上文所描述的预测模式的实例集合,变换单元38可将DCT或整数变换应用于模式2、9及12到17。这些模式可展现有限方向性,因为其为DC预测或处于近似正交方向的两个预测模式的组合。相反,模式1、3到8、10及11为可展现方向性的模式,且因此变换单元38可针对这些模式中的每一者应用不同方向性变换以实现残差视频块的更好能量压紧(energy compaction)。换句话说,当选择具有较强的方向性的预测模式时,还可在此类预测模式的残差块中显现方向性。并且,不同预测模式的残差块展现不同方向性特性。因而,与例如DCT或类似于DCT的整数变换等变换相比,针对每一预测模式而经特定训练的方向性变换可为给定预测模式的残差块提供更好的能量压紧。另一方面,对于不带有强大方向性的预测模式来说,例如DCT或类似于DCT的整数变换等变换提供足够的能量压紧。以此方式,变换单元38无需针对可能的预测模式中的每一者而保持单独变换,因此降低了变换存储要求。此外,DCT及/或整数变换的应用就计算复杂性来说复杂性较小。
在其它例项中,变换单元38可针对可能的预测模式中的每一者而保持不同方向性变换,且基于块的所选预测模式而应用对应方向性变换。对于上文所描述的预测模式的实例集合来说,变换单元38可保持十八个不同方向性变换,所述变换中的每一者符合十八个可能的帧内4×4预测模式中的一者。另外,变换单元38可针对十八个可能的帧内8×8预测模式而保持十八个不同方向性变换、针对四个可能的帧内16×16预测模式而保持四个不同的方向性变换及针对其它分割大小的任何其它预测模式而保持若干变换。基于块的所选预测模式来应用单独方向性变换增加捕捉残差能量的效率(尤其对于选择展现显著方向性的预测模式所针对的块来说)。方向性变换可为非可分离方向性变换(例如,从非可分离Karhunen Lòeve变换(KLT)导出)或可为可分离方向性变换。在一些例项中,可使用数据的训练集合来预先计算方向性变换。
KLT为其中从信号的统计资料导出基函数的线性变换,且因此可为自适应的。KLT经设计以将同样多的能量放置于尽可能少的系数中。KLT大体为不可分离的,且因此变换单元38执行如下文所详细描述的完整矩阵乘法。将出于示范性目的而描述非可分离方向性变换到4×4残差块的应用。将类似的技术用于不同大小的块(例如,8×8块或16×16块)。
以具有像素值的四个行与四个列(即,总计十六个像素值)的二维块格式来表示4×4残差块X。为应用非可分离方向性变换,将4×4残差块重新布置成像素值的一维向量x(即,长度为十六)。通过以光栅扫描次序将像素布置于4×4残差块X中而将X重新布置为向量x。即,如果将4×4残差块X写为
X = x 00 x 01 x 02 x 03 x 10 x 11 x 12 x 13 x 20 x 21 x 22 x 23 x 30 x 31 x 32 x 33 ,
则将长度为16的残差向量x写为
x=[x00 x01 x02 x03 x10 x11 x12 x13 x20 x21 x22 x23 x30 x31 x32 x33]。
通过根据以下方程式(1)执行矩阵乘法而获得变换系数向量y:
y=Tx,        (1)
其中T为大小为16×16的变换矩阵,所述大小对应于针对所述块所选择的预测模式。变换系数向量y也为具有十六个系数的长度的一维向量。
非可分离方向性变换的使用可能伴随着增加的计算成本及存储要求。大体来说,对于大小为N×N的残差块来说,非可分离方向性变换需要大小为N2×N2的基函数。即,对于4×4残差块来说,非可分离方向性变换具有16×16的大小;对于8×8残差块来说,非可分离方向性变换具有64×64的大小;且对于16×16残差块来说,非可分离方向性变换具有256×256的大小。因为可针对所述集合的预测模式中的每一者使用不同非可分离方向性变换,所以变换单元32可存储十八个用于4×4块的16×16方向性变换及十八个用于8×8块的64×64变换(在上文所描述的预测模式的实例集合的情况下),且如果预测模式集合较大,则可能存储得更多。此可导致使用大存储器资源来存储用以进行变换过程所需的变换矩阵。非可分离方向性变换的计算成本也较高。大体来说,将非可分离方向性变换应用于N×N块上需要N2×N2次乘法及N2×(N2-1)次加法。
替代于非可分离方向性变换,变换单元32可针对预测模式中的每一者而保持可分离方向性变换。与非可分离方向性变换相比,可分离方向性变换具有较低的存储及计算成本。对于4×4残差块X来说,举例来说,如由以下方程式(2)所指示来应用可分离变换:
Y=CXR,        (2)
其中Y为所得变换系数矩阵,C为列变换矩阵且R为行变换矩阵,所有所述矩阵均具有等于块的大小的大小(例如,在此实例中为4×4)。因此,所得变换系数矩阵Y也为大小为4×4的二维矩阵。
对于每一预测模式来说,变换单元32可存储两个N×N变换矩阵(例如,矩阵对C与R),其中N×N符合块大小(例如,N=4、8或16)。在上文所描述的用于4×4块的十八个预测模式的实例集合中,变换单元32存储三十六个4×4变换矩阵,其需要比在使用非可分离变换时所存储的十八个16×16变换矩阵小的存储装置。另外,变换单元32可使用2×N×N×N次乘法及2×N×N×(N-1)次加法来执行可分离方向性变换,此为比用于执行非可分离方向性变换的N2×N2次乘法及N2×(N2-1)次加法显著少的操作。表1针对4×4及8×8的块大小而对使用可分离方向性变换对非可分离方向性变换之间的存储及计算要求进行比较。可以类似方式来进行针对16×16块的可分离方向性变换与非可分离方向性变换之间的比较。如表1中所说明,与非可分离方向性变换相比,使用可分离方向性变换提供计算复杂性与存储要求两方面的减小,且对于较大的块大小来说,所述减小变得更显著(例如,8×8块的减小大于4×4块的减小)。
表1:非可分离方向性变换对可分离方向性变换的复杂性
Figure GPA00001026135000141
可使用来自训练视频序列集合的预测残差来获得针对每一预测模式的可分离变换矩阵。类似于非可分离KLT变换的导出,可首先在行方向上且接着在行方向上将奇异值分解(SVD)过程应用于所述训练集合中的预测残差以便分别获得行变换矩阵与列变换矩阵。或者,可首先使用来自训练集合的预测残差来训练非可分离方向性变换矩阵(即,非可分离KLT变换矩阵);接着,可通过进一步将非可分离变换矩阵分解为可分离变换矩阵而获得针对每一预测模式的可分离变换矩阵。
总之,所得变换矩阵通常具有浮点精度。使用定点精度数来逼近变换矩阵中的系数,以使得能够在变换过程中使用定点算术及降低计算成本。可通过使用定点算术而在计算复杂性与变换过程期间所需的最大精度之间找到平衡来决定变换矩阵中的系数的定点逼近法的精度。换句话说,变换矩阵的定点逼近法的较高精度可归因于使用定点逼近法而产生更小误差,这是合乎需要的,但变换矩阵的定点逼近法中的过高精度还可引起定点算术在变换过程期间溢出,这是不合乎需要的。
在将变换应用于像素值的残差块之后,量化单元40量化变换系数以进一步减小位速率。在量化之后,逆量化单元42及逆变换单元44可分别应用逆量化及逆变换,以重构残差块(标记为图2中的“重构残差块(RECON RESID BLOCK)”)。加法器48B将经重构的残差块添加到由预测单元32产生的预测块以产生用于存储于帧存储件34中的经重构的视频块。可由预测单元32使用所述经重构的视频块以对后续视频块进行帧内译码或帧间译码。
如上文所描述,当使用可分离变换(其包括DCT、用于H.264/AVC中的整数变换,及可分离方向性变换)时,所得变换系数被表示为二维系数矩阵。因此,在量化之后,系数扫描单元41将所述系数从二维块格式扫描为一维向量格式(经常被称作系数扫描的过程)。明确地说,系数扫描单元41根据扫描次序来扫描所述系数。根据本发明的一个方面,系数扫描单元41可基于一个或一个以上系数统计资料来自适应地调整用于系数扫描的扫描次序。在一些例项中,系数扫描单元41可针对于预测模式中的每一者而独立地自适应地调整扫描次序,因为所述预测模式中的每一者可具有不同系数统计资料。
系数扫描单元41可最初使用第一扫描次序来扫描经量化的残差块的系数。在一个方面中,所述第一扫描次序可为通常用于H.264/MPEG-4第10部分AVC应用中的z字形扫描次序。尽管将系数扫描单元41描述为最初使用z字形扫描次序进行扫描,但本发明的技术并不限于任何特定初始扫描次序或技术。此外,预测模式中的每一者可具有不同初始扫描次序(例如,针对所述预测模式而经特定训练的扫描次序)。然而,出于说明的目的而描述了z字形扫描次序。所述z字形扫描次序以一维向量来布置量化系数,使得在二维块的左上角中的系数朝向系数向量的开始而压紧。所述z字形扫描次序可为具有有限方向性的系数块提供足够紧密性。
当残差块具有某一方向性或显著方向性且使用可分离方向性变换对其进行变换时,所得二维变换系数块可仍带有某一量的方向性。此是因为尽管使用可分离方向性变换提供较低的计算复杂性及存储要求的益处,但其不可能像使用非可分离方向性变换那样捕捉残差块中的方向性。作为一实例,在将方向性变换应用于垂直预测(上文所描述的实例的模式0)之后,非零系数倾向于沿水平方向而存在。因此,z字形扫描次序可能并未导致所有非零系数均朝向系数向量的开始而被压紧。与在以z字形扫描次序进行扫描将会出现的情况相比,通过调适系数扫描次序以将扫描次序定向于水平方向上以替代固定的z字形扫描次序,系数块的非零系数可朝向一维系数向量的开始而更压紧。此又可减小熵译码上所消耗的位数目,因为在一维系数向量的开始处的非零系数之间存在较短的零游程且在一维系数向量的结尾处存在一个较长的零游程。调适用以产生一维系数向量的扫描次序的概念还可应用于其它预测模式。举例来说,系数扫描单元41可针对预测模式中的每一者而单独地自适应地调整扫描次序,因为所述预测模式中的每一者可在系数块中具有不同方向性且因此具有不同系数统计资料。以此方式,对于预测模式中的每一者来说,扫描次序可能不同。
如上文所描述,初始扫描次序可能并非z字形扫描次序(尤其对于其中将方向性变换应用于残差块的例项来说)。在这些情况下,可使用下文所描述的技术中的一者来预先确定初始扫描次序。作为一个实例,可使用训练视频序列集合来确定初始扫描次序。针对每一预测模式来聚集非零系数的统计资料(例如下文所描述的统计资料)并将其用以初始化系数扫描次序。明确地说,具有最高的非零系数概率的位置是初始扫描次序的第一系数位置,接着具有仅次于最高的非零系数概率的位置是初始扫描次序的第二系数位置等等,直到具有最小非零概率的位置为止,所述位置是初始扫描次序的最后系数位置。或者,可基于可分离变换矩阵的本征值的量值来确定初始扫描次序。举例来说,可将所述本征值分类为递减次序且遵循本征值的对应次序来扫描系数。
即使使用上文所描述的技术中的一者来确定初始扫描次序,各种类型的视频源仍可导致量化残差系数位于块内的不同系数位置中。举例来说,不同分辨率的视频源(例如,共用中间格式(CIF)、四分之一CIF(QCIF)及高清晰度(例如,720p/i或1080p/i)视频源)可导致非零系数位于块内的不同系数位置中。因此,即使基于块的预测模式来选择初始扫描次序,系数扫描单元41仍可调适扫描次序以改进非零系数朝向一维系数向量的开始的紧密性。
为调适扫描次序,系数扫描单元41或视频编码器20的其它单元可收集一个或一个以上块的一个或一个以上系数统计资料。换句话说,随着逐块地执行系数扫描,系数扫描单元41可收集指示块内的位置中的每一者具有非零系数的次数的统计资料。举例来说,系数扫描单元41可保持多个计数器(其每一者均符合二维块中的系数位置),且当非零系数位于所述相应位置处时可递增对应于所述位置的计数器。以此方式,高计数值符合块中非零系数以较大频率出现的位置且低计数值符合块中非零系数以较小频率出现的位置。在一些例项中,系数扫描单元41可针对预测模式中的每一者而收集系数统计资料的单独集合。
如上文所描述,系数扫描单元41可基于所收集的统计资料来调适扫描次序。系数扫描单元41可基于所收集的统计资料来调适扫描次序以在被确定为具有较小的具有非零系数可能性的系数位置之前扫描被确定为具有较高的具有非零系数的可能性的系数位置。举例来说,系数扫描单元41可调适扫描次序以基于二维块的系数位置的计数值(当所述计数值表示相应系数位置具有非零值的次数时)而以递减次序来扫描所述系数位置。或者,计数器可追踪块内的位置中的每一者已为零值系数的位置的次数且调适扫描次序以基于所述系数位置的计数值而以递增次序来扫描所述系数位置。在一些例项中,可仅针对块的系数位置的子集而非块的所有系数位置来收集统计资料。在此情况下,系数扫描单元41可仅调适扫描次序的一部分。
系数扫描单元41可以固定或非固定间隔来调适扫描次序。举例来说,系数扫描单元41可以固定间隔(例如块边界)来调适扫描次序。在一些例项中,系数扫描单元41可在4×4或8×8块边界处或在宏块边界处调适扫描次序。以此方式,可针对每一块或宏块来调适扫描次序。然而,为降低系统复杂性,系数扫描单元41可较不频繁地(例如在每n个块或宏块之后)调适扫描次序。或者,系数扫描单元41可以非固定间隔来调适扫描次序。当块内的位置的计数值中的一者超过阈值时,系数扫描单元41可(例如)调适扫描次序。在调适扫描次序之后,系数扫描单元41可使用经调适的扫描次序来扫描至少一个后续视频块的后续经量化的残差块。在一些例项中,当至少一个后续视频块存在于第一视频块的译码单元中时,系数扫描单元41可使用经调适的扫描次序来扫描所述至少一个后续视频块的后续经量化的残差块。系数扫描单元41可继续扫描后续视频块,直到根据所收集的统计资料来再次调适扫描次序或重新初始化扫描次序为止。以此方式,系数扫描单元41调适扫描次序而以可由熵译码单元46来更有效地编码量化残差系数的方式产生一维系数向量。
在一些例项中,系数扫描单元41可使所收集的统计资料正规化。当系数计数达到阈值时,可能需要使所收集的统计资料正规化。块内的具有已达到阈值的计数值的系数位置(本文中称作系数位置A)可(例如)使所述系数位置即使在所述系数位置在一时间周期中不具有非零系数时仍保持具有最高计数。此归因于位置A处的系数计数是如此大使得在块内的另一位置(本文中称作系数位置B)的系数计数超过位置A处的系数计数并导致系数位置A与B之间的扫描次序改变(即,调换)之前其它系数计数可占有多个块(例如,几十个或几百个块)。因此,为允许视频编码器20较快速地调适局部系数统计资料,当计数中的一者达到阈值时,系数扫描单元41可使系数正规化。举例来说,系数扫描单元41可通过将计数值中的每一者减小预定因数(例如将计数值中的每一者减小2倍)或通过将计数值复位为初始计数值集合来使系数正规化。系数扫描单元41可利用其它正规化方法。举例来说,系数扫描单元41可在对特定数目的块进行译码之后刷新统计资料。
熵编码单元46接收表示块的残差系数的一维系数向量以及块的块标头信息(呈一个或一个以上标头语法元素的形式)。所述标头语法元素可识别当前视频块的特定特性(例如块类型、预测模式、亮度与色度的译码块图案(CBP)、块分割及一个或一个以上运动向量)。可从视频编码器20内的其它组件(例如,从预测单元32)接收这些标头语法元素。
熵编码单元46编码当前视频块的标头信息及残差信息以产生经编码位流(标记为图2中的“视频位流(VIDEO BITSTREAM)”)。熵编码单元46根据本发明中所描述的技术来编码块中的每一者的语法元素中的一者或一者以上。明确地说,熵编码单元46可基于一个或一个以上先前经编码视频块的语法元素来编码当前块的语法元素。因而,熵编码单元46可包括用以存储所述一个或一个以上先前经编码视频块的语法元素的一个或一个以上缓冲器。熵编码单元46可分析任何位置处的任何数目的相邻块以帮助编码当前视频块的语法元素。出于说明的目的,熵编码单元46将被描述为基于直接位于当前块上的先前经编码块(即,上部相邻块)及直接位于当前块左边的先前经编码块(即,左相邻块)来编码预测模式。然而,可将类似技术用于编码其它标头语法元素(例如块类型、块分割、CBP等)。又,可使用在当前视频块的译码中涉及比仅上部相邻块与左相邻块多的相邻块的类似技术。
将参看上文所描述的十八个预测模式的集合并鉴于下文的实例伪代码来描述熵编码单元46的操作。
Let upMode be the prediction mode of the top block
Let leftMode be the prediction mode of the left block
Let currMode be the prediction mode of the current block
If currMode==upMode||currMode==leftMode
      Send″1″
      If upMode!=leftMode
         Send″1″if currMode==upMode or″0″otherwise
      Else
        Send″0″
        Adjust currMode to be in the range of[0,15]
        Send currMode using 4 bits
熵编码单元46将变量upMode、leftMode及currMode分别初始化为等于上部相邻块的预测模式、左相邻块的预测模式及当前块的预测模式。如上文所描述,可基于拉格朗日成本分析来确定上部相邻块、左相邻块及当前块的预测模式。熵编码单元46将当前块的预测模式(currMode)与相邻块的预测模式(upMode及leftMode)相比较。如果当前块的预测模式等于所述相邻块中的任一者的预测模式,则熵编码单元46编码“1”。因此,由熵编码单元46编码以表示当前块的预测模式的第一位指示当前预测模式是与上部相邻块的预测模式相同还是与左相邻块的预测模式相同。
如果当前块的预测模式等于所述相邻块中的任一者的预测模式(即,第一编码位为“1”),则熵编码单元46将上部相邻块的预测模式与左相邻块的预测模式相比较。如果上部相邻块的预测模式与左相邻块的预测模式相同,则熵编码单元46针对预测模式不再编码任何位。在此情况下,可使用单一位来编码预测模式。
然而,如果上部相邻块的预测模式不等于左相邻块的预测模式,则熵编码单元46编码表示预测模式的至少一个额外位以指定所述相邻块中的哪一者具有与当前块相同的预测模式。举例来说,当熵编码单元46分析上部相邻块与左相邻块的预测模式时,熵编码单元46可在当前块的预测模式与上部相邻块的预测模式相同的情况下编码“1”且可在当前块的预测模式与左相邻块的预测模式相同的情况下编码“0”。或者,熵编码单元46可在当前块的预测模式与左相邻块的预测模式相同的情况下编码“1”且可在当前块的预测模式与上部相邻块的预测模式相同的情况下编码“0”。在任一情况下,经编码预测模式的第二位指示上部相邻块或左相邻块中的哪一者具有与当前块的预测模式相同的预测模式。以此方式,当当前块的预测模式等于所述相邻块中的一者的预测模式时,熵编码单元46可使用少到一个位及至多两个位来编码当前块的预测模式。如果熵编码单元46分析两个以上相邻块,则熵编码单元46可编码一个以上额外位以指定先前经编码块中的哪一者具有与当前块相同的预测模式。
如果当前视频块的预测模式与上部相邻块的预测模式或左相邻块的预测模式不相同,则熵编码单元46发送“0”,其指示当前视频块的预测模式与所述相邻块中的任一者的预测模式不相同。熵编码单元46编码表示当前块的预测模式的码字。将上文所描述的十八个预测模式的集合用作实例,熵编码单元46可使用四位码字来编码当前视频块的预测模式。尽管存在十八个可能的预测模式(其通常需要五位码字),但所述可能的预测模式中的两者可针对当前块已从所述集合消除(即,上部相邻块及左相邻块的预测模式),因为上部相邻块及左相邻块的预测模式已与当前块的预测模式相比较并被决定为不等于当前块的预测模式。然而,当上部相邻块及左相邻块具有相同预测模式时,十七个预测模式(而不是十六个预测模式)保持为可能的,从而再次需要五位码字而非四位码字来表示。在此情况下,在预测过程期间,预测单元32可从所述集合选择性地移除剩余十七个译码模式中的一者以使得能够使用四位码字来表示当前块的预测模式。在一例项中,预测单元32可移除最后的预测模式(例如,在此实例中为预测模式17)。然而,预测单元32可使用多种方法中的任何其它方法而将所述集合的预测模式中的任一者选择为待移除。举例来说,预测单元32可追踪所选择的每一预测模式的概率,且移除具有所选择的最低概率的预测模式。
在移除所选预测模式之后,熵编码单元46调整十六个剩余预测模式的范围,使得预测模式数目的范围为[0,15]。在一个实例中,熵编码单元46可临时将所述剩余预测模式从0到15重新编号,其以将0指派给具有最小模式编号的剩余预测模式开始并以将15指派给具有最大预测模式编号的剩余预测模式而结束。举例来说,如果上部相邻块的预测模式为模式12且左相邻块的预测模式是模式14,则熵编码单元46可分别将预测模式13、预测模式15、预测模式16及预测模式17重新编号为预测模式12、预测模式13、预测模式14及预测模式15。熵编码单元46接着使用四个位来编码预测模式。在具有若干预测模式集合(其具有较多或较少可能的预测模式)的其它实例中,熵编码单元46可使用类似技术而以较多或较少的位来编码预测模式。
熵编码单元46可使用CAVLC或CABAC来编码当前视频块的预测模式。强相关性可存在于当前块的预测模式与上部相邻块与左相邻块的预测模式之间。明确地说,当上部相邻块的预测模式及左相邻块的预测模式均为单向性预测模式时,当前块的预测模式也为所述单向性预测模式中的一者的概率为高。同样,当上部相邻块的预测模式及左相邻块的预测模式均为双向性预测模式时,当前块的预测模式也为所述双向性预测模式中的一者的概率为高。以此方式,当上部相邻块及左相邻块的预测模式的类别(例如,单向性对双向性)改变时,当前块的预测模式的概率分布改变。
因而,在一些方面中,熵编码单元46可视一个或一个以上先前经编码视频块(例如,上部相邻视频块及左相邻视频块)的预测模式是单向性还是双向性而定而选择不同译码上下文。在CABAC的情况下,不同译码上下文反映给定上下文内的预测模式集合的不同概率。将对应于在上部相邻译码块及左相邻译码块两者具有单向性预测模式时的情况的译码上下文(本文中称作“第一译码上下文”)作为实例。由于相邻相关性,第一译码上下文可将比双向性预测模式高的概率指派给单向性预测模式。因此,当针对CABAC编码选择第一译码上下文(即,上部相邻预测模式及左相邻预测模式两者为单向性)时,与在当前预测模式为双向性预测模式中的一者的情况下相比,在当前预测模式为单向性预测模式中的一者的情况下,译码当前预测模式可消耗较少的位。在CAVLC的情况下,可针对不同译码上下文来界定不同VLC译码表。举例来说,当选择第一译码上下文(即,上部相邻块及左相邻块两者均具有单向性预测模式)时,可使用VLC译码表,所述VLC译码表将比双向性预测模式短的码字指派给单向性预测模式。
可见,当上部视频块的预测模式与左视频块的预测模式均为单向性预测模式时,熵编码单元46可选择第一译码上下文。当上部视频块的预测模式与左视频块的预测模式均不是单向性预测模式时,熵编码单元46可选择一不同译码上下文。举例来说,当上部相邻视频块的预测模式与左相邻视频块的预测模式均为双向性预测模式时,熵编码单元46可选择第二译码上下文。当上部相邻块与左相邻块两者的预测模式为双向性时,所述第二译码上下文模拟当前视频块的预测模式的概率分布。第二译码上下文的概率分布在CABAC译码的情况下可将比单向性预测模式高的概率指派给双向性预测模式,且在CAVLC译码的情况下可将比单向性预测模式短的码字指派给双向性预测模式。
当所述相邻块中的一者的预测模式是单向性预测模式且所述相邻块中的另一者的预测模式是双向性预测模式时,熵编码单元46仍可选择第三译码上下文。所述第三译码上下文将当前预测模式的概率更均匀地分布于所述集合的单向性预测模式与双向性预测模式当中。基于一个或一个以上先前经编码视频块(例如,上部视频块与左视频块)的预测模式是单向性还是双向性而选择不同译码上下文以用于在编码中使用可引起更好地压缩预测模式信息。
图3为进一步详细说明图1的视频解码器26的实例的框图。视频解码器26可执行经译码单元(例如视频帧或切片)内的块的帧内解码及帧间解码。在图3的实例中,视频解码器26包括熵解码单元60、预测单元62、系数扫描单元63、逆量化单元64、逆变换单元66及帧存储件68。视频解码器26还包括加法器69,所述加法器69组合逆变换单元66及预测单元62的输出。
熵解码单元60接收经编码的视频位流(标记为图3中的“视频位流(VIDEOBITSTREAM)”)并解码所述经编码位流以获得残差信息(例如,呈量化残差系数的一维向量的形式)及标头信息(例如,呈一个或一个以上标头语法元素的形式)。熵解码单元60执行由图2的编码模块46执行的编码的互逆解码功能。出于实例的目的而描述对熵解码单元60执行预测模式语法元素的解码的描述。可将所述技术扩展到其它语法元素(例如块类型、块分割、CBP等)的解码。
明确地说,熵解码单元60分析表示预测模式的第一位以确定当前块的预测模式是否等于所分析的先前经解码的块(例如,上部相邻块或左相邻块)中的任一者的预测模式。熵解码模块60可在第一位为“1”时确定当前块的预测模式等于所述相邻块中的一者的预测模式且可在第一位为“0”时确定当前块的预测模式与所述相邻块中的任一者的预测模式不相同。
如果第一位为“1”且如果上部相邻块的预测模式与左相邻块的预测模式相同,则熵解码单元60无需接收任何更多位。熵解码单元60选择所述相邻块中的任一者的预测模式作为当前块的预测模式。熵解码单元60可(例如)包括存储所述一个或一个以上先前经解码块的先前预测模式的一个或一个以上缓冲器(或其它存储器)。
如果第一位为“1”且如果上部相邻块的预测模式与左相邻块的预测模式不相同,则熵解码单元60接收表示预测模式的第二位,熵解码单元60基于所述第二位来确定所述相邻块中的哪一者具有与当前块相同的预测模式。熵解码单元60可(例如)在第二位为“1”时确定当前块的预测模式与上部相邻块的预测模式相同,且可在第二位为“0”时确定当前块的预测模式与左相邻块的预测模式相同。熵解码单元60选择正确的相邻块的预测模式作为当前块的预测模式。
然而,当第一位为“0”时,熵解码单元60确定当前块的预测模式与所述相邻块中的任一者的预测模式不相同。因此,熵解码单元60可从可能的预测模式的集合移除上部相邻块与左相邻块的预测模式。所述可能的预测模式集合可包括一个或一个以上单向性预测模式及/或一个或一个以上多向性预测模式。在上文图2的描述中提供包括总计十八个预测模式的预测模式的一个实例集合。如果上部相邻块与左相邻块具有相同预测模式,则熵解码单元60可移除所述相邻块的预测模式及至少一个其它预测模式。作为实例,熵解码模块60可移除具有最大模式编号的预测模式(例如,上文所描述的十八个预测模式的集合中的模式17)。然而,熵解码单元60可使用多种方法中的其它任一者而将所述集合的预测模式中的任一者选择为待移除,只要解码单元60移除与由预测单元32移除的预测模式相同的预测模式。举例来说,熵解码单元60可移除具有所选择的最低概率的预测模式。
熵解码单元60可调整剩余预测模式的预测模式编号,使得所述预测模式编号的范围为0到15。在一个实例中,熵编码单元46可临时将剩余预测模式从0到15重新编号,其以具有最小模式编号的剩余预测模式开始且以具有最大预测模式编号的剩余预测模式结束,如上文参看图2所描述。熵解码单元60解码剩余位(例如,在所描述的实例中为四个位),以获得剩余预测模式的预测模式编号,其符合当前块的预测模式。
在一些例项中,熵解码单元60可使用CAVLC或CABAC来解码当前视频块的预测模式。因为强相关性可存在于当前块的预测模式与一个或一个以上先前经解码块的预测模式(例如,上部相邻块与左相邻块的预测模式)之间,所以熵解码单元60可基于一个或一个以上先前经解码视频块的预测模式的类型针对所述块的预测模式而选择不同译码上下文。换句话说,熵解码单元60可基于先前经解码块的预测模式是单向性还是双向性来选择不同译码上下文。
作为一个实例,熵解码单元60可在两个先前经解码块的预测模式为单向性预测模式时选择第一译码上下文,在两个先前经解码块的预测模式为双向性预测模式时选择第二译码上下文,且在所述先前经解码块中的一者的预测模式为单向性预测模式且所述先前经解码块中的另一者的预测模式为双向性预测模式时选择第三译码上下文。
预测单元62使用标头信息的至少一部分而产生预测块。举例来说,在帧内译码块的情况下,熵解码单元60可将标头信息的至少一部分(例如此块的块类型及预测模式)提供到预测单元62以用于产生预测块。预测单元62根据块类型及预测模式而使用共同译码单元内的一个或一个以上邻近块(或所述邻近块的若干部分)来产生预测块。作为实例,预测单元62可(例如)使用由预测模式语法元素指定的预测模式来产生由块类型语法元素指示的分割大小的预测块。可(例如)从帧存储件68检索所述当前译码单元内的所述一个或一个以上邻近块(或所述邻近块的若干部分)。
熵解码单元60还解码经编码视频数据以获得呈一维系数向量的形式的残差信息。如果使用可分离变换(例如,DCT、H.264/AVC整数变换、可分离方向性变换),则系数扫描单元63扫描一维系数向量以产生二维块。系数扫描单元63执行由图2的系数扫描单元41执行的扫描的互逆扫描功能。明确地说,系数扫描单元63根据初始扫描次序来扫描系数以将一维向量的系数置于二维格式。换句话说,系数扫描单元63扫描一维向量以产生量化系数的二维块。
系数扫描单元63可基于一个或一个以上系数统计资料而自适应地调整用于系数扫描的扫描次序以使所述扫描次序与由视频编码器20使用的扫描次序同步。为进行此,系数扫描单元63可收集一个或一个以上块的一个或一个以上系数统计资料并基于所收集的统计资料来调适扫描次序。换句话说,随着重构量化系数的二维块,系数扫描单元63可收集指示二维块内的位置中的每一者已为非零系数的位置的次数的统计资料。系数扫描单元63可保持多个计数器(其每一者符合二维块中的系数位置),且在非零系数位于所述相应位置处时递增对应于所述位置的计数器。
系数扫描单元63可基于所收集的统计资料来调适扫描次序。系数扫描单元63可基于所收集的统计资料来调适扫描次序以在被确定为具有较小的具有非零系数可能性的系数位置之前扫描具有较高的具有非零系数可能性的位置。系数扫描单元63以由视频编码器20使用的相同固定或非固定间隔来调适扫描次序。系数扫描单元63以与上文参看视频编码器20所描述的方式相同的方式而使所收集的统计资料正规化。
如上文所描述,在一些例项中,系数扫描单元63可收集单独的系数统计资料并针对预测模式中的每一者而单独地自适应地调整扫描次序。系数扫描单元63可进行此操作,(例如)因为预测模式中的每一者可具有不同系数统计资料。
在产生量化残差系数的二维块后,逆量化单元64逆量化(即,解量化)所述量化残差系数。逆变换单元66将逆变换(例如,逆DCT、逆整数变换或逆方向性变换)应用于经解量化的残差系数以产生像素值的残差块。加法器69对由预测单元62产生的预测块与来自逆变换单元66的残差块求和以形成经重构的视频块。以此方式,视频解码器26使用标头信息及残差信息来逐块地重构视频序列的帧。
基于块的视频译码可有时在经译码视频帧的块边界处产生在视觉上可察觉的成块性(blockiness)。在此类情况下,解块滤波可使块边界平滑以减少或消除在视觉上可察觉的成块性。因而,还可应用解块滤波器(未展示)来滤波经解码块以便减少或移除成块性。在进行任何任选解块滤波之后,接着将经重构的块放置于帧存储件68中,所述帧存储件68为后续视频块的空间与时间预测提供参考块且还产生用以驱动显示装置(例如图1的显示装置28)的经解码视频。
图4为说明与本发明一致的自适应扫描的假设实例的概念图。在此实例中,将系数位置在项71中标记为c1到c16。在四个连续块的块1(72)、块2(73)、块3(74)及块4(75)中展示了实际系数值。块1到4的实际系数值可表示量化残差系数、未量化的变换系数或其它类型的系数。在其它例项中,所述位置可表示残差块的像素值的位置。块1到4可包含与相同预测模式相关联的块。在图4中所说明的实例中,块1到4为4×4块。然而,如上文所描述,本发明的技术可经扩展以应用于任何大小的块。此外,尽管下文参看视频编码器20的系数扫描单元41而进行了描述,但视频解码器26的系数扫描单元63可收集统计资料并以类似方式调适扫描次序。
最初,系数扫描单元41可使用z字形扫描次序来扫描块1的系数。在此情况下,系数扫描单元41依以下次序来扫描块1的系数位置;c1、c2、c5、c9、c6、c3、c4、c7、c10、c13、c14、c11、c8、c12、c15、c16。因此,在扫描块1的系数之后,系数扫描单元41输出一维系数向量v,其中v=[9,4,6,1,1,0,0,0,0,2,0,0,0,0,0,0]。尽管在图4中所说明的实例中,系数扫描单元41最初使用z字形扫描次序来扫描块1的系数,但所述z字形扫描并非用于自适应扫描的唯一可能的开始点。可将水平扫描、垂直扫描或任何其它初始扫描序列用作初始扫描次序。z字形扫描的使用产生一维系数向量v,所述向量v在两个非零系数之间具有四个零的游程。
统计资料1(76)表示块1的统计资料。统计资料1(76)可为系数位置中的每一者的计数值以追踪每一系数位置具有非零值的次数。在图4的实例中,将系数统计资料全部初始化为零。然而,可使用其它初始化方案。举例来说,可使用预测模式中的每一者的典型或平均系数统计资料来初始化相应预测模式的统计资料。在对块1译码之后,统计资料1(76)对于块1的任何非零系数位置来说具有值1且对于块1的任何具有零值的系数位置来说具有值0。统计资料2(77)表示块1与2的组合统计资料。系数扫描模块41在系数位置在块2中具有非零值时递增统计资料1(76)的计数且在系数位置具有值0时将所述计数保持为相同。因此,如图4中所示,系数扫描模块41将系数位置c1、c2、c5、c9及c13的统计资料递增到值2且将剩余系数位置的统计资料保持为与统计资料1(76)中的情况相同。统计资料3(78)表示块1到3的组合统计资料且统计资料4(79)表示块1到4的组合统计资料。如上文所描述,在一些方面中,系数扫描单元41可使用多个计数器来收集所述块的统计资料。
系数扫描单元41可基于所收集的统计资料来调适扫描次序。在所说明的实例中,系数扫描单元41可经配置以基于统计资料4(79)而在四个视频块之后调适扫描次序。在此情况下,系数扫描单元41分析所收集的统计资料并调适扫描次序,使得系数位置是根据其对应计数值而以递减次序来扫描的。因而,系数扫描单元41可根据初始扫描次序来扫描块1到4且调适扫描次序从而依以下次序来扫描后续块(例如,块5(未展示))的位置c1、c5、c9、c2、c13、c6、c3、c4、c7、c10、c14、c11、c8、c12、c15、c16。系数扫描单元41根据新扫描次序而继续扫描后续块,直到再次基于块的所收集的统计资料而调适或重新初始化所述扫描次序(例如,在后续译码单元开始处)为止。
调适扫描次序以从初始扫描次序(例如,z字形扫描次序)改变到新的扫描次序促进在一维系数向量开始处的非零系数及在结尾处的零系数。在图4的实例中,与水平维度中的系数相比,新的扫描次序较早地扫描垂直维度中的系数,从而反映以下事实:对于给定预测模式来说,与水平维度中的系数相比,垂直维度中的系数具有较高的为非零的可能性。块1到4可均具有相同的预测模式,且过去的统计资料可表示可能的未来的非零系数位置。因此,通过使用过去的统计资料来界定扫描次序,本发明的技术可促进将非零系数分组在靠近经扫描的一维向量的开始处及将零值系数分组在靠近所述经扫描的一维向量的结尾处,因此消除或减少两个非零系数之间的零游程数目。此又可改进在熵译码期间可实现的压缩电平。
图5为说明与本发明一致的译码技术的流程图。可将图5中所说明的译码技术用于视频块的编码或解码。如图5中所示,系数扫描单元41、63根据针对当前块的对应预测模式所界定的初始扫描次序来扫描块的系数(80)。从视频编码器20的观点来说,扫描可将系数的二维块转换为一维系数向量。然而,从视频解码器26的观点来说,扫描将使一维系数向量转换为二维系数块。作为一个实例,对应预测模式的初始扫描次序可为z字形扫描次序。z字形扫描并非唯一可能的初始扫描次序。可将水平扫描、垂直扫描或任何其它初始扫描次序用作初始扫描次序。
系数扫描单元41、63收集一个或一个以上块的统计资料(82)。明确地说,对于所扫描的块中的每一者来说,系数扫描单元41、63可收集追踪(例如,通过计数器)二维块内的系数位置中的每一者为非零系数的频率的统计资料。系数扫描单元41、63确定是否评估扫描次序(83)。系数扫描单元41、63可以固定间隔(例如,在每一块边界处或在n个块边界之后)或非固定间隔(例如,当块内的位置的计数值中的一者超过阈值时)来评估扫描次序。
如果系数扫描单元41、63确定不评估扫描次序,则系数扫描单元41、63根据初始扫描次序来扫描后续块(80)。如果系数扫描单元41、63确定评估扫描次序(例如,在n个块已被编码/解码之后),则系数扫描单元可基于所收集的统计资料来调适扫描次序(84)。举例来说,系数扫描单元41、63可调适扫描次序从而基于其计数值而以递减次序来扫描块的系数位置,其中所述计数值反映给定位置具有非零系数的可能性。在调适扫描次序之后,在一些例项中,系数扫描单元41、63可确定统计资料的任何计数值是否超过阈值(86)。如果所述系数位置中的一者具有超过阈值的对应计数值,则系数扫描单元41、63可使所收集的统计资料(例如,系数计数值)正规化(87)。举例来说,系数扫描单元41、63可通过将计数值中的每一者减小预定因数(例如,减小2倍以将计数值中的每一者减小一半)或将计数值复位为初始计数值的集合来使系数计数值正规化。使系数计数值正规化可允许视频编码器20更快速地调适局部系数统计资料。
在使所收集的统计资料正规化之后或当不执行正规化时,系数扫描单元41、63使用经调适的扫描次序来扫描后续块(88)。当至少一个后续块存在于先前经扫描视频块的译码单元内时,系数扫描单元41、63可使用经调适扫描次序来扫描所述至少一个后续块。系数扫描单元41、63可继续扫描后续视频块,直到再次调整或重新初始化(例如,在译码单元边界处)扫描次序为止。以此方式,系数扫描单元41、63基于所收集的统计资料来调适扫描次序以在块的被确定为具有较小的为非零可能性的系数位置之前扫描块的被确定为具有较高的为非零可能性的系数位置。因此,一维系数向量经布置以促进将非零系数分组在靠近经扫描一维向量的开始处及将零值系数分组在靠近所述经扫描一维向量的结尾处。此又可改进在熵译码期间可实现的压缩电平。
在一些例项中,系数扫描单元41、63可针对预测模式中的每一者而单独地自适应地调整扫描次序,因为所述预测模式中的每一者可具有不同系数统计资料。换句话说,系数扫描单元41、63可针对预测模式中的每一者而保持单独统计资料且基于相应统计资料来不同地调整用于预测模式中的每一者的扫描次序。因此,可针对每一预测模式而由系数扫描单元41、63来执行上文所描述的实例流程图。
图6为流程图,其说明编码单元(例如视频编码器20的熵编码单元46)根据本发明的技术中的一者来编码视频块的标头信息的实例操作。熵编码单元46接收块的标头信息(90),所述标头信息呈一个或一个以上标头语法元素的形式。所述标头语法元素可识别当前视频块的特定特性(例如块类型、预测模式、亮度及/或色度的译码块图案(CBP)、块分割及一个或一个以上运动向量)。将关于编码当前块的预测模式来描述图6。然而,可使用类似技术来编码标头语法元素中的其它者。
熵编码单元46将当前块的预测模式与一个或一个以上先前经编码块的预测模式相比较(92)。所述一个或一个以上先前经编码块可(例如)包含一个或一个以上邻近块。在图6的实例中,分析两个先前经编码块(例如,上部相邻块及左相邻块)。如果当前块的预测模式与所述先前经编码块中的任一者的预测模式相同,则熵编码单元46编码第一位以指示如此情况(94)。作为一个实例,熵编码单元46可将第一位编码为“1”以指示当前块的预测模式与先前经编码块中的任一者的预测模式相同。
熵编码单元46将上部相邻块的预测模式与左相邻块的预测模式相比较(98)。如果上部相邻块的预测模式与左相邻块的预测模式相同,则熵编码单元46针对所述预测模式不再编码任何位(100)。在此情况下,可使用单一位来编码预测模式。
然而,如果上部相邻块的预测模式不等于左相邻块的预测模式,则熵编码单元46编码表示预测模式的第二位以指示所述相邻块中的哪一者具有与当前块相同的预测模式(102)。举例来说,熵编码单元46可在当前块的预测模式与上部相邻块的预测模式相同的情况下编码“1”且可在当前块的预测模式与左相邻块的预测模式相同的情况下编码“0”。因而,当当前块的预测模式等于所述相邻块中的一者的预测模式时,熵编码单元46可使用少到一个位及至多两个位来编码当前块的预测模式。
如果当前块的预测模式与先前经编码块中的任一者的预测模式不相同,则熵编码单元46编码第一位以指示如此情况(96)。为继续上文的实例,熵编码单元46可将第一位编码为“0”以指示当前块的预测模式与先前经编码块中的任一者的预测模式不相同。熵编码单元46可重新布置可能的预测模式的集合(104)。熵编码单元46可通过从可能的预测模式的集合移除相邻块的预测模式来重新布置可能的预测模式的集合。当上部相邻块与左相邻块具有彼此不同的预测模式时,熵编码单元46可从所述集合移除两个预测模式。当上部相邻块与左相邻块具有彼此相同的预测模式时,熵编码单元46可从所述集合移除一个预测模式(即,上部相邻块与左相邻块的预测模式)。此外,在一些例项中,熵编码单元46可从所述集合选择性地移除一个或一个以上额外译码模式。当熵编码单元46移除一个或一个以上额外译码模式时,图2的预测单元32也从可能的预测模式的集合移除相同的额外译码模式,使得将不选择这些额外译码模式。在移除所述一个或一个以上预测模式之后,熵编码单元46调整所述集合的剩余预测模式的模式编号。
熵编码单元46对表示当前块的预测模式的码字进行编码(106)。熵编码单元46可使用CAVLC、CABAC或其它熵译码方法来编码当前视频块的预测模式。如将参看图7而更详细描述,在一些例项中,编码单元46可基于所述一个或一个以上先前经编码块的预测模式而自适应地选择用于在编码当前块的预测模式中使用的译码上下文。
图7为说明根据本发明的一个方面的译码上下文选择的流程图。如上文所描述,相关性可存在于当前块的预测模式的类型与一个或一个以上先前经编码块(例如上部相邻块与左相邻块)的预测模式的类型之间。举例来说,当上部相邻块与左相邻块的预测模式均为单向性预测模式时,存在当前块的预测模式也为单向性预测模式的较高概率。同样,当上部相邻块与左相邻块的预测模式均为双向性预测模式时,存在当前块的预测模式也为双向性预测模式的较高概率。
因而,熵编码单元46可确定上部相邻块与左相邻块的预测模式是否为单向性预测模式(112)且当上部相邻块与左相邻块两者的预测模式为单向性预测模式时选择第一译码上下文(114)。当上部相邻块与左相邻块两者的预测模式为单向性预测模式时,所述第一译码上下文模拟当前视频块的预测模式的概率分布。与所述集合的双向性预测模式相比,第一译码上下文的概率分布可为所述集合的单向性预测模式提供较高概率。在CAVLC的情况下,举例来说,第一译码上下文可使用译码表,与同双向性预测模式相关联的码字相比,所述译码表使较短的码字与单向性预测模式相关联。
当上部相邻块与左相邻块中的每一者的预测模式并非单向性预测模式时,熵编码单元46可确定上部相邻块与左相邻块中的每一者的预测模式是否为双向性预测模式(116)。当上部相邻块与左相邻块中的每一者的预测模式均为双向性预测模式时,熵编码单元46可选择第二译码上下文(117)。所述第二译码上下文基于以下假定来模拟当前视频块的预测模式的概率分布:与单向性预测模式相比,存在当前模式为双向性预测模式的较高概率。又,在CAVLC的情况下,举例来说,第二译码上下文可使用译码表,与同单向性预测模式相关联的码字相比,所述译码表使较短的码字与双向性预测模式相关联。
当上部相邻块与左相邻块的预测模式均不是双向性预测模式(即,先前经编码块的预测模式为双向性预测模式与单向性预测模式的组合)时,熵编码单元46可选择第三译码上下文(118)。所述第三译码上下文是在以下假定下而产生的:当前预测模式的概率被更均匀地分布于所述集合的单向性预测模式与双向性预测模式当中。在CAVLC的情况下,举例来说,第三译码上下文可使用译码表,所述译码表使类似代码长度的码字与双向性预测模式及单向性预测模式相关联。
熵编码模块46根据所选译码上下文来编码当前视频块的预测模式(119)。基于一个或一个以上先前经编码视频块的预测模式而选择不同译码上下文以用于在编码当前视频块的预测模式中使用可引起更好地压缩预测模式信息。由解码单元60执行相同的译码上下文选择技术,使得解码单元60可精确地解码视频块的预测模式。
图8为说明了解码单元(例如视频解码器26的熵解码单元60)根据本发明的技术来解码视频块的标头信息的实例操作的流程图。熵解码单元60解码经编码视频位流以获得标头信息(例如,呈一个或一个以上标头语法元素的形式)。出于实例的目的而描述对熵解码单元60执行预测模式的解码的描述。可将所述技术扩展到其它标头语法元素(例如块类型、块分割、CBP等)的解码。
明确地说,熵解码单元60接收表示当前块的预测模式的第一位(120)。熵解码单元60确定表示预测模式的第一位是否指示当前块的预测模式与先前经解码块(例如,上部相邻块或左相邻块)的预测模式相同(122)。熵解码模块60可(例如)在第一位为“1”时确定当前块的预测模式与上部相邻块及左相邻块中的一者的预测模式相同,且可在第一位为“0”时确定当前块的预测模式与上部相邻块及左相邻块的预测模式不相同。
当熵解码单元60确定当前块的预测模式与上部相邻块及左相邻块中的一者的预测模式相同时,熵解码单元60确定上部相邻块的预测模式与左相邻块的预测模式是否相同(124)。当上部相邻块的预测模式与左相邻块的预测模式相同时,不接收表示当前视频块的预测模式的更多位,且熵解码单元60选择所述相邻块中的任一者的预测模式作为当前块的预测模式(126)。当上部相邻块的预测模式与左相邻块的预测模式不同时,接收表示预测模式的一个额外位,且熵解码单元60基于表示预测模式的下一所接收的位而选择正确的相邻块的预测模式作为当前块的预测模式(128)。举例来说,熵解码单元60可在下一所接收的位为“1”时选择上部相邻块的预测模式作为当前块的预测模式,且可在下一所接收的位为“0”时选择左相邻块的预测模式作为当前块的预测模式。
当熵解码单元60确定当前块的预测模式与上部相邻块及左相邻块中的任一者的预测模式不同时(即,当表示预测模式的第一位为“0”时),熵解码单元60可移除可能的预测模式的集合的一个或一个以上预测模式(130)。熵解码单元60可从可能的预测模式的集合移除上部相邻块及左相邻块的预测模式。如果上部相邻块与左相邻块具有相同预测模式,则熵解码单元60可移除所述相邻块的预测模式及至少一个其它预测模式,如上文所详细描述。
熵解码单元60解码剩余位(例如,在所描述的实例中为四个位)以获得当前块的预测模式的预测模式编号(132)。熵解码单元60可以与由熵编码单元46执行的预测模式编号调整过程互逆的方式来调整剩余预测模式的预测模式编号(134)。在一个实例中,熵解码单元60可通过插回已被移除的预测模式而将经解码预测模式编号(范围是从0到15)重新编号为原始预测模式编号(范围是从0到17)。在一些例项中,熵解码单元60可基于一个或一个以上先前经解码视频块的预测模式(例如,基于所述先前经解码块的预测模式是否均为单向性、均为双向性或一者为单向性且另一者为双向性)针对块的预测模式而选择不同译码上下文,如上文所详细描述。熵解码单元60将预测模式提供到预测单元62以根据所选预测模式而产生预测块(136)。如参看图3所描述,将预测块与残差像素值组合以产生经重构块供呈现给用户。
可以硬件、软件、固件或其任何组合来实施本发明中所描述的技术。可将被描述为单元或组件的任何特征一起实施于集成逻辑装置中或单独实施为离散但可共同操作的逻辑装置。如果以软件实施,则可至少部分地由计算机可读媒体来实现所述技术,所述计算机可读媒体包含在被执行时可执行上文所描述的方法中的一者或一者以上的指令。所述计算机可读媒体可形成计算机程序产品的一部分,所述计算机程序产品可包括封装材料。计算机可读媒体可包含随机存取存储器(RAM)(例如同步动态随机存取存储器(SDRAM))、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪存储器、磁性或光学数据存储媒体等。另外或或者,所述技术可至少部分地由计算机可读通信媒体来实现,所述计算机可读通信媒体携载或传达呈指令或数据结构形式的代码且可由计算机来存取、读取及/或执行。
所述代码可由一个或一个以上处理器(例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路)来执行。因此,如本文中所使用的术语“处理器”可指上述结构中的任一者或任何其它适合用于实施本文中所描述的技术的结构。另外,在一些方面中,可将本文中所描述的功能性提供于经配置以用于编码及解码的专用软件单元或硬件单元内,或并入于组合式视频编码器-解码器(编解码器)中。对不同特征作为单元的描述希望突出所说明的装置的不同功能方面且未必暗示此类单元必须由单独硬件或软件组件来实现。而是,可将与一个或一个以上单元相关联的功能性集成于共用或单独的硬件或软件组件内。
已描述本发明的各种实施例。这些及其它实施例在所附权利要求书的范围内。

Claims (54)

1.一种对视频数据进行译码的方法,所述方法包含:
使用系数扫描次序来扫描第一视频块的系数值;
收集与所述系数值中的至少一部分相关联的统计资料;
根据所述所收集统计资料来调整所述系数扫描次序;
在至少一个后续视频块存在于所述第一视频块的译码单元中时,使用所述经调整系数扫描次序来扫描所述至少一个后续视频块的系数值;以及
对所述系数值进行熵译码。
2.根据权利要求1所述的方法,其中调整所述系数扫描次序包含在固定间隔之后调适所述系数扫描次序以产生所述经调整系数扫描次序。
3.根据权利要求2所述的方法,其中在固定间隔之后调整所述系数扫描次序包含在阈值数目的视频块已被译码之后调整所述系数扫描次序。
4.根据权利要求1所述的方法,其中收集所述系数值的至少一部分的统计资料包含维持对应于所述系数值的二维表示的部分内的每一位置的计数值,所述计数值追踪所述系数值的所述二维表示的所述部分内的所述位置中的每一者具有非零系数值的次数。
5.根据权利要求4所述的方法,其中调整所述系数扫描次序包含调整所述系数扫描次序以产生经调整系数扫描次序,所述经调整系数扫描次序基于系数位置的计数值而以递减次序来扫描所述系数位置。
6.根据权利要求4所述的方法,其中调整所述系数扫描次序包含在所述计数值中的一者达到阈值时,根据所述所收集统计资料来更新所述系数扫描次序以产生所述经调整系数扫描次序。
7.根据权利要求1所述的方法,其进一步包含使所述所收集统计资料正规化。
8.根据权利要求7所述的方法,其中
收集与所述位置中的至少一部分相关联的统计资料包含维持对应于所述系数值的所述二维表示的所述部分内的每一位置的计数值,所述计数值追踪所述系数值的所述二维表示的所述部分内的所述位置中的每一者具有非零系数值的次数;以及使所述所收集统计资料正规化包含在所述计数值中的一者达到阈值计数值时使所述所收集统计资料正规化。
9.根据权利要求7所述的方法,其中使所述所收集统计资料正规化包含将所述计数值中的每一者减小一因数及将所述计数值复位为初始计数值的集合这两种操作中的一者。
10.根据权利要求1所述的方法,其中收集统计资料且调整所述系数扫描次序包含收集统计资料且调整具有第一预测模式的第一视频块的所述系数扫描次序,所述方法进一步包含:
收集与具有第二预测模式的第二视频块的系数值的至少一部分相关联的统计资料;以及
根据所述所收集统计资料来调适与所述第二预测模式相关联的初始系数扫描次序。
11.根据权利要求1所述的方法,其中:
扫描所述第一视频块的所述系数值包含基于所述系数扫描次序而从二维系数值块中产生一维系数值向量;以及
熵译码包含在扫描所述系数值之后对所述一维向量进行熵编码。
12.根据权利要求1所述的方法,其中:
扫描所述第一视频块的所述系数值包含基于所述系数扫描次序而从一维系数值向量中产生二维系数值块;以及
熵译码包含在扫描所述系数值之前对所述一维向量进行熵解码。
13.根据权利要求1所述的方法,其中所述第一视频块及所述至少一个后续视频块属于第一译码单元,所述方法进一步包含针对第二译码单元重新初始化所述扫描次序。
14.一种对视频数据进行译码的装置,所述装置包含:
扫描单元,其使用系数扫描次序来扫描第一视频块的系数值,收集与所述系数值的至少一部分相关联的统计资料,根据所述所收集统计资料来调整所述系数扫描次序,且在至少一个后续视频块存在于所述第一视频块的译码单元中时使用所述经调整系数扫描次序来扫描所述至少一个后续视频块的系数值;以及
熵译码单元,其对所述系数值进行熵译码。
15.根据权利要求14所述的装置,其中所述扫描单元在固定间隔之后调整所述系数扫描次序以产生所述经调整系数扫描次序。
16.根据权利要求15所述的装置,其中所述扫描单元在阈值数目的视频块已被译码之后调整所述系数扫描次序。
17.根据权利要求14所述的装置,其中所述扫描单元维持对应于所述系数值的二维表示的部分内的每一位置的计数值,所述计数值追踪所述系数值的所述二维表示的所述部分内的所述位置中的每一者具有非零系数值的次数。
18.根据权利要求17所述的装置,其中所述扫描单元调整所述系数扫描次序以产生经调整系数扫描次序,所述经调整系数扫描次序基于系数位置的计数值而以递减次序来扫描所述系数位置。
19.根据权利要求17所述的装置,其中当所述计数值中的一者达到阈值时,所述扫描单元根据所述所收集统计资料来更新所述系数扫描次序以产生所述经调整系数扫描次序。
20.根据权利要求14所述的装置,其中所述扫描单元使所述所收集统计资料正规化。
21.根据权利要求20所述的装置,其中所述扫描单元维持对应于所述系数值的所述二维表示的所述部分内的每一位置的计数值,所述计数值追踪所述系数值的所述二维表示的所述部分内的所述位置中的每一者具有非零系数值的次数,且当所述计数值中的一者达到阈值计数值时,所述扫描单元使所述所收集统计资料正规化。
22.根据权利要求20所述的装置,其中使所述所收集统计资料正规化包含将所述计数值中的每一者减小一因数及将所述计数值复位为初始计数值的集合这两种操作中的一者。
23.根据权利要求14所述的装置,其中所述扫描单元针对每一预测模式而单独地收集统计资料并调整所述系数扫描次序。
24.根据权利要求14所述的装置,其中:
所述扫描单元基于所述系数扫描次序而从二维系数值块中产生一维系数值向量;以及
所述熵译码单元在扫描所述系数值之后对所述一维向量进行熵编码。
25.根据权利要求14所述的装置,其中:
所述扫描单元基于所述系数扫描次序而从一维系数值向量中产生二维系数值块;以及
所述熵译码单元包含在扫描所述系数值之前对所述一维向量进行熵解码。
26.根据权利要求14所述的装置,其中所述第一视频块及所述至少一个后续视频块属于第一译码单元,且所述扫描单元针对第二译码单元重新初始化所述扫描次序。
27.根据权利要求14所述的装置,其中所述装置包含无线通信装置。
28.根据权利要求14所述的装置,其中所述装置包含集成电路装置。
29.一种计算机可读媒体,其上面存储有指令,所述指令在于视频译码装置中执行时致使所述装置对视频块进行译码,其中所述指令致使所述装置:
使用系数扫描次序来扫描第一视频块的系数值;
收集与所述系数值的至少一部分相关联的统计资料;
根据所述所收集统计资料来调整所述系数扫描次序;
在至少一个后续视频块存在于所述第一视频块的译码单元中时使用所述经调整系数扫描次序来扫描所述至少一个后续视频块的系数值;以及
对所述系数值进行熵译码。
30.根据权利要求29所述的计算机可读媒体,其中所述指令致使所述装置在固定间隔之后调整所述系数扫描次序以产生所述经调整系数扫描次序。
31.根据权利要求30所述的计算机可读媒体,其中所述指令致使所述装置在阈值数目的视频块已被译码之后调整所述系数扫描次序。
32.根据权利要求29所述的计算机可读媒体,其中所述指令致使所述装置维持对应于所述系数值的二维表示的部分内的每一位置的计数值,所述计数值追踪所述系数值的所述二维表示的所述部分内的所述位置中的每一者具有非零系数值的次数。
33.根据权利要求32所述的计算机可读媒体,其中所述指令致使所述装置调整所述系数扫描次序以产生经调整系数扫描次序,所述经调整系数扫描次序基于系数位置的计数值而以递减次序来扫描所述系数位置。
34.根据权利要求32所述的计算机可读媒体,其中所述指令致使所述装置在所述计数值中的一者达到阈值时根据所述所收集统计资料来更新所述系数扫描次序以产生所述经调整系数扫描次序。
35.根据权利要求29所述的计算机可读媒体,其中所述指令致使所述装置使所述所收集统计资料正规化。
36.根据权利要求35所述的计算机可读媒体,其中所述指令致使所述装置:维持对应于所述系数值的所述二维表示的所述部分内的每一位置的计数值,所述计数值追踪所述系数值的所述二维表示的所述部分内的所述位置中的每一者具有非零系数值的次数;以及
使所述所收集统计资料正规化包含在所述计数值中的一者达到阈值计数值时使所述所收集统计资料正规化。
37.根据权利要求35所述的计算机可读媒体,其中所述指令致使所述装置通过将所述计数值中的每一者减小一因数或将所述计数值复位为初始计数值的集合来使所述所收集统计资料正规化。
38.根据权利要求29所述的计算机可读媒体,其中所述指令致使所述装置针对每一预测模式而单独地收集统计资料并调整所述系数扫描次序。
39.根据权利要求29所述的计算机可读媒体,其中所述指令致使所述装置:
基于所述系数扫描次序而从二维系数值块中产生一维系数值向量;以及在扫描所述系数值之后对所述一维向量进行熵编码。
40.根据权利要求29所述的计算机可读媒体,其中所述指令致使所述装置:
基于所述系数扫描次序而从一维系数值向量中产生二维系数值块;以及在扫描所述系数值之前对所述一维向量进行熵解码。
41.根据权利要求29所述的计算机可读媒体,其中所述第一视频块及所述至少一个后续视频块属于第一译码单元,其中所述指令致使所述装置针对第二译码单元重新初始化所述扫描次序。
42.一种对视频数据进行译码的装置,所述装置包含:
用于使用系数扫描次序来扫描第一视频块的系数值的装置;
用于收集与所述系数值的至少一部分相关联的统计资料的装置;
用于根据所述所收集统计资料来调整所述系数扫描次序的装置;
其中所述系数扫描装置在至少一个后续视频块存在于所述第一视频块的译码单元中时使用所述经调整系数扫描次序来扫描所述至少一个后续视频块的系数值;以及
用于对所述系数值进行熵译码的装置。
43.根据权利要求42所述的装置,其中所述调整装置在固定间隔之后调适所述系数扫描次序以产生所述经调整系数扫描次序。
44.根据权利要求43所述的装置,其中所述调整装置在阈值数目的视频块已被译码之后调整所述系数扫描次序。
45.根据权利要求42所述的装置,其中所述统计资料收集装置维持对应于所述系数值的二维表示的部分内的每一位置的计数值,所述计数值追踪所述系数值的所述二维表示的所述部分内的所述位置中的每一者具有非零系数值的次数。
46.根据权利要求45所述的装置,其中所述调整装置调整所述系数扫描次序以产生经调整系数扫描次序,所述经调整系数扫描次序基于系数位置的计数值而以递减次序来扫描所述系数位置。
47.根据权利要求45所述的装置,其中所述调整装置在所述计数值中的一者达到阈值时根据所述所收集统计资料来更新所述系数扫描次序以产生所述经调整系数扫描次序。
48.根据权利要求42所述的装置,其进一步包含用于使所述所收集统计资料正规化的装置。
49.根据权利要求48所述的装置,其中
所述统计资料收集装置维持对应于所述系数值的所述二维表示的所述部分内的每一位置的计数值,所述计数值追踪所述系数值的所述二维表示的所述部分内的所述位置中的每一者具有非零系数值的次数;以及
所述正规化装置在所述计数值中的一者达到阈值计数值时使所述所收集统计资料正规化。
50.根据权利要求48所述的装置,其中所述正规化装置通过将所述计数值中的每一者减小一因数及将所述计数值复位为初始计数值的集合这两种操作中的一者来使所述所收集统计资料正规化。
51.根据权利要求42所述的装置,其中所述统计资料收集装置及所述调整装置针对每一预测模式而单独地收集统计资料并调整所述系数扫描次序。
52.根据权利要求42所述的装置,其中:
所述扫描装置基于所述系数扫描次序而从二维系数值块中产生一维系数值向量;
以及
所述熵译码装置在扫描所述系数值之后对所述一维向量进行熵编码。
53.根据权利要求42所述的装置,其中:
所述扫描装置基于所述系数扫描次序而从一维系数值向量中产生二维系数值块;以及
所述熵译码装置在扫描所述系数值之前对所述一维向量进行熵解码。
54.根据权利要求42所述的装置,其中所述第一视频块及所述至少一个后续视频块属于第一译码单元,且所述扫描装置针对第二译码单元重新初始化所述扫描次序。
CN200880103221A 2007-06-15 2008-06-13 用于视频译码的自适应系数扫描 Pending CN101803386A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US94447007P 2007-06-15 2007-06-15
US60/944,470 2007-06-15
US97976207P 2007-10-12 2007-10-12
US60/979,762 2007-10-12
US12/133,277 2008-06-04
US12/133,277 US8488668B2 (en) 2007-06-15 2008-06-04 Adaptive coefficient scanning for video coding
PCT/US2008/067020 WO2008157431A2 (en) 2007-06-15 2008-06-13 Adaptive coefficient scanning for video coding

Publications (1)

Publication Number Publication Date
CN101803386A true CN101803386A (zh) 2010-08-11

Family

ID=40132292

Family Applications (3)

Application Number Title Priority Date Filing Date
CN2008800198049A Active CN101682770B (zh) 2007-06-15 2008-06-12 视频块预测模式的自适应译码
CN2008800196594A Active CN101743751B (zh) 2007-06-15 2008-06-13 视帧内预测模式而定的残差块的自适应变换
CN200880103221A Pending CN101803386A (zh) 2007-06-15 2008-06-13 用于视频译码的自适应系数扫描

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN2008800198049A Active CN101682770B (zh) 2007-06-15 2008-06-12 视频块预测模式的自适应译码
CN2008800196594A Active CN101743751B (zh) 2007-06-15 2008-06-13 视帧内预测模式而定的残差块的自适应变换

Country Status (14)

Country Link
US (5) US8428133B2 (zh)
EP (3) EP2165543B1 (zh)
JP (4) JP5254324B2 (zh)
KR (3) KR101107867B1 (zh)
CN (3) CN101682770B (zh)
BR (3) BRPI0813351B1 (zh)
CA (3) CA2687260C (zh)
DK (1) DK2165543T3 (zh)
ES (1) ES2530796T3 (zh)
PL (1) PL2165543T3 (zh)
PT (1) PT2165543E (zh)
RU (4) RU2434360C2 (zh)
TW (3) TWI401959B (zh)
WO (3) WO2008157269A2 (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103190150A (zh) * 2010-09-07 2013-07-03 Sk电信有限公司 利用参考像素的特性省略预测模式信息的发送的帧内预测编码/解码设备和方法
CN103250413A (zh) * 2010-11-16 2013-08-14 高通股份有限公司 视频译码中的并行上下文计算
CN103299638A (zh) * 2010-12-30 2013-09-11 Sk电信有限公司 自适应扫描装置及其扫描方法
CN104010192A (zh) * 2011-01-14 2014-08-27 索尼公司 用于hevc的帧内色度模式信令的码字分配
CN104137542A (zh) * 2012-03-02 2014-11-05 高通股份有限公司 用于变换系数译码的上下文导出中的基于扫描的滑动窗
US9137531B2 (en) 2010-09-30 2015-09-15 Huawei Technologies Co., Ltd. Scanning method and device, and reverse scanning method and device
CN105027561A (zh) * 2012-09-26 2015-11-04 高通股份有限公司 用于上下文自适应、多层级有效性译码的上下文导出
CN105141949A (zh) * 2010-05-30 2015-12-09 Lg电子株式会社 增强的帧内预测模式信令
CN105847845A (zh) * 2010-07-19 2016-08-10 Sk电信有限公司 视频解码方法
CN107105241A (zh) * 2010-07-31 2017-08-29 M&K控股株式会社 图像编码装置
CN107257456A (zh) * 2011-10-19 2017-10-17 株式会社Kt 解码视频信号的方法
CN108337518A (zh) * 2010-12-03 2018-07-27 维洛媒体国际有限公司 在视频译码中单独地译码视频块的最后有效系数的位置
CN108632620A (zh) * 2011-03-08 2018-10-09 维洛媒体国际有限公司 用于视频译码的变换系数的译码
CN113453019A (zh) * 2016-05-03 2021-09-28 高通股份有限公司 解码视频数据的方法和装置

Families Citing this family (261)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NO326065B1 (no) * 2007-01-11 2008-09-08 Tandberg Telecom As Atte pixlers heltallstransform
US8045612B1 (en) 2007-01-19 2011-10-25 Marvell International Ltd. Fast inverse integer transform for video decoding
US8488672B2 (en) * 2007-04-17 2013-07-16 Qualcomm Incorporated Mode uniformity signaling for intra-coding
US8428133B2 (en) 2007-06-15 2013-04-23 Qualcomm Incorporated Adaptive coding of video block prediction mode
US8571104B2 (en) * 2007-06-15 2013-10-29 Qualcomm, Incorporated Adaptive coefficient scanning in video coding
CN103338364B (zh) 2007-06-29 2016-07-06 夏普株式会社 图像编码装置、图像编码方法、图像译码装置、图像译码方法
WO2009032255A2 (en) * 2007-09-04 2009-03-12 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
US8331454B2 (en) * 2007-11-12 2012-12-11 Cisco Technology, Inc. Integer transform function for video compression systems
KR20090097013A (ko) * 2008-03-10 2009-09-15 삼성전자주식회사 영상 부호화장치 및 영상 복호화장치
KR101375668B1 (ko) * 2008-03-17 2014-03-18 삼성전자주식회사 변환 계수의 부호화, 복호화 방법 및 장치
JP5166339B2 (ja) * 2008-03-28 2013-03-21 三星電子株式会社 画像のイントラ予測モード情報の符号化及び/又は復号化方法及び装置
US8542748B2 (en) 2008-03-28 2013-09-24 Sharp Laboratories Of America, Inc. Methods and systems for parallel video encoding and decoding
KR20090129926A (ko) * 2008-06-13 2009-12-17 삼성전자주식회사 영상 부호화 방법 및 그 장치, 영상 복호화 방법 및 그 장치
KR100963424B1 (ko) * 2008-07-23 2010-06-15 한국전자통신연구원 스케일러블 영상 복호화기 및 그 제어 방법
US8000546B2 (en) * 2008-08-01 2011-08-16 National Cheng Kung University Adaptive scan method for image/video coding
US8619856B2 (en) * 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
US8483285B2 (en) * 2008-10-03 2013-07-09 Qualcomm Incorporated Video coding using transforms bigger than 4×4 and 8×8
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8634456B2 (en) * 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
WO2010087808A1 (en) * 2009-01-27 2010-08-05 Thomson Licensing Methods and apparatus for transform selection in video encoding and decoding
KR101710619B1 (ko) * 2009-02-04 2017-02-28 삼성전자주식회사 단계적인 영상 부호화, 복호화 방법 및 장치
US20110286513A1 (en) 2009-02-05 2011-11-24 Yunfei Zheng Methods and apparatus for adaptive mode video encoding and decoding
CN102388610B (zh) * 2009-02-09 2015-03-04 三星电子株式会社 使用低复杂度频率变换的视频编码方法和设备以及视频解码方法和设备
CA2751803A1 (en) * 2009-02-13 2010-08-19 Research In Motion Limited Modified entropy encoding for images and videos
US8634466B2 (en) * 2009-03-17 2014-01-21 Freescale Semiconductor, Inc. Video decoder plus a discrete cosine transform unit
KR101379185B1 (ko) * 2009-04-14 2014-03-31 에스케이 텔레콤주식회사 예측 모드 선택 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
WO2010131903A2 (en) 2009-05-12 2010-11-18 Lg Electronics Inc. Method and apparatus for processing a video signal
US8451903B2 (en) * 2009-05-14 2013-05-28 Massachusetts Institute Of Technology Selecting transforms for compressing visual data
US8509309B2 (en) 2009-05-14 2013-08-13 Massachusetts Institute Of Technology Selecting transforms for compressing visual data
CN101895739B (zh) * 2009-05-20 2012-12-19 深圳市融创天下科技股份有限公司 基于块统计特性的编码方法
US8660261B2 (en) * 2009-06-04 2014-02-25 Mediatek Singapore Pte. Ltd. System and apparatus for integrated video/image encoding/decoding and encryption/decryption
US20100324913A1 (en) * 2009-06-18 2010-12-23 Jacek Piotr Stachurski Method and System for Block Adaptive Fractional-Bit Per Sample Encoding
US8873626B2 (en) * 2009-07-02 2014-10-28 Qualcomm Incorporated Template matching for video coding
CN101945270B (zh) * 2009-07-06 2013-06-19 联发科技(新加坡)私人有限公司 视频编码器、进行内部预测及进行视频数据压缩的方法
CN102474625A (zh) * 2009-07-23 2012-05-23 瑞典爱立信有限公司 用于图像的编码和解码的方法和设备
EP2457377A1 (en) * 2009-07-23 2012-05-30 Thomson Licensing Methods and apparatus for adaptive transform selection for video encoding and decoding
JP5700970B2 (ja) * 2009-07-30 2015-04-15 トムソン ライセンシングThomson Licensing 画像シーケンスを表す符号化データストリームの復号方法と画像シーケンスの符号化方法
KR101474756B1 (ko) 2009-08-13 2014-12-19 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
KR101712097B1 (ko) * 2009-08-19 2017-03-03 삼성전자 주식회사 유연한 직교 변환에 기초한 영상 부호화, 복호화 방법 및 장치
US9819952B2 (en) * 2009-10-05 2017-11-14 Thomson Licensing Dtv Methods and apparatus for embedded quantization parameter adjustment in video encoding and decoding
US8477845B2 (en) * 2009-10-16 2013-07-02 Futurewei Technologies, Inc. Predictive adaptive scan ordering for video coding
US20110090954A1 (en) * 2009-10-21 2011-04-21 Cohen Robert A Video Codes with Directional Transforms
CN102045560B (zh) * 2009-10-23 2013-08-07 华为技术有限公司 一种视频编解码方法及设备
KR20110045949A (ko) * 2009-10-28 2011-05-04 삼성전자주식회사 회전 변환을 이용한 영상 부호화, 복호화 방법 및 장치
AU2014268181B2 (en) * 2009-10-28 2016-02-18 Samsung Electronics Co., Ltd. Method and apparatus for encoding residual block, and method and apparatus for decoding residual block
KR101457894B1 (ko) * 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
TWI396448B (zh) * 2009-10-30 2013-05-11 Hon Hai Prec Ind Co Ltd 熵解碼裝置
KR20110065092A (ko) * 2009-12-09 2011-06-15 삼성전자주식회사 회전 변환을 이용한 영상 부호화, 복호화 방법 및 장치
KR20110065089A (ko) * 2009-12-09 2011-06-15 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR101441879B1 (ko) * 2009-12-09 2014-09-23 에스케이텔레콤 주식회사 영상 부호화 장치 및 방법, 및 거기에 이용되는 변환 부호화 장치 및 방법, 변환기저 생성장치 및 방법, 및 영상 복호화 장치 및 방법
KR20110068792A (ko) 2009-12-16 2011-06-22 한국전자통신연구원 적응적 영상 부호화 장치 및 방법
CN102118613B (zh) * 2009-12-31 2012-11-21 华为技术有限公司 视频解码和编码方法及装置
TWI389577B (zh) * 2009-12-31 2013-03-11 Via Tech Inc 視訊解碼解塊之裝置與方法
JP5432412B1 (ja) * 2010-01-07 2014-03-05 株式会社東芝 動画像符号化装置及び動画像復号化装置
JP5525650B2 (ja) * 2010-01-07 2014-06-18 株式会社東芝 動画像復号化装置、方法及びプログラム
JP5432359B2 (ja) * 2010-01-07 2014-03-05 株式会社東芝 動画像符号化装置、方法及びプログラム
JP5526277B2 (ja) * 2010-01-07 2014-06-18 株式会社東芝 動画像復号化装置、方法及びプログラム
WO2011083573A1 (ja) 2010-01-07 2011-07-14 株式会社 東芝 動画像符号化装置及び動画像復号化装置
JP5696248B2 (ja) * 2010-01-07 2015-04-08 株式会社東芝 動画像符号化装置及び動画像復号化装置
JP5597782B2 (ja) * 2010-01-07 2014-10-01 株式会社東芝 動画像符号化装置及び動画像復号化装置
JP5908619B2 (ja) * 2010-01-07 2016-04-26 株式会社東芝 動画像符号化装置及び動画像復号化装置
JP5323209B2 (ja) * 2010-01-07 2013-10-23 株式会社東芝 動画像符号化装置及び動画像復号化装置
US8885714B2 (en) * 2010-01-14 2014-11-11 Texas Instruments Incorporated Method and system for intracoding in video encoding
WO2011096662A2 (ko) * 2010-02-02 2011-08-11 (주)휴맥스 율-왜곡 최적화를 위한 영상 부호화/복호화 방법 및 이를 수행하는 장치
KR101495724B1 (ko) 2010-02-02 2015-02-25 삼성전자주식회사 계층적 데이터 단위의 스캔 순서에 기반한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
WO2011108240A1 (ja) * 2010-03-01 2011-09-09 パナソニック株式会社 画像符号化方法および画像復号方法
WO2011112239A1 (en) 2010-03-10 2011-09-15 Thomson Licensing Methods and apparatus for constrained transforms for video coding and decoding having transform selection
US8644375B2 (en) 2010-04-09 2014-02-04 Sharp Laboratories Of America, Inc. Methods and systems for intra prediction
US20110249743A1 (en) * 2010-04-09 2011-10-13 Jie Zhao Super-block for high performance video coding
US20110249741A1 (en) * 2010-04-09 2011-10-13 Jie Zhao Methods and Systems for Intra Prediction
CN102215390B (zh) * 2010-04-09 2014-07-09 华为技术有限公司 图像编解码处理方法和装置
US8619857B2 (en) 2010-04-09 2013-12-31 Sharp Laboratories Of America, Inc. Methods and systems for intra prediction
CN102215388B (zh) * 2010-04-09 2013-11-06 华为技术有限公司 一种简化方向性变换的方法、装置和系统
JP5914962B2 (ja) * 2010-04-09 2016-05-11 ソニー株式会社 画像処理装置および方法、プログラム、並びに、記録媒体
CN102215391B (zh) * 2010-04-09 2013-08-28 华为技术有限公司 视频数据编码、解码方法及装置、变换处理方法及装置
US8705619B2 (en) * 2010-04-09 2014-04-22 Sony Corporation Directional discrete wavelet transform (DDWT) for video compression applications
WO2011127963A1 (en) * 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sample region merging
PL3691267T3 (pl) 2010-04-13 2022-07-11 Ge Video Compression, Llc Kodowanie map istotności i bloków współczynników transformacji
CN106231335B (zh) 2010-04-13 2019-07-02 Ge视频压缩有限责任公司 解码器、解码方法、编码器以及编码方法
TWI678916B (zh) * 2010-04-13 2019-12-01 美商Ge影像壓縮有限公司 樣本區域合倂技術
KR102159896B1 (ko) 2010-04-13 2020-09-25 지이 비디오 컴프레션, 엘엘씨 샘플 배열 멀티트리 세부분할에서 계승
CN106067985B (zh) 2010-04-13 2019-06-28 Ge视频压缩有限责任公司 跨平面预测
KR101791078B1 (ko) * 2010-04-16 2017-10-30 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법
US8798131B1 (en) 2010-05-18 2014-08-05 Google Inc. Apparatus and method for encoding video using assumed values with intra-prediction
CN102934440B (zh) 2010-05-26 2016-04-13 Lg电子株式会社 用于处理视频信号的方法和设备
CN102281435B (zh) * 2010-06-11 2013-10-02 华为技术有限公司 编码方法、解码方法、编码装置、解码装置及编解码系统
US9215470B2 (en) * 2010-07-09 2015-12-15 Qualcomm Incorporated Signaling selected directional transform for video coding
US8396305B2 (en) 2010-07-09 2013-03-12 Sony Corporation Image compression utilizing ring-tree entropy coding and directional transforms
CN101895756B (zh) * 2010-07-15 2012-10-31 北京大学 视频图像块的编码、解码、重构方法及系统
EP2595385A4 (en) 2010-07-15 2014-06-25 Toshiba Inc Kk IMAGE ENCODING AND DECODING METHOD
US20130177077A1 (en) * 2010-07-15 2013-07-11 Agency For Science, Technology And Research Method, Apparatus and Computer Program Product for Encoding Video Data
JP2012023632A (ja) * 2010-07-15 2012-02-02 Sony Corp 符号化装置および符号化方法、並びに、復号装置および復号方法
US8837577B2 (en) * 2010-07-15 2014-09-16 Sharp Laboratories Of America, Inc. Method of parallel video coding based upon prediction type
CN101895757A (zh) * 2010-07-15 2010-11-24 北京大学 预测残差块的重排序、逆重排序方法及系统
US8855188B2 (en) * 2010-07-15 2014-10-07 Sharp Laboratories Of America, Inc. Method of parallel video coding based on mapping
JP6342116B2 (ja) 2010-07-15 2018-06-13 シャープ株式会社 イントラ予測モード推定装置
US8873617B2 (en) * 2010-07-15 2014-10-28 Sharp Laboratories Of America, Inc. Method of parallel video coding based on same sized blocks
JP2012028858A (ja) * 2010-07-20 2012-02-09 Sony Corp 画像処理装置及び画像処理方法
WO2012014461A1 (ja) * 2010-07-28 2012-02-02 パナソニック株式会社 符号化方法および復号化方法
US9716886B2 (en) * 2010-08-17 2017-07-25 M&K Holdings Inc. Method for restoring an intra prediction mode
US11284072B2 (en) 2010-08-17 2022-03-22 M&K Holdings Inc. Apparatus for decoding an image
KR101677480B1 (ko) * 2010-09-07 2016-11-21 에스케이 텔레콤주식회사 효과적인 화면내 예측모드 집합 선택을 이용한 영상 부호화/복호화 방법 및 장치
US9378185B2 (en) 2010-09-30 2016-06-28 Texas Instruments Incorporated Transform and quantization architecture for video coding and decoding
US9154801B2 (en) * 2010-09-30 2015-10-06 Texas Instruments Incorporated Method and apparatus for diagonal scan and simplified coding of transform coefficients
US9313514B2 (en) 2010-10-01 2016-04-12 Sharp Kabushiki Kaisha Methods and systems for entropy coder initialization
US8923395B2 (en) * 2010-10-01 2014-12-30 Qualcomm Incorporated Video coding using intra-prediction
EP2606647A1 (en) * 2010-10-05 2013-06-26 General instrument Corporation Method and apparatus for feature based video coding
US9532059B2 (en) 2010-10-05 2016-12-27 Google Technology Holdings LLC Method and apparatus for spatial scalability for video coding
US9641846B2 (en) 2010-10-22 2017-05-02 Qualcomm Incorporated Adaptive scanning of transform coefficients for video coding
US8711940B2 (en) * 2010-11-29 2014-04-29 Mediatek Inc. Method and apparatus of motion vector prediction with extended motion vector predictor
US9042440B2 (en) 2010-12-03 2015-05-26 Qualcomm Incorporated Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding
US9288496B2 (en) * 2010-12-03 2016-03-15 Qualcomm Incorporated Video coding using function-based scan order for transform coefficients
JP5711266B2 (ja) * 2010-12-17 2015-04-30 三菱電機株式会社 動画像符号化装置及び動画像符号化方法
KR20120070479A (ko) * 2010-12-21 2012-06-29 한국전자통신연구원 화면 내 예측 방향 정보 부호화/복호화 방법 및 그 장치
US20120163472A1 (en) * 2010-12-22 2012-06-28 Qualcomm Incorporated Efficiently coding scanning order information for a video block in video coding
US20120163456A1 (en) * 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
US9049444B2 (en) * 2010-12-22 2015-06-02 Qualcomm Incorporated Mode dependent scanning of coefficients of a block of video data
US10992958B2 (en) * 2010-12-29 2021-04-27 Qualcomm Incorporated Video coding using mapped transforms and scanning modes
US9490839B2 (en) 2011-01-03 2016-11-08 Qualcomm Incorporated Variable length coding of video block coefficients
WO2012092661A1 (en) * 2011-01-04 2012-07-12 Research In Motion Limited Coding of residual data in predictive compression
US8768080B2 (en) 2011-01-04 2014-07-01 Blackberry Limited Coding of residual data in predictive compression
CN104811706B (zh) * 2011-01-06 2017-10-27 三星电子株式会社 视频的编码方法和装置及视频的解码方法和装置
EP2661892B1 (en) 2011-01-07 2022-05-18 Nokia Technologies Oy Motion prediction in video coding
FI4120686T3 (fi) * 2011-01-07 2023-09-12 Ntt Docomo Inc Liikevektorin ennustava koodausmenetelmä, ennustava koodauslaite ja ennustava koodausohjelma sekä liikevektorin ennustava dekoodausmenetelmä, ennustava dekoodauslaite ja ennustava dekoodausohjelma
US9071851B2 (en) * 2011-01-10 2015-06-30 Qualcomm Incorporated Adaptively performing smoothing operations
JP5850214B2 (ja) * 2011-01-11 2016-02-03 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
JP5781313B2 (ja) * 2011-01-12 2015-09-16 株式会社Nttドコモ 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム
US9210442B2 (en) 2011-01-12 2015-12-08 Google Technology Holdings LLC Efficient transform unit representation
AU2015202844B2 (en) * 2011-01-12 2016-03-17 Ntt Docomo, Inc. Image predict coding method, image predict coding device, image predict coding program, image predict decoding method, image predict decoding device, and image predict decoding program
US8811759B2 (en) * 2011-01-13 2014-08-19 Sony Corporation System and method for effectively performing an intra prediction procedure
US9232227B2 (en) 2011-01-14 2016-01-05 Sony Corporation Codeword space reduction for intra chroma mode signaling for HEVC
CN102595129B (zh) * 2011-01-14 2016-01-13 索尼公司 用于hevc的帧内色度模式信令的码字分配
US9497466B2 (en) 2011-01-17 2016-11-15 Mediatek Inc. Buffering apparatus for buffering multi-partition video/image bitstream and related method thereof
US8990435B2 (en) 2011-01-17 2015-03-24 Mediatek Inc. Method and apparatus for accessing data of multi-tile encoded picture stored in buffering apparatus
US9380319B2 (en) * 2011-02-04 2016-06-28 Google Technology Holdings LLC Implicit transform unit representation
US8442338B2 (en) * 2011-02-28 2013-05-14 Sony Corporation Visually optimized quantization
FR2972588A1 (fr) 2011-03-07 2012-09-14 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
US9106913B2 (en) 2011-03-08 2015-08-11 Qualcomm Incorporated Coding of transform coefficients for video coding
CN102685503B (zh) 2011-03-10 2014-06-25 华为技术有限公司 变换系数的编码方法、变换系数的解码方法,和装置
WO2012138032A1 (ko) * 2011-04-07 2012-10-11 엘지전자 주식회사 영상 정보 부호화 방법 및 복호화 방법
CN102238387B (zh) * 2011-05-25 2017-07-18 深圳市云宙多媒体技术有限公司 一种视频熵编码、熵解码方法、装置
BR122020013891B1 (pt) * 2011-06-17 2022-09-13 JVC Kenwood Corporation Dispositivo e método para decodificação de imagem, dispositivo e método para transmissão, e dispositivo e método para recepção
CN102843560B (zh) * 2011-06-21 2015-01-21 华为技术有限公司 图像变换处理方法、设备和系统
FR2977111A1 (fr) 2011-06-24 2012-12-28 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
US9167253B2 (en) 2011-06-28 2015-10-20 Qualcomm Incorporated Derivation of the position in scan order of the last significant transform coefficient in video coding
US9445093B2 (en) * 2011-06-29 2016-09-13 Qualcomm Incorporated Multiple zone scanning order for video coding
WO2013003791A1 (en) * 2011-06-29 2013-01-03 General Instrument Corporation Methods and system for using a scan coding pattern during inter coding
US9516316B2 (en) 2011-06-29 2016-12-06 Qualcomm Incorporated VLC coefficient coding for large chroma block
US9392301B2 (en) 2011-07-01 2016-07-12 Qualcomm Incorporated Context adaptive entropy coding for non-square blocks in video coding
US8929455B2 (en) * 2011-07-01 2015-01-06 Mitsubishi Electric Research Laboratories, Inc. Method for selecting transform types from mapping table for prediction modes
US9338456B2 (en) 2011-07-11 2016-05-10 Qualcomm Incorporated Coding syntax elements using VLC codewords
US9756360B2 (en) 2011-07-19 2017-09-05 Qualcomm Incorporated Coefficient scanning in video coding
US9699456B2 (en) 2011-07-20 2017-07-04 Qualcomm Incorporated Buffering prediction data in video coding
CN102447898B (zh) * 2011-08-26 2013-09-25 西安电子科技大学 用fpga实现klt变换的方法
MX343471B (es) * 2011-08-29 2016-11-07 Ibex Pt Holdings Co Ltd Metodo para generar un bloque de prediccion en modo de prediccion de vector de movimiento avanzada (amvp).
GB2494468B (en) 2011-09-12 2014-01-15 Canon Kk Method and device for encoding or decoding information representing prediction modes
US9699452B2 (en) 2011-09-15 2017-07-04 Vid Scale, Inc Systems and methods for spatial prediction
IN2014DN03096A (zh) * 2011-10-17 2015-05-15 Kt Corp
CN107483930B (zh) 2011-10-17 2020-03-06 株式会社Kt 利用解码装置解码视频信号的方法
KR101920601B1 (ko) * 2011-10-17 2018-11-20 가부시끼가이샤 도시바 암호화 장치 및 암호화 방법
GB2509670B (en) 2011-10-18 2018-12-05 Kt Corp Method for encoding image, method for decoding image, image encoder, and image decoder
US9538177B2 (en) 2011-10-31 2017-01-03 Mediatek Inc. Apparatus and method for buffering context arrays referenced for performing entropy decoding upon multi-tile encoded picture and related entropy decoder
TR201811137T4 (tr) 2011-10-31 2018-08-27 Samsung Electronics Co Ltd Dönüştürme katsayısı seviyesi için entropi kod çözme için bir bağlam modelinin belirlenmesine yönelik usul.
AU2015201781B2 (en) * 2011-10-31 2017-01-19 Samsung Electronics Co., Ltd. Method and apparatus for determining a context model for transform coefficient level entropy encoding and decoding
KR20130049523A (ko) * 2011-11-04 2013-05-14 오수미 인트라 예측 블록 생성 장치
KR20130049522A (ko) * 2011-11-04 2013-05-14 오수미 인트라 예측 블록 생성 방법
JP2013102297A (ja) 2011-11-07 2013-05-23 Canon Inc 画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム
FR2982447A1 (fr) * 2011-11-07 2013-05-10 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
JP5871628B2 (ja) * 2011-11-07 2016-03-01 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
KR20130050405A (ko) * 2011-11-07 2013-05-16 오수미 인터 모드에서의 시간 후보자 결정방법
TWI523497B (zh) * 2011-11-10 2016-02-21 Sony Corp Image processing apparatus and method
WO2013076888A1 (ja) * 2011-11-21 2013-05-30 パナソニック株式会社 画像処理装置および画像処理方法
AU2012355212B2 (en) * 2011-12-21 2016-07-21 Sun Patent Trust Image coding method, image decoding method, image coding apparatus and image decoding apparatus
US8660374B1 (en) 2011-12-23 2014-02-25 Massachusetts Institute Of Technology Selecting transform paths for compressing visual data
AU2012200319B2 (en) * 2012-01-19 2015-11-26 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map for residual coefficients of a transform unit
CN103220506B (zh) * 2012-01-19 2015-11-25 华为技术有限公司 一种编解码方法和设备
AU2013211004B2 (en) 2012-01-20 2016-03-17 Ge Video Compression, Llc Transform coefficient coding
AU2012200345B2 (en) 2012-01-20 2014-05-01 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map residual coefficients of a transform unit
US9451277B2 (en) * 2012-02-08 2016-09-20 Qualcomm Incorporated Restriction of prediction units in B slices to uni-directional inter prediction
US11039138B1 (en) 2012-03-08 2021-06-15 Google Llc Adaptive coding of prediction modes using probability distributions
RU2639266C9 (ru) 2012-03-26 2018-05-14 ДжейВиСи КЕНВУД КОРПОРЕЙШН Устройство декодирования изображения, способ декодирования изображения и долговременный носитель записи
WO2013157791A1 (ko) * 2012-04-15 2013-10-24 삼성전자 주식회사 인터 예측의 참조영상을 결정하는 방법과 그 장치
GB2501535A (en) * 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
US20130301713A1 (en) * 2012-05-14 2013-11-14 Qualcomm Incorporated Systems and methods for intra prediction video coding
PL2869557T3 (pl) 2012-06-29 2024-02-19 Electronics And Telecommunications Research Institute Sposób i urządzenie do kodowania/dekodowania obrazów
JP5885604B2 (ja) * 2012-07-06 2016-03-15 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
US9344742B2 (en) * 2012-08-10 2016-05-17 Google Inc. Transform-domain intra prediction
US9319684B2 (en) * 2012-08-21 2016-04-19 Qualcomm Incorporated Alternative transform in scalable video coding
US9219915B1 (en) 2013-01-17 2015-12-22 Google Inc. Selection of transform size in video coding
US9967559B1 (en) 2013-02-11 2018-05-08 Google Llc Motion vector dependent spatial transformation in video coding
US9544597B1 (en) * 2013-02-11 2017-01-10 Google Inc. Hybrid transform in video encoding and decoding
WO2014166553A1 (en) * 2013-04-09 2014-10-16 Siemens Aktiengesellschaft A method for coding a sequence of digital images
JP5537695B2 (ja) * 2013-04-10 2014-07-02 株式会社東芝 画像復号化装置、方法およびプログラム
JP5535361B2 (ja) * 2013-04-10 2014-07-02 株式会社東芝 画像符号化装置、方法およびプログラム
US9674530B1 (en) 2013-04-30 2017-06-06 Google Inc. Hybrid transforms in video coding
US9967594B2 (en) * 2013-06-28 2018-05-08 Mozilla Corporation Probability modeling of intra prediction modes
EP3025494A4 (en) 2013-07-24 2017-03-08 Microsoft Technology Licensing, LLC Scanning orders for non-transform coding
CN103391443A (zh) * 2013-08-05 2013-11-13 深圳市云宙多媒体技术有限公司 一种大尺寸块的亮度变换域帧内预测编解码方法及系统
CN103402094A (zh) * 2013-08-05 2013-11-20 深圳市云宙多媒体技术有限公司 一种变换域色度帧内预测编解码方法及系统
JP2015115614A (ja) * 2013-12-06 2015-06-22 日本電信電話株式会社 変換処理方法、逆変換処理方法、変換処理装置、逆変換処理装置、変換処理プログラム及び逆変換処理プログラム
US10362336B2 (en) 2014-03-25 2019-07-23 Qualcomm Incorporated Palette predictor signaling with run length code for video coding
JP5622954B2 (ja) * 2014-04-17 2014-11-12 株式会社東芝 画像復号化装置、方法およびプログラム
CN103974076B (zh) * 2014-05-19 2018-01-12 华为技术有限公司 图像编解码方法和设备、系统
JP5925855B2 (ja) * 2014-09-17 2016-05-25 株式会社東芝 画像復号化装置、方法およびプログラム、第1のプログラムおよび第2のプログラム、サーバシステムならびにダウンロード制御方法
US9565451B1 (en) 2014-10-31 2017-02-07 Google Inc. Prediction dependent transform coding
JP5775959B2 (ja) * 2014-11-07 2015-09-09 株式会社Nttドコモ 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US20180027236A1 (en) * 2015-02-17 2018-01-25 Lg Electronics Inc. Method and device for encoding/decoding video signal by using adaptive scan order
JP6042478B2 (ja) * 2015-04-01 2016-12-14 株式会社東芝 画像復号化装置
US20180115787A1 (en) * 2015-04-12 2018-04-26 Lg Electronics Inc. Method for encoding and decoding video signal, and apparatus therefor
JP6038243B2 (ja) * 2015-07-15 2016-12-07 株式会社Nttドコモ 画像予測復号方法及び画像予測復号装置
US9769499B2 (en) 2015-08-11 2017-09-19 Google Inc. Super-transform video coding
US9699461B2 (en) * 2015-08-14 2017-07-04 Blackberry Limited Scaling in perceptual image and video coding
US10277905B2 (en) 2015-09-14 2019-04-30 Google Llc Transform selection for non-baseband signal coding
US10681379B2 (en) 2015-09-29 2020-06-09 Qualcomm Incorporated Non-separable secondary transform for video coding with reorganizing
US9807423B1 (en) 2015-11-24 2017-10-31 Google Inc. Hybrid transform scheme for video coding
EP3363199B1 (en) * 2015-11-27 2021-05-19 MediaTek Inc. Method and apparatus of entropy coding and context modelling for video and image coding
CN107046645B9 (zh) * 2016-02-06 2020-08-14 华为技术有限公司 图像编解码方法及装置
KR102210230B1 (ko) 2016-02-12 2021-01-29 후아웨이 테크놀러지 컴퍼니 리미티드 스캔 순서 선택을 위한 방법 및 장치
JP6724152B2 (ja) 2016-02-12 2020-07-15 華為技術有限公司Huawei Technologies Co.,Ltd. 走査順序選択のための方法及び装置
US10623774B2 (en) 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
WO2017195917A1 (ko) * 2016-05-12 2017-11-16 엘지전자 주식회사 비디오 코딩 시스템에서 인트라 예측 방법 및 장치
KR102331933B1 (ko) 2016-05-12 2021-11-29 엘지전자 주식회사 계수 유도 복원을 이용하여 비디오 신호를 처리하는 방법 및 장치
EP3454559A4 (en) * 2016-05-13 2019-03-13 Sony Corporation IMAGE PROCESSING DEVICE AND METHOD
CN109479138B (zh) * 2016-07-13 2023-11-03 韩国电子通信研究院 图像编码/解码方法和装置
WO2018026028A1 (ko) * 2016-08-02 2018-02-08 엘지전자(주) 서브 계수 그룹을 이용하여 레지듀얼 신호를 인코딩, 디코딩하는 방법 및 장치
JP6310034B2 (ja) * 2016-10-20 2018-04-11 株式会社東芝 復号装置、復号方法および復号プログラム
JP6310992B2 (ja) * 2016-11-01 2018-04-11 株式会社Nttドコモ 画像予測復号方法及び画像予測復号装置
CN106507111B (zh) * 2016-11-17 2019-11-15 上海兆芯集成电路有限公司 使用残差补偿的视频编码方法以及使用该方法的装置
US10694202B2 (en) * 2016-12-01 2020-06-23 Qualcomm Incorporated Indication of bilateral filter usage in video coding
KR102257829B1 (ko) 2017-04-13 2021-05-28 엘지전자 주식회사 영상의 부호화/복호화 방법 및 이를 위한 장치
CN108933941A (zh) * 2017-05-26 2018-12-04 富士通株式会社 图像编码方法和装置以及图像解码方法和装置
US10356411B2 (en) 2017-05-30 2019-07-16 Google Llc Adaptation of scan order entropy coding
US10326994B2 (en) * 2017-08-15 2019-06-18 Google Llc Modifying a scan order to limit scan distance
KR102535361B1 (ko) 2017-10-19 2023-05-24 삼성전자주식회사 머신 러닝을 사용하는 영상 부호화기 및 그것의 데이터 처리 방법
EP3484148A1 (en) 2017-11-09 2019-05-15 Thomson Licensing Automated scanning order for sub-divided blocks
US11343538B2 (en) * 2017-11-24 2022-05-24 Sony Corporation Image processing apparatus and method
US10382758B2 (en) 2017-12-15 2019-08-13 Google Llc Transform block-level scan order selection for video coding
CN115776572A (zh) 2017-12-21 2023-03-10 Lg电子株式会社 图像解码和编码方法、存储比特流的介质和数据发送方法
CN108259897B (zh) * 2018-01-23 2021-08-27 北京易智能科技有限公司 一种基于深度学习的帧内编码优化方法
KR102534719B1 (ko) 2018-02-28 2023-05-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 합성된 예측 및 제한된 병합
JP6486528B2 (ja) * 2018-03-19 2019-03-20 株式会社Nttドコモ 画像予測復号方法及び画像予測復号装置
WO2019190284A1 (ko) * 2018-03-29 2019-10-03 엘지전자 주식회사 비디오 압축을 위한 변환 커널의 저복잡도 연산을 수행하는 방법 및 장치
WO2019245340A1 (ko) * 2018-06-21 2019-12-26 주식회사 케이티 비디오 신호 처리 방법 및 장치
KR20230008896A (ko) 2018-07-16 2023-01-16 후아웨이 테크놀러지 컴퍼니 리미티드 비디오 인코더, 비디오 디코더 및 대응하는 인코딩 및 디코딩 방법
BR112021003829A2 (pt) * 2018-09-02 2021-05-18 Lg Electronics Inc. método e aparelho para processamento de sinal de imagem
CN114885163B (zh) * 2018-09-02 2024-04-23 Lg电子株式会社 用于对图像信号编码和解码的方法及计算机可读记录介质
CN109345177B (zh) * 2018-10-20 2022-03-18 广东三胜电器股份有限公司 一种基于云视频信息处理的冷链食品物流可视化方法
WO2020087324A1 (zh) * 2018-10-31 2020-05-07 富士通株式会社 图像编码方法、装置以及电子设备
US11012711B2 (en) 2018-11-29 2021-05-18 Tencent America LLC Adaptive most probable modes for multiple reference line intra prediction
US11102513B2 (en) 2018-12-06 2021-08-24 Tencent America LLC One-level transform split and adaptive sub-block transform
US11323748B2 (en) 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding
US11895289B2 (en) 2019-01-02 2024-02-06 Digitalinsights Inc. Image decoding method, image encoding method, image decoding device, image encoding device, and computer-readable recording medium
KR20210105996A (ko) 2019-02-19 2021-08-27 엘지전자 주식회사 영상 코딩 시스템에서 레지듀얼 정보를 사용하는 영상 디코딩 방법 및 그 장치
US11122297B2 (en) 2019-05-03 2021-09-14 Google Llc Using border-aligned block functions for image compression
JP2022538069A (ja) 2019-06-19 2022-08-31 エルジー エレクトロニクス インコーポレイティド 現在ブロックに対して最終的に予測モードを選択できない場合、インター予測を行う映像デコーディング方法及びその装置
CN110267041B (zh) * 2019-06-28 2021-11-09 Oppo广东移动通信有限公司 图像编码方法、装置、电子设备和计算机可读存储介质
US11800110B2 (en) * 2021-04-20 2023-10-24 Tencent America LLC Adaptive scanning with multiple transform selection
US11838498B2 (en) * 2021-06-28 2023-12-05 Tencent America LLC Harmonized design for intra bi-prediction and multiple reference line selection
CN113873252B (zh) * 2021-09-27 2023-12-19 上海哔哩哔哩科技有限公司 图像处理方法及装置、电子设备和存储介质
CN116600123B (zh) * 2023-07-17 2023-11-07 北京中星微人工智能芯片技术有限公司 视频编码方法及装置、视频解码方法及装置、电子设备

Family Cites Families (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BE1000643A5 (fr) * 1987-06-05 1989-02-28 Belge Etat Procede de codage de signaux d'image.
JPH01155678A (ja) 1987-12-11 1989-06-19 Matsushita Electric Ind Co Ltd 半導体発光装置
US5136371A (en) 1990-03-15 1992-08-04 Thomson Consumer Electronics, Inc. Digital image coding using random scanning
EP0586225B1 (en) * 1992-08-31 1998-12-23 Victor Company Of Japan, Ltd. Orthogonal transform coding apparatus and decoding apparatus
TW224553B (en) 1993-03-01 1994-06-01 Sony Co Ltd Method and apparatus for inverse discrete consine transform and coding/decoding of moving picture
TW297202B (zh) 1993-10-13 1997-02-01 Rca Thomson Licensing Corp
KR0183688B1 (ko) 1994-01-12 1999-05-01 김광호 영상부호화방법 및 장치
KR0178198B1 (ko) 1995-03-28 1999-05-01 배순훈 영상 신호 부호화 장치
US5721822A (en) 1995-07-21 1998-02-24 Intel Corporation Run-length encoding/decoding video signals using scan patterns explicitly encoded into bitstreams
US5790706A (en) 1996-07-03 1998-08-04 Motorola, Inc. Method and apparatus for scanning of transform coefficients
JP3208101B2 (ja) * 1996-11-07 2001-09-10 松下電器産業株式会社 画像符号化方法および画像符号化装置並びに画像符号化プログラムを記録した記録媒体
JP2002232887A (ja) 1996-11-07 2002-08-16 Matsushita Electric Ind Co Ltd 画像符号化方法および画像符号化装置並びに画像復号化方法および画像復号化装置
EP1689191A3 (en) 1996-11-07 2008-12-10 Panasonic Corporation Image encoder and image decoder
JPH10271505A (ja) 1997-03-25 1998-10-09 Oki Electric Ind Co Ltd 信号処理装置、符号化回路および復号回路
US5995055A (en) 1997-06-30 1999-11-30 Raytheon Company Planar antenna radiating structure having quasi-scan, frequency-independent driving-point impedance
CN100459715C (zh) 1997-07-31 2009-02-04 日本胜利株式会社 数字视频信号块间预测编码/解码装置及编码/解码方法
JP2900998B2 (ja) * 1997-07-31 1999-06-02 日本ビクター株式会社 ブロック間内挿予測符号化装置、復号化装置、符号化方法及び復号化方法
JP4226172B2 (ja) * 1998-11-24 2009-02-18 株式会社ハイニックスセミコンダクター 適応的変換方法を用いる映像圧縮符号化装置および復号化装置ならびにその方法
CN1402852A (zh) 1999-10-22 2003-03-12 动感天空公司 面向目标的视频系统
US6724818B1 (en) * 2000-07-17 2004-04-20 Telefonaktiebolaget Lm Ericsson (Publ) Alternative block orders for better prediction
CN1142683C (zh) 2000-10-13 2004-03-17 清华大学 无转置行列分离二维离散余弦正反变换电路及其方法
JP2002135126A (ja) 2000-10-26 2002-05-10 Seiko Epson Corp 半導体装置及びこれを用いた電子機器
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
KR100468844B1 (ko) * 2002-01-07 2005-01-29 삼성전자주식회사 정지영상 및 동영상을 부호화/복호화하기 위한변환계수들의 최적주사방법
JP4447197B2 (ja) * 2002-01-07 2010-04-07 三菱電機株式会社 動画像符号化装置および動画像復号装置
AU2003201069C1 (en) * 2002-01-14 2008-11-06 Nokia Technologies Oy Coding dynamic filters
RU2354073C2 (ru) 2002-01-22 2009-04-27 Нокиа Корпорейшн Кодирование коэффициентов преобразования в кодерах и/или декодерах изображения и видеоданных
US6757576B2 (en) 2002-02-05 2004-06-29 Gcc, Inc. System and method for drawing and manufacturing bent pipes
KR100508798B1 (ko) 2002-04-09 2005-08-19 엘지전자 주식회사 쌍방향 예측 블록 예측 방법
US7170937B2 (en) * 2002-05-01 2007-01-30 Texas Instruments Incorporated Complexity-scalable intra-frame prediction technique
WO2003101117A1 (en) * 2002-05-28 2003-12-04 Sharp Kabushiki Kaisha Methods and systems for image intra-prediction mode estimation, communication, and organization
RU2314656C2 (ru) 2002-06-11 2008-01-10 Нокиа Корпорейшн Внутреннее кодирование, основанное на пространственном прогнозировании
CN101039427B (zh) * 2002-07-15 2010-06-16 株式会社日立制作所 动态图像的解码方法
US6795584B2 (en) 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
US7463782B2 (en) 2002-11-05 2008-12-09 Canon Kabushiki Kaisha Data encoding with an amplitude model and path between the data and corresponding decoding
FI116710B (fi) * 2002-12-20 2006-01-31 Oplayo Oy Kuvien koodausmenetelmä ja -järjestely
KR100750110B1 (ko) * 2003-04-22 2007-08-17 삼성전자주식회사 4×4인트라 휘도 예측 모드 결정방법 및 장치
JP4617644B2 (ja) * 2003-07-18 2011-01-26 ソニー株式会社 符号化装置及び方法
JP3756897B2 (ja) 2003-07-30 2006-03-15 株式会社東芝 動画像符号化装置及び動画像符号化方法
US7289562B2 (en) * 2003-08-01 2007-10-30 Polycom, Inc. Adaptive filter to improve H-264 video quality
US20050036549A1 (en) * 2003-08-12 2005-02-17 Yong He Method and apparatus for selection of scanning mode in dual pass encoding
KR101050828B1 (ko) * 2003-08-26 2011-07-21 톰슨 라이센싱 하이브리드 인트라-인터 코딩된 블록을 디코딩하기 위한 방법 및 장치
US7688894B2 (en) * 2003-09-07 2010-03-30 Microsoft Corporation Scan patterns for interlaced video content
JP4127818B2 (ja) * 2003-12-24 2008-07-30 株式会社東芝 動画像符号化方法及びその装置
KR20050068207A (ko) * 2003-12-29 2005-07-05 엘지.필립스 엘시디 주식회사 2-블록 레이저 마스크 및 이를 이용한 결정화방법
EP1558039A1 (en) 2004-01-21 2005-07-27 Deutsche Thomson-Brandt Gmbh Method and apparatus for generating/evaluating prediction information in picture signal encoding/decoding
JP4542447B2 (ja) 2005-02-18 2010-09-15 株式会社日立製作所 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法
US8731054B2 (en) * 2004-05-04 2014-05-20 Qualcomm Incorporated Method and apparatus for weighted prediction in predictive frames
US8369402B2 (en) * 2004-06-17 2013-02-05 Canon Kabushiki Kaisha Apparatus and method for prediction modes selection based on image formation
JP2006005659A (ja) * 2004-06-17 2006-01-05 Canon Inc 画像符号化装置及びその方法
US8311119B2 (en) 2004-12-31 2012-11-13 Microsoft Corporation Adaptive coefficient scan order
US7706443B2 (en) * 2005-03-11 2010-04-27 General Instrument Corporation Method, article of manufacture, and apparatus for high quality, fast intra coding usable for creating digital video content
WO2006109141A1 (en) * 2005-04-12 2006-10-19 Nokia Corporation Method and system for motion compensated fine granularity scalable video coding with drift control
EP1768415A1 (en) 2005-09-27 2007-03-28 Matsushita Electric Industrial Co., Ltd. Adaptive scan order of DCT coefficients and its signaling
KR100995226B1 (ko) 2005-07-22 2010-11-17 미쓰비시덴키 가부시키가이샤 화상 부호화 장치, 화상 복호 장치, 화상 부호화 방법, 화상 복호 방법, 화상 부호화 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체, 화상 복호 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
US7933337B2 (en) * 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
JP2007053561A (ja) 2005-08-17 2007-03-01 Matsushita Electric Ind Co Ltd 画像符号化装置および画像符号化方法
KR100868476B1 (ko) 2005-10-21 2008-11-12 한국전자통신연구원 적응적 스캐닝을 이용한 동영상 부호화/복호화 장치 및 그방법
WO2007063472A2 (en) 2005-11-30 2007-06-07 Koninklijke Philips Electronics N.V. Encoding method and apparatus applying coefficient reordering
US7529484B2 (en) 2005-12-14 2009-05-05 Nec Laboratories America, Inc. Triplexer transceiver using parallel signal detection
CN1801940A (zh) 2005-12-15 2006-07-12 清华大学 整型变换电路和整型变换方法
US8000539B2 (en) * 2005-12-21 2011-08-16 Ntt Docomo, Inc. Geometrical image representation and compression
US20080008246A1 (en) * 2006-07-05 2008-01-10 Debargha Mukherjee Optimizing video coding
US8571104B2 (en) * 2007-06-15 2013-10-29 Qualcomm, Incorporated Adaptive coefficient scanning in video coding
US8428133B2 (en) 2007-06-15 2013-04-23 Qualcomm Incorporated Adaptive coding of video block prediction mode
WO2010123862A1 (en) * 2009-04-20 2010-10-28 Dolby Laboratories Licensing Corporation Adaptive interpolation filters for multi-layered video delivery
US9641846B2 (en) * 2010-10-22 2017-05-02 Qualcomm Incorporated Adaptive scanning of transform coefficients for video coding

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10742997B2 (en) 2010-05-30 2020-08-11 Lg Electronics Inc. Enhanced intra prediction mode signaling
US11800117B2 (en) 2010-05-30 2023-10-24 Lg Electronics Inc. Enhanced intra prediction mode signaling
US11297331B2 (en) 2010-05-30 2022-04-05 Lg Electronics Inc. Enhanced intra prediction mode signaling
CN105141949A (zh) * 2010-05-30 2015-12-09 Lg电子株式会社 增强的帧内预测模式信令
US10390023B2 (en) 2010-05-30 2019-08-20 Lg Electronics Inc. Enhanced intra prediction mode signaling
CN105847845A (zh) * 2010-07-19 2016-08-10 Sk电信有限公司 视频解码方法
CN107105241B (zh) * 2010-07-31 2020-04-28 M&K控股株式会社 图像编码装置
CN107105241A (zh) * 2010-07-31 2017-08-29 M&K控股株式会社 图像编码装置
CN103190150A (zh) * 2010-09-07 2013-07-03 Sk电信有限公司 利用参考像素的特性省略预测模式信息的发送的帧内预测编码/解码设备和方法
US9137531B2 (en) 2010-09-30 2015-09-15 Huawei Technologies Co., Ltd. Scanning method and device, and reverse scanning method and device
CN103250413A (zh) * 2010-11-16 2013-08-14 高通股份有限公司 视频译码中的并行上下文计算
CN108337518A (zh) * 2010-12-03 2018-07-27 维洛媒体国际有限公司 在视频译码中单独地译码视频块的最后有效系数的位置
CN103299638A (zh) * 2010-12-30 2013-09-11 Sk电信有限公司 自适应扫描装置及其扫描方法
US10015484B2 (en) 2010-12-30 2018-07-03 Sk Telecom Co., Ltd. Adaptive scan device and method for scanning thereof
CN103299638B (zh) * 2010-12-30 2016-08-10 Sk电信有限公司 自适应扫描装置及其扫描方法
CN104010192A (zh) * 2011-01-14 2014-08-27 索尼公司 用于hevc的帧内色度模式信令的码字分配
CN104010192B (zh) * 2011-01-14 2017-06-16 索尼公司 用于hevc的帧内色度模式信令的码字分配
CN108632620A (zh) * 2011-03-08 2018-10-09 维洛媒体国际有限公司 用于视频译码的变换系数的译码
CN107257456B (zh) * 2011-10-19 2020-03-06 株式会社Kt 解码视频信号的方法
CN107257456A (zh) * 2011-10-19 2017-10-17 株式会社Kt 解码视频信号的方法
CN104137542A (zh) * 2012-03-02 2014-11-05 高通股份有限公司 用于变换系数译码的上下文导出中的基于扫描的滑动窗
CN105027561B (zh) * 2012-09-26 2018-08-28 高通股份有限公司 用于上下文自适应、多层级有效性译码的上下文导出
CN105027561A (zh) * 2012-09-26 2015-11-04 高通股份有限公司 用于上下文自适应、多层级有效性译码的上下文导出
CN113453019A (zh) * 2016-05-03 2021-09-28 高通股份有限公司 解码视频数据的方法和装置

Also Published As

Publication number Publication date
US8428133B2 (en) 2013-04-23
US20130044812A1 (en) 2013-02-21
RU2010101116A (ru) 2011-07-20
KR20100029838A (ko) 2010-03-17
BRPI0813349A2 (pt) 2015-11-03
DK2165543T3 (en) 2015-02-23
WO2008157431A8 (en) 2010-03-04
JP5254324B2 (ja) 2013-08-07
EP2172026A2 (en) 2010-04-07
US20140112387A1 (en) 2014-04-24
US20080310507A1 (en) 2008-12-18
CA2687260C (en) 2013-08-27
US8619853B2 (en) 2013-12-31
PL2165543T3 (pl) 2015-04-30
US9578331B2 (en) 2017-02-21
US20080310504A1 (en) 2008-12-18
JP2010530190A (ja) 2010-09-02
CN101682770A (zh) 2010-03-24
US20080310512A1 (en) 2008-12-18
TWI401959B (zh) 2013-07-11
WO2008157269A2 (en) 2008-12-24
JP2013153463A (ja) 2013-08-08
CA2687260A1 (en) 2008-12-24
RU2434360C2 (ru) 2011-11-20
EP2168381A2 (en) 2010-03-31
BRPI0813351B1 (pt) 2020-09-15
KR20100029246A (ko) 2010-03-16
CN101743751A (zh) 2010-06-16
WO2008157360A2 (en) 2008-12-24
JP2010530188A (ja) 2010-09-02
WO2008157360A3 (en) 2009-03-26
WO2008157269A3 (en) 2009-03-19
CN101743751B (zh) 2013-05-01
JP5575940B2 (ja) 2014-08-20
KR20100029837A (ko) 2010-03-17
RU2010101053A (ru) 2011-07-20
RU2447612C2 (ru) 2012-04-10
US8520732B2 (en) 2013-08-27
PT2165543E (pt) 2015-02-24
TW200913723A (en) 2009-03-16
CN101682770B (zh) 2012-07-04
RU2010101085A (ru) 2011-07-27
ES2530796T3 (es) 2015-03-05
CA2687725A1 (en) 2008-12-24
BRPI0813345A2 (pt) 2015-08-11
TW200915880A (en) 2009-04-01
KR101161065B1 (ko) 2012-06-28
BRPI0813345B1 (pt) 2021-01-12
KR101107867B1 (ko) 2012-02-09
EP2165543B1 (en) 2014-12-17
US8488668B2 (en) 2013-07-16
JP2010530184A (ja) 2010-09-02
BRPI0813351A2 (pt) 2015-08-11
WO2008157431A3 (en) 2009-02-19
KR101091479B1 (ko) 2011-12-07
RU2463729C2 (ru) 2012-10-10
RU2446615C2 (ru) 2012-03-27
EP2165543A2 (en) 2010-03-24
CA2687263A1 (en) 2008-12-24
TW200913727A (en) 2009-03-16
WO2008157431A2 (en) 2008-12-24
CA2687263C (en) 2015-10-20
RU2010101115A (ru) 2011-07-20

Similar Documents

Publication Publication Date Title
CN101682770B (zh) 视频块预测模式的自适应译码
CN101911702B (zh) 针对支持cabac的视频编码过程而量化视频块的系数的方法和装置
CN102204251B (zh) 使用大于4x4和8x8的变换的视频译码
CN103621082A (zh) 视频译码中的量化
CN103179395A (zh) 用于上下文自适应可变长度译码(cavlc)的速率-失真量化
WO2010039822A2 (en) VIDEO CODING USING TRANSFORMS BIGGER THAN 4x4 AND 8x8

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20100811

C20 Patent right or utility model deemed to be abandoned or is abandoned