CN1949877A - 自适应量化控制器及其方法 - Google Patents

自适应量化控制器及其方法 Download PDF

Info

Publication number
CN1949877A
CN1949877A CNA2006101416838A CN200610141683A CN1949877A CN 1949877 A CN1949877 A CN 1949877A CN A2006101416838 A CNA2006101416838 A CN A2006101416838A CN 200610141683 A CN200610141683 A CN 200610141683A CN 1949877 A CN1949877 A CN 1949877A
Authority
CN
China
Prior art keywords
frame
macro block
value
discrete cosine
cosine transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006101416838A
Other languages
English (en)
Other versions
CN1949877B (zh
Inventor
金钟善
范宰荣
任庆默
朴宰弘
钱升弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN1949877A publication Critical patent/CN1949877A/zh
Application granted granted Critical
Publication of CN1949877B publication Critical patent/CN1949877B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了一种自适应量化控制器及其方法。在范例性的方法中,基于参考帧对包括在输入帧中的至少一个帧执行运动预测。可能产生预测误差作为输入帧和参考帧之间的差值。可以基于所接收的宏块计算活动性值,所接收的宏块与输入帧和预测误差之一相关。通过将参考量化参数乘以所计算的活动性值的归一化值可以产生量化参数。在另一范例性方法中,可以接收包括I帧的输入帧并至少部分地基于从一个或多个先前输入帧中提取的信息执行对该I帧的运动预测。在另一个例子中,所述自适应量化控制器可以执行上述范例性的方法。

Description

自适应量化控制器及其方法
技术领域
本发明的范例性实施例一般涉及一种自适应量化控制器及其方法,特别是涉及一种执行运动预测的自适应量化控制器及其方法。
背景技术
在运动图像专家组(MPEG)-2、MPEG-4和H.264标准中,输入图像或帧可以被划分为多个亮度块和“宏块”。所述宏块和亮度块当中的每个可以具有相同数量的像素(例如,用于亮度块的8×8像素和用于宏块的16×16像素等)。以亮度块为单位执行包括运动估计和运动补偿的运动预测。可以以其中的每个块都具有相同数量像素(例如,8×8像素)的多个块的单位执行离散余弦变换(DCT)和量化,对输入的图像或帧进行变长编码以便于视频编码处理。
传统的使用MPEG-2、MPEG-4和/或H.264标准的运动图像编码器可以对输入的图像或帧执行解码处理以产生解码的宏块。解码后的宏块可以被存储在存储器中并用于编码后续帧。
为了在带宽限制系统中促进(faciliate)数据流的视频,可以经过有限的传输信道传输由编码格式(例如,MPEG-2、MPEG-4、H.264等)确定的给定量的视频数据。例如,MPEG-2运动图像编码器使用自适应量化控制处理,在该处理中,可以将量化参数或量化级别可以提供给运动图像编码器的量化器。可以基于所述运动图像编码器输出缓冲器的状态控制所提供的量化参数/级别(level)。由于可以在视频特征(例如,涉及在视频帧内时间和空间相关的活动)的基础上计算所述量化参数,所以,可以降低输出缓冲器的位使用率。
传统的MPEG-2运动图像编码器可以支持三种输入帧的编码模式。这三种编码模式可以包括帧内编码(I)帧、预测编码(P)帧和双向预测编码(B)帧。可以基于当前输入帧中的信息编码所述I帧,基于时间在前I帧或P帧的运动预测来编码所述P帧,和基于在前I帧或P帧或后续帧I(例如,下一个帧)或P帧的运动预测来编码所述B帧。
通常,可以对P帧或B帧执行运动估计并可以使用运动矢量编码经过运动补偿的数据。但是,I帧可以不被运动估计以及I帧内的数据可以被编码。
因此,在传统的自适应量化控制方法中,可以基于是当前输入帧和运动补偿数据之间的差值的预测误差或者基于用于预测误差的DCT系数来执行用于P帧和B帧的活动性计算(activity computation)。可以对I帧的数据执行用于I帧的活动性计算。
因此,可以使用运动估计基于一个或多个时间和空间相关性执行I帧前或后相邻的P帧和B帧的活动性计算,但是,用于I帧的活动性计算可以只以空间相关性、而不以时间相关性为基础。这样,在所述I帧中的自适应量化控制可能具有比所述I帧的相邻帧(例如,相邻帧,例如在前帧或下一帧)更低的自适应量化效率和在用于包括在所述I帧中的多个块的量化系数之间的时间连续性可能被间断,从而导致可视质量的降低。由于人的眼睛对于静态区域(例如,具有很小运动的部分)更加敏感,所以,如果多个输入帧都包括很小的运动(例如,当比特率减小时),那么,上述视频质量的降低可能会变成非常明显的问题。此外,由于与所述I帧相邻的帧使用该I帧作为运动估计的参考帧,所以,该I帧的可视质量也可能降低,从而使视频质量的降低可能与所述I帧的频率相互关联起来。
发明内容
本发明的范例性实施例提供了一种自适应量化控制器,包括:预测误差产生单元,用于在参考帧的基础上对包括在输入帧内的至少一个帧执行运动预测并产生预测误差,所述预测误差是所述输入帧和所述参考帧之间的差值;活动性计算单元,用于在所接收的宏块的基础上输出活动性值,所接收的宏块与输入帧和所述预测误差之一相关;和量化参数产生单元,用于通过将参考量化参数乘以所输出活动性值的归一化值而产生量化参数。
本发明的另一个范例性实施例提供了一种自适应量化控制的方法,包括:在参考帧的基础上对包括在输入帧中的至少一个帧执行运动预测,产生预测误差,该预测误差是所述输入帧和所述参考帧之间的差值;基于所接收的宏块计算活动性值,所接收的宏块与输入帧和所述预测误差之一相关;和通过将参考量化参数乘以所计算的活动性值的归一化值而产生量化参数。
本发明的再一范例性实施例提供了一种自适应量化控制的方法,包括:接收包括I帧的输入帧并基于从一个或多个在前输入帧提取的至少部分信息来执行用于I帧的运动预测。
附图说明
包括附图以提供对本发明的进一步理解,附图被插入并作为说明书的一部分。所述附图示出了本发明的范例性实施例,并与说明书一起来解释本发明的原理。
图1的框图示出了根据本发明范例性实施例的用于运动图像编码器的自适应量化控制器;
图2示出了根据本发明另一范例性实施例的活动性计算单元;
图3的框图示出了根据本发明另一范例性实施例的运动图像编码器的另一个自适应量化控制器;
图4的流程示出了根据本发明另一范例性实施例的用于运动图像编码器的自适应量化控制处理;
图5示出了根据本发明另一范例性实施例的活动性值计算的流程图;
图6的曲线示出了传统的峰值信噪比(PSNR)曲线和根据本发明范例性
实施例的PSNR曲线;
图7的曲线示出了另一个传统的PSNR曲线和根据本发明另一范例性实施例的另一个PSNR曲线;
图8的表格示出了一组传统自适应量化控制处理的模拟结果和一组根据本发明范例性实施例的自适应量化控制处理的模拟结果;
图9的表格示出了根据本发明范例性实施例的使用I帧运动预测的一组运动预测模拟结果和不使用I帧运动预测的一组运动预测的模拟结果;
图10的表格示出了根据本发明范例性实施例的一组其中I帧的参考帧是原始帧的运动预测的模拟结果,和一组其中所述I帧的参考帧是运动补偿的帧的模拟结果。
具体实施方式
下面将详细地说明本发明的范例性实施例。但是,为简便描述本发明的范例性实施例,这里所披露的特定结构和功能仅仅是代表性的。本发明的范例性实施例可以多种不同形式实施,并不受这些实施例的限制。
因此,在本发明的范例性实施例可以被作出各种修改和具有其它形式的同时,借助于在附图中举例的方式示出了本发明的特定实施例并在这里予以详细的说明。但是应当理解,这里并不试图将所述范例性实施例限制到所描述的特定形式,相反,本发明的范例性实施例将覆盖落入本发明精神和范围内的所有修改、等同和变化。在整个说明中,相同的数字可以指代相同的元件。
应当理解,尽管在这里可以使用术语第一、第二等描述各种元件,但这些元件不受这些术语的限制。这些术语只被用于元件之间的彼此区分。例如,第一元件也可以被称之为第二元件,类似的,第二元件也可以被称之为第一元件,不会脱离本发明的范围。如这里所使用的,术语“和/或”包括相关列表项的一个或多个的任一和全部组合。
应当理解,当一个元件被称作“连接到”或“耦合到”另一元件时,它可以是被直接连接到或耦合到另一个元件或者是存在介入元件。相反,当一个元件被称作“直接连接到”或“直接耦合到”另一元件时,则不存在所述介入元件。应当用相同的方式来解释用于描述元件之间关系的其它用语(即,“在...之间”和“直接在...之间”,“相邻”和“直接相邻”等)。
这里所使用的术语学仅仅是为了说明本发明的特定实施例而不是试图限制本发明的范例性实施例。如这里所使用的,单数形式“一”、“一个”和“该”试图包括复数形式,除非上下文清楚地指出相反的情况。还应当理解,这里所使用的术语“包含”、“包含有”、“包括”和/或“包括有”规定状态特征、总体、步骤、操作、元件和/或构件的存在,但并不排除附加的一个或多个其它特征、总体、步骤、操作、元件、构件和/或它们组合的存在。
除非有相反的规定,这里所使用的所有术语(包括技术的和科学的术语)都具有本领域普通技术人员所公共理解的相同含义。应当理解,诸如在公共词典中定义的术语应当被解释为具有与相关技术上下文中所具有含义相同的含义,而不被理想化或过度形式化地加以解释,除非这里有明白的规定。
图1的框图示出了根据本发明范例性实施例的用于运动图像编码器的自适应量化控制器100。参看图1,自适应量化控制器100可以包括预测误差产生单元105、宏块类型判定单元110、开关115、活动性计算单元120和量化参数产生单元130。
在图1的范例性实施例中,预测误差产生单元105可以在参考帧REF_F的基础上对输入帧IN_F执行运动预测(例如,运动估计和运动补偿)。预测误差产生单元105可以产生预测误差RE。所述预测误差PE可以表示输入帧IN_F和经过运动补偿的帧(例如,参考帧REF_F)之间的差。
在图1所示的范例性实施例中,输入帧IN_F可以是当前的“原始”帧(例如,未经运动补偿的帧)。该输入帧IN_F可以包括基于运动图像编码器的编码模式的I帧、P帧和B帧。参考帧REF_F可以被存储在运动图像编码器的帧存储器中。
在图1所示的范例性实施例中,由于I帧可以表示编码数据,所以,对于I帧的参考帧是先前(例如,在前)P帧或I帧的原始帧(例如,未经运动补偿的帧)。或者,所述参考帧可以是先前(例如,在前)P帧或I帧的一个未经运动补偿的帧(例如,或者被称为“重构”帧)。用于P帧的参考帧可以是先前(例如,在前)P帧或I帧的经运动补偿的帧,而用于B帧的参考帧可以是先前P帧或I帧和/或随后的(例如,下一个)P帧或I帧的经过运动补偿的帧。
在图1所示的范例性实施例中,预测误差产生单元105可以包括运动估计处理器(未示出)、运动补偿处理器(未示出)和减法器(未示出)。所述运动估计处理器可以基于存储在所述帧存储器中的参考帧REF_F和输入帧IN_F执行运动估计并输出运动矢量。在一个例子中,在I帧、P帧和B帧的运动估计中所使用的参考块是给定像素格栅大小(例如,16×16、4×4、4×8、8×4、8×8、8×16、16×8等)的宏块。所述运动补偿处理器可以在所述运动矢量的基础上从存储在帧存储器中的参考帧中读出经过运动补偿的帧。所述减法器可以从输入帧IN_F中减去经过运动补偿的帧REF_F并可以产生所述预测误差PE。
在图1所示的范例性实施例中,宏块类型判定单元110可以响应输入帧IN_F和预测误差PE而输出用于表示宏块类型是帧间宏块(例如,或者非帧内宏块)还是帧内宏块的宏块类型信息MT。
在图1所示的范例性实施例中,开关115可以响应所述宏块类型信息MT向活动性计算单元120输出所述预测误差PE或输入帧IN_F之一。例如,如果宏块类型信息MT表示帧间宏块类型,则开关115可以输出预测误差PE,以及如果所述宏块类型信息MT表示帧内宏块类型,则开关115可以以宏块为单位输出所述输入帧IN_F。在另一个实施例中,可以将所述预测误差PE和输入帧IN_F作为帧输出。
在图1所示的范例性实施例中,活动性计算单元120可以从开关115接收宏块(例如,预测误差PE的帧间宏块、输入帧IN_F的帧内宏块),可以执行活动性计算并可以输出宏块j的时间和空间活动性值actj
图2示出了根据本发明另一范例性实施例的图1所示的活动性计算单元120。在图2所示的范例性实施例中,活动性计算单元120可以包括预测误差/偏差加法单元122、比较单元124和加法单元126。
在图2所示的范例性实施例中,如果开关115输出预测误差PE的帧间宏块,那么,预测误差/偏差加法单元122可以对预测误差PE的帧间宏块执行操作,其中,包括在预测误差PE的帧间宏块内的预测误差值Ek n的绝对值可以被相加到一起。该加法的结果可以被输出以作为等式1所示的亮度子块值(例如,具有8×8像素大小)sblkn
sblk n = Σ k = 1 64 | E k n | 等式1
其中,Ek n可以表示在第n个8×8预测视频块中的预测误差值,而n可以是正整数(例如,1,2,3,4等)。在等式1中,假设所述亮度子块值sblkn可以对应于8×8像素格栅(grid)(例如,由于64可以被表示为8乘以8)。但是,应当理解,另外的范例性实施例也可以利用其它的像素格栅,因此,等式1中所示的值是按照比例设定(scale)的。
在图2所示的范例性实施例中,如果开关115输出输入帧IN_F的帧内宏块,那么,预测误差/偏差加法单元122对输入帧IN_F的的帧内宏块执行操作,其中,通过从包括在所述输入帧IN_F的帧内宏块内的取样值(例如,像素值)Pk n中减去平均取样值P_meann获得的偏差值的绝对值可以被相加到一起。相加的结果可以被作为等式2所示的亮度子块值(例如,具有8×8像素大小)sblkn输出:
sblk n = Σ k = 1 64 | P k n - P _ mean n | 等式2
其中,
p _ mean n = 1 64 × Σ K = 1 64 P k n 等式3
其中,Pk n可以表示在第n个8×8原始视频块中的取样值,P_meann可以表示第n个取样值的平均值,而n可以是正整数(例如,1,2,3,4等)。在等式2中,假设所述亮度子块值sblkn对应于8×8像素格栅(例如,由于64可以被表示为8乘以8)。但是,应当理解,另外的范例性实施例可以应用到其它的像素大小,因此,在等式2中示出的值是按照比例设定的。
在图2所示的范例性实施例中,比较单元124可以比较子块值sblk1、sblk2、sblk3和sblk4并可以输出具有最低值的子块值。加法单元126可以增加(例如加1)比较后子块值的所述最低值并可以输出活动性值actj。因此,由计算单元124和加法单元126执行的上述操作可以由下述等式4来表示:
actj=1+min(sblk1,sblk2,sblk3,and sblk4)             等式4
回到图1所示的范例性实施例,量化参数产生单元130可以将参考量化参数Qj乘以活动性值actj的归一化值N_actj,由此以产生自适应量化值或量化参数MQj。可以基于运动图象编码器的输出缓冲器被填充的程度(例如,空,填充其容量填满的40%等)确定参考量化参数Qj。例如,如果从输出缓冲器产生的位的数量大于阈值,则所述参考量化参数Qj可以增加,以及如果从所述输出缓冲器产生的位的数量不大于阈值,则所述参考量化参数Qj可以减小。量化参数MQj可以是用于I帧、P帧和B帧的最佳量化参数并可以被提供给运动图像编码器的量化器。这样,可以减少所述输出缓冲器的位使用(例如,与I帧有关的位使用)。所述量化器可以响应量化参数MQj来量化从运动图像编码器的离散余弦变换器中输出的DCT系数,并可以输出量化系数。
在图1所示的范例性实施例中,量化参数产生单元130可以如下输出量化参数MQj
N _ act j = 2 * act j + mean _ act j act j + 2 * mean j - act j 等式5
其中,N_actj可以表示归一化的活动性,mean_actj可以表示活动性的平均值。然后,参数N_actj可以被乘以Qj以获得等式6表示的MQj
M Q j = Q j * N _ act j 等式6
图3的框图示出了根据本发明另一范例性实施例的运动图像编码器的自适应量化控制器300。在图3的范例性实施例中,自适应量化控制器300可以包括预测误差产生单元305、宏快类型判定单元310、开关315、活动性计算单元320、量化参数产生单元330、DCT类型判定单元340和DCT单元350。
此外,在图3的范例性实施例中,预测误差产生单元305、宏块类型判定单元310、开关315和量化参数产生单元330的结构配置和操作可以分别和图1所示的预测误差产生单元105、宏块类型判定单元110、开关115和量化参数才产生单元130的结构配置和操作相同,因此,为简便起见而不再描述。
在图3的范例性实施例中,DCT类型判定单元340可以输出DCT类型信息DT,该信息表示是对从开关315接收的预测误差PE的帧间宏块还是对从开关315接收的输入帧IN_F的帧内宏块执行DCT,使其成为帧结构或场结构。
在图3的范例性实施例中,所述DCT单元350以具有给定像素格栅大小(例如,8×8像素)的块为单位对预测误差PE的帧间宏块或输入帧IN_F的帧内宏块执行与所述DCT类型信息DT相对应的DCT,并可以输出所产生的DCT系数。
在图3的范例性实施例中,DCT系数可以被传送给活动性计算单元320。如上所述,活动性计算单元320可以包括与图1所示范例性实施例的活动性计算单元120类似的结构组件(例如,预测误差/偏差加法单元122、比较单元124和加法单元126)。活动性计算单元320可以计算和输出与DTC系数对应的活动性值actj(例如,利用等式1和/或2,其中sblkj可以表示具有DCT类型的帧结构子块或场结构子块)。
在图3的范例性实施例中,自适应量化控制器300可以利用DCT类型的DCT系数执行活动性计算,由此以降低活动性计算期间的复杂性。
图4的流程示出了根据本发明另一范例性实施例的用于运动图像编码器的自适应量化控制处理。在该例子中,可以利用图1的自适应量化控制器100和/或图3的自适应量化控制器300执行自适应量化控制处理400。
在图4所示的范例性实施例中,可以在参考帧的基础上对输入帧执行运动预测(例如,包括运动估计和运动补偿)。可以产生作为所述输入帧和所述参考帧之间的差的预测误差(在405处)。
在图4所示的范例性实施例中,所述输入帧可以是当前的原始帧并可以包括基于运动图像编码器的编码模式的I帧、P帧和B帧。在例子中,用于I帧的参考帧可以是先前(例如,在前)P帧或I帧的原始帧。在另一个例子中,用于所述I帧的参考帧可以是先前P帧或I帧的经过运动补偿的帧。在再一个例子中,用于所述P帧的参考帧可以是先前P帧或I帧的经过运动补偿的帧,而用于所述B帧的参考帧可以是先前P帧或I帧和随后P帧或I帧的经过运动补偿的帧。运动预测(在405处)可以基于在I帧、P帧和B帧的运动估计中所使用的参考块。在例子中,参考块可以是16×16宏块、4×4宏块、4×8宏块、8×4宏块、8×8宏块、8×16宏块、16×8宏块和/或任何其它大小的宏块。
在图4所示的范例性实施例中,可以确定用于预测误差和/或输入帧的宏块类型(在410处)。在例子中,帧间宏块可以被确定为用于所述预测误差的宏块类型,而帧内宏块可以被确定为用于所述输入帧的宏块类型。在再一个例子中,所述预测误差和输入帧可以被作为帧输出。
在图4的范例性实施例中,评估与预测误差的内部宏块和/或输入帧的帧内宏块相关的DCT的结果(例如,DCT系数),以便确定DCT系数是否可以被用于活动性计算(在415处)。如果确定DCT系数可以被用于活动性计算,那么,处理前进到420(后述)。或者,如果确定所述DCT系数不能被用于活动性计算,那么,图4的处理前进到430。
在图4的范例性实施例中,可以在预测误差的帧间宏块和/或输入帧的帧内宏块的基础上计算宏块j的时间和空间活动性值actj,这将在下面相对于图5所示的范例性实施例详细说明。
图5示出了根据本发明另一范例性实施例的图4的430的活动性值计算。
在图5的范例性实施例中,在4301处,活动性计算430可以包括对包括在预测误差PE的帧间宏块内的预测误差值Ek n的绝对值求和(例如,利用等式1)并输出该求和的结果(例如,作为8×8亮度子块值sblkn(n=1、2、3或4))。如以上对等式1所述,Ek n可以表示在第n个8×8预测视频块中的预测误差值。或者,在图5的4301处,通过从包括在输入帧IN_F的帧内宏块中的取样值(像素值)Pk n减去平均取样值P_meann获得的偏差值的绝对值被求和并被输出(例如,根据等式2)(例如,作为8×8亮度子块值sblkn(n=1、2、3或4))。
在图5的范例性实施例中,在4302处,比较4个子块值sblk1、sblk2、sblk3和sblk4,并输出这4个子块值sblk1、sblk2、sblk3和sblk4中的最小值。可以增加所输出的最小值(例如,加1)并输出活动性值actj。在例子中,可以根据等式3执行图5的4302和4303。
回到图4所示的范例性实施例,可以对被确定的宏块(根据410)(例如,预测误差的帧间宏块或所述输入帧的帧内宏块)进行评估,以确定是否执行DCT以便将所确定的宏块转换成帧或场结构(在420处)。然后,可以以给定的块大小(例如,8×8块)为单位对所确定的宏块执行与所述DCT类型(在420处确定的)相对应的DCT,并输出DCT系数。
在图4所示的范例性实施例中,可以计算与DCT系数对应的活动性值actj(例如,基于等式1或2)(在430处)。在图4的430处,(例如,等式1或等式2)sblkn可以根据DCT的类型来表示帧结构子块或场结构子块。
在图4的范例性实施例中,可以将参考量化参数Qj乘以活动性值actj的归一化值N_actj,从而产生自适应量化值(在435处)(例如,量化参数MQj)。可以基于运动图像编码器的输出缓冲器的填充程度来确定参考量化参数Qj。在例子中,如果在输出缓冲器处产生的位数大于参考值,那么,所述参考量化参数Qj可以较高,而如果从输出缓冲器产生的位数不大于所述参考值,那么,参考量化参数Qj可以较低。可以将量化参数MQj提供给运动图像编码器的量化器(未示出)。量化器可以响应量化参数MQj来量化从所述运动图像编码器(未示出)的离散余弦变换器输出的DCT系数并输出量化系数。在例子中,图4中435的量化参数产生可以执行等式4和/或5。
图6的曲线示出了传统的峰值信/噪比(PSNR)曲线610和根据本发明范例性实施例的PSNR曲线620。在另一示例中,PSNR曲线620可以表示施加到Paris视频序列的亮度块(Y)的自适应量化控制处理。在例子中,Paris视频序列的比特率(bit-rate)可以是每秒800千比特(Kbps),且Paris视频序列可以包括公共媒介格式的帧。但是,应当理解,本发明的其它范例性实施例也可以包括其它的比特率和/或格式。
在图6的范例性实施例中,PSNR曲线620通常高于PSNR曲线610,这表明,通过最佳地安排I帧的量化值,该范例性自适应控制器和该范例性自适应量化控制处理可以影响I帧的相邻P/B帧,从而提供主关视频质量的整个增加。
图7的曲线示出了另一传统的PSNR曲线710和根据本发明范例性实施例的另一个PSNR曲线。在例子中,PSNR曲线720可以表示施加到Flag视频序列的亮度块(Y)的自适应量化处理。在例子中,Flag视频序列的比特率可以是每秒800千比特(Kbps),且所述Flag视频序列可以包括公共媒介格式的多个帧。但是,应当理解,本发明的其它范例性实施例可以包括其它的比特率和/或格式。
在图7的范例性实施例中,PSNR720通常可以高于PSNR曲线710,这可以表示出,通过最佳地安排I帧的量化值,该示例的自适应量化控制器和该示例的自适应量化控制处理可以影响I帧的相邻P/B帧,由此,提供主观视频质量的整个增加。
图8的表格示出了一组传统自适应量化控制处理的模拟结果和一组根据本发明范例性实施例的自适应量化控制处理的模拟结果。在图8所示的范例性实施例中,包括在图像组中的帧数可以是15,而每个视频序列可以包括300个帧。
在图8的范例性实施例中,在每个视频序列中根据本发明范例性实施例的PSNR与传统的PSNR之间的差ΔY_PSNR可以大于0dB。例如,在较低的比特率(例如,诸如600Kbps)处,该ΔY_PSNR可以达到0.52dB的较高(例如,最大)值。Δ_PSNR的正值可以反映响应根据本发明范例性实施例的自适应量化控制器和自适应量化控制处理的图象质量的改善。
图9的表格示出了根据本分明的一组使用I帧运动预测的运动预测模拟结果和一组不使用I帧运动预测的运动模拟结果。在图9的模拟示例中,包括在图像组中的帧数可以是15,而每个视频序列可以包括300帧。
在图9的模拟示例中,在每个视频序列中,使用I帧运动预测时(IMP_On)的PSNR和不使用I帧预测时(IMP_Off)时的PSNR之间的差ΔY_PSNR可以大于0dB。所述ΔY_PSNR的正值反映响应本发明该范例性实施例中使用的I帧运动预测的图像质量的改善。
图10的表格示出了根据本发明范例性实施例的一组用于其中I帧的参考帧是原始帧的运动预测的模拟结果和一组其中所述I帧的参考帧是经过运动补偿的帧的模拟结果。在图10所示的模拟示例中,包括在图像组中的帧数可以是15,而每个视频序列可以包括300帧。
在图10所示的模拟示例中,在每个视频序列中,I帧的参考帧是原始帧(IMP_org)时的PSNR和I帧的参考帧是经过运动补偿的帧(IMP_recon)时的PSNR之间的差ΔY_PSNR可以大于0dB。ΔY_PSNR的正值可以反映响应在本发明范例性实施例中使用原始帧作为所述I帧的参考帧的图像质量的改善。
到此,已经描述了本发明的范例性实施例,很明显,可以利用多种形式做相同的改变。例如,尽管已经利用某种格式和大小(例如,16×16像素的宏块)的结构讨论了本发明,但应当理解,在本发明的其它范例性实施例中,上述给出的几个例子可以按比例决定以便与公知的视频协议相符。
这种变化并不脱离本发明范例性实施例的精神和范围,对于本领域的普通技术人员来讲很明显的这种修改构均被包括在本发明权利要求书的范围内。

Claims (28)

1.一种自适应量化控制器,包括:
预测误差产生单元,用于在参考帧的基础上对包括在输入帧内的至少一个帧执行运动预测并产生预测误差,该预测误差是所述输入帧和所述参考帧之间的差;
活动性计算单元,用于基于所接收的宏块输出活动性值,所接收的宏块与所述输入帧和所述预测误差之一相关;和
量化参数产生单元,用于通过将参考量化参数与输出的活动性值的归一化值相乘而产生量化参数。
2.如权利要求1所述的自适应控制器,其中,至少一个帧包括一个或多个I帧、P帧和B帧。
3.如权利要求1所述的自适应控制器,其中,所接收的宏块是帧内宏块或帧间宏块中的一个。
4.如权利要求1所述的自适应控制器,其中,所述量化参数产生单元基于所包括的输出缓冲器被填充的程度来产生所述参考量化参数。
5.如权利要求2所述的自适应控制器,其中,所述I帧的参考帧是先前P帧或I帧的原始帧。
6.如权利要求2所述的自适应控制器,其中,所述I帧的参考帧是先前P帧或I帧的经过运动补偿的帧。
7.如权利要求1所述的自适应控制器,其中,所述预测误差产生单元执行包括运动估计和运动补偿的运动预测。
8.如权利要求7所述的自适应控制器,其中,在至少一个帧的运动预测期间所使用的参考块是给定大小的宏块。
9.如权利要求8所述的自适应控制器,其中,就像素而言,所述给定大小是16×16、4×4、4×8、8×4、8×8、8×16或16×8。
10.如权利要求1所述的自适应控制器,还包括:
宏块类型判定单元,用于响应所述预测误差和输入帧而输出表示所接收的宏块是否是帧间宏块还是帧内宏块的宏块类型信息;和
开关,用于响应所述宏块类型信息而输出所述预测误差和所述输入帧中的一个给所述活动性计算单元。
11.如权利要求1所述的自适应控制器,其中,所述活动性计算单元包括:
预测误差/偏差加法单元,用于如果所接收的宏块是所述预测误差的帧间宏块,则求和包括在所接收宏块中的预测误差值的绝对值,和如果所接收的宏块是所述输入帧的帧内宏块,则求和通过从包括在所接收宏块中的取样值中减去平均取样值而获得的偏差值的绝对值,和输出求和的结果作为多个子块值中的一个;
比较单元,用于将所述多个子块值进行比较并输出所述多个子块值的最小值;和
加法单元,用于增加所输出的最小值并输出所接收宏块的活动性值。
12.如权利要求1所述的自适应控制器,还包括:
离散余弦变换单元,用于执行与所接收宏块的离散余弦变换类型信息相对应的离散余弦变换,并输出离散余弦变换系数,
其中,所述活动性计算单元接收所述离散余弦变换系数并基于该离散余弦变换系数确定所接收宏块的输出活动性值。
13.如权利要求12所述的自适应控制器,其中,所述量化参数产生单元基于所包括的输出缓冲器被填充的程度以及表示是否对所接收的宏块执行离散余弦变换的离散余弦变换类型信息而产生所述参考量化参数。
14.如权利要求12所述的自适应控制器,还包括:
宏块类型判定单元,用于响应所述预测误差和所述输入帧而输出表示所接收的宏块是否是帧间宏块还是帧内宏块的宏块类型信息;
开关,用于响应所述宏块类型信息将所接收的宏块输出到所述活动性计算单元;和
离散余弦变换类型判定单元,用于响应所接收的从所述开关输出的宏块输出所述离散余弦变换类型信息给所述离散余弦变换单元。
15.一种自适应量化控制方法,包括:
基于参考帧对包括在输入帧中的至少一个帧执行运动预测;
产生预测误差,该预测误差是所述输入帧和所述参考帧之间的差值;
基于所接收的宏块计算活动性值,所接收的宏块与所述输入帧和所述预测误差中的一个相关;和
通过将参考量化参数乘以所计算的活动性值的归一化值而产生量化参数。
16.如权利要求15所述的方法,其中,所述活动性值的计算至少部分地基于与所接收宏块的离散余弦变换类型对应的离散余弦变换系数。
17.如权利要求15所述的方法,其中,所述量化参数产生单元基于所包括的输出缓冲器的填充程度而产生所述参考量化参数,和所述离散余弦变换类型信息表示是否对所接收的宏块执行离散余弦变换。
18.如权利要求15所述的方法,其中,至少一个帧包括一个或多个I帧、P帧和B帧。
19.如权利要求18所述的方法,其中,对于所述I帧的参考帧是先前P帧或I帧的原始帧。
20.如权利要求18所述的方法,其中,对于所述I帧的参考帧是先前P帧或I帧的经过运动补偿的帧。
21.如权利要求15所述的方法,其中,所述运动预测包括运动估计和运动补偿。
22.如权利要求21所述的方法,其中,在至少一帧的运动估计中使用的参考块是给定大小的宏块。
23.如权利要求22所述的方法,其中,就像素而言,所述给定大小是16×16、4×4、4×8、8×4、8×8、8×16或16×8。
24.如权利要求16所述的方法,还包括:
第一,确定所接收的宏块是否是所述预测误差的帧间宏块还是所述输入帧的帧内宏块;
第二,确定是否基于所述离散余弦变换系数来计算所接收宏块的活动性值;和
第三,确定是否对所接收的宏块执行离散余弦变换;
至少部分地基于所接收的宏块是否是帧间宏块还是帧内宏块对所接收的宏块执行离散余弦变换,并输出所述离散余弦变换系数,
其中,如果所述第二确定步骤基于所述离散余弦变换系数确定不计算所述活动性值,则产生所述量化参数,以及如果所述第二确定步骤基于所述离散余弦变换系数确定计算所述活动性值,那么,只有在第三确定和执行步骤之后才产生所述量化参数。
25.如权利要求15所述的方法,其中,产生所述量化参数包括:
如果所接收的宏块是所述预测误差的帧间宏块,则求和包括在所接收宏块中的预测误差值的绝对值,以及如果所接收的宏块是所述输入帧的帧内宏块,则求和通过从包括在所接收宏块中的取样值中减去平均取样值所获得的偏差值的绝对值,并输出求和的结果作为多个子块值中的一个;
比较所述多个子块值并输出所述多个子块值的最小值;和
增加输出的最小值并输出所接收的宏块的活动性值。
26.一种自适应量化控制的方法,包括:
接收包括I帧的输入帧;和
至少部分地基于从一个或多个先前输入帧中提取的信息来执行所述I帧的运动预测。
27.一种执行权利要求15所述方法的自适应量化控制器。
28.一种执行权利要求26所述方法的自适应量化控制器。
CN2006101416838A 2005-10-12 2006-10-09 自适应量化控制器及其方法 Expired - Fee Related CN1949877B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020050096168A KR100723507B1 (ko) 2005-10-12 2005-10-12 I-프레임 움직임 예측을 이용한 동영상 압축 장치의 적응양자화 제어기 및 적응 양자화 제어 방법
KR96168/05 2005-10-12

Publications (2)

Publication Number Publication Date
CN1949877A true CN1949877A (zh) 2007-04-18
CN1949877B CN1949877B (zh) 2010-12-15

Family

ID=37911049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006101416838A Expired - Fee Related CN1949877B (zh) 2005-10-12 2006-10-09 自适应量化控制器及其方法

Country Status (3)

Country Link
US (1) US20070081589A1 (zh)
KR (1) KR100723507B1 (zh)
CN (1) CN1949877B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102907100A (zh) * 2010-05-17 2013-01-30 Sk电信有限公司 使用帧内块和帧间块相混合的编码块的视频编码/解码设备及其方法
CN103365624A (zh) * 2009-10-26 2013-10-23 威盛电子股份有限公司 判断系统及方法
CN105244034A (zh) * 2011-04-21 2016-01-13 三星电子株式会社 针对语音信号或音频信号的量化方法以及解码方法和设备

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101037070B1 (ko) 2009-06-05 2011-05-26 중앙대학교 산학협력단 전역탐색기법에 의한 고속 움직임 예측 방법
LT2773117T (lt) 2011-10-24 2018-12-27 Infobridge Pte. Ltd. Vaizdo dekodavimo aparatas
CN107087183B (zh) 2011-10-24 2020-02-14 英孚布瑞智有限私人贸易公司 对帧内预测模式进行解码的方法
US9961343B2 (en) 2011-10-24 2018-05-01 Infobridge Pte. Ltd. Method and apparatus for generating reconstructed block
US9300984B1 (en) 2012-04-18 2016-03-29 Matrox Graphics Inc. Independent processing of data streams in codec
US10003802B1 (en) 2012-04-18 2018-06-19 Matrox Graphics Inc. Motion-based adaptive quantization
US10003803B1 (en) 2012-04-18 2018-06-19 Matrox Graphics Inc. Motion-based adaptive quantization
US20140269901A1 (en) * 2013-03-13 2014-09-18 Magnum Semiconductor, Inc. Method and apparatus for perceptual macroblock quantization parameter decision to improve subjective visual quality of a video signal
US20140327737A1 (en) 2013-05-01 2014-11-06 Raymond John Westwater Method and Apparatus to Perform Optimal Visually-Weighed Quantization of Time-Varying Visual Sequences in Transform Space
US9787989B2 (en) * 2013-06-11 2017-10-10 Blackberry Limited Intra-coding mode-dependent quantization tuning
US20150016509A1 (en) * 2013-07-09 2015-01-15 Magnum Semiconductor, Inc. Apparatuses and methods for adjusting a quantization parameter to improve subjective quality
US9531915B2 (en) * 2013-12-04 2016-12-27 Aspeed Technology Inc. Image encoding system and method thereof
US20160205398A1 (en) * 2015-01-08 2016-07-14 Magnum Semiconductor, Inc. Apparatuses and methods for efficient random noise encoding
US20210289204A1 (en) * 2016-07-14 2021-09-16 Samsung Electronics Co., Ltd. Method for encoding/decoding image and apparatus therefor
US10360695B1 (en) 2017-06-01 2019-07-23 Matrox Graphics Inc. Method and an apparatus for enabling ultra-low latency compression of a stream of pictures
KR20230042952A (ko) 2021-09-23 2023-03-30 국방과학연구소 I-프레임 분할 전송 장치, 방법, 컴퓨터 판독 가능한 기록 매체 및 컴퓨터 프로그램

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0646411A (ja) * 1992-07-24 1994-02-18 Toshiba Corp 画像符号化装置
JP3165296B2 (ja) * 1992-12-25 2001-05-14 三菱電機株式会社 フレーム間符号化処理方式及びフレーム間符号化処理方法及び符号化制御方式
JPH09163373A (ja) * 1995-12-08 1997-06-20 Toshiba Corp 雑音低減装置
JP3604864B2 (ja) * 1997-04-25 2004-12-22 シャープ株式会社 動画像符号化装置
CN1067832C (zh) * 1997-05-23 2001-06-27 清华大学 视频编码器实现的改进方法
US6895048B2 (en) * 1998-03-20 2005-05-17 International Business Machines Corporation Adaptive encoding of a sequence of still frames or partially still frames within motion video
US6414992B1 (en) * 1999-01-27 2002-07-02 Sun Microsystems, Inc. Optimal encoding of motion compensated video
JP2001148858A (ja) * 1999-11-18 2001-05-29 Sony Corp 画像情報変換装置及び画像情報変換方法
KR100390167B1 (ko) * 2000-09-16 2003-07-04 가부시끼가이샤 도시바 화상 부호화방법 및 화상 부호화장치
US6650707B2 (en) * 2001-03-02 2003-11-18 Industrial Technology Research Institute Transcoding apparatus and method
KR100904329B1 (ko) * 2001-03-28 2009-06-23 소니 가부시끼 가이샤 화상 처리 장치, 화상 처리 방법, 및 기록 매체
US6810083B2 (en) * 2001-11-16 2004-10-26 Koninklijke Philips Electronics N.V. Method and system for estimating objective quality of compressed video data
US20040252758A1 (en) * 2002-08-14 2004-12-16 Ioannis Katsavounidis Systems and methods for adaptively filtering discrete cosine transform (DCT) coefficients in a video encoder
KR20040076034A (ko) * 2003-02-24 2004-08-31 삼성전자주식회사 동 영상의 가변 비트율 부호화 방법 및 장치
CN1235413C (zh) * 2003-07-14 2006-01-04 大唐微电子技术有限公司 基于运动估计的小波视频编解码方法
JP2005045736A (ja) 2003-07-25 2005-02-17 Sony Corp 画像信号符号化方法及び装置、符号化制御装置並びにプログラム
US7839930B2 (en) * 2003-11-13 2010-11-23 Microsoft Corporation Signaling valid entry points in a video stream
US7852919B2 (en) * 2003-09-07 2010-12-14 Microsoft Corporation Field start code for entry point frames with predicted first field
US7675970B2 (en) * 2004-01-12 2010-03-09 General Instrument Corporation Method and apparatus for processing a bitstream in a digital video transcoder
JP4720543B2 (ja) * 2006-03-01 2011-07-13 ソニー株式会社 データ処理装置、データ処理方法およびデータ処理プログラム、記録媒体、ならびに、再生装置、再生方法および再生プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365624A (zh) * 2009-10-26 2013-10-23 威盛电子股份有限公司 判断系统及方法
CN102907100A (zh) * 2010-05-17 2013-01-30 Sk电信有限公司 使用帧内块和帧间块相混合的编码块的视频编码/解码设备及其方法
CN102907100B (zh) * 2010-05-17 2016-09-28 Sk电信有限公司 使用帧内块和帧间块相混合的编码块的视频编码/解码设备及其方法
CN105244034A (zh) * 2011-04-21 2016-01-13 三星电子株式会社 针对语音信号或音频信号的量化方法以及解码方法和设备
CN105244034B (zh) * 2011-04-21 2019-08-13 三星电子株式会社 针对语音信号或音频信号的量化方法以及解码方法和设备

Also Published As

Publication number Publication date
KR100723507B1 (ko) 2007-05-30
CN1949877B (zh) 2010-12-15
KR20070040635A (ko) 2007-04-17
US20070081589A1 (en) 2007-04-12

Similar Documents

Publication Publication Date Title
CN1949877A (zh) 自适应量化控制器及其方法
CN1177480C (zh) 编码系统中基于对象的速率控制装置和方法
CN1233160C (zh) 自适应编码和解码运动图像的方法及其装置
US8121190B2 (en) Method for video coding a sequence of digitized images
CN1223959C (zh) 编码系统中基于宏块的速率控制装置和方法
KR101261526B1 (ko) 영상의 부호화 방법 및 장치, 복호화 방법 및 장치
CN1283100C (zh) 基于时间和空间复杂性自适应编码运动图像的方法及装置
CN102271257B (zh) 图像处理设备
JP5545783B2 (ja) 画像シーケンスを表す符号化されたデータのストリームを復号する方法および画像シーケンスを符号化する方法
CN1184820C (zh) 编码和噪声过滤图象序列
CN1301370A (zh) 用于减少压缩的视频中的喘息污迹的方法和设备
CN1723706A (zh) 宏块分割部分的混合块间/块内视频编码
CN103782598A (zh) 用于无损编码的快速编码方法
KR20110047697A (ko) 픽처 경계의 부호화 단위를 부호화, 복호화 하는 방법 및 장치
CN1627824A (zh) 位流控制的后处理过滤
CN101233757A (zh) 用于为能够可变比特速率编码的视频编码器提供速率控制的方法、模块、设备和系统
CN1933601A (zh) 用于无损视频编码和解码的方法及设备
KR20110083368A (ko) 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
KR20110017302A (ko) 움직임 벡터의 정확도 조절을 이용한 영상 부호화, 복호화 방법 및 장치
CN1902939A (zh) 数字画面序列的编码方法和解码方法以及编码设备
CN103327325A (zh) 基于hevc标准的帧内预测模式快速自适应选择方法
CN102804780A (zh) 图像编码装置、图像解码装置、图像编码方法以及图像解码方法
CN1822677A (zh) 预测视频块的系数的设备和方法
CN110832856A (zh) 用于减小视频编码波动的系统及方法
CN115118976A (zh) 一种图像编码方法、可读介质及其电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101215

Termination date: 20141009

EXPY Termination of patent right or utility model