CN1378384A - 基于比特率预测和预测误差能量的自适应量化 - Google Patents

基于比特率预测和预测误差能量的自适应量化 Download PDF

Info

Publication number
CN1378384A
CN1378384A CN02107793.2A CN02107793A CN1378384A CN 1378384 A CN1378384 A CN 1378384A CN 02107793 A CN02107793 A CN 02107793A CN 1378384 A CN1378384 A CN 1378384A
Authority
CN
China
Prior art keywords
value
video
frame
prediction
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN02107793.2A
Other languages
English (en)
Other versions
CN1217545C (zh
Inventor
乔迪·R·科比拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of CN1378384A publication Critical patent/CN1378384A/zh
Application granted granted Critical
Publication of CN1217545C publication Critical patent/CN1217545C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

用于基于比特率预测的视频帧的自适应量化的一种方法,包括在编码人工因素对于人类视觉系统而言不易识别的的视频帧的部分中提高量化和在编码人工因素对于人类视觉系统而言易于识别的的视频帧的部分中降低量化。在一个实施例中,对于其中自适应量化需要额外的比特的视频帧,本方法回复到统一量化。

Description

基于比特率预测和预测误差能量的自适应量化
                     技术领域
本发明涉及利用在保持比特的同时优化感知的视频质量的自适应量化技术来数字编码视频信号的方法和装置。本发明可以被应用到其中在视频帧内量化可以被修改的任何视频编码应用中。
                     背景技术MPEG标准
运动图象专家组(“MPEG”)已经使得视频的编码表示的语法标准化。对于解码仅仅比特流语法被规定。这为设计编码器带来了灵活性,它可能通过增加精致度而优化性能。MPEG标准也使得在优化图像质量和保持低比特率之间达到平衡。
MPEG视频比特流语法提供了称为量化参数(“QP”)的工具用于调制量化器的步长或数据压缩器。在典型的视频编码中,编码的视频的质量和比特率由编码器所选的QP的值决定。粗略的量化利用较少的比特编码给定的视频景物但是降低了图像质量。细致的量化使用更多的比特来编码给定的视频景物,达到提高图像质量的目的。量化值通常可以在视频帧内被修改。例如,在MPEG(1,2,4)和H.263中,存在针对视频景物的每个16×16图像块(或宏块)的QP。作为获得主观感知图像质量的要素的人类视觉系统
早期的数字图像压缩技术寻求以最低可能的比特率传输图像并且还以最小的感知质量损失来重建该图像。这些早期的努力使用使均方误差最小化(“MMSE”)的信息理论。但是人类的眼睛不能感知均方误差意义上的质量,传统的MMSE编码理论不能必定获得使人眼满意的效果。而且,应用到活动视频景物的人类欣赏的传统的MMSE理论不能获得满意的效果。
对于某些波长,人眼可以看见在黑房间内的光的单光子。人类视觉系统(“HVS”)的这种敏感度也可用于在视频景物中的量化噪声和编码人工因素。HVS的这种敏感度从视频图像的一部分到另一部分而不同。例如,在视频景物的很亮和很暗的区域对量化噪声和编码人工因素的人类敏感度(对比度灵敏度)要差。在包含大结构变化或者具有大对比度或信号差异的复杂(busy)图像区域中,HVS对失真的敏感度降低。在这些复杂区域中,量化噪声和编码人工因素在复杂图像上损失。这被称为掩蔽效应。在结构变化小的图像的平滑部分,人类对对比度和失真的敏感度提高。例如,在盐容器中的胡椒粉的单个颗粒可以马上被识别和分离出来。同样,在视频监视器中的单个无用像素如果位于监视器的工作区的中心的可视均匀区则是可识别的和恼人的,但是如果混在杂色的工具栏中靠近边缘处则难以识别。
在图像以低比特率被编码的情况下发生的令人讨厌的人工因素有成块化、模糊、成环化和色彩析出。成块化是与由在低复杂区域的粗略量化引起的8×8离散余弦变换的形状相关的人工因素。有时这引起直线的像素化。模糊是在中度结构变化和大结构变化区域中的空间细节上损失的结果。成环化和色彩析出发生在高频量化差的平缓的背景上的边缘。色彩析出特别针对重色度的边缘。在活动视频场景中,这些人工因素显示为运行时的复杂和肮脏的未遮盖背景。在帧间的较明显的人工因素如果重复的话可以导致运行时的闪烁。
通常对于HVS来说,视频信号的局部变化在很小的范围内(从帧到帧或从宏块到宏块)是可识别的。这意味着理想上量化步长应当针对视频帧内的每个宏块或其他小的区域子单元(“部分”)而计算。因此,量化步长应当与在每个宏块或部分中的变化或一些其他尺度成正比。自适应与统一量化的对比度
以往,发明者已经使用了下面两种方法来选择QP的值:统一量化和自适应量化。
统一量化方法为一个帧内的所有宏块选择相同(或近乎相同的)的QP。其结果,由数据压缩引起的量化噪声和编码人工因素在整个帧中均匀地分布。
自适应量化方法使得视频场景内的不同部分被编码为具有不同的数据压缩程度,因此具有不同的保真度。这种方法改变QP的值以便量化噪声按照HVS的至少一个属性而分布。自适应量化的目标是优化每个视频场景的可视质量和从视频场景到视频场景的可视质量,同时通过保持低比特率而保持了存储比特。例如,由于人眼对于在复杂或结构变化大的部分的量化噪声和编码人工因素不太敏感,对应的QP可以提高,导致复杂区域的粗略的量化和较低的比特率要求。由于人眼对于平缓的或小结构变化的区域中的量化噪声和编码人工因素更敏感,对应的QP可以降低以保持或改进视频质量,导致细致的量化和但是较高的比特率要求。
虽然MPEG标准允许自适应量化,但在MPEG标准中并未规定包含使用自适应量化改进视频质量的规则的算法。结果,两种编码器可以使用完全不同的自适应量化算法并且每个仍然产生有效的MPEG比特流。MPEG2实验模式5(“TM5”)是按照例如空间频率和视频掩蔽之类响应HVS的特性寻求提供改进的主观感知视频质量的一种这样的自适应量化方法。
一些自适应量化方法的共同问题是,虽然它们可以改进一些视频场景区域的视频质量,它们也可以降低其他方面的质量。例如,如果细化在视频场景的一些区域中的细节所需要的额外比特的数量非常高,则对于剩余区域分配的比特数量会太小,后者的量化噪声和编码人工因素可以变得非常易于识别和恼人。
另外,一些宏块可以包含难于编码的平滑结构变化,因为它们较差地被预测,而其他宏块可以包含较好预测和易于编码的结构变化大的区域。已知的方法在使用QP时未将此考虑在内。
现有技术的说明
下面通过下列非专利的参考资料来说明示意性的以往的方法,这些方法试图对于每个宏块进行量化以便由HVS感知的视频质量在整个帧内是均匀的:Puri和R.Aravind的“利用自适应感知量化的活动补偿视频编码”;Sultan和H.A.Latchman的“基于HVS(人类视觉系统)的用于MPEG视频编码器的自适应量化方案”;S.H.Tan,K.K.Pang和K.N.Ngan的“利用自适应量化的分类感知编码”;和N.I.Choo、H.Lee及S.U.Lee的“用于视频编码的简单自适应量化算法”。这些参考资料所述的所有方法每个都具有至少一个缺陷。上述参考资料中的所有方法按照结构变化情况而对宏块分类,但是未考虑比特率的预测精度的效果。一些宏块被精确地预测,需要很少的比特来编码,但是其他类似结构变化程度的宏块未被精确地预测并且可能需要许多比特来编码。这一对于类似结构变化程度的宏块的比特要求的可变性应当是计算QP的量值的一个因子。这些方法未能节省比特消耗,并且在视频场景的一些部分中浪费了比特而未显著地改善视频质量。另外,其中一些方法对于一次完成的视频编码并不合适。而且有几种方法利用特殊的手段来测量宏块的结构变化。这使得硬件编码器的设计复杂化,难于在可编程LSI(大规模集成电路)芯片中实现。
针对自适应量化的专利参考资料未说明节省比特消耗和易于实现的一个满意的方法。
例如,授予Murakami等人的名为“帧间自适应矢量量化编码装置和视频编码传输装置”的美国专利第4,710,812号,授予Yoon的名为“基于自适应量化技术的视频信号编码方法和装置”的美国专利第5,861,923号,未考虑每类宏块所要求的比特的数量。在这两种参考资料中的方法可以容易地产生图像质量的下降,例如通过减小在平缓的宏块中的量化步长。如果没有结构变化大的宏块并存在许多平缓的宏块,则该平缓的宏块将消耗许多比特,那么将剩余较少的比特用于中度结构变化的宏块,因此产生可识别的量化噪声和编码人工因素。
授予Juri等人的名为“具有自适应量化的视频信号比特率减小装置”的美国专利第5,481,309号,授予Gonzales等人的名为“具有自适应比特分配和量化的活动视频压缩系统”的美国专利第5,231,484号,都提出了改变人眼不敏感的视频场景的部分的量化步长。但是在这两个参考材料中,由于这些方法未基于预测误差能量而改变QP,所以视频质量会降低。
授予Ryoo的名为“利用自适应量化的视频信号比特数量控制”的美国专利第5,990,957号,涉及一种方法,其中QP按照人类视觉敏感度的一些方面而改变。但是该技术要求预先分析,不适用于一次完成的编码器。
                            发明内容
本发明的目的是提供一种利用在保持比特的同时优化感知的视频质量的自适应量化技术来数字编码视频信号的一次完成的方法。本发明可以被应用到其中在视频帧中量化可以被改变的任何视频编码应用中。
本发明通过提高在量化噪声和编码人工因素对于人类视觉系统不易识别的部分中的量化和降低在量化噪声和编码人工因素对于人类视觉系统易于识别的部分中的量化而编码一个视频帧。从提高的量化获得的多余的比特最好被用于执行降低平缓的部分的量化的步骤。在一个优选实施例中,如果提高或降低量化将要求比保持统一量化更多的比特,则统一量化被保持。
在另一个方案中,本发明通过判定是否利用降低的量化参数来编码平缓的部分所要求的比特的数量可以由通过利用提高的量化参数来编码所有的复杂区而提供的预测的多余的比特来提供,来预测是否存在足够的复杂区而使得特殊的视频帧的自适应量化有效。
通过下面参照附图详细说明本发明,本发明的上述和其他目的、特性和优点将会变得更加清楚。
                      附图说明
图1是本发明的一个优选方法实施例的流程图,示出了确定是否对于在一个视频帧序列中的给定视频帧使用自适应量化。
图2是本发明的一个优选方法实施例的流程图,示出了选择具有足够的复杂部分的视频帧来驱动自适应量化。
图3是本发明的一个优选方法实施例的流程图,示出了向由图2所示的方法所选择的视频帧中的每个宏块分配一个QP。
                     具体实施方式
本发明提供了有效的和简单的一次完成的由视频编码器可执行的自适应量化技术。本发明的方法在Sharp的MPEG2 LSI视频编码解码器中被发展。然而此技术可以被应用到其中在一个帧内量化可以被改变的任何视频编码应用。优选实施例使用一次完成的编码,但是替代的实施例可以使用多次完成的。
本发明通过向自适应量化引入比特率预测而克服了现有技术的缺陷。本发明计算量化变化对于编码视频帧所需要的比特率的影响,并且因此调节对于在一个帧内的宏块的QP。更具体地说,本发明利用了下列新颖技术的步骤:
1.在可以以比特的相对小的增加而更详细地编码平缓(flat)的、小结构
变化(low-textured)的部分,QP被减小。
2.仅仅当所预测的释放的比特的节省导致较大的剩余时,在复杂(busy)
的、大结构变化的、细节的损失对于人眼不易识别的部分,QP被增加。
3.如果在一个帧的所有小结构变化部分中细化细节所需要的额外的比
特的数量大于从在一个帧的所有复杂部分中减少细节而获得的释放
的比特的多余的数量,则自适应量化对于该视频帧停止。
根据实验,本发明的自适应量化方法或者产生等于或超过单纯统一量化的图像质量的图像质量,或者如果图像质量保持不变则节省最多大约40%到45%的比特率。
上面列出的新技术基于下列思想:仅仅如果QP将节省较大数量的比特才应当提高QP;否则,提高QP是比特开销的浪费并冒影响图像质量的危险。而且,仅仅如果QP的减小将消耗很少的另外的比特来增加更多的细节才应当减小QP,因为当比特消耗很大时,改善单个宏块的可视质量不是有效的。由于仅仅在刚才列出的特殊情况下QP才提高或减小,存在QP不适用于每个宏块的许多情况,统一量化被用作缺省方法。本发明将上面列出的新技术、结合到自适应地提高或降低在一个视频帧中宏块的QP的方法实施例,如果上面讨论的所选的条件未满足则回复到均匀的QP。
应当注意,响应于某些条件对于特殊的视频帧停止自适应量化(并且暂时回复到统一量化)本身就是自适应的。但是为了清楚,此暂时的回复到统一量化将被描述为“将自适应量化启动或停止的自适应量化方法”或“将本身启动或停止的自适应量化”。定义
AAC-             在一个宏块中的AC值的绝对和
AC-              活动系数
ActMAX-         在宏块中的子块的差异的最大值
ActMIN-         在宏块中的子块的差异的最小值
BOVER-           降低在一个视频帧的一组平缓宏块中的量化步
                 长Q所多花费的比特数量
BSAVED-          提高在一个视频帧的一组复杂宏块中的量化步
                 长Q所节省的比特数量
BestAE-          一个宏块的预测误差的绝对值的和
比特消耗-        执行一个功能所需要的比特数量复杂部分-           描述大结构变化、复杂图像的或不规则边缘的
                视频图像的在视频场景中的至少一个宏块或连
                续的宏块DCT-                离散余弦变换,用来产生表示一视频像素块的
                频率的数学算法降低的量化-         降低的数据压缩,需要用于编码视频部分的更
                多的比特或更高的比特率并且一般提供更大的
                可视细节EAQ-               宏块的能量值的平方根EBUSY-             复杂宏块的能量的和EFLAT-             平缓宏块的能量的和ERAT-              更新的或过滤的EFLAT/EBUSY值ERAT-10-            EFLAT和EBUSY(乘以10)的过滤比平缓部分-           描述具有小结构变化或平滑边缘的视频图像的
                在视频场景中的至少一个宏块或连续的宏块提高的量化-         提高的数据压缩,需要用于编码视频部分的更
                少的比特或更低的比特率并且一般提供更少的
                可视细节KB-                依赖于在一个视频帧中的一组复杂宏块的参数KF-                依赖于在一个视频帧中的一组平缓宏块的参数LSI-                大规模集成电路宏块-               视频帧的一个16×16像素区Mbtype-             宏块的类型(在之内或在之间)Q-                  量化步长QP-                 表示当前宏块的量化步长的量化参数。用于
                H.263知MPEGQVBR-              用于例如来自编码器的VBR(可变比特率)率
                控制电路的帧的基本、缺省或均匀的QP部分-               描述具有类似的可视特点的视频图像的视频场
                景的至少一个宏块或连续的宏块子块-               一个宏块的一个8×8像素区
TBUSY-             针对ActMIN的任意阈值,在其上的宏块可以被
                   分类为复杂
TFLAT-             针对ActMAX的任意阈值,在其下的宏块可以被
                   分类为平缓
本发明的方法涉及可以避免现有技术遇到的问题的视频编码。优选实施例的自适应量化方法通过最好结合和互连三个步骤以较低的比特率消耗获得更高的视频图像质量:在平缓、低比特率宏块中量化降低;在复杂、高比特率宏块中的量化提高;如果在视频帧中存在不够复杂的宏块则以统一量化取代上述两个步骤。这三个步骤的相互关系将利用图1-3中的流程图来说明,随后将以数学方法解释。
图1着重于在自适应量化和统一量化之间的确定10。如果在视频帧中提高和降低量化更有效,因为视频质量的提高将不需要比统一量化更多的比特,那么该方法将将在复杂部分中提高量化12并在平缓部分中降低量化14。如果对于给定的视频帧来说使用自适应量化不是更有效,通常因为没有足够的复杂部分来产生多余的额外比特来降低在平缓部分中的量化,那么该方法对于整个视频帧保持统一量化18。当视频帧已经被整体编码时,该方法查看是否该帧是在视频序列中的最后一帧16。如果它不是最后一帧,那么该方法处理序列中的下一帧。
图2示出了本发明如何在编码诸如MPEG视频帧的一系列视频帧的过程中最好地确定量化参数。具体说,图2示出了确定是否利用自适应量化参数量化一个特殊的完整视频帧或是否对于在该特殊视频帧中的所有宏块而言缺省为统一量化参数。在开始,编码器输入一个视频帧20并且可选地将该视频帧划分为宏块作为要量化的基本单元30。每个宏块的的图像结构随后可以被从宏块中的子块的最大和最小差别或活动来计算出来40。用于编码每个宏块的比特消耗最好由预测误差能量公式计算或预测50。每个宏块可以随后被分类为复杂、一般或平缓60。
接下来,可以对关于是否在视频帧中存在足够的复杂的宏块来使得自适应量化有效作出计算。如果来自提高视频帧的所有复杂宏块中的量化参数的比特消耗节省释放了足够的比特来允许在一个视频帧中的所有一般和/或平缓的宏块中的降低的量化和更高的分辨率(需要更多的比特),则存在足够复杂的宏块来使得自适应量化有效。另一方面,如果在视频质量中的改进不能被通过提高在视频帧中的所有复杂宏块中的量化而释放的多余比特所使能,则不存在足够的复杂宏块来判定自适应量化。
当对于视频帧自适应量化需要比统一量化更多的比特的时候,即当自适应量化不能自己承担比特消耗的时候,优选实施例中自适应量化方法最好停止。因此,优选实施例将自适应量化应用到包含大比例复杂部分的视频序列中70、100,但是可以将统一量化应用到缺少大比例复杂部分的视频序列中70、80。
图3示出了一个示范实施例,它是关于一个编码器可以如何分配自适应量化参数给有足够的复杂宏块来使得自适应量化有效的视频帧中的宏块。一个宏块可以被分类为例如复杂、一般或平缓120。在一种变化形式中,此分类可以从对于整个视频帧的宏块的以往标记来获得(图2中的60)。如果要处理的宏块被分类为平缓,那么优选的方法确定是否利用降低的QP编码该宏块需要较少的额外比特130。换而言之,改进单宏块的视频质量不值得用大的比特消耗。优选的方法最好寻求机会来利用非常少的额外比特来提高图像质量。如果提高在HVS对量化噪声和编码人工因素更敏感的平缓宏块中的视频质量需要很少的额外比特,那么该宏块将利用降低的QP来编码140。如果降低对于平缓宏块的QP来获得视频质量的仅仅一个小的增加需要太多的额外比特,那么该宏块最好利用用于统一量化的基本的或缺省的QP来编码150。
如果该宏块被分类为复杂160,那么该优选的方法判定是否在那个宏块中利用较大的QP提高量化将导致较大量的所释放的比特。如果用于复杂宏块的提高量化的比特率节省将产生多余的比特,那么该宏块将利用提高的QP编码180。然而如果应用到视频帧中另一处的视频质量的比特率节省为低,则在复杂宏块中的提高量化不是有效的。复杂宏块的不加区别的量化可能带来量化噪声和人工因素的无用的引入。如果没有实质的比特率节省,复杂宏块将利用用于统一量化的基本或缺省QP来编码190。对于是否存在实质的比特率节省的判定可以基于任何因素,包括但是不局限于预定的阈值或作为另一个选择,在至少一个视频帧中的一些或全部其他宏块编码所需要的比特的计算。
优选方法的一些变化方式利用用于统一量化的基本或缺省QP来编码一般的宏块(不是平缓的或复杂的)200。在其他的变化方式中,一般宏块可以通过一个优选实施例的方法被自适应量化,该方法从HVS不太可能注意到量化噪声和编码人工因素的部分提取比特并使用所提取的比特来在HVS更可能注意到量化的部分产生更大的可视细节。
在QP被分配给特殊的宏块之后,该方法可以对于在视频帧中的每个宏块重复直到整个帧被编码210。在平缓的、低比特率的宏块中降低量化
如图3所示,一个优选实施例可以减小平缓宏块的量化步长120、130、140。下面是用于完成此步骤的一种示范性具体方法。
一个宏块包含16×16像素并经常被划分成4个块,每块包含8×8像素。该四块的每块中的差异可以通过下面来计算: act j = 1 64 Σ i = 1 64 ( F ( i ) - m ) 2 , j = 1,2,3,4 . . . . . . . ( 1 ) 其中actj是宏块中的第j块的差异或“活动”,F(i)是在该块中的第i个像素的亮度值,m是像素平均值。在MPEG2中,一个宏块可以被划分为两个分离的区,因此另外4个块可以被考虑,j取自1和8之间的数值。ActMAX可以定义如下:
ActMAX=max{act1,act2,...,act8}            (2)在一个优选实施例中,如现有技术一样,被当作平缓块的必要条件可以是最大活动ActMAX低于阈值TFLAT
在图3中,量化步长最好仅在易于编码的平缓部分中被减少120、130、140(即这不需要很多的额外比特)。否则,用于降低该步长的比特率消耗会太高。例如,如果一个宏块相当地平缓,但是未被精确地预测(如在视频场景的封闭部分),则与良好预测的平缓宏块相比该宏块将需要许多另外的比特要编码。如果QP被降低,大量的比特将被用于编码其中对于HVS来说可视效益不太易于识别的宏块。
在图2和3中,对于用于编码一个宏块的预测的比特率要求50和对于一个宏块易于编码的判定130、140可以从例如预测误差和量化步长之间的关系来计算。更具体而言,平均来说,对于宏块的预测误差σ2的差异可以遵照下式: σ 2 = AΔ 2 + Q 2 12 + n , . . . . . ( 3 ) 其中A随着宏块的结构的变化而增加,Δ是活动向量精确度(如典型的Δ=1/2像素),Q是用于编码宏块的预测的量化步长,n是不可预测的噪声(如摄像机噪声,光变化等)。
从方程(3),可以确定预测误差小于Q2/12的宏块通常容易编码,即这样的一个宏块已经被精确预测并且应当在给定的压缩水平上使用较少的比特。
在Sharp的LSI中,预测误差差异的值σ2经常不能得到。但是BestAE的值(在预测误差中的绝对值的和)通常易于从活动估计来获得。实际的实验显示:
Figure A0210779300191
并且,作为结果,用于确定宏块易于编码的条件,即, &sigma; 2 < Q 2 12 , . . . . . . ( 5 ) 可以被大约相当于 BestAE 256 < 0.7 Q 12 &cong; Q 5 . . . . . . ( 6 ) 对于内部宏块,BestAE的值可能不相关,因为这些宏块不可能利用预测被编码。在这种情况下,可以利用AAC值(即在DCT内的绝对AC系数的和),它也可以在Sharp的LSI中计算。但是AAC的值被除以1.4以补偿关于内部像素比像素之间更相关的事实。换而言之,带有给定的AAC的一个内部宏块一般将需要比带有相同的BestAE值的宏块之间更少的用于编码的比特。
总而言之,对于本发明的自适应量化技术的选择平缓的宏块的过程可以通过下面的示例来说明:
●如果该宏块是内部的,则设定
EAQ=(AAC/1.4)/256≈AAC/358,
否则设定EAQ=BestAE/256
●如果EAQ<Q/5和ActMAX<TFLAT,该宏块被分类为平缓的。
在一个优选实施例中,对于平缓的宏块量化步长Q一般通过大约2的因子(QP=Q/2)来减少。可以采用一个优选值TFLAT=175。由于此阈值相当高,宏块的主要分类可以通过其他手段执行,如使用在数值EAQ和量化步长Q之间的关系。在复杂、高比特率宏块中的提高量化
人眼对于在复杂、大结构变化的部分中的量化噪声和编码人工因素不太敏感,如图3所示,一个优选实施例可以提高复杂、大结构变化的宏块中的量化步长160、170、180。在这种情况下,ActMIN可以定义为:
ActMIN=min{act1,act2,...,act8}         (7)与现有技术一样,如果最小活动ActMIN高于某一阈值TBUSY,则宏块最好被定义为复杂的。
然而,在本发明的优选实施例中,量化步长可以仅仅在需要较大量的比特要编码的复杂、大结构变化部分中被提高160,170,180。这是为了防止即使很小的视频质量降级的危险,除非大量的多余比特被释放用于其他宏块中。如果一个部分是大结构变化的但是不需要大量的用于编码的比特,它可能被确定不提高QP 160、170、190。例如,如果对于结构变化的静态(从一个帧到下一个帧)宏块(如在背景中)或对于良好预测的宏块提高QP,所提高的QP将不会释放许多多余的比特用于其他宏块。这样的一个无效的QP的提高无必要地承担了引入诸如量化噪声和编码人工因素的视觉误差的危险并且在量化开销上浪费了比特。
从方程(3)中,可能采用下面的标准来确定宏块难于编码: &sigma; 2 > 4 Q 2 12 . . . . . . ( 8 ) 它大致相当于: BestAE 256 > 0.7 Q 12 / 4 &cong; 2 Q 5 . . . . . . ( 9 )
总之,选择复杂宏块的处理可以在下面的示例中说明:
●如果该宏块是内部的,则设定
  EAQ=(AAC/1.4)/256≈AAC/358,
  否则设定EAQ=BestAE/256
●如果EAQ>2Q/5和ActMIN>TBUSY,则该宏块被分类为复杂的。
在一个优选实施例中,对于复杂的宏块量化步长Q一般通过大约2的因子(QP=2Q)来增加。可以采用一个优选值TBUSY=125。由于此阈值相当低,宏块的主要分类可以通过其他手段执行,如使用在数值EAQ和量化步长Q之间的关系。对于带有复杂部分的视频场景的限定的自适应量化
现有技术方法几乎总是在视频场景的平缓宏块中降低量化步长Q。这可能是一种聪明的方法,因为在平缓的宏块中的量化噪声和编码人工因素更容易看见。然而它也可以带来图象质量上的降低。因此,如图2所示,本发明的优选实施例可以限定对于带有阈值数量的复杂部分的视频场景的自适应量化70、100以便来自量化复杂部分的多余的释放比特可以被用来向平缓部分增加更多的细节而不提高整个帧的整体比特需要。
作为自适应量化方法与在不含有复杂部分的视频场景中的统一量化方法的示范性比较,考虑其中多数宏块为平缓的、一些为中度结构变化的(“一般”)、但是没有一个为复杂或大结构变化的两个相同的帧。其中之一将被自适应量化,另一个相同的帧将被统一量化。在自适应量化的帧中,用Q/2和Q分别表示用于平缓的和中度结构变化的宏块的量化步长。在统一量化的帧中,统一的步长Q’被用于编码对每个类型的宏块分配了相同数量的比特的平缓的和中度结构变化的宏块。在后一种情况中,Q’将取Q和Q/2之间的值。实际上,Q’将偏向于Q/2,因为统一的Q’情况不因量化额外开销而受到损害。
在比较通过这两种不同方法编码的两个相同的帧中,自适应方法编码(对于平缓的宏块为Q/2,对于中度结构变化的宏块为Q)的那一个将显示比统一量化的帧有在平缓部分中的一些质量上的改进(因为Q/2比统一步长方法的对应的Q’要小)。然而,在中度结构变化的部分质量会变差(因为Q大于Q’)。作为结果,人类的观察者不会必然感知到比另一个具有更好图象质量的帧,因为两者中可以存在不同的视觉人工因素。事实上,向中度结构变化的部分引入可视的量化噪声和编码人工因素比在小结构变化的部分更为容易并且在小结构变化的部分该人工因素不令人眼厌烦,因此观察者可能经常更喜欢以统一Q’方法编码的帧。在本发明的优选实施例研发中的实验确认了当自适应量化被无区别地施加到缺少复杂部分的视频场景中的时候,在中度结构变化部分中的量化噪声和编码人工因素容易被识别和恼人。
由于对于平缓宏块的量化步长Q的降低可能降级中度结构变化的宏块的图象质量,所以希望避免降低平缓宏块的量化步长Q,除非通过量化复杂宏块提供了编码平缓宏块所需要的额外比特。如图2所示,优选实施例最好仅仅当从提高复杂部分的量化步长而释放的多余的比特超过通过降低平缓部分的步长所消耗的另外的比特的时候才使用自适应量化参数70、100。因此,与对整个帧使用固定Q的现有技术方法相比,优选实施例当编码视频帧的时候将理想地消耗与现有技术方法相比相等或更少的比特。
用于以固定量化步长Q编码在一组N个宏块比特的数量BN可以通过下式给出: B N = K N &Sigma; N &sigma; i 2 Q 2 . . . . . ( 10 ) 其中σi 2是该组中对于第i个宏块的预测误差差异,KN是依赖于该组的参数。下面,设Q为用于一个帧内的中度结构变化的宏块的基本步长。量化步长Q可以对于复杂宏块以因子a提高、并对于平缓宏块以因子a降低。换而言之,对于复杂宏块的步长为aQ,对于平缓宏块的步长为Q/a。更一般地,提高量化的因子不需要与降低其的因子相同,即aQ可以被用于提高量化,Q/b可以被用于降低量化,其中a和b不同。
设B为一组复杂宏块,通过提高在那些宏块中的量化步长而节省的比特数量大约为: B SAVED = K B &Sigma; B &sigma; i 2 Q 2 - K B &Sigma; B &sigma; i 2 ( aQ ) 2 = a 2 - 1 a 2 K B &Sigma; B &sigma; i 2 Q 2 . . . . . . ( 11 ) 类似地,设F为一组平缓宏块。通过降低那些宏块中的量化步长而超出的比特数量大约是: B OVER = K F &Sigma; F &sigma; i 2 ( Q / a ) 2 - K F &Sigma; F &sigma; i 2 Q 2 = ( a 2 - 1 ) K F &Sigma; F &sigma; i 2 Q 2 . . . . . . . ( 12 ) 在如图2所示的优选实施例中,自适应量化70、100仅仅在BSAVED大于或等于BOVER的时候被执行;否则,优选的实施例将承受与现有技术方法类似的缺陷。通过比较方程(11)和(12)中的公式,可以获得下面的表达式:
BSAVED>BOVER a 2 - 1 a 2 K B &Sigma; B &sigma; i 2 Q 2 > ( a 2 - 1 ) K F &Sigma; F &sigma; i 2 Q 2 , . . . . . ( 13 ) E BUSY > K F K B a 2 E FLAT , 其中EBUSY和EFLAT可以定义如下: E BUSY = &Sigma; B E AQ , i 2 . . . . . . ( 14 ) E FLAT = &Sigma; F E AQ , i 2 EAQ,i是在各组中对于第i个宏块的EAQ的值。EAQ是BestAE/256或(AAC/1.4)/256,它们与σ相关。对于KF/KBa2可以采用优选的保守值600。利用此保守值,方程(13)可以表示如下: 100 E FLAT E BUSY < 6 . . . . . . ( 15 ) 在优选实施例的一种变化形式中,自适应量化仅仅当满足方程(15),即当在复杂部分节省的比特数量大于或等于在平缓部分消耗的另外的比特的时候将被执行70、100。但是在一些实施例中,方程(15)左面的比可以从帧到帧大幅度波动,因此在一些变化形式中,可能使用线性滤波器来平滑该波动: E RAT = 0.8 E RAT + 0.2 * 100 E FLAT E BUSY , . . . . . . ( 16 ) 其中ERAT是在方程(15)中的比的更新的或过滤的值。为了方便,方程(15)的两边可以乘以10以便避免在汇编编码(下部分讨论)中乘以0.8和0.2。总之,优选实施例最好仅仅在满足下面不等式时执行自适应量化70,100。
ERAT-10=10ERAT<60                        (17)优选实施例的方法
在前面部分的理论中对执行自适应量化设计了有效的方法。在本部分中,逐步介绍优选实施例的方法。这些方法在存储和计算要求方面简单,因此可以利用诸如使用极少数量的指令的Sharp的LSI汇编编码的平台来进行实现。例如,自适应量化可以通过按照不同的帧类型改变一些参数来改善。但是在一个优选实施例中,为了简便该参数被保持固定。在实验上,一个虽然简化了的优选方法获得与那些更复杂的优选实施例相近的性能。
在图2所示的优选实施例中,宏块可以按照图象结构变化40和比特消耗50被分类60为例如三类(即一般、平缓和复杂)。图象结构变化40可以以块最小和最大差异或活动来衡量,比特消耗50可以例如从预测误差能量和量化水平来估计。QP值最好对于平缓宏块降低并对于复杂宏块提高。
在P-RAM中,可以对下列参数设置变量:
EFLAT=EBUSY=0
ERAT-10=20示例步骤1:在编码当前帧之前初始化。
过滤的比ERAT-10可以被更新为: E RAT - 10 = 8 * E RAT - 10 + 2 * [ 100 * E FLAT E BUSY ] &cong; 8 * E RAT - 10 + 2 * [ E FLAT max ( 1 , E BUSY / 100 ) ]
(方程的第二部分引入了最大(max)运算符来避免在汇编编码实现中被0除)
下面,可以初始化下列参数:
QVBR=基本量化步长QP(由如来自VBR比率控制技术的编码器的比率控制电路给出)
EFLAT=EBUSY=0示例步骤2:可以如此例中对当前宏块计算EAQ、ActMAX和ActMIN
如果Mbtype是内部的,设定EAQ=(AAC/1.4)/256≈AAC/358,
否则设定EAQ=BestAE/256,其中:
ACTMIN=min{act1,act2,...,act8}
ACTMAX=max{act1,act2,...,act8}示例步骤3:可以如这些例子中对当前宏块选择QP:
QP=QVBR
如果ERAT-10<60,那么......
在线性量化的情况下,平缓和复杂宏块可以被分配一个QP并且对于平缓和复杂宏块的能量的和可以如这些例子中被更新:
平缓:如果EAQ<QVBR/5和ACTMAX<175
      则设定QP=QVBR/2
            EFLAT=EFLAT+EAQ*EAQ
复杂:如果EAQ>2QVBR/5和ACTMIN>125
      则设定QP=2QVBR
          EBUSY=EBUSY+EAQ*EAQ
在非线性量化中,平缓和复杂宏块可以被分配一个QP,并且对于平缓和复杂宏块的能量的和可以如这些例子中被更新:
平缓:如果EAQ<QVBR/5和ACTMAX<175
      则设定QP=QVBR/1.5
           EFLAT=EFLAT+EAQ*EAQ
复杂:如果EAQ>2QVBR/5和ACTMIN>125
      则设定QP=1.5QVBR
            EBUSY=EBUSY+EAQ*EAQ利用在TM5视频编码解码器中的优选实施例的实验结果
本发明的优选实施例的优化的自适应量化被首先用于公知的TM5MPEG2视频编码解码器中。各个示例实验将下面列出的两个技术应用到三个相同的视频序列并比较结果:
●利用优选实施例的自适应量化方法,导致对于编码序列的比特率B。
●利用对于所有宏块相同量化步长的统一量化方法,其中步长被改变
  直到相同的整个比特率B如从上述的自适应方法一样获得。
1.姑娘跳舞的第一视频序列
该序列的开始有带有两种颜色的背景。优选实施例的自适应量化方法降低了背景中的量化噪声和编码人工因素。在序列的其余部分中,姑娘们在跳舞。在跳舞序列中的结构变化非常平滑,因此没有什么潜力来通过自适应提高复杂、大结构变化的区域来释放多余的比特。实际上,没有满足方程(16)和(17)中的具有有利的复杂对平缓宏块之比的阈值条件,优选的方法对于这部分视频序列停止了自适应量化。该方法停止了将有额外的比特率消耗的视频场景的自适应量化。额外的比特率消耗是因为缺少从其中可以释放多余的比特用于平缓部分的使用的复杂部分。
2.姑娘跳舞的第二视频序列(在嘴唇闭合后的场景,其中有几个闪光)
在这个视频序列中,优选实施例的自适应量化方法降低了在姑娘们脸上的成块的量化噪声和编码人工因素。一个有趣的改善是中心跳舞的姑娘脸上的一个黑斑在使用统一量化方法时出现和消失,但是使用优选实施例的自适应量化方法时看起来一致和自然。
3.花园的第三视频序列(带有天空、树木、房屋和花园的场景)
此场景因为有多种结构变化而从优选实施例的自适应量化方法获益最多。天空有较少的可识别的由于量化噪声和编码人工因素导致的成块,树木和房屋对人眼比相同视频序列的统一量化格式的情况更清楚。
统一量化方法的比特率随后被提高(几乎加倍)。这一利用更高比特率的统一量化方法随后被与优选实施例的自适应量化方法比较。对于人眼来说,在两种方法之间的图象质量相似,仅有可忽略的差别(统一量化方法在场景的天空部分给出了稍好的结果,在场景的其他部分给出稍差的结果,但是两个视频序列的整个质量则表现为相当)。在统一量化方法中的比特率的提高指出当优选实施例的自适应量化方法和统一量化方法被平衡来产生同等质量的视频场景的时候,优选实施例的自适应量化方法节省了整体比特率消耗的大约40%到50%。实验结果的总结
从这些和其他实施例中可得出下列结论:
●不论场景如何,通过使用优选实施例获得的图象质量与通过现有技
  术量化方法获得的总是一样好或更好。
●在结构变化全平滑的场景中,通过使用自适应量化获得的益处很小
  或没有。实际上,优选实施例的方法检测哪里大多结构变化是平滑
  的并利用方程(16)和(17)中的条件自动停止自适应量化以避免
  引入任何量化噪声和编码人工因素。
●在有多种结构变化的场景中,优选实施例的方法可以获得相当大的
  图象质量或者以另一种方式表达,高达40%到45%比特率节省。
在前面说明书中使用的术语和表达被用做说明的形式而非限定性的,它们不是要排除所述或示出的特性的等同物或其各部分。本发明的范围仅仅通过所附的权利要求书来定义和限定。

Claims (34)

1.一种用于编码视频帧的方法,考虑了人类视觉系统,所述方法包括步骤:
(a)在量化噪声和编码人工因素对于所述人类视觉系统难于识别的所述
   帧的各个部分提高量化;和
(b)在量化噪声和编码人工因素对于所述人类视觉系统易于识别的所述帧的各个部分降低量化。
2.如权利要求1的方法,包括:
(a)所述提高量化的步骤释放多余的比特;和
(b)所述降低量化的步骤需要额外的比特。
3.如权利要求2的方法,所述降低量化的步骤使用所述多余的比特来实现所需要的另外的比特。
4.如权利要求3的方法,还包括如果所述提高量化的步骤和所述降低量化的步骤将需要比保持统一量化的步骤更多的比特,则在所述视频帧中保持所述统一量化的步骤。
5.如权利要求3的方法,还包括如果所述多余的比特不足以实现由降低量化步骤所需要的所述另外的比特,则在所述视频帧中保持所述统一量化的步骤。
6.如权利要求3的方法,还包括如果所述提高量化的步骤和所述降低量化的步骤不比保持统一量化的步骤有效,则在所述视频帧中保持所述统一量化的步骤。
7.一种用于自适应量化视频帧的编码的方法,所述方法包括步骤:
(a)选择一个第一缺省QP值、一个比所述第一缺省QP值大的第二较
   大QP值和一个比所述第一缺省QP值小的第三较小QP值;
(b)预测利用所述第一缺省QP值来编码所述视频帧的基本数量的比特;
(c)将所述视频帧的部分划分为复杂部分和平缓部分;
(d)预测如果复杂部分利用所述第二较大QP值被编码则是否所述视频
   帧有足够的所述复杂部分来产生超过所述基本比特数量的多余的比
   特;
(e)预测是否利用所述的第三较小QP值所述的多余比特足够编码所
   述的平缓部分;
(f)如果所述视频帧有所述足够的复杂部分和所述多余的比特足够编码
   所述的平缓部分,则用所述第二较大QP值量化所述复杂部分,用
   所述第三较小QP值量化所述平缓部分;
(g)如果完全利用所述的第一缺省QP值来编码所述的视频帧将会比用
   所述第二较大QP值量化所述复杂部分和用所述第三较小QP值量
   化所述平缓部分更为有效,则完全利用所述的第一缺省QP值来编
   码所述的视频帧。
8.如权利要求7的方法,还包括对于多个视频帧中的每个重复步骤(a)-(g)的步骤。
9.如权利要求7的方法,其中如果所述视频帧没有所述足够的复杂部分,则完全利用所述的第一缺省QP值来编码所述的视频帧的所述步骤比用所述第二较大QP值量化所述复杂部分的所述步骤和用所述第三较小QP值量化所述平缓部分的所述步骤更为有效。
10.如权利要求7的方法,其中如果所述多余比特在数量上不足以编码所述平缓部分,则完全利用所述的第一缺省QP值来编码所述的视频帧的所述步骤比用所述第二较大QP值量化所述复杂部分的所述步骤和用所述第三小QP值量化所述平缓部分的所述步骤更为有效。
11.如权利要求7的方法,其中如果用所述第三小QP值编码所述视频帧的所有所述平缓部分所需要的预测数量的比特少于或等于通过用所述第二较大QP值编码所述视频帧的所有所述复杂部分而提供的预测数量的所述多余比特,则预测是否视频帧有足够的复杂部分的所述步骤还包括设定所述视频帧具有足够的复杂部分的一个标准。
12.一种基于所需要的比特的预测的视频编码的自适应量化的方法,所述方法包括步骤:
(a)提供一个视频帧;
(b)对于所述的视频帧建立统一的QP值;
(c)将所述视频帧划分成复杂部分、一般部分和平缓部分;
(d)在所述视频帧的所述平缓部分中将量化降低到小于所述统一QP
   值,该所述视频帧的所述平缓部分可以通过利用小于所述统一QP
   值的一个QP值编码所述的平缓部分所需要的所述预测相对较小增
   加的比特来编码;
(e)当利用大于所述统一QP值的一个QP值编码所述的平缓部分需要
   的所述要求的比特的预测的降低较大的时候,提高量化到大于所述
   视频帧的所述复杂部分中所述统一QP值;和
(f)如果用于利用小于所述统一QP值的所述QP值在所述视频帧中编
   码所有所述平缓部分的预测数量的所述要求的比特将大于通过利用
   大于所述统一QP值的所述QP值编码在所述视频帧中的所有所述
   平缓部分而提供的预测数量的多余比特,则对于所述视频帧的所有
   部分回复到所述统一QP值。
13.如权利要求12的方法,还包括对于多个视频帧中的每个重复步骤(a)-(f)的步骤。
14.如权利要求12的方法,将所述视频帧分类成复杂部分、一般部分和平缓部分的所述步骤还包括利用大、中度和小结构变化类别和对于在所述视频帧中的每个部分的至少一部分的预测的要求的比特值来分类可视的结构变化的步骤。
15.如权利要求12的方法,还包括对于在所述视频帧中的每个部分的至少一部分的能量值求和的步骤。
16.如权利要求14的方法,所述分类可视结构变化的步骤还包括从一组步骤中选择的步骤,该组步骤包括:
(a)利用至少一个差异值对于所述的每个部分的至少一部分计算所述的
   能量值;
(b)利用至少一个亮度值对于所述的每个部分的至少一部分计算所述的
   能量值;
(c)利用至少一个活动值对于所述的每个部分的至少一部分计算所述的
   能量值;
17.如权利要求14的方法,所述分类可视结构变化的步骤还包括利用预测误差能量值计算对于每个部分的预测的要求的比特值的步骤。
18.如权利要求12的方法,还包括以一个第一常数降低所述QP的步骤。
19.如权利要求12的方法,还包括以一个第二常数提高所述QP的步骤。
20.一种用于基于预测的比特率的编码视频帧的自适应量化的方法,所述方法包括步骤:
(a)降低所述视频帧的小结构变化部分中的QP,该视频帧可以利用所
   述预测的比特率的较小的提高而被编码。
(b)仅仅当所述预测的比特率降低较大时提高在所述视频帧的大结构变
   化的部分中的QP;和
(c)如果用于编码所述小结构变化部分的所述预测的比特率的所述较小
   的提高大于用于编码所述大结构变化部分的所述预测的比特率的所
   述降低,则停止所述提高QP和降低QP的步骤。
21.如权利要求20的方法,所述提高QP和降低QP的步骤还包括以一个常数提高或降低QP的步骤。
22.如权利要求21的方法,还包括从一组步骤中选择的步骤,该组步骤包括:
(a)对于线性量化选取大约2.0的常数;
(b)对于非线性量化选取大约1.5的常数。
23.如权利要求20的方法,还包括步骤:
(a)向解码器提供由所述自适应量化编码的至少一个视频帧的完全数字
   的表示;和
(b)以解码的形式在显示器上显示所述至少一个视频帧。
24.一种用于确定用于一个视频帧序列的数字存储的数据压缩率的方法,所述方法包括步骤:
(a)将所述视频帧序列划分成单独的视频帧;
(b)对每个视频帧建立通常的数据压缩率;
(c)将每个视频帧划分为多个部分;
(d)预测用于数字地存储每个部分的比特率消耗;
(e)预测每个部分的可视复杂度;
(f)对于其中所述的预测的可视复杂度小和用于数字存储的所述预测的
   比特率消耗小的每个部分,所述的通常的数据压缩率除以第一常
   数;
(g)对于其中所述的可视复杂度大和用于数字存储的所述预测的比特率
   消耗大的每个部分,将所述通常的数据压缩率乘以第二常数;
(h)如果用于数字存储其中所述的预测的可视复杂度小和用于数字存储
   的所述预测的比特率消耗小的所有部分的整体比特率消耗中的预测
   的提高的绝对值大于用于数字存储其中所述的预测的可视复杂度大
   和用于数字存储的所述预测的比特率消耗大的所有部分的整体比特
   率消耗中的预测的降低的绝对值,则对于在所述视频帧中的所有部
   分,保持所述的通常数据压缩率在近乎恒定的值;和
(i)以视频帧的所述序列编码每个视频帧的每个部分以获得所述视频帧
   序列的完全数字的表示。
25.如权利要求24的方法还包括步骤:
(a)向解码器提供所述视频帧的序列的所述的完全数字的表示;和
(b)以解码的形式在显示器上显示所述视频帧的序列。
26.如权利要求24的方法,其中预测用于数字地存储每个部分的比特率消耗的所述步骤还包括通过下列来计算所述比特率消耗的步骤:
(a)确定每个部分的能量参数;
(b)确定每个部分的量化步长;
(c)将所述能量参数的值的平方根小于被第三常数除的所述量化步长值
   的每个部分定义为具有用于数字存储的小比特率消耗;和
(d)将所述能量参数的值的平方根大于被第四常数相乘的所述量化步长
   值的每个部分定义为具有用于数字存储的大比特率消耗。
27.如权利要求24的方法,所述对于每个部分预测可视复杂度的所述步骤还包括通过下列来计算所述可视复杂度的步骤:
(a)确定每个部分的活动参数;
(b)确定用于对每个部分的所述可视复杂度分类的第一和第二阈值活动
   值;
(c)将所述活动参数的值小于或等于所述第一阈值活动值的每个部分定
   义为具有小可视复杂度;
(d)将所述活动参数的值大于所述第一阈值活动值和小于或等于所述第
   二个阈值活动值的每个部分定义为具有一般可视复杂度;
(e)将所述活动参数的值大于所述二阈值活动值的每个部分定义为具有
   大可视复杂度;
28.如权利要求24的方法,所述预测每个部分的可视复杂度的步骤还包括通过下列来计算所述可视复杂度的步骤:
(a)确定每个部分的最大活动参数;
(b)确定每个部分的最小活动参数;
(c)确定用于对每个部分的所述可视复杂度分类的第一和第二阈值活动
   值;
(d)将所述最大活动参数的值小于或等于所述第一阈值活动值的每个部
   分定义为具有小可视复杂度;
(e)将所述最大活动参数的值大于所述第一阈值活动值并且所述最小活
   动参数的值小于或等于所述第二阈值活动值的每个部分定义为具有
   一般可视复杂度;
(f)将所述最小活动参数的值大于所述第二阈值活动值的每个部分定义
   为具有大可视复杂度;
29.如权利要求24的方法,所述保持所述通常数据压缩率的步骤还包括通过对其中所述预测的可视复杂度小并且用于数字存储的所述预测的比特率消耗小的每个部分的所述比特率消耗求和来计算整个比特率消耗的所述提高的步骤。
30.如权利要求24的方法,所述保持所述通常数据压缩率的步骤还包括通过对其中所述预测的可视复杂度大并且用于数字存储的所述预测的比特率消耗大的每个部分的所述比特率消耗求和来计算整个比特率消耗的所述降低的步骤。
31.如权利要求24的方法,所述将所述通常数据压缩率除以第一常数和将所述通常数据压缩率乘以第二常数的步骤还包括执行线性量化的步骤。
32.如权利要求24的方法,所述将所述通常数据压缩率除以第一常数和将所述通常数据压缩率乘以第二常数的步骤还包括执行非线性量化的步骤。
33.如权利要求24的方法,所述保持所述通常数据压缩率的步骤还包括过滤对于每个视频帧的在小可视复杂度的所述部分和大可视复杂度的所述部分之间形成的比率的值以便虽然存在在单独视频帧的所述比率中的分离的波动但是所述的视频帧序列将保持所述的通常数据压缩率的步骤。
34.一种用于编码在视频帧中的数字图象的编码器,包括:
(a)帧划分器,用于将所述视频帧划分为多个部分;
(b)比特率预测器,用于预测用于数字存储每个部分的比特率消耗;
(c)可视复杂度预测器,用于预测每个部分的可视复杂度;
(d)量化除法器,用于对于其中所述的预测的可视复杂度小并且用于数   字存储的所述的预测的比特率消耗小的每个部分将通常数据压缩率除以第一常数;(e)量化乘法器,用于对于其中所述的预测的可视复杂度大并且用于数字存储的所述的预测的比特率消耗大的每个部分将通常数据压缩率乘以第二常数;和(f)量化平衡器,用于如果用于数字存储其中所述的预测的可视复杂度小和用于数字存储的所述预测的比特率消耗小的所有部分的整体比特率消耗中的预测的提高的绝对值大于用于数字存储其中所述的预测的可视复杂度大和用于数字存储的所述预测的比特率消耗大的所有部分的整体比特率消耗中的预测的降低的绝对值,则对于在所述视频帧中的所有部分将通常数据压缩率保持为几乎恒定的值。
CN02107793.2A 2001-03-23 2002-03-22 基于比特率预测和预测误差能量的自适应量化 Expired - Fee Related CN1217545C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/816,983 2001-03-23
US09/816,983 US6831947B2 (en) 2001-03-23 2001-03-23 Adaptive quantization based on bit rate prediction and prediction error energy

Publications (2)

Publication Number Publication Date
CN1378384A true CN1378384A (zh) 2002-11-06
CN1217545C CN1217545C (zh) 2005-08-31

Family

ID=25222091

Family Applications (1)

Application Number Title Priority Date Filing Date
CN02107793.2A Expired - Fee Related CN1217545C (zh) 2001-03-23 2002-03-22 基于比特率预测和预测误差能量的自适应量化

Country Status (5)

Country Link
US (1) US6831947B2 (zh)
EP (1) EP1250012B1 (zh)
JP (1) JP2002335527A (zh)
CN (1) CN1217545C (zh)
DE (1) DE60230946D1 (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100380982C (zh) * 2004-01-13 2008-04-09 索尼株式会社 图像编码方法和装置
WO2009111935A1 (zh) * 2008-03-11 2009-09-17 深圳市融创天下科技发展有限公司 一种视频图像宏块级自适应码率分配方法
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
CN1735208B (zh) * 2004-07-12 2011-12-14 微软公司 在运动补偿的时间滤波中的自适应更新
CN101627635B (zh) * 2007-02-21 2012-06-13 高通股份有限公司 三维视频编码
WO2012079237A1 (zh) * 2010-12-16 2012-06-21 北京航空航天大学 一种图像压缩中利用人眼视觉模型的小波系数量化方法
US8213503B2 (en) 2008-09-05 2012-07-03 Microsoft Corporation Skip modes for inter-layer residual video coding and decoding
CN102547225A (zh) * 2010-12-29 2012-07-04 中国移动通信集团公司 视频监控场景判别方法及其监控图像编码方法、及装置
CN102572380A (zh) * 2010-12-29 2012-07-11 中国移动通信集团公司 视频监控编码方法及其装置
US8340177B2 (en) 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
US8374238B2 (en) 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
CN103081469A (zh) * 2010-09-03 2013-05-01 松下电器产业株式会社 图像编码方法、图像解码方法、图像编码装置以及图像解码装置
CN103444180A (zh) * 2011-03-09 2013-12-11 日本电气株式会社 视频编码设备、视频解码设备、视频编码方法以及视频解码方法
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US8953673B2 (en) 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
CN106095358A (zh) * 2011-12-06 2016-11-09 杜比实验室特许公司 改进不同显示能力之间基于感知照度非线性的图像数据交换的装置和方法
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
CN107257426A (zh) * 2017-06-19 2017-10-17 成都优孚达信息技术有限公司 一种减少资源消耗的数据压缩方法
US10621952B2 (en) 2011-12-06 2020-04-14 Dolby Laboratories Licensing Corporation Perceptual luminance nonlinearity-based image data exchange across different display capabilities

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100525785B1 (ko) * 2001-06-15 2005-11-03 엘지전자 주식회사 이미지 화소 필터링 방법
JP2003061097A (ja) * 2001-08-09 2003-02-28 Sony Corp 画像符号化装置および方法、記録媒体、並びにプログラム
JP4769392B2 (ja) * 2001-09-25 2011-09-07 キヤノン株式会社 信号処理装置
US7418037B1 (en) * 2002-07-15 2008-08-26 Apple Inc. Method of performing rate control for a compression system
US7769084B1 (en) 2002-07-15 2010-08-03 Apple Inc. Method for implementing a quantizer in a multimedia compression and encoding system
JP4214771B2 (ja) * 2002-12-12 2009-01-28 ソニー株式会社 画像処理装置およびその方法と符号化装置
US7804897B1 (en) * 2002-12-16 2010-09-28 Apple Inc. Method for implementing an improved quantizer in a multimedia compression and encoding system
US7940843B1 (en) 2002-12-16 2011-05-10 Apple Inc. Method of implementing improved rate control for a multimedia compression and encoding system
US7352809B2 (en) 2003-02-21 2008-04-01 Polycom, Inc. System and method for optimal transmission of a multitude of video pictures to one or more destinations
US7327786B2 (en) * 2003-06-02 2008-02-05 Lsi Logic Corporation Method for improving rate-distortion performance of a video compression system through parallel coefficient cancellation in the transform
US7738554B2 (en) 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
US10554985B2 (en) 2003-07-18 2020-02-04 Microsoft Technology Licensing, Llc DC coefficient signaling at small quantization step sizes
US8218624B2 (en) 2003-07-18 2012-07-10 Microsoft Corporation Fractional quantization step sizes for high bit rates
US7778813B2 (en) * 2003-08-15 2010-08-17 Texas Instruments Incorporated Video coding quantization
US9351013B2 (en) * 2003-11-13 2016-05-24 Qualcomm Incorporated Selective and/or scalable complexity control for video codecs
US7796499B2 (en) * 2003-12-05 2010-09-14 Telefonaktiebolaget L M Ericsson (Publ) Method of and system for video fast update
US7869500B2 (en) * 2004-04-27 2011-01-11 Broadcom Corporation Video encoder and method for detecting and encoding noise
US7801383B2 (en) 2004-05-15 2010-09-21 Microsoft Corporation Embedded scalar quantizers with arbitrary dead-zone ratios
US7949051B2 (en) 2004-05-26 2011-05-24 Broadcom Corporation Mosquito noise detection and reduction
US8005139B2 (en) 2004-06-27 2011-08-23 Apple Inc. Encoding with visual masking
EP1762093A4 (en) * 2004-06-27 2011-06-29 Apple Inc MULTIPASS VIDEO CODING
US9578345B2 (en) 2005-03-31 2017-02-21 Euclid Discoveries, Llc Model-based video encoding and decoding
US9743078B2 (en) 2004-07-30 2017-08-22 Euclid Discoveries, Llc Standards-compliant model-based video encoding and decoding
US9532069B2 (en) 2004-07-30 2016-12-27 Euclid Discoveries, Llc Video compression repository and model reuse
JP4877449B2 (ja) * 2004-11-04 2012-02-15 カシオ計算機株式会社 動画像符号化装置および動画像符号化処理プログラム
CN101069432B (zh) * 2004-12-02 2015-10-21 汤姆逊许可公司 用于视频编码器速率控制的量化参数的确定方法和设备
WO2006070787A1 (ja) * 2004-12-28 2006-07-06 Nec Corporation 動画像符号化方法、及びこれを用いた装置と、コンピュータプログラム
US20060256856A1 (en) * 2005-05-16 2006-11-16 Ashish Koul Method and system for testing rate control in a video encoder
US8422546B2 (en) 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
US8064516B2 (en) * 2005-06-02 2011-11-22 Broadcom Corporation Text recognition during video compression
TWI308459B (en) * 2005-10-26 2009-04-01 Univ Nat Chiao Tung Context-aware frame memory scheme for motion compensation in video decoding
US8503536B2 (en) 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US8059721B2 (en) 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
US8130828B2 (en) 2006-04-07 2012-03-06 Microsoft Corporation Adjusting quantization to preserve non-zero AC coefficients
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US7974340B2 (en) 2006-04-07 2011-07-05 Microsoft Corporation Adaptive B-picture quantization control
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
TWI386064B (zh) * 2006-10-10 2013-02-11 Nippon Telegraph & Telephone 內部預測編碼控制方法及裝置,其程式,以及記錄有程式之記憶媒體
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
US8238424B2 (en) 2007-02-09 2012-08-07 Microsoft Corporation Complexity-based adaptive preprocessing for multiple-pass video compression
JP4901772B2 (ja) * 2007-02-09 2012-03-21 パナソニック株式会社 動画像符号化方法及び動画像符号化装置
US8498335B2 (en) 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US8243797B2 (en) 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US8442337B2 (en) 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
US8090016B2 (en) * 2007-05-17 2012-01-03 Zoran Corporation Activity normalization for video encoding
US8331438B2 (en) 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
US20090115789A1 (en) * 2007-11-07 2009-05-07 Digi International Inc. Methods, systems and apparatus for maximum frame size
US8401071B2 (en) * 2007-12-19 2013-03-19 Sony Corporation Virtually lossless video data compression
US8189933B2 (en) 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US9326004B2 (en) 2008-06-03 2016-04-26 Broadcom Corporation Reduced memory mode video decode
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
WO2010035433A1 (ja) * 2008-09-25 2010-04-01 パナソニック株式会社 画像符号化装置、デジタルスチルカメラ、デジタルビデオカメラ、撮像素子、プリンタおよび画像符号化方法
FR2939546B1 (fr) * 2008-12-05 2011-02-11 Thales Sa Procede et dispositif pour l'enfouissement d'une sequence binaire dans un flux video compresse
EP2377321A1 (en) * 2008-12-17 2011-10-19 Telefonaktiebolaget L M Ericsson (PUBL) Adaptive quantization based on bit ratio
KR101538704B1 (ko) * 2009-01-28 2015-07-28 삼성전자주식회사 보간 필터를 적응적으로 사용하여 영상을 부호화 및 복호화하는 방법 및 장치
JP5100689B2 (ja) * 2009-03-11 2012-12-19 三菱電機株式会社 動画像符号化装置及び動画像復号装置
US8848788B2 (en) * 2009-05-16 2014-09-30 Thomson Licensing Method and apparatus for joint quantization parameter adjustment
US8655101B2 (en) 2009-06-04 2014-02-18 Sharp Kabushiki Kaisha Signal processing device, control method for signal processing device, control program, and computer-readable storage medium having the control program recorded therein
WO2011061957A1 (ja) 2009-11-17 2011-05-26 シャープ株式会社 符号化装置、復号化装置、符号化装置の制御方法、復号化装置の制御方法、伝送システム、および制御プログラムを記録したコンピュータ読み取り可能な記録媒体
US8824825B2 (en) 2009-11-17 2014-09-02 Sharp Kabushiki Kaisha Decoding device with nonlinear process section, control method for the decoding device, transmission system, and computer-readable recording medium having a control program recorded thereon
US10897625B2 (en) 2009-11-20 2021-01-19 Texas Instruments Incorporated Block artifact suppression in video coding
EP2538658A4 (en) 2010-02-15 2013-07-24 Sharp Kk SIGNAL PROCESSING DEVICE, CONTROL PROGRAM AND INTEGRATED CIRCUIT
US20110268180A1 (en) * 2010-04-29 2011-11-03 Naveen Srinivasamurthy Method and System for Low Complexity Adaptive Quantization
US20110280398A1 (en) * 2010-05-17 2011-11-17 Anatoly Fradis Secured content distribution system
WO2012043407A1 (ja) 2010-09-29 2012-04-05 シャープ株式会社 信号処理装置、制御プログラム、および集積回路
TWI686085B (zh) * 2012-11-29 2020-02-21 日商索尼半導體解決方案公司 攝像裝置及圖像感測器之資料傳送方法、資訊處理裝置及資訊處理方法以及程式
JP6226578B2 (ja) * 2013-06-13 2017-11-08 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム
US10091507B2 (en) * 2014-03-10 2018-10-02 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding
US10097851B2 (en) 2014-03-10 2018-10-09 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding
US9621917B2 (en) 2014-03-10 2017-04-11 Euclid Discoveries, Llc Continuous block tracking for temporal prediction in video encoding
US9848193B2 (en) * 2014-04-15 2017-12-19 Qualcomm Incorporated System and method for selecting quantization parameter (QP) in display stream compression (DSC)
TWI508531B (zh) * 2014-06-04 2015-11-11 Hon Hai Prec Ind Co Ltd 視訊編碼裝置及方法
CA2960617A1 (en) * 2014-09-11 2016-03-17 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding
US10057601B2 (en) * 2015-06-22 2018-08-21 Integrated Device Technology, Inc. Methods and apparatuses for filtering of ringing artifacts post decoding
EP3166313A1 (en) 2015-11-09 2017-05-10 Thomson Licensing Encoding and decoding method and corresponding devices
US20210067785A1 (en) * 2020-11-17 2021-03-04 Intel Corporation Video encoding rate control for intra and scene change frames using machine learning
US11653003B2 (en) 2021-07-16 2023-05-16 City University Of Hong Kong System and method for processing a stream of images

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1289656C (en) 1985-02-28 1991-09-24 Tokumichi Murakami Interframe adaptive vector quantization encoding apparatus
US5121216A (en) * 1989-07-19 1992-06-09 Bell Communications Research Adaptive transform coding of still images
US5231484A (en) 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
US5214507A (en) * 1991-11-08 1993-05-25 At&T Bell Laboratories Video signal quantization for an mpeg like coding environment
JP2940304B2 (ja) 1992-06-15 1999-08-25 松下電器産業株式会社 高能率符号化装置および高能率符号化方法および高能率符号化装置の復号装置
JP3348310B2 (ja) 1992-09-28 2002-11-20 ソニー株式会社 動画像符号化方法および動画像符号化装置
JPH08511385A (ja) 1993-04-16 1996-11-26 データ トランスレイション,インコーポレイテッド 可変量子化を用いた適応型画像圧縮
US5724097A (en) 1993-10-18 1998-03-03 Mitsubishi Denki Kabushiki Kaisha Adaptive quantization of video based on edge detection
KR100307618B1 (ko) * 1994-05-31 2001-11-30 윤종용 영상부호화방법및장치
US5802213A (en) * 1994-10-18 1998-09-01 Intel Corporation Encoding video signals using local quantization levels
KR100381830B1 (ko) 1995-03-09 2003-08-02 소니 가부시끼 가이샤 화상신호의부호화방법및그장치
US5729294A (en) 1995-04-05 1998-03-17 International Business Machines Corporation Motion video compression system with novel adaptive quantization
US5754742A (en) * 1995-05-12 1998-05-19 Intel Corporation Setting quantization level to match DCT coefficients
KR100355375B1 (ko) * 1995-11-01 2002-12-26 삼성전자 주식회사 영상부호화장치에있어서양자화간격결정방법및회로
US5745178A (en) * 1996-01-22 1998-04-28 Lucent Technologies Inc. Global rate control for model-assisted coding of low bit rate video
KR100203712B1 (ko) 1996-04-23 1999-06-15 전주범 영상신호 부호화시스템에 있어서 양자화장치 및 방법
KR100229796B1 (ko) 1996-08-30 1999-11-15 전주범 열화영상에 대한 보상기능을 갖는 영상 복호화 시스템
KR100297830B1 (ko) 1996-11-09 2001-08-07 윤종용 영상단위별 비트발생량 조절 장치 및 방법
KR19980022377A (ko) 1996-09-21 1998-07-06 김광호 적응형 격자 양자화기법에 의한 비디오신호 부호화 및 또는 복호화방법
US6256423B1 (en) * 1998-09-18 2001-07-03 Sarnoff Corporation Intra-frame quantizer selection for video compression
JP2000165802A (ja) * 1998-11-25 2000-06-16 Matsushita Electric Ind Co Ltd ストリーム編集装置と編集方法

Cited By (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100380982C (zh) * 2004-01-13 2008-04-09 索尼株式会社 图像编码方法和装置
US8340177B2 (en) 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
US8442108B2 (en) 2004-07-12 2013-05-14 Microsoft Corporation Adaptive updates in motion-compensated temporal filtering
CN1735208B (zh) * 2004-07-12 2011-12-14 微软公司 在运动补偿的时间滤波中的自适应更新
US8374238B2 (en) 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
US8493513B2 (en) 2006-01-06 2013-07-23 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
US8780272B2 (en) 2006-01-06 2014-07-15 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
US9319729B2 (en) 2006-01-06 2016-04-19 Microsoft Technology Licensing, Llc Resampling and picture resizing operations for multi-resolution video coding and decoding
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
CN101627635B (zh) * 2007-02-21 2012-06-13 高通股份有限公司 三维视频编码
US8953673B2 (en) 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
CN101534436B (zh) * 2008-03-11 2011-02-02 深圳市融创天下科技发展有限公司 一种视频图像宏块级自适应码率分配方法
WO2009111935A1 (zh) * 2008-03-11 2009-09-17 深圳市融创天下科技发展有限公司 一种视频图像宏块级自适应码率分配方法
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US8964854B2 (en) 2008-03-21 2015-02-24 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US10250905B2 (en) 2008-08-25 2019-04-02 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8213503B2 (en) 2008-09-05 2012-07-03 Microsoft Corporation Skip modes for inter-layer residual video coding and decoding
US10223811B2 (en) 2010-09-03 2019-03-05 Panasonic Intellectual Property Management Co., Ltd. Image encoding method, image decoding method, image encoding device and image decoding device
CN103081469A (zh) * 2010-09-03 2013-05-01 松下电器产业株式会社 图像编码方法、图像解码方法、图像编码装置以及图像解码装置
WO2012079237A1 (zh) * 2010-12-16 2012-06-21 北京航空航天大学 一种图像压缩中利用人眼视觉模型的小波系数量化方法
CN102934428B (zh) * 2010-12-16 2015-08-05 北京航空航天大学 一种图像压缩中利用人眼视觉模型的小波系数量化方法
CN102934428A (zh) * 2010-12-16 2013-02-13 北京航空航天大学 一种图像压缩中利用人眼视觉模型的小波系数量化方法
CN102547225B (zh) * 2010-12-29 2014-12-31 中国移动通信集团公司 视频监控场景判别方法及其监控图像编码方法、及装置
CN102572380A (zh) * 2010-12-29 2012-07-11 中国移动通信集团公司 视频监控编码方法及其装置
CN102547225A (zh) * 2010-12-29 2012-07-04 中国移动通信集团公司 视频监控场景判别方法及其监控图像编码方法、及装置
CN107277523B (zh) * 2011-03-09 2019-08-02 日本电气株式会社 视频解码设备以及视频解码方法
CN103444180A (zh) * 2011-03-09 2013-12-11 日本电气株式会社 视频编码设备、视频解码设备、视频编码方法以及视频解码方法
CN107257467A (zh) * 2011-03-09 2017-10-17 日本电气株式会社 视频解码设备以及视频解码方法
US11509909B2 (en) 2011-03-09 2022-11-22 Nec Corporation Video decoding device and method using inverse quantization
CN107277523A (zh) * 2011-03-09 2017-10-20 日本电气株式会社 视频解码设备以及视频解码方法
US11496749B2 (en) 2011-03-09 2022-11-08 Nec Corporation Video decoding device and method using inverse quantization
US11483571B2 (en) 2011-03-09 2022-10-25 Nec Corporation Video decoding device and method using inverse quantization
US10284859B2 (en) 2011-03-09 2019-05-07 Nec Corporation Video decoding device and method using inverse quantization
US10771790B2 (en) 2011-03-09 2020-09-08 Nec Corporation Video decoding device and method using inverse quantization
CN107257467B (zh) * 2011-03-09 2020-01-03 日本电气株式会社 视频解码设备以及视频解码方法
US10957283B2 (en) 2011-12-06 2021-03-23 Dolby Laboratories Licensing Corporation Perceptual luminance nonlinearity-based image data exchange across different display capabilities
CN106095358B (zh) * 2011-12-06 2019-05-14 杜比实验室特许公司 改进不同显示能力之间基于感知照度非线性的图像数据交换的装置和方法
CN106095357B (zh) * 2011-12-06 2020-02-21 杜比实验室特许公司 改进不同显示能力之间基于感知照度非线性的图像数据交换的装置和方法
US10621952B2 (en) 2011-12-06 2020-04-14 Dolby Laboratories Licensing Corporation Perceptual luminance nonlinearity-based image data exchange across different display capabilities
CN106095356B (zh) * 2011-12-06 2019-05-14 杜比实验室特许公司 改进不同显示能力之间基于感知照度非线性的图像数据交换的装置和方法
CN106095356A (zh) * 2011-12-06 2016-11-09 杜比实验室特许公司 改进不同显示能力之间基于感知照度非线性的图像数据交换的装置和方法
CN106095358A (zh) * 2011-12-06 2016-11-09 杜比实验室特许公司 改进不同显示能力之间基于感知照度非线性的图像数据交换的装置和方法
CN106095357A (zh) * 2011-12-06 2016-11-09 杜比实验室特许公司 改进不同显示能力之间基于感知照度非线性的图像数据交换的装置和方法
US11587529B2 (en) 2011-12-06 2023-02-21 Dolby Laboratories Licensing Corporation Perceptual luminance nonlinearity-based image data exchange across different display capabilities
US11600244B2 (en) 2011-12-06 2023-03-07 Dolby Laboratories Licensing Corporation Perceptual luminance nonlinearity-based image data exchange across different display capabilities
US11887560B2 (en) 2011-12-06 2024-01-30 Dolby Laboratories Licensing Corporation Perceptual luminance nonlinearity-based image data exchange across different display capabilities
CN107257426B (zh) * 2017-06-19 2019-09-03 成都优孚达信息技术有限公司 一种减少资源消耗的数据压缩方法
CN107257426A (zh) * 2017-06-19 2017-10-17 成都优孚达信息技术有限公司 一种减少资源消耗的数据压缩方法

Also Published As

Publication number Publication date
CN1217545C (zh) 2005-08-31
JP2002335527A (ja) 2002-11-22
EP1250012A3 (en) 2004-10-06
US6831947B2 (en) 2004-12-14
EP1250012A2 (en) 2002-10-16
US20020181583A1 (en) 2002-12-05
EP1250012B1 (en) 2009-01-21
DE60230946D1 (de) 2009-03-12

Similar Documents

Publication Publication Date Title
CN1378384A (zh) 基于比特率预测和预测误差能量的自适应量化
CN1164123C (zh) 视频编码的量化方法和装置
CN1726709A (zh) 利用基于图像的超前查看窗口进行速率控制
CN1120630C (zh) 对数字视频进行基于色度键编码的方法和设备
CN1487474A (zh) 用于数据压缩的改进优化技术
US7801383B2 (en) Embedded scalar quantizers with arbitrary dead-zone ratios
US6912255B2 (en) Bit rate control through selective modification of DCT coefficients
CN1608372A (zh) 在视频编码器中选择宏块量化参数的方法和装置
CN101039432A (zh) 在编码过程中实现自适应量化的方法及装置
CN1666429A (zh) 用于在视频编码中选择插值滤波器类型的方法和系统
CN1652610A (zh) 视频或图像去块滤波的方法和装置
CN1794815A (zh) 产生对图像或图像序列进行编码的量化矩阵的方法和设备
KR20230173216A (ko) 비디오 코딩에서의 크로마 양자화
CN1758764A (zh) 用于编码和/或解码运动图像的方法和装置
CN1659784A (zh) 色度解块滤波器
CN1820512A (zh) 消除块效应的方法、介质和滤波器
CN1347620A (zh) 转换mpeg-2 4:2:2-轮廓位流为主轮廓位流的方法及架构
CN1816151A (zh) 图框层速率控制的视讯编码方法和系统
JP5166435B2 (ja) 画像符号化方法及び係る方法を実現する装置
CN1941915A (zh) 视频编码方法及装置
CN107465924A (zh) 从多个相邻量化参数中确定量化参数预测值的方法和装置
CN1192105A (zh) 图象压缩/编码装置及其方法
CN101043621A (zh) 一种自适应插值处理方法及编解码模块
CN1941911A (zh) 退色补偿的参数化
CN1125569C (zh) 图象数据压缩装置、压缩图象数据的方法和数字摄像机

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20050831

Termination date: 20160322