CN102415097A - 失真加权 - Google Patents

失真加权 Download PDF

Info

Publication number
CN102415097A
CN102415097A CN201080018881XA CN201080018881A CN102415097A CN 102415097 A CN102415097 A CN 102415097A CN 201080018881X A CN201080018881X A CN 201080018881XA CN 201080018881 A CN201080018881 A CN 201080018881A CN 102415097 A CN102415097 A CN 102415097A
Authority
CN
China
Prior art keywords
pixels
activity
block
subgroup
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201080018881XA
Other languages
English (en)
Other versions
CN102415097B (zh
Inventor
理查德·肖伯格
肯尼思·安德森
程晓音
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of CN102415097A publication Critical patent/CN102415097A/zh
Application granted granted Critical
Publication of CN102415097B publication Critical patent/CN102415097B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

通过针对宏块(10)内多个子群(30)中具有至少一个像素(20)的每个子群(30)来确定表示邻域(40)中像素值的分布的活动性值,针对帧(1)的宏块(10)来估计失真表示,该邻域(40)包括多个像素(20)并包含子群(30)。基于活动性值,针对子群确定对应的失真权重。使用这些失真权重,以将失真表示估计为宏块(10)的像素值与宏块(10)的参考像素值的加权组合。失真权重暗示了与宏块(10)的其他部分相比,宏块(10)的不同部分将对失真表示做出更多或更少的贡献。失真表示将在编码期间减少帧(1)的高活动性区域和低活动性区域之间的环状伪像。

Description

失真加权
技术领域
本发明一般地涉及像素块的失真加权,更具体地,涉及可以结合像素块编码使用的这种失真加权。
背景技术
视频编码标准定义了用于视频数据的编码表示的语法。只指定了用于解码的比特流语法,这在设计编码器中留出了灵活性。视频编码标准也考虑到了优化图像质量和降低比特率之间的折衷。
可以使用量化参数来调整(modulate)编码器中的量化器或者数据压缩器的步长。一般地,编码视频的质量和比特率取决于编码器所使用的量化参数的具体值。从而,较粗的量化使用较少的比特来编码视频景象,然而也降低了图像质量。较精细的量化使用更多比特来编码视频景象,然而典型地,增加了图像质量。
使用所谓的自适应量化,可以获得主观(Subjective)视频压缩增益,在自适应量化中,在视频景象或者帧内改变量化参数(QP)。一般地,在适应性量化中,在具有平滑纹理的区域上使用较低的QP,而在空间活动性(spatial activity)较高的区域上使用较高的QP。这是个好主意,因为人类视觉系统将轻易地检测到平滑区域中的失真,而在高纹理的区域中的相同量的失真将不被注意到。
美国专利No.6,831,947B1公开了基于比特率预测的视频帧的自适应量化。自适应量化在视频帧中的编码伪像(artifacts)可能更不引起人类视觉系统注意的段中增加了量化,并在视频帧中的编码伪像更能引起人类视觉系统注意的段中降低了量化。
已知的自适应地降低或者增加QP值的解决方案的限制在于:根据当前的视频编码标准,QP自适应性仅可以基于宏块(即,具有16×16像素的块)改变。
图1示出了由于QP自适应性中的该限制而出现的问题。在现有技术解决方案中,为了将其分类为平滑,并得到较低的QP值,整个宏块必须是平滑的。这可以如图1所示,导致在平滑背景下,在高活动性对象的周围有清晰可见的环。图中灰色的同质的部分表示帧中宏块根据现有技术被分类为平滑的部分。在由平滑的草地背景下的足球运动员所表示的高活动性对象的周围,环效应是显而易见的。
直接的解决方案可以是将这些部分平滑的宏块包括在被指派了较低QP值的宏块的组中。然而,降低这些宏块的QP可能花费非常多的比特,由此为了实际可用,增加了太多的比特。
因此,需要能够减少现有技术的环状伪像并且可以结合视频编码使用的解决方案。
发明内容
总的目的是提供改进的失真表示。
具体目的是提供可以结合帧的像素块的编码使用的失真表示。
简言之,针对帧的像素块估计失真表示。将像素块分成多个(优选地,不重叠)的子群(subgroup),每个这种子群包括像素块的至少一个像素。针对每个子群确定活动性值或表示,其中,活动性值表示了像素邻域中的像素值的分布,像素邻域包括多个像素并包含了子群。
基于活动性值,针对子群来确定失真权重。将针对像素群的子群确定的失真权重与像素块的像素值以及像素块的参考像素值(例如,重构或预测的像素值)一起使用,以估计像素块的失真表示。因此,失真权重表示(entail)与像素块的其他像素相比,像素块的像素将对失真表示贡献得更多。
用于估计失真表示的设备包括活动性计算器,活动性计算器被配置为针对像素块的每个子群计算活动性值。权重确定器基于对应的活动性值确定子群的对应失真权重。然后,失真估计器基于多个失真权重、像素块的像素值和参考像素值估计或者计算像素块的失真表示。
结合为了选择宏块的适当编码模式而对帧进行编码,可以有利地使用失真表示。在这种情况下,针对帧的每个宏块,将宏块活动性计算为表示宏块内的像素值的分布。基于宏块活动性,将帧的宏块归类到至少两个类别中,例如低活动性宏块和高活动性宏块。向低活动性宏块指派低量化参数值,而向高活动性宏块指派高量化参数值。
如前所述,针对宏块的每个子群确定活动性值。基于活动性值,将子群分类为低活动性子群或高活动性子群。将低活动性宏块中的子群和高活动性宏块的高活动性子群的失真权重设置为等于已定义的因子。然而,相反,将高活动性宏块中的低活动性子群的失真权重确定为大于已定义的因子,并优选地基于向对应的宏块指派的量化参数来确定。
使用失真权重来确定宏块的失真表示,继而将宏块的失真表示与率值一起使用,以获得宏块的率失真值。然后,根据各种编码模式对宏块进行伪编码(pseudo encode),并针对每个这种模式计算率失真值。基于率失真值选择针对宏块使用的编码模式。
实施例还涉及用于对帧编码的编码器。编码器包括块活动性计算器和块归类器,块活动性计算器计算帧中宏块的对应宏块活动性,块归类器基于宏块活动性将宏块归类为至少两类,例如,低活动性宏块或高活动性宏块。量化选择器基于宏块活动性选择宏块的量化参数值。活动性计算器确定子群特有的活动性值,以及子群归类器使用该子群特有的活动性值来将子群分类为低活动性子群或高活动性子群。权重确定器将低活动性宏块中的子群和高活动性宏块的高活动性子群的失真权重确定为等于已定义的因子,而高活动性宏块中的低活动性子群得到大于已定义的因子的失真权重。
然后,编码器根据可用编码模式中的每个编码模式对宏块进行伪编码。针对每个这种编码模式,基于加权的失真表示和该具体编码模式的率值,确定率失真值。模式选择器选择最适合的编码模式,即,最小化宏块的率失真值的编码模式。然后,编码器根据该所选择的编码模式对宏块编码。
当结合帧的编码使用时,失真权重使得能够以比降低量化参数值所能获得的比特开销低得多的比特开销来减少环状伪像和运动拖尾(motion drag)伪像。
附图说明
结合附图,通过参考以下的描述,本发明及其进一步的目的和优势可被最好地理解,在附图中:
图1是示出根据现有技术的具有环效应的问题的图;
图2是示出根据实施例产生像素块的失真表示的方法的流程图;
图3是根据实施例,具有包括多个像素的像素块的帧的示意性示出;
图4是示出图2的活动性值确定步骤的实施例的流程图;
图5示意性地示出了出于确定活动性值的目的而提供多个像素邻域的实施例;
图6示意性地示出了出于确定活动性值的目的而提供多个像素邻域的另一实施例;
图7是示出与图1中的现有技术相比,实施例的有利效果的图;
图8示意性地示出了确定活动性值的不同实施例;
图9是示出图2的估计方法的附加可选步骤的流程图;
图10是示出图2的估计方法的附加可选步骤的流程图;
图11是示出图2的估计方法的附加可选步骤的流程图;
图12是示出根据实施例,对宏块的帧编码的方法的流程图;
图13示意性地示出了结合自适应量化方案的实施例应用;
图14示意性地示出了根据实施例,用于帧间编码的运动估计的概念;
图15是根据实施例的失真产生设备的示意性方框图;
图16是图15中的失真估计设备的阈值提供器的实施例的示意性方框图;
图17是图15中的失真估计设备的阈值提供器的另一实施例的示意性方框图;
图18是根据实施例的编码器的示意性方框图;以及
图19是根据实施例的编码器结构的示意性方框图。
具体实施方式
在全部附图中,针对相似或者对应的元素使用相同的参考标记。
实施例一般涉及帧的像素块的处理,其中,允许像素块内的像素的特性反映并影响像素块的失真表示。作为结果,实施例提供了处理像素块的高效技术,该像素块包括在像素特性或者值上变化小的平滑像素部分,以及就较高的像素特性的变化而言,具有相对较高的活动性的像素部分。
例如,通过选择适当的编码或解码模式,进行运动估计并降低在编码和解码期间所调查的编码或解码模式的数目,实施例的新颖的失真表示在例如像素块和帧的编码和解码期间提供了有价值的工具。
为了简化对实施例的理解,首先参考图2进行对总的实施例的描述。该图是对帧的像素块的失真表示进行估计的方法的流程图。
根据实施例,图3中示出的帧1由多个像素块组成,每个像素块包括多个像素20,其中,每个像素具有对应的像素特性或者值,例如颜色值,可选地,该对应的像素特性或者值由多个分量构成。本领域众所周知的是,每个像素典型地包括红、绿、蓝(RGB)格式的颜色值,并且可以因此被表示为RGB三元组。然而,在帧的编码和解码期间,典型地,将像素的RGB值从RGB格式变换到相应的亮度(Y)和色度(UV)值,例如,YUV格式。一个普通的示例是使用YUV 4:2:0,其中,亮度是完全分辨率,设备分量在水平和垂直轴上使用半分辨率。因此,在此使用的像素值可以是亮度值、色度值或者亮度和色度值。备选地,可以根据实施例来备选地使用RGB格式或者另一颜色或亮度-色度格式的像素值。
像素块10优选地包括2α×2β像素,其中,α,β是大于或等于1的正整数,并且优选地,α=β。像素块10优选地是帧1的最小的非重叠实体,在帧1的编码和解码期间,对像素块10进行整体操作和处理。因此,这种像素块10的优选实现是所谓的包括16×16像素20的宏块。本领域众所周知的是,宏块10是在使用自适应QP进行编码和解码期间被指派了单独的量化参数(QP)的最小的实体。因此,实施例特别适于估计作为宏块的像素块10的失真表示。下面,将参考宏块作为像素块的示意性和优选示例来对本发明进行进一步描述。
优选地,帧1是视频序列的帧1,然而可以备选地是(单独的)静止图像的帧1。
图2中的方法的第一步骤S1涉及定义宏块(像素块)的多个子群。这些子群中的每一个包括宏块的至少一个像素。如在此进一步描述的,子群可以包括宏块的单个像素,或者宏块的多个(即,至少两个)像素。然而,该子群是真子群,这意味着子群中像素的数目小于宏块的像素总数。
下一步骤S2确定步骤S1中定义的子群的活动性值。活动性值表示像素邻域中的像素特性或值的分布,该像素邻域包括多个像素并包含了子群。像素邻域是就所包括的像素数目而言具有预定大小的像素群,并且优选地至少部分位于宏块内部以包含子群的像素或多个像素。如果子群包括多个像素,像素邻域可以具有等于子群大小的预定大小。在这种情况下,在子群和像素邻域之间存在一对一的关系。然而,一般地,像素邻域优选是大于子群的,以由此除了当前子群的至少一个像素之外,还包含帧的更多像素。
活动性值可以是像素邻域中的像素值的分布的任何表示。非限制性的示例包括:在像素邻域中相同行或列中的相邻像素的像素值的绝对差(absolute difference)之和。
下面的步骤S3基于步骤S2中针对子群确定的活动性,确定子群的失真权重。针对步骤S1中定义的宏块的每个子群执行步骤S2和S3,线L1示意性地对此进行了示出。作为结果,由此向每个子群指派了对应的失真权重,其中,失真权重是基于针对特定的子群产生的活动性值而确定的。此外,优选地对失真权重进行确定,以使得具有对第一活动性进行表示的活动性值的子群的失真权重小于具有对第二活动性进行表示的活动性值的子群的失真权重,第二活动性相对地小于第一活动性。换种方式表达,高活动性子群的失真权重优选地小于低活动性子群的失真权重,其中,子群的活动性由活动性值来表示。
失真权重使得可以对宏块内的像素活动性进行单独评估和补偿,因为向每个至少一个像素的子群给予了失真权重。此外,在优选的实施例中,向宏块内的任何低活动性的子群指派的失真权重相对高于宏块内的任何高活动性的子群的失真权重。这意味着:在确定失真表示中,宏块的低活动性子群将被加权得更高,并因此被给予了针对宏块的更高等级的重要性。
一旦在步骤S3中对每个子群指派了对应的失真权重,方法继续到步骤S4,在步骤S4中,基于来自步骤S3的多个失真权重、宏块的像素值以及宏块的参考像素值对宏块的失真表示进行估计。由此,失真表示D是失真权重、像素值以及参考值的函数:D=kij×f(p,q,n,i,j),其中,p表示当前帧,q表示当前帧的参考帧,n是当前帧内的当前宏块的数目,i,j是宏块内的子群的像素坐标,以及,kij表示具有像素坐标(i,j)的子群的失真权重。
参考像素值是被使用来作为当前宏块的参考的参考宏块的像素值。这意味着失真表示是指示参考像素值与宏块的当前以及优选地原始的像素值有多大差异的失真或误差值。在步骤S4中使用的具体参考宏块取决于失真表示的目的。例如,在帧的编码期间,针对宏块测试不同的编码模式,以及针对每个这种编码模式,首先根据模式对宏块的原始像素值编码,以得到候选的编码宏块,然后对候选的编码宏块解码以得到重构的像素值。在估计失真表示中,将原始像素值和重构的像素值之间的差与失真权重一起使用。从而,在编码和解码之后获得的重构的像素值是根据实施例的参考像素值的示例。失真表示的备选应用是在运动估计期间,以发现针对帧间(P或B)编码宏块的适合的运动矢量。在这种情况下,失真表示是宏块的原始像素值与参考帧中的参考宏块的运动补偿的像素之间的加权差。作为结果,这种运动补偿的像素是根据实施例的参考像素值的另一示例。从而,可以将在编码或解码期间被使用来作为宏块的参考值的任何预测的、运动补偿的、重构的或者其他方式的参考像素值视为在此使用的参考像素值。在此,相关的特征是对失真或者误差表示进行估计,该失真或者误差表示反映出宏块和参考宏块(例如,重构的、预测的或者运动补偿的宏块)之间的像素值的差。
通过与根据现有技术的方式完全不同的方式来进行步骤S4中的失真表示的估计。在现有技术中,直接关于宏块和参考宏块之间像素值的差来估计失真表示。从而,没有对差进行的加权,并且具体地,没有对反映出宏块的不同部分中的活动性的差进行的加权。
由此,当确定失真表示时,实施例的失真表示允许对宏块中的不同像素进行差异性加权。作为结果,对于具有不同失真权重的像素和子群,并由此对于具有不同活动性的像素和子群,对失真表示的贡献将是不同的。
通过减少在帧的高活动性区域和低活动性区域的边界处的环状伪像和运动拖尾伪像,对像素值差进行的加权改进了宏块的编码和解码。
可以针对帧内的单个宏块进行一次步骤S1-S4的操作。然而,有利地针对帧的多个宏块进行该方法,线L2示意性地对此进行了示出。在一个实施例中,向所有宏块指派步骤S4中估计的失真表示。在备选方式中,仅对帧内被选择的宏块如步骤S1-S4所公开地进行处理。这些宏块例如可以是包括高活动性像素区域和低活动性像素区域并且典型地在帧的高活动性区域和低活动性区域的边界处发现的那些宏块,例如,如图1中所示出的。这意味着针对帧中的其他宏块,可以代之以使用传统的非加权失真值。
在一个实施例中,图2的步骤S1中定义的子群可以是单个像素。从而,在这种情况下,在步骤S2中确定像素特有的活动性值或者像素活动性。如果像素块是16×16像素的宏块,步骤S1将从而定义256个子群。将单个像素作为子群使用一般提高了确定活动性值、失真权重和失真表示的性能,因为可能由此补偿并考虑宏块内的像素值中的单独变化。
为了降低确定活动性值中的复杂度,步骤S1中定义的子群可以包括多个像素。在这种情况下,子群优选地是不重叠的子群,并优选地具有2m×2n像素,其中,m,n是0(如果都是0,每个子群包括如上提到的单个像素)、1、2或3。在优选的实施例中,步骤S1中定义的子群是2m×2m像素的不重叠子群。如果像素块(例如,宏块)的大小大于16×16像素,参数m,n可以具有大于4的值。一般地,对于具有2o×2o像素的方形(quadratic)像素块,子群可以包括2m×2m像素,对于方形的子群,其中,m是零或者正整数,限制条件为m<o。
该将多个相邻的像素一起分组为子群,并针对子群中的所有像素确定单个活动性值显著降低了复杂度和存储器需求。例如,利用2×2像素而不是单个像素的子群将复杂度和存储器需求降低了75%。对16×16像素的宏块使用更大的子群(例如,4×4像素或者8×8像素)甚至进一步降低了复杂度。
图4是示出图2确定活动性值的实施例的流程图。该方法从图2的步骤S1继续。下一步骤S10识别潜在的像素邻域,该潜在的像素邻域包括多个像素并包含当前子群。潜在的像素邻域优选地具有预定的形状并在其包含的像素数目方面具有预定大小。像素邻域的大小还取决于步骤S1中定义的子群的大小,因为像素邻域应该至少与子群的大小相同,以包含该至少一个像素的子群。在提高活动性值的质量方面,一般优选大小比子群的大小要大的像素邻域,以将宏块中除该子群外的至少一些像素包括在内。如果子群每个都仅包括单个像素,这进一步成了必要条件。然而,像素邻域的大小越大,活动性值的计算变得越复杂。
优选地,将像素邻域识别为包含子群的2a×2b像素的块,其中,a,b是大于或等于1的正整数。根据实施例可以使用的像素邻域的非限制性示例包括16×16、8×8、4×4和2×2像素。然而像素邻域没有必要是方形的,而是可以代之将其不同地成形为例如32×8和8×32像素的块。这两个块具有与方形的16×16块相同数目的像素。的确可能将不同形状(例如,16×16、32×8和8×32)的像素邻域相混合。由于所有这些像素邻域具有相同数目的像素,不需要规范化(normalization)或者缩放活动性值。同样地,针对其他的大小,也可以代之以使用矩形的块或者将其作为补充,例如,针对8×8块的16×4像素和4×16像素,针对4×4块的8×2像素和2×8像素。实际上,可以使用具有不同像素数目的像素邻域,因为当计算活动性值时,容易进行基于每个像素邻域的像素数目的规范化。
计算活动性值的在计算上简单的实施例是将像素邻域放置为使得当前子群位于像素领域的中心。然而,对于平滑区域(低活动性)中靠近非平滑区域(高活动性)的那些子群,这将导致高的活动性值。因此,更优选的实施例是如图4的步骤S11和S12中所示的一样进行。
步骤S11计算当像素邻域位于包含子群的第一位置时,表示像素邻域内的像素值的分布的候选活动性值。然后,将像素邻域放置在另一包含该子群的位置,并针对新的位置计算新的候选活动性值。从而,在实施例中,测试像素邻域相对于子群的多个不同的位置,并针对这些位置中的每个计算候选活动性值,线L3示意性地对此进行了示出。这意味着:潜在像素邻域内的子群位置与在步骤S10中定义并在步骤S11中测试的每个其他潜在像素邻域内的子群的相应位置不同。
图5示意性地示出了该概念。四幅图示出了宏块10具有子群30的部分,在本示例中,子群30由单个像素组成。在图5中,像素邻域40具有2×2像素的大小,以及图示出了像素邻域40相对于子群30的四个不同的可能位置,以使得子群30的单个像素占据像素邻域40内的四个可能位置之一。
在步骤S11的实施例中,如图5中所示地测试像素邻域相对于子群的所有可能位置。为了降低计算复杂度,不对所有可能的像素领域位置进行调查。例如,可以忽略其左上角在奇数水平坐标或垂直坐标处的所有像素邻域。这等于是将对其计算候选活动性值的像素领域放置在2×2栅格上。可以代之使用其他的这种栅格大小,例如,4×4、8×8栅格等。一般地,可以将2a×2b像素块形式的像素邻域限制为放置在帧中的2c×2d栅格上,其中,c,d是大于或等于1的正整数,以及c≤a,d≤b。
图6示出了对像素邻域40相对于子群30的可能位置的数目进行限制的概念。在该示例中,子群30包括4×4像素,以及像素邻域40是8×8像素的块。该图还示出了2×2像素的栅格50。使用2×2的栅格暗示了当包含子群30时,仅可以根据所示出的9个位置来放置像素邻域40。这意味着在本示例中将像素邻域位置的数目从25减少到9。
一旦在步骤S11中已经对所有可用的潜在像素邻域位置进行了测试,以及针对每个所测试的潜在像素邻域计算了候选活动性值,方法继续到步骤S12。该步骤S12选择最小或者最低的候选活动性值作为子群的活动性值。然后,方法继续到图2的步骤S3,在步骤S3中,基于所选择的候选活动性值确定失真权重。
如之前已经描述的,(候选)活动性值表示(潜在)像素邻域内的像素值的分布。各种活动性值都是可能的,并且可以根据实施例来使用。在示例中,对行或列中相邻像素之间的绝对差求和,以得到活动性值。这对应于:
Activity = Σ x = 0 2 a - 2 Σ y = 0 2 b - 1 | Y x , y - Y x + 1 , y | + Σ x = 0 2 a - 1 Σ y = 0 2 b - 2 | Y x , y - Y x , y + 1 | ,
其中,Yx,y表示在包括2a×2b像素的像素邻域内的位置(x,y)处的像素的像素值。在图8的上部分中对此进行了示意性示出。该活动性值是纯空间的,并向平滑的子群给予了低的活动性值。该活动性值仅对水平和垂直像素值差敏感。备选活动性值是对更多方向(即,还有对角线)上的像素差敏感:
Activity = Σ x = 0 2 a - 2 Σ y = 0 2 b - 1 | Y x , y - Y x + 1 , y | + Σ x = 0 2 a - 1 Σ y = 0 2 b - 2 | Y x , y - Y x , y + 1 | + Σ x = 0 2 a - 2 Σ y = 0 2 b - 2 | Y x , y - Y x + 1 , y + 1 | + Σ x = 2 a - 1 1 Σ y = 0 2 b - 2 | Y x , y - Y x - 1 , y + 1 |
图8的下部示出了活动性值的该实施例,其基于像素邻域中垂直、水平和对角线相邻或临近的像素的像素值的绝对差之和。
对上述活动性值实施例的一个简单修改是不采用像素值的绝对差,而是采用像素值的平方差。实际上,可以根据实施例使用对像素邻域内的像素值的分布进行反映的任何值。
可以使用其他子群活动性值,实施例不仅限于上述的空间活动性。
典型地,将在图2的步骤S3中基于子群的活动性值确定的失真权重确定为活动性值的函数。在一个实施例中,将失真权重确定为对活动性值是线性的。然而,也可以考虑其他函数,例如指数函数和对数函数。
一般地,高活动性子群的失真权重应该低于低活动性子群的失真权重:
kij≤V,subgroupij∈high activity
kij>V,subgroupij∈low activity
其中,V是某个定义的常数,优选地为1。
可以将被用于基于活动性值来确定失真权重的函数构建为:也基于被用来向帧中的宏块指派QP值的自适应QP方法。例如,假定宏块M和宏块N是帧中相邻的宏块。自适应QP方法还进一步向宏块M指派了低QP值,以及向宏块N指派了高QP值。因此,宏块M对应于帧的具有很少空间活动性和像素值变化的平滑区域,而宏块N具有较高的活动性并因此在像素值上具有较高的变化。然而,宏块N中靠近宏块M的一些像素实际上属于帧的平滑(背景)区域,并因此具有低的像素活动性。从而,从活动性值到失真权重的函数可以是:通过针对宏块M和N使用的量化参数,将失真权重的效果与拉姆达效果相关。在本领域中众所周知的是,常常在编码/解码中使用率失真(rate-distortion)项J=D+λ×bits,其中,D是宏块的失真,bits表示编码宏块所需的比特数,以及λ是拉格朗日乘数并定义了失真和比特对率失真项的相对贡献。典型地,λ是用于编码宏块的量化参数值的函数。在本领域中,每个QP值因此具有对应的拉姆达值,该拉姆达值常常存储在表中。针对每个QP使用的值是用实验方法找到的,并且拉姆达值典型地随着QP值的增加而单调增加。
在本示例中,假定使用量化编码参数值QPM编码宏块M,以及使用量化编码参数值QPN编码宏块N。这些量化参数值继而暗示了分别针对两个宏块选择以下的拉姆达值:λM和λN。为了关于拉姆达得到与量化效果所给出的相同的效果,则宏块N中的低活动性像素的失真权重是
Figure BDA0000103220410000121
备选地,可以将失真权重定义为
Figure BDA0000103220410000122
其中,f是大于或等于1的因子。从而,将宏块N中的高活动性像素的失真权重设置为~1.0。
在备选的方式中,代之以使用较低的量化参数值QPL<QPN来编码宏块N。针对宏块N中的低活动性像素使用的失真权重变为
Figure BDA0000103220410000123
在这种情况下,优选地不将宏块N中的高活动性像素的失真权重设置为等于已定义的常数1,而是等于
Figure BDA0000103220410000124
优选地,所选择的量化参数值QPL有QPM<QPL<QPN的关系,并可以被选择为
Figure BDA0000103220410000125
但是不是必须在QPM和QPN的中间。
实际上,可以根据实施例使用任何允许基于活动性值来确定失真权重的函数,只要表示低活动性的活动性值与表示相对较高的活动性的活动性值相比,导致较大的失真加权。
在具体的实施例中,可以使用8×8像素的子群大小,8×8像素的栅格以及8×8像素的像素邻域。这对应于宏块活动性,然而是针对8×8块进行的。对于该特别的情况,可以将自适应QP方法改变为作用在8×8块上而不是16×16块上。向每个8×8块指派虚拟QP值,并且取决于虚拟8×8QP值对宏块QP值进行设置。如果向四分之三的8×8块指派相同的QP值,可以将所使用的宏块QP值设置为多数8×8QP值。这些8×8子群的失真权重应该是1,然而如上在宏块M和N的示例中所述的,应该将剩余子群的失真权重修改为与虚拟QP相匹配。如果半数的8×8子群具有一个虚拟QP值,而半数具有另一个虚拟QP值,可以将宏块QP值设置为较低的虚拟QP值或者较高的QP值或者中间的QP值。对于所有的情况,应该使用失真权重来补偿上述的宏块QP值和虚拟QP值之间的差。
为了减少用于失真权重的差值的数目,可以使用至少一个阈值来将活动性值划分为有限数目的类别,其中,向每个类别指派一个失真权重。例如使用单个阈值,在该阈值之上的活动性值得到特定的失真权重,而活动性值在该阈值之下的子群和像素得到另一失真权重。图9中示意性地示出了该概念。该方法从图2的步骤S2继续。在下一步骤S20中,将针对子群确定的活动性值与至少一个活动性阈值相比较。然后,方法继续到图2的步骤S3,在步骤S3中,基于该比较确定子群的失真权重。
在具体的实施例中,使用单个活动性阈值,从而将子群和像素区分为低活动性子群(即,具有低于活动性阈值的相应活动性值)和高活动性子群(即,具有超过活动性阈值的相应活动性值)。
在单个活动性阈值的情况下,高活动性子群的失真权重优选地等于已定义的常数,优选地,等于1。从而,低活动性子群可以具有确定大于已定义的常数的失真权重。在具体的实施例中,基于针对宏块确定的量化参数值来确定失真权重。在这种情况下,如前所述,失真权重可以是基于向帧中的当前宏块和相邻宏块指派的拉格朗日乘数的函数,例如 k = f × λ N λ M .
实施例不限于使用单个活动性阈值,而是还可以结合具有多个不同的活动性阈值来使用,以从而得到两个以上的不同类别的子群。
该至少一个活动性阈值可以是固定的,即等于预定值。这意味着:针对帧中的所有宏块以及优选地视频序列内的所有帧,每个活动性阈值将使用同一个值。
在备选的方式中,结合自适应QP方法确定该至少一个活动性阈值的值。参考图10,在步骤S30中,针对帧中的每个宏块,在自适应QP方法中确定对应的块活动性。块活动性表示宏块内像素值的分布。根据现有技术中众所周知的技术,在步骤S31中使用块活动性来确定宏块的量化参数。在步骤S32中,还向每个宏块指派了拉格朗日乘数或者拉姆达值,如前所述,其优选地是基于宏块的量化参数和宏块模式定义的。优选地针对帧内的所有宏块执行步骤S30-S32,线L4对此进行了示意性的示出。然后,在步骤S33中基于针对宏块确定的对应量化参数值(优选地,基于块活动性),将宏块划分为多个类别。从而,优选地,针对每个类别或者至少一部分类别,识别具有最高块活动性的宏块。然后,在步骤S34中,基于针对所识别的宏块确定的活动性值,确定该至少一个活动性阈值。然后,方法继续到图2的步骤S1,在步骤S1处,如前所述估计失真表示。
在具体的实施例中,可以将活动性阈值的值设置为具有该类别的最高块活动性的宏块的平均或中间活动性值。在备选方式中,将活动性阈值设置为一类别的具有最高块活动性的宏块与下一类别的具有最低块活动性的宏块的平均或中间活动性值,该下一类别具有更高的QP值。该方式暗示了:多数像素位于其类别中并从而将得到典型地等于或者接近于该类别中的其他像素的失真权重。
在备选的方式中,动态确定该至少一个活动性阈值,以使得固定百分比的子群或像素将具有超过或低于活动性阈值的活动性值。在这种情况下,基于其对应的量化参数值将帧的宏块划分为不同的类别,优选地,该对应的量化参数值是基于对应的块活动性来确定的。然后,计算在不同类别中的宏块的相应的百分比,以及使用这些百分比来计算该至少一个活动性阈值。例如,假定两个宏块种类,60%的宏块在包含最低活动性宏块的类别中。在这种情况下,从而可以选择(单个)活动性阈值的值,以使得具有最低活动性值的子群有60%将具有落在活动性阈值之下的活动性值。
为了对移植进行简化,可以将失真权重设置为2的倍数,以避免乘法运算。因此,对于不同的正整数值t,失真权重可以是这意味着可以仅使用移位来实现加权。
优选地,将步骤S4中估计的失真表示确定为
Figure BDA0000103220410000152
其中,pij表示像素块(宏块)内的像素位置i,j处的像素值,qij表示像素位置i,j处的参考像素值,kij表示在像素位置i,j处的子群的失真权重,n是大于或等于1的正整数,以及像素块包括M×N像素,优选地,16×16像素。平方差之和(即,n=2)是本领域中最常见的失真度量。本领域中一般使用的备选失真度量是绝对差之和,即,n=1。有利地,结合运动估计来使用该后一个失真度量,即,以失真权重修改的SAD。
图7是图1中所示出的对应图,然而根据实施例进行了处理。如从图中看出的,在此公开的实施例降低了平滑背景上高活动性对象周围的环效应。
可以将实施例的失真表示与宏块编码和解码结合使用,作为率失真参数J=D+λ×bits的参数。在这种情况下,优选地基于在自适应QP过程期间向宏块指派的量化参数值,以针对宏块确定拉格朗日乘数或者拉姆达值。率参数表示基于量化参数产生的宏块的已编码版本的比特开销。从而,率失真值或者拉格朗日代价函数被获得为:实施例的失真表示与使用拉格朗日乘数加权的率值的加权和。
可以将根据以上确定的率失真值结合对帧的宏块进行编码来使用。在这种情况下,方法从图2的步骤S3继续,其中,已经确定了失真权重。此外,也优选地进行了图10的步骤S30-S32,以使得自适应QP方法已计算了宏块的块活动性,确定了QP值以及选择了拉格朗日乘数。方法继续到图11的步骤S40。该步骤根据多个可用编码模式的集合中的一个对宏块进行伪编码。在步骤S41中确定已编码宏块的率值。然后,方法继续到图2的步骤S4,其中,对宏块的失真表示进行估计。在该情况下,在步骤S4中使用的参考像素值是在对已伪编码的宏块解码之后获得的重构的像素值。一旦估计了失真表示,方法继续到步骤S42,其中,针对所测试的编码模式,计算宏块的率失真值。然后,针对所有的其他可用编码模式重复步骤S40-S42的操作,线L5对此进行了示意性示出。
如本领域众所周知的,可以根据各种模式对宏块编码。例如,存在若干可能的帧内编码模式、跳过模式以及多个帧间编码模式可用于宏块。对于帧内编码,不同的编码方向是可能的,而在帧间编码中,宏块可以被进行不同的分割和/或使用不同的参考帧或运动矢量。这在视频编码领域中是众所周知的。
步骤S40至S42的多个操作的结果是从所测试的每个编码模式获得对应的率失真值。然后,在步骤S43中选择用于宏块的具体编码模式。优选地,该编码模式是步骤S42中计算的模式中具有最低率失真值的编码模式。然后,在步骤S44中,根据所选择的编码模式,通过编码宏块来获得宏块的已编码版本。
根据实施例使用失真权重以估计或计算失真表示暗示了针对所测试的一些编码模式,帧的至少一些宏块将得到不同的率失真值。具体地,对于一些编码模式,在高活动性区域和低活动性区域之间的边界处出现在帧中的这些宏块将得到显著不同的率失真值。作为结果,将为这些宏块选择更适当的编码模式,将看到这些宏块的环状伪像和运动拖尾伪像的降低,但是是以与降低针对这些宏块的QP值相比低得多的比特开销为代价的。
在标准视频编码中,向解码器发送从步骤S43选择的编码模式。然而,在解码器侧的模式估计中,用于已编码宏块的解码模式是从解码器中导出的。也可以将在此公开的实施例用于这种场景中。在解码器中确定解码模式的一种方式是使用模板匹配。在模板匹配中,与标准视频编码中的原始宏块相类似地使用当前宏块之外的之前已解码的区域。
在对帧编码的期间,可以有利地将实施例的失真表示与自适应QP结合使用。将参考图12和13对失真表示的这种应用进行进一步描述。在对包括多个宏块的帧编码的方法中,针对每个宏块,在步骤S50中计算对应的宏块活动性。如之前所描述的,宏块活动性表示宏块内的像素值的分布,并可以被例如定义为:
Activity = Σ x = 0 14 Σ y = 0 15 | Y x , y - Y x + 1 , y | + Σ x = 0 15 Σ y = 0 14 | Y x , y - Y x , y + 1 |
Activity = Σ x = 0 14 Σ y = 0 15 | Y x , y - Y x + 1 , y | + Σ x = 0 15 Σ y = 0 14 | Y x , y - Y x , y + 1 | + Σ x = 0 14 Σ y = 0 14 | Y x , y - Y x + 1 , y + 1 | + Σ x = 15 1 Σ y = 0 14 | Y x , y - Y x - 1 , y + 1 |
然后,编码的S60中的自适应QP方法在步骤S51中将多个宏块归类。在示意性的实施例中,基于对应的宏块活动性将宏块归类为至少低活动性宏块S61和高活动性宏块S63。从而,可以通过定义两个类别(一个针对低活动性宏块,另一个针对高活动性宏块)来将宏块划分为多个类别。当然,可以将该过程进一步扩展为在两个以上的宏块类别之间进行区分。
在步骤S51中,根据其所指派到的类别,还在自适应QP中向宏块指派量化参数值。从而,向在步骤S51中被归类为低活动性宏块的宏块指派低QP值S62,向属于高活动性类别的宏块指派高QP值S64,高QP值S64大于低QP值S62。
以下步骤S52-S54的处理优选地针对各个宏块进行,线L6对此进行了示意性的示出。针对宏块内多个子群中具有至少有一个像素的每个子群,步骤S52对表示像素邻域中的像素值的分布的活动性值进行确定,像素邻域包括多个像素并包含子群S65。该步骤S52基本上以与图2的步骤S2相同的方法进行,并且在此不做进一步描述。然后,基于步骤S52中确定的对应活动性值,在步骤S53/S66中将宏块中的多个子群中的每个归类或者分类为低活动性子群S67、S70或者高活动性子群S68。可以根据任何之前描述的技术来进行步骤S53中子群的分类,例如,通过将活动性值与活动性阈值进行比较来进行。
下一步骤S54确定子群的失真权重。在步骤S54的具体实施例中,优选地向属于被归类为低活动性宏块S67的宏块的子群指派等于已定义常数(例如1)的失真权重S69。优选地,还将该已定义的常数作为失真权重向高活动性宏块中被分类为高活动性子群S68的子群指派。然而,相反,针对被分类为低活动性子群并属于高活动性宏块S70的宏块,确定大于已定义的常数的失真权重S71。可以如前所述,基于向当前高活动性宏块指派的QP值以及优选地,基于向帧中的邻近宏块指派的QP值,有利地计算针对这些低活动性子群的失真权重。
此后,遵循之前描述的基于率失真值进行的编码模式选择过程S72。从而,根据各种可用的编码模式在步骤S55中对宏块进行伪编码,并且针对每个候选编码模式,基于失真权重计算率失真值。在步骤S56中选择最小化宏块的率失真值的编码模式,并在步骤S57中将其用于编码具体的宏块。注意到,步骤S55-S57的操作典型地是针对每个宏块分别进行的,这暗示了不是必须使用相同的宏块类型或模式对帧的所有宏块编码。
也可以使用失真权重和用于确定失真权重的子群活动性来降低要针对宏块测试的编码模式的数目。从而,宏块的子群活动性或失真权重的分布可以使得使用具体的编码模式,将不能有效地编码宏块变得显而易见,即,如果使用该具体的编码模式,将产生非常高的率失真值。在这种情况下,可以因此降低可用编码模式的数目,以由此显著地降低编码过程的复杂度并加速宏块编码。
除了评估用于编码的候选宏块模式之外,还可以针对其他应用使用实施例的失真权重。例如,还可以使用失真权重来针对H.264中的宏块分裂(macroblock split)对运动矢量候选进行评估。可以使用相同的失真权重,并且选择最小化率失真值的运动矢量。图14示意性地示出了该概念。将要对当前帧1中的当前宏块10进行帧间编码,并且确定运动矢量16,运动矢量16定义了宏块10在参考帧2中已具有的位置14到参考帧2中的宏块预测12之间的运动。在这种情况下,在失真表示的估计中使用的参考像素值是宏块预测12的已运动补偿的像素值。
图15是失真估计设备100的实施例的示意性方框图。失真估计设备100包括活动性计算器110,活动性计算器110被配置为计算像素块(例如,宏块)内多个子群中每个子群的活动性值,该每个子群包括至少一个像素。优选地,活动性值表示像素领域中的像素值的分布,该像素领域包括多个像素并包含了子群。
权重确定器120使用活动性计算器110所确定的活动性值,确定子群的失真权重。优选地,操作活动性计算器110和权重确定器120以确定像素块中的每个子群的活动性值和失真权重。
失真估计设备100还包括失真估计器130,失真估计器130被配置为基于权重确定器120针对像素块的子群确定的多个失真权重、像素块的像素值以及像素块的参考像素值,估计像素块的失真表示。
优选地,活动性计算机110被配置为如前所述针对多个潜在像素邻域中相对于子群的每个潜在像素邻域,计算候选活动性值。然后,活动性计算器110选择这些多个候选活动性值中最小的候选活动性值来作为针对子群使用的活动性值。潜在的像素邻域是像素块,其中,子群在像素邻域的块内的位置与子群在其他像素领域内的对应位置不同。活动性计算器110可以使用栅格,如前所述,栅格用于该目的,或者用于降低潜在像素邻域相对于子群的位置数的目的。
优选地,加权确定器170基于子群的活动性值与至少一个活动性阈值的比较,确定子群的失真加权。在这种情况下,失真估计设备100可以可选地包括阈值提供器140,阈值提供器140被配置为提供由权重确定器120所使用的该至少一个活动性阈值。
图16是示出阈值提供器140的可能实现实施例的方框图。阈值提供器140包括块活动性计算器141,块活动性计算器141被配置为计算帧中的每个像素块的对应块活动性。块归类器143基于向像素块指派的对应的量化参数,将帧中的像素块划分为多个类别,该指派是基于块活动性进行的。阈值提供器140还包括像素块识别器145,像素块识别器145被配置为识别该多个类别的至少一个中具有最高块活动性的像素块。然后,阈值计算器147基于针对像素块识别器145识别出的像素块计算的活动性值,计算该至少一个活动性阈值。
图17是示出阈值提供器140的另一实现实施例的方框图。阈值提供器140包括块归类器143,块归类器143以与图16中的对应块归类器相同的方式进行操作。百分比计算器149被配置为计算帧中属于块归类器143所定义的多个类别中的每个类别的像素块的相应的百分比。在本实施例中,阈值计算器147根据之前描述的技术,基于百分比计算器计算的相应的百分比,计算该至少一个活动性阈值。
然后,权重确定器120可被配置为:如果针对子群确定的活动性值超过活动性阈值,将失真权重确定为等于已定义的常数(例如,1),如果相反,活动性值低于活动性阈值,基于向像素块指派的QP值来确定失真权重。在该后一情况下,如之前描述的,可以基于当前像素块的拉格朗日乘数与帧中的相邻像素块的拉格朗日乘数之比来确定失真权重。
失真估计设备100还可以可选地包括率失真(RD)计算器150,率失真计算器150被配置为基于来自失真估计器130的失真表示以及对像素块的已编码版本的比特开销进行表示的率值,计算像素块的率失真值。
可以通过硬件、软件或者硬件和软件的组合来实现失真估计设备100。如果通过软件实现,将失真估计设备100实现为计算机程序产品,计算机程序产品存储在存储器上,并且载入到通用或者专用计算机、处理器或微处理器以及在其上运行。软件包括实现失真估计设备100的活动性计算器110、权重确定器120和失真估计器130的操作的计算机程序代码单元或者软件代码部分。还可以将图15中示出的其他可选然而是优选的设备实现为存储在存储器中并由处理器执行的计算机程序代码单元。可以将程序整个或者部分地存储在一个或多个适合的计算机可读介质或者数据存储装置(例如,磁碟、CD-ROM、DVD碟、USB存储器、硬盘、磁-光存储器)上,存储在RAM或易失性存储器中,存储在ROM或闪存存储器中,作为固件存储或者存储在数据存储器上。
有利地,可以在计算机、移动设备或者其他视频或图像处理设备或系统中实现失真估计设备100。
实施例还涉及图18中示出的编码器200。从而,编码器200被配置为根据多个可用的编码模式的集合中的每个编码模式,对像素块进行伪编码。在该实施例中,编码器200包括图15中示出的失真估计设备100,即,包括活动性计算器100、权重确定器120、失真估计器130和率失真计算器150。在这种情况下,率失真计算器150如前所述计算多个可用编码模式中每个编码模式的对应率失真值。编码器200的模式选择器270在多个可用编码模式中选择最小化率失真值的模式。然后,编码器200通过根据模式选择器270选择的编码模式对像素块编码,产生像素块的已编码版本。
在编码器200的备选实施例中,块活动性计算器210被配置为计算帧中的每个宏块的宏块活动性。块归类器220基于块活动性计算器210所计算的宏块的活动性,将多个宏块归类为至少低活动性宏块或高活动性宏块。
编码器200还包括量化选择器240,将量化选择器240实现为基于宏块活动性来选择每个宏块的对应QP值。在这种情况下,向低活动性宏块指派低QP值,而向高活动性宏块指派相对较高的QP值。活动性计算器110如前所述,进行操作以计算宏块的子群的活动性值。子群归类器230基于活动性值,将子群分类为低活动性子群或高活动性子群。
加权确定器120向属于被归类为低活动性宏块的这些子群以及高活动性宏块的高活动性子群指派等于已定义的因子或常数的失真权重。然而,相反,将高活动性宏块中的低活动性子群的失真权重确定为大于已定义的因子,并优选地基于量化选择器240针对这些宏块确定的QP值进行计算。
乘数确定器250在编码器200中实现,用于基于量化选择器240确定的QP值,确定宏块的拉格朗日乘数。编码器200还包括率计算器260,率计算器260被配置为导出对宏块的已编码版本的比特大小或开销进行表示的率值。然后,率失真计算器150基于来自失真估计器130的失真表示、来自乘数确定器250的拉格朗日乘数以及来自率计算器260的率值,产生宏块的率失真值。针对每个所测试的编码模式计算这种率失真值,然后模式选择器可以基于不同的率失真值选择针对宏块使用的编码模式,即,优选地,选择产生最小率失真值的编码模式。
可以通过软件、硬件或其组合来实现图18中示出的编码器200。在前一情况下,将编码器200实现为计算机程序产品,计算机程序产品存储在存储器上,并且载入到通用或者专用计算机、处理器或微处理器以及在其上运行。软件包括实现编码器200的单元110-130、150、210-270的操作的计算机程序代码单元或软件代码部分。可以将程序整个或者部分地存储在一个或多个适合的计算机可读介质或者数据存储装置(例如,磁碟、CD-ROM、DVD碟、USB存储器、硬盘、磁-光存储器)上,存储在RAM或易失性存储器中,存储在ROM或闪存存储器中,作为固件存储或者存储在数据存储器上。
有利地,可以在计算机、移动设备或者其他视频或图像处理设备或系统中实现编码器200。
图19是根据另一实施例的编码器结构300的示意性方框图。编码器300包括运动估计单元或估计器370以及帧内预测单元或预测器375,运动估计单元370被配置用于像素块的帧间编码版本,帧内预测单元375用于产生像素块的对应帧内预测版本。将像素块预测和参考像素块转发到误差计算器305,误差计算器305计算残留误差,作为与原始像素块和参考或预测像素块之间的特性值之差。例如通过离散余弦变换310、量化315以及之后的熵编码320对残留误差进行变换。
还向逆量化器335和逆变换器340提供当前像素块的已变换和量化的残留误差,以重新得到对原始残留误差的近似。在加法器345中将该原始的残留误差与从运动补偿单元365或帧内解码单元360输出的参考像素块相加,以计算已解码的块。可以在帧的下一个像素块的预测和编码中使用该已解码的块。可选地,在输入对帧内预测器375、运动估计器370和运动补偿单元365变得可用的帧355之前,可以首先由解块过滤器350对该已解码的像素块进行处理。
编码器300还包括率失真控制器380,率失真控制器380被配置为如之前在此所述,选择针对每个像素块的具体编码模式。
要将上述实施例理解为本发明的一些示意性的示例。本领域技术人员将理解,在不背离本发明的范围的情况下,可以对实施例进行各种修改、合并和改变。具体地,只要技术上可能,可以通过其他配置来合并不同实施例中的不同的部分解决方案。然后,本发明的范围由所附权利要求限定。

Claims (30)

1.一种产生帧(1)的像素块(10)的失真表示的方法,所述方法包括:
定义所述像素块(10)的多个子群(30),其中,每个子群(30)包括所述像素块(10)的至少一个像素(20);
针对所述多个子群(30)中的每个子群(30),确定表示像素邻域(40)中的像素值的分布的活动性值,所述像素邻域(40)包括多个像素(20)并包含所述子群(30);
针对所述多个子群(30)中的每个子群(30),基于针对所述子群(30)确定的所述活动性值,确定失真权重;
基于所述多个失真权重、所述像素块(10)的像素值以及所述像素块(10)的参考像素值,估计所述像素块(10)的失真表示。
2.根据权利要求1所述的方法,其中,确定所述失真权重包括:确定具有对第一活动性进行表示的活动性值的子群(30)的失真权重低于具有对第二活动性进行表示的活动性值的子群(30)的失真权重,所述第二活动性相对低于所述第一活动性。
3.根据权利要求1或2所述的方法,定义所述多个子群(30)包括:定义所述像素块(10)的多个非重叠子群(30),其中,每个子群(30)包括2m×2m个像素(20),其中,m是0或正整数。
4.根据权利要求1至3中任一项所述的方法,其中,确定所述活动性值包括:
针对所述多个子群(30)中的每个子群(30)并针对多个潜在像素邻域(40)中的每个像素邻域(40),计算表示所述像素邻域(40)中的像素值的分布的候选活动性值,所述像素邻域(40)包括多个像素(20)并包含所述子群(30);以及
选择所述多个候选活动性值中最小的候选活动性值,作为所述子群(30)的所述活动性值。
5.根据权利要求4所述的方法,其中,计算所述候选活动性值包括:基于所述像素邻域(40)中垂直和水平相邻像素(20)的像素值的绝对差之和,计算所述候选活动性值。
6.根据权利要求4或5所述的方法,还包括:将所述多个潜在像素邻域(40)识别为包含所述子群(30)的相应的2a×2b像素的块(20),其中,a,b是大于或等于1的正整数,以及所述子群(30)在所述多个潜在像素邻域(40)中的潜在像素邻域(40)内的位置不同于所述子群(30)在所述多个潜在像素邻域(40)中的每个其他潜在像素邻域(40)内的相应位置。
7.根据权利要求6所述方法,其中,识别所述多个潜在像素邻域(40)包括:识别包含所述子群(30)并位于所述帧(1)中的2c×2d栅格(50)上的每个潜在像素邻域(40),其中,c,d是大于或等于1的正整数,c≤a以及d≤b。
8.根据权利要求1至7中任一项所述的方法,其中,确定所述失真权重包括:
a)针对所述多个子群(30)中的每个子群(30),将针对所述子群(30)确定的所述活动性值与至少一个活动性阈值相比较;以及
b)针对所述多个子群(30)中的每个子群(30),基于所述比较确定所述失真权重。
9.根据权利要求8所述的方法,还包括确定所述像素块(10)的量化参数值,其中,确定步骤b)包括:
i)针对所述多个子群(30)中的每个子群(30),如果针对所述子群(30)确定的所述活动性值超过活动性阈值,确定所述失真权重等于已定义的常数;以及
ii)针对所述多个子群(30)中的每个子群(30),如果针对所述子群(30)确定的所述活动性值低于所述活动性阈值,基于针对所述像素块(10)确定的所述量化参数值来确定所述失真权重。
10.根据权利要求9所述的方法,还包括基于所述量化参数值确定所述像素块(10)的拉格朗日乘数,其中,确定步骤(ii)包括:针对所述多个子群(30)中的每个子群(30),如果针对所述子群(30)确定的所述活动性值低于所述活动性阈值,将所述失真权重k确定为
Figure FDA0000103220400000031
其中,f是大于或等于1的因子,λN表示所述像素块(10)的所述拉格朗日乘数以及λM表示所述帧(1)中相邻像素块的拉格朗日乘数。
11.根据权利要求8至10中任一项所述的方法,还包括:
针对所述帧(1)中的每个像素块(10),确定表示所述像素块(10)中的像素值的分布的块活动性;
基于针对所述像素块(10)确定的相应量化参数,将所述帧的像素块(10)划分为多个类别;
针对所述多个类别中的类别,识别具有最高块活动性的像素块;以及
基于针对所识别的像素块确定的活动性值,计算活动性阈值。
12.根据权利要求8至10中任一项所述的方法,还包括:
基于针对所述像素块(10)确定的相应量化参数,将所述帧的像素块(10)划分为多个类别;
计算所述帧(1)中属于所述多个类别中每个类别的所述像素块(10)的相应的百分比;以及
基于所述相应的百分比,计算所述至少一个活动性阈值。
13.根据权利要求1至12中任一项所述的方法,其中,估计所述失真表示包括将所述失真表示D计算为:
D = Σ i = 0 M - 1 Σ j = 0 N - 1 k ij | p ij - q ij | n
其中,pij表示所述像素块(10)内像素位置i,j处的像素值,qij表示像素位置i,j处的参考像素值,kij表示所述像素块(10)内像素位置i,j处的子群(30)的失真权重,n是大于或等于1的正整数,以及所述像素块(10)包括M×N个像素(20)。
14.根据权利要求1至13中任一项所述的方法,还包括:
基于向所述像素块(10)指派的量化参数值,确定所述像素块(10)的拉格朗日乘数;
针对所述像素块(10),确定率值,所述率值表示所述像素块(10)的已编码版本的比特开销,所述像素块(10)的已编码版本是基于所述量化参数值产生的;以及
基于所述失真表示、所述拉格朗日乘数以及所述率值,计算所述像素块(10)的率失真值。
15.根据权利要求14所述的方法,还包括:
根据多个可用编码模式的集合中的每个编码模式,对所述像素块(10)进行伪编码;
针对所述多个可用编码模式中的每个编码模式,计算率失真值;
从所述多个可用编码模式中选择最小化所述率失真值的编码模式;以及
通过根据所选择的编码模式编码所述像素块,产生所述像素块(10)的已编码版本。
16.一种对包括多个像素(20)宏块(10)的帧(1)进行编码的方法,所述方法包括:
针对每个宏块(10),计算表示所述宏块(10)内像素值的分布的宏块活动性;以及
基于所述相应的宏块活动性,将所述多个宏块(10)归类为至少低活动性宏块或者高活动性宏块,其中,向被归类为低活动性宏块的宏块(10)指派低量化参数值,以及向被归类为高活动性宏块的宏块(10)指派高量化参数值,所述高量化参数值大于所述低量化参数值,以及,针对所述多个宏块(10)中的每个宏块(10):
针对所述宏块(10)内的多个子群(30)中具有至少一个像素(20)的每个子群(30),确定表示像素邻域(40)中的像素值的分布的活动性值,所述像素邻域(40)包括多个像素(20)并包含所述子群(30);
基于所述相应的活动性值,将所述多个子群(30)中的每个子群(30)归类为低活动性子群或高活动性子群;
针对高活动性宏块中的每个低活动性子群,确定大于已定义的常数的失真权重;
针对低活动性宏块中的每个子群以及高活动性宏块中的每个高活动性子群,指派等于所述已定义的常数的失真权重;
选择多个可用编码模式的集合中最小化拉格朗日代价函数J=D+λ×R的编码模式,其中,D表示等于的失真,pij表示所述宏块(10)内位置i,j处的像素值,qij表示所述宏块(10)内位置i,j处的重构像素值,kij表示所述宏块(10)内位置i,j处的子群(30)的失真权重,以及n是大于或等于1的正整数,λ表示基于所述宏块(10)的所述量化参数值针对所述宏块(10)选择的拉格朗日乘数,以及R表示对所述宏块(10)的已编码版本的比特开销进行表示的率值,所述宏块(10)的已编码版本是根据编码模式,使用所述宏块(10)的所述量化参数值获得的;以及
根据所选择的编码模式,对所述宏块(10)进行编码。
17.一种用于产生帧(1)的像素块(10)的失真表示的设备(100),所述设备包括:
活动性计算器(110),被配置为针对所述像素块(10)中的多个子群(30)的每个子群(30),计算表示像素邻域(40)中的像素值的分布的活动性值,所述像素邻域(40)包括多个像素(20)并包含所述子群(30),其中,每个子群(30)包括所述像素块(10)的至少一个像素(10);
权重确定器(120),被配置为针对所述多个子群(30)中的每个子群(30),基于所述活动性值,确定失真权重,所述活动性值是所述活动性计算器(110)针对所述子群(30)计算的;以及
失真估计器(130),被配置为基于所述权重确定器(120)确定的所述多个失真权重、所述像素块(10)的像素值以及所述像素块(10)的参考像素值,估计所述像素块(10)的失真表示。
18.根据权利要求17所述的设备,其中,所述活动性计算器(110)被配置为:针对所述多个子群(30)中的每个子群(30),以及针对包括多个像素(20)并包含所述子群(30)的多个潜在像素邻域(40)中的每个像素邻域(40),计算表示所述像素邻域(40)中的像素值的分布的候选活动性值,并选择所述多个候选活动性值中最小的候选活动性值作为所述子群(30)的所述活动性值。
19.根据权利要求18所述的设备,其中,所述活动性计算器(110)被配置为:基于所述像素邻域(30)中垂直和水平相邻像素(20)的像素值的绝对差之和,计算所述候选活动性值。
20.根据权利要求18或19所述的设备,其中,所述活动性计算器(110)被设置为:将所述多个潜在像素邻域(40)识别为包含所述子群(30)的相应的2a×2b像素的块(20),其中,a,b是大于或等于1的正整数,以及所述子群(30)在所述多个潜在像素邻域(40)中的潜在像素邻域(40)内的位置不同于所述子群(30)在所述多个潜在像素邻域(40)中的每个其他潜在像素邻域(40)内的相应位置。
21.根据权利要求20所述的设备,其中,所述活动性计算器(110)被配置:识别包含所述子群(30)并位于所述帧(1)中的2c×2d栅格(50)上的每个潜在像素邻域(40),其中,c,d是大于或等于1的正整数,c≤a以及d≤b。
22.根据权利要求17至21中任一项所述的设备,其中,所述权重确定器(120)被配置为:针对所述多个子群(30)中的每个子群(30),将针对所述子群(30)确定的所述活动性值与至少一个活动性阈值相比较,以及针对所述多个子群(30)中的每个子群(30),基于所述比较确定所述失真权重。
23.根据权利要求22所述的设备,其中,向所述像素块(10)指派量化参数值,以及所述权重确定器(120)被配置为:针对所述多个子群(30)中的每个子群(30),如果针对所述子群(30)确定的所述活动性值超过活动性阈值,确定所述失真权重等于已定义的常数;以及针对所述多个子群(30)中的每个子群(30),如果针对所述子群(30)确定的所述活动性值低于所述活动性阈值,基于向所述像素块(10)指派的所述量化参数值来确定所述失真权重。
24.根据权利要求23所述的设备,其中,向所述像素块(10)指派基于所述量化参数值以针对所述像素块(10)选择的拉格朗日乘数,以及所述权重确定器(120)被配置为:针对所述多个子群(30)中的每个子群(30),如果针对所述子群(30)确定的所述活动性值低于所述活动性阈值,将所述失真权重k确定为其中,f是大于或等于1的因子,λN表示所述像素块(30)的所述拉格朗日乘数,以及λM表示所述帧(10)中相邻像素块的拉格朗日乘数。
25.根据权利要求22至24中任一项所述的设备,还包括:
块活动性计算器(141),被配置为针对所述帧(1)中的每个像素块(10),计算表示所述像素块(10)中的像素值的分布的块活动性;
块归类器(143),被配置为基于针对所述像素块(10)指派的相应的量化参数,将所述帧(1)的像素块(10)划分为多个类别;
像素块识别器(145),被配置为针对所述多个类别中的每个类别,识别具有最高块活动性的像素块;以及
阈值计算器(147),被配置为基于针对所述像素块计算的活动性值,计算所述至少一个活动性阈值,所述像素块由所述像素块识别器(145)识别。
26.根据权利要求22至24中任一项所述的设备,还包括:
块归类器(143),被配置为基于针对所述像素块(10)指派的相应的量化参数,将所述帧的像素块(10)划分为多个类别;
百分比计算器(149),被配置为计算所述帧(1)中属于所述多个类别中的每个类别的所述像素块(10)的相应的百分比;以及
阈值计算器(147),被配置为基于所述百分比计算器(149)计算的所述相应的百分比,计算所述至少一个活动性阈值。
27.根据权利要求17至26中任一项所述的设备,其中,所述失真估计器(130)被配置为将所述失真表示D计算为:
D = Σ i = 0 M - 1 Σ j = 0 N - 1 k ij | p ij - q ij | n
其中,pij表示所述像素块(10)内像素位置i,j处的像素值,qij表示像素位置i,j处的参考像素值,kij表示所述像素块(10)内像素位置i,j处的子群(30)的失真权重,n是大于或等于1的正整数,以及所述像素块(10)包括M×N个像素(20)。
28.根据权利要求17至27中任一项所述的设备,还包括率失真计算器(150),所述率失真计算器(150)被配置为:基于所述失真表示、拉格朗日乘数以及率值,来计算所述像素块(10)的率失真值,所述拉格朗日乘数是基于向所述像素块(10)指派的量化参数值针对所述像素块(10)选择的,所述率值表示所述像素块(10)的已编码版本的比特开销,所述像素块(10)的已编码版本是基于所述量化参数产生的。
29.一种编码器(200),被配置为对像素块(10)进行编码,以及根据多个可用编码模式的集合中的每个编码模式,对所述像素块进行伪编码,所述编码器(200)包括:
根据权利要求28的用于估计失真表示的设备(100),其中,所述率失真计算器(150)被配置为针对所述多个可用编码模式中的每个编码模式,计算率失真值;以及
模式选择器(270),被配置为从所述多个可用编码模式中选择最小化所述率失真值的编码模式,其中,所述编码器(200)被配置为通过根据所述模式选择器(270)选择的所述编码模式对所述像素块(10)进行编码,产生所述像素块(10)的已编码版本。
30.一种被配置为对包括多个像素(20)宏块(10)的帧(1)进行编码的编码器(200),所述编码器(200)包括:
块活动性计算器(210),被配置为针对每个宏块(10),计算表示所述宏块(10)内像素值的分布的宏块活动性;以及
块归类器(220),被配置为基于所述块活动性计算器(210)计算的所述相应宏块活动性,将所述多个宏块(10)归类为至少低活动性宏块或高活动性宏块;
量化选择器(240),被配置为针对每个宏块(10),基于所述块活动性计算器(210)计算的所述宏块活动性来选择量化参数,其中,所述量化选择器(240)向被归类为低活动性宏块的宏块(10)指派低量化参数值,以及所述量化选择器(240)向被归类为高活动性宏块的宏块(10)指派高量化参数值,所述高量化参数值大于所述低量化参数值,以及,针对所述多个宏块(10)中的每个宏块(10):
活动性计算器(110),被配置为针对所述宏块(10)内的多个子群(30)中具有至少一个像素(20)的每个子群(30),计算表示像素邻域(40)中的像素值的分布的活动性值,所述像素邻域(40)包括多个像素(20)并包含所述子群(30);
子群归类器(230),被配置为基于所述活动性计算器(110)计算的所述相应的活动性值,将所述多个子群(30)中的每个子群(30)归类为低活动性子群或高活动性子群;
权重确定器(120),被配置为针对高活动性宏块中的每个低活动性子群,确定大于已定义的常数的失真权重,以及针对低活动性宏块中的每个子群以及高活动性宏块中的每个高活动性子群,指派等于所述已定义的常数的失真权重;以及
模式选择器(270),被配置为选择多个可用编码模式的集合中最小化拉格朗日代价函数J=D+λ×R的编码模式,其中,D表示等于
Figure FDA0000103220400000091
的失真,pij表示所述宏块(10)内位置i,j处的像素值,qij表示所述宏块(10)内位置i,j处的重构像素值,kij表示所述宏块(10)内位置i,j处的子群(30)的失真权重,以及n是大于或等于1的正整数,λ表示基于所述宏块(10)的所述量化参数值针对所述宏块(10)选择的拉格朗日乘数,以及R表示对所述宏块(10)的已编码版本的比特开销进行表示的率值,所述宏块(10)的已编码版本是根据编码模式,使用所述宏块(10)的所述量化参数值获得的,其中,所述编码器(200)被配置为根据所述模式选择器(270)选择的所述编码模式对所述宏块(10)进行编码。
CN201080018881.XA 2009-04-28 2010-04-27 失真加权 Expired - Fee Related CN102415097B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US17324709P 2009-04-28 2009-04-28
US61/173,247 2009-04-28
PCT/SE2010/050463 WO2010126437A1 (en) 2009-04-28 2010-04-27 Distortion weighing

Publications (2)

Publication Number Publication Date
CN102415097A true CN102415097A (zh) 2012-04-11
CN102415097B CN102415097B (zh) 2015-01-07

Family

ID=43032395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080018881.XA Expired - Fee Related CN102415097B (zh) 2009-04-28 2010-04-27 失真加权

Country Status (6)

Country Link
US (1) US20120039389A1 (zh)
EP (1) EP2425628A4 (zh)
JP (1) JP5554831B2 (zh)
KR (1) KR20120006488A (zh)
CN (1) CN102415097B (zh)
WO (1) WO2010126437A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111903128A (zh) * 2018-03-29 2020-11-06 交互数字Vc控股公司 基于加权失真的解码器侧的预测方法和装置
CN113596483A (zh) * 2021-08-20 2021-11-02 红河学院 一种编码树单元的参数确定方法及系统

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100566427C (zh) * 2007-07-31 2009-12-02 北京大学 用于视频编码的帧内预测编码最佳模式的选取方法及装置
KR101791078B1 (ko) * 2010-04-16 2017-10-30 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법
JP2012213128A (ja) 2011-03-24 2012-11-01 Sony Corp 画像処理装置および方法
CN104246823A (zh) * 2011-11-24 2014-12-24 汤姆逊许可公司 基于图像内容的伪像检测方案的方法和装置
WO2014193631A1 (en) * 2013-05-31 2014-12-04 Intel Corporation Adjustment of intra-frame encoding distortion metrics for video encoding
US10104395B2 (en) 2013-10-14 2018-10-16 Texas Instruments Incorporated Intra block copy (IntraBC) cost estimation
US10038904B2 (en) * 2013-10-25 2018-07-31 Mediatek Inc. Method and apparatus for controlling transmission of compressed picture according to transmission synchronization events
US10356405B2 (en) 2013-11-04 2019-07-16 Integrated Device Technology, Inc. Methods and apparatuses for multi-pass adaptive quantization
US20150208069A1 (en) * 2014-01-23 2015-07-23 Magnum Semiconductor, Inc. Methods and apparatuses for content-adaptive quantization parameter modulation to improve video quality in lossy video coding
TWI561060B (en) * 2015-01-15 2016-12-01 Mstar Semiconductor Inc Signal processing apparatus and signal processing method including quantization or inverse-quantization process
KR20180008471A (ko) * 2015-05-12 2018-01-24 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
US10057601B2 (en) * 2015-06-22 2018-08-21 Integrated Device Technology, Inc. Methods and apparatuses for filtering of ringing artifacts post decoding
CN111512632B (zh) * 2017-11-01 2023-07-14 Vid拓展公司 用于简化视频译码中的自适应环路滤波器的方法
US20200068197A1 (en) * 2018-08-27 2020-02-27 Ati Technologies Ulc Benefit-based bitrate distribution for video encoding

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5214507A (en) * 1991-11-08 1993-05-25 At&T Bell Laboratories Video signal quantization for an mpeg like coding environment
US5396567A (en) * 1990-11-16 1995-03-07 Siemens Aktiengesellschaft Process for adaptive quantization for the purpose of data reduction in the transmission of digital images
EP1610563A2 (en) * 2004-06-27 2005-12-28 Apple Computer, Inc. Selecting encoding types and predictive modes for encoding video data
US20060285594A1 (en) * 2005-06-21 2006-12-21 Changick Kim Motion estimation and inter-mode prediction
GB2444991A (en) * 2006-12-21 2008-06-25 Tandberg Television Asa Method of selecting quantizer values in video compression systems
CA2681025A1 (en) * 2007-03-20 2008-10-23 Fujitsu Limited Video encoding and decoding apparatus and method using quantization in sub-blocks
US20080285647A1 (en) * 2001-03-28 2008-11-20 Akira Sugiyama Picture processing apparatus, picture processing method, picture processing program and recording medium

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5229864A (en) * 1990-04-16 1993-07-20 Fuji Photo Film Co., Ltd. Device for regenerating a picture signal by decoding
WO1994018799A1 (en) 1993-02-03 1994-08-18 Qualcomm Incorporated Interframe video encoding and decoding system
US5930394A (en) * 1993-08-30 1999-07-27 Sony Corporation Picture coding apparatus and method thereof
US5486863A (en) * 1994-04-29 1996-01-23 Motorola, Inc. Method for determining whether to intra code a video block
US6192081B1 (en) * 1995-10-26 2001-02-20 Sarnoff Corporation Apparatus and method for selecting a coding mode in a block-based coding system
US5742622A (en) * 1996-03-12 1998-04-21 Discovision Associates Error detection and correction system for a stream of encoded data
US6414994B1 (en) * 1996-12-18 2002-07-02 Intel Corporation Method and apparatus for generating smooth residuals in block motion compensated transform-based video coders
KR100243430B1 (ko) * 1997-12-31 2000-02-01 구자홍 적응형 양자화 제어방법
JP4253276B2 (ja) * 2004-06-15 2009-04-08 株式会社東芝 画像符号化方法
US8325822B2 (en) * 2006-01-20 2012-12-04 Qualcomm Incorporated Method and apparatus for determining an encoding method based on a distortion value related to error concealment
US8019804B2 (en) * 2007-03-26 2011-09-13 City University Of Hong Kong Method and apparatus for calculating an SSD and encoding a video signal
JP4709179B2 (ja) * 2007-05-14 2011-06-22 日本電信電話株式会社 符号化パラメータ選択方法,符号化パラメータ選択装置,符号化パラメータ選択プログラムおよびその記録媒体
JP4709187B2 (ja) * 2007-07-10 2011-06-22 日本電信電話株式会社 符号化パラメータ決定方法、符号化パラメータ決定装置、符号化パラメータ決定プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
EP2191651A1 (en) * 2007-09-28 2010-06-02 Dolby Laboratories Licensing Corporation Video compression and tranmission techniques
JP4824708B2 (ja) * 2008-01-31 2011-11-30 日本電信電話株式会社 動画像符号化方法,装置,プログラムおよびコンピュータ読み取り可能な記録媒体

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5396567A (en) * 1990-11-16 1995-03-07 Siemens Aktiengesellschaft Process for adaptive quantization for the purpose of data reduction in the transmission of digital images
US5214507A (en) * 1991-11-08 1993-05-25 At&T Bell Laboratories Video signal quantization for an mpeg like coding environment
US20080285647A1 (en) * 2001-03-28 2008-11-20 Akira Sugiyama Picture processing apparatus, picture processing method, picture processing program and recording medium
EP1610563A2 (en) * 2004-06-27 2005-12-28 Apple Computer, Inc. Selecting encoding types and predictive modes for encoding video data
US20060285594A1 (en) * 2005-06-21 2006-12-21 Changick Kim Motion estimation and inter-mode prediction
GB2444991A (en) * 2006-12-21 2008-06-25 Tandberg Television Asa Method of selecting quantizer values in video compression systems
CA2681025A1 (en) * 2007-03-20 2008-10-23 Fujitsu Limited Video encoding and decoding apparatus and method using quantization in sub-blocks

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111903128A (zh) * 2018-03-29 2020-11-06 交互数字Vc控股公司 基于加权失真的解码器侧的预测方法和装置
CN113596483A (zh) * 2021-08-20 2021-11-02 红河学院 一种编码树单元的参数确定方法及系统
CN113596483B (zh) * 2021-08-20 2024-03-12 红河学院 一种编码树单元的参数确定方法及系统

Also Published As

Publication number Publication date
EP2425628A1 (en) 2012-03-07
KR20120006488A (ko) 2012-01-18
US20120039389A1 (en) 2012-02-16
JP2012525763A (ja) 2012-10-22
CN102415097B (zh) 2015-01-07
EP2425628A4 (en) 2016-03-02
JP5554831B2 (ja) 2014-07-23
WO2010126437A1 (en) 2010-11-04

Similar Documents

Publication Publication Date Title
CN102415097A (zh) 失真加权
USRE49565E1 (en) Apparatus for encoding an image
CN101385356B (zh) 采用帧内预测模式的图像编码方法
CN101964906B (zh) 基于纹理特性的快速帧内预测方法和装置
KR101344200B1 (ko) 모션 추정 검색 범위 및 확장된 모션 벡터 범위의 동적 선택 방법, 및 인코더
US9307250B2 (en) Optimization of intra block size in video coding based on minimal activity directions and strengths
KR100739714B1 (ko) 인트라 예측 모드 결정 방법 및 장치
CN113273213A (zh) 图像编码/解码方法和设备以及存储比特流的记录介质
CN104639940B (zh) 一种快速hevc帧内预测模式选择方法
KR20110065090A (ko) 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
CN103596004A (zh) Hevc中基于数学统计和分类训练的帧内预测方法及装置
CN101056408B (zh) 用于确定视频编码中跳跃模式的阈值的方法和装置
CN103067704A (zh) 一种基于编码单元层次提前跳过的视频编码方法和系统
US20170374361A1 (en) Method and System Of Controlling A Video Content System
Najafabadi et al. Mass center direction-based decision method for intraprediction in HEVC standard
KR20110067539A (ko) 화면 내 예측 부호화/복호화 방법 및 장치
JP4709179B2 (ja) 符号化パラメータ選択方法,符号化パラメータ選択装置,符号化パラメータ選択プログラムおよびその記録媒体
JP2008306413A (ja) 画像符号化装置および画像符号化方法
CN104768008B (zh) 一种用于可伸缩视频编码的快速编码方法
JP5655480B2 (ja) 動画像符号化装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150107

Termination date: 20210427