CN1943245A - 一种用于降低多媒体数据编码比特率的方法 - Google Patents

一种用于降低多媒体数据编码比特率的方法 Download PDF

Info

Publication number
CN1943245A
CN1943245A CNA2006800000217A CN200680000021A CN1943245A CN 1943245 A CN1943245 A CN 1943245A CN A2006800000217 A CNA2006800000217 A CN A2006800000217A CN 200680000021 A CN200680000021 A CN 200680000021A CN 1943245 A CN1943245 A CN 1943245A
Authority
CN
China
Prior art keywords
function
frame
transforming
data
transformation function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800000217A
Other languages
English (en)
Other versions
CN100499819C (zh
Inventor
火焰
区子廉
雷志斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hong Kong Applied Science and Technology Research Institute ASTRI
Original Assignee
Hong Kong Applied Science and Technology Research Institute ASTRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hong Kong Applied Science and Technology Research Institute ASTRI filed Critical Hong Kong Applied Science and Technology Research Institute ASTRI
Publication of CN1943245A publication Critical patent/CN1943245A/zh
Application granted granted Critical
Publication of CN100499819C publication Critical patent/CN100499819C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一些典型的实施例是关于压缩数据组的系统和方法。在一个实施例中,一种方法包括:接收要编码的数据帧,产生代表接收的帧和一个或几个参考帧之间的差的剩余帧,执行剩余帧内每个块的绝对差之和(SAD)的计算,将变换函数应用到剩余帧内的每个数据值,其中该变换函数至少是为包含各数据值的块计算出的SAD值的函数。

Description

一种用于降低多媒体数据编码比特率的方法
技术领域
本发明总的来说涉及压缩数据的系统和方法。
背景技术
多种应用中使用的多媒体数据(视频、音频、文本和它们的结合)具有很大程度的复杂性。在许多应用中,主要通过数据压缩来克服这种复杂性,以便实现有效率的处理、传送、呈现和涉及多媒体数据的其它重要功能。
数据压缩算法取决于数据组的冗余度,以便获得编码效率。通常地,使用数据组特征的先验知识来选择该数据组的编码算法实现数据压缩。例如,图象压缩算法取决于图象数据的空间相关性。具体来说,我们知道各象素的等级(level)与相邻象素的等级(level)紧密相关。类似地,各视频帧内一个象素的等级与先前视频帧内的同一象素和/或相邻象素的等级紧密相关。相应地,很多图象和视频压缩算法产生“剩余”或“差别”信号,他们使用行程编码(run lengths)和其它技术来利用空间和/或时间相关性编码。例如,运动图象专家组标准(MPEG standards)定义的压缩算法就使用这些技术。
压缩算法的性能取决于用来产生剩余信号的参考机制或函数(functionality)的选择。在视频压缩算法中,通过假定存在相对严格的时间相关性来进行参考帧的选择。基于这样的假定,典型地通过检查正在编码的帧之前一定限量的先前帧来选择参考帧。如果该视频数据具有相对紧密的时间相关性,压缩性能就是可接受的。但是,多媒体数据不是必需总遵循这样的假定。因此,已知的压缩算法可能不能有效地利用存在于多媒体数据中的冗余。
发明内容
一些典型的实施例通常是关于这样的算法,即通过利用数据的一个或几个参考帧来计算和编码剩余数据来压缩当前数据帧的算法。此外,一些典型的实施例通过产生最佳剩余数据使得可实现更大程度的数据压缩。在一些典型的实施例中,最佳剩余数据是多个因子的函数,诸如当前帧,一个或几个参考帧,绝对差之和(SAD),运动矢量值,块能量,和/或其它系统变量。例如,传统剩余数据块中的一个值可以通过与该块相关的SAD值的函数来变换或标度(scale)。变换后的值然后用于编码该特定数据元素的该剩余值。优选地,这样选择该变换函数,以区分可以丢弃的信息(例如,噪声、假象等)和对于图象的感知质量很重要的信息。通过能够进行这样的区分,一些典型的实施例使得可进行更大数量的数据压缩。
前面已经广义地概括了本发明的特点和技术优越性,以便可以更好地理解后续的本发明的详细说明。本发明的其它特点和技术优越性将在此后说明,他们构成本发明的权利要求的主题。应该理解,这里公开的概念和具体实施例可以很容易地用于修正或设计实现本发明的相同目的的构造的基础。还应认识到,这样的等同结构不脱离所附权利要求定义的本发明范围。本发明的特征的创新点,即指其结构也包括操作方法,以及其它的目的和优点,这些将在后面结合附图的说明中更好地理解。但是还应理解,每个附图是用于说明的目的,不用来限定本发明的范围。
附图说明
为了更全面地理解本发明,请参考结合附图的下面的说明。其中:
图1是根据本发明的一个典型实施例的压缩视频帧的流程图;
图2-4是根据本发明的一些典型实施例的用于标度剩余值的SAD值的变换函数;
图5是根据本发明的一个典型实施例的执行数据压缩的系统。
具体实施方式
为了说明根据本发明的一个典型性实施例的视频帧的压缩,请参考图1。图1的处理流程从步骤101开始。在步骤101,定义一组非重叠象素宏块。宏块可以多个块尺寸运动估计公开的方式,再分成尺寸为16×16,16×8,8×16,8×8,4×8,4×4和/或等尺寸的子宏块。子宏块分割的不同模式可以应用于各宏块。再有,这种再分可以逐个帧地变化。每个宏块可以包括多于一个成分或通道(例如,RGB,YIQ,YUV,YCbCr等)。
在步骤102,对于当前帧中的每个块,获得最佳匹配块。每个最佳匹配块可以从参考帧中的相同尺寸的块确定。或者,最佳匹配块可以与重叠运动估计类似的方式从更大块中产生。再有,每个最佳匹配块可以与子象素运动估计或重叠运动估计/补偿算法类似的方式从相邻块的加权线性组合中确定。用于该多个块以产生最佳匹配块的权重可以逐象素地改变。还有,最佳匹配块可以从预定距离的先前帧和预定距离的后续帧的组合中确定。在一个实施例中,搜索帧i中的块中的最佳匹配块的过程可以跨越帧i-2,i-1,i+1,i+2以及其中的任何块。最佳匹配块的确定也可以使用当前帧。此外,各最佳匹配块可以与扩展的运动估计类似的方式利用所选象素的重复来形成。例如,步骤101和102可以利用标准视频处理算法来执行,诸如各种MPEG压缩标准定义的算法。
在步骤103,对于当前帧内的每个块,分析其相应的最佳匹配块。这种分析可以包括计算通常的剩余帧。这种分析也可以包括执行每个剩余块的的绝对差之和的计算,确定每个剩余块的能量,分析与每个剩余块相关的运动矢量,检查这些特征的过去帧的历史,等等。
在步骤104,最佳剩余帧作为一个或几个变量(例如最佳剩余=函数F(通常剩余,一个或几个其它参数))的函数来计算。在一个实施例中,使用了与通常剩余帧的每个块相关的所选参数的变换函数。该变换函数为通常剩余帧中的每个数据元素进行估计,剩余帧的每个数据元素根据结果值进行标度。每个数据元素标度之后,通常剩余帧就被变换成最佳剩余帧。也可以使用多个函数来产生单一的最佳剩余帧。这些函数可以是线性或非线性的。
选择每个函数来区分对图象数据的感知质量有用的信号信息和不重要的信号信息(诸如误差、噪声、假象等)。再有,这些函数可以有多种形式和/或格式。例如,假定压缩算法应用于根据摄象机的慢速运动“拖曳”取得的视频。可以使用较低复杂度的函数。或者,当一个场景具有更复杂摄象机运动和目标运动时,可以使用更复杂的函数,以决定可以丢弃剩余帧的哪些信息(或者等同地,在给定计算量、资源和时间限制条件下可以产生的最佳剩余帧是什么)。最佳参考帧不同于已知的剩余帧,不同之处在于最佳参考帧不编码全部不同点。具体来说,应用变换函数除去了对于数据感知质量不重要的信息。因此实现更大数量的数据压缩。
在步骤105,可以进行典型的剩余处理,诸如采用离散余弦变换(DCT),或者其它变换、量化、熵编码(例如霍夫曼编码,算术编码等)、运动矢量相关,等等。MPEG标准定义的典型处理也可以使用。
压缩之后,可以利用传统的处理方法恢复数据。例如,传统的MPEG解码器可以用于恢复被压缩的数据。由于应用了变换函数,可能不能恢复特定帧的准确的视频数据(即该压缩是有损压缩)。但是,优选地,变换函数的选择最好是使得有错的或不太重要的信息从剩余数据删除。因此,解压缩视频数据的观看者不会体验到图象质量的不适当的降低。
虽然图1描述了视频数据的压缩,但是本发明不限于此。对于可以接受有损压缩的任何类型的数据,可以采用其它的典型实施例。
图2表示根据本发明一个典型实施例的用于剩余数据的函数200。函数200是SAD值的分段线性函数。函数200分成几个区域,每个区域具有其自己的参数值(在简化的线性情况下,即直线的斜度)。对于小SAD值来说,直线是陡的,以便减少最佳剩余数据(来反映这样的事实,即差值可能是噪声或误差)。或者,对于大的SAD值来说,直线变得平缓,以便可以编码全部剩余值。可以经训练或先前的统计来获得各区域。
图3和4分别表示根据本发明的其它典型实施例的函数300和400。函数300压缩与小SAD值有关的差,同时强调与大SAD值(例如重要的新的视频特征)有关的差。函数400具有“带通”形状。与小SAD值和大SAD值有关的差被压缩。当先验知识表明大的差值可能不可靠因此应该被压缩,可以使用函数400。在其它实施例中,类似地,变换函数可以是能量、熵和/或运动矢量的函数。
图5表示根据本发明的一个典型实施例的压缩视频数据的系统500。系统500可以利用包括合适的计算资源(如处理器501,显示器502和非可变存储器503)的计算机平台实施。非可变存储器503可以用于存储执行视频数据504的压缩的代码或软件指令。例如,当前视频帧可以由最佳匹配块模块505处理。在从一个或几个参考帧中确定了当前帧数据的最佳匹配块之后,传统的剩余计算模块506产生一剩余帧。变换函数模块507利用一个或几个变量来标度传统剩余帧的数据值,以产生一个最佳剩余帧。变量可以包括SAD值、能量值、运动矢量值等等。变换函数模块507从剩余帧除去对图象质量来说不重要的信息或者可能代表噪声或误差的信息。MPEG编码模块508处理最佳剩余帧,以产生压缩的视频数据509。压缩的视频数据509可以利用传统MPEG解码器/浏览器510来取得。
虽然为某些典型性实施例讨论了MPEG编码,但是根据其它的典型性实施例任何合适的编码方案都可以使用。此外,虽然某些典型性实施例在此以软件形式加以讨论,但是可以利用任何其它合适的逻辑元素,诸如集成电路。
虽然已经详细说明了本发明及其优越性,但应理解,在不脱离所附权利要求定义的本发明的条件下可以做出各种改变,替换和变化。此外,本申请的范围不限定到此处说明书中描述的处理方法,机器,制造,物质构成,手段,方法和步骤等的特定实施例。从说明书可以容易理解,可以利用实质上执行了与这里说明的相应实施例相同功能或实现了相同结果的目前已有的或者将来会开发出的处理方法,机器,制造,物质构成,手段,方法和步骤。因此,所附的权利要求书旨在包括这些处理方法,机器,制造,物质构成,手段,方法或步骤。

Claims (17)

1.一种方法,包括:
接收要编码的数据帧;
产生剩余帧,该剩余帧代表接收的帧和一个或几个参考帧之间的差;
执行所述剩余帧内每个块的绝对差之和(SAD)的计算;及
将变换函数应用到所述剩余帧内的每个数据值,其中该变换函数至少是为包含各数据值的块计算出的SAD值的函数。
2.如权利要求1的方法,其中所述的变换函数是分段函数。
3.如权利要求2的方法,其中所述的变换函数是对于各SAD值区域具有不同斜度的线性函数。
4.如权利要求1的方法,其中所述变换函数对于较低SAD值具有相对陡的斜度,对于较高SAD值具有相对平缓的斜度。
5.如权利要求1的方法,其中所述变换函数是与包含各数据值的块有关的运动矢量的函数。
6.如权利要求1的方法,其中所述变换函数是与包含各数据值的块有关的计算的能量的函数。
7.如权利要求1的方法,还包括:
在所述的变换函数应用到剩余帧之后,编码所述的剩余帧。
8.如权利要求1的方法,其中所述的数据帧是视频序列帧。
9.一种用于压缩视频数据的系统,包括:
用于接收要编码的数据帧的装置;
用于从所述的接收数据帧和一个或几个参考帧中产生剩余帧的装置;
用于为所述的剩余帧的每个块计算各量度的装置,其中所述的量度表示所述的接收帧的一个块和所述的剩余帧内相应块之间的差;
用于利用变换函数标度所述剩余帧的每个数据元素的装置,其中与包含各数据元素的剩余块有关的计算出的量度提供到所述变换函数作为函数自变量。
10.如权利要求9的系统,其中所述量度是绝对差量度之和。
11.如权利要求9的系统,其中所述的变换函数是分段函数。
12.如权利要求11的系统,其中所述的变换函数是对于各SAD值区域具有不同斜度的线性函数。
13.如权利要求12的系统,其中所述变换函数对于较低SAD值具有相对陡的斜度,对于较高SAD值具有相对平缓的斜度。
14.如权利要求9的系统,其中所述变换函数是与包含各数据值的块有关的运动矢量的函数。
15.如权利要求9的系统,其中所述变换函数是与包含各数据值的块有关的计算的能量的函数。
16.如权利要求9的系统,还包括在所述的变换函数应用到剩余帧之后编码所述的剩余帧的装置。
17.如权利要求9的系统,其中所述的数据帧是视频序列帧。
CNB2006800000217A 2005-02-08 2006-02-08 一种用于降低多媒体数据编码比特率的方法 Active CN100499819C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/053,362 2005-02-08
US11/053,362 US7706440B2 (en) 2005-02-08 2005-02-08 Method for reducing bit rate requirements for encoding multimedia data

Publications (2)

Publication Number Publication Date
CN1943245A true CN1943245A (zh) 2007-04-04
CN100499819C CN100499819C (zh) 2009-06-10

Family

ID=36779896

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006800000217A Active CN100499819C (zh) 2005-02-08 2006-02-08 一种用于降低多媒体数据编码比特率的方法

Country Status (3)

Country Link
US (1) US7706440B2 (zh)
CN (1) CN100499819C (zh)
WO (1) WO2006084419A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9736500B2 (en) * 2009-07-06 2017-08-15 Thomson Licensing Methods and apparatus for spatially varying residue coding
CN103975594B (zh) * 2011-12-01 2017-08-15 英特尔公司 用于残差预测的运动估计方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2861462B2 (ja) * 1991-04-12 1999-02-24 ソニー株式会社 動きベクトル検出装置
EP0557007A2 (en) * 1992-02-15 1993-08-25 Sony Corporation Picture processing apparatus
JP3444449B2 (ja) * 1994-12-26 2003-09-08 ソニー株式会社 映像信号処理装置
US5737537A (en) * 1995-09-29 1998-04-07 Intel Corporation Two-measure block classification scheme for encoding video images
US20020015513A1 (en) * 1998-07-15 2002-02-07 Sony Corporation Motion vector detecting method, record medium on which motion vector calculating program has been recorded, motion detecting apparatus, motion detecting method, picture encoding apparatus, picture encoding method, motion vector calculating method, record medium on which motion vector calculating program has been recorded
KR20020077884A (ko) * 2000-11-17 2002-10-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 블록 매칭 프로세스를 사용하는 비디오 코딩 방법
US20030152151A1 (en) * 2002-02-14 2003-08-14 Chao-Ho Hsieh Rate control method for real-time video communication by using a dynamic rate table
KR100846769B1 (ko) * 2002-02-19 2008-07-16 삼성전자주식회사 고정 연산량을 갖는 동영상 부호화 방법 및 그 장치
JP4136403B2 (ja) * 2002-03-08 2008-08-20 キヤノン株式会社 画像処理装置、画像処理方法、プログラム、記憶媒体
JP2004104694A (ja) * 2002-09-12 2004-04-02 Sony Corp 符号化装置と符号化方法と符号化プログラムおよび復号化装置と復号化方法と復号化プログラム
US7227901B2 (en) * 2002-11-21 2007-06-05 Ub Video Inc. Low-complexity deblocking filter
US7280597B2 (en) * 2003-06-24 2007-10-09 Mitsubishi Electric Research Laboratories, Inc. System and method for determining coding modes, DCT types and quantizers for video coding

Also Published As

Publication number Publication date
US7706440B2 (en) 2010-04-27
WO2006084419A1 (en) 2006-08-17
US20060176961A1 (en) 2006-08-10
CN100499819C (zh) 2009-06-10

Similar Documents

Publication Publication Date Title
CN101371583B (zh) 编码/解码高动态范围图像的方法和设备
KR100809354B1 (ko) 복원된 프레임의 프레임율을 업컨버팅하는 장치 및 방법
US6771826B2 (en) Digital image encoding and decoding method and digital image encoding and decoding device using the same
US20180115787A1 (en) Method for encoding and decoding video signal, and apparatus therefor
Liu et al. CNN-based DCT-like transform for image compression
CN101584215B (zh) 综合空时预测
US20160014409A1 (en) Encoding and decoding device and method using intra prediction
CN104581177B (zh) 一种结合块匹配和串匹配的图像压缩方法和装置
CN101103632A (zh) 利用动态地基于法向流的量化步长来处理视频信号的方法
RU2567988C2 (ru) Кодер, способ кодирования данных, декодер, способ декодирования данных, система передачи данных, способ передачи данных и программный продукт
US8594189B1 (en) Apparatus and method for coding video using consistent regions and resolution scaling
US20180199058A1 (en) Video encoding and decoding method and device
CN104704826A (zh) 两步量化和编码方法和装置
EP1158806A1 (en) Motion vector coding
CN104937934A (zh) 图像边界邻域中的自回归像素预测
JP2002058031A (ja) 画像符号化方法及び装置、並びに、画像復号化方法及び装置
EP0734168A2 (en) Apparatus for encoding a moving image signal having a still object
CN108401185B (zh) 参考帧选择方法、视频转码方法、电子设备和存储介质
CN105519108B (zh) 量化矩阵编码的加权预测方法和装置
CN100499819C (zh) 一种用于降低多媒体数据编码比特率的方法
JPH05284368A (ja) 画像データ符号化・復元方法及びその装置
CN108156462A (zh) 一种图像压缩、解压缩方法、系统及其应用的me架构
US20050157790A1 (en) Apparatus and mehtod of coding moving picture
JPH0410788A (ja) 画像信号符号量制御方法
US8467619B2 (en) Image compressing apparatus, image compressing method, image decompressing apparatus, and storage medium

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant