CN100405847C - 编码移动通信终端的运动图像的系统和方法 - Google Patents

编码移动通信终端的运动图像的系统和方法 Download PDF

Info

Publication number
CN100405847C
CN100405847C CNB2004800007255A CN200480000725A CN100405847C CN 100405847 C CN100405847 C CN 100405847C CN B2004800007255 A CNB2004800007255 A CN B2004800007255A CN 200480000725 A CN200480000725 A CN 200480000725A CN 100405847 C CN100405847 C CN 100405847C
Authority
CN
China
Prior art keywords
component
block
coding
movable block
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004800007255A
Other languages
English (en)
Other versions
CN1717938A (zh
Inventor
李昌浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MAIHJUK CO Ltd
Original Assignee
MAIHJUK CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MAIHJUK CO Ltd filed Critical MAIHJUK CO Ltd
Publication of CN1717938A publication Critical patent/CN1717938A/zh
Application granted granted Critical
Publication of CN100405847C publication Critical patent/CN100405847C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y20/00Nanooptics, e.g. quantum optics or photonic crystals
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01SDEVICES USING THE PROCESS OF LIGHT AMPLIFICATION BY STIMULATED EMISSION OF RADIATION [LASER] TO AMPLIFY OR GENERATE LIGHT; DEVICES USING STIMULATED EMISSION OF ELECTROMAGNETIC RADIATION IN WAVE RANGES OTHER THAN OPTICAL
    • H01S5/00Semiconductor lasers
    • H01S5/20Structure or shape of the semiconductor body to guide the optical wave ; Confining structures perpendicular to the optical axis, e.g. index or gain guiding, stripe geometry, broad area lasers, gain tailoring, transverse or lateral reflectors, special cladding structures, MQW barrier reflection layers
    • H01S5/22Structure or shape of the semiconductor body to guide the optical wave ; Confining structures perpendicular to the optical axis, e.g. index or gain guiding, stripe geometry, broad area lasers, gain tailoring, transverse or lateral reflectors, special cladding structures, MQW barrier reflection layers having a ridge or stripe structure
    • H01S5/2202Structure or shape of the semiconductor body to guide the optical wave ; Confining structures perpendicular to the optical axis, e.g. index or gain guiding, stripe geometry, broad area lasers, gain tailoring, transverse or lateral reflectors, special cladding structures, MQW barrier reflection layers having a ridge or stripe structure by making a groove in the upper laser structure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0075Transmission of coding parameters to receiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01SDEVICES USING THE PROCESS OF LIGHT AMPLIFICATION BY STIMULATED EMISSION OF RADIATION [LASER] TO AMPLIFY OR GENERATE LIGHT; DEVICES USING STIMULATED EMISSION OF ELECTROMAGNETIC RADIATION IN WAVE RANGES OTHER THAN OPTICAL
    • H01S5/00Semiconductor lasers
    • H01S5/30Structure or shape of the active region; Materials used for the active region
    • H01S5/34Structure or shape of the active region; Materials used for the active region comprising quantum well or superlattice structures, e.g. single quantum well [SQW] lasers, multiple quantum well [MQW] lasers or graded index separate confinement heterostructure [GRINSCH] lasers
    • H01S5/343Structure or shape of the active region; Materials used for the active region comprising quantum well or superlattice structures, e.g. single quantum well [SQW] lasers, multiple quantum well [MQW] lasers or graded index separate confinement heterostructure [GRINSCH] lasers in AIIIBV compounds, e.g. AlGaAs-laser, InP-based laser
    • H01S5/34346Structure or shape of the active region; Materials used for the active region comprising quantum well or superlattice structures, e.g. single quantum well [SQW] lasers, multiple quantum well [MQW] lasers or graded index separate confinement heterostructure [GRINSCH] lasers in AIIIBV compounds, e.g. AlGaAs-laser, InP-based laser characterised by the materials of the barrier layers
    • H01S5/34366Structure or shape of the active region; Materials used for the active region comprising quantum well or superlattice structures, e.g. single quantum well [SQW] lasers, multiple quantum well [MQW] lasers or graded index separate confinement heterostructure [GRINSCH] lasers in AIIIBV compounds, e.g. AlGaAs-laser, InP-based laser characterised by the materials of the barrier layers based on InGa(Al)AS

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Nanotechnology (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Optics & Photonics (AREA)
  • Geometry (AREA)
  • Discrete Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Electromagnetism (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及对移动通信终端的运动图像进行编码的系统和方法。本发明包括:帧内编码过程,通过在一个4*4像素单元内计算均值来编码所述运动图像压缩目标信号的U和V分量,而通过在一个8*8像素块单元内离散余弦变换、量化和Golomb-Rice编码Y分量来对运动图像压缩目标的Y分量进行编码;以及帧间编码过程,用于估算移动是否发生在一个8*8像素块单元中,把该块分类成移动块和非移动块,并分别存储移动块和非移动块,编码并输出有关移动否发生的信息作为纹理映象信息,并同时对移动块进行帧内模式和帧间模式的估算。

Description

编码移动通信终端的运动图像的系统和方法
技术领域
本发明涉及运动图像编码,更为具体地,本发明涉及对移动通信终端的运动图像进行编码的系统和方法,该系统和方法能够使在编码运动图像时,处理过程和操作数最少,并且通过以软件方式对其进行体现,从而与移动通信终端相适应。
背景技术
目前,处理运动图像的技术已经被应用于各种不同的领域。诸如互联网上的电影服务的视频点播(VOD)服务,就是该技术的一个代表性实例。
已经定义了用来处理运动图像的此种不同领域中的国际标准。作为典型的国际标准,运动图像专家组-1(MPEG-1)用作为视频高密光盘(CD)的一种压缩方法,MPEG-2适用且用作为高清晰数字电视广播或数字视频光盘(DVD)业务的一种压缩方法,MPEG-4是一种制作适合于各种内容压缩编码器的方法,且在如互联网广播或国际移动通信2000系统(IMT-2000)的无线环境中的运动图像压缩解决方案中使用。另外,还有为电话会议开发的H.261,其性能和MPEG-1的性能相似,主要用于ISDN网络;为视频电话开发的H.263,并且H.263提供MPEG-4基础;以及H.26L(H.264),其是用于图像电话、支持运动图像的蜂窝电话和电视等的最新标准压缩方法,并且能将压缩性能提高到MPEG-4的两倍。
同时,上述运动图像处理技术应用到了各种领域,而个人电脑(PC)就是公众普遍接触的一个领域。但是,PC存在移动性受限的问题。最近,处理诸如个人数字助理(PDA)和蜂窝电话等移动通信终端中的运动图像的技术正逐渐发展,该技术允许通过互联网连接以及安装照相机来提供各种多媒体业务,并解决了PC移动性受限的问题。
但是,与PC相比,由于移动通信终端的CPU性能较差,内存较小,提供驱动能量的电池容量有限,所以在应用需要许多终端操作的运动图像处理技术时就有很多限制。因此,运动图像处理技术还没有如PC中那样以软件方式体现。取而代之,已利用一个硬件芯片来提供运动图像压缩技术。
目前,由于移动通信终端中的CPU性能已经提高(例如,来自Qualcomm的MSM6000的商品化),所以出现了许多将运动图像处理技术以软件方式应用于移动通信终端的尝试。但是,与运动图像的解码相比,由于相关技术的运动图像处理技术需要许多操作来编码运动图像,所以事实上不能以软件方式将运动图像处理技术应用于移动通信终端。因此,为了以软件方式将运动图像处理技术应用于移动通信终端,就需要开发一种运动图像压缩编码技术,其能够减少操作数,从而满足移动通信终端的CPU性能。
例如,如图1所示,根据采用MPEG的相关技术的运动图像编码设备,该设备包括视频信号变换单元10,用于将输入的RGB图像变换为运动图像压缩目标信号(YUV420或YUV422);帧内编码部件20,用于通过利用帧内的空间相关性,仅使用该帧本身来进行压缩;以及帧间编码部件30,其利用当前帧和在前帧的时间相关性来进行压缩。此时,所述系统利用离散余弦变换(DCT)方法来编码运动图像。
帧内编码部件20包括离散余弦变换单元(DCT)21,量化单元22和霍夫曼编码单元23。对于运动图像压缩目标信号的Y分量,DCT单元21将一个(16*16像素)宏块分成四个(8*8像素)块单元,然后对每个(8*8像素)块单元进行DCT。由于运动图像压缩目标信号的U和V分量的数据大小相当于Y分量的1/4,所以DCT单元21在一个宏块内对U和V分量进行DCT。在进行DCT之后,DCT单元进行量化,并且随后进行作为熵编码方法的霍夫曼编码。
如同帧内编码部件20一样,帧间编码部件30将霍夫曼编码作为熵编码方法使用,并利用当前帧和在前帧的时间相关性对预测帧编码(即P帧编码)进行编码。此时,在在前帧的图像的情况下,由于对从压缩图像恢复的图像进行比较,所以在执行编码时还执行解码。
另外,帧间编码部件30中的移动估算单元31把运动图像压缩目标信号(YUV420,YUV422)分成(16*16像素)宏块并估算移动是否发生在每一个宏块(即搜索区域中)中,该运动图像压缩目标信号是通过把视频信号变换单元10输出的RGB(红绿蓝)图像变换成MPEG格式得到的。然后,通过移动估算来得到运动矢量(VM),并估算有关移动超出搜索区域或移动不能用运动矢量表达的情形的信息。此时,所述运动矢量是具有当前帧图像和在前帧图像的最大相似性的位置信息。通过提供此种运动矢量,就可以进行具有更高压缩性能和压缩质量的压缩。
但是,在编码运动图像时,移动估算单元31的移动估算处理占用了大部分操作。因此,在由于CPU性能限制而需要低复杂性的移动通信终端的情况下,由于移动估算处理,所以很难以软件方式体现运动图像编码功能。
另外,根据相关技术的运动图像编码设备,在帧间编码方法中,每一个宏块都被分类为没有移动发生的块和有移动发生的块,且根据其编码方法,有移动发生的块被分类为帧内模式和帧间模式。帧内模式是以与帧内编码相同的方式处理宏块的模式,而帧间模式是一种利用当前帧和在前帧的差值来编码宏块的模式。通过当前帧和估算运动向量时出现的搜索区域中的宏块单元的最小均值的差值来区分帧内模式和帧间模式,该最小均值是通过计算当前帧的宏块和在前帧的宏块的差值得到的。
如上所述,根据采用MPEG的相关技术的运动图像编码设备,由于在进行帧间编码时要使用从压缩图像恢复出来的在前图像,所以在编码运动图像时,也需要解码处理。由于帧间编码通过对每一个宏块进行移动估算得到运动矢量,并且另外,还要进行DCT和量化处理来获得有关移动是否发生每一个宏块中的信息,所以帧间编码需要的操作复杂。因此,以软件方式来体现移动通信终端的运动图像编码非常困难。而且,由于霍夫曼编码被作为熵编码使用,所以它并不适合于实时服务。
发明内容
因此,已经作出本发明来解决上述相关技术中出现的上述问题。本发明的一个目的是具体实现一个适合移动通信终端的运动图像编码功能,该移动通信终端是一个需要实时服务的应用领域。与相关技术相比,为了大幅度地缩短整个系统的编码时间而不降低编码性能或分辨率,在编码运动图像时,本发明将具有低复杂度和高处理速度的Golomb-Rice编码作为熵编码方式,并根据运动图像压缩目标信号的Y分量、U分量和V分量的重要程度,分别对其中的每个分量进行编码。
本发明的又一个目的是使操作数最少,由于在执行编码时解码过程是不必要的,所以可以通过在对运动图像进行帧间编码时利用在前帧的原始图像执行预测帧编码来实现该目标。
本发明的另一个目的是通过删除不必要过程如在帧间编码运动图像时获取运动矢量的过程来大大缩减操作,该目的还可以通过当对运动图像进行帧间编码时在块单元中进行移动估算,利用块边界的像素值来估算移动是否发生,并且同时进行帧内模式和帧间模式的估算来实现。
本发明的又一个目的是节省为允许对适合于移动通信终端的运动图像进行编码而增加的硬件芯片的开发费用,并且通过以不同于硬件芯片、能够快速处理一些情形的软件方式来具体实现运动图像编码功能,可以更有效地为快速发展的移动通信终端提供运动图像编码服务。
为了实现上述目的,本发明提供了一种移动通信终端的运动图像系统,该系统具有把输入的RGB图像变换成具有Y、U和V分量的运动图像压缩目标信号的视频信号变换单元,该运动图像系统包括:帧内编码部件和帧间编码部件,其中所述帧内编码部件用于通过在一个4*4像素单元内计算均值并编码该均值,来对运动图像压缩目标信号的U和V分量进行编码,并且在一个8*8像素块单元内对Y分量进行离散余弦变换,然后量化离散余弦变换后的Y分量得到量化系数,再利用Golomb-Rice编码对该量化系数进行熵编码,来对运动图像压缩目标信号的Y分量进行编码;而所述帧间编码部件用于利用在前帧内的原始图像对运动图像压缩目标信号进行预测帧编码,利用块边界的像素值来估算移动是否发生在一个8*8像素块单元内,同时进行帧内模式和帧间模式的估算,通过在一个4*4像素单元内计算均值来编码有移动发生的移动块的U和V分量,以及用于通过在一个8*8像素块单元内对Y分量进行离散余弦变换,通过量化离散余弦变换后的Y分量得到量化系数,然后利用Golomb-Rice编码对该量化系数进行熵编码来编码该移动块的Y分量。
优选地,所述帧间编码部件包括:移动估算单元,用于对所述视频信号变换单元输出的运动图像压缩目标信号,使用在前帧内的原始图像来估算移动是否发生在搜索区域(即一个8*8像素块单元)中;纹理映象信息存储单元,用于存储指示移动是否发生在每一宏块中的纹理映象信息;移动块存储单元,用于存储有移动发生的运动块,该移动块由移动评估单元输出;非移动块存储单元,用于存储没有移动发生的非移动块,该非移动块由移动估算单元输出;离散余弦变换(DCT)单元,用于通过对8*8像素块单元中的移动块的Y分量进行离散余弦变换得到DCT系数,该移动块存储在移动块存储单元中;量化单元,用于对已取得的DCT系数进行一个与量化宽度和每个频率分量相应的量化过程来产生量化系数;以及Golomb-Rice编码单元,用于利用Golomb-Rice编码来编码并随后输出所产生的量化系数。
优选地,移动估算单元利用当前帧的块边界值和在前帧的块边界值的差值来估算移动是否发生,分别输出有移动发生的块和没有移动发生的块,并将有关移动是否发生在每一宏块中的信息作为纹理映象信息输出。
优选地,移动估算单元可以基于当前帧的块和在前帧的块之间的差值求平方而得到的值,进行帧内模式和帧间模式的估算,该差值是在估算移动是否发生时得到的最终值。
另外,本发明提供了一种对移动通信终端的运动图像进行编码的方法,该方法通过把输入的RGB图像变换成运动图像压缩目标信号,来进行帧内编码和帧间编码,所述方法包括:帧内编码过程,通过在一个4*4像素单元内计算均值并编码该均值来对运动图像压缩目标信号的U和V分量进行编码,并且在一个8*8像素块单元内对Y分量进行离散余弦变换,通过量化离散余弦变换后的Y分量来得到量化系数,然后再利用Golomb-Rice编码对该量化系数进行熵编码来对运动图像压缩目标信号的Y分量进行编码;和帧间编码过程,对运动图像压缩目标信号进行估算,估算出移动是否发生在一个8*8像素块单元内,将该块分类成移动块和非移动块,分别存储该移动块和该非移动块,编码并输出作为纹理映象信息的有关移动是否发生的信息,并在估算移动是否发生时,同时对该移动块进行帧内模式和帧间模式的估算。
优选地,帧间编码过程包括:利用当前帧的块边界值和在前帧的块边界值的差值来估算移动是否发生;并根据移动是否发生的估算结果来输出没有移动发生的非移动块和有移动发生的移动块,并将其存储在每个存储单元内;然后编码和输出指示移动是否发生在相应块中的纹理映象信息;并在估算移动是否发生时,同时估算是否以帧内模式或帧间模式对发生移动的移动块进行编码。
优选地,帧间编码过程可以以与帧内编码同样的方法来编码被估算为帧内模式的移动块,并通过编码当前帧的原始图像和在前图像之间的不同分量来编码被估算为帧间模式的移动块。
优选地,帧间编码过程通过计算一个4*4像素单元内的均值并编码该均值来对移动块的U和V分量进行编码,并通过在一个8*8像素块单元内对Y分量进行离散余弦变换,通过量化离散余弦变换后的Y分量得到量化系数,然后利用Golomb-Rice编码对该量化系数进行熵编码来对该移动块的Y分量进行编码。
附图说明
通过下述结合参考附图的详细描述,本发明的上述和其他目的、特点和优点都将更加明显,其中:
图1是一个说明根据MPEG相关技术的编码运动图像的设备的框图;和
图2是一个功能性地说明根据本发明的一个实施例的对移动通信终端的运动图像进行编码的系统的结构框图。
**上述结构图中重要部分号码说明**
10:视频信号变换单元          50:帧内编码部件
51,65:DCT单元               52,66:量化单元
53,67:Golomb-Rice编码单元   60:帧间编码部件
61:移动估算单元              62:移动块存储单元
63:非移动块存储单元          67:纹理映象信息存储单元
发明详述
下文中,结合附图描述本发明的优选实施例。在下面对本发明的描述中,考虑到可能会使本发明的主题变得相当不清楚,将省略这里引用的熟知的功能和结构的详细描述。
根据本发明的运动图像编码系统是以软件方式来具体体现,而不是一个硬件芯片。如图2所示,根据本发明的一个实施例的系统包括:视频信号变换单元10,用于将输入的RGB图像变换成具有MPEG-4格式的运动图像压缩目标信号(YUV 420),帧内编码部件50和帧间编码部件60。
帧内编码部件50将视频信号变换单元10输出的运动图像压缩目标信号(YUV 420)分为U和V分量,以及Y分量。然后,对于U和V分量,在一个4*4像素单元内计算一个均值且随后编码该均值。另外,在一个8*8像素块单元内离散余弦变换并量化Y分量,然后利用Golomb-Rice编码来对变换且量化后的Y分量进行熵编码。
根据本发明,帧内编码部件50包括DCT单元51,量化单元52和Golomb-Rice编码单元53,用来编码Y分量。DCT单元51通过在一个块单元(8*8)内离散余弦变换Y分量而得到一个DCT系数。量化单元52通过进行一个使得到的DCT系数成为与量化宽度和每个频率分量相应的8*8量化矩阵的量化过程而产生量化系数。Golomb-Rice编码单元53利用Golomb-Rice编码来编码并输出所产生的量化系数。
帧间编码部件60利用在前内帧的原始图像进行预测帧编码,利用一个块边界的像素值估算移动是否发生在一个8*8块单元内,并同时进行帧内模式和帧间模式的估算。之后,对于有移动发生的移动块的U和V分量,帧间编码部件60在一个4*4像素单元内计算一个均值且编码该均值。对于有移动发生的移动块的Y分量,帧间编码部件60在一个8*8像素块单元内离散余弦变换并量化Y分量,然后利用Golomb-Rice编码来对该分量进行熵编码。
特别地,如图2中所示,帧间编码部件60包括移动估算单元61、移动块存储单元62、非移动块存储单元63、纹理映象信息存储单元64、DCT单元65、量化单元66和Golomb-Rice编码单元67。
移动估算单元61利用在前内帧的原始图像,对视频信号变换单元10输出的运动图像压缩目标信号进行估算,估算出移动是否发生在一个搜索区域(即一个8*8块单元)中。此时,该单元利用当前帧的块边界值和在前帧的块边界值的差值来估算移动是否发生,根据估算结果分别地输出有移动发生的块和没有移动发生的块,并有关移动是否发生在每一个块中的信息作为纹理映象信息输出。另外,该单元基于当前帧的块和在前帧的块的差值求平方而得到值,来进行帧内模式和帧间模式的估算,该差值是在估算移动是否发生时得到的最终值。
移动块存储单元62存储有移动发生的块。非移动块存储单元63存储没有移动发生的块。纹理映象信息存储单元64存储移动估算单元61输出的纹理映象信息,该纹理映象信息指示移动是否发生在每一个块中。
DCT单元65通过在8*8像素块单元中对存储在移动块存储单元62中的移动块的Y分量进行离散余弦变换,得到DCT系数。通过进行一个使所获得的DCT系数成为与量化宽度和每一个频率分量相应的8*8量化矩阵的量化过程,量化单元66产生量化系数。Golomb-Rice编码单元67利用Golomb-Rice编码来编码该产生的量化系数并将其输出。
此时,对于存储在移动块存储单元62中的移动块的U和V分量,帧间编码部件在一个4*4像素单元内计算一个均值,对该均值进行编码并输出。
在下文中,将描述具有上述结构的运动图像编码系统的操作。
首先,利用视频信号变换单元10,将从例如照相机的输入装置(没有示出)输入的RGB图像变换成具有MPEG-4格式的运动图像压缩目标信号(YUV420),然后输入到帧内编码部件50。构成运动图像压缩目标信号的Y分量是一个图像的明和暗(黑和白)指示,而U和V分量是利用色彩的不同分量来说明图像的色彩信息的分量。与U和V分量相比,Y分量在组成图像上负责重要部分。Y、U和V分量中的每一个呈现于每个存储空间中。由于在编码过程中,Y分量、U和V分量在组成图像上具有不同的重要性,所以根据它们的重要程度来分别处理这几个分量。
换言之,对于从视频信号变换单元10输入的运动图像压缩目标信号(YUV 420)的U和V分量,帧内编码部件50在一个4*4像素单元内计算一个均值并随后编码该均值。
然后,帧内编码部件50通过对Y分量进行离散余弦变换得到一个DCT系数,接着通过进行一个使所得的DCT系数成为一个与量化宽度和每一个频率分量相应的8*8量化矩阵的量化过程,来产生量化系数。然后,帧内编码部件50利用Golomb-Rice编码来编码产生的量化系数并输出该量化系数。因此,编码的复杂度低于霍夫曼编码并且能够实现实时编码,其中霍夫曼编码是相关技术的熵编码。另外,由于在表达图像时,构成运动图像目标压缩信号的U和V分量比Y分量的重要性小,所以可以仅通过编码一个4*4像素单元的均值来具体体现和表达与利用8*8像素单元的DCT所达到的压缩性能和清晰度相类似的压缩性能和清晰度。因此,与相关技术的帧内编码相比,可以大大地减少编码U和V分量的所需时间,而不降低压缩性能和清晰度。
同时,帧间编码部件60利用当前帧和在前帧之间的时间相关性来编码从视频信号变换单元10输入的运动图像压缩目标信号。首先,帧间编码部件60中的移动估算单元61把运动图像压缩目标信号分成块单元(8*8),然后将块单元分类成有移动发生的块(移动块)和没有移动发生的块(非移动块)。此时,它将有关移动是否发生的信息作为纹理映象信息存储在每个块中。
换言之,移动估算单元61利用在前内帧的原始图像,估算移动是否发生在搜索区域(即一个块单元)中。此时,它利用当前帧的块边界值和在前帧的块边界值的差值来估算移动是否发生。
当估算出相应块是一个没有移动发生的非移动块时,移动估算单元61输出该非移动块,把该非移动块存储到非移动块存储单元63中,并把没有移动发生在块中的信息存储到纹理映象信息存储单元64中。
然而,当估算出相应块是一个有移动发生的移动块时,移动估算单元61输出该移动块,把该移动块存储到移动块存储单元62中,并且把有移动发生在块中的信息存储到纹理映象信息存储单元64中。
由于存储在纹理映象信息存储单元64中的有关移动是否发生的信息被编码和输出,所以解码部件(没有在图中显示)能够知道有关移动是否发生在每个块中的信息。因此,对于非移动块,不需要编码过程和任何后续过程。换言之,解码部分通过复制在前图像中的块,利用纹理映象信息来处理非移动块。
另外,移动估算单元61在估算移动是否发生时,同时估算是否以帧内模式和帧间模式对发生移动的移动块进行编码。
换言之,在有物体移动、光线改变或者来自运动图像输入装置(例如照相机)的噪音的情况下,块能够被估算为有移动发生的移动块。在上述情况中,存在如物体移动的大移动的移动块被估算为以帧内模式编码。其中存在图像中的小变化(如由于光线或噪音引起的微小移动)的移动块被估算为以帧间模式编码。
编码并存储相应的帧内模式编码或帧间模式编码信息,使得解码部件知道该信息。同时,在移动块被估算为处于帧内模式的情况下,以与帧内编码相同的方式来编码原始图像的块值。在移动块被估算为处于帧间模式的情况下,编码原始图像和在前图像之间的不同分量。
另外,在进行移动是否发生的估算和对移动块进行帧内/帧间模式的估算之后,对移动块进行相应的编码处理。在此时,对于移动块的U和V分量,在一个4*4像素单元内计算均值然后编码该均值。另一方面,在一个8*8像素单元内,离散余弦变换并量化Y分量。之后,利用Golomb-Rice编码来熵编码该Y分量。
工业适用性
如上所述,根据本发明,在编码运动图像时,取代霍夫曼(Huffman)编码,将具有低复杂性和高处理速度的Golomb-Rice编码作为熵编码方法应用。另外,根据运动图像目标压缩信号的Y分量、U和V分量的重要程度,来对其进行单独编码。因此,由于与相关技术相比,可以大大地减少整个系统的编码时间,而不会降低压缩性能和清晰度,所以能够具体体现适合于移动通信终端的运动图像编码功能,该移动通信终端是一个要求实时服务的应用。
根据本发明,当对运动图像进行帧间编码时,利用在前内帧的原始图像来编码预测帧。因此,由于不需要使用从在前压缩的图像中恢复的图像作为相关技术,所以可以使操作数最少。例如,在进行编码时,不需要解码过程。
另外,根据本发明,当对运动图像进行帧内编码时,在一个块单元内进行移动是否发生的估算。此时,如相关技术一样,利用块边界的像素值来只估算移动是否发生,而不需得到运动矢量。因此,获取运动矢量的过程和获取有关移动是否发生的信息所需的离散余弦变换和量化过程就可以省略,所以减少了许多操作。
此外,根据本发明,在对运动图像进行帧间编码时,要同时进行移动估算以及帧内模式和帧间模式的估算,而不是如同相关技术一样,在得到运动矢量之后才进行帧内模式和帧间模式的估算。因此,与相关技术的运动图像编码装置相比,可以减少先前描述的过程的操作。
另外,根据本发明,上述的运动图像编码功能以软件方式具体体现。因此,就可以减少开发移动通信终端的附加费用的负担,该费用是由于为编码运动图像而增加的硬件芯片而发生的。另外,与硬件芯片不同,由于上述功能是以软件方式具体实现,以更简单地迅速地处理一些情况,所以就能更有效地提供移动通信终端上的运动图像服务。
尽管结合优选实施例对本发明进行了说明和描述,但是本领域的熟练技术人员应该明白,在不偏离所附权利要求书规定的本发明的实质与范围的情况下,可以进行各种不同形式和细节的修改。

Claims (8)

1.一种移动通信终端的运动图像系统,该系统具有一个把输入的RGB图像变换成具有Y,U和V分量的运动图像压缩目标信号的视频信号变换单元,所述系统包括:
帧内编码部件,用于通过在一个4*4像素单元内计算均值并对该均值进行编码,来编码该运动图像压缩目标信号的U和V分量,并且在一个8*8像素块单元内对Y变量进行离散余弦变换,量化离散余弦变换后的Y分量得到量化系数,然后利用Golomb-Rice编码对该量化系数进行熵编码,从而实现对该运动图像压缩目标信号的Y分量的编码;和
帧间编码部件,用于利用在前内帧的原始图像对该运动图像压缩目标信号进行预测帧编码,利用当前帧的块边界的像素值和在前帧的块边界的像素值的差值来估算在一个8*8像素块单元中是否发生移动,并存储指示在每个块中是否发生移动的纹理映象信息、有移动发生的移动块以及没有移动发生的非移动块,用于同时进行帧内模式和帧间模式的估算,用于通过在一个4*4像素单元内计算均值来对有移动发生的移动块的U和V分量进行编码,并且在一个8*8像素块单元内对该移动块的Y分量进行离散余弦变换,量化离散余弦变换后的Y分量,以得到量化系数,并利用Golomb-Rice编码来对该量化系数进行熵编码,从而实现对该移动块的Y分量的编码。
2.如权利要求1所述的系统,其中所述帧间编码部件包括:
移动估算单元,用于对所述视频信号变换单元输出的所述运动图像压缩目标信号进行估算,利用当前帧的块边界的像素值和在前内帧的原始图像的块边界的像素值的差值来估算在一个8*8像素块单元中是否发生移动;
纹理映象信息存储单元,用于存储指示在每个块中是否发生移动的纹理映象信息;
移动块存储单元,用于存储有移动发生的移动块,该移动块由该移动估算单元输出;
非移动块存储单元,用于存储没有移动发生的非移动块,该非移动块由该移动估算单元输出;
离散余弦变换DCT单元,用于通过在一个8*8像素块单元中对存储在该移动块存储单元中的所述移动块的Y分量进行离散余弦变换而得到一个DCT系数;
量化单元,用于对获得的DCT系数进行与量化宽度和每个频率分量相应的量化处理来产生一个量化系数;以及
Golomb-Rice编码单元,用于利用Golomb-Rice编码来编码并随后输出该产生的量化系数。
3.如权利要求2所述的系统,其中所述移动估算单元利用当前帧的块边界的像素值和在前帧的块边界的像素值的差值来估算移动是否发生,分别输出其中有移动发生的块和其中没有移动发生的块,并将有关运动在每一个块中是否发生的信息作为纹理映象信息输出。
4.如权利要求2所述的系统,其中所述移动估算单元基于当前帧的块的像素值和在前帧的块的像素值之间的差值求平方得到的值,对帧内模式和帧间模式进行估算,该差值是在估算移动是否发生时得到的最终值。
5.一种编码移动通信终端的运动图像的方法,通过把输入的RGB图像变换成运动图像压缩目标信号来进行帧内编码和帧间编码,该方法包括:
帧内编码过程,通过在一个4*4像素单元内计算均值并对该均值进行编码,来编码该运动图像压缩目标信号的U和V分量,并且在一个8*8像素块单元内对Y分量进行离散余弦变换,量化离散余弦变换后的该Y分量得到量化系数,并利用Golomb-Rice编码对该量化系数进行熵编码,从而实现对该运动图像压缩目标信号的Y分量的编码;
帧间编码过程,对该运动图像压缩目标信号进行估算,利用当前帧的块边界的像素值和在前帧的块边界的像素值的差值来估算移动是否发生在一个8*8像素块单元中,把该块分类成移动块和非移动块,并分别存储移动块和非移动块,编码并输出作为纹理映象信息的有关移动是否发生在每一个块中的信息,并在估算移动是否发生时,同时对该移动块进行帧内模式和帧间模式的估算,通过在一个4*4像素单元内计算均值来对有移动发生的移动块的U和V分量进行编码,并且在一个8*8像素块单元内对该移动块的Y分量进行离散余弦变换,量化离散余弦变换后的Y分量,以得到量化系数,并利用Golomb-Rice编码来对该量化系数进行熵编码,从而实现对该移动块的Y分量的编码。
6.如权利要求5所述的方法,其中所述帧间编码过程包括:
利用当前帧的块边界的像素值和在前帧的块边界的像素值之间的差值来估算移动是否发生;
根据移动是否发生的估算结果,输出且在每个存储单元中存储没有移动发生的非移动块和有移动发生的移动块,并且随后编码并输出指示移动是否发生在相应块中的纹理映象信息;以及
在估算移动是否发生时,同时估算是否以帧内模式或帧间模式编码其中发生移动的所述移动块。
7.如权利要求5所述的方法,其中所述帧间编码过程以与帧内编码相同的方式来编码估算为帧内模式的移动块,而通过编码当前帧的原始图像和在前图像之间的不同U、V、Y分量来编码估算为帧间模式的移动块。
8.如权利要求5所述的方法,所述帧间编码过程通过在一个4*4像素单元内计算均值并对该均值进行编码,来编码所述移动块的U和V分量,并且通过在一个8*8像素块单元内对所述移动块的Y分量进行离散余弦变换,量化所述离散余弦变换后的Y分量得到量化系数,并利用Golomb-Rice编码对该量化系数进行熵编码,从而实现对所述移动块的Y分量的编码。
CNB2004800007255A 2004-05-20 2004-05-20 编码移动通信终端的运动图像的系统和方法 Expired - Fee Related CN100405847C (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/KR2004/001204 WO2005115007A1 (en) 2004-05-20 2004-05-20 Systems and methods of encoding moving pictures for mobile communication terminals

Publications (2)

Publication Number Publication Date
CN1717938A CN1717938A (zh) 2006-01-04
CN100405847C true CN100405847C (zh) 2008-07-23

Family

ID=35428689

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004800007255A Expired - Fee Related CN100405847C (zh) 2004-05-20 2004-05-20 编码移动通信终端的运动图像的系统和方法

Country Status (2)

Country Link
CN (1) CN100405847C (zh)
WO (1) WO2005115007A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101500159B (zh) * 2008-01-31 2012-01-11 华为技术有限公司 一种图像熵编码、熵解码的方法及装置
KR102101824B1 (ko) * 2019-05-03 2020-04-20 한국콘베어공업주식회사 마찰음을 이용한 롤러체인의 길이 추정 방법
CN111402380B (zh) * 2020-03-12 2023-06-30 杭州小影创新科技股份有限公司 一种gpu压缩纹理处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1258413A (zh) * 1998-01-17 2000-06-28 皇家菲利浦电子有限公司 图像产生和编码
JP2001076166A (ja) * 1999-08-11 2001-03-23 K Media Co Ltd アニメーション動画像の符号化方法
US6650784B2 (en) * 2001-07-02 2003-11-18 Qualcomm, Incorporated Lossless intraframe encoding using Golomb-Rice

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100497760B1 (ko) * 2003-02-18 2005-06-29 (주) 멀티비아 이동통신 단말기용 동영상 부호화 시스템 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1258413A (zh) * 1998-01-17 2000-06-28 皇家菲利浦电子有限公司 图像产生和编码
JP2001076166A (ja) * 1999-08-11 2001-03-23 K Media Co Ltd アニメーション動画像の符号化方法
US6650784B2 (en) * 2001-07-02 2003-11-18 Qualcomm, Incorporated Lossless intraframe encoding using Golomb-Rice

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
A multiple transform based scheme for still colorimagecompression. Arun Ramaswamy ET AL.Circuits and Systems,1996. 1996
A multiple transform based scheme for still colorimagecompression. Arun Ramaswamy ET AL.Circuits and Systems,1996. 1996 *
A novel compression algorithm for cell animation images. Byongseok Min ET AL.Image Processing Proceedings,2001 International Conference. 2001
A novel compression algorithm for cell animation images. Byongseok Min ET AL.Image Processing Proceedings,2001 International Conference. 2001 *
Compression of color images without visible blocking artifactsusing a modified DCT computation scheme. P.Dorfler ET AL.Image Processing and Its Applications,1999. 1999
Compression of color images without visible blocking artifactsusing a modified DCT computation scheme. P.Dorfler ET AL.Image Processing and Its Applications,1999. 1999 *
Efficient global motion estimation for MPEG4 video compression. Y.Keller ET AL.Electrical and Electronics Engineers in Israel, 2002. 2002
Efficient global motion estimation for MPEG4 video compression. Y.Keller ET AL.Electrical and Electronics Engineers in Israel, 2002. 2002 *

Also Published As

Publication number Publication date
WO2005115007A1 (en) 2005-12-01
CN1717938A (zh) 2006-01-04

Similar Documents

Publication Publication Date Title
CN102986211B (zh) 视频编码中的速率控制
CN101133648B (zh) 用于帧内预测视频编码的模式选择方法及设备
CN108833923B (zh) 视频编码、解码方法、装置、存储介质和计算机设备
CN101946515B (zh) Cabac译码器的二回合量化
CN102172027B (zh) 有效率的预测模式选择
CN114501010B (zh) 图像编码方法、图像解码方法及相关装置
CN108989802B (zh) 一种利用帧间关系的hevc视频流的质量估计方法及系统
US11765390B2 (en) Non-transform coding
CN1589576A (zh) 使用较大像素格栅运动补偿的降低复杂性视频解码
CN101888546B (zh) 一种运动估计的方法及装置
CN101984665A (zh) 一种视频传输质量评测的方法与系统
JP4417054B2 (ja) 離散コサイン変換係数を参照する動き推定方法及び装置
US20070133689A1 (en) Low-cost motion estimation apparatus and method thereof
CN101742301B (zh) 一种块模式编码方法及装置
CN102595132A (zh) 一种应用于无线传感器网络的分布式视频编解码方法
JP2004241957A (ja) 画像処理装置および符号化装置とそれらの方法
CN115118976A (zh) 一种图像编码方法、可读介质及其电子设备
CN101516028B (zh) 一种针对移动网视频通话应用的高效视频编码技术
CN100377597C (zh) 面向移动设备的视频压缩方法
CN1457196A (zh) 基于时空域相关性运动矢量预测的视频编码方法
CN100405847C (zh) 编码移动通信终端的运动图像的系统和方法
KR20130006578A (ko) 비표준 벡터 양자화 코더를 이용한 비디오 표준을 따르는 레지듀얼 코딩
CN100466733C (zh) 对移动通信终端的运动图像进行编码的系统和方法
Minallah et al. Performance analysis of H. 265/HEVC (high-efficiency video coding) with reference to other codecs
CN1302666C (zh) 编码运动图像的装置和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080723

Termination date: 20120520