CN101340585A - 数据处理设备、方法及编码设备、方法和解码设备、方法 - Google Patents

数据处理设备、方法及编码设备、方法和解码设备、方法 Download PDF

Info

Publication number
CN101340585A
CN101340585A CNA2008101264675A CN200810126467A CN101340585A CN 101340585 A CN101340585 A CN 101340585A CN A2008101264675 A CNA2008101264675 A CN A2008101264675A CN 200810126467 A CN200810126467 A CN 200810126467A CN 101340585 A CN101340585 A CN 101340585A
Authority
CN
China
Prior art keywords
motion vector
index value
block
district
cell block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101264675A
Other languages
English (en)
Other versions
CN101340585B (zh
Inventor
佐川裕祐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN101340585A publication Critical patent/CN101340585A/zh
Application granted granted Critical
Publication of CN101340585B publication Critical patent/CN101340585B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

数据处理设备、方法及编码设备、方法和解码设备、方法。数据处理设备包含运动向量存储单元、索引值生成单元、存储控制单元和运动向量读取单元。运动向量存储单元在单元块区中存储运动向量。索引值生成单元基于要获得预测运动向量的对象块的尺寸生成索引值,索引值对应于单元块的在对象块的左上角和右上角处的位置。存储控制单元通过每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量。运动向量读取单元基于索引值获得指示单元块区的索引值。基于运动向量获得预测运动向量。

Description

数据处理设备、方法及编码设备、方法和解码设备、方法
技术领域
本发明分别涉及适合于在使用正交编码对视频数据进行压缩编码并通过图像内预测码对视频数据进行运动补偿的情况下使用的数据处理设备、数据处理方法和数据处理程序,编码设备、编码方法和编码程序,以及解码设备、解码方法和解码程序。
背景技术
现今,在广播站等的信息分发和普通家庭的信息接收的领域中,图像信息的编码设备和解码设备居主流地位,图像信息遵从MPEG(运动图像专家组)规定的压缩编码方法。压缩编码方法将诸如运动图像的图像信息作为数字数据来处理,并且通过利用特定于图像信息的冗余,使用诸如离散余弦变换的正交变换执行压缩编码,以及使用运动补偿执行预测编码。
特别地,MPEG2标准(运动图像专家组2:ISO(国际标准化组织)/IEC(国际电工委员会)13818-2)被规定为通用图像编码方法。MPEG2标准涵盖所有隔行扫描的图像数据和逐行扫描的图像数据,以及标准分辨率图像和高清晰度图像,并且现在被广泛用于专业使用和消费者使用的各种应用中。
通过利用MPEG2标准的压缩编码方法,例如通过将具有720×480像素标准分辨率、代码量为4的隔行扫描图像分配到作为位速率的8Mbp(位每秒),以及将具有1920×1088像素高分辨率、代码量为18的隔行扫描图像分配到作为位速率的22Mbp,能够实现高压缩系数和良好的图像质量。
虽然以高图像质量编码为目标的MPEG2标准主要适合于广播用途,然而其与以较小代码量(低位速率),即较高压缩系数为目标的编码方法不兼容。便携终端的广泛普及增加了对能够实现高压缩系数和低位速率的编码方法的需要。为响应该需要,已经开发了MPEG4标准。一种被称作ISO/IEC 14496-2的标准在1998年12月被批准成为针对图像编码方法的国际标准。
最近,被称作H.26L的运动图像编码方法的国际标准化工作正在进行。H.26L最初是以电视会议的图像编码为目标而设计的,并且其目标是实现大约两倍于诸如MPEG4的现有编码标准的压缩性能。
作为MPEG4的活动的一部分,基于H.26L的标准化、并入不被H.26L支持的功能以及实现更高编码效率的活动目前以增强压缩视频编码的联合模型的形式推进。在2003年3月,在ITU-T(国际电信联盟-电信标准化部门)建议H.264或ISO(国际标准化组织)/IEC(国际电工委员会)国际标准14496-10(MEPEG-4第10部分)高级视频编码(此后缩写成H.264|AVC)中规定了国际标准的编码方法。在2003年由ISO/IEC MPEG&ITU-T VCEG的联合视频工作组的Thomas Wiegand等人的非专利文献1:″Draft Errata List with Revision-Marked Correctionsfor H.264/AVC″中描述了基于该规定的处理的内容。
日本待审专利申请公开No.2006-25033(专利文献1)描述了遵从H.264|AVC规范的编码技术。
遵从H.264|AVC规范的编码方法的特性之一是:除了诸如MPEG2标准、通过利用正交变换和运动补偿而进行的预测编码来实现帧间压缩的已知编码方法之外,还通过利用与处理对象块接近或接触的块的运动向量来预测处理对象的运动向量。参照图20A和20B,将简要描述利用预测运动向量的编码。
以具有预定尺寸且由画面分成的宏块为单位执行利用预测运动向量的编码。这里假定一个宏块的尺寸是16×16像素。从画面的左上角处的宏块开始,从画面中的左端到右端并且从画面中的上端到下端执行利用预测运动向量的编码。也就是说,对于相对于要处理的宏块的上边位置和左边位置处的宏块,已经完成了编码处理。
如图20A中说明性示出地,由自左邻近于宏块E的宏块A、自上邻近的宏块B和自右上邻近的宏块C的运动向量MV(A)、MV(B)和MV(C)的每个水平和垂向分量的中值获得处理对象宏块E的预测运动向量PMV(E)。
发明内容
根据H.264|AVC规范,运动预测/补偿块的尺寸是可变的。也就是说,对于运动预测/补偿块的尺寸,定义了包括16×16像素、16×8像素、8×16像素和8×8像素的四种类型作为宏块单元的尺寸,此外,对于8×8像素块的子宏块单元的尺寸,定义了包括8×8像素、8×4像素、4×8像素和4×4像素的四种类型。通过恰当选择,使用这七种类型的运动预测/补偿块。通过有选择地使用多个类型的最优运动预测/补偿块,在抑制要形成的代码量的同时,可以进行更精细的运动预测。
例如,如图20B中说明性示出地,对于处理对象宏块E,8×4像素的子宏块被用于左邻近的宏块A,4×8像素的子宏块被用于上邻近的宏块B,16×8像素的子宏块被用于右上邻近的宏块C。
如上所述,由于定义了多个运动预测/补偿块尺寸,在处理对象宏块与邻近宏块和子宏块之间存在大量组合。因此,当在获得处理对象宏块E的预测运动向量MV(E)时选择邻近运动向量MV(A)、MV(B)和MV(C)时,出现计算量变得巨大以及处理时间延长的问题。
为缩短处理时间,还出现需要具有高处理能力的计算电路,可能导致较高设备成本的问题。
例如,如图21到24所示,具有16×16像素尺寸的宏块的子宏块的组合数目是256。也就是说,子宏块具有四个等级层次的结构,每个等级层次均具有四个分支,并且由具有4位数据长度的参数sub_mb_type0、sub_mb_type1、sub_mb_type2和sub_mb_type3,以及具有6位数据长度并且指示上层宏块类型的参数mb_type代表。
图21示出了宏块中的左上角子宏块类型的块尺寸被固定为8×8像素时的组合的例子,图22示出了左上角子宏块类型的块尺寸被固定为8×4像素时的组合的例子,图23示出了左上角子宏块类型的块尺寸被固定为4×8像素时的组合的例子,以及图24示出了左上角子宏块类型的块尺寸被固定为4×4像素时的组合的例子。一个宏块具有259种组合,包含256种组合加上对应于宏块类型的块类型的三种组合。因此,处理对象块与邻近块之间的组合具有2592=67081种模式,使得需要构造67081种模式的判断。
因此,期望提供一种数据处理设备、数据处理方法和数据处理程序、编码设备、编码方法和编码程序、以及解码设备、解码方法和解码程序,其分别能够减少当通过利用邻近或接触处理目标块的块的运动向量来预测处理对象的运动向量时,选择运动预测/补偿块所需的计算量。
根据本发明的第一方面,提供了一种数据处理设备,包含:用于在单元块的单元块区中存储运动向量的运动向量存储单元,索引值生成单元,存储控制单元,和运动向量读取单元。通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出单元块。按照在宏块中的预定顺序为单元块区分配索引值。索引值生成单元基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,索引值对应于单元块的在对象块的左上角和右上角处的位置。存储控制单元通过运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量。单元块区对应于运动向量存储单元的邻近块。邻近块与对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触对象块,并且能够采取多个不同尺寸。运动向量读取单元基于由索引值生成单元生成的索引值,获得指示将从中读取运动向量的运动向量存储单元的单元块区的索引值。基于由运动向量读取单元读取的运动向量,获得预测运动向量。
根据本发明的第二方面,提供了一种数据处理方法,包含步骤:在单元块的单元块区中存储运动向量,生成索引值,通过运动向量存储单元的每个单元块区复制邻近块的运动向量并且存储所复制的运动向量,读取运动向量以获得索引值,和基于由运动向量读取步骤读取的运动向量,获得预测运动向量。通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出单元块。单元块区被提供在运动向量存储单元中,并且按照在宏块中的预定顺序为单元块区分配索引值。基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,索引值对应于单元块的在对象块的左上角和右上角处的位置。单元块区对应于运动向量存储单元的邻近块。邻近块与对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触对象块,并且能够采取多个不同尺寸。索引值指示将从中读取运动向量的运动向量存储单元的单元块区。
根据本发明的第三方面,提供了一种用于使计算机执行数据处理方法的数据处理程序,所述数据处理方法包含步骤:在单元块的单元块区中存储运动向量,生成索引值,通过运动向量存储单元的每个单元块区复制邻近块的运动向量并且存储所复制的运动向量,读取运动向量以获得索引值,和基于由运动向量读取步骤读取的运动向量,获得预测运动向量。通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出单元块。单元块区被提供在运动向量存储单元中,并且按照在宏块中的预定顺序为单元块区分配索引值。基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,索引值对应于单元块的在对象块的左上角和右上角处的位置。单元块区对应于运动向量存储单元的邻近块。邻近块与对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触对象块,并且能够采取多个不同尺寸。索引值指示将从中读取运动向量的运动向量存储单元的单元块区。
根据本发明的第四方面,提供了一种用于编码运动图像数据的编码设备,包含:用于在单元块的单元块区中存储运动向量的运动向量存储单元,索引值生成单元,存储控制单元,和运动向量读取单元。通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出单元块。按照在宏块中的预定顺序为单元块区分配索引值。索引值生成单元基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,索引值对应于单元块的在对象块的左上角和右上角处的位置。存储控制单元通过运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量。单元块区对应于运动向量存储单元的邻近块。邻近块与对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触对象块,并且能够采取多个不同尺寸。运动向量读取单元基于由索引值生成单元生成的索引值,获得指示将从中读取运动向量的运动向量存储单元的单元块区的索引值。基于由运动向量读取单元读取的运动向量生成预测运动向量,基于针对每个块获得的运动向量生成预测图像数据。编码预测图像数据与输入图像数据之间的差。
根据本发明的第五方面,提供了一种用于编码运动图像数据的编码方法,包含步骤:在单元块的单元块区中存储运动向量,生成索引值,通过每个单元块区复制邻近块的运动向量并且存储所复制的运动向量,读取运动向量以获得索引值,和基于由运动向量读取步骤读取的运动向量,获得预测运动向量。通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出单元块。单元块区被提供在运动向量存储单元中,并且按照在宏块中的预定顺序为单元块区分配索引值。基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,索引值对应于单元块的在对象块的左上角和右上角处的位置。单元块区对应于运动向量存储单元的邻近块。邻近块与对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触对象块,并且能够采取多个不同尺寸。基于由索引值生成步骤生成的索引值产生指示将从中读取运动向量的运动向量存储单元的单元块区。基于通过运动向量读取步骤读取的运动向量生成预测运动向量,并且基于针对每个块获得的运动向量生成预测图像数据。编码预测图像数据与输入图像数据之间的差。
根据本发明的第六方面,提供了一种用于使计算机执行编码运动图像数据的编码方法的编码程序,编码方法包含步骤:在单元块的单元块区中存储运动向量,其中,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出所述单元块,单元块区被提供在运动向量存储单元中,按照在宏块中的预定顺序为单元块区分配索引值;基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,索引值对应于单元块的在对象块的左上角和右上角处的位置;通过运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量,单元块区对应于运动向量存储单元的邻近块,邻近块与对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触对象块,并且能够采取多个不同尺寸;基于由索引值生成步骤生成的索引值读取运动向量,以获得指示将从中读取运动向量的运动向量存储单元的单元块区的索引值;和基于通过运动向量读取步骤读取的运动向量,获得预测运动向量,其中,基于通过所述运动向量读取步骤读取的运动向量,生成预测运动向量,基于针对每个块获得的运动向量,生成预测图像数据,并且编码预测图像数据与输入图像数据之间的差。
根据本发明的第七方面,提供了一种用于解码所编码的图像数据的解码设备,所编码的图像数据是通过如下方式获得的:对于基于针对每个块获得的运动向量而生成的预测图像数据和基于通过利用运动向量和输入的图像数据获得的预测运动向量而生成的预测图像数据之间的差,对该差进行编码,解码设备包含:运动向量存储单元,用于在单元块的单元块区中存储运动向量,其中,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出单元块,按照在宏块中的预定顺序为单元块区分配索引值;索引值生成单元,用于基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,索引值对应于单元块的在对象块的左上角和右上角处的位置;存储控制单元,用于通过运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量,单元块区对应于运动向量存储单元的邻近块,邻近块与对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触对象块,并且能够采取多个不同尺寸;以及运动向量读取单元,用于基于由索引值生成单元生成的索引值,获得指示将从中读取运动向量的运动向量存储单元的单元块区的索引值,其中,基于预测运动向量和针对每个块获得的运动向量生成预测图像数据,运动向量是利用由运动向量读取单元读取的运动向量获得的,并且通过预测图像数据与输入的编码图像数据的相加来执行解码处理。
根据本发明的第八方面,提供了一种用于解码所编码的图像数据的解码方法,所编码的图像数据是通过如下方式获得的:对于基于针对每个块获得的运动向量而生成的预测图像数据和基于通过利用运动向量和输入的图像数据获得的预测运动向量而生成的预测图像数据之间的差,对该差进行编码,所述方法包含步骤:在单元块的单元块区中存储运动向量,其中,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出单元块,按照在宏块中的预定顺序为单元块区分配索引值;基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,索引值对应于单元块的在对象块的左上角和右上角处的位置;通过运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量,单元块区对应于运动向量存储单元的邻近块,邻近块与对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触对象块,并且能够采取多个不同尺寸;基于通过索引值生成步骤生成的索引值,读取运动向量,以获得指示将从中读取运动向量的运动向量存储单元的单元块区的索引值;和基于通过运动向量读取步骤获得的运动向量获得预测运动向量,其中,基于预测运动向量和针对每个块获得的运动向量生成预测图像数据,预测运动向量是基于由运动向量读取步骤读取的运动向量产生的,并且通过预测图像数据与输入的图像数据的相加来执行解码处理。
根据本发明的第九方面,提供了一种用于使计算机执行解码方法的解码程序,所述解码方法用于解码所编码的图像数据,所编码的图像数据是通过如下方式获得的:对于基于针对每个块获得的运动向量而生成的预测图像数据和基于通过利用运动向量和输入的图像数据获得的预测运动向量而生成的预测图像数据之间的差,对该差进行编码,所述方法包含步骤:在单元块的单元块区中存储运动向量,其中,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出单元块,按照在宏块中的预定顺序为单元块区分配索引值;基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,索引值对应于单元块的在对象块的左上角和右上角处的位置;通过运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量,单元块区对应于运动向量存储单元的邻近块,邻近块与对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触对象块,并且能够采取多个不同尺寸;基于通过索引值生成步骤生成的索引值,读取运动向量,以获得指示将从中读取运动向量的运动向量存储单元的单元块区的索引值;和基于通过运动向量读取步骤获得的运动向量获得预测运动向量,其中,基于预测运动向量和针对每个块获得的运动向量生成预测图像数据,预测运动向量是基于由运动向量读取步骤读取的运动向量产生的,并且通过预测图像数据与输入的图像数据的相加来执行解码处理。
如上所述,根据本发明的第一到第三方面,对于用于在单元块的单元块区中存储运动向量的运动向量存储单元,通过以预定方式将一个画面分成宏块并且以预定方式进一步划分每个宏块来限定出单元块,单元块区被提供于运动向量存储单元中,按照在宏块中的预定顺序为单元块区分配索引值;运动向量被存储在单元块区中,接触处理对象块、与处理对象块存在于同一二维图像区中并且能够具有多种不同尺寸的左、上和右上或左上邻近块的运动向量被复制并且存储在运动向量存储单元的对应于邻近块的单元块区中,基于能够采取多个不同尺寸、要获得预测运动向量的处理对象块的尺寸生成索引值,索引值对应于处理对象块的左上角和右上角处的位置,基于生成的索引值获得指示将从中读取运动向量的运动向量存储单元的单元块区的索引值,基于根据索引值从运动向量存储单元读取的运动向量,获得预测运动向量。因此,当运动向量被用于从运动向量存储单元中获得预测运动向量时,不必考虑对应邻近块的尺寸。
此外,根据本发明的第四到第六方面,在编码运动画面时,对于用于在单元块的单元块区中存储运动向量的运动向量存储单元,通过以预定方式将一个画面分成宏块并且以预定方式进一步划分每个宏块来限定出单元块,单元块区被提供于运动向量存储单元中,按照在宏块中的预定顺序为单元块区分配索引值;运动向量被存储在单元块区中,接触处理对象块、与处理对象块存在于同一二维图像区中并且能够具有多种不同尺寸的左、上和右上或左上邻近块的运动向量被复制并且存储在运动向量存储单元的对应于邻近块的单元块区中,基于能够采取多个不同尺寸、要获得预测运动向量的处理对象块的尺寸生成索引值,索引值对应于处理对象块的左上角和右上角处的位置,基于生成的索引值获得指示将从中读取运动向量的运动向量存储单元的单元块区的索引值,基于根据索引值从运动向量存储单元读取的运动向量,获得预测运动向量,基于通过利用运动向量读取步骤中读取的运动向量所获得的预测运动向量和针对每个块获得的运动向量来生成预测向量数据,以及编码预测图像数据与输入图像数据之间的差。因此,当运动向量被用于从运动向量存储单元中获得预测运动向量时,不必考虑对应邻近块的尺寸。
更进一步地,根据本发明的第七到第九方面,对于通过如下方式获得的所编码的图像数据:对于通过编码每个块的运动向量之间的差而获得的预测图像数据和利用运动向量而获得的预测运动向量之间的差,对该差进行编码,在解码所编码的图像数据时,对于用于在单元块的单元块区中存储运动向量的运动向量存储单元,通过以预定方式将一个画面分成宏块并且以预定方式进一步划分每个宏块来限定出单元块,单元块区被提供于运动向量存储单元中,按照在宏块中的预定顺序为单元块区分配索引值;运动向量被存储在单元块区中,接触处理对象块、与处理对象块存在于同一二维图像区中并且能够具有多种不同尺寸的左、上和右上或左上邻近块的运动向量被复制并且存储在运动向量存储单元的对应于邻近块的单元块区中,基于能够采取多个不同尺寸、要获得预测运动向量的处理对象块的尺寸生成索引值,索引值对应于处理对象块的左上角和右上角处的位置,基于生成的索引值获得指示将从中读取运动向量的运动向量存储单元的单元块区的索引值,基于根据索引值从运动向量存储单元读取的运动向量,获得预测运动向量,基于通过利用运动向量读取步骤中读取的运动向量所获得的预测运动向量和针对每个块获得的运动向量来生成预测向量数据,以及解码预测图像数据与输入图像数据的相加。因此,当运动向量被用于从运动向量存储单元中获得预测运动向量时,不必考虑对应邻近块的尺寸。
本发明的上述概括说明并未打算描述本发明的每个图解实施例或每个实现。随后的附图和详细描述更具体地举例说明这些实施例。
附图说明
图1的模块图示意性地示出了本发明应用于的编码/解码系统的例子。
图2的模块图示出了应用于实施例的编码设备的例子。
图3是解释直接模式的示意图。
图4A和4B的示意图示出了针对运动预测/补偿块定义的多个块尺寸。
图5的模块图示出了应用于实施例的解码设备的例子。
图6是解释索引值的示意图。
图7的示意图示出了显示与宏块和子宏块相关的索引值lft_idx[3:0]和rht_idx[3:0]的表的例子。
图8的示意图示出了宏块上的运动补偿块的最右和最左单元块的位置,以及相应索引值lft_idx[3:0]和rht_idx[3:0]。
图9的模块图示出了邻近MV选择器单元的结构的例子。
图10的示意图示出了按光栅扫描顺序分配给对应于单元块的每个区的每个索引值。
图11的流程图图解了由邻近MV选择器单元执行的过程的例子。
图12是用于具体地描述由邻近MV选择器单元执行的过程的示意图。
图13是用于具体地描述由邻近MV选择器单元执行的过程的示意图。
图14的示意图图解了根据实施例的修改的索引值分配。
图15的示意图图解了根据实施例的修改的索引值分配。
图16的流程图图解了根据实施例的修改、获得块A的运动向量MV的过程的例子。
图17的流程图图解了根据实施例的修改、获得块B的运动向量MV的过程的例子。
图18的流程图图解了根据实施例的修改、获得块C的运动向量MV的过程的例子。
图19的流程图图解了根据实施例的修改、获得块D的运动向量MV的过程的例子。
图20A和20B的示意图图解了使用预测运动向量的编码。
图21的示意图示出了具有16×16像素尺寸的宏块中的子宏块的组合。
图22的示意图示出了具有16×16像素尺寸的宏块中的子宏块的组合。
图23的示意图示出了具有16×16像素尺寸的宏块中的子宏块的组合。
图24的示意图示出了具有16×16像素尺寸的宏块中的子宏块的组合。
具体实施方式
将参照附图描述本发明的实施例。图1的示意图地示出了本发明应用于的编码/解码系统1的例子。编码/解码系统1包含发送侧的编码设备2和接收侧的解码设备4。编码设备2和解码设备4通过传输线路3互连。
通过诸如离散余弦变换的正交变换、画面内预测编码和帧内预测编码,编码设备2执行输入视频信号的图像数据的压缩编码。在帧内预测编码中,帧图像包含例如基于帧内编码的I(内编码)图像、基于预测编码的P(预测编码)图像、以及B(双向预测编码)图像。帧图像被编码为具有按预定布置来安排I图像、P图像和B图像的GOP(图像组)结构的数据。编码设备2将压缩编码的帧图像数据作为位流输出。
位流经由传输线路3被传送到解码设备4。传输线路3可以是通信网络,例如宽带卫星波、CATV(有线电视)网络、电话线网络和移动电话网络。诸如光盘、磁盘、磁带和半导体存储器的存储设备或记录介质可以被用作传输线路3。解码设备4针对经由传输线路3传送的位流执行对应于由编码设备进行的编码处理的解码处理,以扩展压缩编码的帧图像数据,并且输出基带的视频信号。
图2示出了应用于实施例的编码设备2的结构的例子。例如,由亮度信号Y和色差信号Cb和Cr组成的模拟类型的原始图像的视频信号被提供给A/D转换器单元10,其将模拟视频信号转换成数字视频信号的图像数据,并且输出图像数据。重新排列单元11根据例如由I图像、P图像和B图像组成的GOP结构,按编码顺序重新排列从A/D转换器单元10输出的图像数据中的帧图像信号。具有重新排列的帧顺序的原始图像的图像数据被输入到减法器单元12的一个输入端、运动预测/补偿单元28以及内预测单元27。
后面描述的从选择器单元29输出的预测图像数据PI被输入给减法器单元12的另一个端子。减法器单元12从输入到一个端子的原始图像的图像数据中减去输入到另一个端子的预测图像数据PI,并且输出代表原始图像与预测图像数据PI的图像数据之间的差的差图像数据。差图像数据被提供给正交变换单元13。
正交变换单元13执行所提供的差图像数据的正交变换以生成系数数据。这里考虑,例如离散余弦变换(DCT:离散余弦变换)被正交变换单元13用作正交变换。由正交变换单元13生成的系数数据被提供给量化单元14。量化单元14基于从后面描述的比率控制单元17提供的量化比例来量化系数数据,并且输出通过量化系数数据而获得的量化数据。
按预定块单元执行正交变换单元13的正交变换处理和量化单元14的量化处理。例如,以预定方式划分一个帧以形成每个均被用作正交变换处理的单元的正交变换块,并且由多个正交变换块组成的宏块被用作量化处理的单元。例如,正交变换块是由8×8像素构成的正方形块,而宏块是由四个正交变换块构成的正方形块。
从量化单元14输出的量化数据分别被提供给熵编码单元15和逆量化单元20。
熵编码单元15对所提供的量化数据执行诸如可变长度编码处理或算术编码处理的熵编码处理,从而进一步压缩编码量化数据。在这种情况下,熵编码单元15编码从后面描述的运动预测/补偿单元28提供的运动向量MV或运动向量MV的差运动向量、将被预测编码参考的参考图像数据的标识数据、以及从内预测单元27提供的内预测模式IPM,并且将结果以预定方式存储在编码的量化数据的头部等等中。
从熵编码单元15输出的编码数据被用作编码设备2的最终压缩图像数据。从熵编码单元15输出的压缩图像数据被存储在缓冲器16中。上述的比率控制单元17监视存储在缓冲器16中的压缩图像数据,基于监视结果确定量化比例,并且给量化单元14提供量化比例。存储在缓冲器16中的压缩图像数据被以预定方式读取,经过发送到传输线路3所需的、诸如调制过程的过程的处理,并且被从编码设备2输出。
逆量化单元20对从量化单元14提供的量化数据执行量化单元14的过程的逆过程,从而生成逆量化的数据。逆量化的数据被提供给逆正交变换单元21来进行上述正交变换单元13的正交变换的逆变换过程。从逆正交变换单元21输出的逆变换的图像数据被输入到加法器22的一个输入端。
加法器22将输入到一个输入端的逆转换的图像数据与从后面描述的选择器单元29输出并且输入到另一个输入端的预测图像数据PI相加,以生成重构图像数据。重构图像数据被提供给去块(de-block)滤波器23以消除块应变,并且作为参考图像数据REF被写在帧存储器24中。
以完成处理的宏块为单位,将每个图像的重构图像数据顺序地写入帧存储器24,此重构图像数据是后面描述的运动预测/补偿单元28的运动预测/补偿过程和内预测单元27的内预测过程的处理对象。
运动预测/补偿单元28基于根据从PMV生成单元25提供的预测运动向量PMV最终选择的运动预测/补偿块尺寸,从存储在帧存储器24的参考图像数据REF和自图像重新排列单元11提供的原始图像的图像数据中检测运动向量MV。运动预测/补偿单元28基于存储在帧存储器24的参考图像数据REF和运动向量MV生成预测图像数据PIm,并且获得被用作编码数据的代码量的指标的指标数据COSTm。预测图像数据PIm和指标数据COSTm被输入到选择器单元29的一个输入端。
运动预测/补偿单元28能够按直接模式针对图像类型为B图像的帧执行预测编码。直接模式是一种由已编码的块预测运动向量MV的模式,包含时间直接模式和空间直接模式。如图3中说明性所示的,在直接模式中,由时间域中对象图像之前和之后的对应图像的运动向量预测对象图像的对应块的运动向量。例如,紧跟在对象图像之后的参考图像被用作锚标图像(anchor picture),并且该预测在下述位置使用锚标图像和锚标图像的参考图像:对象图像被夹在参考图像与锚标图像之间。
如上所述,由于以直接模式由已编码块预测运动向量,所以有必要存储预定图像的所有运动向量。在图2所示的例子中,生成的运动向量被存储在直接模式存储器30中。在这种情况下,可能存在预定图像的宏块中运动补偿块的尺寸全部都是4×4像素的情况。因此,需要直接模式存储器30具有能够存储可能按4×4像素的块(每一个宏块有16个块,合计为一帧)来检测的运动向量的容量。
基于从后面描述的选择器单元29提供的选择信号SEL,运动预测/补偿单元28在直接模式存储器30中存储上述运动向量MV。因此,不必提供另一个存储器来存储每个单元块中的运动向量,从而电路规模不会增加。显然该实施例并不限于此,另一存储器可被用于存储运动向量。
运动预测/补偿单元28将检测到的运动向量MV提供给熵编码单元15。运动预测/补偿单元28也给熵编码单元15提供有关最终选择的运动预测/补偿块的尺寸、代表参考图像数据REF的运动预测/补偿模式MEM、和由运动预测/补偿过程选择的参考图像数据的标识数据的信息。熵编码单元15在将信息存储在诸如头部等的预定位置之后,编码所提供的信息。
如果在原始图像的图像数据中要处理的宏块被进行间(画面间)编码,则PMV生成单元25基于由邻近MV选择器单元26选择的块的运动向量生成预测运动向量PMV,其中已参考每个宏块的邻近块数据生成所述运动向量,邻近块具有由每个宏块限定的多个运动预测/补偿尺寸。
下面简要描述PMV生成单元25和邻近MV选择器单元26中的处理。从运动预测/补偿单元28中输出的每个块的运动向量MV被提供给邻近MV选择器单元26。在该例子中,邻近MV选择器单元26从直接模式存储器30中读取运动向量MV。
在该实施例中,如图4A和4B中说明性所示的,作为运动预测/补偿块的块尺寸,定义有四种类型的宏块单元尺寸(被称作宏块类型),包含16×16像素、16×8像素、8×16像素和8×8像素(参考图4A),以及8×8像素块中的四种类型的子宏块单元尺寸(被称作子宏块类型),包含8×8像素、8×4像素、4×8像素和4×4像素(参考图4B)。
针对位置接近处理对象宏块的多个块的数据(即二维画面区中位置接近处理对象宏块的块的数据),邻近MV选择器单元26选择预定块,该预定块的运动向量MV将在生成处理对象宏块的运动向量之前生成。邻近MV选择器单元26将所选择的块的运动向量MV提供给PMV生成单元25。
在本发明的一个实施例中,设计邻近MV选择器单元26中的块选择过程,使得利于从接近处理对象宏块(要处理的宏块)的邻近块中选择预定块的过程。
PMV生成单元25基于从邻近MV选择器单元26提供的运动向量MV,获得处理对象块的预测运动向量PMV。例如,PMV生成单元25提取例如处理对象块的上和左邻近块以及右上邻近块的运动向量的中值,并且将该中值用作处理对象块的预测运动向量。中值是多个对象值的中间值。
PMV生成单元25分别针对垂直和水平方向生成预测运动向量PMV。因此,存在处理对象块的左邻近块的运动向量MV的垂直分量可变成预测运动向量的垂直分量,而右上邻近块的运动向量MV的水平分量可变成预测运动向量PMV的水平分量的情况。
如果位置接近要处理的块的所有块都不存在于处理对象块附近,即,在二维画面区中邻近于或接触的位置不存在,则PMV生成单元25将该块的预测运动向量PMV的值设置为0。如果位置接近要处理的上邻近块的块不存在于处理对象块附近,即在二维画面区中不存在,则处理对象块的左邻近块的运动向量MV被用作预测运动向量PMV。如果定位的要处理的右上块的块不存在于二维画面区中,则通过利用被放置在将被处理的左上邻近块中的块的运动向量MV,而不是右上块的运动向量来获得运动向量MV。
在下文中,相对于处理对象宏块(适当时被称作″宏块E″),左邻近块被称作A块,上邻近块被称作B块,右上邻近块被称作C块,以及左上邻近块被称作D块。
内预测单元27对从图像重新排列单元11提供的原始图像的图像数据执行内(画面内)预测编码。在这种情况下,内预测单元27针对多种模式,例如用于以4×4像素为单位执行画面内预测编码的内4×4模式,或用于以16×16为单位执行画面内预测编码的内16×16模式中的每种模式,生成处理对象宏块的预测图像数据PIi,并且基于预测图像数据PIi和从重新排列单元11提供的原始图像的图像数据,生成指标数据COSTi以作为编码数据的量的指标。内预测单元27选择最小化所生成的指标数据COSTi的内预测模式。内预测单元27给选择器单元29提供预测图像数据PIi以及与最终所选择的内预测模式相一致所生成的指标数据COSTi。
当通过从选择器单元29提供的选择信号SEL通知内预测单元27内预测模式的选择时,内预测单元将表明最终选择的内预测模式的预测模式信息IPM提供给熵编码单元15。熵编码单元15在将该信息存储在头部等中之后,编码所提供的预测模式信息IPM。
选择器单元29比较从运动预测/补偿单元28提供的指标数据COSTi与从内预测单元27提供的指标数据COSTm,识别较小值,并且选择和输出与所识别的指标数据一致的预测图像数据PIi或预测图像数据PIm输入。从选择器单元29输出的预测图像数据PIi或预测图像数据PIm被输入到减法器单元13的另一个输入端。
如果选择器单元29由指标数据COSTi与指标数据COSTm之间的比较结果判断出指标数据COSTi较小,则选择器单元输出指示选择内预测模式的选择信号。另一方面,如果选择器单元29由比较结果判断出指标数据COSTm较小,则选择器单元输出指示选择运动预测/补偿模式的选择信号。选择信号SEL被提供给内预测单元27和运动预测/补偿单元28。
H.264|AVC将沿着水平方向连续连接宏块的片(slice)定义为编码单元。因此,包含I片、P片和B片的不同类型的片可在一个图像中被混合。I片是仅用于画面内(内)编码的片。B片是用于图像内编码和利用一或两个参考图像的帧间预测编码的片。P片是用于图像内编码和利用一个参考图像的帧间预测编码的片。在H.264|AVC中,即使对于属于用于利用参考图像的帧间预测编码的P或B片的宏块,内预测单元27也可执行内预测编码。
接下来,将描述解码设备4。图5示出了应用于本发明的实施例的解码设备4的结构的例子。解码设备4包含缓冲器40、熵代码解码单元41、逆量化单元42、逆正交变换单元43、加法器44、去块滤波器45、画面重新排列单元46、D/A转换器47、帧存储器50、运动预测/补偿单元51、内预测单元54、PMV生成单元52和邻近MV选择器单元53。
由利用编码设备2以上面描述的方式压缩编码的帧图像组成的位流经由传输线路3被输入到解码设备4。输入位流被一次性加载到缓冲器40中。从缓冲器40中读出的位流被提供给熵代码解码单元41。
熵代码解码单元41执行熵代码的解码过程,所述解码过程对应于由利用图2描述的编码设备2的熵编码单元15所执行的熵编码。通过解码熵代码获得的数据被提供给逆量化单元42。如果解码的帧图像数据是内编码数据,则熵代码解码单元41将帧图像数据提供给内预测单元54。
熵代码解码单元41也解码存储在头部中的每条信息。如果解码的帧图像数据是内编码数据,则熵代码解码单元41也解码指示存储在头部中的内预测模式的预测模式信息IPM或运动向量MV,或运动向量MV的差运动向量。解码的预测模式信息IPM被提供给后面描述的内预测单元54。解码的运动向量MV或差运动向量被提供给后面描述的邻近MV选择器单元53。
逆量化单元42针对从熵代码解码单元41提供的数据,执行上述编码设备2的量化单元15(参考图2)中的过程的逆过程,以生成逆量化数据。逆量化数据被提供给逆正交变换单元43。逆正交变换单元43针对从逆量化单元42提供的数据,生成通过执行上述编码设备2的正交变换单元13(参考图2)中的正交变换的逆变换过程获得的数据(这里被称作″逆变换图像数据″)。逆变换图像数据被输入到加法器44的一个输入端。
如果要处理的帧是内编码的帧,则内预测单元54通过利用从熵代码解码单元41提供的内编码帧图像数据和预测模式信息IPM,执行解码过程以生成预测图像数据。预测图像数据被输入到加法器44的另一个输入端,以与逆变换图像数据合成。
如果处理对象帧是间编码帧,则从运动预测/补偿单元51输出的参考图像数据被输入到加法器44的另一个输入端以与逆变换图像数据合成。
例如,基本类似于上述编码设备2,如果间编码数据将被处理,则邻近MV选择器单元53基于从熵代码解码单元41提供的运动向量MV,从位于要处理的宏块周围的块中选择预定块。从提供自熵代码解码单元41的运动向量MV中选出所选择的块的运动向量,并且提供给PMV生成单元52。PMV生成单元52基于所提供的运动向量MV获得预测运动向量PMV。运动预测/补偿单元51基于所提供的预测运动向量PMV和存储在帧存储器50中的帧图像数据,生成参考图像数据。
在以上描述中,虽然图2中所示的编码设备2和图5中所示的解码设备4的每个部件都是由硬件组成,但是实施例并不限于此。例如,编码设备2和解码设备4的部分或全部可通过软件来实现。例如,用于运行编码设备2和解码设备4的程序经由预定记录介质或网络被提供给诸如个人计算机的计算机,并且被加载到计算机中。通过执行计算机中的程序,可在该计算机上实现编码设备2和解码设备4的功能。
接下来,将对编码设备2的邻近MV选择器单元26和解码设备4的邻近MV选择器单元53进行详细描述,其与本发明的主题有关。因为邻近MV选择器单元26和邻近MV选择器单元53可具有相同的配置,所以将通过例子描述编码设备2的邻近MV选择器单元26。
在本发明的一个实施例中,例如,16×16像素的正方形块的宏块被分成4×4像素的块,其为H.264|AVC中定义的16×16像素到4×4像素的七种类型运动补偿块尺寸中的最小尺寸,并且以4×4像素的分割块为单位,按宏块的光栅扫描顺序定义索引值。定义索引值的4×4像素的块此后被称作单元块。
也就是说,如图6中说明性所示的,对于要处理的宏块(E)和用于获得预测运动向量的宏块(A)至(D),针对宏块的左上角处的单元块定义索引值4′d0,利用左上角作为起点,从左至右以及从上至下索引值递增1,以定义每个单元块的索引值。在这里所使用的标记″值4′dx″中,″4′d″意味着右边数值″x″由十进制数代表,虽然其实际上由四个二进制位的数值代表。
更准确地说,对于宏块的最上面一行的4个单元块,从左顺序地定义索引值4′d0、4′d1、4′d2和4′d3,对于第二行的四个单元块,从左顺序地定义索引值4′d4、4′d5、4′d6和4′d7,对于第三行的四个单元块,从左顺序地定义索引值4′d8、4′d9、4′d10和4′d11,以及对于最下面一行的四个单元块,从左顺序地定义索引值4′d12、4′d13、4′d14和4′d15。
在具有上述16×16像素到4×4像素的七种类型运动补偿块尺寸的每一个块中,定义最左和最右块来标识最左块的索引值lft_idx[3:0]和最右块的索引值rht_idx[3:0]。最左和最右块被定义为运动补偿块的最上面一行的最左和最右单元块。诸如lft_idx[3:0]和rht_idx[3:0]的索引值的标记意味着当索引值由二进制数值表示时,只使用LSB(最低有效位)侧上的4位。
图7是与宏块类型和子宏块类型相关的、示出针对具有七种运动补偿块尺寸的块的每一个的最左和最右单元块所定义的索引值lft_idx[3:0](值4′dx)和索引值rht_idx[3:0]的表的例子。该表事先被存储在例如配备到编码设备2的只读存储器(ROM)(图7中未示出)中。图8示出了具有16×16像素到4×4像素的七种运动补偿块尺寸的宏块上最左和最右单元块的位置,以及对应的索引值lft_idx[3:0](值4′dx)和索引值rht_idx[3:0]。
参考图7,在宏块类型为16×16像素的情况下,运动补偿块变得与宏块一致,最左单元块具有索引值lft_idx[3:0]4′d0,而最右单元块具有索引值rht_idx[3:0]4′d3。
在宏块类型为16×8像素的情况下,运动补偿块为沿着水平方向被分成两部分的宏块。在上面的运动补偿块中,最左单元块具有索引值lft_idx[3:0]4′d0,而最右单元块具有索引值rht_idx[3:0]4′d3。在下面的运动补偿块中,最左单元块具有索引值lft_idx[3:0]4′d8,而最右单元块具有索引值rht_idx[3:0]4′d15。
在宏块类型为8×16像素的情况下,运动补偿块为沿着垂直方向被分成两部分的宏块。在左边的运动补偿块中,最左单元块具有索引值lft_idx[3:0]4′d0,而最右单元块具有索引值rht_idx[3:0]4′d11。在右边的运动补偿块中,最左单元块具有索引值lft_idx[3:0]4′d2,而最右单元块具有索引值rht_idx[3:0]4′d3。
在宏块类型为8×8像素的情况下,进一步定义了四种子宏块类型8×8像素、8×4像素、4×8像素和4×4像素。在子宏块类型为8×8像素的情况下,运动补偿块为沿着水平和垂直方向被分成两部分,即被分成四个块的宏块,并且类似于上述宏块类型,最上面一行的最左和最右单元块被定义为索引值lft_idx[3:0]4′dx以及索引值rht_idx[3:0]4dy。
在子宏块的类型为4×8像素和4×4像素的情况下,只有一个单元块沿水平方向排列。因此,可以认为相同的单元块为最左和最右单元块,并且相同的数值也被用于索引值lft_idx[3:0](值4′dx)和索引值rht_idx[3:0](数值4′dy)。
图9示出邻近MV选择器单元26的配置的例子。因为解码器设备4的邻近MV选择器单元53具有如图9中所示的基本相同的配置,所以省略其描述。邻近MV选择器单元26包含块值生成单元100、加法器单元102和MV存储单元106,以及四个选择器101、103、104和105。MV存储单元106被配置为使得能够控制针对上述直接模式存储器30的读/写。
块值生成单元100被输入指示宏块类型的信息mb_type和指示子宏块类型的信息sub_mb_type,并且基于信息mb_type和sub_mb_type,通过参考例如图7中所示的表,生成索引值lft_idx[3:0]4′dx和索引值rht_idx[3:0]4′dy。例如,如果信息mb_type指示宏块类型为16×16像素,则通过参考图7中所示的表,生成索引值lft_idx[3:0]4′d0和rht_idx[3:0]4′d3,并且将这些值提供给块值生成单元100。例如,可以由控制单元(未示出)生成信息mb_type和sub_mb_type。
在块值生成单元100中生成的索引值lft_idx[3:0]4′dx被输入到选择器101的第一输入端,而索引值rht_idx[3:0]4′dy被输入到选择器101的第二输入端。例如,在获得要处理的宏块的右上邻近块C的运动向量MV时,选择器101被切换到第二输入端。选择器101的输出被输入到加法器单元102的一个输入端。
例如,如果针对要处理的宏块存在C块,则选择器101选择第二输入端以输出索引值rht_idx[3:0]4′dy。如果C块不存在,则如果D块存在,使用D块,如先前所描述的。在这种情况下,选择器101选择第一输入端以输出索引值lft_idx[3:0]4′dx。
分别用预定值设置选择器103、104和105,根据获得运动向量MV的块选择适当的值。选择器103执行与A块有关的选择。例如,索引值4′d3和4′d15被设置到选择器103的第一和第二输入端。在该例子中,选择器103在利用运动向量MV的情况下,如果值rht_idx[3:0]是值4′d0、4′d4、4′d8和4′d12中的一个,则选择第一输入端,在其它情况下选择第二输入端。
用于与B块有关的选择的选择器104在第一输入端处被设置例如索引值4′d12,而选择器103的输出被输入到第二输入端。在该例子中,当使用B块的运动向量MV时,选择器104选择第一输入端,而在其它情况下选择第二输入端。
用于与C块有关的选择的选择器105分别在第一到第四输入端处被设置例如值4′d9、4′d11、4′d13和4′d15,并且选择器104的输出被输入到第五输入端。选择器105的输出被输入到加法器单元102的另一个输入端。在该例子中,如果使用A或B块的运动向量MV,则选择器105选择第五输入端。如果使用C块的运动向量MV,则选择器105选择第一或第三输入端,并且输出值4′d9或4′d13。如果使用D块的运动向量MV,则选择器105选择第二或第四输入端,并且输出值4′d11或4′d15。
加法器单元102将输入到一个输入端、从选择器101提供的值与输入到另一个输入端、从选择器105提供的值相加。相加结果仅使用LSB侧的4位,并且被输出为邻近块的索引值nbd-idx[3:0]。索引值nbd-idx[3:0]被存储在MV存储单元106中。
MV存储单元106被配置为使得例如能够执行对直接模式存储器30的访问控制,在直接模式存储器30中存储通过运动预测/补偿处理单元28获得的运动向量MV,以及从由索引值lft_idx[3:0]指示的地址读取数据。实施例不局限于此,mv存储单元106本身可被用作存储器。例如,如图10中说明性所示的,mv存储单元106针对每个单元块执行到直接模式存储器30的映射,以使对应于单元块的每个区与按光栅扫描顺序分配的索引值相关。当运动向量MV被提供给mv存储单元106时,运动向量被复制并且被存储在对应于运动补偿块的直接模式存储器30的单元块区中,所述运动补偿块对应于宏块类型。
例如,如果宏块类型为16×16像素,则相同的运动向量MV被复制到对应于索引值0到15的每个单元块区中。此外,例如,如果宏块类型为16×8像素,则根据上面的运动补偿块的运动向量MV被复制到对应于索引值0到7的每个单元块区中,而下面的运动补偿块被复制到对应于索引值8到15的每个单元块区中。
如上所述,在该实施例中,由于运动向量MB被复制并且存储在单元块区中,所以不论运动补偿块的尺寸如何,能够通过访问预定单元块区来读取运动向量。因此,不必存储有关邻近于要处理的块的运动补偿块的尺寸的信息。也就是说,如前所述,当考虑降至子宏块类型时,不需要存储具有指示宏块类型的6位数据长度的参数,以及具有指示子宏块类型的4位数据长度的参数sub_mb_type0、sub_mb_type1、sub_mb_type2和sub_mb_type3。
mv存储单元106从对应于索引值nbd_idx[3:0]的直接模式存储器30的单元块区中读取数据,所述索引值从加法器单元102中提供,并且输出读取的数据作为运动向量MV。该运动向量MV被提供给PMV生成单元25。
如上所述,邻近MV选择器单元26的mv存储单元106按每个单元块的光栅扫描顺序分配直接模式存储器30的索引值,并且存储每个单元块的对应运动向量MV。使mv存储单元106将邻近块的索引值输入到要处理的宏块,所述索引值由加法器单元102根据选择器101、103、104和105的选择结果计算而得。因此,能够选择获得要处理的宏块(宏块E)的预测运动向量PMV所需的A块的运动向量MV(A)、B块的运动向量MV(B)和C块的运动向量MV(C)。
如上所述,邻近MV选择器单元26将运动向量MV写到直接模式存储器30中。因此,在完成直接模式的预测过程之后,需要执行邻近MV选择器单元26中的过程。
参考图11中所示的流程图,将描述由邻近MV选择器单元26执行的过程的例子。该流程图中的每个过程由用于利用预定程序控制整个编码设备2的控制单元(图11中未示出)来执行。实施例不局限于此,而是控制信号可以在构成编码设备2的设备之间以预定方式传送,以使每个设备自主和/或协同地运行。
首先,在第一步骤S10中,基于处理对象宏块E的宏类型和子宏类型,例如根据图7中所示的表格,以预定方式用索引值lft_idx[3:0]和rht-idx[3:0]设置块值生成单元100,并且块值生成单元100生成块值。
如果获得A块的运动向量MV(A)(步骤S11),则A块的运动向量MV(A)被提供给MV存储单元106,并且如已描述的,被复制到直接模式存储器30上具有相应索引值的单元块区中。选择器101选择第一输入端,并且输出索引值lft_idx[3:0]。
过程前进到步骤S12,其中判断索引值lft_idx[3:0]是否是值4′d0、4′d4、4′d8和4′d12中的一个。如果断定索引值lft_idx[3:0]是值4′d0、4′d4、4′d8和4′d12中的一个,则过程前进到步骤S13,其中获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与4′d3的相加值。当获得邻近块的索引值nbd_idx[3:0]时,过程前进到步骤S15。
如果在步骤S12中判断索引值lft_idx[3:0]不是值4′d0、4′d4、4′d8和4′d12中的任何一个,则过程前进到步骤S14,其中获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与4′d15的相加值。当获得邻近块的索引值nbd_idx[3:0]时,过程前进到步骤S15。
如果获得B块的运动向量MV(B)(步骤S16),则B块的运动向量MV(B)被提供给mv存储单元106,并且如已描述的,被复制到直接模式存储器30上具有相应索引值的单元块区中。选择器101选择第一输入端,并且输出索引值lft_idx[3:0]。
过程前进到步骤S17,其中获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与4′d12的相加值。当获得邻近块的索引值nbd_idx[3:0]时,过程前进到步骤S15。
如果获得C块的运动向量MV(C)(步骤S18),则C块的运动向量MV(C)被提供给mv存储单元106,并且如已描述的,被复制到直接模式存储器30上具有相应索引值的单元块区中。选择器101选择第二输入端,并且输出索引值rht_idx[3:0]。
过程前进到步骤S19,其中判断索引值rht_idx[3:0]是否是4′d3。如果断定索引值rht_idx[3:0]是4′d3,则过程前进到步骤S20,其中获得邻近块的索引值nbd_idx[3:0],其为索引值rht_idx[3:0]与4′d13的相加值。当获得邻近块的索引值nbd_idx[3:0],过程前进到步骤S15。
如果在步骤S19处判断索引值lft_idx[3:0]不是4′d3,则过程前进到步骤S21,其中获得邻近块的索引值nbd_idx[3:0],其为索引值rht_idx[3:0]与4′d9的相加值。当获得邻近块的索引值nbd_idx[3:0]时,过程前进到步骤S15。
如果要处理的块的右上方邻近块与要处理的块不存在于同一二维图像区中,如前所述,则使用要处理的块的左上方邻近块的运动向量MV(D)。在这种情况下,D块的运动向量MV(D)被提供给mv存储单元106,并且如已描述的,被复制到直接模式存储器30上具有相应索引值的单元块区中。选择器101选择第一输入端,并且输出索引值lft_idx[3:0]。
在步骤S22中,判断索引值lft_idx[3:0]是否是值4′d0、4′d4、4′d8和4′d12中的一个。如果断定索引值lft_idx[3:0]是值4′d0、4′d4、4′d8和4′d12中的一个,则过程前进到步骤S23,其中获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与4′d15的相加值。当获得邻近块的索引值nbd_idx[3:0]时,过程前进到步骤S15。
如果在步骤S22中判断索引值lft_idx[3:0]不是值4′d0、4′d4、4′d8和4′d12中的任何一个,则过程前进到步骤S24,其中获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与4′d11的相加值。当获得邻近块的索引值nbd_idx[3:0]时,过程前进到步骤S15。
在步骤S15中,基于获得的邻近块的索引值nbd_idx[3:0],mv存储单元106读取存储在直接模式存储器30中的运动向量MV。该运动向量MV被提供给PMV生成单元25。
将利用更具体例子来描述图11的流程图中所图解的由邻近MV选择器单元26执行的过程。例如现在考虑图12中所示的情况。也就是说,假定处理对象宏块(E块)是一个具有16×16像素宏类型的块。也可以假定,获得E块的预测运动向量PMV所需的左邻近块A、上邻近块B和右上方邻近块C具有以下状态。A块是具有16×8像素的宏块类型的块,B块是具有4×8像素的宏块类型和4×8像素的子宏块类型的块,以及C块是具有8×8像素的宏块类型和8×8像素的子宏块类型的块。
对于要处理的E块,根据图7中所示的表格,块值生成单元100设置值4′d0作为索引值lft_idx[3:0],以及值4′d3作为索引值rht_idx[3:0](步骤S10)。
如果要获得A块的运动向量MV(A)(步骤S11),则A块的运动向量MV(A)被提供给mv存储单元106,然后被复制到直接模式存储器30上具有索引值0到7的、对应于A块的宏块类型的单元块区。A块的下面16×8像素的区中的运动向量MV被复制到具有索引值8到15的单元块区。
选择器101选择第一输入端,并且将索引值lft_idx[3:0](值4′d0)输入到加法器单元102的一个输入端。由于索引值是值4′d0,所以在步骤S12中的判断使过程前进到步骤S13。
选择器103选择第一输入端以选择值4′d3,而选择器104和105分别选择第二和第五输入端以将从选择器103输出的值4′d3输入到加法器单元102的另一个输入端。加法器单元102将输入到一个输入端的索引值lft_idx[3:0]4′d0与输入到另一个输入端的值4′d3相加,并且输出索引值nbd-idx[3:0]4′d3作为相加结果(步骤S13)。
mv存储单元106读取写入由索引值nbd-idx[3:0]4′d3指示的单元块区中的运动向量MV(A)(步骤S15)。运动向量MV(A)被提供给PMV生成单元25。
如果要获得B块的运动向量MV(B)(步骤S16),首先B块的运动向量MV(B)被提供给mv存储单元106,然后被复制到直接模式存储器30上具有索引值8和12的、对应于B块的宏块类型和子宏块类型的每个单元块区中。类似地,对于其它单元块区,对应于包含B块的宏块的块的运动向量MV被复制到每个单元块。
选择器101选择第一输入端,并且将索引值lft_idx[3:0]值4′d0输入到加法器单元102的一个输入端。选择器104选择第一输入端来输出值4′d12,而选择器105选择第五输入端将从选择器104输出的值4′d12输入到加法器单元102的另一个输入端。加法器单元102将输入到一个输入端的索引值lft_idx[3:0]4′d0与输入到另一个输入端的值4′d12相加,并且输出索引值nbd-idx[3:0]4′d12作为相加结果(步骤S17)。
mv存储单元106从直接模式存储器30中读取被写入由索引值nbd-idx[3:0]4′d12指示的单元块区中的运动向量MV(B)(步骤S15)。运动向量MV(B)被提供给PMV生成单元25。
如果要获得C块的运动向量MV(C)(步骤S18),首先C块的运动向量MV(C)被提供给mv存储单元106,然后被复制到直接模式存储器30上具有索引值8、9、12和13的、对应于C块的宏块类型和子宏块类型的每个单元块区中。类似地,对于mv存储单元106的其它单元块区,对应于包含C块的宏块的块的运动向量MV被复制到每个单元块。
选择器101选择第二输入端,并且将索引值rht_idx[3:0](值4′d3)输入到加法器单元102的一个输入端。由于索引值rht_idx[3:0]是值4′d3,过程前进到步骤S20。
选择器105选择第一输入端来输出值4′d9,并且输入到加法器单元102的另一个输入端。加法器单元102将输入到一个输入端的索引值rht_idx[3:0]4′d3与输入到另一个输入端的值4′d9相加,并且输出索引值nbd-idx[3:0]4′d12作为相加结果(步骤S20)。mv存储单元106读取被写入由索引值nbd-idx[3:0]4′d12指示的单元块区中的运动向量MV(C)(步骤S15)。运动向量MV(C)被提供给PMV生成单元25。
如已经描述的,如果C块与E块不处于同一二维图像区中,则接触E块的左上方块的运动向量MV(D)被用于获得预测运动向量PMV。在这种情况下,如前所述,在步骤S22中,如果如图11中所示的例子中索引值lft_idx[3:0]是值4′d0,则过程前进到步骤S23。选择器105选择第四输入端来输出值4′d15。值4′d15被输入到加法器单元102的另一个输入端。加法器单元102将输入到一个输入端的索引值lft_idx[3:0]4′d0与输入到另一个输入端的值4′d15相加,以获得索引值nbd-idx[3:0]4′d15作为相加结果。索引值4′d15的单元块位于宏块的右下角,并且接触E块的左上方。
可以考虑通过顺序地输入有关mb_type和sub_mb_type的信息来执行上述过程,类似于图7中所示的从上侧顺序地生成最左和最右索引值lft_idx[3:0]和rht_idx[3:0]。通过这种方式,针对每个宏块类型(以及针对每个子宏块类型),可以获得要处理的E块的预测运动向量PMV。
在这种情况下,如果E块的宏块类型是8×8像素,则E块的预测运动向量PMV可能刚好通过利用有关包含E块的宏块的信息而获得。因此,按宏块的光栅扫描顺序执行过程。
在以上描述中,虽然要处理的E块的尺寸与具有16×16像素的宏块类型的宏块一样,但是实施例并不限于此。也就是说,实施例的邻近MV选择过程也适用于其它宏块类型。
例如,将描述如图13中所示的情况,其中要处理的E块具有8×8像素的尺寸,即E块的宏块类型和子宏块类型为8×8像素。假定E块位于包含E块的宏块的左下角。考虑获得E块的预测运动向量PMV所需的块,由于要处理的E块位于左下角,而接触右上角的C块不存在,所以使用接触E块的左上角的D块。假定D块以及E块的左邻近A块和上邻近B块具有4×4像素的宏块类型和子宏块类型。
对于处理对象块E,根据图7中所示的表格(步骤S10),块值生成单元100设置值4′d10作为索引值lft_idx[3:0],以及设置值4′d11作为索引值rht_idx[3:0]。
如果要获得A块的运动向量MV(A)(步骤S11),则A块的运动向量MV(A)被提供给mv存储单元106,然后被复制到直接模式存储器30上具有索引值9的、对应于A块的宏块类型和子宏块类型的单元块区。
选择器101选择第一输入端,以选择将被输入到加法器单元102的一个输入端的索引值lft_idx[3:0]4′d0。由于索引值是值4′d10,所以在步骤S12中的判断使过程前进到步骤S14。
选择器103选择第二输入端以选择值4′d15,而选择器104和105分别选择第二和第五输入端以将从选择器103输出的值4′d15输入到加法器单元102的另一个输入端。加法器单元102将输入到一个输入端的索引值lft_idx[3:0]4′d10与输入到另一个输入端的值4′d15相加,并且输出索引值nbd-idx[3:0]4′d9作为相加结果(步骤S13)。
也就是说,相加结果为值4′d25,其二进制表示为″b11001″(b表明后面的数值用二进制记数法表示)。然而,如已经描述的,索引值nbd_idx[3:0]仅使用LSB侧的4位,值为″b1001″,并且得到值4′d9。
mv存储单元106从直接模式存储器30中读取被写入由索引值nbd-idx[3:0]4′d9指示的单元块区中的运动向量MV(B)(步骤S15)。运动向量MV(A)被提供给PMV生成单元25。
如果要获得B块的运动向量MV(B)(步骤S16),首先B块的运动向量MV(B)被提供给mv存储单元106,然后被复制到直接模式存储器30上具有索引值6的、对应于B块的宏块类型和子宏块类型的每个单元块区中。
选择器101选择第一输入端,并且将索引值lft_idx[3:0]值4′d0输入到加法器单元102的一个输入端。选择器104选择第一输入端来输出值4′d12,而选择器105选择第六输入端将从选择器104输出的值4′d12输入到加法器单元102的另一个输入端。加法器单元102将输入到一个输入端的索引值lft_idx[3:0]4′d0与输入到另一个输入端的值4′d12相加,并且输出索引值nbd-idx[3:0]4′d12作为相加结果(步骤S17)。
mv存储单元106读取被写入由索引值nbd-idx[3:0](值4′d12)指示的单元块区中的运动向量MV(B)(值4′d12)(步骤S15)。运动向量MV(B)被提供给PMV生成单元25。
接下来,获得C块的运动向量MV(C)。在该例子中,不存在预测编码已经完成、接触要处理的E块的右上角的块。因此,获得D块而不是C块的的运动向量MV(D)。D块的运动向量MV(D)被提供给mv存储单元106,并且被复制到直接模式存储器30上具有索引值5的、对应于D块的宏块类型和子宏块类型的单元块区。
选择器105选择第一输入端来将索引值rht_idx[3:0]4′d10输入到加法器单元102的一个输入端。由于索引值rht_idx[3:0]是值4′d10,过程前进到步骤S24。
选择器105选择第二输入端来输出值4′d11,其被输入到加法器单元102的另一个输入端。加法器单元102将输入到一个输入端的索引值lft_idx[3:0]4′d10与输入到另一个输入端的值4′d11相加,并且输出索引值nbd-idx[3:0]4′d5作为相加结果。
也就是说,相加结果是值4′d21,其二进制表示为″b10101″。然而,索引值nbd_idx[3:0]仅使用LSB侧的4位,值为″b1001″,并且得到值4′d5。具有索引值4′d5的单元块接触E块的左上方。
如前所述,为了获得要处理的宏块E的预测运动向量,例如,如果选择宏块B的运动向量,则宏块E与宏块B之间存在2592=67081种组合。处理时间变得很长,并且要求计算电路具有较高处理能力。
另一方面,根据本发明的实施例,如图10中说明性示出的,mv存储单元106存储按光栅扫描顺序分配的4×4像素的每个单元块的运动向量MV。因此,宏块B的运动向量MV(B)可以仅由lft_idx[3:0]+值4′d12的加法过程获得。因此,能够缩短处理时间并且减少计算量。
接下来,将描述本发明的实施例的一个修改。虽然按光栅扫描顺序分配4×4像素的每个单元块的索引值,但是实施例并不限于此。例如,根据H.264|AVC规范,在以4×4像素为单位执行帧内预测编码(内编码)时,如图14中说明性示出的,16×16像素的宏块被分成四个8×8像素的中间块,每个中间块被分成4×4像素的小块,所述中间块按左上、右上、左下和右下的顺序被编码,并且类似地,每个中间块按左上、右上、左下和右下的顺序被编码。
实施例的修改将索引值按H.264|AVC规定的内编码的编码顺序分配给每个单元块区。将对由邻近MV选择器单元26执行的过程进行简要描述。
如图15中说明性示出的,对于要处理的宏块(E)以及用于获得预测运动向量的宏块(A)到MB(D)中的每个,宏块被分成8×8像素的中间块,其在宏块中按左上、右上、左下和右下的顺序排列,并且如利用图14所描述的,每个中间块被分成4×4像素的小块。索引值按左上、右上、左下和右下的顺序,顺序地从中间块的左上处的起始点开始,按1递增地被分配给每个小块。通过顺序地增加每个中间块的索引值来分配索引值。
图16到19示出了根据实施例的修改由邻近MV选择器单元26执行的过程的例子。图16到19对应于获得图11中所示的A、B、C和D块的运动向量MV的过程。在图16到19中,图11中所示的公共部分由相同参考符号表示,并且省略其详细描述。
图16图解了根据实施例的修改获得块A的运动向量MV的过程的例子。图16对应于步骤S11中的过程,并遵循图11中图解的、用于获得A块的运动向量MV的步骤。在实施例的修改中,与所述实施例的A块的运动向量MV的获得相比,增加了一个判断分支过程。
也就是说,在图16所示的例子中,判断索引值lft_idx[3:0]是否是值4′d0、4′d2、4′d8和4′d10中的任何一个,或者是否是值4′d4、4′d6、4′d12和4′d14中的任何一个,或者其它值。根据判断结果,获得邻近块的索引值nbd_idx[3:0]。
更具体地说,如果判断索引值lft_idx[3:0]是值4′d0、4′d2、4′d8和4′d10中的任何一个(步骤S120),则获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与值4′d5的相加值(步骤S130)。如果判断索引值lft_idx[3:0]是值4′d4、4′d6、4′d12和4′d14中的任何一个(步骤S121),则获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与值4′d13的相加值(步骤S131)。如果判断索引值lft_idx[3:0]是除了这些值之外的值,则获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]和值4′d15的相加值(步骤132)。
图17图解了根据实施例的修改获得B块的运动向量MV的过程的例子。图17对应于步骤S16中的过程,并遵循图11中图解的、用于获得B块的运动向量MV的步骤。如图17与11之间的比较所示,在实施例的修改中,与实施例的B块的运动向量MV的获得相比,增加了一个判断分支过程。
也就是说,在图17所示的例子中,判断索引值lft_idx[3:0]是否是值4′d0、4′d1、4′d4、4′d5、4′d8、4′d9、4′d12和4′d13中的任何一个(步骤S170),以及根据判断结果,获得邻近块的索引值nbd_idx[3:0]。
更具体地说,如果判断索引值lft_idx[3:0]是索引值4′d0、4′d1、4′d4、4′d5、4′d8、4′d9、4′d12和4′d13中的任何一个(步骤S170),则获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与值4′d10的相加值(步骤S171)。如果判断索引值lft_idx[3:0]是除了这些值之外的值,则获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与值4′d14的相加值(步骤172)。
图18图解了根据实施例的修改获得C块的运动向量MV的过程的例子。图18对应于步骤S18中的过程,并遵循图11中图解的、用于获得C块的运动向量MV的步骤。如图18与11之间的比较所示,在实施例的修改中,与实施例的C块的运动向量MV的获得相比,增加了三个判断分支过程。
也就是说,在图18所示的例子中,判断索引值rht_idx[3:0]是否是值4′d5,或者值4′d1和4′d9中的任何一个,或者值4′d3和4′d11中的任何一个,或者值4′d0、4′d4、4′d8与4′d12中的任何一个,或者其它值。根据判断结果,获得邻近块的索引值nbd_idx[3:0]。
更具体地说,如果判断索引值rht_idx[3:0]是值4′d5(步骤S190),则获得邻近块的索引值nbd_idx[3:0],其为索引值lft_ idx[3:0]与值4′d5的相加值(步骤S200)。如果判断索引值lft_idx[3:0]是值4′d1和4′d9中的任何一个(步骤S191),则获得邻近块的索引值nbd_idx[3:0],其为索引值rht_ idx[3:0]与值4′d12的相加值(步骤S201)。如果判断索引值rht_idx[3:0]是值4′d3和4′d11中的任何一个(步骤S192),则获得邻近块的索引值nbd_idx[3:0],其为索引值rht_idx[3:0]与值4′d1的相加值(步骤S202)。
如果判断索引值rht_idx[3:0]是值4′d0、4′d4、4′d8和4′d12中的任何一个(步骤S193),则获得邻近块的索引值nbd_idx[3:0],其为索引值rht_idx[3:0]与值4′d11的相加值(步骤S203)。如果判断索引值rht_idx[3:0]是除了这些值之外的值,则获得邻近块的索引值nbd_idx[3:0],其为索引值rht_idx[3:0]与值4′d15的相加值(步骤204)。
图19图解了根据实施例的修改获得D块的运动向量MV的过程的例子。图19对应于步骤S22中的过程,并遵循图11中图解的、用于获得D块的运动向量MV的步骤。如图19与11之间的比较所示,在实施例的修改中,与实施例的C块的运动向量MV的获得相比,增加了三个判断分支过程。
也就是说,在图19所示的例子中,判断索引值lft_idx[3:0]是否是值4′d0和4′d8中的任何一个,或者是值4′d2和4′d10中的任何一个,或者是值4′d4和4′d12中的任何一个,或者值4′d6和4′d14中的任何一个,或者是4′d1、4′d5、4′d9和4′d13中的任何一个,或者是其它值。基于判断结果,获得邻近块的索引值nbd_idx[3:0]。
更具体地说,如果判断索引值lft_idx[3:0]是值4′d0和4′d8中的任何一个(步骤S220),则获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与值4′d15的相加值(步骤S230)。如果判断索引值lft_idx[3:0]是值4′d2和4′d10中的任何一个(步骤S221),则获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与值4′d3的相加值(步骤S231)。如果判断索引值lft_idx[3:0]是值4′d4和4′d12中的任何一个(步骤S222),则获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与值4′d7的相加值(步骤S232)。
如果判断索引值lft_idx[3:0]是值4′d6和4′d14中的任何一个(步骤S223),则获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与值4′d11的相加值(步骤S233)。如果判断索引值lft_idx[3:0]是值4′d1、4′d5、4′d9和4′d13中的任何一个(步骤S224),则获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与值4′d9的相加值(步骤S234)。如果判断索引值lft_idx[3:0]是除了这些值之外的值,则获得邻近块的索引值nbd_idx[3:0],其为索引值lft_idx[3:0]与值4′d15的相加值(步骤235)。
如上所述,在不使用光栅扫描顺序,而是使用例如H.264|AVC中规定的内预测编码的编码顺序作为索引值定义的情况下,可应用本发明的实施例的过程。然而,实施例的修改中判断分支过程的数量大于在利用图16到19所述的实施例的光栅扫描顺序的索引值定义的情况下判断分支过程的数量。因此,与本发明的实施例相比,修改可能具有诸如处理速度和负载的缺点。
接下来,将简要描述本发明的实施例的另一个修改。
如已经描述的,在直接模式中,能够由已经编码的块预测B图像的运动信息。因此,为了与直接模式兼容,需要存储预定图像的所有生成的运动向量。在这种情况下,在预定图像的宏块中,所有运动补偿块的尺寸可变为4×4像素。相应地,需要直接模式存储器30具有存储按4×4像素的块可能被检测到的运动向量的容量,总计一帧有每一个宏块十六个块。
H.264|AVC规定了被称作基线类(Baseline profile)的小规模类,其不具有B图像的图像类型。在基线类中,不执行直接模式。因此,为了执行符合基线类的编码,用于存储运动向量的存储器不是必需的,但是仅足够在存储器中存储获得预测运动向量PMV所需的运动向量。
也就是说,在不具有B图像的图像类型的系统,如基线类中,连接到图9中所示的MV存储单元106的存储器可具有这样的配置,例如对于图10中说明性示出的B、C和D块,存储器仅存储索引值4′d12、4′d13、4′d14和4′d15处的运动向量MV,而对于A块,仅存储索引值4′d12、4′d13、4′d14和4′d15处的运动向量MV。因此,能够减少用于存储运动向量的存储器容量。
如上所述,根据本发明的实施例,对于用于在单元块的单元块区中存储运动向量的运动向量存储单元,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出单元块,所述单元块被提供于所述运动向量存储单元中,并且在所述宏块中以预定顺序被分配索引值;运动向量被存储在单元块区中,接触处理对象块、与处理对象块存在于同一二维图像区中并且能够具有多种不同尺寸的左、上和右上方或左上方邻近块的运动向量被复制并且存储在运动向量存储单元的对应于邻近块的单元块区中,基于能够具有多种不同尺寸的处理对象块的尺寸生成对应于要获得所述预测向量的处理对象块的左上角和右上角的位置的索引值,基于所生成的索引值获得指示将从中读取运动向量的运动向量存储单元的单元块区的索引值,以及基于根据索引值从运动向量存储单元中读取的运动向量获得预测运动向量。因此,有利的是,当运动向量被用于从运动向量存储单元中获得预测运动向量时,不必考虑相应邻近块的尺寸。
此外,根据本发明的实施例,在编码运动画面时,对于用于在单元块的单元块区中存储运动向量的运动向量存储单元,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出单元块,单元块被提供于运动向量存储单元中,并且在宏块中以预定顺序被分配索引值;运动向量被存储在单元块区中,接触处理对象块、与处理对象块存在于同一二维图像区中并且能够具有多种不同尺寸的左、上和右上方或左上方邻近块的运动向量被复制并且存储在运动向量存储单元的对应于邻近块的单元块区中,基于能够具有多种不同尺寸的处理对象块的尺寸生成对应于要获得预测向量的处理对象块的左上角和右上角的位置的索引值,基于所生成的索引值获得指示将从中读取运动向量的运动向量存储单元的单元块区的索引值,基于根据索引值从运动向量存储单元中读取的运动向量获得预测运动向量,基于通过利用运动向量读取步骤读取的运动向量所获得的预测运动向量和针对每个块获得的运动向量生成预测向量数据,以及编码预测图像数据与输入图像数据之间的差。因此,有利的是,当运动向量被用于从运动向量存储单元中获得预测运动向量时,不必考虑相应邻近块的尺寸。
此外,根据本发明的实施例,对于通过编码每个块的运动向量与利用运动向量获得的预测运动向量之间的差而获得的编码图像数据,在解码该编码图像数据时,对于用于在单元块的单元块区中存储运动向量的运动向量存储单元,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出单元块,单元块被提供于运动向量存储单元中,并且在宏块中以预定顺序被分配索引值;运动向量被存储在单元块区中,接触处理对象块、与处理对象块存在于同一二维图像区中并且能够具有多种不同尺寸的左、上和右上方或左上方邻近块的运动向量被复制并且存储在运动向量存储单元的对应于邻近块的单元块区中,基于能够具有多种不同尺寸的处理对象块的尺寸生成对应于要获得预测向量的处理对象块的左上角和右上角的位置的所述索引值,基于所生成的索引值获得指示将从中读取运动向量的运动向量存储单元的单元块区的索引值,基于根据索引值从运动向量存储单元中读取的运动向量获得预测运动向量,基于通过利用运动向量读取步骤读取的运动向量所获得的预测运动向量和针对每个块获得的运动向量生成预测向量数据,以及解码预测图像数据与输入图像数据的相加。因此,有利的是,当运动向量被用于从运动向量存储单元中获得预测运动向量时,不必考虑相应邻近块的尺寸。

Claims (20)

1.一种数据处理设备,包括:
运动向量存储单元,用于在单元块的单元块区中存储运动向量,其中,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出所述单元块,按照在宏块中的预定顺序为所述单元块区分配索引值;
索引值生成单元,用于基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,所述索引值对应于所述单元块的在所述对象块的左上角和右上角处的位置;
存储控制单元,用于通过所述运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量,所述单元块区对应于所述运动向量存储单元的所述邻近块,所述邻近块与所述对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触所述对象块,并且能够采取多个不同尺寸;以及
运动向量读取单元,用于基于由所述索引值生成单元生成的索引值,获得指示将从中读取运动向量的所述运动向量存储单元的单元块区的索引值,
其中,基于由所述运动向量读取单元读取的运动向量,获得所述预测运动向量。
2.如权利要求1所述的数据处理设备,其中,按照所述宏块中的光栅扫描顺序将所述索引值分配给所述运动向量存储单元的单元块区。
3.如权利要求1所述的数据处理设备,其中,所述运动向量读取单元从所述运动向量存储单元的单元块区之一中读取所述运动向量。
4.如权利要求1所述的数据处理设备,其中:
通过将所述宏块分别向垂直和水平方向分成四个来形成所述单元块;
所述运动向量读取单元通过将由所述索引值生成单元生成的索引值与预定值相加,获得指示将从中读取运动向量的单元块区的索引值;以及
指示将从中读取运动向量的单元块区的索引值仅使用所述相加结果的在LSB侧的4位。
5.一种数据处理方法,包括步骤:
在单元块的单元块区中存储运动向量,其中,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出所述单元块,所述单元块区被提供在运动向量存储单元中,并且按照在宏块中的预定顺序为所述单元块区分配索引值;
基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,所述索引值对应于所述单元块的在所述对象块的左上角和右上角处的位置;
通过所述运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量,所述单元块区对应于所述运动向量存储单元的所述邻近块,所述邻近块与所述对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触所述对象块,并且能够采取多个不同尺寸;
读取运动向量,以基于由所述索引值生成步骤生成的索引值,获得指示将从中读取运动向量的所述运动向量存储单元的单元块区的索引值;以及
基于由所述运动向量读取步骤读取的运动向量,获得所述预测运动向量。
6.一种用于使计算机执行数据处理方法的数据处理程序,所述数据处理方法包括步骤:
在单元块的单元块区中存储运动向量,其中,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出所述单元块,所述单元块区被提供在运动向量存储单元中,并且按照在宏块中的预定顺序为所述单元块区分配索引值;
基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,所述索引值对应于所述单元块的在所述对象块的左上角和右上角处的位置;
通过所述运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量,所述单元块区对应于所述运动向量存储单元的所述邻近块,所述邻近块与所述对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触所述对象块,并且能够采取多个不同尺寸;
读取运动向量,以基于由所述索引值生成步骤生成的索引值,获得指示将从中读取运动向量的所述运动向量存储单元的单元块区的索引值;以及
基于由所述运动向量读取步骤读取的运动向量,获得所述预测运动向量。
7.一种用于编码运动图像数据的编码设备,所述设备包括:
运动向量存储单元,用于在单元块的单元块区中存储运动向量,其中,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出所述单元块,按照在宏块中的预定顺序为所述单元块区分配索引值;
索引值生成单元,用于基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,所述索引值对应于所述单元块的在所述对象块的左上角和右上角处的位置;
存储控制单元,用于通过所述运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量,所述单元块区对应于所述运动向量存储单元的所述邻近块,所述邻近块与所述对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触所述对象块,并且能够采取多个不同尺寸;以及
运动向量读取单元,用于基于由所述索引值生成单元生成的索引值,获得指示将从中读取运动向量的所述运动向量存储单元的单元块区的索引值,
其中,基于由所述运动向量读取单元读取的运动向量,生成所述预测运动向量,基于针对每个块获得的运动向量,生成预测图像数据,并且
编码所述预测图像数据与输入图像数据之间的差。
8.如权利要求7所述的数据处理设备,其中,按照所述宏块中的光栅扫描顺序将所述索引值分配给所述运动向量存储单元的单元块区。
9.如权利要求7所述的数据编码设备,其中,所述运动向量读取单元从所述运动向量存储单元的单元块区之一中读取所述运动向量。
10.如权利要求7所述的数据编码设备,其中:
通过将所述宏块分别向垂直和水平方向分成四个来形成所述单元块;
所述运动向量读取单元通过将由所述索引值生成单元生成的索引值与预定值相加,获得指示将从中读取运动向量的单元块区的索引值;以及
指示将从中读取运动向量的单元块区的索引值仅使用所述相加结果的在LSB侧的4位。
11.如权利要求7所述的编码设备,还包括用于与所述运动向量存储单元共享的存储单元,所述存储单元用于存储通过利用编码顺序在所述图像数据之前并且显示顺序在所述图像数据之前和/或之后的编码图像数据的相应块,利用图像数据中的块的直接模式的直接预测而得到的编码图像数据。
12.一种用于编码运动图像数据的方法,所述方法包括步骤:
在单元块的单元块区中存储运动向量,其中,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出所述单元块,按照在宏块中的预定顺序为所述单元块区分配索引值;
基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,所述索引值对应于所述单元块的在所述对象块的左上角和右上角处的位置;
通过所述运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量,所述单元块区对应于所述运动向量存储单元的所述邻近块,所述邻近块与所述对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触所述对象块,并且能够采取多个不同尺寸;
基于由所述索引值生成步骤生成的索引值读取运动向量,以获得指示将从中读取运动向量的所述运动向量存储单元的单元块区的索引值;和
基于通过所述运动向量读取步骤读取的运动向量,获得所述预测运动向量,
其中,基于通过所述运动向量读取步骤读取的运动向量,生成所述预测运动向量,基于针对每个块获得的运动向量,生成预测图像数据,并且编码所述预测图像数据与输入图像数据之间的差。
13.一种用于使计算机执行编码运动图像数据的方法的编码程序,包含步骤:
在单元块的单元块区中存储运动向量,其中,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出所述单元块,按照在宏块中的预定顺序为所述单元块区分配索引值;
基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,所述索引值对应于所述单元块的在所述对象块的左上角和右上角处的位置;
通过所述运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量,所述单元块区对应于所述运动向量存储单元的所述邻近块,所述邻近块与所述对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触所述对象块,并且能够采取多个不同尺寸;
基于由所述索引值生成步骤生成的索引值读取运动向量,以获得指示将从中读取运动向量的所述运动向量存储单元的单元块区的索引值;和
基于通过所述运动向量读取步骤读取的运动向量,获得所述预测运动向量,
其中,基于通过所述运动向量读取步骤读取的运动向量,生成所述预测运动向量,基于针对每个块获得的运动向量,生成预测图像数据,并且编码所述预测图像数据与输入图像数据之间的差。
14.一种用于解码所编码的图像数据的解码设备,所编码的图像数据是通过如下方式获得的:对于基于针对每个块获得的运动向量而生成的预测图像数据和基于通过利用运动向量和输入的图像数据获得的预测运动向量而生成的预测图像数据之间的差,对该差进行编码,所述解码设备包括:
运动向量存储单元,用于在单元块的单元块区中存储运动向量,其中,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出所述单元块,按照在宏块中的预定顺序为所述单元块区分配索引值;
索引值生成单元,用于基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,所述索引值对应于所述单元块的在所述对象块的左上角和右上角处的位置;
存储控制单元,用于通过所述运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量,所述单元块区对应于所述运动向量存储单元的所述邻近块,所述邻近块与所述对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触所述对象块,并且能够采取多个不同尺寸;以及
运动向量读取单元,用于基于由所述索引值生成单元生成的索引值,获得指示将从中读取运动向量的所述运动向量存储单元的单元块区的索引值,
其中,基于预测运动向量和针对每个块获得的运动向量生成所述预测图像数据,所述运动向量是利用由所述运动向量读取单元读取的运动向量获得的,并且通过所述预测图像数据与输入的编码图像数据的相加来执行解码处理。
15.如权利要求14所述的解码设备,其中,按照所述宏块中的光栅扫描顺序将所述索引值分配给所述运动向量存储单元的单元块区。
16.如权利要求14所述的解码设备,其中,所述运动向量读取单元从所述运动向量存储单元的单元块区之一中读取所述运动向量。
17.如权利要求14所述的解码设备,其中:
通过将所述宏块分别向垂直和水平方向分成四个来形成所述单元块;
所述运动向量读取单元通过将由所述索引值生成单元生成的索引值与预定值相加,获得指示将从中读取运动向量的单元块区的索引值;以及
指示将从中读取运动向量的单元块区的索引值仅使用所述相加结果的在LSB侧的4位。
18.如权利要求14所述的编码设备,还包括用于与所述运动向量存储单元共享的存储单元,所述存储单元用于存储通过利用编码顺序在所述图像数据之前并且显示顺序在所述图像数据之前和/或之后的编码图像数据的相应块,利用图像数据中的块的直接模式的直接预测而得到的编码图像数据。
19.一种用于解码所编码的图像数据的方法,所编码的图像数据是通过如下方式获得的:对于基于针对每个块获得的运动向量而生成的预测图像数据和基于通过利用运动向量和输入的图像数据获得的预测运动向量而生成的预测图像数据之间的差,对该差进行编码,所述方法包括步骤:
在单元块的单元块区中存储运动向量,其中,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出所述单元块,按照在宏块中的预定顺序为所述单元块区分配索引值;
基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,所述索引值对应于所述单元块的在所述对象块的左上角和右上角处的位置;
通过所述运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量,所述单元块区对应于所述运动向量存储单元的所述邻近块,所述邻近块与所述对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触所述对象块,并且能够采取多个不同尺寸;
基于通过所述索引值生成步骤生成的索引值,读取运动向量,以获得指示将从中读取运动向量的所述运动向量存储单元的单元块区的索引值;和
基于通过运动向量读取步骤获得的运动向量获得所述预测运动向量,
其中,基于预测运动向量和针对每个块获得的运动向量生成所述预测图像数据,所述预测运动向量是基于由所述运动向量读取步骤读取的运动向量产生的,并且通过所述预测图像数据与输入的图像数据的相加来执行解码处理。
20.一种用于使计算机执行解码方法的解码程序,所述解码方法用于解码所编码的图像数据,所编码的图像数据是通过如下方式获得的:对于基于针对每个块获得的运动向量而生成的预测图像数据和基于通过利用运动向量和输入的图像数据获得的预测运动向量而生成的预测图像数据之间的差,对该差进行编码,所述方法包括步骤:
在单元块的单元块区中存储运动向量,其中,通过以预定方式将一个画面分成宏块并且进一步以预定方式分割每个宏块来限定出所述单元块,按照在宏块中的预定顺序为所述单元块区分配索引值;
基于能够采取多个不同尺寸、要获得预测运动向量的对象块的尺寸生成索引值,所述索引值对应于所述单元块的在所述对象块的左上角和右上角处的位置;
通过所述运动向量存储单元的每个单元块区复制邻近块的运动向量,并且存储所复制的运动向量,所述单元块区对应于所述运动向量存储单元的所述邻近块,所述邻近块与所述对象块存在于同一二维图像区中,在左侧、上侧、右上方或左上方接触所述对象块,并且能够采取多个不同尺寸;
基于通过所述索引值生成步骤生成的索引值,读取运动向量,以获得指示将从中读取运动向量的所述运动向量存储单元的单元块区的索引值;和
基于通过运动向量读取步骤获得的运动向量获得所述预测运动向量,
其中,基于预测运动向量和针对每个块获得的运动向量生成所述预测图像数据,所述预测运动向量是基于由所述运动向量读取步骤读取的运动向量产生的,并且通过所述预测图像数据与输入的图像数据的相加来执行解码处理。
CN2008101264675A 2007-07-05 2008-07-03 数据处理设备、方法及编码设备、方法和解码设备、方法 Expired - Fee Related CN101340585B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2007177155 2007-07-05
JP2007-177155 2007-07-05
JP2007177155A JP4325708B2 (ja) 2007-07-05 2007-07-05 データ処理装置、データ処理方法およびデータ処理プログラム、符号化装置、符号化方法および符号化プログラム、ならびに、復号装置、復号方法および復号プログラム

Publications (2)

Publication Number Publication Date
CN101340585A true CN101340585A (zh) 2009-01-07
CN101340585B CN101340585B (zh) 2011-05-11

Family

ID=40214516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101264675A Expired - Fee Related CN101340585B (zh) 2007-07-05 2008-07-03 数据处理设备、方法及编码设备、方法和解码设备、方法

Country Status (3)

Country Link
US (1) US8204326B2 (zh)
JP (1) JP4325708B2 (zh)
CN (1) CN101340585B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831571A (zh) * 2011-07-08 2012-12-19 图芯芯片技术(上海)有限公司 用流水线方式单步实现图形图像缩放、旋转的5阶滤波器的设计方法
CN103238329A (zh) * 2010-12-06 2013-08-07 索尼公司 图像解码装置、运动矢量解码方法、图像编码装置和运动矢量编码方法
CN104754352A (zh) * 2010-02-02 2015-07-01 三星电子株式会社 对视频进行解码的方法和设备
CN106331712A (zh) * 2015-06-30 2017-01-11 展讯通信(上海)有限公司 一种视频图像压缩方法
CN107071460A (zh) * 2010-12-14 2017-08-18 M&K控股株式会社 用于编码运动画面的设备
CN107087194A (zh) * 2010-12-13 2017-08-22 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
CN108347609A (zh) * 2011-11-07 2018-07-31 英孚布瑞智有限私人贸易公司 利用合并模式的图像解码方法
CN108462874A (zh) * 2010-04-09 2018-08-28 三菱电机株式会社 运动图像编码装置以及运动图像解码装置
CN109086074A (zh) * 2017-10-30 2018-12-25 上海寒武纪信息科技有限公司 机器学习处理器及使用处理器执行向量复制指令的方法
US11990137B2 (en) 2018-09-13 2024-05-21 Shanghai Cambricon Information Technology Co., Ltd. Image retouching method and terminal device

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9628794B2 (en) 2009-06-18 2017-04-18 Kabushiki Kaisha Toshiba Video encoding apparatus and a video decoding apparatus
CN102577393B (zh) * 2009-10-20 2015-03-25 夏普株式会社 运动图像编码装置、运动图像解码装置、运动图像编码/解码系统、运动图像编码方法及运动图像解码方法
KR101459714B1 (ko) * 2009-10-28 2014-11-13 에스케이텔레콤 주식회사 공간 분할을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
KR101768207B1 (ko) 2010-01-19 2017-08-16 삼성전자주식회사 축소된 예측 움직임 벡터의 후보들에 기초해 움직임 벡터를 부호화, 복호화하는 방법 및 장치
JP5368631B2 (ja) 2010-04-08 2013-12-18 株式会社東芝 画像符号化方法、装置、及びプログラム
US8837592B2 (en) * 2010-04-14 2014-09-16 Mediatek Inc. Method for performing local motion vector derivation during video coding of a coding unit, and associated apparatus
JP2012094959A (ja) * 2010-10-25 2012-05-17 Sony Corp 画像処理装置と画像処理方法およびプログラム
SG189831A1 (en) * 2010-11-16 2013-06-28 Mitsubishi Electric Corp Video information distributing and displaying system and video information distributing and displaying method
US10171813B2 (en) 2011-02-24 2019-01-01 Qualcomm Incorporated Hierarchy of motion prediction video blocks
HRP20230425T1 (hr) * 2011-03-21 2023-07-07 Lg Electronics, Inc. Odabir prediktora vektora kretanja
US9426463B2 (en) 2012-02-08 2016-08-23 Qualcomm Incorporated Restriction of prediction units in B slices to uni-directional inter prediction
US9451277B2 (en) * 2012-02-08 2016-09-20 Qualcomm Incorporated Restriction of prediction units in B slices to uni-directional inter prediction
US20150181232A1 (en) * 2012-07-18 2015-06-25 Sony Corporation Image processing device and method
JP5798539B2 (ja) * 2012-09-24 2015-10-21 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法
US9317770B2 (en) * 2013-04-28 2016-04-19 Tencent Technology (Shenzhen) Co., Ltd. Method, apparatus and terminal for detecting image stability
US9706212B2 (en) 2014-10-06 2017-07-11 Futurewei Technologies, Inc. Palette mode in high efficiency video coding (HEVC) screen content coding (SCC)
JP6288209B2 (ja) * 2016-10-24 2018-03-07 株式会社Jvcケンウッド 画像符号化装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05127809A (ja) 1991-04-19 1993-05-25 Sharp Corp 三次元空間座標入力装置
AU673250B2 (en) * 1993-03-24 1996-10-31 Sony Corporation Method and apparatus for coding/decoding motion vector, and method and apparatus for coding/decoding image signal
JP4034380B2 (ja) * 1996-10-31 2008-01-16 株式会社東芝 画像符号化/復号化方法及び装置
US7403564B2 (en) * 2001-11-21 2008-07-22 Vixs Systems, Inc. System and method for multiple channel video transcoding
JP4015934B2 (ja) * 2002-04-18 2007-11-28 株式会社東芝 動画像符号化方法及び装置
JP2004179687A (ja) * 2002-11-22 2004-06-24 Toshiba Corp 動画像符号化/復号化方法及び装置
JP4277793B2 (ja) * 2004-12-17 2009-06-10 ソニー株式会社 画像処理装置、符号化装置およびそれらの方法
KR100703751B1 (ko) * 2005-02-14 2007-04-06 삼성전자주식회사 가상 영역의 영상을 참조하여 인코딩 및 디코딩 하는 방법및 장치

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10123043B2 (en) 2010-02-02 2018-11-06 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on scanning order of hierarchical data units, and method and apparatus for decoding video based on scanning order of hierarchical data units
US9319713B2 (en) 2010-02-02 2016-04-19 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on scanning order of hierarchical data units, and method and apparatus for decoding video based on scanning order of hierarchical data units
CN104754352B (zh) * 2010-02-02 2019-10-18 三星电子株式会社 对视频进行解码的方法和设备
CN104754352A (zh) * 2010-02-02 2015-07-01 三星电子株式会社 对视频进行解码的方法和设备
CN104754351A (zh) * 2010-02-02 2015-07-01 三星电子株式会社 对视频进行解码的方法和设备
CN104796719A (zh) * 2010-02-02 2015-07-22 三星电子株式会社 对视频进行解码的方法和设备
US9743109B2 (en) 2010-02-02 2017-08-22 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on scanning order of hierarchical data units, and method and apparatus for decoding video based on scanning order of hierarchical data units
US9277239B2 (en) 2010-02-02 2016-03-01 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on scanning order of hierarchical data units, and method and apparatus for decoding video based on scanning order of hierarchical data units
US9351015B2 (en) 2010-02-02 2016-05-24 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on scanning order of hierarchical data units, and method and apparatus for decoding video based on scanning order of hierarchical data units
CN104796719B (zh) * 2010-02-02 2016-11-02 三星电子株式会社 对视频进行解码的方法和设备
US10567798B2 (en) 2010-02-02 2020-02-18 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on scanning order of hierarchical data units, and method and apparatus for decoding video based on scanning order of hierarchical data units
CN104754351B (zh) * 2010-02-02 2019-10-18 三星电子株式会社 对视频进行解码的方法和设备
CN108462874B (zh) * 2010-04-09 2022-06-07 三菱电机株式会社 运动图像编码装置以及运动图像解码装置
CN108462874A (zh) * 2010-04-09 2018-08-28 三菱电机株式会社 运动图像编码装置以及运动图像解码装置
CN103238329A (zh) * 2010-12-06 2013-08-07 索尼公司 图像解码装置、运动矢量解码方法、图像编码装置和运动矢量编码方法
CN107087194B (zh) * 2010-12-13 2020-02-11 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
CN107087194A (zh) * 2010-12-13 2017-08-22 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
US11843795B2 (en) 2010-12-13 2023-12-12 Electronics And Telecommunications Research Institute Method and device for determining reference unit
US11252424B2 (en) 2010-12-13 2022-02-15 Electronics And Telecommunications Research Institute Method and device for determining reference unit
US10425653B2 (en) 2010-12-13 2019-09-24 Electronics And Telecommunications Research Institute Method and device for determining reference unit
CN107071460B (zh) * 2010-12-14 2020-03-06 M&K控股株式会社 用于编码运动画面的设备
CN107071460A (zh) * 2010-12-14 2017-08-18 M&K控股株式会社 用于编码运动画面的设备
CN102831571A (zh) * 2011-07-08 2012-12-19 图芯芯片技术(上海)有限公司 用流水线方式单步实现图形图像缩放、旋转的5阶滤波器的设计方法
CN102831571B (zh) * 2011-07-08 2014-10-22 图芯芯片技术(上海)有限公司 用流水线方式单步实现图形图像缩放、旋转的5阶滤波器的设计方法
CN108347609A (zh) * 2011-11-07 2018-07-31 英孚布瑞智有限私人贸易公司 利用合并模式的图像解码方法
CN106331712A (zh) * 2015-06-30 2017-01-11 展讯通信(上海)有限公司 一种视频图像压缩方法
CN106331712B (zh) * 2015-06-30 2019-06-25 展讯通信(上海)有限公司 一种视频图像压缩方法
US11922132B2 (en) 2017-10-30 2024-03-05 Shanghai Cambricon Information Technology Co., Ltd. Information processing method and terminal device
US11762631B2 (en) 2017-10-30 2023-09-19 Shanghai Cambricon Information Technology Co., Ltd. Information processing method and terminal device
CN109086074A (zh) * 2017-10-30 2018-12-25 上海寒武纪信息科技有限公司 机器学习处理器及使用处理器执行向量复制指令的方法
US11996105B2 (en) 2018-09-13 2024-05-28 Shanghai Cambricon Information Technology Co., Ltd. Information processing method and terminal device
US11990137B2 (en) 2018-09-13 2024-05-21 Shanghai Cambricon Information Technology Co., Ltd. Image retouching method and terminal device

Also Published As

Publication number Publication date
JP4325708B2 (ja) 2009-09-02
US20090010553A1 (en) 2009-01-08
CN101340585B (zh) 2011-05-11
US8204326B2 (en) 2012-06-19
JP2009017262A (ja) 2009-01-22

Similar Documents

Publication Publication Date Title
CN101340585B (zh) 数据处理设备、方法及编码设备、方法和解码设备、方法
CN112789852B (zh) 基于历史的图像编码方法及其设备
CN112823521B (zh) 使用基于历史的运动信息的图像编码方法及其装置
KR101717510B1 (ko) 화상 예측 부호화 장치, 방법 및 프로그램, 화상 예측 복호 장치, 방법 및 프로그램, 및 부호화·복호 시스템 및 방법
CN104170379B (zh) 用于图像解码的方法和装置
CN101969563B (zh) 图像处理装置以及图像处理方法
JP3686436B2 (ja) 映像信号の復号化方法
CN101350929B (zh) 表示图像帧的非帧边缘区块时的增强的压缩方法
CN103959790A (zh) 高效视频编码中的预测残余的扫描
KR20130045149A (ko) 인트라 예측 정보 부호화 방법 및 장치
CN117336484A (zh) 图像解码和编码设备及发送比特流的设备
CN116320455A (zh) 编码设备、解码设备及数据发送设备
KR100827093B1 (ko) 영상 부호화 방법 및 장치
JP4360093B2 (ja) 画像処理装置および符号化装置とそれらの方法
CN100411444C (zh) 用于视频数据的空间预测编码和/或解码的方法和设备
CN113316938A (zh) 使用去块滤波的图像编译方法和装置
KR20170125154A (ko) 곡선 화면 내 예측을 사용하는 비디오 복호화 방법 및 장치
CN102801980B (zh) 一种用于可伸缩视频编码的解码装置和方法
JP3568392B2 (ja) 動画像復号化装置
KR101328931B1 (ko) 비디오 복호기 및 복호방법
US12010323B2 (en) Method and apparatus for deriving motion vector
KR20160053848A (ko) 영상의 인트라 예측 부호화/복호화 방법 및 그 장치
CN102316321A (zh) 利用非语法重用的视频编码器及其使用的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110511

Termination date: 20130703