CN104581162A - 通过使用大型变换单元编码和解码图像的方法和设备 - Google Patents

通过使用大型变换单元编码和解码图像的方法和设备 Download PDF

Info

Publication number
CN104581162A
CN104581162A CN201510005662.2A CN201510005662A CN104581162A CN 104581162 A CN104581162 A CN 104581162A CN 201510005662 A CN201510005662 A CN 201510005662A CN 104581162 A CN104581162 A CN 104581162A
Authority
CN
China
Prior art keywords
unit
coding unit
depth
size
converter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510005662.2A
Other languages
English (en)
Other versions
CN104581162B (zh
Inventor
李泰美
韩宇镇
陈建乐
郑海庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN104581162A publication Critical patent/CN104581162A/zh
Application granted granted Critical
Publication of CN104581162B publication Critical patent/CN104581162B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

一种通过使用大型变换单元编码和解码图像的方法和设备。公开了一种用于通过将多个相邻预测单元组合为变换单元并将所述多个相邻预测单元变换为频域来编码图像的图像编码方法和设备,以及一种用于通过使用所述图像编码方法和设备来对编码的图像进行解码的图像解码方法和设备。

Description

通过使用大型变换单元编码和解码图像的方法和设备
本申请是申请日为2010年8月13日,申请号为“201080036020.4”,标题为“通过使用大型变换单元编码和解码图像的方法和设备”的发明专利申请的分案申请。
技术领域
示例性实施例涉及一种编码和解码图像的方法和设备,更具体地说,涉及一种通过将像素域的图像变换为频域的系数来对图像进行编码和解码的方法和设备。
背景技术
为了执行图像压缩,多数图像编码和解码方法和设备通过将像素域的图像变换为频域的系数来对图像编码。作为频率变换技术之一的离散余弦变换(DCT)是广泛使用于图像和声音压缩中的公知技术。使用DCT的图像编码方法包括:对像素域的图像执行DCT,生成离散余弦系数,量化生成的离散余弦系数,对生成的离散余弦系数执行熵编码。
发明内容
技术方案
示例性实施例提供一种通过使用更有效的离散余弦变换(DCT)来对图像进行编码和解码的方法和设备,还提供一种其上记录了用于执行所述方法的程序的计算机可读记录介质。
有益效果
根据一个或多个示例性实施例,可以将变换单元设置为比预测单元大,并执行DCT,从而可有效地对图像进行压缩和编码。
附图说明
通过参照附图详细描述本发明的示例性实施例,示例性实施例的以上和其它特点将变得更清楚,其中:
图1是根据示例性实施例的图像编码设备的框图;
图2是根据另一示例性实施例的图像解码设备的示图;
图3是根据另一示例性实施例的层次编码单元;
图4是根据另一示例性实施例的基于编码单元的图像编码器的框图;
图5是根据另一示例性实施例的基于编码单元的图像解码器的框图;
图6示出根据另一示例性实施例的最大编码单元、次级编码单元和预测单元;
图7是根据另一示例性实施例的编码单元和变换单元的示图;
图8A和图8B示出根据另一示例性实施例的最大编码单元、预测单元和变换单元的划分形状;
图9是根据另一示例性实施例的图像编码设备的框图;
图10是变换器的示图;
图11A到图11C示出根据另一示例性实施例的变换单元的类型;
图12示出根据另一示例性实施例的不同变换单元;
图13是根据另一示例性实施例的图像解码设备的框图;
图14是根据示例性实施例的图像编码方法的流程图;
图15是根据另一示例性实施例的图像解码方法的流程图。
最佳实施方式
根据示例性实施例的一方面,提供了一种图像编码方法,包括以下操作:通过选择多个相邻预测单元来设置变换单元;根据变换单元将所述多个相邻预测单元变换为频域,并生成频率分量系数;量化频率分量系数;对量化的频率分量系数执行熵编码。
可基于指示大小缩减的等级的深度来执行设置变换单元的操作,所述大小缩减从当前片段或当前图片的最大编码单元到包括所述多个相邻预测单元的次级编码单元逐级执行。
可通过选择根据相同预测模式执行预测的多个相邻预测单元来执行设置变换单元的操作。
相同预测模式可以是帧间预测模式或帧内预测模式。
图像编码方法还可包括通过对不同的变换单元重复执行上述操作来设置最佳变换单元的操作,其中,上述操作包括以下操作:通过选择多个相邻预测单元来设置变换单元,根据变换单元将所述多个相邻预测单元变换为频域并生成频率分量系数,量化频率分量系数并对量化的频率分量系数执行熵编码。
根据示例性实施例的另一方面,提供了一种图像编码设备,包括:变换器,通过使用多个相邻预测单元来设置变换单元,根据变换单元将所述多个相邻预测单元变换为频域并生成频率分量系数;量化单元,量化频率分量系数;熵编码单元,对量化的频率分量系数执行熵编码。
根据示例性实施例的另一方面,提供了一种图像解码方法,包括以下操作:根据变换单元对通过被变换到频域而生成的频率分量系数进行熵解码;反量化频率分量系数;将频率分量系数反变换为像素域,并重构包括在变换单元中的多个相邻预测单元。
根据示例性实施例的另一方面,提供了一种图像解码设备,包括:熵解码器,根据变换单元对通过被变换到频域而生成的频率分量系数进行熵解码的;反量化单元,反量化频率分量系数;反变换器,将频率分量系数反变换为像素域,并重构包括在变换单元中的多个相邻预测单元。
根据示例性实施例的另一方面,提供了一种记录了用于执行图像编码和解码方法的计算机可读记录介质。
具体实施方式
在下文,将参照附图详细描述示例性实施例。在示例性实施例中,根据上下文,“单元”可表示或可不表示单元的大小,“图像”可表示视频的静止图像或运动图像(即,视频本身)。
图1是根据示例性实施例的用于编码图像的设备100的框图。
参照图1,设备100包括最大编码单元划分单元110、编码深度确定单元120、图像数据编码器130以及编码信息编码器140。
最大编码单元划分单元110可基于作为最大大小的编码单元的最大编码单元划分当前图片或片段。也就是说,最大编码单元划分单元110可划分当前图片或片段以获得至少一个最大编码单元。
根据示例性实施例,可使用最大编码单元和深度来表示编码单元。如上所述,最大编码单元指示当前图片的编码单元中的具有最大大小的编码单元,深度指示通过层次地减小编码单元而获得的次级编码单元的大小。随着深度增加,编码单元可在大小上从最大编码单元减小到最小编码单元,其中,最大编码单元的深度被定义为最小深度,最小编码单元的深度被定义为最大深度。由于编码单元的大小随着深度增加从最大编码单元减小,因此第k深度的次级编码单元可包括多个第(k+n)(k和n是等于或大于1的整数)深度的次级编码单元。
根据将要编码的图片的大小的增加,以更大的编码单元对图像编码可得到更高的图像压缩率。然而,如果固定采用更大的编码单元,则考虑到连续变化的图像特征的因素,不能高效地编码图像。
例如,当对诸如大海或天空的平滑区域进行编码时,编码单元越大,压缩率就会越增加。然而,当对诸如人物或建筑物的复杂区域进行编码时,编码单元越小,压缩率就会越增加。
因此,根据示例性实施例,对每个图片或片段设置不同最大图像编码单元和不同最大深度。由于最大深度表示编码单元可减小的倍数的最大数量,因此可根据最大深度不同地设置包括在最大图像编码单元中的每个最小编码单元的大小。
编码深度确定单元120确定最大深度。可基于速率失真(R-D)成本的计算来确定最大深度。可为每个图片或片段或每个最大编码单元不同地确定最大深度。确定的最大深度被提供到编码信息编码器140,根据最大编码单元的图像数据被提供到图像数据编码器130。
最大深度表示可包括在最大编码单元中的具有最小大小的编码单元(即最小编码单元)。换句话说,最小编码单元可被划分为根据不同深度的具有不同大小的次级编码单元。稍后参照图8A到图8B对此详细描述。此外,可基于具有不同大小的处理单元预测或变换包括在最大编码单元中的具有不同大小的次级编码单元。换句话说,设备100可基于具有不同大小和不同形状的处理单元执行用于图像编码的多种处理操作。为了对图像数据进行编码,执行诸如预测、变换和熵编码的处理操作,其中,具有相同大小的处理单元可用于每个操作,或者具有不同大小的处理单元可用于每个操作。
例如,设备100可选择与编码单元不同的处理单元来预测所述编码单元。
当编码单元的大小是2N×2N(其中N是正整数)时,用于预测的处理单元可以是2N×2N、2N×N、N×2N和N×N。换句话说,可基于具有编码单元的高和宽中的至少一个被等分为二的形状的处理单元来执行运动预测。在下文,作为预测的基础的处理单元被定义为“预测单元”。
预测模式可以是帧内模式(intra-mode)、帧间模式(inter-mode)、跳过模式和仅对具有特定大小或形状的预测单元执行的特定预测模式中的至少一个。例如,可仅对具有2N×2N和N×N的大小的形状为正方形的预测单元执行帧内模式。此外,仅对具有2N×2N的大小的预测单元执行跳过模式。如果多个预测单元存在于编码单元中,则可在对每个预测单元执行预测之后选择具有最少编码错误的预测模式。
可选择地,设备100可基于具有与编码单元的大小不同大小的处理单元对图像数据执行频率变换。对于编码单元中的频率变换而言,可基于具有与编码单元的大小相同的大小或比编码单元的大小小的大小的处理单元执行频率变换。在下文,作为频率变换基础的处理单元被定义为“变换单元”。频率变换可以是离散余弦变换(DCT)或Karhunen-Loeve变换(KLT)。
编码深度确定单元120可使用基于拉格朗日乘数的RD优化来确定包括在最大编码单元中的次级编码单元。换句话说,编码深度确定单元120可确定从最大编码单元划分的多个次级编码单元的形状,其中,所述多个次级编码单元根据它们的深度具有不同的大小。图像数据编码器130通过基于由编码深度确定单元120确定的划分形状(即,划分最大编码单元的形状)对最大编码单元进行编码来输出比特流。
编码信息编码器140对与由编码深度确定单元120确定的最大编码单元的编码模式有关的信息进行编码。换句话说,编码信息编码器140通过对关于最大编码单元的划分形状的信息、关于最大深度的信息以及关于每个深度的次级编码单元的编码模式的信息进行编码来输出比特流。关于次级编码单元的编码模式的信息可包括:关于次级编码单元的预测单元的信息、关于每个预测单元的预测模式的信息以及关于次级编码单元的变换单元的信息。
由于每个最大编码单元存在具有不同大小的次级编码单元,并且必须为每个次级编码单元确定关于编码模式的信息,因此可为一个最大编码单元确定关于至少一个编码模式的信息。
设备100可根据深度的增加通过将最大编码单元的高和宽两者等分为二来生成次级编码单元。也就是说,当第k深度的编码单元的大小是2N×2N时,第(k+1)深度的编码单元的大小是N×N。
因此,根据示例性实施例的设备100可考虑到图像特征,基于最大编码单元的大小和最大深度确定每个最大编码单元的最佳划分形状。通过考虑到图像特征不同地调整最大编码单元的大小,并通过将最大编码单元划分为不同深度的次级编码单元来对图像编码,可更有效地对具有不同分辨率的图像进行编码。
图2是根据示例性实施例的用于解码的设备200的框图。
参照图2,设备200包括图像数据获得单元210、编码信息提取单元220以及图像数据解码器230。
图像数据获得单元210通过解析由设备200接收的比特流来获得根据最大编码单元的图像数据,并将图像数据输出到图像数据解码器230。图像数据获得单元210可从当前图片或片段的头提取关于当前图片或片段的最大编码单元的信息。换句话说,图像数据获得单元210按照最大编码单元划分比特流,从而图像数据解码器230可根据最大编码单元对图像数据进行解码。
编码信息提取单元220通过解析由设备200接收的比特流来从当前图片的头提取关于最大编码单元、最大深度、最大编码单元的划分形状以及次级编码单元的编码模式的信息。关于划分形状的信息和关于编码模式的信息被提供到图像数据解码器230。
关于最大编码单元的划分形状的信息可包括关于根据包括在最大编码单元中的深度具有不同大小的次级编码单元的信息,关于编码模式的信息可包括关于根据次级编码单元的预测单元的信息、关于预测模式的信息以及关于变换单元的信息。
图像数据解码器230通过基于由编码信息提取单元220提取的信息对每个最大编码单元的图像数据进行解码来恢复当前图片。图像数据解码器230可基于关于最大编码单元的划分形状的信息对包括在最大编码单元中的次级编码单元进行解码。解码处理可包括指示帧内预测和运动补偿的预测处理以及反变换处理。
为了预测预测单元,图像数据解码器230可基于关于预测单元的信息和关于预测模式的信息执行帧内预测或帧间预测。图像数据解码器230还可基于关于次级编码单元的变换单元的信息对每个次级编码单元执行反变换。
图3示出根据示例性实施例的层次编码单元。
参照图3,根据示例性实施例的层次编码单元可包括宽×高为64×64、32×32、16×16、8×8和4×4的编码单元。除了这些具有完美正方形形状的编码单元之外,还可存在宽×高为64×32、32×64、32×16、16×32、16×8、8×16、8×4和4×8的编码单元。
参照图3,对于分辨率为1920×1080的图像数据310而言,最大编码单元的大小被设置为64×64,最大深度被设置为2。
对于分辨率为1920×1080的图像数据320而言,最大编码单元的大小被设置为64×64,最大深度被设置为3。对于分辨率为352×288的图像数据330而言,最大编码单元的大小被设置为16×16,最大深度被设置为1。
当分辨率高或者数据量大时,优选(但不必要)编码单元的最大大小较大以增加压缩率和精确地反映图像特征。因此,对于具有比图像数据330更高的分辨率的图像数据310和图像数据320而言,可选择64×64作为最大编码单元的大小。
最大深度指示层次编码单元中的层的总数。由于图像数据310的最大深度是2,因此图像数据310的编码单元315可根据深度的增加包括长轴大小为64的最大编码单元以及长轴大小为32和16的次级编码单元。
另一方面,由于图像数据330的最大深度为1,因此图像数据330的编码单元335可根据深度的增加包括长轴大小为16的最大编码单元以及长轴大小为8的编码单元。
然而,由于图像数据320的最大深度为4,因此图像数据320的编码单元325可根据深度的增加包括长轴大小为64的最大编码单元以及长轴大小为32、16、8和4的次级编码单元。由于随着深度增加而基于较小次级编码单元对图像编码,因此示例性实施例适合于对在场景中包括更多微小细节的图像进行编码。
图4是根据示例性实施例的基于编码单元的图像解码器400的框图。
帧内预测器410对当前帧405中的帧内模式的预测单元执行帧内预测,运动估计单元420和运动补偿单元425使用当前帧405和参考帧495对帧间模式的预测单元执行帧间预测和运动补偿。
基于从帧内预测器410、运动估计单元420和运动补偿单元425输出的预测单元生成残值,通过经过变换器430和量化单元440将生成的残值输出为量化的变换系数。
通过经过反量化单元460和频率反变换器470将量化的变换系数恢复为残值,通过经过数据分块单元480和环形滤波单元490后处理恢复的残值并将恢复的残值输出为参考帧495。可通过经过熵编码器450将量化的变换系数输出为比特流455。
为了基于根据示例性实施例的编码方法执行编码,图像编码器400的部件(即,帧内预测器410、运动估计单元420、运动补偿单元425、变换器430、量化单元440、熵编码器450、反量化单元460、频率反变换器470、数据分块单元480和环形滤波单元490)基于最大编码单元、根据深度的次级编码单元、预测单元和变换单元执行图像编码处理。
图5是根据示例性实施例的基于编码单元的图像解码器500的框图。
比特流505经过解析单元510,从而将被解码的编码单元和解码所需的编码信息被解析。通过经过熵解码器520和反量化单元530,编码的图像数据被输出为反量化的数据,通过经过频率反变换器540,编码的图像数据被恢复为残值。通过被添加到帧内预测器550的帧内预测结果或添加到运动补偿单元560的运动补偿结果,残值根据编码单元被恢复。通过经过数据分块单元570和环形滤波单元580,恢复的编码单元用于预测其后的编码单元或其后的图片。
为了基于根据示例性实施例的解码方法执行解码,图像解码器500的部件(即,解析单元510、熵解码器520、反量化单元530、频率反变换单元540、帧内预测器550、运动补偿单元560、数据分块单元570和环形滤波单元580)基于最大编码单元、根据深度的次级编码单元、预测单元和变换单元执行图像解码处理。
具体地说,帧内预测器550和运动补偿单元560通过考虑最大编码单元和深度来在次级编码单元中确定预测单元和预测模式,频率反量化单元540通过考虑变换单元的大小来执行反变换。
图6示出根据示例性实施例的最大编码单元、次级编码单元和预测单元。
根据示例性实施例的设备100和设备200考虑到图像特征使用层次编码单元以执行编码和解码。可根据图像特征适应性地设置最大编码单元和最大深度,或根据用户的要求不同地设置最大编码单元和最大深度。
根据示例性实施例的层次编码单元结构600示出高和宽为64且最大深度为4的最大编码单元610。深度沿着层次编码单元结构600的垂直轴增加,并且随着深度增加,次级编码单元620到650的高和宽减小。沿着层次编码单元结构600的水平轴示出了最大编码单元610和次级编码单元620到650的预测单元。
最大编码单元610具有0的深度和64×64的编码单元的大小(即,高和宽)。深度沿垂直轴增加,并且存在大小为32×32且深度为1的次级编码单元620、大小为16×16且深度为2的次级编码单元630、大小为8×8且深度为3的次级编码单元640以及大小为4×4且深度为4的次级编码单元650。大小为4×4且深度为4的次级编码单元650是最小编码单元,并且最小编码单元可被划分为预测单元,每个预测单元小于最小编码单元。
参照图6,根据每个深度沿着水平轴示出预测单元的示例。也就是说,深度为0的最大编码单元610的预测单元可以是大小等于编码单元610(即64×64)的预测单元,或者是具有小于大小为64×64的编码单元610的大小为64×32的预测单元612、大小为32×64的预测单元614、或大小为32×32的预测单元616。
深度为1且大小为32×32的编码单元620的预测单元可以是大小等于编码单元620(即32×32)的预测单元,或者是具有小于大小为32×32的编码单元620的大小为32×16的预测单元622、大小为16×32的预测单元624、或大小为16×16的预测单元626。
深度为2且大小为16×16的编码单元630的预测单元可以是大小等于编码单元630(即16×16)的预测单元,或者是具有小于大小为16×16的编码单元630的大小为16×8的预测单元632、大小为8×16的预测单元634、或大小为8×8的预测单元636。
深度为3且大小为8×8的编码单元640的预测单元可以是大小等于编码单元640(即8×8)的预测单元,或者是具有小于大小为8×8的编码单元620的大小为8×4的预测单元642、大小为4×8的预测单元644、或大小为4×4的预测单元646。
最后,深度为4且大小为4×4的编码单元650是最小编码单元并且是最大深度的编码单元,编码单元650的预测单元可以是大小为4×4的预测单元650、具有大小为4×2的预测单元652、具有大小为2×4的预测单元654或者具有大小为2×2的预测单元656。
图7示出根据示例性实施例的编码单元和变换单元。
根据示例性实施例的设备100和设备200利用最大编码单元本身或利用次级编码单元执行编码,所述次级编码单元从最大编码单元被划分,并等于或小于最大编码单元。
在编码处理中,用于频率变换的变换单元的大小被选择为不大于对应编码单元的大小。例如,当编码单元710具有64×64的大小时,可使用具有32×32的大小的变换单元720执行频率变换。
图8A和图8B示出根据示例性实施例的编码单元、预测单元和变换单元的划分形状。
图8A示出根据示例性实施例的编码单元和预测单元。
图8A的左侧示出根据示例性实施例的设备100为了对最大编码单元710进行编码而选择的划分形状。设备100将最大编码单元810划分为多个形状,执行编码,并通过基于R-D成本将多个划分形状的编码结果与彼此相比较来选择最佳划分形状。当按照最大编码单元810本身进行编码是最佳时,可对最大编码单元810进行编码而不需要图8A和图8B所示划分最大编码单元810。
参照图8A的左侧,通过将深度为0的最大编码单元810划分为深度等于或大于1的次级编码单元来对最大编码单元810进行编码。也就是说,将最大编码单元810划分为4个深度为1的次级编码单元,并且将所有或部分深度为1的次级编码单元划分为深度为2的次级编码单元。
将深度为1的次级编码单元中的位于右上侧的次级编码单元和位于左下侧的次级编码单元划分为深度等于或大于2的次级编码单元。可将部分深度等于或大于2的次级编码单元划分为深度等于或大于3的次级编码单元。
图8A的右侧示出最大编码单元810的预测单元的划分形状。
参照图8A的右侧,可与最大编码单元810不同地划分最大编码单元810的预测单元860。换句话说,每个次级编码单元的预测单元可以小于对应的次级编码单元。
例如,深度为1的次级编码单元中的位于右下侧的次级编码单元854的预测单元可以小于编码单元854。此外,深度为2的次级编码单元814、816、818、828、850和852中的一部分的预测单元(814、816、850和852)可以分别小于次级编码单元814、816、850和852。此外,深度为3的次级编码单元822、832和848的预测单元可以分别小于次级编码单元822、832和848。预测单元可具有各个次级编码单元在高方向或宽方向上被等分为二的形状,或具有各个次级编码单元在高和宽的方向上被等分为四的形状。
图8B示出根据示例性实施例的预测单元和变换单元。
图8B的左侧示出在图8A的右侧示出的最大编码单元810的预测单元的划分形状,图8B的右侧示出最大编码单元810的变换单元的划分形状。
参照图8B的右侧,可与预测单元860不同地设置变换单元870的划分形状。
例如,即使将深度为1的编码单元854的预测单元选择为具有编码单元854的高被等分为二的形状,也可将变换单元选择为具有与编码单元854相同的大小。类似地,即使将深度为2的编码单元814和850的预测单元选择为具有编码单元814和850中的每个的高被等分为二的形状,也可将变换单元选择为具有与编码单元814和850中的每个的原始大小相等的大小。
可将变换单元选择为具有小于预测单元的大小。例如,当将深度为2的编码单元852的预测单元选择为具有编码单元852的宽被等分为二的形状时,可将变换单元选择为具有编码单元852在高和宽的方向上被等分为四的形状,所述形状具有小于预测单元的形状的大小。
图9是根据另一示例性实施例的图像编码设备900的框图。
参照图9,根据本示例性实施例的图像编码设备900包括变换器910、量化单元920以及熵编码器930。
变换器910接收像素域的图像处理单元,并将图像处理单元变换为频域。变换器910接收包括由于帧内预测或帧间预测生成的残值的多个预测单元,并将预测单元变换为频域。作为变换到频域的结果,生成频率分量的系数。根据本示例性实施例,可通过离散余弦变换(DCT)或Karhunen-Loeve变换(KLT)发生到频域的变换,并且作为DCT或KLT的结果,生成频域的系数。在下文,到频域的变换可以是DCT,然而,对于本领域的一个普通技术人员而言,到频域的变换可以是包括将像素域的图像变换为频域的变换的任何变换。
此外,根据本示例性实施例,变换器910通过组合多个预测单元来设置变换单元,并根据变换单元执行变换。将参照图10、图11A、图11B和图12详细描述该处理。
图10是变换器910的示图。
参照图10,变换器910包括选择单元1010和变换执行单元1020。
选择单元1010通过选择多个相邻预测单元设置变换单元。
根据现有技术的图像编码设备根据具有预定大小的块(即,根据预测单元)执行帧内预测或帧间预测,并基于小于或等于预测单元的大小的大小执行DCT。换句话说,根据现有技术的图像编码设备通过使用小于或等于预测单元的变换单元来执行DCT。
然而,由于多份头信息被添加到变换单元,随着变换单元的减小,额外的开销增加。为了解决这个问题,根据本示例性实施例的图像编码设备900将多个相邻预测单元组合为变换单元,并根据通过组合生成的变换单元执行变换。相邻预测单元很可能包括相似残值,从而如果将相邻预测单元组合为一个变换单元然后在其上执行变换,可高度增加编码操作的压缩率。
例如,选择单元1010选择将被组合为一个变换单元的相邻预测单元。将参照图11A到图11C和图12详细描述该处理。
图11A到图11C示出根据另一示例性实施例的变换单元的类型。
参照图11A到图11C,相对于编码单元1110的预测单元1120可具有通过将编码单元1110的宽分半而获得的划分形状。编码单元1110可以是最大编码单元,或可以是具有小于最大编码单元的大小的次级编码单元。
如图11A中所示,变换单元1130的大小可小于预测单元1120,或如图11B中所示,变换单元1140的大小可以等于预测单元1120。此外,如图11C中所示,变换单元1150的大小可以大于预测单元1120。也就是说,可在变换单元1130到1150与预测单元1120没有关系的情况下设置变换单元1130到1150。
此外,图11C示出通过组合包括在编码单元1110中的多个预测单元1120来设置预测单元1120的示例。然而,可以以将多个预测单元设置为一个变换单元的方式来将变换单元设置为大于编码单元,其中,所述多个预测单元不是包括在一个编码单元中而是包括在多个编码单元中。换句话说,如参照图11A到图11C所述,可将变换单元设置为等于或小于编码单元的大小,或大于编码单元的大小。也就是说,可在变换单元与预测单元和编码单元没有关系的同时设置变换单元。
虽然图11A到图11C示出具有正方形形式的变换单元的示例。然而,根据组合相邻预测单元的方法,变换单元可具有矩形形式。例如,在预测单元未被设置为具有如图11A到图11C所示的矩形形式,而被设置为具有通过将编码单元1110四等分而获得四个正方形形式的情况下,组合上和下预测单元或左和右预测单元,从而变换单元可具有水平侧或垂直侧是长的的矩形形式。
参照图10,选择单元1010选择相邻预测单元的标准没有限制。然而,根据示例性实施例,选择单元1010可根据深度选择变换单元。如上所述,深度指示从当前片段或当前图片的最大编码单元到次级编码单元逐级执行的大小缩减的等级。如以上参照图3到图6的描述,随着深度增加,次级编码单元的大小减小,从而包括在次级编码单元中的预测单元也减小。这种情况下,如果根据小于或等于预测单元的变换单元执行变换,则由于头信息被添加到每个变换单元而导致图像编码操作的压缩率下降。
因此,对于预定值的深度的次级编码单元,优选(但不必要)将包括在次级编码单元中的预测单元组合和设置为变换单元,然后对其执行变换。为此,选择单元1010基于次级编码单元的深度设置变换单元。例如,在图11C中的编码单元1110的深度大于k的情况下,选择单元1010组合预测单元1120并将预测单元1120设置为变换单元1150。
此外,根据另一示例性实施例,选择单元1010可组合根据相同预测模式执行预测的多个相邻预测单元,并可将所述多个预测单元设置为一个变换单元。选择单元1010组合根据帧内预测或帧间预测执行预测的相邻预测单元,然后将所述相邻预测单元设置为一个变换单元。由于根据相同预测模式执行预测的相邻预测单元很可能包括相似残值,因此可将相邻预测单元组合为变换单元然后对所述相邻预测单元执行变换。
当选择单元1010设置变换单元时,变换执行单元1020根据变换单元将相邻预测单元变换为频域。变换执行单元1020根据变换单元对相邻预测单元执行DCT,并生成离散余弦系数。
返回参照图9,量化单元920量化由变换器910生成的频率分量系数(例如,离散余弦系数)。量化单元920可根据预定量化步长(quantization step)来量化输入的离散余弦系数。
熵编码器930对由量化单元920量化的频率分量系数执行熵编码。熵编码器930可通过使用内容自适应变化算法编码(CABAC)或内容自适应变长编码(CAVLC)来对离散余弦系数执行熵编码。
图像编码设备900可通过对不同变换单元重复执行DCT、量化和熵编码来确定最佳变换单元。可重复用于选择相邻预测单元的处理以确定最佳变换单元。可考虑到RD成本的计算来确定最佳变换单元,这将参照图12进行详细描述。
图12示出根据另一示例性实施例的不同变换单元。
参照图12,图像编码设备900对不同编码单元重复执行编码操作。
如图12所示,可基于具有小于编码单元1210的大小的预测单元1220对编码单元1210进行预测和编码。对通过预测的结果生成的残值执行变换,这里,如图12中所示,可基于不同变换单元对残值执行DCT。
第一示出的变换单元1230具有与编码单元相同的大小,并具有通过组合包括在编码单元1210中的所有预测单元而获得的大小。
第二示出的变换单元1240分别具有通过将编码单元1210的宽分半而获得的大小,以及通过组合垂直方向上的每两个彼此相邻的预测单元而获得的大小。
第三示出的变换单元1250分别具有通过将编码单元1210的高分半而获得的大小,以及通过组合水平方向上的每两个彼此相邻的预测单元而获得的大小。
当基于具有与预测单元1220相同的大小的第四示出变换单元1260执行变换时使用第四示出的变换单元1260。
图13是根据另一示例性实施例的图像解码设备1300的框图。
参照图13,根据本示例性实施例的图像解码设备1300包括熵解码器1310、反量化单元1320以及反变换器1330。
熵解码器1310关于预定编码单元对频率分量系数执行熵解码。如以上参照图11A到图11C以及图12的描述,预定变换单元可以是通过组合多个相邻预测单元而生成的变换单元。
如以上参照图像编码设备900的描述,可通过根据深度组合相邻预测单元来生成变换单元,或可通过组合根据相同预测模式(即根据帧内预测模式或帧间预测模式)执行预测的多个相邻预测单元来生成变换单元。
多个预测单元可不包括在一个编码单元中而是包括在多个编码单元中。换句话说,如以上参照图11A到图11C的描述,可将通过熵解码器1310熵解码的变换单元设置为等于或小于编码单元的大小,或可将所述变换单元设置为大于编码单元的大小。
此外,如以上参照图12的描述,变换单元可以是通过重复组合多个相邻预测单元的处理并且通过对不同变换单元重复执行变换、量化和熵编码而选择的最佳变换单元。
反量化单元1320对由熵解码器1310熵解码的频率分量系数进行反量化。
反量化单元1320根据用于变换单元的编码的量化步长对频率分量系数进行反量化和熵解码。
反变换器1330将频率分量系数反变换和反量化为像素域。反变换器可对反量化后的离散余弦系数(即反量化后的频率分量系数)执行反DCT,然后可重构像素域的变换单元。重构的变换单元可包括相邻预测单元。
图14是根据示例性实施例的图像编码方法的流程图。
参照图14,在操作1410,图像编码设备通过选择多个相邻预测单元来设置变换单元。图像编码设备可根据深度选择多个相邻预测单元,或可选择根据相同预测模式执行预测的多个相邻预测单元。
在操作1420,图像编码设备根据在操作1420设置的变换单元将相邻单元变换为频域。图像编码设备组合相邻预测单元,对相邻预测单元执行DCT,从而生成离散余弦系数。
在操作1430,图像编码设备根据量化步长对在操作1420生成的频率分量系数进行量化。
在操作1440,图像编码设备对在操作1430量化的频率分量系数执行熵编码。图像编码设备通过使用CABAC或CAVLC对离散余弦系数执行熵编码。
根据另一示例性实施例的图像编码方法还可包括通过对不同的变换单元重复执行操作1410到操作1440来设置最佳变换单元的操作。也就是说,通过如图12所示的对不同的变换单元重复执行变换、量化和熵编码,可设置最佳变换单元。
图15是根据另一示例性实施例的图像解码方法的流程图。
参照图15,在操作1510,图像解码设备关于预定变换单元对频率分量系数执行熵解码。频率分量系数可以是离散余弦系数。
在操作1520,图像解码设备对在操作1510熵解码的频率分量系数进行反量化。图像解码设备通过使用用于编码操作的量化步长来对离散余弦系数进行反量化。
在操作1530,图像解码设备将已经在操作1520反量化的频率分量系数反变换为像素域,然后重构变换单元。通过组合多个相邻预测单元来设置重构的变换单元。如上所述,可通过根据深度组合相邻预测单元来设置变换单元,或者可通过组合根据相同预测模式执行预测的相邻预测单元来设置变换单元。
根据一个或多个示例性实施例,可将变换单元设置为大于预测单元,并执行DCT从而图像可被有效地压缩和编码。
示例性实施例还可被实施为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是可存储数据的任何数据存储装置,所述数据之后可被计算机系统读取。计算机可读记录介质的示例包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘以及光数据存储介质。计算机可读记录介质还可通过网络连接的计算机被分布,从而计算机可读代码可以以分布方式被存储和执行。
例如,根据一个或多个示例性实施例的图像编码设备、图像解码设备、图像编码器和图像解码器中的每个可包括连接到如图1-2、图4-5、图9-10和图14示出的设备中的每个单元的总线以及连接到总线的至少一个处理器。此外,根据一个或多个示例性实施例的图像编码设备、图像解码设备、图像编码器和图像解码器中的每个可包括连接到与总线连接的至少一个处理器的存储器,以存储命令、接收的消息或生成的消息并执行命令。
虽然参照本发明示例性实施例显示和描述了本发明,但是本领域普通技术人员将理解,在不脱离权利要求限定的本发明的精神和范围的情况下,可以对其做出形式和细节上的各种改变。示例性实施例应被理解为仅仅是描述性而不是用于限制目的。因此,本发明的范围不是由本发明的详细描述限定,而是由权利要求限定,并且所述范围内的所有不同将被解释为包括在本发明中。

Claims (4)

1.一种用于对图像解码的方法,包括:
通过对基于编码单元编码的比特流执行熵解码来获得编码单元中的变换单元的量化的变换系数;
通过对量化的变换系数执行反量化和反变换来获得变换单元的残差;
使用包括在编码单元中的至少一个预测单元执行预测以产生预测因子,并使用所述残差和预测因子来重构编码单元,
其中,从编码单元划分的变换单元的大小独立于编码单元中的所述至少一个预测单元的大小被确定,
所述图像被划分为多个最大编码单元,
最大编码单元根据划分信息被分层地划分为具有深度的一个或更多个编码单元,其中,所述深度包括当前深度和更低深度中的至少一个,
当划分信息指示针对当前深度进行划分时,当前深度的编码单元独立于相邻编码单元被划分为更低深度的四个正方形编码单元,
当划分信息指示针对更低深度不进行划分时,从更低深度的编码单元获得至少一个预测单元。
2.如权利要求1所述的方法,其中,当最大编码单元的大小被设置为16×16、32×32和64×64中的一个时,编码单元的大小被确定为8×8、16×16、32×32和64×64中的一个,通过根据1:1的比率对编码单元的高度和宽度中的至少一个进行划分来获得所述至少一个预测单元。
3.如权利要求1所述的方法,其中,变换单元的大小和预测单元的大小均小于或等于编码单元的大小。
4.一种用于对图像解码的设备,包括:
熵解码单元,被配置为通过对基于编码单元编码的比特流执行熵解码来获得编码单元中的变换单元的量化的变换系数;
反量化和反变换单元,被配置为通过对量化的变换系数执行反量化和反变换来获得变换单元的残差;
解码器,被配置为使用包括在编码单元中的至少一个预测单元执行预测以产生预测因子,并使用所述残差和预测因子来重构编码单元,
其中,从编码单元划分的变换单元的大小独立于编码单元中的所述至少一个预测单元的大小被确定,
所述图像被划分为多个最大编码单元,
最大编码单元根据划分信息被分层地划分为具有深度的一个或更多个编码单元,其中,所述深度包括当前深度和更低深度中的至少一个,
当划分信息指示针对当前深度进行划分时,当前深度的编码单元独立于相邻编码单元被划分为更低深度的四个正方形编码单元,
当划分信息指示针对更低深度不进行划分时,从更低深度的编码单元获得至少一个预测单元。
CN201510005662.2A 2009-08-13 2010-08-13 通过使用大型变换单元解码图像的方法 Active CN104581162B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2009-0074895 2009-08-13
KR1020090074895A KR101474756B1 (ko) 2009-08-13 2009-08-13 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN201080036020.4A CN102484703B (zh) 2009-08-13 2010-08-13 通过使用大型变换单元编码和解码图像的方法和设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201080036020.4A Division CN102484703B (zh) 2009-08-13 2010-08-13 通过使用大型变换单元编码和解码图像的方法和设备

Publications (2)

Publication Number Publication Date
CN104581162A true CN104581162A (zh) 2015-04-29
CN104581162B CN104581162B (zh) 2016-05-04

Family

ID=43586668

Family Applications (6)

Application Number Title Priority Date Filing Date
CN201510005662.2A Active CN104581162B (zh) 2009-08-13 2010-08-13 通过使用大型变换单元解码图像的方法
CN201080036020.4A Active CN102484703B (zh) 2009-08-13 2010-08-13 通过使用大型变换单元编码和解码图像的方法和设备
CN2013100927003A Pending CN103220525A (zh) 2009-08-13 2010-08-13 通过使用大型变换单元编码和解码图像的方法和设备
CN201510005604.XA Active CN104581161B (zh) 2009-08-13 2010-08-13 通过使用大型变换单元编码和解码图像的方法和设备
CN201510006252.XA Active CN104581163B (zh) 2009-08-13 2010-08-13 通过使用大型变换单元编码和解码图像的方法和设备
CN201310097476.7A Active CN103220528B (zh) 2009-08-13 2010-08-13 通过使用大型变换单元编码和解码图像的方法和设备

Family Applications After (5)

Application Number Title Priority Date Filing Date
CN201080036020.4A Active CN102484703B (zh) 2009-08-13 2010-08-13 通过使用大型变换单元编码和解码图像的方法和设备
CN2013100927003A Pending CN103220525A (zh) 2009-08-13 2010-08-13 通过使用大型变换单元编码和解码图像的方法和设备
CN201510005604.XA Active CN104581161B (zh) 2009-08-13 2010-08-13 通过使用大型变换单元编码和解码图像的方法和设备
CN201510006252.XA Active CN104581163B (zh) 2009-08-13 2010-08-13 通过使用大型变换单元编码和解码图像的方法和设备
CN201310097476.7A Active CN103220528B (zh) 2009-08-13 2010-08-13 通过使用大型变换单元编码和解码图像的方法和设备

Country Status (24)

Country Link
US (10) US8792741B2 (zh)
EP (7) EP3282696B1 (zh)
JP (7) JP5746169B2 (zh)
KR (1) KR101474756B1 (zh)
CN (6) CN104581162B (zh)
AU (1) AU2010283113B2 (zh)
BR (3) BR122013019725A2 (zh)
CA (5) CA2877241C (zh)
CY (5) CY1119836T1 (zh)
DK (6) DK2629518T3 (zh)
ES (6) ES2760475T3 (zh)
HR (5) HRP20171767T1 (zh)
HU (6) HUE039342T2 (zh)
IN (3) IN2015MN00402A (zh)
LT (5) LT2629526T (zh)
MX (1) MX2012000614A (zh)
MY (3) MY157499A (zh)
NO (4) NO2866442T3 (zh)
PL (6) PL2890123T3 (zh)
PT (5) PT3282696T (zh)
RU (4) RU2510945C1 (zh)
SI (5) SI2629526T1 (zh)
WO (1) WO2011019234A2 (zh)
ZA (5) ZA201201157B (zh)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
US8711948B2 (en) * 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US9571856B2 (en) * 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
KR101474756B1 (ko) 2009-08-13 2014-12-19 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN104602013B (zh) * 2009-10-01 2017-10-31 Sk电信有限公司 视频编码装置和方法
WO2011049119A1 (ja) * 2009-10-20 2011-04-28 シャープ株式会社 動画像符号化装置、動画像復号装置、動画像符号化・復号システム、動画像符号化方法および動画像復号方法
KR101487687B1 (ko) 2010-01-14 2015-01-29 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN106686379B (zh) 2010-04-13 2019-10-18 三星电子株式会社 对视频进行解码的方法
SI2955917T1 (sl) * 2010-08-17 2018-09-28 Samsung Electronics Co., Ltd Postopek dekodiranja videa z uporabo transformacijske enote variabilne drevesne strukture
KR20120035096A (ko) * 2010-10-04 2012-04-13 한국전자통신연구원 쿼드 트리 변환 구조에서 부가 정보의 시그널링 방법 및 장치
US9532059B2 (en) 2010-10-05 2016-12-27 Google Technology Holdings LLC Method and apparatus for spatial scalability for video coding
US8605567B2 (en) * 2010-12-02 2013-12-10 Adtran, Inc. Apparatuses and methods for enabling crosstalk vectoring in expandable communication systems
EP3554078A1 (en) 2010-12-13 2019-10-16 Electronics and Telecommunications Research Institute Method and device for determining reference unit
JP5594841B2 (ja) * 2011-01-06 2014-09-24 Kddi株式会社 画像符号化装置及び画像復号装置
US8494290B2 (en) * 2011-05-05 2013-07-23 Mitsubishi Electric Research Laboratories, Inc. Method for coding pictures using hierarchical transform units
MY175434A (en) * 2011-06-30 2020-06-25 Samsung Electronics Co Ltd Video encoding method with bit depth adjustment for fixed-point conversion and apparatus therefor, and video decoding method and apparatus therefor
JP5989772B2 (ja) 2011-07-01 2016-09-07 サムスン エレクトロニクス カンパニー リミテッド 階層的構造のデータ単位を利用したエントロピー符号化方法及び該装置、並びに復号化方法及び該装置
US9807426B2 (en) * 2011-07-01 2017-10-31 Qualcomm Incorporated Applying non-square transforms to video data
JP5899447B2 (ja) * 2011-11-21 2016-04-06 パナソニックIpマネジメント株式会社 画像処理装置および画像処理方法
US9094681B1 (en) 2012-02-28 2015-07-28 Google Inc. Adaptive segmentation
US8396127B1 (en) * 2012-06-27 2013-03-12 Google Inc. Segmentation for video coding using predictive benefit
TWI627857B (zh) * 2012-06-29 2018-06-21 Sony Corp Image processing device and method
MX347473B (es) * 2012-07-02 2017-04-27 Samsung Electronics Co Ltd Metodo y aparato para codificar video por entropia, y metodo y aparato para decodificar video por entropia.
CN111629208B (zh) * 2012-07-02 2021-12-21 韩国电子通信研究院 图像编码/解码方法和非暂时性计算机可读记录介质
US9332276B1 (en) 2012-08-09 2016-05-03 Google Inc. Variable-sized super block based direct prediction mode
US9380298B1 (en) 2012-08-10 2016-06-28 Google Inc. Object-based intra-prediction
US9445124B2 (en) 2013-03-15 2016-09-13 Samsung Electronics Co., Ltd. Electronic system with frequency mechanism and method of operation thereof
WO2014168411A1 (ko) * 2013-04-11 2014-10-16 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
JP6402520B2 (ja) * 2014-07-22 2018-10-10 沖電気工業株式会社 符号化装置、方法、プログラム及び機器
US20160029022A1 (en) * 2014-07-25 2016-01-28 Mediatek Inc. Video processing apparatus with adaptive coding unit splitting/merging and related video processing method
CN109155857B (zh) * 2016-03-11 2023-05-30 数字洞察力有限公司 视频编码方法以及装置
KR102416804B1 (ko) * 2016-10-14 2022-07-05 세종대학교산학협력단 영상 부호화 방법/장치, 영상 복호화 방법/장치 및 비트스트림을 저장한 기록 매체
KR101823533B1 (ko) * 2017-03-21 2018-01-30 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN111602397B (zh) * 2018-01-17 2024-01-23 英迪股份有限公司 使用各种变换技术的视频编码方法和装置
KR101913734B1 (ko) 2018-01-24 2018-10-31 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN116320411A (zh) * 2018-03-29 2023-06-23 日本放送协会 图像编码装置、图像解码装置以及程序
JP7378035B2 (ja) * 2018-09-12 2023-11-13 パナソニックIpマネジメント株式会社 変換装置、復号装置、変換方法および復号方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1857001A (zh) * 2003-05-20 2006-11-01 Amt先进多媒体科技公司 混合视频压缩方法

Family Cites Families (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5842033A (en) * 1992-06-30 1998-11-24 Discovision Associates Padding apparatus for passing an arbitrary number of bits through a buffer in a pipeline system
US6435737B1 (en) * 1992-06-30 2002-08-20 Discovision Associates Data pipeline system and data encoding method
JP3133517B2 (ja) * 1992-10-15 2001-02-13 シャープ株式会社 画像領域検出装置、該画像検出装置を用いた画像符号化装置
US5598514A (en) * 1993-08-09 1997-01-28 C-Cube Microsystems Structure and method for a multistandard video encoder/decoder
US5610657A (en) * 1993-09-14 1997-03-11 Envistech Inc. Video compression using an iterative error data coding method
US5446806A (en) 1993-11-15 1995-08-29 National Semiconductor Corporation Quadtree-structured Walsh transform video/image coding
JP3169783B2 (ja) * 1995-02-15 2001-05-28 日本電気株式会社 動画像の符号化・復号システム
DE69619002T2 (de) 1995-03-10 2002-11-21 Toshiba Kawasaki Kk Bildkodierungs-/-dekodierungsvorrichtung
DE69636150T8 (de) 1995-03-15 2007-07-12 Kabushiki Kaisha Toshiba System zur Kodierung von bewegten Bildern, und System zur variablen Längenkodierung
US5680129A (en) * 1995-07-18 1997-10-21 Hewlett-Packard Company System and method for lossless image compression
EP0857392B1 (en) * 1995-10-25 2004-08-11 Sarnoff Corporation Overlapping block zerotree wavelet image coder
CN1177485C (zh) * 1996-05-17 2004-11-24 松下电器产业株式会社 图像解码装置
EP1085763B1 (en) 1996-05-28 2003-01-22 Matsushita Electric Industrial Co., Ltd. Image predictive coding apparatus and method.
US6101276A (en) * 1996-06-21 2000-08-08 Compaq Computer Corporation Method and apparatus for performing two pass quality video compression through pipelining and buffer management
US5995080A (en) * 1996-06-21 1999-11-30 Digital Equipment Corporation Method and apparatus for interleaving and de-interleaving YUV pixel data
US6292589B1 (en) * 1996-06-21 2001-09-18 Compaq Computer Corporation Method for choosing rate control parameters in motion-compensated transform-based picture coding scheme using non-parametric technique
US6292591B1 (en) * 1996-07-17 2001-09-18 Sony Coporation Image coding and decoding using mapping coefficients corresponding to class information of pixel blocks
FR2755527B1 (fr) 1996-11-07 1999-01-08 Thomson Multimedia Sa Procede de prediction compensee en mouvement et codeur utilisant un tel procede
US6173013B1 (en) * 1996-11-08 2001-01-09 Sony Corporation Method and apparatus for encoding enhancement and base layer image signals using a predicted image signal
US5956467A (en) * 1996-12-17 1999-09-21 Eastman Kodak Company Encoding color image data for multipass color printers
JPH10178639A (ja) 1996-12-19 1998-06-30 Matsushita Electric Ind Co Ltd 画像コーデック部および画像データ符号化方法
US6157746A (en) * 1997-02-12 2000-12-05 Sarnoff Corporation Apparatus and method for encoding wavelet trees generated by a wavelet-based coding method
CN1110963C (zh) * 1997-03-26 2003-06-04 松下电器产业株式会社 图象解码装置
JPH11146367A (ja) 1997-11-06 1999-05-28 Matsushita Electric Ind Co Ltd モバイルビデオフォン
US6393060B1 (en) * 1997-12-31 2002-05-21 Lg Electronics Inc. Video coding and decoding method and its apparatus
US5995150A (en) * 1998-02-20 1999-11-30 Winbond Electronics Corporation America Dual compressed video bitstream camera for universal serial bus connection
JP3132456B2 (ja) * 1998-03-05 2001-02-05 日本電気株式会社 階層的画像符号化方式、及び階層的画像復号方式
IL129203A (en) * 1999-03-28 2002-07-25 Univ Ramot System and method for compressing figures
CN1297148C (zh) 2001-08-28 2007-01-24 株式会社Ntt都科摩 动画图像编码传送系统、动画图像编码传送方法、该系统和方法使用的适合的编码装置、译码装置、编码方法、译码方法以及程序
US6980596B2 (en) 2001-11-27 2005-12-27 General Instrument Corporation Macroblock level adaptive frame/field coding for digital video content
CN101448162B (zh) 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
EP1322121A3 (en) 2001-12-19 2003-07-16 Matsushita Electric Industrial Co., Ltd. Video encoder and decoder with improved motion detection precision
JP2003250161A (ja) * 2001-12-19 2003-09-05 Matsushita Electric Ind Co Ltd 符号化装置及び復号化装置
HUE030635T2 (en) 2002-03-27 2017-06-28 Panasonic Ip Corp America A variable length coding and decoding system and a variable length coding and decoding method
JP2003319394A (ja) * 2002-04-26 2003-11-07 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
KR100491530B1 (ko) * 2002-05-03 2005-05-27 엘지전자 주식회사 모션 벡터 결정 방법
US6795584B2 (en) 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
WO2004052017A1 (en) * 2002-12-04 2004-06-17 Koninklijke Philips Electronics N.V. Video coding method and device
US7580584B2 (en) * 2003-07-18 2009-08-25 Microsoft Corporation Adaptive multiple quantization
ES2767933T3 (es) * 2003-09-07 2020-06-19 Microsoft Technology Licensing Llc Capa de sectores en códec de vídeo
US7317839B2 (en) * 2003-09-07 2008-01-08 Microsoft Corporation Chroma motion vector derivation for interlaced forward-predicted fields
KR20050045746A (ko) 2003-11-12 2005-05-17 삼성전자주식회사 계층 구조의 가변 블록 크기를 이용한 움직임 추정 방법및 장치
CN101695132B (zh) * 2004-01-20 2012-06-27 松下电器产业株式会社 图像编码方法和设备、图像解码方法和设备
KR101136629B1 (ko) 2004-01-30 2012-04-23 파나소닉 주식회사 화상 부호화 방법, 화상 복호화 방법, 화상 부호화 장치,화상 복호화 장치, 및 그 프로그램
US7565020B2 (en) * 2004-07-03 2009-07-21 Microsoft Corp. System and method for image coding employing a hybrid directional prediction and wavelet lifting
JP2006174415A (ja) * 2004-11-19 2006-06-29 Ntt Docomo Inc 画像復号装置、画像復号プログラム、画像復号方法、画像符号化装置、画像符号化プログラム及び画像符号化方法
JP4889231B2 (ja) * 2005-03-31 2012-03-07 三洋電機株式会社 画像符号化方法および装置、画像復号方法
KR101127221B1 (ko) * 2005-07-15 2012-03-29 삼성전자주식회사 주파수 공간에서 컬러 성분간 예측을 이용한 컬러영상부호화/복호화 방법 및 장치
JP4828543B2 (ja) 2005-09-26 2011-11-30 三菱電機株式会社 動画像符号化装置及び動画像復号装置
KR100763196B1 (ko) * 2005-10-19 2007-10-04 삼성전자주식회사 어떤 계층의 플래그를 계층간의 연관성을 이용하여부호화하는 방법, 상기 부호화된 플래그를 복호화하는방법, 및 장치
CN101129063B (zh) 2005-11-18 2010-05-19 索尼株式会社 编码设备和方法、解码设备和方法以及传输系统
JP2007243427A (ja) * 2006-03-07 2007-09-20 Nippon Hoso Kyokai <Nhk> 符号化装置及び復号化装置
KR101200865B1 (ko) 2006-03-23 2012-11-13 삼성전자주식회사 영상의 부호화 방법 및 장치, 복호화 방법 및 장치
WO2007116551A1 (ja) 2006-03-30 2007-10-18 Kabushiki Kaisha Toshiba 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法
KR100745765B1 (ko) * 2006-04-13 2007-08-02 삼성전자주식회사 화상 데이터의 공간상 예측 장치 및 방법과 그를 이용한부호화 장치 및 방법, 화상 데이터의 공간상 예측 보상장치 및 방법과 그를 이용한 복호화 장치 및 방법
WO2008027192A2 (en) * 2006-08-25 2008-03-06 Thomson Licensing Methods and apparatus for reduced resolution partitioning
KR20080045516A (ko) * 2006-11-20 2008-05-23 삼성전자주식회사 Rgb 영상의 부호화 및 복호화 방법과 그 장치
JP5026092B2 (ja) 2007-01-12 2012-09-12 三菱電機株式会社 動画像復号装置および動画像復号方法
JP2008245016A (ja) * 2007-03-28 2008-10-09 Canon Inc 画像符号化装置、画像符号化方法、及びプログラム
US8488668B2 (en) * 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
US8265144B2 (en) 2007-06-30 2012-09-11 Microsoft Corporation Innovations in video decoder implementations
US8483282B2 (en) 2007-10-12 2013-07-09 Qualcomm, Incorporated Entropy coding of interleaved sub-blocks of a video block
CN101159875B (zh) 2007-10-15 2011-10-05 浙江大学 二重预测视频编解码方法和装置
WO2009051719A2 (en) * 2007-10-16 2009-04-23 Thomson Licensing Methods and apparatus for video encoding and decoding geometically partitioned super blocks
JP2009111691A (ja) 2007-10-30 2009-05-21 Hitachi Ltd 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
US7444596B1 (en) 2007-11-29 2008-10-28 International Business Machines Corporation Use of template messages to optimize a software messaging system
US8619856B2 (en) 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
US8503527B2 (en) * 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
KR101474756B1 (ko) * 2009-08-13 2014-12-19 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
KR101452859B1 (ko) * 2009-08-13 2014-10-23 삼성전자주식회사 움직임 벡터를 부호화 및 복호화하는 방법 및 장치
KR102036118B1 (ko) * 2010-01-12 2019-10-24 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
KR101487687B1 (ko) * 2010-01-14 2015-01-29 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
JP6056122B2 (ja) * 2011-01-24 2017-01-11 ソニー株式会社 画像符号化装置と画像復号装置およびその方法とプログラム
EP3849187B1 (en) * 2011-06-24 2023-09-20 Mitsubishi Electric Corporation Moving image encoding apparatus, moving image decoding apparatus, moving image encoding method and moving image decoding method
EP2942961A1 (en) * 2011-11-23 2015-11-11 HUMAX Holdings Co., Ltd. Methods for encoding/decoding of video using common merging candidate set of asymmetric partitions
JP5917127B2 (ja) * 2011-12-19 2016-05-11 株式会社ジャパンディスプレイ 液晶表示装置
JP5887909B2 (ja) * 2011-12-19 2016-03-16 コニカミノルタ株式会社 画像形成装置及びその制御方法
US9332257B2 (en) * 2012-10-01 2016-05-03 Qualcomm Incorporated Coded black flag coding for 4:2:2 sample format in video coding

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1857001A (zh) * 2003-05-20 2006-11-01 Amt先进多媒体科技公司 混合视频压缩方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CIXUN ZHANG ET AL.: "VIDEO CODING USING VARIABLE BLOCK-SIZE SPATIALLY VARYING TRANSFORMS", 《ACOUSTICS,SPEECH AND SIGNAL PROCESSING,2009,ICASSP 2009》, 24 April 2009 (2009-04-24) *
MATHIAS WIEN: "Variable Block-Size Transforms for Hybrid Video Coding", 《VARIABLE BLOCK-SIZE TRANSFORMS FOR HYBRID VIDEO CODING》, 3 February 2004 (2004-02-03) *

Also Published As

Publication number Publication date
DK2866442T3 (da) 2017-11-27
EP2629518B1 (en) 2017-11-15
DK3282696T3 (en) 2019-01-07
NO2866442T3 (zh) 2018-04-14
PL3282696T3 (pl) 2019-02-28
DK2890123T3 (da) 2017-11-27
JP6023260B2 (ja) 2016-11-09
EP2866442A1 (en) 2015-04-29
AU2010283113A1 (en) 2012-01-12
CA2768181C (en) 2015-04-28
CA2877255C (en) 2015-10-06
CA2815777C (en) 2015-04-28
LT2866442T (lt) 2017-12-11
EP2449778A4 (en) 2013-12-25
WO2011019234A3 (en) 2011-06-23
HRP20182055T1 (hr) 2019-02-08
CN104581161B (zh) 2016-06-01
LT3282696T (lt) 2018-12-27
SI2629526T1 (en) 2018-06-29
HUE038258T2 (hu) 2018-10-29
BR122013019724A2 (pt) 2016-05-10
CN102484703A (zh) 2012-05-30
CY1119803T1 (el) 2018-06-27
RU2013113038A (ru) 2014-04-10
CA2768181A1 (en) 2011-02-17
ES2648091T3 (es) 2017-12-28
IN2015MN00401A (zh) 2015-09-04
HUE038255T2 (hu) 2018-10-29
CN102484703B (zh) 2015-02-25
HUE039342T2 (hu) 2018-12-28
US8971650B2 (en) 2015-03-03
US20140286585A1 (en) 2014-09-25
NO2629518T3 (zh) 2018-04-14
US8311348B2 (en) 2012-11-13
BR122013019725A2 (pt) 2016-05-10
MX2012000614A (es) 2012-01-27
JP6023261B2 (ja) 2016-11-09
SI3282696T1 (sl) 2019-01-31
EP3448039B1 (en) 2019-11-13
ES2760475T3 (es) 2020-05-14
CA2815893C (en) 2015-02-03
EP2866442B1 (en) 2017-11-15
PL3448039T3 (pl) 2020-02-28
RU2551794C2 (ru) 2015-05-27
CN104581163A (zh) 2015-04-29
US8971649B2 (en) 2015-03-03
CN103220528A (zh) 2013-07-24
DK2629526T3 (en) 2018-05-22
RU2510945C1 (ru) 2014-04-10
CA2815893A1 (en) 2011-02-17
ZA201201157B (en) 2020-02-26
LT2629526T (lt) 2018-05-25
US20130336390A1 (en) 2013-12-19
EP2890123B1 (en) 2017-11-15
US8792737B2 (en) 2014-07-29
SI2866442T1 (sl) 2017-12-29
CY1121001T1 (el) 2019-12-11
MY153787A (en) 2015-03-13
ES2648089T3 (es) 2017-12-28
CY1120725T1 (el) 2019-12-11
EP3282696A1 (en) 2018-02-14
PL2890123T3 (pl) 2018-01-31
EP2629526B1 (en) 2018-05-02
PT3282696T (pt) 2018-12-17
HRP20171769T1 (hr) 2017-12-29
HUE038282T2 (hu) 2018-10-29
US20130064291A1 (en) 2013-03-14
US20130336391A1 (en) 2013-12-19
JP2013214989A (ja) 2013-10-17
ZA201502023B (en) 2017-08-30
PL2629526T3 (pl) 2018-07-31
ZA201502024B (en) 2015-11-25
MY157499A (en) 2016-06-15
US8515190B2 (en) 2013-08-20
HUE043938T2 (hu) 2019-09-30
NO2629526T3 (zh) 2018-09-29
CY1119836T1 (el) 2018-06-27
PT2629518T (pt) 2017-11-23
CN104581163B (zh) 2017-05-24
PT2629526T (pt) 2018-05-11
JP2015180086A (ja) 2015-10-08
IN2015MN00400A (zh) 2015-09-04
SI2629518T1 (sl) 2017-12-29
US8204320B2 (en) 2012-06-19
JP5579309B2 (ja) 2014-08-27
EP2629526A2 (en) 2013-08-21
SI2890123T1 (sl) 2017-12-29
HRP20171767T1 (hr) 2017-12-29
HUE048402T2 (hu) 2020-08-28
US20140294311A1 (en) 2014-10-02
NO2890123T3 (zh) 2018-04-14
EP3448039A1 (en) 2019-02-27
DK2629518T3 (da) 2017-11-27
ZA201304973B (en) 2013-09-25
CA2815777A1 (en) 2011-02-17
JP5753327B2 (ja) 2015-07-22
LT2890123T (lt) 2017-12-11
RU2014104800A (ru) 2015-04-27
ES2701979T3 (es) 2019-02-26
IN2015MN00402A (zh) 2015-09-04
RU2012104828A (ru) 2013-08-20
ZA201502025B (en) 2015-12-23
LT2629518T (lt) 2017-12-11
DK3448039T3 (da) 2019-11-25
JP5746169B2 (ja) 2015-07-08
HRP20171768T1 (hr) 2017-12-29
RU2514777C1 (ru) 2014-05-10
US20120236938A1 (en) 2012-09-20
US8842921B2 (en) 2014-09-23
US20150156513A1 (en) 2015-06-04
CN103220525A (zh) 2013-07-24
HRP20180692T1 (hr) 2018-06-29
JP2015109686A (ja) 2015-06-11
CY1119838T1 (el) 2018-06-27
BR112012001757A2 (pt) 2016-04-12
PL2629518T3 (pl) 2018-01-31
PT2890123T (pt) 2017-11-23
KR20110017300A (ko) 2011-02-21
CA2877241A1 (en) 2011-02-17
US8792741B2 (en) 2014-07-29
US20120106637A1 (en) 2012-05-03
ES2668472T3 (es) 2018-05-18
KR101474756B1 (ko) 2014-12-19
JP5753328B2 (ja) 2015-07-22
ES2647908T3 (es) 2017-12-27
CN104581161A (zh) 2015-04-29
US9386325B2 (en) 2016-07-05
JP2015109687A (ja) 2015-06-11
JP2013179707A (ja) 2013-09-09
EP2629518A3 (en) 2013-12-18
JP5579310B2 (ja) 2014-08-27
JP2013502138A (ja) 2013-01-17
EP3282696B1 (en) 2018-12-05
EP2449778A2 (en) 2012-05-09
CA2877241C (en) 2016-10-11
JP2015173484A (ja) 2015-10-01
EP2629526A3 (en) 2013-12-18
CN103220528B (zh) 2017-03-01
WO2011019234A2 (en) 2011-02-17
CA2877255A1 (en) 2011-02-17
CN104581162B (zh) 2016-05-04
EP2629518A2 (en) 2013-08-21
MY157501A (en) 2016-06-15
US20130336392A1 (en) 2013-12-19
PT2866442T (pt) 2017-11-23
US8798381B2 (en) 2014-08-05
RU2014104796A (ru) 2015-08-20
US20110038554A1 (en) 2011-02-17
AU2010283113B2 (en) 2014-07-03
PL2866442T3 (pl) 2018-01-31
EP2890123A1 (en) 2015-07-01
RU2543519C2 (ru) 2015-03-10

Similar Documents

Publication Publication Date Title
CN102484703B (zh) 通过使用大型变换单元编码和解码图像的方法和设备
JP6665225B2 (ja) ビデオ復号化方法とその装置、ビデオ符号化方法とその装置
RU2686626C1 (ru) Способ и устройство для энтропийного кодирования/декодирования коэффициента преобразования
CN102640492B (zh) 对图像边界的编码单元进行编码和解码的方法和设备
CN102835111B (zh) 使用先前块的运动矢量作为当前块的运动矢量来对图像进行编码/解码的方法和设备
CN101647281B (zh) 视频编码和解码的方法和设备
CN104735454A (zh) 通过使用大变换单元对图像进行编码和解码的方法和设备
CN102474611A (zh) 通过控制运动矢量的精度对图像编码/解码的方法和设备
KR20200096474A (ko) 계층적 가변 블록 변환이 가능한 부호화 방법 및 장치 그리고 복호화 방법 및 장치
CN104486623A (zh) 用于对视频进行解码的方法和设备
KR20110010324A (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
CN103765893A (zh) 使用用于定点变换的比特深度调整的视频编码方法及其设备,以及视频解码方法及其设备
CN102598663A (zh) 通过使用旋转变换对图像编码和解码的方法和设备
CN105025298A (zh) 对图像进行编码/解码的方法和设备
CN105025301A (zh) 对图像进行编码/解码的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant