CN103404149A - 图像处理装置以及方法 - Google Patents

图像处理装置以及方法 Download PDF

Info

Publication number
CN103404149A
CN103404149A CN2012800117832A CN201280011783A CN103404149A CN 103404149 A CN103404149 A CN 103404149A CN 2012800117832 A CN2012800117832 A CN 2012800117832A CN 201280011783 A CN201280011783 A CN 201280011783A CN 103404149 A CN103404149 A CN 103404149A
Authority
CN
China
Prior art keywords
candidate
adjacent area
information
movable information
parts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012800117832A
Other languages
English (en)
Inventor
佐藤数史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN103404149A publication Critical patent/CN103404149A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

本发明涉及能够提高编码效率的图像处理装置及方法。本发明设置有:确定单元,该确定单元确定周围运动信息可用还是不可用,所述周围运动信息为位于感兴趣的区域的周围的周围区域的运动信息并且用于对感兴趣的区域的运动信息进行编码,所述感兴趣的区域为处理对象;以及编码单元,该编码单元通过使用其他周围区域的可用运动信息来代替被所述确定单元确定为不可用的周围区域的运动信息,以对感兴趣的区域的运动信息进行编码。本发明可以应用于图像处理装置。

Description

图像处理装置以及方法
技术领域
本公开涉及图像处理装置以及图像处理方法,特别地涉及通过其能够提高编码效率的图像处理装置以及图像处理方法。
背景技术
近年来,遵照MPEG(运动图像专家组)方案的装置等在发送信息的广播站和接收信息的普通家庭二者中变得日益广泛,其中,为了有效传输并存储信息,借助于正交变换例如离散余弦变换以及运动补偿同时利用特定于图像信息的冗余,MPEG方案将图像信息作为数字化信息来对待并且压缩所述信息。
MPEG-2(ISO(国际标准组织)/IEC(国际电工委员会)13818-2)特别地被定义为如下通用图像编码方案:其是覆盖隔行扫描图像、逐行扫描图像以及具有标准分辨率和高分辨率的图像的标准。MPEG-2现在被广泛使用于专家和消费者所使用的宽范围应用中。MPEG-2压缩方案的使用例如通过对具有720×480像素的标准分辨率的隔行扫描图像分配4Mbps至8Mbps的代码量(比特率),或对具有1920×1088像素的高分辨率的隔行扫描图像分配18Mbps至22Mbps的代码量,能够实现高压缩比以及令人满意的图像品质。
MPEG-2具有主要适用于广播的针对性高图像品质编码,但其不适用于具有低于MPEG-1的代码量的代码量(比特率)的编码方案,即具有较高压缩比的编码方案。随着移动终端的广泛使用,将来对这样的编码方案的需要预期会增加。作为响应,MPEG-4编码方案被标准化。关于图像编码方案,MPEG-4的标准在1998年12月被批准成为国际标准ISO/IEC14496-2。
另外,被命名为H.26L(ITU-T(国际电信联盟远程通信标准化组织)Q6/16VCEG(视频编码专家组))的标准近年来处于被标准化的过程中,所述标准起初意在用于对电视会议中使用的图像进行编码。与传统的编码方案例如MPEG-2和MPEG-4在编码和解码中需要较大的计算量相比较,已知H.26L能够实现更高的编码效率。作为属于MPEG-4的动作的一部分,进一步地,通过使用H.26L作为基础并且包含在H.26L中不支持的功能实现更高编码效率的标准化目前正处于作为加增压缩视频编码的联合模型的过程中。
所述标准在2003年3月变成被命名为关于标准化进度表的H.264和MPEG-4第10部分(高级视频编码;以下被称为AVC)的国际标准。
然而,关注的是对于在UHD(超高清,4000像素×2000像素)中设置的大图片帧,16像素×16像素的宏块尺寸不是最佳的,所述UHD将是下一代编码方案的目标。
相应地,为了进一步提高通过AVC实现的编码效率,由ITU-T和ISO/IEC形成的联合标准化组JCTVC(视频编码联合合作小组)目前致力于被称为HEVC(高效视频编码)的编码方案的标准化(例如,参见非专利文献1)。
HEVC编码方案定义了与在AVC中使用的宏块相似的编码单元(CU)作为处理单元。与在AVC中使用的宏块不同,CU的尺寸不被固定为16×16像素,而是在每个序列的图像压缩信息中进行指定。
现在,为了改进AVC中的采用中值预测对运动向量进行编码,除了在中值预测中需要并且在AVC中定义的“空间预测”,建议自适应地使用“时间预测”和“时空预测”中的任一个作为预测运动向量信息(以下还被称为MV竞争)(例如参见非专利文献2).
在图像信息编码装置中,当使用针对每个块的相应的预测运动向量信息时,计算成本函数值以选择最佳预测运动向量信息。表示针对每个块哪个预测运动向量信息被使用的标志信息被发送给图像压缩信息。
另外,建议将被称为运动划分融合(以下还被称为融合模式)的方法作为编码模式信息的一个方案(例如参见非专利文献3)。在该方法中,只有当针对当前块的运动信息与针对相邻块的运动信息相同时才发送标志信息,在解码时通过使用针对相邻块的运动信息来重构针对当前块的运动信息。
例如为了并行处理,图像编码方案例如AVC和HEVC提供了如下方法:其中图片被分割成多片使得针对每片来执行处理。除了所述片还建议熵片。
熵片是在熵编码处理和熵解码处理中采用的处理单元。也就是说,在熵编码处理和熵解码处理中,图片被分割成多个熵片使得针对每个熵片来执行处理。在预测处理中,另一方面针对未进行片分割的每个图片来执行处理。
引用文献列表
非专利文献
非专利文献1:Thomas Wiegand,Woo-Jin Han,Benjamin Bross,Jens-Rainer Ohm,Gary J.Sullivan,“Working Draft1of High-EfficiencyVideo Coding”,JCTVC-C403,Joint Collaborative Team on VideoCoding(JCT-VC)of ITU-T SG16WP3and ISO/IECJTC1/SC29/WG113rd Meeting:Guangzhou,CN:2010年10月7日至15日。
非专利文献2:Joel Jung,Guillaume Laroche,“Competition-BasedScheme for Motion Vector Selection and Coding”,VCEG-AC06,ITU-Telecommunications Standardization SectorSTUDY GROUP16Question6Video Coding Experts Group(VCEG)29th Meeting:Klagenfurt,
Austria,2006年7月17日至18日。
非专利文献3:Martin Winken,Sebastian Bosse,Benjamin Bross,Philipp Helle,Tobias Hinz,Heiner Kirchhoffer,HaricharanLakshman,Detlev Marpe,Simon Oudin,Matthias Preiss,HeikoSchwarz,Mischa Siekmann,Karsten Suehring,and ThomasWiegand,“Description of video coding technology proposed byFraunhofer HHI”,JCTVC-A116,2010年4月。
发明内容
本发明待解决的问题
然而,如上所述,当处理待处理的当前区域的运动信息时,MV竞争和融合模式需要参考位于当前区域周围的相邻区域的运动信息。结果,存在如下可能:当图片被分割成多片(包括熵片)以针对每片来执行处理时,相邻区域位于当前区域的片之外并且取决于当前区域的位置而不可用。因此关注的是:当采用MV竞争和融合模式时,候选的数量减少,从而导致编码效率降低。
考虑到这样的情况,提出了本公开。本公开的目的是当在如下图像编码中采用MV竞争和融合模式时能够抑制编码效率的降低:在所述图像编码中,图片被分割成多片使得针对每片来并行执行处理。
问题的解决方案
本公开的一方面提供了一种图像处理装置,其包括:确定单元,该确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,相邻区域的运动信息用于对要处理的当前区域的运动信息进行编码;以及编码单元,该编码单元通过使用另外的相邻区域的可用运动信息来代替被所述确定单元确定为不可用的相邻区域的运动信息,以对当前区域的运动信息进行编码。
确定单元基于包括当前区域的当前片的边界地址和当前区域的地址来确定相邻区域的运动信息是否可用,所述当前片为帧被分割成的多片中的一片。
当相邻区域位于待处理的当前帧的当前片之外时,确定单元确定相邻区域的运动信息不可用。
编码单元包括:候选设置部件,当待成为候选区域以与当前区域融合的相邻区域的运动信息不可用时,该候选设置部件将具有可用运动信息的另外的相邻区域设置为代替相邻区域的候选;以及融合信息生成部件,该融合信息生成部件从候选设置部件设置的候选中确定与当前区域融合的相邻区域并且生成融合信息。
候选设置部件在被确定单元确定为不可用的相邻区域的共同定位区域(co-located region)可用时将所述共同定位区域设置为候选。
候选设置部件将位于待处理的当前帧中的待处理的当前片内的另外的相邻区域设置为候选,所述当前片为帧被分割成的多片中的一片。
当被确定单元确定为不可用的相邻区域位于当前帧之外时,候选设置部件将位于待处理的当前帧参考的参考帧中的相邻区域设置为候选。
编码单元包括:候选设置部件,当待成为当前区域的预测运动向量信息的候选的相邻区域的运动信息不可用时,该候选设置部件将另外的相邻区域的可用运动信息设置为代替所述运动信息的候选;以及预测运动向量生成部件,该预测运动向量生成部件使用候选设置部件设置的候选中的任意候选来生成当前区域的预测运动向量信息。
候选设置部件在被确定单元确定为不可用的相邻区域的共同定位区域可用时将所述共同定位区域设置为候选。
候选设置部件将位于待处理的当前帧中的待处理的当前片内的另外的相邻区域设置为候选,所述当前片为帧被分割成的多片中的一片。
当被确定单元确定为不可用的相邻区域位于当前帧之外时,候选设置部件将位于待处理的当前帧参考的参考帧中的相邻区域设置为候选。
本公开的一方面提供了在图像处理装置中处理图像的方法,其中,确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,相邻区域的运动信息用于对要处理的当前区域的运动信息进行编码,以及编码单元通过使用另外的相邻区域的可用运动信息来代替被确定为不可用的相邻区域的运动信息,以对当前区域的运动信息进行编码。
本公开的另一方面提供了一种图像处理装置,其包括:确定单元,该确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,相邻区域的运动信息用于对要处理的当前区域的运动信息进行解码;以及解码单元,该解码单元通过使用另外的相邻区域的可用运动信息来代替被确定单元确定为不可用的相邻区域的运动信息,以对当前区域的经编码的运动信息进行解码。
确定单元基于包括当前区域的当前片的边界地址和当前区域的地址来确定相邻区域的运动信息是否可用,所述当前片为帧被分割成的多片中的一片。
当相邻区域位于待处理的当前帧的当前片之外时,确定单元确定相邻区域的运动信息不可用。
解码单元包括:候选设置部件,当待成为候选区域以与当前区域融合的相邻区域的运动信息不可用时,该候选设置部件将具有可用运动信息的另外的相邻区域设置为代替相邻区域的候选;以及融合信息解码部件,该融合信息解码部件从候选设置部件设置的候选中确定与当前区域融合的相邻区域并且根据所述确定对融合信息进行解码。
候选设置部件在被确定单元确定为不可用的相邻区域的共同定位区域可用时将所述共同定位区域设置为候选。
候选设置部件将位于待处理的当前帧中的待处理的当前片内的另外的相邻区域设置为候选,所述当前片为帧被分割成的多片中的一片。
当被确定单元确定为不可用的相邻区域位于当前帧之外时,候选设置部件将位于待处理的当前帧参考的参考帧中的相邻区域设置为候选。
解码单元包括:候选设置部件,当待成为当前区域的预测运动向量信息的候选的相邻区域的运动信息不可用时,该候选设置部件将另外的相邻区域的可用运动信息设置为代替所述运动信息的候选;以及预测运动向量重构部件,该预测运动向量重构部件使用由候选设置部件设置的候选中的任意候选来重构当前区域的预测运动向量信息。
候选设置部件在被确定单元确定为不可用的相邻区域的共同定位区域可用时,将所述共同定位区域设置为候选。
候选设置部件将位于待处理的当前帧中的待处理的当前片内的另外的相邻区域设置为候选,所述当前片为帧被分割成的多片中的一片。
当被确定单元确定为不可用的相邻区域位于当前帧之外时,候选设置部件将位于待处理的当前帧参考的参考帧中的相邻区域设置为候选。
本公开的另一方面提供了一种在图像处理装置中处理图像的方法,其中,确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,相邻区域的运动信息用于对要处理的当前区域的运动信息进行解码,以及解码单元通过使用另外的相邻区域的可用运动信息来代替被确定为不可用的相邻区域的运动信息,以对当前区域的运动信息进行解码。
在本公开的一个方面,确定位于当前区域周围的相邻区域的运动信息是否可用,相邻区域的运动信息用于对要处理的当前区域的运动信息进行编码。通过使用另外的相邻区域的可用运动信息来代替被确定为不可用的相邻区域的运动信息,以对当前区域的运动信息进行编码。
在本公开的另一方面,确定位于当前区域周围的相邻区域的运动信息是否可用,相邻区域的运动信息用于对要处理的当前区域的运动信息进行解码。通过使用另外的相邻区域的可用运动信息来代替被确定为不可用的相邻区域的运动信息,以对当前区域的运动信息进行解码。
发明的效果
根据本公开,能够处理图像,并且特别地能够抑制编码效率的降低。
附图说明
图1是示出了图像编码装置的主要配置的示例的框图。
图2是示出了具有分数像素精度的运动预测/补偿处理的示例的图。
图3是示出了宏块的示例的图。
图4是示出了如何执行中值操作的示例的图。
图5是示出了多参考帧的示例的图。
图6是示出了如何执行时间离散模式的示例的图。
图7是示出了如何执行运动向量编码方法的示例的图。
图8是示出了编码单元的配置的示例的图。
图9是示出了如何执行运动划分融合的示例的图。
图10是示出了片分割的示例的图。
图11是示出了片类型的示例的图。
图12是示出了片边界的示例的图。
图13是示出了在片边缘执行的MV竞争的处理的示例的图。
图14是示出了并行处理的示例的图。
图15是示出了在片边缘执行的MV竞争的处理的示例的图。
图16是示出了在图片边缘执行的MV竞争的处理的示例的图。
图17是示出了在片边缘执行的融合模式的处理的示例的图。
图18是示出了运动预测/补偿单元、片边界确定单元以及运动向量编码单元的主要配置的示例的图。
图19是示出了编码处理的流程的示例的流程图。
图20是示出了帧间预测处理的流程的示例的流程图。
图21是示出了图像解码装置的主要配置的示例的框图。
图22是示出了运动预测/补偿单元、片边界确定单元以及运动向量解码单元的主要配置的示例的框图。
图23是示出了解码处理的流程的示例的流程图。
图24是示出了预测处理的流程的示例的流程图。
图25是示出了帧间运动预测处理的流程的示例的流程图。
图26是示出了个人计算机的主要配置的示例的框图。
图27是示出了电视装置的示意性配置的示例的框图。
图28是示出了移动电话的示意性配置的示例的框图。
图29是示出了记录/再现装置的示意性配置的示例的框图。
图30是示出了成像装置的示意性配置的示例的框图。
具体实施方式
用于执行本发明的模式
以下将描述用于执行本公开的模式(以下被称为实施方式)。将以如下顺序来提供描述。
1.第一实施方式(图像编码装置)
2.第二实施方式(图像解码装置)
3.第三实施方式(个人计算机)
4.第四实施方式(电视机)
5.第五实施方式(移动电话)
6.第六实施方式(记录/再现装置)
7.第七实施方式(成像装置)
<1.第一实施方式>
[图像编码装置]
图1是示出了图像编码装置的主要配置的示例的框图。
当采用如在编码方案例如H.264或MPEG(运动图像专家组)4第10部分(AVC(高级视频编码))中执行的预测处理时,在图1中所示的图像编码装置100对图像数据进行编码。
如图1所示,图像编码装置100包括A/D转换单元101、图片重排缓冲器102、计算器103、正交变换单元104、量化单元105、无损编码单元106、存储缓冲器107、反量化单元108、逆正交变换单元109、计算器110、环路滤波器111、帧存储器112、选择单元113、帧内预测单元114、运动预测/补偿单元115、预测图像选择单元116以及速率控制单元117。
图像编码装置100还包括片边界确定单元121和运动向量编码单元122。
A/D转换单元101对输入的图像数据执行A/D转换并且将转换后的图像数据(数字数据)提供给图片重排缓冲器102以将转换后的图像数据存储在该图片重排缓冲器中。图片重排缓冲器102根据GOP(图片组)将在存储的图像中以显示顺序布置的帧重排为用于编码的顺序的帧,随后将具有重排帧顺序的图像提供给计算器103。图片重排缓冲器102还将具有重排帧顺序的图像提供给帧内预测单元114和运动预测/补偿单元115。
计算器103从从图片重排缓冲器102读出的图像中减去经由预测图像选择单元116通过帧间预测单元114或运动预测/补偿单元115提供的预测图像,并且将差信息输出给正交变换单元104。
当图像经历帧间编码时,例如,计算器103从从图片重排缓冲器102读出的图像中减去通过运动预测/补偿单元115提供的预测图像。
正交变化单元104对从计算器103提供的差信息执行正交变换例如离散余弦变换或卡胡南-洛夫(Karhunen-Loeve)变换。应当注意,正交变化方法是任意选择的。正交变换单元104然后将变换系数提供给量化单元105。
量化单元105对从正交变换单元104提供的变换系数进行量化。也就是说,量化单元105基于关于从速率控制单元117提供的代码量的目标值的信息来设置量化参数并执行量化。应当注意,量化方法是任意选择的。量化单元105然后将量化后的变换系数提供给无损编码单元106。
无损编码单元106通过采用任意的编码方案来对量化单元105中量化后的变换系数进行编码。由于系数数据在速率控制单元117的控制下进行量化,代码量与通过速率控制单元117设置的目标值相对应(或接近该目标值)。
另外,无损编码单元106从帧内预测单元114获取代表帧内预测的模式的信息等以及从运动预测/补偿单元115获取代表帧内预测的模式的信息、运动向量信息等。无损编码单元106还获取在环路滤波器111中使用的滤波系数等。
无损编码单元106通过任意的编码方案对各条信息进行编码并且使所述信息成为经编码的数据的报头信息(即复用)。无损编码单元106然后将通过编码获得的经编码的数据提供给存储缓冲器107并且将所述数据存储在存储缓冲器中。
无损编码单元106可以采用例如可变长度编码或算术编码作为编码方案。例如在H.264/AVC方案中指定的CAVLC(基于上下文的自适应变长编码)可以作为可变长度编码被采用。例如CABAC(基于上下文的自适应二进制算术编码)可以作为算术编码被采用。
存储缓冲器107临时容置从无损编码单元106提供的经编码的数据。以预定时序,存储缓冲器107将容置在其中的经编码的数据输出至记录装置(记录介质)或在图中未示出但在以下阶段中布置的传输路径。
在量化单元105中量化后的变换系数也被提供给反量化单元108。反量化单元108通过与量化单元105执行的量化对应的方法来对量化后的变换系数进行反量化。反量化方法可以是任意方法,只要该反量化方法与由量化单元105执行的量化处理对应即可。反量化单元108将获得的变换系数提供给逆正交变换单元109。
逆正交变化单元109通过与正交变换单元104执行的正交变化处理对应的方法,对从反量化单元108提供的变换系数执行逆正交变换。逆正交变化方法可以是任意方法,只要其与正交变换单元104执行的正交变换处理对应即可。经历逆正交变换后的输出(复原的差信息)被提供给计算器110。
计算器110将经由预测图像选择单元116从帧内预测单元114或运动预测/补偿单元115提供的预测图像与从逆正交变换单元109提供的逆正交变换的输出(即复原的差信息)进行相加。计算器110然后获取本地解码后的图像(解码后的图像),该解码后的图像被提供给环路滤波器111或帧存储器112。
环路滤波器111包括去块效应滤波器、自适应性环路滤波器等,并且对从计算器110提供的解码后的图像适当地执行滤波处理。环路滤波器111例如通过对解码后的图像执行去块效应滤波处理来去除在解码后的图像中的块失真。环路滤波器111还通过使用例如维纳滤波器对去块效应滤波处理的输出(已经去除了块失真的解码后的图像)执行环路滤波处理来提高图像品质。
应当注意,环路滤波器111可以适用于对解码后的图像执行任意滤波处理。如果需要,环路滤波器111还可以将信息例如在滤波处理中使用的滤波器系数提供给无损编码单元106以对所述信息进行编码。
环路滤波器111将滤波处理的输出(紧接滤波处理之后的解码后的图像)提供给帧存储器112。应当注意,从计算器110输出的解码后的图像可以提供给帧存储器112而不需要如上所述经过环路滤波器111,即可以省略环路滤波器111的滤波处理。
帧存储器112存储提供给其的解码后的图像并且以预定时序将存储的解码后的图像提供给选择单元113作为参考图像。
选择单元113选择将从帧存储器112提供的参考图像提供至的目的地。例如当执行帧间预测时,选择单元113将从帧存储器112提供的参考图像提供给运动预测/补偿单元115。
帧内预测单元114使用为经由选择单元113从帧存储器112提供的参考图像的待处理的图片中的像素值,并且执行生成具有作为基本处理单元的预测单元(PU)的预测图像的帧内预测(帧内图片预测)。帧内预测单元114以预先准备的多种模式(帧内预测模式)来执行该帧内预测。
帧内预测单元114以所有的候选帧内预测模式来生成预测图像,通过使用从图片重排缓冲器102提供的输入图像来评估针对每个预测图像的成本函数值,以及选择最佳模式。一旦选择了最佳帧内预测模式,帧内预测单元114将以最佳模式生成的预测图像提供给预测图像选择单元116。
另外,如上所述,帧内预测单元114适当地将代表所采用的帧内预测模式的帧内预测模式信息等提供给无损编码单元106,该无损编码单元然后对所述信息进行编码。
运动预测/补偿单元115通过使用从图片重排缓冲器102提供的输入图像以及经由选择单元113从帧存储器112提供的参考图像,借助于作为基本处理单元的PU来执行运动预测(帧间预测),根据所检测到的运动向量执行运动补偿处理,并且生成预测图像(帧间预测图像信息)。运动预测/补偿单元115以预先准备的多种模式(帧内预测模式)来执行该帧内预测。
运动预测/补偿单元115以所有候选帧间预测模式来生成预测图像,评估针对每个预测图像的成本函数值,以及选择最佳模式。一旦选择了最佳帧内预测模式,运动预测/补偿单元115将以最佳模式生成的预测图像提供给预测图像选择单元116。
另外,运动预测/补偿单元115将代表所采用的帧间预测模式的信息以及在对经编码的数据进行解码时以帧间预测模式执行处理所需要的信息提供给无损编码单元106,该无损编码单元然后对所述信息进行编码。
预测图像选择单元116选择如下源:预测图像从该源被提供给计算器103和计算器110。当执行例如帧间编码时,预测图像选择单元116选择运动预测/补偿单元115作为提供预测图像的源,并且将从运动预测/补偿单元115提供的预测图像提供给计算器103和计算器110。
速率控制单元117基于在存储缓冲器107中累积的经编码的数据的代码量,来控制通过量化单元105执行的量化操作的速率以不引起上溢或下溢。
片边界确定单元121确定待处理的当前区域是否位于片边界的附近并且将确定结果提供给运动向量编码单元122。运动向量编码单元122根据当前区域相对于片边界的位置来定义相邻区域。
运动预测/补偿单元115通过使用关于通过运动向量编码单元122定义的相邻区域的信息来执行处理例如MV竞争或融合模式。
[四分之一像素精度的模式预测]
图2是示出了如何执行具有通过AVC编码方案指定的四分之一像素精度的运动预测/补偿处理的示例的图。图2中的每个四边形代表像素。由A表示的四边形代表存储在帧存储器112中的具有整数精度的像素的位置。由b、c和d表示的四边形代表具有二分之一像素精度的位置。由e1、e2和e3表示的四边形代表具有四分之一像素精度的位置。
以下将通过式(1)来定义函数Clip1()。
[式1]
Clipl ( a ) = 0 ; if ( a < 0 ) a ; otherwise max _ pix ; if ( a > max _ pix ) . . . ( 1 )
例如,当输入图像具有8位精度时,在式(1)中的max_pix的值为255。
当使用6抽头FIR滤波器时,生成如在式(2)和式(3)中表达的针对位置b和位置d中的每个位置的像素值。
[式2]
F=A-2–5·A-1+20·A0+20·A1-5·A2+A3...(2)
[式3]
b,d=Clip1((F+16)>>5)...(3)
当沿水平方向和垂直方向应用6抽头FIR滤波器时,生成如在以下的式(4)至式(6)中的表达的针对由c表示的位置的像素值。
[式4]
F=b-2-5·b-1+20·b0+20·b1-5·b2+b3...(4),
或者,
[式5]
F=d-2-5·d-1+20·d0+20·d1-5·d2+d3...(5)
[式6]
c=Clip1((F+512)>>10)...(6)
应当注意,仅在沿水平方向和垂直方向二者执行乘积和操作之后的末端执行一次修剪处理。
通过如在以下的式(7)至式(9)中表达的线性插值来生成针对位置e1至位置e3中的每个位置的值。
[式7]
e1=(A+b+1)>>1...(7)
[式8]
e2=(b+d+1)>>1...(8)
[式9]
e3=(b+c+1)>>1...(9)
[宏块]
MPEG-2通过在帧运动补偿模式中的16×16像素以及在域运动补偿模式的第一域和第二域的每个域中的16×8像素为单位来执行运动预测/补偿处理。
在AVC方案中,另一方面,如图3所示,由16×16像素构成的单个宏块可以被划分成16×16像素、16×8像素、8×16像素或8×8像素,使得每个子宏块具有独立的运动向量信息。如图3所示,划分的8×8像素可以被进一步被分割成8×8像素、8×4像素、4×8像素或4×4像素的子宏块,使得每个子宏块可以具有独立的运动向量信息。
然而,已经关注到,当与在MPEG-2中执行的方式相同的方式执行运动预测/补偿处理时,在AVC图像编码方案中生成了大量的运动向量信息。因此还关注到,对所生成的大量运动向量信息进行编码会引起编码效率的降低。
[针对运动向量的中值预测]
作为解决前述问题的方法,AVC图像编码已经实施了以下方法并且降低了针对运动向量的编码信息量。
在图4中所示的每条直线代表运动补偿块的边界。在图4中,字母E代表待进行编码的当前运动补偿块,而字母A至字母D中的每个字母则代表已经进行编码并且与块E相邻的运动补偿块。
现在,令X=A、B、C、D和E,针对X的运动向量信息为mvx.
首先,通过如在以下式(10)中所表达的中值操作,使用针对运动补偿块A、B和C的运动向量信息来生成针对运动补偿块E的预测运动向量信息pmvE.
[式10]
pmvE=med(mvA,mvB,mvC)...(10)
当针对运动补偿块C的信息因为例如运动补偿块C处于图片帧的边缘而不可用时,针对运动补偿块D的信息代替针对运动补偿块C的信息。
通过使用在以下式(11)中表达的pmvE生成被编码作为在图像压缩信息中的针对运动补偿块E的运动向量信息的数据mvdE.
[式11]
mvdE=mvE–pmvE...(11)
应当注意,针对运动向量信息的水平分量和垂直分量中的每个分量来独立执行实际处理。
[多参考帧]
在AVC中还指定了被称为多参考帧的系统,该系统未在传统的图像编码方案例如MPEG-2和H.263中进行指定。
现在将参照图5来描述在AVC中指定的多参考帧。
如图5所示,当使用p图片时MPEG-2和H.263通过参考存储在帧存储器中的单个参考帧来执行运动预测/补偿处理,而AVC具有存储在存储器中的多个参考帧使得针对每个宏块可以参考不同的存储器。
[直接模式]
当在采用B图片时包含了大量的运动向量信息,AVC设置有被称为直接模式的模式。
运动向量信息不以直接模式存储在图像压缩信息中。图像解码装置根据相邻块的运动向量信息或在参考帧中的共同定位块的运动向量信息来计算当前块的运动向量信息,所述共同定位块位于与待处理的块的位置的相同位置处。
直接模式包括在每帧中可以切换的空间直接模式和时间直接模式。
空间直接模式如在式(12)中所表达的计算针对待处理的运动补偿块E的运动向量信息mvE
mvE=pmvE...(12)
也就是说,将通过中值预测生成的运动向量信息应用于当前块。
现在将参照图6来描述时间直接模式。
在图6中,在参考图片L0中的共同定位块是位于与当前块相同空间地址的块,共同定位块的运动向量信息被表示为mvcol。当前图片与参考图片L0之间沿时间轴的距离被表示为TDB,而参考图片L0与参考图片L1之间沿时间轴的距离被表达为TDD.
在此,通过以下的式(13)和式(14)来计算在当前图片中针对L0的运动向量信息mvL0以及针对L1的运动向量信息mvL1
[式12]
mv L 0 = TD B TD D mv col . . . ( 13 )
[式13]
mv L 1 = TD D - TD B TD D mv col . . . ( 14 )
应当注意,在AVC图像压缩信息中不存在代表沿时间轴的距离的信息TD,由此采用POC(图片顺序统计)以执行在前述的式(12)和(13)中的计算。
另外,可以通过16×16像素的宏块单元或8×8像素的块单元来定义在AVC图像压缩信息中的直接模式。
[预测模式的选择]
在AVC编码方案中选择适当的预测模式以实现更高的编码效率是重要的。
在用于被称为JM(联合模型)的H.264/MPEG-4的参考软件中实施的方法(在http://iphome.hhi.de/suehring/tml/index.htm中公开)是这样的选择方案的示例。
JM可以在以下将描述的针对高复杂度模式和低复杂度模式的两种模式确定方法之间进行选择。两种方法均计算针对每个预测模式的成本函数值并且选择具有最小成本函数值的预测模式作为针对当前子宏块或当前宏块的最佳模式。
通过式(15)表达高复杂度模式的成本函数。
Cost(Mode∈Ω)=D+λ*R...(15)
在此,Ω表示对当前块或宏块进行编码的候选模式的全体的组,D表示当在当前预测模式之下编码时在解码后的图像与输入图像之间的能量差,λ表示根据量化参数给出的拉格朗日未定乘数,以及R表示当在当前模式之下执行时包括正交变换系数的总代码量。
这意味着高复杂度模式下的编码处理需要更多的计算,这是因为在所有候选模式中都需要执行一次临时编码处理以计算参数D和R。
通过式(16)表达了低复杂度模式的成本函数。
Cost(Mode∈Ω)=D+QP2Quant(QP)*HeaderBit...(16)
与高复杂度模式不同,在此D表示预测图像与输入图像之间的能量差。QP2Quant(QP)是根据量化参数QP给出的,而HeaderBit是与属于报头例如运动向量和模式且不包括正交变换系数的信息相关的代码量。
这意味着低复杂度模式需要在每种候选模式下的预测处理而不是解码后的图像,从而不需要编码处理。因此低复杂度模式能够实现具有少于高复杂度模式的计算。
[运动向量竞争]
现在,非专利文献1建议以下方法以改进使用参照图4描述的中值预测的运动向的编码处理。
所述方法使得除了通过中值预测获得并在AVC中定义的“空间预测”之外,将在以下描述的“时间预测”和“时空预测”中的任一个能够被自适应性地使用以作为预测运动向量信息。
也就是说,通过以下式(17)至式(19)定义了每个预测运动向量信息(预测),令“mvcol”为针对对应于当前块的共同定位块(参考图像中的块,该块具有与当前块相同的x-y坐标)的运动向量信息,以及令mvtk(k=0至8)为针对相邻块的运动向量信息。
时间预测
[式14]
mvtm5=median{mvcol,mvt0,...,mvt3}...(17)
[式15]
mvtm9=median{mvcol,mvt0,...,mvt8}...(18)
时空预测:
[式16]
mvspt=median{mvcol,mvcol,mva,mvb,mvc}...(19)
图像编码装置100计算针对在其中使用每个预测向量信息的每个块的成本函数并且选择最佳预测模式向量信息。在每个块中使用的表示使用哪个预测运动向量信息的标志信息被发送给图像压缩信息。
[编码单元]
现在,16像素×16像素的宏块尺寸对于具有UHD(超高清,4000像素×2000像素)的大图片帧不是最佳的,UHD将成为下一代编码方案的目标。
AVC指定了如图3所示的包括宏块和子宏块的分层结构,而例如HEVC(高效视频编码)指定了如图8所示的编码单元(CU)。
CU还被成为编码树块(CTB),CU是图片单元中的图像的部分区域并且与AVC中的宏块起相似的作用。宏块具有16×16像素的固定尺寸,而CU的尺寸是非固定的,因此在每个序列的图像压缩信息中进行指定。
例如,在包括在待输出的经编码的数据中的序列参数组(SPS)中指定了CU的最大尺寸(LCU(最大编码单元))和最小尺寸(SCU(最小编码单元))。
通过在不小于SCU的尺寸的范围内设置split_flag=1,每个LCU可以被进一步分割成更小的CU。在图8所示的示例中,LCU在尺寸上为128×128像素,以及最大分层深度为5。在尺寸上具有2N×2N像素的CU被分割成比当split_flag的值为“1”时的分层低一级的具有在尺寸上为N×N像素的CU。
CU被进一步分割成预测单元(PU),PU是针对帧内预测或帧间预测的待成为处理单元的区域(在图片单元中的图像的部分区域),CU然后被分割成变换单元(TU),TU是针对正交变化待成为处理单元的区域(在图片单元中的图像的部分区域)。HEVC现在可以执行除了具有4×4像素和8×8像素之外的16×16像素和32×32像素的正交变换。
可以考虑,当通过定义CU并且使用作为单位的CU、在AVC中与LCU对应的宏块,编码方案例如上述HEVC执行多种处理。虽然CU具有如图8所示的分层结构,但是通常分层的最上级的LCU的尺寸(例如128×128像素)被设置得大于在AVC中的宏块的尺寸。
[运动划分融合]
如图9所示,已经建议被称为运动划分融合(融合模式)的方法作为用于对运动信息进行编码的方案之一。在该方法中,包括MergeFlag和MergeLeftFlag的两个标志被作为与融合模式相关的融合信息而发送。标志MergeFlag=1表示当前区域X的融合信息与和当前区域上相邻的相邻区域T或者和当前区域左相邻的相邻区域L的运动信息相同。此时,发送包括MergeLeftFlag的融合信息。标志MergeFlag=0表示当前区域X的运动信息不同于相邻区域T以及相邻区域L的运动信息。在这种情况下发送当前区域X的运动信息。
当当前区域X的运动信息与相邻区域L的运动信息相同时,标志MergeFlag=1和MergeLeftFlag=1有效。当当前区域X的运动信息与相邻区域T的运动信息相同时,标志MergeFlag=1和MergeLeftFlag=0成立。
[在AVC中的分片]
图像编码方案例如MPEG-2和AVC可以将单个图片分割成多片并且对每片进行并行处理。
如图10中的情况A所示,MPEG-2采用具有等于一条宏块线的最大尺寸的片并且要求构成B图片的每片为B片。
另一方面,如图10中的情况B所示,AVC采用具有大于一条宏块线的片,片边界不需要处于宏块线的右边缘(图片的右边缘)。另外,可以通过不同类型的片来构成单个图片。
AVC指定了例如如图11所示的片类型。
应当注意,AVC可以执行通过片边界的去块效应滤波处理。然而使用相邻信息的处理例如帧内预测,CABAC、CAVLC或运动向量预测不能通过片边界执行。
换言之,可以彼此独立地执行针对每片的编码处理,从而单个图片可以被分割成多片,使得可以对每片进行并行编码。因此,这样的片分割能够减少执行编码处理所需的时间(或者加速编码处理)。
[片边界]
以AVC中的宏块为单位来划分片。也就是说,片边界为对应于任意宏块边界(相邻宏块之间的边界)的相邻片之间的边界。以另一种方式处置,片包括多个宏块。
在HEVC中,另一方面,可以在LCU内分割片。这意味着不以LCU而以CU为单位来划分片。因此,片边界对应于任意CU边界(相邻的CU之间的边界)。任意设置CU的尺寸。
图12示出了片边界的示例。在图12中所示的最大的四边形代表LCU,在最大的四边形内的四边形代表构成LCU的CU。在图12所示的示例中,在位于LCU中的CU之间划分片。当片边界的控制单元变小时,片边界的形状变得复杂。
本技术适用于当待处理的当前区域与片边界相邻时相邻区域位于另外的片中或不存在的情况,使得运动向量编码单元122选择新的候选(可用候选)来代替不可用的相邻区域以不减少针对MV竞争或融合模式的可用候选的数量。
[在MV竞争中的候选选择控制]
以下将参照图13来描述在MV竞争中执行的针对片边界的候选选择控制。
在图13中的每个四边形代表待成为预测处理的单位的区域(例如CU或子宏块)。
图13的右侧示出了待处理的当前帧的区域的示例。通过MVcurr表示的四边形代表待处理的当前区域,而MVcurr代表针对当前区域的运动向量。通过MVa表示的四边形代表与当前区域左相邻的相邻区域A,而MVa代表针对相邻区域A的运动向量。
通过MVb表示的四边形代表与当前区域上相邻的相邻区域B,而MVb代表针对相邻区域B的运动向量。通过MVc表示的四边形代表与当前区域右上相邻的相邻区域C,而MVc代表针对相邻区域C的运动向量。
另外,图13的左侧示出了当前帧参考的参考帧的区域的示例。通过MVcol表示的四边形代表位于与当前区域相同位置处的共同定位区域(即针对当前区域的时间相邻区域col),而MVcol代表针对共同定位区域的运动向量。通过MVcola表示的四边形代表位于与相邻区域A相同位置的共同定位区域,而MVcola代表针对共同定位区域的运动向量。
通过MVcolb表示的四边形代表位于与相邻区域B相同位置的共同定位区域,而MVcolb代表针对共同定位区域的运动向量。通过MVcolc表示的四边形代表位于与相邻区域C相同位置的共同定位区域,而MVcolc代表针对共同定位区域的运动向量。
当当前区域未与片边界接触时,MVa、MVb、MVc以及MVcol是针对当前区域的预测运动向量信息的候选。
当相邻区域A至C如图13中的示例所示位于当前片(包括待处理的当前区域的待处理的片)之外时,然而,针对相邻区域的运动向量(MVa、MVb和MVc)变得不可用并且被从针对预测运动向量信息的候选中排除掉。结果候选的数量减少,从而引起对预测运动向量信息进行预测的精度下降并可能降低当前区域的运动信息的编码效率。
尽管图13示出了所有相邻区域A至C都位于当前片之外的示例(MVa、MVb和MVc都不可用),可以存在如下情况:取决于片边界存在的方式MVa、MVb和MVc中的一部分不可用。
例如,可以考虑如下情况:仅相邻区域A位于当前片之外(仅MVa不可用);仅相邻区域B位于当前片之外(仅MVb不可用);仅相邻区域C位于当前片之外(仅MVc不可用);相邻区域A和B位于当前片之外(MVa和MVb均不可用);相邻区域A和C位于当前片之外(MVa和MVc均不可用);以及相邻区域B和C位于当前片之外(MVb和MVc均不可用)。
任一种情况会导致针对预测运动向量信息的候选的数量的下降,从而引起对预测运动向量信息进行预测的精度下降并且可能降低针对当前区域的运动信息的编码效率。
现在,运动向量编码单元122选择另外的相邻区域的可用运动信息作为预测运动向量信息的候选来代替作为预测运动向量信息的候选的相邻区域的不可用运动信息。
运动向量编码单元选择例如针对区域的共同定位区域的运动信息作为代替所述区域的不可用运动信息的候选。通常,在参考帧中的每个区域在当前帧被处理时已经被处理。这意味着在参考帧中的每个区域的运动信息可用。运动向量编码单元122相应地选择共同定位区域的运动信息作为替代候选,该运动信息具有与不可用运动信息的高相关性,以尽可能不降低预测精度。
当MVa因为例如相邻区域A位于当前片之外而不可用时,运动向量编码单元122选择可用的并且是针对对应于相邻区域A的共同定位区域而设置的MVcola作为预测运动向量信息的候选来代替MVa
当MVb因为例如相邻区域B位于当前片之外而不可用时,运动向量编码单元122选择可用的并且是针对对应于相邻区域B的共同定位区域而设置的MVcolb作为预测运动向量信息的候选来代替MVb
当MVc因为例如相邻区域C位于当前片之外而不可用时,运动向量编码单元122选择可用的并且是针对对应于相邻区域C的共同定位区域而设置的MVcolc作为预测运动向量信息的候选来代替MVc
结果,运动编码单元122能够执行MV竞争而不需要减少针对预测运动向量信息的候选的数量。因此,图像编码装置100能够抑制在片边界处的编码效率的下降。
应当注意,如图14所示,即使在通过不同处理器处理多片中的每片的情况下使用多个处理器时,已经处理的每片中的数据被存储在共享存储器(彼此相同的存储空间)中,因此能够被处理器中的任意处理器参考。相应地,如上所述,在参考帧中的运动信息也可以被毫无问题地在这种情况下使用。
关注的是,例如以更大的难度执行片之间的并行处理,会引起当编码装置等待待获得的候选运动信息而不代替候选时的不必要的延迟以及处理时间的增加。另外,如图14的示例所示,通过不同的处理器处理每片,通过已经被处理并且位于当前帧的当前片之外的相邻区域的运动信息来代替所述运动信息,代替后的运动信息可能仍然存储在每个处理器独享的存储空间,从而使得另外的处理器难以参考所述运动信息。
如上所述,图像编码装置100通过使用不同于当前帧的参考帧(在处理当前帧之前处理的帧)的运动信息来抑制不被关注的在片边界处的编码效率的降低。
应当注意,在前述的描述中,设置以代替不可用运动信息的运动信息可以从除了与相邻区域对应的共同定位区域之外的区域来选择。当然期望的是替代运动信息具有与原运动信息的较高相关性。然而,运动信息可以成为替代候选,只要其至少可用。例如可以使用除了参考帧中的共同定位区域之外的区域的运动信息。可替代地,还可以使用除了参考帧和当前帧之外的已经被处理的帧的运动信息。
可以使用在当前帧中的已经被处理的运动信息。另外,可以使用在当前片内的已经被处理的运动信息以避免当使用多个处理器时前述关注的出现。
如图15中的示例所示,可以使用在当前片内的相邻区域中的已经被处理并且可用的MVd来代替不可用的MVb
应当注意,具有待成为预测运动向量信息的候选的运动信息的区域(相邻区域)不需要与当前区域(时间上或空间上)相邻。例如,与相邻区域A左相邻的区域(未示出)可以为所述相邻区域(也就是说,该区域的运动信息可以为针对预测运动向量信息的候选)。然而通常存在如下情况:所述区域距当前区域越远,其与当前区域的运动信息的相关性越低。因此期望的是,距当前区域较近的区域的运动信息成为针对预测运动向量信息的候选。
前述片边界包括图片帧。这意味着当当前区域位于图片(帧)的上端或左端时,待成为预测运动向量信息的候选的相邻区域的运动信息可能不可用。在这种情况下,可用的运动信息也可以成为替代候选。
然而,当相邻区域不存在于当前帧中时,如图16所示,在片边界与图片帧对应的情况下,也不存在与相邻区域对应的共同定位区域。在图16所示的示例中,相邻区域A至C均位于图片帧之外并且不存在于当前帧中。在这种情况下,与相邻区域对应的共同定位区域也位于图片帧之外并且不存在于参考帧中。也就是说,MVa、MVb和MVc均不可用,与此同时MVcola、MVcolb和MVcolc也均不可用。
在这种情况下,例如,在参考帧中的可用运动信息例如MVcold、MVcole和MVcolf可以被使用作为替代候选。当然也可以使用除了参考帧之外的帧中的可用运动信息。尽管关于使用哪个可用运动信息是任意的,但是期望的是如上所述使用距当前区域较近的区域的运动信息。
[融合模式的候选选择控制]
替代候选的这种方法还可以应用于在融合模式下选择待与当前区域融合的候选区域。
在融合模式中,如图17所示,与当前区域左相邻的相邻区域L和与当前区域上相邻的区域T是待与当前区域融合的候选区域(以下还被称为融合候选)。在图17中的每个四边形代表待成为预测处理的单位的区域(例如CU或子宏块)。
图17的右侧示出了待处理的当前帧的区域的示例。通过MVcurr表示的四边形代表待处理的当前区域而MVcurr代表针对当前区域的运动向量。通过MVL表示的四边形代表与当前区域左相邻的相邻区域L,而MVL代表针对相邻区域L的运动向量。
通过MVT表示的四边形代表与当前区域上相邻的相邻区域T,而MVT代表针对相邻区域T的运动向量。
另外,图17的左侧示出了当前帧参考的参考帧的区域的示例。通过MVcol表示的四边形代表位于与当前区域相同位置的共同定位区域(也就是说,针对当前区域的时间相邻区域col),而MVcol代表针对共同定位区域的运动向量。通过MVcolL表示的四边形代表位于与相邻区域L相同位置的共同定位区域,而MVcolL代表针对共同定位区域的运动向量。
通过MVcolT表示的四边形代表位于与相邻区域T相同位置的共同定位区域,而MVcolT代表针对共同定位区域的运动向量。
融合模式与前述MV竞争的相似之处在于:如图17的示例所示,当相邻区域L和T位于当前片(包括待处理的当前区域的待处理的片)之外时,针对相邻区域的运动向量(MVL和MVT)变得不可用并且被从融合候选中排除掉。结果融合候选的数量减少,从而使得融合模式不太可能被选择并且可能降低针对当前区域的运动信息的编码效率。
尽管图17示出了相邻区域L和T均位于当前片之外(MVL和MVT均不可用)的情况,但是可以存在如下情况:MVL和MVT中的任一个取决于片边界存在的方式而变得不可用。这种情况也会导致融合候选的数量减少,从而使得融合模式不太可能被选择并且可能降低针对当前区域的运动信息的编码效率。
现在,与前述MV竞争的情况相同,运动向量编码单元122选择可用的另外的相邻区域作为融合候选并且使用所述区域的运动信息来代替为融合候选的相邻区域的不可用运动信息。
运动向量编码单元例如选择对应于所述区域的共同定位区域的运动信息作为候选来代替所述区域的不可用运动信息,所述共同定位区域的运动信息与所述区域的运动信息具有高相关性。
当MVL例如因为相邻区域L位于当前片之外而不可用时,运动向量编码单元122选择如下MVcolL:其可用并且被设置针对与相邻区域L对应的共同定位区域作为针对预测运动向量信息的候选以代替MVL
当MVT例如因为相邻区域T位于当前片之外而不可用时,运动向量编码单元122选择如下MVcolT:其可用并且被设置针对与相邻区域T对应的共同定位区域作为针对预测运动向量信息的候选以代替MVT
结果,运动向量编码单元122可以确定是否选择融合模式而不需要减少融合候选的数量。因此图像编码装置100能够抑制在片边界处的编码效率的降低。
与前述MV竞争的情况相同,融合模式可以选择与具有不可用运动信息的区域对应的共同定位区域作为替代融合候选。这意味着所述区域可以成为替代融合候选,只要所述区域至少具有可用运动信息即可。
[运动预测/补偿单元、片边界确定单元以及运动向量编码单元]
图18是示出了运动预测/补偿单元115、片边界确定单元121以及运动向量编码单元122的主要配置的示例的框图。
如图18所示,运动预测/补偿单元115包括运动搜索部件131、成本函数计算部件132、模式确定部件133、运动补偿部件134以及运动信息缓冲器135。
运动向量编码单元122包括融合候选设置部件141、融合信息生成部件142、候选预测设置部件143、预测运动向量生成部件144以及差运动向量生成部件145。
来自图片重排缓冲器102的输入图像像素值和来自帧存储器112的参考图像像素值被输入至运动搜索部件131。运动搜索部件131然后对所有帧间预测模式执行运动搜索处理以生成包括运动向量和参考索引的运动信息。运动搜索部件131随后将运动信息提供给在运动向量编码单元122中的融合信息生成部件142和预测运动向量生成部件144。
无损编码单元106向片边界确定单元121提供:包括在信息例如序列参数组、图片参数组以及片报头中的片边界区域地址和当前区域地址,所述片边界区域地址通过待成为处理单元的区域(例如CU或子宏块)的地址(识别信息)表示片边界的位置,所述当前区域地址表示待处理的当前区域的位置。
基于这些信息以及当前区域与片边界之间的关系,片边界确定单元121确定是否存在具有待成为当前区域的运动预测向量信息的候选的运动信息的区域或者在当前片内待成为融合候选的区域(或者所述运动信息是否可用)。片边界确定单元121然后将确定结果(片边界确定结果)提供给在运动向量编码单元122中的融合候选设置部件141和候选预测设置部件143。
一旦获取来自片边界确定单元121的片边界确定结果,在运动向量编码单元122中的融合候选设置部件141根据片边界确定结果来确定待成为融合候选的相邻区域。融合候选设置部件141确定能够从运动信息缓冲器135获取待成为可用运动信息的相邻运动信息的相邻区域。例如,当片边界确定结果已经确定在融合候选中存在具有不可用信息的区域,则融合候选设置部件141确定能够从运动信息缓冲器135获取相邻运动信息的相邻区域作为融合候选以代替具有不可用运动信息的区域。一旦确定了融合候选,融合候选设置部件141向融合信息生成部件142提供:包括指定被确定待成为候选的相邻区域的信息的候选信息以及相邻区域的运动信息(相邻运动信息)。
融合信息生成部件142从融合搜索部件131获取当前区域的运动信息,并且将所述运动信息与包括在从融合候选设置部件141提供的候选信息中的相邻运动信息进行比较,确定是否将相邻区域与当前区域进行融合,并且进一步确定当确定将相邻区域与当前区域进行融合时哪个候选被融合。融合信息生成部件142适当地生成表示确定结果的MergeFlag和MergeLeftFlag以及包括这些标志信息的融合信息。融合信息生成部件142然后将所生成的融合信息提供给成本函数计算部件132。在由于当前区域的运动信息与相邻运动信息不匹配而未选择融合模式的情况下,融合信息生成部件142将控制信号提供给预测运动向量生成部件144,所述信号指示预测运动向量生成部件144以生成预测运动向量。
当未选择融合模式时,候选预测设置部件143从片边界确定单元121获取片边界确定结果并且根据所述片边界确定结果来确定待成为预测运动向量信息候选的运动信息。候选预测设置部件143确定能够从运动信息缓冲器135获取待成为可用运动信息的相邻运动信息的相邻区域。例如,当片边界确定结果已经确定在预测运动向量信息的候选中存在具有不可用运动信息的区域时,则候选预测设置部件143确定能够被从运动信息缓冲器135中获取待成为替代候选的相邻运动信息。一旦已经确定了候选,候选预测设置部件143将包括确定待成为候选的相邻运动信息的候选信息提供给预测运动向量生成部件144。
预测运动向量生成部件144根据从融合信息生成部件142提供的控制信号,从运动搜索部件131获取在每个帧间预测模式下的当前区域的运动信息,并且从候选预测设置部件143获取候选信息。预测运动向量生成部件144使用这些信息以生成待成为候选的多条预测运动向量信息。通过任意方法生成预测运动向量信息,所述方法可以为例如在非专利文献2中描述的方法。
随后,预测运动向量生成部件144向差运动向量生成部件145提供:当前区域的运动信息、每个所生成的待成为候选的预测运动向量信息以及分配给每个预测运动向量信息的代码号。
差运动向量生成部件145从所提供的针对每个帧间预测模式的预测运动向量信息来选择最佳候选,并生成包括运动信息与预测运动向量信息之间的差值的差运动向量信息。差运动向量生成部件145向在运动预测/补偿单元115中的成本函数计算部件132提供:在每个帧间预测模式下所生成的差运动向量信息、针对每个帧间预测模式所选择的预测运动向量信息以及分配给预测运动向量信息的代码量。
运动搜索部件131还使用所搜索的运动向量信息以对参考图像执行补偿处理并且生成预测图像。此外,运动搜索部件131计算预测图像与输入图像之间的差(差像素值)并且将该差像素值提供给成本函数计算部件132。
成本函数计算部件132使用从运动搜索部件131提供的针对每个帧间预测模式的差像素值以计算在每个帧间预测模式下的成本函数值。成本函数计算部件132然后将针对每个帧间预测模式所计算的成本函数值以及融合信息提供给模式确定部件133。如果需要,成本函数计算部件132还向模式确定部件133提供:针对每个帧间预测模式的差运动信息、针对每个帧间预测模式的预测运动向量信息以及分配给预测运动向量信息的代码号。
模式确定部件133通过使用针对每个帧间预测模式的成本函数值来确定哪个帧间预测模式对于使用是最佳的并且确定具有最小成本函数值待成为最佳预测模式的帧间预测模式。模式确定部件133然后向运动补偿部件134提供:为关于最佳预测模式的信息的最佳预测模式信息以及融合信息。如果需要,模式确定部件133还向运动补偿部件134提供:差运动信息,预测运动向量信息以及在已经被选择作为最佳预测模式的帧间预测模式中分配给预测运动向量信息的代码号。
运动补偿部件134通过使用所提供的信息来获得在最佳预测模式下的运动向量。当选择例如融合模式时,运动补偿部件134从运动信息缓冲器135获取通过融合信息指定的相邻区域的运动信息,并且确定待成为在最佳预测模式下的运动向量的运动向量。当未选择融合模式时,运动补偿部件134使用从模式确定部件133提供的差运动信息以及预测运动向量信息以生成在最佳预测模式下的运动向量。运动补偿部件134通过使用所述运动向量并且对来自帧存储器112的参考图像执行补偿以生成在最佳预测模式下的预测图像。
当选择帧间预测时,预测图像选择单元116提供表示通过预测图像选择单元116选择的帧间预测的信号。作为响应,运动补偿部件134将最佳预测模式信息和融合信息提供给无损编码单元106。如果需要,运动补偿部件134还向无损编码单元106提供:差运动向量信息以及在最佳预测模式下的预测模式向量信息的代码号。
运动补偿部件134还将最佳预测模式下的运动信息存储在运动信息缓冲器135中。应当注意,当通过预测图像选择单元116未选择帧间预测(意味着未选择帧内预测图像)时,作为运动向量信息的0向量被存储在运动信息缓冲器135中。
运动信息缓冲器135对在最佳预测模式下过去处理的区域的运动信息进行存储。所存储的运动信息被提供给每个部件,以作为对在时间上在与所存储的运动信息对应的区域之后进行处理的区域执行的处理中的相邻运动信息。
如上所述,运动向量编码单元122基于来自片边界确定单元121的片边界确定结果来确定预测运动向量信息的候选和融合候选。因此,运动向量编码单元122能够抑制在MV竞争和融合模式下的候选的数量的减少。结果图像编码装置100能够提高编码效率。
[编码处理流程]
现在将描述通过前述图像编码装置100执行的每个处理流程。首先,将参照图19所示的流程图来描述编码处理的流程的示例。
在步骤S101中,A/D转换单元101对输入图像执行A/D转换。在步骤S102中,图片重排缓冲器102存储经A/D转换的图像并且将每个图片的顺序从显示顺序重排成编码顺序。
在步骤S103中,帧内预测单元114执行在帧内预测模式下的帧内预测处理。在步骤S104中,运动预测/补偿单元115执行如下帧间模式预测处理:其执行在帧间预测模式下的运动预测或运动补偿。
在步骤S105中,预测图像选择单元116基于从帧内预测单元114和运动预测/补偿单元115输出的每个成本函数值来确定最佳模式。也就是说,预测图像选择单元116选择通过帧内预测单元114生成的预测图像或通过运动预测/补偿单元115生成的预测图像中的任一个。
在步骤S106中,计算器103计算在步骤S102中执行的处理中重排后的图像与在步骤S105中执行的处理中所选择的预测图像之间的差。差数据与原图像数据相比较数据量降低了。因此,与图像被编码时的数据量相比较,数据量被压缩了。
在步骤S107中,正交变换单元104对在步骤S106中通过执行处理生成的差信息执行正交变换。具体地,执行正交变换例如离散余弦变换或卡胡南-洛夫变换使得输出变换系数。
在步骤S108中,量化单元105对在步骤S107中执行处理获得的正交变换系数进行量化。
通过在步骤S108中执行处理量化后的差信息被如下本地解码。也就是说,在步骤S109中,反量化单元108通过与量化单元105的特性对应的特性对如下正交变换系数(还被称为量化系数)进行反量化:其是通过在步骤S108中执行的处理被量化并生成的。在步骤S110中,逆正交变换单元109通过与正交变换单元104的特性对应的特性对在步骤S107中执行处理获得的正交变换系数来执行逆正交变换。
在步骤S111中,计算器110通过将预测图像与本地解码的差信息相加来生成本地解码的图像(与至计算器103的输入对应的图像)。在步骤S112中,环路滤波器111适当地对在步骤S111中通过执行处理获得的本地解码后的图像执行包括去块效应滤波处理和自适应性环路滤波处理的环路滤波处理。
在步骤S113中,帧存储器112对在步骤S112中通过执行的处理对其已经进行了环路滤波处理的解码后的图像进行存储。帧存储器112还对未通过环路滤波器111对其进行滤波处理的图像进行存储,所述图像从计算器110提供。
在步骤S114中,无损编码单元106对在步骤S108中通过执行的处理量化后的变换系数进行编码。也就是说,对差图像执行无损编码例如可变长度编码或算术编码。
无损编码单元106对在步骤S108中计算出的量化参数进行编码并且将所述量化参数与经编码的数据进行相加。无损编码单元106还对在步骤S105中执行处理选择的预测图像的预测模式的信息进行编码,并且将所述信息与通过对差图像进行编码获得的经编码的数据进行相加。无损编码单元106还对从预测单元114提供的最佳帧内预测模式信息或与从运动预测/补偿单元115提供的最佳帧间预测模式对应的信息进行编码,并且将所述信息与经编码的数据进行相加。
在步骤S115中,存储缓冲器107对在步骤S114中执行处理获得的经编码的数据进行累积。从存储缓冲器107中适当地读出累积的经编码的数据并且将所述数据经由传输路径和记录介质发送至解码侧。
在步骤S116中,速率控制单元117基于在步骤S115中执行处理的在存储缓冲器107中累积的经编码的数据的代码量(生成的代码量)来控制通过量化单元105的量化操作的速率,以不引起上溢或下溢。
在完成在步骤S116中执行的处理之后就完成了编码处理。
[帧间运动预测处理流程]
现在,将参照图20所示的流程图描述在图19的步骤S104中执行的帧间运动预测处理的流程的示例。
一旦开始了帧间运动预测处理,在步骤S131中,运动搜索部件131执行在每个帧间预测模式下的运动搜索以生成运动信息和差像素值。
在步骤S132中,片边界确定单元121从无损编码单元106获取地址信息例如片边界区域地址以及当前区域地址。
在步骤S133中,片边界确定单元121基于在步骤S132中获取的各种地址信息来确定当前区域是否与片边界接触以及预测运动向量信息的每个候选或每个融合候选的运动信息是否可用。
在步骤S134中,融合候选设置部件141根据在步骤S133中获得的片边界确定结果来设置融合候选。例如,当在融合候选中存在具有不可用运动信息的区域时,融合候选设置部件141将替代区域设置为融合候选。
在步骤S135中,融合信息生成部件142确定是否选择融合模式,在步骤S134中设置的融合候选中选择待融合的区域,并且生成融合信息。
当在步骤S136中确定未选择融合模式时,融合信息生成部件142进行至步骤S137。
在步骤S137中,候选预测设置部件143根据在步骤S133中获得的片边界确定结果来设置预测运动向量信息的候选(候选预测)。例如,当在候选中存在不可用的运动信息时,候选预测设置部件143将替代运动信息设置作为预测运动向量信息的候选。
在步骤S138中,预测运动向量生成部件144使用在步骤S137中设置的预测运动向量信息的候选以生成所有候选预测运动向量信息。
在步骤S139中,差运动向量生成部件145确定针对每个预测模式的最佳预测运动向量信息,并且生成预测运动向量信息与当前区域的运动信息之间的差运动向量。差运动向量生成部件145在执行在步骤S139中的处理之后进行至在步骤S140中的处理。
另一方面,当在步骤S136中确定已经选择了融合模式,融合信息生成部件142进行至在步骤S140中的处理。
在步骤S140中,成本函数计算部件132计算针对每个帧间预测模式的成本函数值。
在步骤S141中,模式确定部件133使用在步骤S140中计算出的成本函数值以确定被确定为最佳的帧间预测模式的最佳帧间预测模式(还被称为最佳预测模式)。
在步骤S142中,运动补偿部件134在最佳帧间预测模式下执行运动补偿。在步骤S143中,运动补偿部件134将在步骤S142中通过执行运动补偿获得的预测图像经由预测图像选择单元116提供给计算器103和计算器110,并且生成差图像信息和解码后的图像。在步骤S144中,运动补偿部件134将关于最佳帧间预测模式的信息提供给无损编码单元106,该无损编码单元106然后对所述信息进行编码。关于最佳帧间预测模式的信息包括最佳预测模式信息、融合信息、差运动信息、针对预测运动向量信息的代码号等。
在步骤S145中,运动信息缓冲器135存储所选择的最佳帧间预测模式的运动信息。运动信息缓冲器135一旦存储了所述运动信息,则结束帧间运动预测处理。
如上所述,运动向量编码单元122能够通过执行每个处理来抑制在MV竞争和融合模式下的候选的数量的减少。结果图像编码装置100也能够提高编码效率。
<2.第二实施方式>
[图像解码装置]
现在将描述对以前述方式经编码的数据进行解码的处理。图21是示出了与图1所示的图像编码装置100对应的图像解码装置的主要配置的示例的框图。
在图21中所示的图像解码装置200通过对应于编码方法的解码方法对通过图像编码装置100生成的经编码的数据进行解码。应当注意,与图像编码装置100相同,图像解码装置200适用于以预测单元(PU)为单位来执行帧间预测。
如图21所示,图像解码装置200包括存储缓冲器201、无损解码单元202、反量化单元203、逆正交变换单元204、计算器205、环路滤波器206、图片重排缓冲器207、D/A转换单元208、帧存储器209、选择单元210、帧内预测单元211、运动预测/补偿单元212以及选择单元213。
图像解码装置200还包括片边界确定单元221和运动向量解码单元222。
存储缓冲器201存储被发送的经编码的数据并且以预定时序将经编码的数据提供给无损解码单元202。无损解码单元202通过与由无损编码单元106采用的编码方案对应的解码方案,对在经图1所示的无损编码单元106编码并且从存储缓冲器201提供的信息进行解码。无损解码单元202将通过解码获得的差图像的量化系数数据提供给反量化单元203。
无损解码单元202还确定选择帧内预测模式还是帧间预测模式作为最佳预测模式,并且将关于最佳预测模式的信息提供给帧内预测单元211或与所选择的且无损解码单元确定的模式对应的运动预测/补偿单元212中的任一个。例如,当图像编码装置100确定帧间预测模式作为最佳预测模式时,关于最佳预测模式的信息被提供给运动预测/补偿单元212。
反量化单元203通过与图1所示的量化单元105采用的量化方案对应的方案,对通过无损解码单元202解码后的量化系数数据进行反量化,并且将所获得的系数数据提供给逆正交变换单元204。
逆正交变换单元204通过与图1所示的正交变换单元104采用的正交变换方案对应的方案,对从反量化单元203提供的系数数据进行逆正交变换。作为逆正交变化换处理的结果,逆正交变换单元204获得与在经历图像编码装置100的正交变换之前的残留数据对应的解码后的残留数据。
经历逆正交变换的解码后的残留数据被提供给计算器205。来自帧内预测单元211或运动预测/补偿单元212的预测图像也经由选择单元213提供给计算器205。
计算器205将解码后的残留数据与预测图像相加并且获得与在被图像编码装置100中的计算器103从预测图像中减掉其之前的图像数据对应的解码后的图像数据。计算器205然后将解码后的图像数据提供给环路滤波器206。
环路滤波器206适当地对所提供的解码后的图像执行包括去块效应滤波处理和自适应性环路滤波处理的环路滤波处理并且将输出提供给图片重排缓冲器207。
包括去块效应滤波器和自适应性环路滤波器的环路滤波器206适当地对从计算器205提供的解码后的图像进行滤波处理。例如,环路滤波器206通过对解码后的图像执行去块效应滤波处理来去除在解码后的图像中的块失真。环路滤波器206还通过使用例如维纳滤波器对去块效应滤波处理的输出(从其去除了块失真的解码后的图像)执行环路滤波处理来改进图像品质。
应当注意,环路滤波器206可以适用于对解码后的图像执行任意的滤波处理。环路滤波器206还可以通过使用从图1所示的图像编码装置100提供的滤波系数来执行滤波处理。
环路滤波206将滤波处理的输出(紧接滤波处理之后的解码后的图像)提供给图片重排缓冲器207和帧存储器209。可以将从计算器205输出的解码后的图像提供给图片重排缓冲器207和帧存储器209而不需要经过环路滤波器206,这意味着可以省略通过环路滤波器206的滤波处理。
图片重排缓冲器207对图像进行重排。也就是说,通过图1所示的图片重排缓冲器102重排成编码顺序的帧顺序现在被重排回原显示顺序。D/A转换单元208对从图片重排缓冲器207提供的图像执行D/A转换并且将转换后的结果输出至在其上显示提供的图像的显示器(未示出)。
帧存储器209以预定时序或基于来自外部例如帧内预测单元211或运动预测/补偿单元212的请求来存储所提供的解码后的图像并且将所存储的解码后的图像提供给选择单元210作为参考图像。
选择单元210选择从帧存储器209提供的参考图像被提供至的目的地。当对经帧内编码的图像进行解码时,选择单元210将从帧存储器209提供的帧图像提供给帧内预测单元211。另一方面,当对经帧间编码的图像进行解码时,选择单元210将从帧存储器209提供的参考图像提供给运动预测/补偿单元212。
无损解码单元202适当地将代表通过对报头信息进行解码获得的帧内预测模式的信息提供给帧内预测单元211。帧内预测单元211通过使用从帧存储器209获取的参考图像执行帧内预测并且在图1所示的帧内预测单元114中使用的帧内预测模式下生成预测图像。帧内预测单元211随后将所生成的预测图像提供给选择单元213。
运动预测/补偿单元212从无损解码单元202获取通过对报头信息进行解码获得的信息(例如最佳预测模式信息、差信息以及针对预测模式向量信息的代码号)。
运动预测/补偿单元212通过使用从帧存储器209获取的参考图像执行帧间预测并且生成在图1所示的运动预测/补偿单元115中使用的帧间预测模式下的预测图像。
片边界确定单元221执行与片边界确定单元121基本上相同的处理,确定当前区域是否与片边界接触以及预测运动向量信息的候选或融合候选的运动信息是否不可用。片边界确定单元121将片边界确定结果提供给运动向量解码单元222。
运动向量解码单元222基于从片边界确定单元221提供的片边界确定结果来设置融合候选或预测运动向量信息的候选。运动向量解码单元222然后使用所述候选以对融合信息进行解码。也就是说,运动向量解码单元222当编码时确定在当前区域中执行的预测中是否选择了融合模式,以及当未选择融合模式时确定哪个向量区域已经被融合。
然后,运动向量解码单元222根据确定结果将相邻区域与当前区域进行融合,并且将指定相邻区域的信息提供给运动预测/补偿单元212。运动预测/补偿单元212使用指定的相邻区域的运动信息以重构当前区域的运动信息。
当确定未选择融合模式时,运动向量解码单元222使用预测运动向量信息的已被设置的候选来重构预测运动向量信息。换言之,通过图像编码装置100生成的预测运动向量信息可能是通过替代候选生成的。因此,运动向量解码单元222需要知道候选是否已经被代替,当代替发生后,运动向量解码单元222需要知道使用了哪个相邻区域的运动信息以对从图像编码装置100发送的代码号进行正确解码。
相应地,运动向量解码单元222根据片边界确定结果再现预测运动向量信息的候选的替代,使用再现的结果,并且根据所述代码号重构预测运动向量信息。
运动向量解码单元222能够以如下方式对从图像编码装置100提供的信息进行正确解码并且能够正确重构当前区域的运动向量信息:如上所述,通过基于来自片边界确定单元221的片边界确定结果来设置融合候选或预测运动向量信息的候选,通过使用所述候选进行融合,以及重构预测运动向量信息。
结果,图像解码装置200能够对通过图像编码装置100编码的数据进行正确解码并且提高编码效率。
[运动预测/补偿单元、片区域确定单元以及运动向量解码单元]
图22是是出了运动预测/补偿单元212、片边界确定单元221以及运动向量解码单元222的主要配置的示例的框图。
如图22所示,运动预测/补偿单元212包括差运动信息缓冲器231、融合信息缓冲器232、预测运动向量信息缓冲器233、运动信息缓冲器234运动信息重构部件235以及运动补偿部件236。
运动向量解码单元222包括融合候选设置部件241、融合信息解码部件242、候选预测设置部件243以及预测运动向量重构部件244。
差运动信息缓冲器231存储从无损解码单元202提供的差运动信息。从图像编码装置100提供的差运动信息是在被选择作为最佳预测模式的帧间预测模式下的差运动信息。差运动信息缓冲器231以预定时序或基于从运动信息重构部件235发送的请求来将所述存储的差运动信息提供给运动信息重构部件235。
融合信息缓冲器232存储从无损解码单元202提供的融合信息。从图像编码装置100提供的融合信息是在被选择作为最佳预测模式的帧间预测模式下的融合运动信息。融合信息缓冲器232以预定时序或基于从融合信息解码部件242发送的请求来将存储的融合信息提供给融合信息解码部件242。
预测运动向量信息缓冲器233存储从无损解码单元202提供的预测运动向量信息的代码号。预测运动向量信息的代码号从图像编码装置100提供并被分配给在被选择作为最佳预测模式的帧间预测模式下的预测运动向量信息。预测运动向量信息缓冲器233以预定时序或基于从预测运动向量重构部件244发送的请求来将所存储的预测运动向量信息的代码号提供给预测运动向量重构部件244。
片边界确定单元221从无损解码单元202获取片边界区域地址以及从编码侧提供的当前区域地址,并且执行片边界确定。这些信息被存储在如下代码流的预定位置:该代码流包括例如被发送的图像的经编码的数据例如序列参数组,图片参数组或片报头。可替代地,所述信息可以与代码流分开发送。
片边界确定单元221将确定结果(片边界确定结果)提供给在运动向量解码单元222中的融合候选设置部件241和候选预测设置部件243。
在运动向量解码单元222中的融合候选设置部件241适当地从运动信息缓冲器234获取相邻区域的必要相邻运动信息并且设置融合候选,同时适当地根据从片边界确定单元221提供的片边界确定结果通过具有可用运动信息的区域来代替不可用的候选运动信息。融合候选设置部件241将指定融合候选的候选信息提供给融合信息解码部件242。
融合信息解码部件242从融合信息缓冲器232获取从图像编码装置100提供的融合信息。融合信息解码部件242然后对包括在融合信息中的每个标志例如MergeFlag和MergeLeftFlag的值进行解码。此时,当对编码侧执行候选代替时,融合信息解码部件242基于从融合候选设置部件241提供的候选信息来再现候选替代。
也就是说,与传统情况相同,发送的单独标志信息仅能指定相邻区域L和相邻区域T。事实上,可能在编码侧候选已经被代替并且另外的相邻区域已经被选择作为候选。融合信息解码部件242基于从融合候选设置部件241提供的候选信息来准确地指定事实上已经被选择作为候选的相邻区域。
一旦已经确定融合模式被选择作为对融合信息进行解码的结果,并且指定待与当前区域融合的相邻区域,融合信息解码部件242将指定相邻区域的相邻区域指定信息提供给运动信息重构部件235。
一旦已经确定融合模式未被选择作为对融合信息进行解码的结果,另一方面,融合信息解码部件242向预测运动向量重构部件244提供:提供重构预测运动向量信息的指令的控制信号。
候选预测设置部件243适当地从运动信息缓冲器234获取相邻区域的必要相邻运动信息并且设置预测运动向量信息的候选,同时适当地根据从片边界确定单元221提供的片边界确定结果通过具有可用运动信息的区域来代替不可用的候选运动信息。候选预测设置部件243向预测运动向量重构部件244提供:被设置指定预测运动向量信息的候选的候选信息。
一旦被融合信息解码部件242指示以重构预测运动向量信息(一旦提供了控制信号),预测运动向量重构部件244从预测运动向量信息缓冲器233获取从图像编码装置100提供的预测运动向量信息的代码号并且对所述代码号进行解码。
与融合信息解码部件242的情况相同,当在编码侧已经进行了候选代替时,预测运动向量重构部件244此时基于从候选预测设置部件243提供的候选信息来再现候选替代。预测运动向量重构部件然后正确指定具有被选择作为预测运动向量信息的运功信息的相邻区域。预测运动向量重构部件244从运动信息缓冲器234获取相邻区域的相邻运动信息,并且确定所述相邻运动信息为预测运动向量信息。随后,预测运动向量重构部件244将重构的预测运动向量信息提供给在运动预测/补偿单元212中的运动信息重构部件235。
当已经选择了融合模式时,运动信息重构部件235从运动信息缓冲器234获取通过从融合信息解码部件242提供的相邻区域指定信息指定的相邻区域的运动信息,并且确定所述运动信息为当前区域的运动信息(或重构所述运动信息)。
当已经选择了MV竞争时,另一方面,运动信息重构部件235从差运动信息缓冲器231获取从图像编码装置100提供的差运动信息。运动信息重构部件235然后将从预测运动向量重构部件244获取的预测运动向量信息与差运动信息相加,并且重构当前区域(当前PU)的运动信息。运动信息重构部件235将重构的当前区域的运动信息提供给运动补偿部件236。
运动补偿部件236使用如上所述通过运动信息重构部件235重构的当前区域的运动信息以对从帧存储器209获取的参考图像像素值执行运动补偿,并且生成预测图像。运动补偿部件236将预测图像像素值经由选择单元213提供给计算器205。
运动信息重构部件235还将重构的当前区域的运动信息提供给运动信息缓冲器234。
运动信息缓冲器234存储从运动信息重构部件235提供的当前区域的运动信息。运动信息缓冲器234将作为相邻运动信息的另外的区域的运动信息提供给融合候选设置部件241,候选预测设置部件243以及对时间上在当前区域之后被处理的另一个区域执行处理的运动向量重构部件244。
如上所述每个部件执行处理,由此图像解码装置200能够对图像编码装置100编码后的数据进行正确解码并且提高编码效率。
[解码处理流程]
现在将描述通过前述图像解码装置200执行的每个处理的流程。首先,将参照图23所示的流程图描述解码处理的流程的示例。
在步骤S201中,一旦开始解码处理,存储缓冲器201将所发送的代码流进行累积。在步骤S202中,无损解码单元202对从存储缓冲器201提供的代码流(经编码的差图像信息)进行解码。也就是说,对通过图1所示的无损编码单元106编码的I图片、P图片以及B图片被进行解码。
此时,除了包括在代码流例如差运动信息中的差图像信息之外的各种信息,预测运动向量信息的代码号以及融合信息也被进行解码。
在步骤S203中,反量化单元203对通过在步骤S202中执行处理获得的量化正交变换系数进行反量化。在步骤S204中,逆正交变换单元204对在步骤S203中经反量化的正交变换系数进行逆正交变换。
在步骤S205中,帧内预测单元211或运动预测/补偿单元212使用所提供的信息以执行预测处理。在步骤S206中,选择单元213选择在步骤S205中生成的预测图像。在步骤S207中,计算器205将在步骤S206中选择的预测图像与在步骤S204中通过执行逆正交变换获得的差图像信息相加。结果,原图像被解码。
在步骤S208中,环路滤波器206对在步骤S207中获得的解码后的图像适当地执行包括去块效应滤波处理和自适应性环路滤波处理的环路滤波处理。
在步骤S209中,图片重排缓冲器207对在步骤S208中对其已经执行滤波处理的图像进行重排。也就是,被图像编码装置100中的图片重排缓冲器102重排用于编码的帧顺序被重排回原显示顺序。
在步骤S210中,D/A转换单元208对其帧顺序在步骤S209中已经被重排的图像执行D/A转换。该图像然后被输出至显示器(未示出)并显示。
在步骤S211中,帧存储器209存储在步骤S208中对其已经执行了滤波处理的图像。
一旦完成了在步骤S211中的处理,则完成了解码处理。
[预测处理流程]
接下来,将参照图24所示的流程图描述在图23的步骤S205中执行的预测处理的流程的示例。
一旦开始了预测处理,在步骤S231中的无损解码单元202基于从图像编码装置100提供的关于最佳预测模式的信息来确定待处理的经编码的数据是否是经帧内编码的。当确定经解码的数据为经帧内编码的,无损解码单元202进行至在步骤S232中的处理。
在步骤S232中,帧内预测单元211获取帧内预测模式信息。在步骤S233中,帧内预测单元211使用在步骤S232中获取的帧内预测模式信息以执行帧内预测并且生成预测图像。在生成预测图像后,帧内预测单元211完成预测处理并且返回至图23中的处理。
当在步骤S231中确定经编码的数据为经帧间编码的,另一方面,无损解码单元202进行至步骤S234中的处理。
在步骤S234中,运动预测/补偿单元212执行帧间运动预测处理。在完成帧间运动预测处理后,运动预测/补偿单元212完成预测处理并且返回至图23中的处理。
[帧间运动预测处理的流程]
现在,将参照图25所示的流程图描述在图24的步骤S234中执行的帧间运动预测处理的流程的示例。
一旦开始了帧间运动预测处理,在步骤S251中的运动预测/补偿单元212获取属于当前区域的运动预测的信息。例如,差运动信息缓冲器231获取差运动信息,融合信息缓冲器232获取融合信息,以及预测运动向量信息缓冲器233获取预测运动向量信息的代码号。
在步骤S252中,片边界确定单元221获取地址信息例如片边界区域地址和当前区域地址。在步骤S253中,片边界确定单元221基于在步骤S252中获取的地址信息来确定当前区域是否与片边界接触以及待成为融合候选或预测运动向量信息的候选的相邻区域的运动信息是否可用。
在步骤S254中,融合候选设置部件241根据在步骤S253中执行的片边界确定的结果来设置融合候选。在步骤S255中,当已经选择了融合模式时,融合信息解码部件242使用在步骤S253中设置的融合候选以对融合信息进行解码,并指定待融合的相邻区域。
在步骤S256中,融合信息解码部件242确定是否选择了融合模式,当确定已经选择了融合模式,进行至步骤S257中的处理。
在步骤S257中,候选预测设置部件243根据在步骤S253中获得的片边界确定结果来设置预测运动向量信息的候选(候选预测)。
在步骤S258中,预测运动向量重构部件244根据预测运动向量信息的代码号使用候选预测以重构预测运动向量信息。一旦已经重构了预测运动向量信息,预测运动向量重构部件244进行至在步骤S259中的处理。当在步骤S256中确定已经选择了融合模式时,融合信息解码部件242进行至在步骤S259中的处理。
在步骤S259中,运动信息重构部件使用在步骤S255中的融合信息的解码结果或在步骤S258中重构的预测运动向量信息以对当前区域的运动信息进行重构。
在步骤S260中,运动补偿部件236使用在步骤S259中重构的运动信息以执行运动补偿并且生成预测图像。
在步骤S261中,运动补偿部件236将在步骤S260中生成的预测图像经由选择单元213提供给计算器205并且生成解码后的图像。
在步骤S262中,运动信息缓冲器234存储在步骤S259中重构的运动信息。
在完成在步骤S262中的处理之后,运动信息缓冲器234完成帧间运动预测处理并且返回至在图24中的处理。
图像解码装置200能够通过执行上述的每个处理,对通过图像编码装置100编码后的数据进行正确解码并且提高编码效率。
与MPEG和H.26x相同,本技术能够应用于如下图像编码装置和图像解码装置:在接收通过正交变换例如离散余弦变换压缩的并且经由网络介质例如卫星广播、电缆电视、因特网或移动电话进行运动补偿的图像信息(比特流)时使用的图像编码装置和图像解码装置。本技术还能够应用于如下图像编码装置和图像解码装置:在对存储介质例如光盘、磁盘或快闪存储器执行处理时使用的图像编码装置和图像解码装置。另外,本技术能够应用于包括在这些图像编码装置和图像解码装置中的运动预测补偿装置。
<3.第三实施方式>
[个人计算机]
前述处理序列可以通过硬件或软件来执行。当通过软件执行处理序列时,将构成软件的程序安装在计算机中。在此的计算机包括具有专用硬件的计算机以及通过安装各种程序能够执行各种功能的通用个人计算机。
如图26所示,个人计算机500的CPU(中央处理器)501根据存储在ROM(只读存储器)502中的程序或从存储单元513加载至RAM(随机存取存储器)503中的程序来执行各种处理。RAM503还适当地存储对于CPU501执行各种处理必要的数据等。
CPU501、ROM502以及RAM503通过总线504彼此连接。输入/输出接口510也被连接至总线504。
连接至输入/输出接口510的为包括键盘和鼠标的输入单元511,包括CRT(阴极射线管)或LCD(液晶显示)显示器以及扬声器的输出单元512,包括硬盘等的存储器单元513,以及包括调制解调器等的通信单元514。通信单元514经由包括因特网的网络执行通信处理。
然而,如果需要将驱动器515连接至输入/输出接口510,以及如果需要可移动介质521例如磁盘、光盘、磁光盘或半导体存储器被适当地安装至驱动器,使得如果需要从介质中读出的计算机程序被安装进存储单元513中。
当通过软件执行前述处理序列时,来自网络或记录介质的构成软件的程序被安装。
如图26中的示例所示,例如,记录介质由如下选项构成:包括磁盘(包括软盘)、光盘(包括CD-ROM(光碟只读存储器)和DVD(数字多功能光碟))、磁光盘(包括MD(微型光碟))或半导体存储器的可移动介质521,在该可移动介质上记录程序并且该可移动介质被分配以将所述程序与所述装置本身分开传送至用户;ROM502,在该ROM上记录程序并且程序被传送至用户而程序预先被包括在装置本身中;以及包括在存储单元513中的硬盘。
应当注意,通过计算机执行的程序可以例如是以按照在本文中描述的顺序的时序执行处理的程序,或者以并行方式或以被呼叫时需要的时序来执行处理的程序。
另外,在此描述的将程序记录在记录介质中的步骤不仅包括以按照所述顺序的时序执行的处理而且包括以并行方式或单独执行的处理。
在此的系统代表包括多个装置的整体装置。
以上作为一个装置(或处理单元)描述的配置可以被分割成多个装置(或处理单元)。相反,以上作为多个装置(或处理单元)描述的配置可以被集成为一个装置(或处理单元)。另外,除了前述配置之外的配置当前可以被添加至每个装置(或处理单元)的配置。另外,某个装置(或处理单元)的配置的一部分可以包括在另外的装置(或另外的处理单元)的配置中,只要系统范围内的配置和操作基本上相同即可。也就是说,本技术并不限制于前述实施方式,而是可以在不脱离本技术的保护范围的前提下进行各种变化。
根据前述实施方式的图像编码装置和图像解码装置可以被应用于各种电子装置,包括:在电缆广播例如卫星广播和电缆TV中使用的发射器或接收器,因特网的分配装置,或至蜂窝通信的终端的分配装置;记录介质,其将图像记录在介质例如光盘、磁盘或快闪存储器上;以及再现装置,其从这些存储介质再现图像。以下将描述四个应用示例。
<4.第四实施方式>
[第一应用示例:电视机]
图27是示出了应用前述实施方式的电视装置的示意性配置的示例的图。电视装置900包括天线901、调谐器902、解复用器903、解码器904、视频信号处理单元905、显示器906、音频信号处理单元907、扬声器908、外部接口909、控制单元910、用户接口911以及总线912。
调谐器902从经由天线901接收的广播信号中提取期望信道的信号,并且对所提取的信号进行解调。调谐器902然后将通过解调获得的经编码的比特流输出至解复用器903。也就是说,调谐器902与在电视装置900中接收经编码的流的发送装置具有相同作用,在所述发送装置中图像被编码。
解复用器903将在待观看的节目中的视频流和音频流与经编码的比特流隔离开,并且将每个隔离后的流输出至解码器904。解复用器903还从经编码的比特流中提取辅助数据例如EPG(电子节目指南),并且将所提取的数据提供给控制单元910。在此,当经编码的比特流被扰码时,解复用单元903可以对其进行解扰。
解码器904对从解复用器903输入的视频流和音频流进行解码。解码器904然后将通过解码处理生成的视频数据输出至视频信号处理单元905。另外,解码器904将通过解码处理生成的音频数据输出至音频信号处理单元907。
视频信号处理单元905对从解码器904输入的视频数据进行再现,并且在显示器906上显示所述视频。视频信号处理单元905还可以将经由网络提供的应用屏幕显示在显示器906上。视频信号处理单元905还根据所述设置对所述视频数据执行附加处理例如降噪。另外,视频信号处理单元905可以生成GUI(图形用户接口)例如菜单、按键或光标的图像并且将所生成的图像叠加在输出的图像之上。
显示器906通过从视频信号处理单元905提供的驱动信号进行驱动,并且将视频或图像显示在显示装置(例如液晶显示器、等离子显示器或OELD(有机致电发光显示器))的视频屏幕上。
音频信号处理单元907对从解码器904输入的音频数据执行再现处理例如D/A转换和放大,并且从扬声器908输出所述音频。音频信号处理单元907还对所述音频数据执行附加处理例如降噪。
外部接口909是连接电视装置900与外部装置或网络的接口。例如,解码器904可以对经由外部接口909接收的视频流或音频流进行解码。这意味着外部接口909还与在电视装置900中接收经编码的流的发送装置的具有相同作用,在发送装置中图像被编码。
控制单元910包括处理器例如CPU和存储器例如RAM和ROM。存储器存储通过CPU执行的程序、程序数据、EPG数据以及经由网络获取的数据。例如,在电视装置900启动时,通过CPU读取并执行存储在存储器中的程序。通过执行该程序,CPU根据例如从用户接口911输入的操作信号来控制电视装置900的操作。
用户接口911连接至控制单元910。用户接口911包括用于用户操作电视装置900的按键和开关以及接收例如遥控信号的接收部件。用户接口911检测经由这些部件的用户操作,生成操作信号并且将所述生成的操作信号输出至控制单元910。
总线912使调谐器902、解复用器903、解码器904、视频信号处理率单元905、音频信号处理单元907、外部接口909以及控制单元910彼此连接。
以前述方式配置的电视装置900中的解码器904具有根据前述实施方式的图像解码装置的功能。相应地,当在电视装置900中对图像进行解码时,能够抑制在MV竞争或融合模式下的候选的数量的减少,从而实现提高编码效率。
<5.第五实施方式>
[第二应用示例:移动电话]
图28是示出了应用前述实施方式的移动电话的示意性配置的示例的图。移动电话920包括天线921、通信单元922、音频编解码器923、扬声器924、麦克风925、相机单元926、图像处理单元927、解复用单元928、记录/再现单元929、显示器930、控制单元931、操作单元932以及总线933。
天线921被连接至通信单元922。扬声器924和麦克风925被连接至音频编解码器923。操作单元932被连接至控制单元931。总线933使通信单元922、音频编解码器923、相机单元926、图像处理单元927、解复用单元928、记录/再现单元929、显示器930和控制单元931彼此连接。
移动电话920执行如下操作:以包括音频呼叫模式、数据通信模式、摄影模式以及可视电话模式的各种操作模式发送/接收音频信号,发送/接收电子邮件或图像数据、对图像进行成像或记录数据。
在音频呼叫模式下,通过麦克风925生成的模拟音频信号被提供给音频编解码器923。音频编解码器923然后将模拟音频信号转换为音频数据,对经转换的音频数据执行A/D转换,并且压缩所述数据。音频编解码器923随后将压缩的音频数据输出至通信单元922。通信单元922对所述音频数据进行编码和调制以生成发送信号。通信单元922然后将所述生成的发送信号经由天线921发送至基站(未示出)。另外,通信单元922对经由天线921接收的无线电信号进行放大,以及转换所述信号的频率,并且获取接收信号。通信单元922然后对接收信号进行解调和解码以生成音频数据,并且将所生成的音频数据输出至音频编解码器923。音频编解码器923扩展所述音频数据,对所述数据执行D/A转换,并且生成模拟音频信号。音频编解码器923然后通过将所生成的音频数据提供给扬声器924来输出所述音频。
在数据通信模式下,例如控制单元931根据经由操作单元932的用户操作生成构成电子邮件的字符数据。控制单元931还将字符显示在显示器930上。另外,控制单元931根据经由操作单元932来自用户的发送指令生成电子邮件数据,并且将所生成的电子邮件数据输出至通信单元922。通信单元922对所述电子邮件数据进行编码和调制以生成发送信号。然后,通信单元922将所生成的发送信号经由天线921发送至基站(未示出)。通信单元922还对经由天线921接收的无线电信号进行放大,转换所述信号的频率,并且获取接收信号。通信单元922随后对接收信号进行解调和解码,存储电子邮件数据,并且将所存储的电子邮件数据输出至控制单元931。控制单元931将电子邮件的内容显示在显示器930上并且将电子邮件数据存储在记录/再现单元929的存储介质中。
记录/再现单元929包括可读并且可写的任意存储介质。例如,存储介质可以为内置存储介质例如RAM或快闪存储器,或者外部安装存储介质例如硬盘、磁盘、磁光盘、光盘、USB(未分配空间位图)存储器或者存储卡。
在摄影模式下,例如,相机单元926对对象成像,生成图像数据,并且将生成的图像数据输出至图像处理单元927。图像处理单元927对从相机单元926输入的图像数据进行编码并且将经编码的流存储在存储/再现单元929的存储介质中。
在可视电话模式下,例如,解复用单元928对通过图像处理单元927编码的视频流以及从视频编解码器923输入的音频流进行复用,并且将经复用的流输出至通信单元922。通信单元922对所述流进行编码和调制以生成发送信号。通信单元922然后将所生成的发送信号经由天线921发送至基站(未示出)。另外,通信单元922对经由天线921接收到的无线电信号进行放大,转换所述信号的频率,以及获取接收信号。发送信号和接收信号可以包括经编码的比特流。通信单元922对所述接收信号进行解调和解码以存储所述流,并且将存储的流输出至解复用单元928。解复用单元928将视频流和音频流与输入流隔离开,并且将所述视频流和音频流分别输出至图像处理单元927和音频编解码器923。图像处理单元927对所述视频流进行解码以生成视频数据。视频数据然后被提供给显示图像序列的显示器930。音频编解码器923对所述音频流进行扩展并执行D/A转换以生成模拟音频信号。音频编解码器923然后将所生成的音频信号提供给扬声器924以输出所述音频。
在以前述方式配置的移动电话中的图像处理单元927具有根据前述实施方式的图像编码装置和图像解码装置的功能。相应地,当对移动电话920中的图像进行编码和解码时,能够抑制在MV竞争或融合模式下的候选的数量的减少,从而实现提高编码效率。
<6.第六实施方式>
[第三应用示例:记录/再现装置]
图29是示出了应用前述实施方式的记录/再现装置的示意性配置的示例的图。记录/再现装置940对接收到的广播节目的音频数据和视频数据进行编码,并且将所述数据存储在例如记录介质中。记录/再现装置940还对从另外的装置获取的音频数据和视频数据进行编码,并且将所述数据记录在例如记录介质中。响应于用户指令,记录/再现装置940例如在监测器和扬声器中再现记录在记录介质中的数据。记录/再现装置940此时对音频数据和视频数据进行解码。
记录/再现装置940包括调谐器941、外部接口942、编码器943、HDD(硬盘驱动器)944、盘驱动器945、选择器946、解码器947、OSD(同屏显示)948、控制单元949以及用户接口950。
调谐器941从经由天线(未示出)接收到的广播信号中提取期望信道的信号并对所提取的信号进行解调。调谐器941然后将通过解调获得的经编码的比特流输出至选择器946。也就是说,调谐器941与记录/再现装置940中的发送装置具有相同作用。
外部接口942是连接记录/再现装置940与外部装置或网络的接口。外部接口942可以是例如IEEE1394接口、网络接口、USB接口或快闪存储器接口。经由外部接口942接收到的视频数据和音频数据被输入至例如编码器943。也就是说,外部接口942与在记录/再现装置940中的发送装置具有相同作用。
当从外部接口942输入的视频数据和音频数据未经编码时,编码器943对视频数据和音频数据进行编码。编码器943随后将经编码的比特流输出至选择器946。
HDD944将经编码的比特流、各种程序以及其他数据记录在内部硬盘中,在所述经编码的比特流中内容数据例如视频和音频被压缩。当再现视频和音频时,HDD944从硬盘读取这些数据。
盘驱动器945记录并且将数据读入/读出安装至盘驱动器的记录介质。被安装在盘驱动器945中的记录介质可以是例如DVD盘(例如DVD视频、DVD-RAM、DVD-R、DVD-RW、DVD+R或DVD+RW),或蓝光(注册商标)盘。
当记录视频和音频时,选择器946选择从调谐器941或编码器943输入的经编码的比特流,并且将所选择的经编码的比特流输出至HDD944或盘驱动器945。当再现视频和音频时,另一方面,选择器946将从HDD944或盘驱动器945输入的经编码的比特流输出至解码器947。
解码器947对经编码的比特流进行解码以生成视频数据和音频数据。解码器904然后将所生成的视频数据输出至OSD948以及将所生成的音频数据输出至外部扬声器。
OSD948对从解码器947输入的视频数据进行再现并且显示视频。OSD948还将GUI例如菜单、按键或光标的图像与显示的视频进行叠加。
控制单元949包括处理器例如CPU以及存储器例如RAM和ROM。存储器存储程序数据以及通过CPU执行的程序。当启动记录/再现装置940时,存储在存储器中的程序例如通过CPU读取并执行。通过执行所述程序,CPU根据从例如用户接口950输入的操作信号来控制记录/再现装置940的操作。
用户接口950连接至控制单元949。用户接口950包括用于用户操作记录/再现装置940的按键和开关以及接收例如遥控信号的接收部件。用户接口950检测经由这些部件的用户操作,生成操作信号,并且将所生成的操作信号输出至控制单元949。
在以前述方式配置的记录/再现装置940中的编码器943具有根据前述实施方式的图像编码装置的功能。另一方面。解码器947具有根据前述实施方式的图像解码装置的功能。相应地,当对记录/再现装置940中的图像进行编码和解码时,能够抑制在MV竞争或融合模式下的候选的数量的减少,从而实现提高编码效率。
<7.第七实施方式>
[第四应用示例:成像装置]
图30是示出了应用前述实施方式的成像装置的示意性配置的示例的图。成像装置960对对象成像,生成图像,对图像数据进行编码以及将所述数据记录在记录介质中。
成像装置960包括聚光装置961、成像单元962、信号处理单元963、图像处理单元964、显示器965、外部接口966、存储器967、介质驱动器968、OSD969、控制单元970、用户接口971以及总线972。
聚光装置961连接至成像单元962。成像单元962连接至信号处理单元963。显示器965连接至图像处理单元964。用户接口971连接至控制单元970。总线972使图像处理单元964、外部接口966、存储器967、介质驱动器968、OSD969以及控制单元970彼此连接。
聚光装置961包括聚焦透镜和膜片机构。聚光装置961在成像单元962的成像表面上形成对象的光学图像。成像单元962包括图像传感器例如CCD(电荷耦合装置)或CMOS(互补金属氧化物半导体)并且执行光电转换以将形成在成像表面上的光学图像转换成作为电信号的图像信号。随后,成像单元962将图像信号输出至信号处理单元963。
信号处理单元963对从成像单元962输入的图像信号执行各种相机信号处理例如拐点校正、伽马校正以及颜色校正。信号处理单元963将对其已经执行了相机信号处理的图像数据输出至图像处理单元964。
图像处理单元964对从信号处理单元963输入的图像数据进行编码并且生成经编码的数据。图像处理单元964然后将所生成的经编码的数据输出至外部接口966或介质驱动器968。图像处理单元964还对从外部接口966或介质驱动器968输入的经编码的数据进行解码以生成图像数据。图像处理单元964然后将所生成的图像数据输出至显示器965。另外,图像处理单元964可以将从信号处理单元963输入的图像数据输出至显示器965以显示图像。另外,图像处理单元964可以将从OSD969获取的显示数据与输出至显示器965的图像进行叠加。
OSD969生成GUI例如菜单、按键或光标的图像并且将所生成的图像输出至图像处理单元964。
外部接口966被配置成例如USB输入/输出端。例如当打印图像时,外部接口966连接成像装置960和打印机。另外,如果需要,驱动器被连接至外部接口966。可移动介质例如磁盘或光盘被安装至例如驱动器,使得从可移动介质读取的程序能够被安装在成像装置960中。外部接口966还可以被配置成连接至网络例如LAN或因特网的网络接口。也就是说,外部接口966与成像装置960中的发送装置具有相同作用。
安装至介质驱动器968的记录介质可以为可读以及可写的任意可移动介质,例如磁盘、磁光盘、光盘或半导体存储器等。另外,记录介质可以被固定安装在介质驱动器968中使得非便携式存储单元例如内置硬盘驱动器或SSD(固态驱动器)被配置。
控制单元970包括处理器例如CPU以及存储器例如RAM和ROM。存储器存储程序数据以及通过CPU执行的程序。在启动成像装置960时,通过CPU读取并执行存储在存储器中的程序。通过执行程序,CPU根据从例如用户接口971输入的操作信号来控制成像装置960的操作。
用户接口971连接至控制单元970。用户接口971例如包括用于用户操作成像装置960的按键和开关。用户接口971检测经由这些部件的用户操作,生成操作信号,并且将所生成的操作信号输出至控制单元970。
在以前述方式配置的成像装置960中的图像处理单元964具有根据前述实施方式的图像编码装置和图像解码装置的功能。相应地,当对成像装置960中的图像进行编码和解码时,能够抑制在MV竞争或融合模式下的候选的数量的减少,从而实现提高编码效率。
本文中描述的是如下示例:各种信息例如预测模式信息和融合信息被复用成经编码的流的报头并且从编码侧发送至解码侧。然而,发送这些信息的方法并不限制于这样的示例。例如,这些信息可以被作为与经编码的比特流相关联的独立数据来发送或记录,而不需要被复用成经编码的比特流。在本文中,术语“关联”指当解码时,使得包括在比特流中的图像(可以是图像的一部分例如片或块)与对应于当前图像的信息之间建立链接。也就是,信息可以根据图像(或比特流)沿不同的传输路径进行发送。信息还可以根据图像(或比特流)被记录在不同的记录介质(或相同记录介质的不同记录区域)中。另外,信息和图像(或比特流)可以通过二进制单位(例如多帧、一帧或帧中的一部分)彼此关联。
尽管已经参照附图详细描述了本公开的优选实施方式,但本公开并不限制于所述示例。显然,本领域的技术人员在所附权利要求的技术构思的范围内可以进行各种变化或修改,应当理解这些变化或修改肯定属于本公开的技术保护范围。
应当注意,本技术可以采用如下配置。
(1)一种图像处理装置,包括:
确定单元,所述确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,所述相邻区域的运动信息用于对要处理的所述当前区域的运动信息进行编码;以及
编码单元,所述编码单元通过使用另外的相邻区域的可用运动信息来代替被所述确定单元确定为不可用的所述相邻区域的运动信息,以对所述当前区域的运动信息进行编码。
(2)根据(1)所述的图像处理装置,其中,所述确定单元基于包括所述当前区域的当前片的边界地址和所述当前区域的地址来确定所述相邻区域的运动信息是否可用,所述当前片为帧被分割成的多片中的一片。
(3)根据(2)所述的图像处理装置,其中,当所述相邻区域位于待处理的当前帧的所述当前片之外时,所述确定单元确定所述相邻区域的运动信息不可用。
(4)根据(1)至(3)中的任一项所述的图像处理装置,其中,所述编码单元包括:
候选设置部件,当待成为候选区域以与所述当前区域融合的相邻区域的运动信息不可用时,所述候选设置部件将具有可用运动信息的另外的相邻区域设置为代替所述相邻区域的候选;以及
融合信息生成部件,所述融合信息生成部件从所述候选设置部件设置的候选中确定与所述当前区域融合的相邻区域并且生成融合信息。
(5)根据(4)所述的图像处理装置,其中,所述候选设置部件在被所述确定单元确定为不可用的相邻区域的共同定位区域可用时将所述共同定位区域设置为候选。
(6)根据(4)所述的图像处理装置,其中,所述候选设置部件将位于待处理的当前帧中的待处理的当前片内的另外的相邻区域设置为候选,所述当前片为帧被分割成的多片中的一片。
(7)根据(4)所述的图像处理装置,其中,当被所述确定单元确定为不可用的所述相邻区域位于当前帧之外时,所述候选设置部件将位于待处理的当前帧参考的参考帧中的相邻区域设置为候选。
(8)根据(1)至(7)中任一项所述的图像处理装置,其中,所述编码单元包括:
候选设置部件,当待成为所述当前区域的预测运动向量信息的候选的相邻区域的运动信息不可用时,所述候选设置部件将另外的相邻区域的可用运动信息设置为代替所述运动信息的候选;以及
预测运动向量生成部件,所述预测运动向量生成部件使用由所述候选设置部件设置的候选中的任意候选来生成所述当前区域的预测运动向量信息。
(9)根据(8)所述的图像处理装置,其中,所述候选设置部件在被所述确定单元确定为不可用的相邻区域的共同定位区域可用时将所述共同定位区域设置为候选。
(10)根据(8)所述的图像处理装置,其中,所述候选设置部件将位于待处理的当前帧中的待处理的当前片内的另外的相邻区域设置为候选,所述当前片为帧被分割成的多片中的一片。
(11)根据(8)所述的图像处理装置,其中,当被所述确定单元确定为不可用的所述相邻区域位于当前帧之外时,所述候选设置部件将位于待处理的所述当前帧参考的参考帧中的相邻区域设置为候选。
(12)一种在图像处理装置中处理图像的方法,其中
确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,所述相邻区域的运动信息用于对要处理的所述当前区域的运动信息进行编码,以及
编码单元通过使用另外的相邻区域的可用运动信息来代替被确定为不可用的所述相邻区域的运动信息,以对所述当前区域的运动信息进行编码。
(13)一种图像处理装置,包括:
确定单元,所述确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,所述相邻区域的运动信息用于对要处理的所述当前区域的运动信息进行解码;以及
解码单元,所述解码单元通过使用另外的相邻区域的可用运动信息来代替被所述确定单元确定为不可用的所述相邻区域的运动信息,以对所述当前区域的经编码的运动信息进行解码。
(14)根据(13)所述的图像处理装置,其中,所述确定单元基于包括所述当前区域的当前片的边界地址和所述当前区域的地址来确定所述相邻区域的运动信息是否可用,所述当前片为帧被分割成的多片中的一片。
(15)根据(13)或(14)所述的图像处理装置,其中,当所述相邻区域位于待处理的当前帧的所述当前片之外时,所述确定单元确定所述相邻区域的运动信息不可用。
(16)根据(13)至(15)中的任一项所述的图像处理装置,其中,所述解码单元包括:
候选设置部件,当待成为候选区域以与所述当前区域融合的相邻区域的运动信息不可用时,所述候选设置部件将具有可用运动信息的另外的相邻区域设置为代替所述相邻区域的候选;以及
融合信息解码部件,所述融合信息解码部件从由所述候选设置部件设置的候选中确定与所述当前区域融合的相邻区域并且根据所述确定对融合信息进行解码。
(17)根据(16)所述的图像处理装置,其中,所述候选设置部件在被所述确定单元确定为不可用的相邻区域的共同定位区域可用时将所述共同定位区域设置为候选。
(18)根据(16)所述的图像处理装置,其中,所述候选设置部件将位于待处理的当前帧中的待处理的当前片内的另外的相邻区域设置为候选,所述当前片为帧被分割成的多片中的一片。
(19)根据(16)所述的图像处理装置,其中,当被所述确定单元确定为不可用的所述相邻区域位于当前帧之外时,所述候选设置部件将位于待处理的当前帧参考的参考帧中的相邻区域设置为候选。
(20)根据(13)至(19)中的任一项所述的图像处理装置,其中,所述解码单元包括:
候选设置单元,当待成为所述当前区域的预测运动向量信息的候选的相邻区域的运动信息不可用时,所述候选设置单元将另外的相邻区域的可用运动信息设置为代替所述运动信息的候选;以及
预测运动向量重构部件,所述预测运动向量重构部件使用由所述候选设置部件设置的候选中的任意候选来重构所述当前区域的预测运动向量信息。
(21)根据(20)所述的图像处理装置,其中,所述候选设置部件在被所述确定单元确定为不可用的相邻区域的共同定位区域可用时将所述共同定位区域设置为候选。
(22)根据(20)所述的图像处理装置,其中,所述候选设置部件将位于待处理的当前帧中的待处理的当前片内的另外的相邻区域设置为候选,所述当前片为帧被分割成的多片中的一片。
(23)根据(20)所述的图像处理装置,其中,当被所述确定单元确定为不可用的所述相邻区域位于当前帧之外时,所述候选设置部件将位于待处理的所述当前帧参考的参考帧中的相邻区域设置为候选。
(24)一种在图像处理装置中处理图像的方法,其中
确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,所述相邻区域的运动信息用于对要处理的所述当前区域的运动信息进行解码,以及
解码单元通过使用另外的相邻区域的可用运动信息来代替被确定为不可用的所述相邻区域的运动信息,以对所述当前区域的运动信息进行解码。
附图标记列表
100 图像编码装置
115 运动预测/补偿单元
121 片边界确定单元
122 运动向量编码单元
141 融合候选设置部件
142 融合信息生成部件
143 候选预测设置部件
144 预测运动向量生成部件
145 差运动向量生成部件
200 图像解码装置
212 运动预测/补偿单元
221 片边界确定单元
222 运动向量解码单元
241 融合候选设置部件
242 融合信息解码部件
243 候选预测设置部件
244 预测融合向量重构部件
权利要求书(按照条约第19条的修改)
1.(修改)一种图像处理装置,包括:
确定单元,所述确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,所述相邻区域的运动信息被用于对要处理的所述当前区域的运动信息进行编码;以及
编码单元,所述编码单元通过使用另外的相邻区域的可用运动信息来代替被所述确定单元确定为不可用的所述相邻区域的运动信息,以对所述当前区域的运动信息进行编码,
其中,所述确定单元基于包括所述当前区域的当前片的边界地址和所述当前区域的地址来确定所述相邻区域的运动信息是否可用,所述当前片为帧被分割成多片中的一片。
2.(删除)
3.(修改)根据权利要求1所述的图像处理装置,其中,所述确定单元确定当所述相邻区域位于待处理的当前帧的所述当前片之外时,所述相邻区域的运动信息不可用。
4.根据权利要求1所述的图像处理装置,其中,所述编码单元包括:
候选设置部件,所述候选设置部件当与所述当前区域融合的待成为候选区域的相邻区域的运动信息不可用时,将具有可用运动信息的另外的相邻区域设置作为所述候选区域来代替所述相邻区域;以及
融合信息生成部件,所述融合信息生成部件从所述候选设置部件设置的所述候选区域中来确定与所述当前区域融合的相邻区域并且生成融合信息。
5.根据权利要求4所述的图像处理装置,其中,所述候选设置部件当共同定位区域可用时将被所述确定单元确定的不可用的所述相邻区域的所述共同定位区域设置为所述候选区域。
6.根据权利要求4所述的图像处理装置,其中,所述候选设置部件将位于待处理的当前帧的待处理的当前片中的另外的相邻区域设置为所述候选区域,所述当前片为帧被分割成多片中的一片。
7.根据权利要求4所述的图像处理装置,其中,所述候选设置部件当所述确定单元确定的不可用的所述相邻区域位于当前帧之外时,将位于待处理的所述当前帧参考的参考帧中的相邻区域设置为所述候选区域。
8.根据权利要求1所述的图像处理装置,其中,所述编码单元包括:
候选设置部件,当待成为所述当前区域的预测运动向量信息的候选的相邻区域的运动信息不可用时,将另外的相邻区域的可用运动信息设置为候选信息来代替所述运动信息;以及
预测运动向量生成部件,所述预测运动向量生成部件使用由所述候选设置部件设置的任意所述候选信息来生成所述当前区域的所述预测运动向量信息。
9.根据权利要求8所述的图像处理装置,其中,所述候选设置部件当共同定位区域可用时,将所述确定单元确定的不可用的所述相邻区域的所述共同定位区域设置为所述候选区域。
10.根据权利要求8所述的图像处理装置,其中,所述候选设置部件将位于待处理的当前帧的待处理的当前片中的另外的相邻区域设置为所述候选区域,所述当前片为帧被分割成多片中的一片。
11.根据权利要求8所述的图像处理装置,其中,所述候选设置部件当所述确定单元确定的不可用的所述相邻区域位于当前帧之外时,将位于待处理的所述当前帧参考的参考帧中的相邻区域设置为所述候选区域。
12.(修改)一种在图像处理装置中处理图像的方法,其中
确定单元基于包括当前区域的当前片的边界地址和所述当前区域的地址来确定位于所述当前区域周围的相邻区域的运动信息是否可用,所述相邻区域的运动信息被用于对要处理的所述当前区域的运动信息进行编码,所述当前片为帧被分割成多片中的一片,以及
编码单元通过使用另外的相邻区域的可用运动信息来代替被确定为不可用的所述相邻区域的运动信息,以对所述当前区域的运动信息进行编码。
13.(修改)一种图像处理装置,包括:
确定单元,所述确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,所述相邻区域的运动信息被用于对要处理的所述当前区域的运动信息进行解码;以及
解码单元,所述解码单元通过使用另外的相邻区域的可用运动信息来代替被所述确定单元确定为不可用的所述相邻区域的运动信息,以对所述当前区域的经编码的运动信息进行解码,
其中,所述确定单元基于包括所述当前区域的当前片的边界地址和所述当前区域的地址来确定所述相邻区域的运动信息是否可用,所述当前片为帧被分割成多片中的一片。
14.(删除)
15.(修改)根据权利要求13所述的图像处理装置,其中,所述确定单元当所述相邻区域位于待处理的当前帧的所述当前片之外时,确定所述相邻区域的运动信息不可用。
16.根据权利要求13所述的图像处理装置,其中,所述解码单元包括:
候选设置部件,所述候选设置部件当与所述当前区域融合的待成为候选区域的相邻区域的运动信息不可用时,将具有可用运动信息的另外的相邻区域设置为所述候选区域来代替所述相邻区域;以及
融合信息解码部件,所述融合信息解码部件从由所述候选设置部件设置的所述候选区域中来确定与所述当前区域融合的相邻区域并且根据所述确定对融合信息进行解码。
17.根据权利要求16所述的图像处理装置,其中,所述候选设置部件当共同定位区域可用时,将被所述确定单元确定为不可用的所述相邻区域的所述共同定位区域设置为所述候选区域。
18.根据权利要求16所述的图像处理装置,其中,所述候选设置部件将位于待处理的当前帧的待处理的当前片中的另外的相邻区域设置为所述候选区域,所述当前片为帧被分割成多片中的一片。
19.根据权利要求16所述的图像处理装置,其中,所述候选设置部件当所述确定单元确定的不可用的所述相邻区域位于当前帧之外时,将位于待处理的所述当前帧参考的参考帧中的相邻区域设置为所述候选区域。
20.根据权利要求13所述的图像处理装置,其中,所述解码单元包括:
候选设置单元,当待成为所述当前区域的预测运动向量信息的候选的相邻区域的运动信息不可用时,将另外的相邻区域的可用运动信息设置为候选信息来代替所述运动信息;以及
预测运动向量重构部件,所述预测运动向量重构部件使用由所述候选设置部件设置的任意所述候选信息来重构所述当前区域的所述预测运动向量信息。
21.根据权利要求20所述的图像处理装置,其中,所述候选设置部件当共同定位区域可用时,将被所述确定单元确定为不可用的所述相邻区域的所述共同定位区域设置为所述候选区域。
22.根据权利要求20所述的图像处理装置,其中,所述候选设置部件将位于待处理的当前帧的待处理的当前片中的另外的相邻区域设置为所述候选区域,所述当前片为帧被分割成多片中的一片。
23.根据权利要求20所述的图像处理装置,其中,所述候选设置部件当所述确定单元确定的不可用的所述相邻区域位于当前帧之外时,将位于待处理的所述当前帧参考的参考帧中的相邻区域设置为所述候选区域。
24.(修改)一种在图像处理装置中处理图像的方法,其中
确定单元基于包括当前区域的当前片的边界地址和所述当前区域的地址来确定位于所述当前区域周围的相邻区域的运动信息是否可用,所述相邻区域的运动信息被用于对要处理的所述当前区域的运动信息进行解码,所述当前片为帧被分割成多片中的一片,以及
解码单元通过使用另外的相邻区域的可用运动信息来代替被确定为不可用的所述相邻区域的运动信息,以对所述当前区域的运动信息进行解码。

Claims (24)

1.一种图像处理装置,包括:
确定单元,所述确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,所述相邻区域的运动信息用于对要处理的所述当前区域的运动信息进行编码;以及
编码单元,所述编码单元通过使用另外的相邻区域的可用运动信息来代替被所述确定单元确定为不可用的所述相邻区域的运动信息,以对所述当前区域的运动信息进行编码。
2.根据权利要求1所述的图像处理装置,其中,所述确定单元基于包括所述当前区域的当前片的边界地址和所述当前区域的地址来确定所述相邻区域的运动信息是否可用,所述当前片为帧被分割成的多片中的一片。
3.根据权利要求2所述的图像处理装置,其中,当所述相邻区域位于待处理的当前帧的所述当前片之外时,所述确定单元确定所述相邻区域的运动信息不可用。
4.根据权利要求1所述的图像处理装置,其中,所述编码单元包括:
候选设置部件,当待成为候选区域以与所述当前区域融合的相邻区域的运动信息不可用时,所述候选设置部件将具有可用运动信息的另外的相邻区域设置为代替所述相邻区域的候选;以及
融合信息生成部件,所述融合信息生成部件从所述候选设置部件设置的候选中确定与所述当前区域融合的相邻区域并且生成融合信息。
5.根据权利要求4所述的图像处理装置,其中,所述候选设置部件在被所述确定单元确定为不可用的相邻区域的共同定位区域可用时将所述共同定位区域设置为候选。
6.根据权利要求4所述的图像处理装置,其中,所述候选设置部件将位于待处理的当前帧中的待处理的当前片内的另外的相邻区域设置为候选,所述当前片为帧被分割成的多片中的一片。
7.根据权利要求4所述的图像处理装置,其中,当被所述确定单元确定为不可用的所述相邻区域位于当前帧之外时,所述候选设置部件将位于待处理的当前帧参考的参考帧中的相邻区域设置为候选。
8.根据权利要求1所述的图像处理装置,其中,所述编码单元包括:
候选设置部件,当待成为所述当前区域的预测运动向量信息的候选的相邻区域的运动信息不可用时,所述候选设置部件将另外的相邻区域的可用运动信息设置为代替所述运动信息的候选;以及
预测运动向量生成部件,所述预测运动向量生成部件使用由所述候选设置部件设置的候选中的任意候选来生成所述当前区域的预测运动向量信息。
9.根据权利要求8所述的图像处理装置,其中,所述候选设置部件在被所述确定单元确定为不可用的相邻区域的共同定位区域可用时将所述共同定位区域设置为候选。
10.根据权利要求8所述的图像处理装置,其中,所述候选设置部件将位于待处理的当前帧中的待处理的当前片内的另外的相邻区域设置为候选,所述当前片为帧被分割成的多片中的一片。
11.根据权利要求8所述的图像处理装置,其中,当被所述确定单元确定为不可用的所述相邻区域位于当前帧之外时,所述候选设置部件将位于待处理的所述当前帧参考的参考帧中的相邻区域设置为候选。
12.一种在图像处理装置中处理图像的方法,其中
确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,所述相邻区域的运动信息用于对要处理的所述当前区域的运动信息进行编码,以及
编码单元通过使用另外的相邻区域的可用运动信息来代替被确定为不可用的所述相邻区域的运动信息,以对所述当前区域的运动信息进行编码。
13.一种图像处理装置,包括:
确定单元,所述确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,所述相邻区域的运动信息用于对要处理的所述当前区域的运动信息进行解码;以及
解码单元,所述解码单元通过使用另外的相邻区域的可用运动信息来代替被所述确定单元确定为不可用的所述相邻区域的运动信息,以对所述当前区域的经编码的运动信息进行解码。
14.根据权利要求13所述的图像处理装置,其中,所述确定单元基于包括所述当前区域的当前片的边界地址和所述当前区域的地址来确定所述相邻区域的运动信息是否可用,所述当前片为帧被分割成的多片中的一片。
15.根据权利要求14所述的图像处理装置,其中,当所述相邻区域位于待处理的当前帧的所述当前片之外时,所述确定单元确定所述相邻区域的运动信息不可用。
16.根据权利要求13所述的图像处理装置,其中,所述解码单元包括:
候选设置部件,当待成为候选区域以与所述当前区域融合的相邻区域的运动信息不可用时,所述候选设置部件将具有可用运动信息的另外的相邻区域设置为代替所述相邻区域的候选;以及
融合信息解码部件,所述融合信息解码部件从由所述候选设置部件设置的候选中确定与所述当前区域融合的相邻区域并且根据所述确定对融合信息进行解码。
17.根据权利要求16所述的图像处理装置,其中,所述候选设置部件在被所述确定单元确定为不可用的相邻区域的共同定位区域可用时将所述共同定位区域设置为候选。
18.根据权利要求16所述的图像处理装置,其中,所述候选设置部件将位于待处理的当前帧中的待处理的当前片内的另外的相邻区域设置为候选,所述当前片为帧被分割成的多片中的一片。
19.根据权利要求16所述的图像处理装置,其中,当被所述确定单元确定为不可用的所述相邻区域位于当前帧之外时,所述候选设置部件将位于待处理的当前帧参考的参考帧中的相邻区域设置为候选。
20.根据权利要求13所述的图像处理装置,其中,所述解码单元包括:
候选设置单元,当待成为所述当前区域的预测运动向量信息的候选的相邻区域的运动信息不可用时,所述候选设置单元将另外的相邻区域的可用运动信息设置为代替所述运动信息的候选;以及
预测运动向量重构部件,所述预测运动向量重构部件使用由所述候选设置部件设置的候选中的任意候选来重构所述当前区域的预测运动向量信息。
21.根据权利要求20所述的图像处理装置,其中,所述候选设置部件在被所述确定单元确定为不可用的相邻区域的共同定位区域可用时将所述共同定位区域设置为候选。
22.根据权利要求20所述的图像处理装置,其中,所述候选设置部件将位于待处理的当前帧中的待处理的当前片内的另外的相邻区域设置为候选,所述当前片为帧被分割成的多片中的一片。
23.根据权利要求20所述的图像处理装置,其中,当被所述确定单元确定为不可用的所述相邻区域位于当前帧之外时,所述候选设置部件将位于待处理的所述当前帧参考的参考帧中的相邻区域设置为候选。
24.一种在图像处理装置中处理图像的方法,其中
确定单元确定位于当前区域周围的相邻区域的运动信息是否可用,所述相邻区域的运动信息用于对要处理的所述当前区域的运动信息进行解码,以及
解码单元通过使用另外的相邻区域的可用运动信息来代替被确定为不可用的所述相邻区域的运动信息,以对所述当前区域的运动信息进行解码。
CN2012800117832A 2011-03-11 2012-03-01 图像处理装置以及方法 Pending CN103404149A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011-054560 2011-03-11
JP2011054560A JP5979405B2 (ja) 2011-03-11 2011-03-11 画像処理装置および方法
PCT/JP2012/055237 WO2012124497A1 (ja) 2011-03-11 2012-03-01 画像処理装置および方法

Publications (1)

Publication Number Publication Date
CN103404149A true CN103404149A (zh) 2013-11-20

Family

ID=46830572

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012800117832A Pending CN103404149A (zh) 2011-03-11 2012-03-01 图像处理装置以及方法

Country Status (5)

Country Link
US (1) US9177392B2 (zh)
JP (1) JP5979405B2 (zh)
CN (1) CN103404149A (zh)
BR (1) BR112013022672A2 (zh)
WO (1) WO2012124497A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109862356A (zh) * 2019-01-17 2019-06-07 中国科学院计算技术研究所 一种基于感兴趣区域的视频编码方法及系统
CN110495175A (zh) * 2017-03-31 2019-11-22 明达半导体股份有限公司 用于对用于并行处理的运动信息进行处理的图像处理方法、用于使用该图像处理方法进行解码和编码的方法、以及用于该方法的设备
CN110546956A (zh) * 2017-06-30 2019-12-06 华为技术有限公司 一种帧间预测的方法及装置

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9819963B2 (en) 2011-07-12 2017-11-14 Electronics And Telecommunications Research Institute Inter prediction method and apparatus for same
KR101769576B1 (ko) * 2011-07-12 2017-08-18 한국전자통신연구원 인터 예측 방법 및 그 장치
CN110545419B (zh) 2012-10-12 2022-11-22 韩国电子通信研究院 图像编码/解码方法和使用其的装置
KR101638875B1 (ko) * 2012-11-27 2016-07-22 경희대학교 산학협력단 머지를 기반으로 한 복호화 방법 및 장치
US20150304678A1 (en) * 2012-12-26 2015-10-22 Sony Corporation Image processing device and method
WO2014141899A1 (ja) * 2013-03-12 2014-09-18 ソニー株式会社 画像処理装置および方法
CN103517073B (zh) * 2013-07-12 2016-11-02 上海交通大学 视频编解码方法、装置及系统
US9300977B2 (en) * 2013-10-02 2016-03-29 Amlogic Co., Ltd. Methods for encoding motion vectors
US9973754B2 (en) * 2014-03-18 2018-05-15 Texas Instruments Incorporated Low power ultra-HD video hardware engine
JP6491587B2 (ja) * 2015-11-06 2019-03-27 日本電信電話株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法、映像符号化プログラム及び映像復号プログラム
WO2018105515A1 (ja) 2016-12-09 2018-06-14 株式会社アクセル 画像データ処理方法
JP6732337B2 (ja) 2016-12-09 2020-07-29 株式会社アクセル 画像データ処理方法
JP6918661B2 (ja) * 2017-09-22 2021-08-11 キヤノン株式会社 符号化装置、符号化方法及びプログラム
US10469869B1 (en) * 2018-06-01 2019-11-05 Tencent America LLC Method and apparatus for video coding
JP6694086B2 (ja) * 2019-02-13 2020-05-13 日本電信電話株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005159824A (ja) * 2003-11-27 2005-06-16 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラム,画像復号プログラムおよびそれらの記録媒体
CN1976457A (zh) * 2002-04-19 2007-06-06 松下电器产业株式会社 图像编码方法及图像编码装置
JP2008283490A (ja) * 2007-05-10 2008-11-20 Ntt Docomo Inc 動画像符号化装置、方法及びプログラム、並びに動画像復号化装置、方法及びプログラム
CN101573982A (zh) * 2006-11-03 2009-11-04 三星电子株式会社 利用运动矢量跟踪编码/解码图像的方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004208258A (ja) * 2002-04-19 2004-07-22 Matsushita Electric Ind Co Ltd 動きベクトル計算方法
JP4277530B2 (ja) * 2003-01-28 2009-06-10 ソニー株式会社 画像処理装置および符号化装置とそれらの方法
KR101356734B1 (ko) * 2007-01-03 2014-02-05 삼성전자주식회사 움직임 벡터 트랙킹을 이용한 영상의 부호화, 복호화 방법및 장치
EP2140684B1 (en) * 2007-04-12 2018-08-15 Thomson Licensing DTV Method and apparatus for context dependent merging for skip-direct modes for video encoding and decoding
KR101431545B1 (ko) * 2008-03-17 2014-08-20 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1976457A (zh) * 2002-04-19 2007-06-06 松下电器产业株式会社 图像编码方法及图像编码装置
JP2005159824A (ja) * 2003-11-27 2005-06-16 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラム,画像復号プログラムおよびそれらの記録媒体
CN101573982A (zh) * 2006-11-03 2009-11-04 三星电子株式会社 利用运动矢量跟踪编码/解码图像的方法和装置
JP2008283490A (ja) * 2007-05-10 2008-11-20 Ntt Docomo Inc 動画像符号化装置、方法及びプログラム、並びに動画像復号化装置、方法及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110495175A (zh) * 2017-03-31 2019-11-22 明达半导体股份有限公司 用于对用于并行处理的运动信息进行处理的图像处理方法、用于使用该图像处理方法进行解码和编码的方法、以及用于该方法的设备
CN110495175B (zh) * 2017-03-31 2022-10-18 明达半导体股份有限公司 图像解码方法和图像编码方法
CN110546956A (zh) * 2017-06-30 2019-12-06 华为技术有限公司 一种帧间预测的方法及装置
US11197018B2 (en) 2017-06-30 2021-12-07 Huawei Technologies Co., Ltd. Inter-frame prediction method and apparatus
CN110546956B (zh) * 2017-06-30 2021-12-28 华为技术有限公司 一种帧间预测的方法及装置
CN109862356A (zh) * 2019-01-17 2019-06-07 中国科学院计算技术研究所 一种基于感兴趣区域的视频编码方法及系统

Also Published As

Publication number Publication date
JP2012191513A (ja) 2012-10-04
US9177392B2 (en) 2015-11-03
JP5979405B2 (ja) 2016-08-24
US20130343663A1 (en) 2013-12-26
BR112013022672A2 (pt) 2019-09-24
WO2012124497A1 (ja) 2012-09-20

Similar Documents

Publication Publication Date Title
CN103404149A (zh) 图像处理装置以及方法
JP6057140B2 (ja) 画像処理装置および方法、プログラム、並びに、記録媒体
JP6274103B2 (ja) 画像処理装置および方法
US20230247217A1 (en) Image processing apparatus and method
CN106878745B (zh) 图像处理设备和图像处理方法
KR20120058521A (ko) 화상 처리 장치 및 방법
CN104054346A (zh) 图像处理装置和方法
CN103891285A (zh) 图像处理装置和方法
CN103548355A (zh) 图像处理装置及方法
CN103621094A (zh) 图像处理装置和方法
JP2024015150A (ja) 映像デコーディング方法及びその装置
CN114073079A (zh) 带有运动信息采集缓冲器的运动矢量预测
CN103891286A (zh) 图像处理装置和方法
CN103959784A (zh) 图像处理装置和方法
CN103597836A (zh) 图像处理设备和方法
CN103843348A (zh) 图像处理装置和方法
CN103518373A (zh) 图像处理装置和方法
JP6268556B2 (ja) 画像処理装置および方法、プログラム、並びに、記録媒体
KR20230135587A (ko) 비디오 코딩을 위한 모델-기반 모션 벡터 차이 도출및 템플릿 매칭 예측
CN103314589A (zh) 图像处理装置和方法
JP2016201831A (ja) 画像処理装置および方法
CN102823255A (zh) 图像处理设备和图像处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20131120