CN107770548B - 解码方法、解码装置 - Google Patents
解码方法、解码装置 Download PDFInfo
- Publication number
- CN107770548B CN107770548B CN201711214366.9A CN201711214366A CN107770548B CN 107770548 B CN107770548 B CN 107770548B CN 201711214366 A CN201711214366 A CN 201711214366A CN 107770548 B CN107770548 B CN 107770548B
- Authority
- CN
- China
- Prior art keywords
- reference list
- buffer
- picture
- information
- buffer description
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/39—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving multiple description coding [MDC], i.e. with separate layers being structured as independently decodable descriptions of input picture data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/43—Hardware specially adapted for motion estimation or compensation
- H04N19/433—Hardware specially adapted for motion estimation or compensation characterised by techniques for memory access
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/58—Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
有关本发明的一方案的图像编码方法,包括:将定义缓冲器记述的缓冲器记述定义信息向编码比特流写入的步骤(S101)、生成初始设定的参照列表的步骤(S102)、进行将上述初始设定的参照列表中包含的图片的顺序重新排列的重新排列处理的步骤(S103)、将表示上述重新排列处理的内容的参照列表重新排列信息向上述编码比特流写入的步骤(S104)、和使用上述缓冲器记述和通过上述重新排列处理得到的参照列表将上述图像编码的步骤(S105);在上述参照列表重新排列信息中,作为上述重新排列的对象的图片用在该图像编码方法中在该参照列表重新排列信息之外也被使用的索引确定。
Description
本申请是申请日为2012年9月28日、申请号为201280049463.6、发明名称为“图像编码方法、图像解码方法、图像编码装置、图像解码装置及图像编码解码装置”的中国专利申请的分案申请。
技术领域
本发明涉及图像编码方法、图像解码方法、图像编码装置、图像解码装置及图像编码解码装置,特别涉及使用用来指定保持在缓冲器中的图片(picture)的缓冲器记述、和用来指定所参照的图片的参照列表的图像编码方法及图像解码方法。
背景技术
在MPEG-4AVC/H.264(参照非专利文献1)和下一代的HEVC(High-EfficiencyVideo Coding)等的最新的影像编码方式中,使用利用已经编码或解码的参照图片的图片间预测对图像或影像内容进行编码。即,该影像编码方式利用在时间上连续的图片全体的信息的冗余性。在MPEG-4AVC影像编码方式中,解码图片缓冲器(DPB)中保持的参照图片通过以下的任意一种方法来管理。第一个方法是用于从DPB中删除编码顺序较早的图片的、使用预先定义的滑动窗口方式的方法。第二个方法是明确使用编码比特流中包含的缓冲器管理信号对未使用的参照图片进行管理和删除的方法。
现有技术文献
非专利文献
非专利文献1:ISO/IEC 14496-10“MPEG-4Part10Advanced Video Coding”
发明概要
发明要解决的问题
在使用这样的影像编码方式的图像编码方法及图像解码方法中,希望进一步的编码效率的提高及运算量的减少。
发明内容
所以,本发明提供一种能够提高编码效率或实现运算量的减少的图像编码方法或图像解码方法。
有关本发明的一技术方案的图像编码方法,使用用来指定保持在缓冲器中的图片的缓冲器记述、和用来指定所参照的图片的参照列表将图像编码,从而生成编码比特流,其特征在于,包括:缓冲器记述写入步骤,将定义缓冲器记述的缓冲器记述定义信息向上述编码比特流写入;参照列表生成步骤,生成包含由上述缓冲器记述所表示的多个图片的初始设定的参照列表;重新排列步骤,进行将上述初始设定的参照列表中包含的图片的顺序重新排列的重新排列处理;重新排列信息写入步骤,将表示上述重新排列处理的内容的参照列表重新排列信息向上述编码比特流写入;以及编码步骤,使用上述缓冲器记述和通过上述重新排列处理得到的参照列表,将上述图像编码;在上述参照列表重新排列信息中,作为上述重新排列的对象的图片,由在该图像编码方法中在该参照列表重新排列信息之外也被使用的索引来确定。
另外,这些总括或具体的方式可以通过系统、方法、集成电路、计算机程序或计算机可读取的CD-ROM等的记录介质来实现,也可以通过系统、方法、集成电路、计算机程序和记录介质的任意组合来实现。
发明效果
本发明能够提供一种能提高编码效率或实现运算量的减少的图像编码方法或图像解码方法。
附图说明
图1是表示图片的参照构造的一例的图。
图2是表示编码比特流的结构的图。
图3是有关本发明的实施方式1的图像编码装置的框图。
图4是有关本发明的实施方式1的图像编码方法的流程图。
图5是有关本发明的实施方式1的参照列表的重新排列处理的第1例的流程图。
图6是有关本发明的实施方式1的参照列表的重新排列处理的第2例的流程图。
图7是表示有关本发明的实施方式1的第1例的编码比特流的结构的图。
图8是表示有关本发明的实施方式1的第1例的编码比特流的结构的图。
图9是表示有关本发明的实施方式1的第1例的切片头的语法构造的图。
图10是表示有关本发明的实施方式1的第2例的编码比特流的结构的图。
图11是表示有关本发明的实施方式1的第2例的编码比特流的结构的图。
图12是表示有关本发明的实施方式1的第2例的序列参数集的语法构造的图。
图13是表示有关本发明的实施方式1的第2例的切片头的语法构造的图。
图14是表示有关本发明的实施方式1的第3例的编码比特流的结构的图。
图15是表示有关本发明的实施方式1的第3例的编码比特流的结构的图。
图16是表示有关本发明的实施方式1的第3例的序列参数集的语法构造的图。
图17是表示有关本发明的实施方式1的第3例的切片头的语法构造的图。
图18是表示有关本发明的实施方式1的第4例的编码比特流的结构的图。
图19是表示有关本发明的实施方式1的第4例的序列参数集的语法构造的图。
图20是表示有关本发明的实施方式1的第4例的图片参数集的语法构造的图。
图21是表示有关本发明的实施方式1的第4例的切片头的语法构造的图。
图22是表示有关本发明的实施方式1的第5例的编码比特流的结构的图。
图23是表示有关本发明的实施方式1的第5例的序列参数集的语法构造的图。
图24是表示有关本发明的实施方式1的第5例的图片参数集的语法构造的图。
图25是表示有关本发明的实施方式1的第5例的切片头的语法构造的图。
图26是有关本发明的实施方式1的图像解码装置的框图。
图27是有关本发明的实施方式1的图像解码方法的流程图。
图28是有关本发明的实施方式2的图像编码方法的流程图。
图29是有关本发明的实施方式2的图像解码方法的流程图。
图30是实现内容分发服务的内容供给系统的整体结构图。
图31是数字广播用系统的整体结构图。
图32是表示电视机的结构例的框图。
图33是表示对作为光盘的记录介质进行信息的读写的信息再现/记录部的结构例的框图。
图34是表示作为光盘的记录介质的构造例的图。
图35A是表示便携电话的一例的图。
图35B是表示便携电话的结构例的框图。
图36是表示复用数据的结构的图。
图37是示意地表示各流在复用数据中怎样被复用的图。
图38是更详细地表示在PES包序列中视频流怎样被保存的图。
图39是表示复用数据的TS包和源包的构造的图。
图40是表示PMT的数据结构的图。
图41是表示复用数据信息的内部结构的图。
图42是表示流属性信息的内部结构的图。
图43是表示识别影像数据的步骤的图。
图44是表示实现各实施方式的运动图像编码方法及运动图像解码方法的集成电路的结构例的框图。
图45是表示切换驱动频率的结构的图。
图46是表示识别影像数据、切换驱动频率的步骤的图。
图47是表示将影像数据的标准与驱动频率建立了对应的查找表的一例的图。
图48A是表示将信号处理部的模块共用的结构的一例的图。
图48B是表示将信号处理部的模块共用的结构的另一例的图。
具体实施方式
(作为本发明的基础的认识)
HEVC影像编码方式中的最近的进展之一是使用缓冲器记述的DPB管理的导入。代替对从DPB中删除的对象的图片进行定义,缓冲器记述对DPB中保持的图片进行定义。即,缓冲器记述是表示DPB中存储的全部参照图片的图片识别符的列表。该列表的各项目被称为缓冲器要素(buffer element)。缓冲器要素具有图片序列号(POC)数这样的各图片固有的图片识别符、temporal_id值这样的追加的图片信息。
该缓冲器记述在图片的编码或解码开始时是有效的。从DPB中删除未包含在有效的缓冲器记述中的图片。该缓冲器记述的优点在于改善针对发送时的损失的鲁棒性、以及简化不存在的图片的处理等。
这里,在影像序列中包含的多个图片中,有时使用相同的图片参照构造。例如,在低延迟编码构造中,如图1所示,使用以4个图片单位周期地重复相同层级构造而得到的周期性聚类构造。另外,将该重复单位(这里为4个图片)称为聚类(cluster)。
在图1所示的例子中,图片编号(P0~P12)示出固有的编码顺序和固有的图片显示或输出顺序双方。图片P0、P4、P8和P12构成图片的第1层。这些图片例如通过应用最弱的量化而以最高画质被编码。图片P2、P6和P10构成第2层。这些图片以比第1层低的画质被编码。图片P1、P3、P5、P7、P9和P11构成第3层。这些图片以最低画质被编码。在这种周期性的参照构造中,聚类内的相对位置相同的图片(例如P1、P5和P9)通常使用相同的相对图片参照构造。例如,针对图片P5,图片P4和P2被用作参照图片,针对图片P9,图片P8和P6被用作参照图片。
为了对上述构造的周期性的聚类构造进行调整,考虑周期性地对缓冲器记述发送信号的方法。该缓冲器记述指定参照图片相对于编码或解码对象图片的时间上的距离或位置。由此,能够确定DPB中存储的参照图片。例如,该缓冲器记述临时包含在图片参数集(PPS)中进行信号发送。然后,在聚类内具有相同相对位置的多个图片的切片头(sliceheader)中反复参照该缓冲器记述。例如,指定{-1,-3}的相对位置的缓冲器记述能够用于指定{P4,P2}作为参照图片的P5和指定{P8,P6}作为参照图片的P9双方。
图2是表示该情况下的缓冲器记述的信号发送构造的一例的图。图2所示的编码比特流500包含SPS(时序参数集)501(SPS0)、多个PPS(图片参数集)502(PPS0和PPS1)、多个图片数据503。各图片数据503包含多个切片(slice)数据535。各切片数据535包含切片头541和切片数据部542。切片数据部542包含多个CU(Coding Unit,编码单元)数据543。
各PPS502包含PPS识别符522(pps_id)和缓冲器记述定义信息512(BD定义)。缓冲器记述定义信息512表示多个缓冲器记述515(BD0~BDn)。各缓冲器记述515包含多个缓冲器要素515A(BE0~BE2)。
这样,通过图片参数集合502中包含的缓冲器记述定义信息512来定义多个缓冲器记述515。并且,通过PPS固有的PPS识别符522来识别各PPS502。
切片头541包含PPS选择信息533(pps_select)和缓冲器记述更新信息523(BD更新)。
PPS选择信息533表示切片的编码或解码时所参照的PPS502。在图2的例子中,pps_select=0,选择具有pps_id=0的PPS0。
缓冲器记述更新信息523包含用于确定从多个缓冲器记述515中选择出的缓冲器记述的信息。在图2的例子中,选择缓冲器记述BD1。进而,缓冲器记述更新信息523包含缓冲器记述修正信息。缓冲器记述修正信息对选择出的缓冲器记述515中包含的选择出的缓冲器要素515A分配图片识别符。这里,使用相对位置或图片固有的识别符来确定图片识别符。图片固有的识别符例如是图片序列号(POC)数。在图2的例子中,由POC数=214识别出的图片P214被分配给缓冲器记述BD1中包含的缓冲器要素BE0。该修正仅适用于当前的处理对象的切片,不适用于后续切片。
在编码比特流中,使用参照索引来识别预测单位(N×N块)的帧间预测处理中使用的参照图片。全部可利用的参照图片和与其相关联的参照索引记述在参照列表中。在使用双方向帧间预测的情况下,在2个群组的参照图片和与其相关联的参照索引的记述中使用2个参照列表。与更大的参照索引相比,更小的参照索引在编码比特流中以更少的比特来表现。因此,通过对频繁使用的参照图片分配更小的参照索引,实现更高的编码效率。
在切片的编码或解码的开始时,通过根据预先确定的排序方式对全部可利用的参照图片分配索引,生成初始设定的参照列表。图像编码装置还可以对初始设定的参照列表中包含的参照索引进行重新排列,在编码比特流中包含的切片头中写入参照列表重新排列信息。重新排列后的参照列表仅适用于当前的处理对象的切片,不适用于后续切片。
这里,在记述参照列表的重新排列的参照列表重新排列信息(参数)中,为了确定参照列表中包含的重新排列对象的参照图片,使用图片号码的差值或POC数的差值。具体而言,这些差值是处理对象的切片(或图片)的图片号码(POC数)与重新排列对象的参照图片的图片号码(POC数)的差值、或重新排列对象的参照图片的图片号码(POC数)与紧挨着的之前的重新排列对象的参照图片的图片号码(POC数)的差值。这里,该差值是正或负的值。此外,使用用长期(long term)的图片号码的绝对值识别长期的参照图片的独立的参数集,将参照列表中包含的长期的参照图片重新排列。
这里,在上述技术中,在参照列表重新排列信息中使用图片号码或POC数确定重新排列对象的参照图片。另一方面,将保持在DPB中的有效的参照图片列表化,以便在有效的缓冲器记述中能够单独地识别。即,本申请的发明者发现,在该缓冲器记述中使用的能够容易利用的信息并没有被用在参照列表重新排列信息中。这样,在上述技术的参照列表重新排列信息中使用了冗余的信息。
此外本申请的发明者发现,在上述技术中,有记述参照列表的重新排列的信息(参数)仅能够应用到编码或解码对象切片中一次的问题。但是,如上述那样,有在影像序列中包含的多个图片中使用相同的参照构造的情况。结果,将记述有相同的参照列表重新排列处理的信息在编码比特流内反复进行信号发送。
这样,本申请的发明者发现,通过在编码比特流中重复包含同样的信息,有编码效率下降的课题。
为了解决上述课题,有关本发明的一技术方案的图像编码方法,使用用来指定保持在缓冲器中的图片的缓冲器记述、和用来指定所参照的图片的参照列表将图像编码,从而生成编码比特流,其特征在于,包括:缓冲器记述写入步骤,将定义缓冲器记述的缓冲器记述定义信息向上述编码比特流写入;参照列表生成步骤,生成包含由上述缓冲器记述所表示的多个图片的初始设定的参照列表;重新排列步骤,进行将上述初始设定的参照列表中包含的图片的顺序重新排列的重新排列处理;重新排列信息写入步骤,将表示上述重新排列处理的内容的参照列表重新排列信息向上述编码比特流写入;以及编码步骤,使用上述缓冲器记述和通过上述重新排列处理得到的参照列表,将上述图像编码;在上述参照列表重新排列信息中,作为上述重新排列的对象的图片,由在该图像编码方法中在该参照列表重新排列信息之外也被使用的索引来确定。
由此,在重新排列对象的图片的确定中,援用在其他处理中使用的索引。由此,参照列表重新排列信息的冗余性及复杂性被降低,所以图像编码装置及图像解码装置的运算量被降低。
例如,也可以将上述缓冲器记述定义信息和上述参照列表重新排列信息向属于不同类型的NAL网络提取层的不同的头写入。
由此,在重新排列对象的图片的确定中,援用在缓冲器记述中使用的缓冲器元素索引。由此,参照列表重新排列信息的冗余性及复杂性被降低,所以图像编码装置及图像解码装置的运算量被降低。
例如,上述重新排列步骤也可以包括:选择步骤,从上述参照列表所包含的多个图片中选择重新排列对象的第1图片;分配步骤,向上述第1图片分配预先决定的第1参照索引;以及增加步骤,将与上述第1参照索引的值以上的值的参照索引建立了对应的图片的参照索引增加1,该图片是上述参照列表中包含的上述第1图片以外的图片。
例如,也可以是,在上述重新排列步骤中,将包括上述选择步骤、上述分配步骤和上述增加步骤的处理重复预先决定的次数;在最初的上述处理中,将上述第1参照索引设定为零;在第2次以后的上述处理中,使上述第1参照索引与前一次的上述处理相比增加1。
例如,也可以是,在上述参照列表重新排列信息中,将作为上述重新排列的对象的图片用上述索引的绝对值表示。
例如,也可以是,在上述参照列表重新排列信息中,将作为重新排列对象的多个对象图片中的最初的对象图片,用上述索引的绝对值表示;将上述多个对象图片中的上述最初的对象图片以外的对象图片,用与前一个对象图片的上述索引之间的差值表示。
例如,也可以是,上述缓冲器记述包括分别与指定1张图片的缓冲器元素建立了对应的缓冲器元素索引;上述索引是上述缓冲器元素索引。
由此,该图像编码方法能够将参照列表重新排列信息的信息量削减。
例如,也可以是,上述缓冲器记述定义信息定义包括上述缓冲器记述的多个缓冲器记述;上述缓冲器记述定义信息被向上述编码比特流中包含的序列参数集写入;上述图像编码方法还包括:参照列表定义写入步骤,将定义了与上述多个缓冲器记述一对一地对应的多个参照列表记述、并且包含上述参照列表重新排列信息的参照列表记述定义信息,向上述编码比特流中包含的处理对象的切片的切片头写入;以及选择信息写入步骤,从上述多个缓冲器记述中选择一个缓冲器记述,将确定所选择的缓冲器记述的缓冲器记述选择信息向上述切片头写入;在上述编码步骤中,使用上述被选择的缓冲器记述、和与该被选择的缓冲器记述对应的参照列表记述,将上述处理对象的切片编码。
由此,有关本发明的一技术方案的图像编码方法将参照列表记述定义信息向在多个图片中共同使用的图片参数集内写入。由此,该图像编码方法与将参照列表记述定义信息向切片头写入的情况相比能够削减冗余的信息,所以能够改善编码效率。
此外,有关本发明的一技术方案的图像解码方法,使用用来指定保持在缓冲器中的图片的缓冲器记述、和用来指定所参照的图片的参照列表,将编码比特流解码,其特征在于,包括:缓冲器记述取得步骤,从上述编码比特流取得定义缓冲器记述的缓冲器记述定义信息;参照列表生成步骤,生成包含由上述缓冲器记述表示的多个图片的初始设定的参照列表;重新排列信息取得步骤,从上述编码比特流取得表示对于上述初始设定的参照列表的重新排列处理的内容的参照列表重新排列信息;重新排列步骤,进行按照上述参照列表重新排列信息将上述初始设定的参照列表中包含的图片的顺序重新排列的上述重新排列处理;以及解码步骤,使用上述缓冲器记述和通过上述重新排列处理得到的参照列表,将处理对象的图片或切片解码;在上述参照列表重新排列信息中,上述重新排列的对象的图片,由在该图像解码方法中在该参照列表重新排列信息之外也被使用的索引来确定。
由此,在重新排列对象的图片的确定中援用在其他处理中使用的索引。由此,参照列表重新排列信息的冗余性及复杂性被降低,图像解码装置的运算量被减少。
此外,有关本发明的一技术方案的图像编码装置,使用用来指定保持在缓冲器中的图片的缓冲器记述、和用来指定所参照的图片的参照列表将图像编码,从而生成编码比特流,其特征在于,具备帧存储器控制部,上述帧存储器控制部,将定义缓冲器记述的缓冲器记述定义信息向上述编码比特流写入;生成包含由上述缓冲器记述所表示的多个图片的初始设定的参照列表;进行将上述初始设定的参照列表中包含的图片的顺序重新排列的重新排列处理;以及将表示上述重新排列处理的内容的参照列表重新排列信息向上述编码比特流写入;上述图像编码装置使用上述缓冲器记述和通过上述重新排列处理得到的参照列表,将上述图像编码;在上述参照列表重新排列信息中,作为上述重新排列的对象的图片,由在该图像编码装置中在该参照列表重新排列信息之外也被使用的索引来确定。
由此,在重新排列对象的图片的确定中援用在其他处理中使用的索引。由此,参照列表重新排列信息的冗余性及复杂性被降低,图像编码装置及图像解码装置的运算量被减少。
此外,有关本发明的一技术方案的图像解码装置,使用用来指定保持在缓冲器中的图片的缓冲器记述、和用来指定所参照的图片的参照列表,将编码比特流解码,其特征在于,具备帧存储器控制部,上述帧存储器控制部,从上述编码比特流取得定义缓冲器记述的缓冲器记述定义信息;生成包含由上述缓冲器记述表示的多个图片的初始设定的参照列表;从上述编码比特流取得表示对于上述初始设定的参照列表的重新排列处理的内容的参照列表重新排列信息;以及进行按照上述参照列表重新排列信息将上述初始设定的参照列表中包含的图片的顺序重新排列的上述重新排列处理;上述图像解码装置使用上述缓冲器记述和通过上述重新排列处理得到的参照列表,将处理对象的图片或切片解码;在上述参照列表重新排列信息中,上述重新排列的对象的图片,由在该图像编解码装置中在该参照列表重新排列信息之外也被使用的索引来确定。
由此,在重新排列对象的图片的确定中援用在其他处理中使用的索引。由此,参照列表重新排列信息的冗余性及复杂性被降低,该图像解码装置的运算量被减少。
此外,有关本发明的一技术方案的图像编码解码装置具备上述图像编码装置和上述图像解码装置。
另外,这些总括或具体的方式可以通过系统、方法、集成电路、计算机程序或计算机可读取的CD-ROM等的记录介质来实现,也可以通过系统、方法、集成电路、计算机程序和记录介质的任意组合来实现。
下面,参照附图对实施方式进行具体说明。
另外,以下说明的实施方式均示出总括或具体的例子。以下实施方式所示的数值、形状、材料、结构要素、结构要素的配置位置和连接方式、步骤、步骤的顺序等是一例,并不是限定本发明的主旨。并且,关于以下实施方式的结构要素中的、未记载于示出最上位概念的独立权利要求中的结构要素,作为任意的结构要素进行说明。
并且,下面说明2个实施方式。本领域技术人员能够明白,为了进一步提高周期性的参照列表记述的有用性和适用性,可以对这些实施方式进行组合。
(实施方式1)
在本实施方式中,在重新排列对象的图片的确定中,援用在缓冲器记述中使用的缓冲器元素索引。由此,参照列表重新排列信息的冗余性及复杂性被降低,所以图像编码装置及图像解码装置的运算量被减少。
[编码装置]
图3是表示本实施方式的图像编码装置100的构造的框图。
图像编码装置100通过以块单位对输入图像信号120进行编码,生成编码比特流132。如图3所示,图像编码装置100具有减法器101、正交变换部102、量化部103、逆量化部104、逆正交变换部105、加法器106、块存储器107、帧存储器108、帧内预测部109、帧间预测部110、图片类型决定部111、可变长度编码部112、帧存储器控制部113。
输入图像信号120是影像或图像比特流。减法器101通过计算预测图像数据131与输入图像信号120的差分,生成预测误差数据121。正交变换部102将预测误差数据121正交变换为频率系数122。量化部103通过对频率系数122进行量化,生成量化值123。可变长度编码部112通过对量化值123进行熵编码(可变长度编码),生成编码比特流132。
逆量化部104通过对量化值123进行逆量化,生成频率系数124。逆正交变换部105通过对频率系数122进行逆正交变换,生成预测误差数据125。加法器106通过对预测误差数据125和预测图像数据131进行相加,生成解码图像数据126。块存储器107以块单位保持解码图像数据126作为解码图像数据127。帧存储器108以帧单位保持解码图像数据126作为解码图像数据128。
帧内预测部109通过进行帧内预测(intra prediction),生成编码对象块的预测图像数据129。具体而言,帧内预测部109在块存储器107中存储的解码图像数据127内进行检索,估计与输入图像信号120最相似的图像区域。
帧间预测部110通过使用帧存储器108中保存的帧单位的解码图像数据128进行帧间预测(inter prediction),生成编码对象块的预测图像数据130。
图片类型决定部111选择预测图像数据129和预测图像数据130中的一方,输出所选择出的数据作为预测图像数据131。
帧存储器控制部113对帧存储器108中存储的解码图像数据128进行管理。具体而言,帧存储器控制部113决定是在帧存储器208中保持解码图像数据128还是从帧存储器208中删除解码图像数据128。并且,帧存储器控制部113生成由帧间预测部110使用的参照列表。进而,帧存储器控制部113生成包含缓冲器记述定义信息和参照列表记述定义信息的帧存储器控制信息133。通过可变长度编码部112生成包含该帧存储器控制信息133的编码比特流132。
[编码处理]
接着,对基于上述图像编码装置100的图像编码方法进行说明。
图4是本实施方式的图像编码方法的流程图。
首先,图像编码装置100向比特流的第1头写入定义缓冲器记述的缓冲器记述定义信息(S101)。缓冲器记述为了指定保持在缓冲器(帧存储器)中的图片而使用。具体而言,各缓冲器记述包括多个缓冲器元素。各缓冲器元素包括与保存在帧存储器中的1张参照图片对应的固有的图片识别符(例如POC数)。即,各缓冲器记述表示保存在帧存储器中的多个参照图片。
接着,图像编码装置100生成包括由缓冲器记述表示的全部的参照图片的初始设定的参照列表(S102)。这里,所谓初始设定的参照列表,是在图像编码装置及图像解码装置中按照预先决定的初始设定的参照列表制作方式而制作的参照列表。即,作为对于相同的图片(或切片)的初始设定的参照列表,在图像编码装置及图像解码装置中生成相同的参照列表。
接着,图像编码装置100进行将在所生成的初始设定的参照列表中包含的多个参照图片的顺序重新排列的重新排列处理(S103)。
接着,图像编码装置100将表示步骤S103的重新排列处理的内容的参照列表重新排列信息向编码比特流的第2头写入(S104)。这里,在参照列表重新排列信息中,作为重新排列的对象的图片由缓冲器记述中的缓冲器元素索引确定。
最后,图像编码装置100使用缓冲器记述、和通过重新排列处理得到的参照列表,将处理对象的切片编码(S105)。此外,图像编码装置100生成包含通过编码得到的编码数据的编码比特流132。
这里,上述第1及第2头属于相同的NAL(Network Abstraction Layer:网络提取层)单元。例如,该相同的NAL单元是切片NAL单元。即,第1及第2头是单一的切片头。另外,该相同的NAL单元也可以是APS(Adaptation Parameter Set:适应参数集)NAL单元、PPS(图片参数集)NAL单元或SPS(序列参数集)NAL单元。
此外,上述第1及第2头也可以属于不同的NAL单元类型的NAL单元。例如,第1头属于SPS NAL单元,第2头属于APS NAL单元。另外,也可以第1头属于PPS NAL单元,第2头属于APS NAL单元。也可以第1头属于SPS NAL单元,第2头属于切片NAL单元。也可以第1头属于PPS NAL单元,第2头属于切片NAL单元。
以下,对图4所示的初始设定的参照列表的重新排列处理(S103)进行说明。图5是该重新排列处理(S103)的第1例的流程图。
首先,图像编码装置100从处理对象的参照列表中包含的多个参照图片识别并选择重新排列对象的参照图片(S111)。这里,在编码比特流中,重新排列对象的参照图片使用有效的缓冲器记述中的缓冲器元素索引表示。
接着,图像编码装置100在参照列表中,对重新排列对象的参照图片分配预先决定的参照索引(S112)。
接着,图像编码装置100将参照列表中包含的作为上述重新排列对象的参照图片以外的参照图片、并且是与上述预先决定的参照索引的值以上的值的参照索引建立了对应的参照图片的参照索引增加1(S113)。
以下,说明具体例。例如,在步骤S111中选择参照图片R。接着,在步骤S112中,对参照图片R分配参照索引=2。接着,在步骤S113中,使初始设定的参照列表中包含的其他参照图片中的、被分配了参照索引=2以上的参照图片的参照索引增加到3以上。由此,生成进行了重新排列的参照列表。
图6是重新排列处理(S103)的第2例的流程图。
图6所示的重新排列处理(S103)包括预先决定的次数的重复处理。各重复处理包括与上述图5所示的步骤S111~S113同样的处理。具体而言,各重复处理包括选择重新排列对象的参照图片的处理(S122)、对重新排列对象的参照图片分配参照索引的处理(S123)、和使参照索引增加1的处理(S124)。例如,编码比特流包括表示该重复处理的次数的信息。另外,编码比特流也可以包含表示在各重复处理之后是否还执行重复处理的信息。
首先,图像编码装置100在最初的重复处理中,将第1参照索引设定为零(S121),进行步骤S122~S124的处理。
具体而言,图像编码装置100从处理对象的参照列表中包含的多个参照图片中识别并选择重新排列对象的参照图片(S122)。这里,在编码比特流中,将重新排列对象的参照图片使用有效的缓冲器记述中的缓冲器元素索引表示。
接着,图像编码装置100在参照列表中对重新排列对象的参照图片分配预先决定的参照索引(=0)(S123)。
接着,图像编码装置100将参照列表中包含的作为上述重新排列对象的参照图片以外的参照图片、而且是与上述预先决定的参照索引的值以上的值的参照索引建立了对应的参照图片的参照索引增加1(S124)。
在第1参照索引的值比规定值小的情况下(S125中“否”),即在未将重复处理执行预先决定的次数的情况下,图像编码装置100使第1参照索引的值增加1(S126),然后执行步骤S122以后的处理。即,在将重复处理执行预先决定的次数之前(S125中“是”),重复执行步骤S126、S122~S124的处理。
这里,在本实施方式中,在编码比特流所包含的参照列表重新排列信息中,将重新排列的对象的参照图片用缓冲器元素索引的绝对值表示。
另外,在参照列表重新排列信息中,也可以将重新排列的对象的多个参照图片中的最初的参照图片用缓冲器元素索引的绝对值表示,将其以后的重新排列的对象的参照图片用与紧挨着的之前的重新排列对象的参照图片的缓冲器元素索引的差值表示。即也可以是,在最初的重复处理中,将重新排列对象的参照图片用缓冲器元素索引的绝对值表示,在第2次以后的重复处理中,将重新排列对象的参照图片使用缓冲器元素索引的差值表示。
[语法图解:第1例]
图7及图8是表示本实施方式的第1例的、编码比特流内的缓冲器记述定义信息及参照列表记述定义信息的位置的语法图解。
图7所示的编码比特流132包括SPS301、PPS302和多个图片数据303。各图片数据303包括图片头331和图片数据部332。图片数据部332包括多个切片数据335。
各切片数据335包括切片头341和切片数据部342。切片数据部342包括多个CU(Coding Unit)数据343。
切片头341包括缓冲器记述定义信息312(BD定义)和参照列表记述定义信息313(RLD定义)。
缓冲器记述定义信息312定义缓冲器记述315。例如,该缓冲器记述315与上述缓冲器记述515同样,包括多个缓冲器元素。
参照列表记述定义信息313定义多个参照列表记述316。该参照列表记述定义信息313包括表示是否将初始设定的参照列表重新排列的重新排列标志和上述参照列表重新排列信息。
此外,在图8所示的编码比特流132A中,缓冲器记述定义信息312及参照列表记述定义信息313不是包含在切片头341A而是包含在图片头331A中。另外,缓冲器记述定义信息312及参照列表记述定义信息313也可以包含在HEVC的APS中。这里,图片包括多个切片。由此,在一个图片所包含的全部的切片中,使用按照缓冲器记述定义信息312及参照列表记述定义信息313形成的多个参照列表中的某个。
另外,也可以将上述说明中的“切片”替换为“子图片单元(SPU)”。所谓子图片单元,例如是瓦片(tile)、熵切片及构成波面处理的子图片分割的块群(WPP(Wave frontParallel Processing unit))等。
将上述缓冲器记述定义信息312及参照列表记述定义信息313按照在图9所示的表中表示的模拟代码,在切片头的语法构造中进行信号发送。另外,SPU头及图片头的语法构造也是同样的。
记述符(Descriptor)定义基于与AVC影像编码方式相同的比特表现的各语法元素的解析处理。
ue(v)是左侧比特为开头的无符号整数的指数哥伦布编码语法要素。
u(n)是n比特的无符号整数。在语法表中,当n为“v”时,比特数依赖于其他语法要素的值而变动。
以下,说明与表示缓冲器记述定义信息和参照列表记述定义信息的语法元素建立了关联的意义。
图9中的PredictionType表示对象切片(或SPU、或图片)的预测类型。PredictionType=P意味着单向预测,PredictionType=B意味着双向预测。该PredictionType是已经在编码比特流内表示的信息,例如是之前的切片头的语法要素、或在APS语法构造中已经表示的信息。
以下,对图9所示的语法元素进行说明。
作为变量或列表的BDDeltaPOC及BDTemporalID表示有效的缓冲器记述BD中的缓冲器元素BE的顺序。
number_of_bes_minus1表示缓冲器记述BD中包含的缓冲器元素BE的数量。该缓冲器元素BE的数量是(number_of_bes_minus1+1)。
first_delta_poc_sign_flag表示对象图片与缓冲器记述BD中包含的缓冲器元素BE[0]建立了关联的参照图片的POC的差的符号(正负)。当first_delta_poc_sign_flag[i]是零时,意味着POC的差是正值,当first_delta_poc_sign_flag[i]是“1”时,意味着POC的差是负值。
first_delta_poc_minus1表示对象图片、与和缓冲器记述BD中包含的缓冲器元素BE[0]建立了关联的参照图片的POC的差绝对值。first_delta_poc_sign_flag及first_delta_poc将带有符号的变量BDDeltaPOC[0]的值如以下这样定义。
BDDeltaPOC[0]=
(first_delta_poc_minus1+1)
×(1-2×first_delta_poc_sign_flag)
在将BDDeltaPOC[0]与缓冲器记述BD所包含的多个缓冲器元素BE[j]建立了关联的全部的参照图片中,为最大的带有符号的POC差值。
first_temporal_id是指时间识别符,用预先决定的比特数表现。例如,该比特数已经在编码比特流内表示,例如在有效的SPS或有效的PPS中表示。first_temporal_id将无符号的变量BDTemporalID[0]的值如以下这样定义。
BDTemporalID[0]=first_temporal_id
delta_poc_minus1[j]表示从与缓冲器记述BD中包含的缓冲器元素BE[j]建立了关联的参照图片到与缓冲器元素BE[j+1]建立了关联的参照图片的POC的负的距离值。delta_poc_minus1[j]将带有符号的变量BDDeltaPOC[j+1]的值如以下这样定义。
BDDeltaPOC[j+1]=
BDDeltaPOC[j]-(delta_poc_minus1[j]+1)
temporal_id[j]是指时间识别符,与first_temporal_id同样用预先决定的比特数表现。temporal_id将无符号的变量BDTemporalID[j+1]的值如以下这样定义。
BDTemporalID[j+1]=temporal_id[j]
当ref_pic_list_modification_flag_l0是“1”时,意味着为了确定与缓冲器记述BD对应的参照图片列表RL0,存在num_ref_idx_l0_active_minus1及more_modification_flag。当ref_pic_list_modification_flag_l0是零时,意味着不存在num_ref_idx_l0_active_minus1及more_modification_flag。
假设当ref_pic_list_modification_flag_l0是“1”时,接着ref_pic_list_modification_flag_l0的more_modification_flag是“1”的次数不超过num_ref_idx_l0_active_minus1+1。
当ref_pic_list_modification_flag_l1是“1”时,意味着为了确定与缓冲器记述BD对应的参照图片列表RL1而存在num_ref_idx_l1_active_minus1及more_modification_flag。当ref_pic_list_modification_flag_l1是零时,意味着不存在num_ref_idx_l1_active_minus1及more_modification_flag。
假设当ref_pic_list_modification_flag_l1是“1”时、接着ref_pic_list_modification_flag_l1的more_modification_flag是“1”的次数不超过(num_ref_idx_l1_active_minus1+1)。
num_ref_idx_l0_active_minus1表示对于与缓冲器记述BD对应的参照图片列表RL0的最大参照索引。
num_ref_idx_l1_active_minus1表示对于与缓冲器记述BD对应的参照图片列表RL1的最大参照索引。
伴随着be_idx的more_modification_flag是指哪个参照图片被再映射。当more_modification_flag是“1”时,意味着be_idx存在于紧挨着more_modification_flag的之后。当more_modification_flag是零时,意味着参照图片列表中包含的参照图片的再映射的循环的结束。
be_idx_in_ref_pic_list表示在对象缓冲器记述BD中与缓冲器元素BE[be_idx_in_ref_pic_list]建立了关联的参照图片。be_idx_in_ref_pic_list识别在与缓冲器记述BD建立了关联的对象参照列表RL0或RL1中被再映射的图片。将该再映射或重新排列处理在图5及图6所示的处理之后进行。
[语法图解:第2例]
图10及图11是表示本实施方式的第2例的编码比特流内的缓冲器记述定义信息及参照列表记述定义信息的位置的语法图解。另外,以下主要说明与第1例的差异点,重复的说明省略。此外,对于与图7及图8所示的要素同样的要素赋予相同的标号。这些在以下的其他例子中也同样。
图10所示的编码比特流132B在缓冲器记述定义信息312包含在SPS中这一点,与图7所示的编码比特流132不同。具体而言,图10所示的编码比特流132B相对于图7所示的编码比特流132,SPS301B、PPS302B及切片头341B与SPS301、PPS302及切片头341不同。
SPS301B包括缓冲器记述定义信息312和SPS识别符311(sps_id)。
缓冲器记述定义信息312定义多个缓冲器记述315。此外,缓冲器记述定义信息312包括表示该缓冲器记述定义信息312中包含的缓冲器记述315的数量的缓冲器记述数314(number_of_bds)。
此外,将SPS301B通过固有的SPS识别符311(例如sps_id=0)识别。
各PPS302B包括SPS选择信息321(sps_select)和PPS识别符322(pps_id)。SPS选择信息321(例如sps_select=0)表示参照目标的SPS301B。此外,将各PPS302B通过固有的PPS识别符322(例如pps_id=0)识别。
切片头341B包括PPS选择信息(pps_select)333、缓冲器记述选择信息334(bd_select)、缓冲器记述更新信息323(BD更新)和参照列表记述定义信息313。
PPS选择信息333(例如pps_select=0)表示参照目标的PPS302B。由该PPS选择信息333从切片头341B参照一个PPS302B。进而,通过PPS302B中包含的SPS选择信息321,从所参照的PPS302B参照SPS301B。由此,将编码对象的切片与在SPS301B中定义的可利用的多个缓冲器记述建立关联。
缓冲器记述选择信息334(例如bd_select=2)确定多个缓冲器记述中的一个。由此,从多个缓冲器记述中选择一个缓冲器记述。
缓冲器记述更新信息323是用来将所选择的缓冲器记述更新的信息。并且,将更新后的缓冲器记述用在对象切片的编码或解码处理中。另外,在由SPS301B中包含的缓冲器记述定义信息312定义的初始缓冲器记述没有被更新的情况下,切片头341B不包含缓冲器记述更新信息323。
另外,如图11所示的编码比特流132C那样,缓冲器记述定义信息312也可以包含在PPS302C中。
将上述缓冲器记述定义信息312按照图12所示的表所示的模拟代码,在序列参数集的语法构造中进行信号发送。另外,图片参数集的语法构造也是同样的。此外,将上述缓冲器记述更新信息323及参照列表记述定义信息313按照图13所示的表所示的模拟代码,在切片头的语法构造中进行信号发送。另外,SPU头及图片头的语法构造也是同样的。
以下,对图12所示的语法元素进行说明。
作为变量或列表的BDDeltaPOC[i]及BDTemporalID[i]表示有效的缓冲器记述BD[i]中的缓冲器元素BE[i]的顺序。
bits_for_temporal_id表示first_temporal_id及temporal_id的比特数。
number_of_bds(缓冲器记述数314)表示SPS301中包含的number_of_bes_minus1的数量。即,number_of_bds表示SPS301中包含的缓冲器记述315的数量。
number_of_bes_minus1[i]表示缓冲器记述BD[i]中包含的缓冲器元素的数量。
first_delta_poc_sign_flag[i]表示对象图片、与和缓冲器记述BD[i]中包含的缓冲器元素BE[i][0]建立了关联的参照图片的POC的差的符号(正负)。当first_delta_poc_sign_flag[i]是零时,意味着POC的差是正值,当first_delta_poc_sign_flag[i]是“1”时,意味着POC的差是负值。
first_delta_poc_minus1[i]表示对象图片、与和缓冲器记述BD[i]中包含的缓冲器元素BE[i][0]建立了关联的参照图片的POC的差绝对值。first_delta_poc_sign_flag[i]及first_delta_poc[i]如以下这样定义带有符号的变量BDDeltaPOC[i][0]的值。
BDDeltaPOC[i][0]=
(first_delta_poc_minus1[i]+1)
×(1-2×first_delta_poc_sign_flag[i])
将BDDeltaPOC[i][0]定义为,在与缓冲器记述BD[i]中包含的多个缓冲器元素BE[i][j]建立了关联的全部的参照图片中最大的带有符号的POC差值。
first_temporal_id[i]是指时间识别符,由bits_for_temporal_id比特表示。first_temporal_id[i]如以下这样定义无符号的变量BDTemporalID[i][0]的值。
BDTemporalID[i][0]=first_temporal_id[i]
delta_poc_minus1[i][j]表示从与缓冲器记述BD[i]中包含的缓冲器元素BE[i][j]建立了关联的参照图片到与缓冲器元素BE[i][j+1]建立了关联的参照图片的POC的负的距离值。delta_poc_minus1[i][j]如以下这样定义带有符号的变量BDDeltaPOC[i][j+1]的值。
BDDeltaPOC[i][j+1]=
BDDeltaPOC[i][j]-(delta_poc_minus1[i][j]+1)
temporal_id[i][j]是指时间识别符,由bits_for_temporal_id比特表示。temporal_id[i]如以下这样定义无符号的变量BDTemporalID[i][j+1]的值。
BDTemporalID[i][j+1]=temporal_id[i][j]
以下,对图13所示的语法元素进行说明。
PredictionType表示对象切片(或SPU、或图片)的预测类型。另外,PredictionType的详细情况与上述是同样的。
作为变量或列表的BDDeltaPOC[bd_select]及BDTemporalID[bd_select]表示所选择的缓冲器记述BD[bd_select]中的缓冲器元素BE[bd_select]的顺序。作为更新后的变量或列表的BDDeltaPOC[bd_select]及BDTemporalID[bd_select]表示在对象切片的编码或解码处理中使用的有效的缓冲器记述。
bd_select表示向表示由切片头修正的缓冲器记述BD[bd_select]的BDDeltaPOC及BDTemporalID的列表的索引。
bd_modification_operation表示对所选择的缓冲器记述BD[bd_select]应用的修正工序。当bd_modification_operation是零时,意味着用来将缓冲器记述BD[bd_select]修正的循环的结束。
在本方式中,当bd_modification_operation是“1”时,对在缓冲器记述BD[bd_select]中由be_idx_in_bd_update表示的缓冲器元素赋予对于对象图片的POC差值。并且,该POC差值表示参照图片的POC数与对象图片或切片的POC数的差。
在另一方式中,也可以定义由bd_modification_operation表示的追加的缓冲器记述修正工序。作为其一例,可以举出用来对于用缓冲器元素表示的图片赋予表示是短期参照图片还是长期参照图片的标记的工序。
be_idx_in_bd_update表示在缓冲器记述BD[bd_select]中被修正的缓冲器元素。
delta_poc_sign_flag表示对象图片、与和缓冲器记述BD[bd_select]内的缓冲器元素BE[bd_select][be_idx_in_bd_update]建立了关联的参照图片的POC的差的符号(正负)。当delta_poc_sign_flag是零时,意味着POC的差是正值,当delta_poc_sign_flag是“1”时,意味着POC的差是负值。
delta_poc_minus1表示对象图片与和缓冲器记述BD[bd_select]内的缓冲器元素BE[bd_select][be_idx_in_bd_update]建立了关联的参照图片的POC绝对差值。first_delta_poc_sign_flag和first_delta_poc如以下这样定义带有符号的变量BDDeltaPOC[bd_select][be_idx_in_bd_update]的值。
BDDeltaPOC[bd_select][be_idx_in_bd_update]
=(delta_poc_minus1+1)
×(1-2×delta_poc_sign_flag)
temporal_id是指时间识别符,由bits_for_temporal_id比特表示。temporal_id如以下这样定义无符号的变量BDTemporalID[bd_select][be_idx_in_bd_update]的值。
BDTemporalID[bd_select][be_idx_in_bd_update]=temporal_id
另外,图13所示的参照列表记述定义信息的语法元素ref_pic_list_modification_flag_l0、ref_pic_list_modification_flag_l1、num_ref_idx_l0_active_minus1、num_ref_idx_l1_active_minus1、more_modification_flag及be_idx_in_ref_pic_list的意思与图9同样。
[语法图解:第3例]
图14及图15是表示本实施方式的第3例的编码比特流内的缓冲器记述定义信息及参照列表记述定义信息的位置的语法图解。
图14所示的编码比特流132D在参照列表记述定义信息313包含在SPS中这一点,与图10所示的编码比特流132B不同。具体而言,图14所示的编码比特流132D相对于图10所示的编码比特流132B,SPS301D及切片头341D与SPS301B及切片头341B不同。
SPS301D除了缓冲器记述定义信息312和SPS识别符311以外,还包括参照列表记述定义信息313。
参照列表记述定义信息313定义多个参照列表记述316。一个参照列表记述316(例如RLD2)被与一个缓冲器记述315(例如BD2)排他地建立了关联。
切片头341D包括PPS选择信息333、缓冲器记述选择信息334、缓冲器记述更新信息323和参照列表记述更新信息324(RLD更新)。
参照列表记述更新信息324是用来将与更新后的缓冲器记述对应的参照列表记述更新的信息。并且,将更新后的缓冲器记述及参照列表记述用于对象切片的编码或解码处理。另外,在由SPS301D中包含的缓冲器记述定义信息312及参照列表记述定义信息313定义的初始缓冲器记述及参照列表记述没有被更新的情况下,切片头341D不包含缓冲器记述更新信息323及参照列表记述更新信息324。
此外,在SPS301D中,参照列表记述定义信息313被配置在缓冲器记述定义信息312之后。在切片头341D中,参照列表记述更新信息324被配置在缓冲器记述更新信息323之后。此外,参照列表记述定义信息313及参照列表记述更新信息324都包括表示是否进行参照列表的重新排列的重新排列标志。此外,参照列表记述定义信息313及参照列表记述更新信息324在进行参照列表的重新排列的情况下还包括表示该重新排列的内容的参照列表重新排列信息。
在参照列表记述更新信息324中,在表示不进行重新排列的情况下,使用参照列表记述定义信息313生成参照列表。另一方面,在参照列表记述更新信息324中表示进行重新排列的情况下,不使用用参照列表记述定义信息313生成的参照列表,而用参照列表记述更新信息324生成参照列表。具体而言,按照预先决定的初始设定的参照列表生成方式生成初始设定的参照列表。接着,按照参照列表记述更新信息324中包含的重新排列信息,进行该初始设定的参照列表的重新排列。换言之,将使用参照列表记述定义信息313重新排列后的参照列表,覆盖到使用参照列表记述更新信息324重新排列后的参照列表上。这里,在参照列表记述定义信息313及参照列表记述更新信息324所包含的参照列表重新排列信息中,重新排列对象的参照列表用缓冲器记述中的缓冲器元素索引识别。
另外,如图15所示的编码比特流132E那样,参照列表记述定义信息313也可以包含在PPS302E中。
将上述缓冲器记述定义信息312及参照列表记述定义信息313按照图16所示的表所示的模拟代码,在序列参数集的语法构造中进行信号发送。另外,图片参数集的语法构造也是同样的。此外,将上述缓冲器记述更新信息323及参照列表记述更新信息324按照图17所示的表所示的模拟代码,在切片头的语法构造中进行信号发送。另外,SPU头及图片头的语法构造也是同样的。
以下,对图16所示的语法元素进行说明。
作为变量或列表的BDDeltaPOC[i]及BDTemporalID[i]表示有效的缓冲器记述BD中的缓冲器元素BE[i]的顺序。
另外,图16所示的缓冲器记述定义信息的语法元素bits_for_temporal_id、number_of_bds、number_of_bes_minus1[i]、first_delta_poc_sign_flag[i]、first_delta_poc_minus1[i]、first_temporal_id[i]、delta_poc_minus1[i][j]及temporal_id[i][j]的意思与图12同样。
当ref_pic_list_modification_flag_l0[i]是“1”时,意味着为了确定与缓冲器记述BD[i]对应的参照图片列表RL0[i]而存在num_ref_idx_l0_active_minus1[i]及more_modification_flag。当ref_pic_list_modification_flag_l0[i]是零时,意味着不存在num_ref_idx_l0_active_minus1[i]及more_modification_flag。
假设当ref_pic_list_modification_flag_l0[i]是“1”时,接着ref_pic_list_modification_flag_l0[i]的more_modification_flag是“1”的次数不超过num_ref_idx_l0_active_minus1[i]+1。
当ref_pic_list_modification_flag_l1[i]是“1”时,意味着为了确定与缓冲器记述BD[i]对应的参照图片列表RL1[i]而存在num_ref_idx_l1_active_minus1[i]及more_modification_flag。当ref_pic_list_modification_flag_l1[i]是零时,意味着不存在num_ref_idx_l1_active_minus1[i]及more_modification_flag。
假设当ref_pic_list_modification_flag_l1[i]是“1”时,接着ref_pic_list_modification_flag_l1[i]的more_modification_flag是“1”的次数不超过(num_ref_idx_l1_active_minus1[i]+1)。
num_ref_idx_l0_active_minus1[i]表示对于与缓冲器记述BD[i]对应的参照图片列表RL0[i]的最大参照索引。
num_ref_idx_l1_active_minus1[i]表示对于与缓冲器记述BD[i]对应的参照图片列表RL1[i]的最大参照索引。
伴随着be_idx的more_modification_flag意味着哪个参照图片被再映射。当more_modification_flag是“1”时,意味着be_idx存在于more_modification_flag的紧接着之后。当more_modification_flag是零时,意味着参照图片列表中包含的参照图片的再映射的循环的结束。
be_idx_in_ref_pic_list表示在对象缓冲器记述BD[i]中与缓冲器元素BE[i][be_idx_in_ref_pic_list]建立了关联的参照图片。be_idx_in_ref_pic_list在与缓冲器记述BD[i]建立了关联的对象参照列表RL0[i]或RL1[i]中识别被再映射的图片。该再映射或重新排列处理在图5及图6所示的处理之后进行。
以下,对图17所示的语法元素进行说明。
PredictionType表示对象切片(或SPU、或图片)的预测类型。另外,PredictionType的详细情况与上述是同样的。
作为变量或列表的BDDeltaPOC[bd_select]及BDTemporalID[bd_select]表示被选择的缓冲器记述BD[bd_select]中的缓冲器元素BE[bd_select]的顺序。作为被更新后的变量或列表的BDDeltaPOC[bd_select]及BDTemporalID[bd_select]表示在对象切片的编码或解码处理中使用的有效的缓冲器记述。
另外,图17所示的缓冲器记述更新信息的语法元素bd_select、bd_modification_operation、be_idx_in_bd_update、delta_poc_sign_flag、delta_poc_minus1及temporal_id的意思与图13是同样的。
此外,图17所示的参照列表更新信息的语法元素ref_pic_list_modification_flag_l0、ref_pic_list_modification_flag_l1、num_ref_idx_l0_active_minus1、num_ref_idx_l1_active_minus1、more_modification_flag及be_idx_in_ref_pic_list的意思与图9是同样的。
[语法图解:第4例]
图18是表示本实施方式的第4例的、编码比特流内的缓冲器记述定义信息及参照列表记述定义信息的位置的语法图解。
图18所示的编码比特流132F还在缓冲器记述更新信息及参照列表记述更新信息包含在PPS中这一点,与图14所示的编码比特流132D不同。具体而言,图18所示的编码比特流132F相对于图14所示的编码比特流132D,PPS302F与PPS302B不同。
PPS302F除了SPS选择信息321和PPS识别符322以外,还包括缓冲器记述更新信息323F和参照列表记述更新信息324F。
缓冲器记述更新信息323F包括更新数信息325(number_of_bd_updates)和1个以上的更新信息326。各更新信息326包括缓冲器记述选择信息327(bd_select)和缓冲器记述修正信息328(BD修正)。
更新数信息325(例如number_of_bd_updates=2)表示被修正的缓冲器记述的数量及与其对应的参照列表记述的数量。
缓冲器记述选择信息327确定更新的缓冲器记述。缓冲器记述修正信息328表示缓冲器记述的修正内容。
参照列表记述更新信息324F包括1个以上的参照列表定义信息329(RLD定义)。各参照列表定义信息329定义与更新后的缓冲器记述对应的参照列表记述。
此外,在PPS302F中,参照列表记述更新信息324F被配置在缓冲器记述更新信息323F之后。此外,参照列表记述更新信息324F与参照列表记述定义信息313及参照列表记述更新信息324同样,包括表示是否进行参照列表的重新排列的重新排列标志。此外,参照列表记述更新信息324F在进行参照列表的重新排列的情况下还包括表示该重新排列的内容的参照列表重新排列信息。
在参照列表记述更新信息324中,在表示不进行重新排列的情况下,使用PPS中包含的参照列表记述更新信息324F生成参照列表。另一方面,在参照列表记述更新信息324中,在表示进行重新排列的情况下,不使用用参照列表记述更新信息324F生成的参照列表,而使用参照列表记述更新信息324生成参照列表。具体而言,按照预先决定的初始设定的参照列表生成方式,生成初始设定的参照列表。接着,按照参照列表记述更新信息324中包含的重新排列信息,进行该初始设定的参照列表的重新排列。换言之,将使用参照列表记述更新信息324F重新排列后的参照列表覆盖到使用参照列表记述更新信息324重新排列后的参照列表上。
此外,PPS302F中包含的参照列表记述更新信息324F与SPS301D中包含的参照列表记述定义信息313的关系,和参照列表记述更新信息324与参照列表记述更新信息324F的关系是同样的。即,只要将上述说明中的“参照列表记述更新信息324”替换为“参照列表记述更新信息324F”、将“参照列表记述更新信息324F”替换为“参照列表记述定义信息313”就可以。
这里,与参照列表记述定义信息313及参照列表记述更新信息324同样,在参照列表记述更新信息324F所包含的参照列表重新排列信息中,将重新排列对象的参照列表用缓冲器记述中的缓冲器元素索引识别。
将上述缓冲器记述定义信息312及参照列表记述定义信息313按照在图19所示的表中表示的模拟代码,在序列参数集的语法构造中进行信号发送。此外,将上述缓冲器记述更新信息323F及参照列表记述更新信息324F按照在图20所示的表中表示的模拟代码,在图片参数集的语法构造中进行信号发送。此外,将上述缓冲器记述更新信息323及参照列表记述更新信息324按照在图21所示的表中表示的模拟代码,在切片头的语法构造中进行信号发送。另外,SPU头及图片头的语法构造也同样。
以下,对图19所示的语法元素进行说明。
作为变量或列表的BDDeltaPOC[i]及BDTemporalID[i]表示有效的缓冲器记述BD中的缓冲器元素BE[i]的顺序。
另外,图19所示的缓冲器记述定义信息的语法元素bits_for_temporal_id、number_of_bds、number_of_bes_minus1[i]、first_delta_poc_sign_flag[i]、first_delta_poc_minus1[i]、first_temporal_id[i]、delta_poc_minus1[i][j]及temporal_id[i][j]的意思与图12是同样的。
此外,图19所示的参照列表记述定义信息的语法元素ref_pic_list_modification_flag_l0[i]、ref_pic_list_modification_flag_l1[i]、num_ref_idx_l0_active_minus1[i]、num_ref_idx_l1_active_minus1[i]、more_modification_flag及be_idx_in_ref_pic_list的意思与图16是同样。
以下,对图20所示的语法元素进行说明。
作为变量或列表的BDDeltaPOC[bd_select]及BDTemporalID[bd_select]表示被选择的缓冲器记述BD[bd_select]中的缓冲器元素BE[bd_select]的顺序。
number_of_bd_updates是指语法元素bd_select在PPS内存在的次数。即,number_of_bd_updates表示被PPS修正的缓冲器记述的数量。
bd_select表示向表示被PPS修正的缓冲器记述BD[bd_select]的BDDeltaPOC及BDTemporalID的列表的索引。
bd_modification_operation表示对所选择的缓冲器记述BD[bd_select]应用的修正工序。当bd_modification_operation是零时,意味着用来将缓冲器记述BD[bd_select]修正的循环的结束。假设bd_modification_operation在syntaxelementbd_select的紧接着之后不是零。
在本方式中,当bd_modification_operation是“1”时,对在缓冲器记述BD[bd_select]中由be_idx_in_bd_update表示的缓冲器元素赋予相对于对象图片的POC差值。并且,将该POC差值与当前保存的POC差值替换。
在另一方式中,也可以定义由bd_modification_operation表示的追加的缓冲器记述修正工序。作为其一例,可以举出用来对由缓冲器元素表示的图片赋予表示是短期参照图片还是长期参照图片的标记的工序。此外,作为另一例,是定义新的追加的缓冲器记述的工序。在此情况下,bd_select表示对于多个新的(不存在的)缓冲器记述的索引,通过后续的缓冲器记述修正工序对新的缓冲器记述内的缓冲器元素赋予图片识别符。
此外,图20所示的缓冲器记述更新信息的语法元素be_idx_in_bd_update、delta_poc_sign_flag、delta_poc_minus1及temporal_id与图13是同样的。
此外,图20所示的参照列表记述更新信息的语法元素ref_pic_list_modification_flag_l0[i]、ref_pic_list_modification_flag_l1[i]、num_ref_idx_l0_active_minus1[i]、num_ref_idx_l1_active_minus1[i]、more_modification_flag及be_idx_in_ref_pic_list与图16是同样的。
以下,对图21所示的语法元素进行说明。
PredictionType表示对象切片(或SPU、或图片)的预测类型。另外,PredictionType的详细情况与上述是同样的。
作为变量或列表的BDDeltaPOC[bd_select]及BDTemporalID[bd_select]表示所选择的缓冲器记述BD[bd_select]中的缓冲器元素BE[bd_select]的顺序。作为更新后的变量或列表的BDDeltaPOC[bd_select]及BDTemporalID[bd_select]表示在对象切片的编码或解码处理中使用的有效的缓冲器记述。
另外,图21所示的缓冲器记述更新信息的语法元素bd_select、bd_modification_operation、be_idx_in_bd_update、delta_poc_sign_flag、delta_poc_minus1及temporal_id的意思与图13是同样的。
此外,图21所示的参照列表更新信息的语法元素ref_pic_list_modification_flag_l0、ref_pic_list_modification_flag_l1、num_ref_idx_l0_active_minus1、num_ref_idx_l1_active_minus1、more_modification_flag及be_idx_in_ref_pic_list的意思与图9是同样的。
另外,也可以将记述语法循环的缓冲器记述更新信息和参照列表记述更新信息结合为一个。在这样的方式中,用来定义修正后的参照列表记述的参数的位置是用来将对应的缓冲器记述修正的参数的紧接着的之后。在图18的例子中,参数的顺序为[number_of_bd_updates=2]、[bd_select=2]、[BD2修正]、[RLD2定义]、[bd_select=3]、[BD3修正]、[RLD3定义]。
[语法图解:第5例]
图22是表示本实施方式的第5例的编码比特流内的缓冲器记述定义信息及参照列表记述定义信息的位置的语法图解。
图22所示的编码比特流132G相对于图18所示的编码比特流132F,PPS302G中包含的缓冲器记述更新信息323G及参照列表记述更新信息324G与PPS302F中包含的缓冲器记述更新信息323F及参照列表记述更新信息324F不同。此外,切片头341G与切片头341D不同。
缓冲器记述更新信息323G包括确定所选择的一个缓冲器记述的缓冲器记述选择信息351(例如,bd_select=2)、和表示所选择的缓冲器记述及与该缓冲器记述对应的参照列表记述是否被修正的缓冲器记述修正标志352(例如,modify_flag=1)。在由缓冲器记述修正标志352表示进行修正的情况下,缓冲器记述更新信息323G还包括缓冲器记述修正信息328(BD修正)。此外,在由缓冲器记述修正标志352表示进行修正的情况下,PPS302G包括参照列表记述更新信息324G,所述参照列表记述更新信息324G包括定义修正后的参照列表的参照列表定义信息329(RLD定义)。另一方面,在由缓冲器记述修正标志352表示不进行修正的情况下,PPS302G不包含缓冲器记述修正信息328及参照列表定义信息329。
另外,在切片头341G中不包含缓冲器记述选择信息334。
通过以上,PPS302G被PPS识别符322(例如pps_id=0)识别,使用PPS选择信息333(例如pps_select=0)在切片头341G中参照。当参照PPS302G时,也参照所选择的缓冲器记述及与其建立了关联的参照列表记述。将处理对象的图片中包含的切片(或子图片单元)按照所选择的缓冲器记述和所选择的参照列表记述,使用以顺序排列的参照图片编码或解码。
这里,与参照列表记述定义信息313及参照列表记述更新信息324同样,在参照列表记述更新信息324G所包含的参照列表重新排列信息中,将重新排列对象的参照列表在缓冲器记述中的缓冲器元素索引识别。
将上述缓冲器记述定义信息312及参照列表记述定义信息313按照在图23所示的表中表示的模拟代码,在序列参数集的语法构造中进行信号发送。此外,将上述缓冲器记述更新信息323G及参照列表记述更新信息324G按照在图24所示的表中表示的模拟代码,在图片参数集的语法构造中进行信号发送。此外,将上述缓冲器记述更新信息323及参照列表记述更新信息324按照在图25所示的表中表示的模拟代码,在切片头的语法构造中进行信号发送。另外,SPU头及图片头的语法构造也同样。
以下,对图23所示的语法元素进行说明。
作为变量或列表的BDDeltaPOC[i]及BDTemporalID[i]表示有效的缓冲器记述BD中的缓冲器元素BE[i]的顺序。
另外,图23所示的缓冲器记述定义信息的语法元素bits_for_temporal_id、number_of_bds、number_of_bes_minus1[i]、first_delta_poc_sign_flag[i]、first_delta_poc_minus1[i]、first_temporal_id[i]、delta_poc_minus1[i][j]及temporal_id[i][j]的意思与图12是同样的。
此外,图23所示的参照列表记述定义信息的语法元素ref_pic_list_modification_flag_l0[i]、ref_pic_list_modification_flag_l1[i]、num_ref_idx_l0_active_minus1[i]、num_ref_idx_l1_active_minus1[i]、more_modification_flag及be_idx_in_ref_pic_list的意思与图16是同样的。
以下,对图24所示的语法元素进行说明。
作为变量或列表的BDDeltaPOC[bd_select]及BDTemporalID[bd_select]表示所选择的缓冲器记述BD[bd_select]中的缓冲器元素BE[bd_select]的顺序。
此外,图24所示的缓冲器记述更新信息的语法元素bd_select、bd_modification_operation、be_idx_in_bd_update、delta_poc_sign_flag、delta_poc_minus1及temporal_id与图20是同样的。另外,该缓冲器记述更新信息不包含语法元素number_of_bd_updates而仅包含所选择的1个缓冲器记述及参照列表记述这一点与图20不同。将该缓冲器记述及参照列表记述在参照该PPS的全部的切片中使用。
此外,图24所示的参照列表记述更新信息的语法元素ref_pic_list_modification_flag_l0、ref_pic_list_modification_flag_l1、num_ref_idx_l0_active_minus1、num_ref_idx_l1_active_minus1、more_modification_flag及be_idx_in_ref_pic_list与图9是同样的。
以下,对图25所示的语法元素进行说明。
PredictionType表示对象切片(或SPU、或图片)的预测类型。另外,PredictionType的详细情况与上述是同样的。
作为变量或列表的BDDeltaPOC[bd_select]及BDTemporalID[bd_select]表示所选择的缓冲器记述BD[bd_select]中的缓冲器元素BE[bd_select]的顺序。作为更新后的变量或列表的BDDeltaPOC[bd_select]及BDTemporalID[bd_select]表示在对象切片的编码或解码处理中使用的有效的缓冲器记述。
另外,图25所示的缓冲器记述更新信息的语法元素bd_select、bd_modification_operation、be_idx_in_bd_update、delta_poc_sign_flag、delta_poc_minus1及temporal_id的意思与图13是同样的。这里,虽然在切片头中不包含bd_select,但选择在从该切片头参照的PPS中包含的缓冲器记述及与其对应的参照列表记述。
此外,图25所示的参照列表更新信息的语法元素ref_pic_list_modification_flag_l0、ref_pic_list_modification_flag_l1、num_ref_idx_l0_active_minus1、num_ref_idx_l1_active_minus1、more_modification_flag及be_idx_in_ref_pic_list的意思与图9是同样的。
[编码方法的效果]
通过以上,在有关本实施方式的图像编码装置100中,将重新排列对象的参照列表用缓冲器记述中的缓冲器元素索引识别。这样,在重新排列对象的图片的确定中,援用在缓冲器记述中使用的缓冲器元素索引。由此,参照列表重新排列信息的冗余性及复杂性被降低,所以图像编码装置及图像解码装置的运算量被减少,编码效率被改善。
另外,在上述说明中,在参照列表重新排列信息中,说明了将重新排列对象的参照列表用缓冲器记述中的缓冲器元素索引识别的例子,但也可以将重新排列对象的参照图片在图像编码装置或图像解码装置中用在该参照列表重新排列信息以外也使用的索引确定。这里,该索引,例如是对多个图片分配的从零开始的连续号码。在此情况下,参照列表重新排列信息的冗余性及复杂性也被降低,所以图像编码装置及图像解码装置的运算量被减少。
例如,上述索引也可以是初始设定的参照列表中的参照索引。
[解码装置]
图26是表示有关本实施方式的图像解码装置200的构造的框图。
图26所示的图像解码装置200通过以块单位对编码比特流232进行解码,生成解码图像数据226。该图像解码装置200具有可变长度解码部212、逆量化部204、逆正交变换部205、加法器206、块存储器207、帧存储器208、帧内预测部209、帧间预测部210、图片类型决定部211、帧存储器控制部213。
编码比特流232例如是通过上述图像编码装置100生成的编码比特流132。
可变长度解码部212通过对编码比特流232进行可变长度解码(熵解码),生成量化值223和帧存储器控制信息233。这里,帧存储器控制信息233对应于上述帧存储器控制信息133。
逆量化部204通过对量化值223进行逆量化,生成频率系数224。逆正交变换部205通过对频率系数224进行逆频率变换,生成预测误差数据225。加法器206通过对预测误差数据225和预测图像数据231进行相加,生成解码图像数据226。该解码图像数据226从图像解码装置200输出,例如进行显示。
块存储器207以块单位保持解码图像数据226作为解码图像数据227。帧存储器208以帧单位保持解码图像数据226作为解码图像数据228。
帧内预测部209通过进行帧内预测,生成解码对象块的预测图像数据229。具体而言,帧内预测部209在块存储器207中存储的解码图像数据227内进行检索,估计与解码图像数据226最相似的图像区域。
帧间预测部210通过使用帧存储器208中保存的帧单位的解码图像数据228进行帧间预测,生成解码对象块的预测图像数据230。
图片类型决定部211选择预测图像数据229和预测图像数据230中的一方,输出所选择出的数据作为预测图像数据231。
帧存储器控制部213对帧存储器208中存储的解码图像数据228进行管理。具体而言,帧存储器控制部213根据帧存储器控制信息233进行存储器管理处理。帧存储器控制部213决定是在帧存储器208中保持解码图像数据128还是从帧存储器208中删除解码图像数据128。并且,帧存储器控制部213生成由帧间预测部210使用的参照列表。
[解码处理]
接着,对上述图像解码装置200的图像解码方法进行说明。
图27是有关本实施方式的图像解码方法的流程图。
首先,图像解码装置200从编码比特流232取得定义缓冲器记述的缓冲器记述定义信息(S201)。
接着,图像解码装置200生成包括在缓冲器记述中表示的全部参照图片的初始设定的参照列表(S202)。
接着,图像解码装置200从编码比特流232取得表示对于初始设定的参照列表的重新排列处理的内容的参照列表重新排列信息(S203)。
接着,图像解码装置200按照所取得的参照列表重新排列信息,进行将初始设定的参照列表中包含的图片的顺序重新排列的重新排列处理(S204)。
接着,图像解码装置200使用缓冲器记述、和通过上述重新排列处理得到的参照列表,将处理对象的图片或切片解码(S205)。
这里,在参照列表重新排列信息中,将重新排列对象的图片用与在该图像编码方法的其他处理中使用的索引确定。具体而言,该索引是缓冲器记述中的缓冲器元素索引。
另外,步骤S202及S204的重新排列处理的详细情况例如与上述图像编码装置100的步骤S102及S103是同样的。
[解码方法的效果]
通过以上,有关本实施方式的图像解码装置200能够将通过提高编码效率、并且降低参照列表记述的复杂性的编码处理而被编码的编码比特流解码。
(实施方式2)
有关本实施方式的图像编码方法将缓冲器记述定义信息及参照列表记述定义信息向在多个图片中共同使用的图片参数集内写入。由此,该图像编码方法与将缓冲器记述定义信息及参照列表记述定义信息向切片头等写入的情况相比,能够削减冗余的信息,所以能够改善编码效率。
[编码装置]
有关本实施方式的图像编码装置100的框图与图3是同样的,说明省略。
[编码处理]
以下,对有关本实施方式的图像编码装置100的图像编码方法进行说明。
首先,图像编码装置100决定对影像序列中包含的多个图片使用的多个缓冲器记述、和与多个缓冲器记述对应的多个参照列表记述(S301)。
接着,图像编码装置100将定义所决定的多个缓冲器记述的缓冲器记述定义信息向编码比特流132中包含的PPS写入(S302)。
接着,图像编码装置100将用来定义多个参照列表记述的参照列表记述定义信息向PPS写入(S303)。
接着,图像编码装置100按照每个图片,从多个缓冲器记述中选择在该图片的编码中使用的一个缓冲器记述(S304)。另外,图像编码装置100也可以按照每个切片选择一个缓冲器记述。
接着,图像编码装置100将确定所选择的缓冲器记述的缓冲器记述选择信息向与编码比特流132中包含的处理对象的切片对应的切片头写入(S305)。此外,选择与所选择的缓冲器记述对应的一个参照列表记述。
最后,图像编码装置100使用对处理对象的切片选择的缓冲器记述、和与该缓冲器记述对应的参照列表记述,将该处理对象的切片编码(S306)。此外,图像编码装置100生成包含通过编码得到的编码数据的编码比特流132。
另外,在上述说明中,表示了将缓冲器记述选择信息向切片头写入的例子,但也可以将缓冲器记述选择信息向图片头或APS写入。
此外,在上述说明中,表示了将缓冲器记述定义信息及参照列表记述定义信息向PPS写入的例子,但也可以将缓冲器记述定义信息及参照列表记述定义信息向SPS或切片头写入。
此外,如在上述实施方式1中说明那样,也可以将参照列表记述定义信息中包含的参照列表重新排列信息用缓冲器元素索引确定。
[语法图解]
本实施方式的编码比特流的语法图解例如与图15是同样的。
[编码方法的效果]
通过以上,有关本实施方式的图像编码装置100能够防止用于参照列表的制作的相同的参数在编码比特流中被冗余地重复。由此,该图像编码装置100能够提高记述参照列表的制作的参数的编码效率。进而,该图像编码装置100能够实现记述参照列表的数据单元和缓冲器记述数据单元的设计上的协调、以及编码比特流的层级地构建的信号单元的设计上的协调。
[解码装置]
有关本实施方式的图像解码装置200的框图与图26是同样的,说明省略。
[解码处理]
接着,对上述图像解码装置200的图像解码方法进行说明。
图29是有关本实施方式的图像解码方法的流程图。
首先,图像解码装置200从编码比特流232所包含的PPS中,取得定义多个缓冲器记述的缓冲器记述定义信息(S401)。接着,图像解码装置200从上述PPS取得定义多个参照列表记述的参照列表记述定义信息(S402)。这里,多个参照列表记述与多个缓冲器记述一对一地对应。
接着,图像解码装置200从编码比特流232所包含的切片头取得缓冲器记述选择信息(S403)。并且,图像解码装置200对于处理对象的切片,从多个缓冲器记述中,选择由缓冲器记述选择信息指定的一个缓冲器记述(S404)。此外,图像解码装置200选择与所选择的缓冲器记述对应的一个参照列表记述。
最后,图像解码装置200使用所选择的缓冲器记述和所选择的参照列表记述,将处理对象的切片解码(S405)。
另外,在上述说明中,表示了缓冲器记述选择信息包含在切片头中的例子,但缓冲器记述选择信息也可以包含在图片头或APS中。
[解码方法的效果]
通过以上,有关本实施方式的图像解码装置200能够将通过提供了编码效率、并且实现了与参照列表记述数据的设计上的协调的编码处理而被编码的编码比特流解码。
以上,对有关本发明的实施方式的图像编码装置及图像解码装置进行了说明,但本发明并不限定于该实施方式。
例如,在上述说明中,叙述了SPS包含在与切片数据等相同的编码比特流中的例子,但也可以将SPS与包含切片数据等的编码比特流另外地从图像编码装置向图像解码装置传送。
此外,有关上述实施方式的图像编码装置及图像解码装置中包含的各处理部典型地作为集成电路即LSI实现。它们既可以单独地1芯片化,也可以包含一部分或全部而1芯片化。
此外,集成电路化并不限定于LSI,也可以通过专用电路或通用处理器实现。也可以利用在LSI制造后能够编程的FPGA(Field Programmable Gate Array:现场可编程门阵列)、或能够再构成LSI内部的电路单元的连接及设定的可重构处理器。
在上述各实施方式中,各构成要素也可以由专用的硬件构成、或通过执行适合于各构成要素的软件程序来实现。各构成要素也可以通过CPU或处理器等的程序执行部将记录在硬盘或半导体存储器等的记录介质中的软件程序读出并执行来实现。
进而,本发明也可以是上述软件程序,也可以是记录有上述程序的非暂时性的计算机可读取的记录介质。此外,上述程序当然能够经由因特网等的传送媒体流通。
此外,在上述中使用的数字全部是为了具体地说明本发明而例示的,本发明并不受例示的数字限制。
此外,框图中的功能块的划分是一例,也可以将多个功能块作为一个功能块实现,或将一个功能块划分为多个,或将一部分功能转移到其他功能块。此外,也可以是单一的硬件或软件并行地、或时间划分地处理具有类似的功能的多个功能块的功能。
此外,上述图像编码方法或图像解码方法中包含的步骤被执行的顺序是为了具体地说明本发明而例示的,也可以是上述以外的顺序。此外,也可以将上述步骤的一部分与其他步骤同时(并行)执行。
(实施方式3)
通过将用来实现上述各实施方式所示的运动图像编码方法(图像编码方法)或运动图像解码方法(图像解码方法)的结构的程序记录到存储介质中,能够将上述各实施方式所示的处理在独立的计算机系统中简单地实施。存储介质是磁盘、光盘、光磁盘、IC卡、半导体存储器等,只要是能够记录程序的介质就可以。
进而,这里说明在上述各实施方式中示出的运动图像编码方法(图像编码方法)及运动图像解码方法(图像解码方法)的应用例和使用它的系统。该系统的特征在于,具有由使用图像编码方法的图像编码装置及使用图像解码方法的图像解码装置构成的图像编码解码装置。关于系统的其他结构,可以根据情况而适当变更。
图30是表示实现内容分发服务的内容供给系统ex100的整体结构的图。将通信服务的提供区划分为希望的大小,在各小区内分别设置有作为固定无线站的基站ex106、ex107、ex108、ex109、ex110。
该内容供给系统ex100在因特网ex101上经由因特网服务提供商ex102及电话网ex104、及基站ex107~ex110连接着计算机ex111、PDA(PersonalDigital Assistant)ex112、照相机ex113、便携电话ex114、游戏机ex115等的各设备。
但是,内容供给系统ex100并不限定于图30那样的结构,也可以将某些要素组合连接。此外,也可以不经由作为固定无线站的基站ex107~ex110将各设备直接连接在电话网ex104上。此外,也可以将各设备经由近距离无线等直接相互连接。
照相机ex113是能够进行数字摄像机等的运动图像摄影的设备,照相机ex116是能够进行数字照相机等的静止图像摄影、运动图像摄影的设备。此外,便携电话ex114是GSM(Global System for Mobile Communications)方式、CDMA(Code Division MultipleAccess)方式、W-CDMA(Wideband -Code Division Multiple Access)方式、或LTE(LongTerm Evolution)方式、HSPA(High Speed Packet Access)的便携电话机、或PHS(PersonalHandyphone System)等,是哪种都可以。
在内容供给系统ex100中,通过将照相机ex113等经由基站ex109、电话网ex104连接在流媒体服务器ex103上,能够进行现场转播等。在现场转播中,对用户使用照相机ex113摄影的内容(例如音乐会现场的影像等)如在上述各实施方式中说明那样进行编码处理(即,作为本发明的一个方式的图像编码装置发挥作用),向流媒体服务器ex103发送。另一方面,流媒体服务器ex103将发送来的内容数据对有请求的客户端进行流分发。作为客户端,有能够将上述编码处理后的数据解码的计算机ex111、PDAex112、照相机ex113、便携电话ex114、游戏机ex115等。在接收到分发的数据的各设备中,将接收到的数据解码处理而再现(即,作为本发明的一个方式的图像解码装置发挥作用)。
另外,摄影的数据的编码处理既可以由照相机ex113进行,也可以由进行数据的发送处理的流媒体服务器ex103进行,也可以相互分担进行。同样,分发的数据的解码处理既可以由客户端进行,也可以由流媒体服务器ex103进行,也可以相互分担进行。此外,并不限于照相机ex113,也可以将由照相机ex116摄影的静止图像及/或运动图像数据经由计算机ex111向流媒体服务器ex103发送。此情况下的编码处理由照相机ex116、计算机ex111、流媒体服务器ex103的哪个进行都可以,也可以相互分担进行。
此外,这些编码解码处理一般在计算机ex111或各设备具有的LSIex500中处理。LSIex500既可以是单芯片,也可以是由多个芯片构成的结构。另外,也可以将运动图像编码解码用的软件装入到能够由计算机ex111等读取的某些记录介质(CD-ROM、软盘、硬盘等)中、使用该软件进行编码解码处理。进而,在便携电话ex114是带有照相机的情况下,也可以将由该照相机取得的运动图像数据发送。此时的运动图像数据是由便携电话ex114具有的LSIex500编码处理的数据。
此外,也可以是,流媒体服务器ex103是多个服务器或多个计算机,是将数据分散处理、记录、及分发的。
如以上这样,在内容供给系统ex100中,客户端能够接收编码的数据而再现。这样,在内容供给系统ex100中,客户端能够将用户发送的信息实时地接收、解码、再现,即使是没有特别的权利或设备的用户也能够实现个人广播。
另外,并不限定于内容供给系统ex100的例子,如图31所示,在数字广播用系统ex200中也能够装入上述实施方式的至少运动图像编码装置(图像编码装置)或运动图像解码装置(图像解码装置)的某个。具体而言,在广播站ex201中,将对影像数据复用了音乐数据等而得到的复用数据经由电波向通信或广播卫星ex202传送。该影像数据是通过上述各实施方式中说明的运动图像编码方法编码后的数据(即,通过本发明的一个方式的图像编码装置编码后的数据)。接受到该数据的广播卫星ex202发出广播用的电波,能够对该电波进行卫星广播接收的家庭的天线ex204接收该电波,通过电视机(接收机)ex300或机顶盒(STB)ex217等的装置将接收到的复用数据解码并将其再现(即,作为本发明的一个方式的图像解码装置发挥作用)。
此外,也可以是,在将记录在DVD、BD等的记录介质ex215中的复用数据读取并解码、或将影像数据编码再根据情况与音乐信号复用而写入记录介质ex215中的读取器/记录器ex218中也能够安装上述各实施方式所示的运动图像解码装置或运动图像编码装置。在此情况下,可以将再现的影像信号显示在监视器ex219上,通过记录有复用数据的记录介质ex215在其他装置或系统中能够再现影像信号。此外,也可以是,在连接在有线电视用的线缆ex203或卫星/地面波广播的天线ex204上的机顶盒ex217内安装运动图像解码装置,将其用电视机的监视器ex219显示。此时,也可以不是在机顶盒、而在电视机内装入运动图像解码装置。
图32是表示使用在上述各实施方式中说明的运动图像解码方法及运动图像编码方法的电视机(接收机)ex300的图。电视机ex300具备经由接收上述广播的天线ex204或线缆ex203等取得或者输出对影像数据复用了声音数据的复用数据的调谐器ex301、将接收到的复用数据解调或调制为向外部发送的编码数据的调制/解调部ex302、和将解调后的复用数据分离为影像数据、声音数据或将在信号处理部ex306中编码的影像数据、声音数据复用的复用/分离部ex303。
此外,电视机ex300具备:具有将声音数据、影像数据分别解码、或将各自的信息编码的声音信号处理部ex304和影像信号处理部ex305(即,作为本发明的一个方式的图像编码装置或图像解码装置发挥作用)的信号处理部ex306;具有将解码后的声音信号输出的扬声器ex307及显示解码后的影像信号的显示器等的显示部ex308的输出部ex309。进而,电视机ex300具备具有受理用户操作的输入的操作输入部ex312等的接口部ex317。进而,电视机ex300具有合并控制各部的控制部ex310、对各部供给电力的电源电路部ex311。接口部ex317也可以除了操作输入部ex312以外,还具有与读取器/记录器ex218等的外部设备连接的桥接部ex313、用来能够安装SD卡等的记录介质ex216的插槽部ex314、用来与硬盘等的外部记录介质连接的驱动器ex315、与电话网连接的调制解调器ex316等。另外,记录介质ex216是能够通过收存的非易失性/易失性的半导体存储元件电气地进行信息的记录的结构。电视机ex300的各部经由同步总线相互连接。
首先,对电视机ex300将通过天线ex204等从外部取得的复用数据解码、再现的结构进行说明。电视机ex300接受来自遥控器ex220等的用户操作,基于具有CPU等的控制部ex310的控制,将由调制/解调部ex302解调的复用数据用复用/分离部ex303分离。进而,电视机ex300将分离的声音数据用声音信号处理部ex304解码,将分离的影像数据用影像信号处理部ex305使用在上述各实施方式中说明的解码方法解码。将解码后的声音信号、影像信号分别从输出部ex309朝向外部输出。在输出时,可以暂时将这些信号储存到缓冲器ex318、ex319等中,以使声音信号和影像信号同步再现。此外,电视机ex300也可以不是从广播等、而从磁/光盘、SD卡等的记录介质ex215、ex216读出编码的复用数据。接着,对电视机ex300将声音信号或影像信号编码、向外部发送或写入到记录介质等中的结构进行说明。电视机ex300接受来自遥控器ex220等的用户操作,基于控制部ex310的控制,由声音信号处理部ex304将声音信号编码,由影像信号处理部ex305将影像信号使用在上述各实施方式中说明的编码方法编码。将编码后的声音信号、影像信号用复用/分离部ex303复用,向外部输出。在复用时,可以暂时将这些信号储存到缓冲器ex320、ex321等中,以使声音信号和影像信号同步再现。另外,缓冲器ex318、ex319、ex320、ex321既可以如图示那样具备多个,也可以是共用一个以上的缓冲器的结构。进而,在图示以外,也可以是,在例如调制/解调部ex302或复用/分离部ex303之间等也作为避免系统的上溢、下溢的缓冲部而在缓冲器中储存数据。
此外,电视机ex300除了从广播等或记录介质等取得声音数据、影像数据以外,也可以具备受理麦克风或照相机的AV输入的结构,对从它们中取得的数据进行编码处理。另外,这里,将电视机ex300作为能够进行上述编码处理、复用、及外部输出的结构进行了说明,但也可以是,不能进行这些处理,而是仅能够进行上述接收、解码处理、外部输出的结构。
此外,在由读取器/记录器ex218从记录介质将复用数据读出、或写入的情况下,上述解码处理或编码处理由电视机ex300、读取器/记录器ex218的哪个进行都可以,也可以是电视机ex300和读取器/记录器ex218相互分担进行。
作为一例,将从光盘进行数据的读入或写入的情况下的信息再现/记录部ex400的结构表示在图33中。信息再现/记录部ex400具备以下说明的单元ex401、ex402、ex403、ex404、ex405、ex406、ex407。光头ex401对作为光盘的记录介质ex215的记录面照射激光斑而写入信息,检测来自记录介质ex215的记录面的反射光而读入信息。调制记录部ex402电气地驱动内置在光头ex401中的半导体激光器,根据记录数据进行激光的调制。再现解调部ex403将由内置在光头ex401中的光检测器电气地检测到来自记录面的反射光而得到的再现信号放大,将记录在记录介质ex215中的信号成分分离并解调,再现所需要的信息。缓冲器ex404将用来记录到记录介质ex215中的信息及从记录介质ex215再现的信息暂时保持。盘马达ex405使记录介质ex215旋转。伺服控制部ex406一边控制盘马达ex405的旋转驱动一边使光头ex401移动到规定的信息轨道,进行激光斑的追踪处理。系统控制部ex407进行信息再现/记录部ex400整体的控制。上述的读出及写入的处理由系统控制部ex407利用保持在缓冲器ex404中的各种信息、此外根据需要而进行新的信息的生成、追加、并且一边使调制记录部ex402、再现解调部ex403、伺服控制部ex406协调动作、一边通过光头ex401进行信息的记录再现来实现。系统控制部ex407例如由微处理器构成,通过执行读出写入的程序来执行它们的处理。
以上,假设光头ex401照射激光斑而进行了说明,但也可以是使用近场光进行高密度的记录的结构。
在图34中表示作为光盘的记录介质ex215的示意图。在记录介质ex215的记录面上,以螺旋状形成有导引槽(沟),在信息轨道ex230中,预先通过沟的形状的变化而记录有表示盘上的绝对位置的地址信息。该地址信息包括用来确定作为记录数据的单位的记录块ex231的位置的信息,通过在进行记录及再现的装置中将信息轨道ex230再现而读取地址信息,能够确定记录块。此外,记录介质ex215包括数据记录区域ex233、内周区域ex232、外周区域ex234。为了记录用户数据而使用的区域是数据记录区域ex233,配置在比数据记录区域ex233靠内周或外周的内周区域ex232和外周区域ex234用于用户数据的记录以外的特定用途。信息再现/记录部ex400对这样的记录介质ex215的数据记录区域ex233进行编码的声音数据、影像数据或复用了这些数据的编码数据的读写。
以上,举1层的DVD、BD等的光盘为例进行了说明,但并不限定于这些,也可以是多层构造、在表面以外也能够记录的光盘。此外,也可以是在盘的相同的地方使用不同波长的颜色的光记录信息、或从各种角度记录不同的信息的层等、进行多维的记录/再现的构造的光盘。
此外,在数字广播用系统ex200中,也可以由具有天线ex205的车ex210从卫星ex202等接收数据、在车ex210具有的车载导航仪ex211等的显示装置上再现运动图像。另外,车载导航仪ex211的结构可以考虑例如在图32所示的结构中添加GPS接收部的结构,在计算机ex111及便携电话ex114等中也可以考虑同样的结构。
图35A是表示使用在上述实施方式中说明的运动图像解码方法和运动图像编码方法的便携电话ex114的图。便携电话ex114具有由用来在与基站ex110之间收发电波的天线ex350、能够拍摄影像、静止图像的照相机部ex365、显示将由照相机部ex365摄影的影像、由天线ex350接收到的影像等解码后的数据的液晶显示器等的显示部ex358。便携电话ex114还具有包含操作键部ex366的主体部、用来进行声音输出的扬声器等的声音输出部ex357、用来进行声音输入的麦克风等的声音输入部ex356、保存拍摄到的影像、静止图像、录音的声音、或者接收到的影像、静止图像、邮件等的编码后的数据或者解码后的数据的存储器部ex367、或者作为与同样保存数据的记录介质之间的接口部的插槽部ex364。
进而,使用图35B对便携电话ex114的结构例进行说明。便携电话ex114对于合并控制具备显示部ex358及操作键部ex366的主体部的各部的主控制部ex360,将电源电路部ex361、操作输入控制部ex362、影像信号处理部ex355、照相机接口部ex363、LCD(LiquidCrystal Display:液晶显示器)控制部ex359、调制/解调部ex352、复用/分离部ex353、声音信号处理部ex354、插槽部ex364、存储器部ex367经由总线ex370相互连接。
电源电路部ex361如果通过用户的操作使通话结束及电源键成为开启状态,则通过从电池组对各部供给电力,便携电话ex114起动为能够动作的状态。
便携电话ex114基于具有CPU、ROM及RAM等的主控制部ex360的控制,在语音通话模式时,将由声音输入部ex356集音的声音信号通过声音信号处理部ex354变换为数字声音信号,将其用调制/解调部ex352进行波谱扩散处理,由发送/接收部ex351实施数字模拟变换处理及频率变换处理后经由天线ex350发送。此外,便携电话ex114在语音通话模式时,将由天线ex350接收到的接收数据放大并实施频率变换处理及模拟数字变换处理,用调制/解调部ex352进行波谱逆扩散处理,通过声音信号处理部ex354变换为模拟声音数据后,将其经由声音输出部ex357输出。
进而,在数据通信模式时发送电子邮件的情况下,将通过主体部的操作键部ex366等的操作输入的电子邮件的文本数据经由操作输入控制部ex362向主控制部ex360送出。主控制部ex360将文本数据用调制/解调部ex352进行波谱扩散处理,由发送/接收部ex351实施数字模拟变换处理及频率变换处理后,经由天线ex350向基站ex110发送。在接收电子邮件的情况下,对接收到的数据执行上述处理的大致逆处理,并输出到显示部ex350。
在数据通信模式时,在发送影像、静止图像、或者影像和声音的情况下,影像信号处理部ex355将从照相机部ex365供给的影像信号通过上述各实施方式所示的运动图像编码方法进行压缩编码(即,作为本发明的一个方式的图像编码装置发挥作用),将编码后的影像数据送出至复用/分离部ex353。另外,声音信号处理部ex354对通过照相机部ex365拍摄影像、静止图像等的过程中用声音输入部ex356集音的声音信号进行编码,将编码后的声音数据送出至复用/分离部ex353。
复用/分离部ex353通过规定的方式,对从影像信号处理部ex355供给的编码后的影像数据和从声音信号处理部ex354供给的编码后的声音数据进行复用,将其结果得到的复用数据用调制/解调部(调制/解调电路部)ex352进行波谱扩散处理,由发送/接收部ex351实施数字模拟变换处理及频率变换处理后,经由天线ex350发送。
在数据通信模式时接收到链接到主页等的运动图像文件的数据的情况下,或者接收到附加了影像或者声音的电子邮件的情况下,为了对经由天线ex350接收到的复用数据进行解码,复用/分离部ex353通过将复用数据分离,分为影像数据的比特流和声音数据的比特流,经由同步总线ex370将编码后的影像数据向影像信号处理部ex355供给,并将编码后的声音数据向声音信号处理部ex354供给。影像信号处理部ex355通过与上述各实施方式所示的运动图像编码方法相对应的运动图像解码方法进行解码,由此对影像信号进行解码(即,作为本发明的一个方式的图像解码装置发挥作用),经由LCD控制部ex359从显示部ex358显示例如链接到主页的运动图像文件中包含的影像、静止图像。另外,声音信号处理部ex354对声音信号进行解码,从声音输出部ex357输出声音。
此外,上述便携电话ex114等的终端与电视机ex300同样,除了具有编码器、解码器两者的收发型终端以外,还可以考虑只有编码器的发送终端、只有解码器的接收终端的3种安装形式。另外,在数字广播用系统ex200中,设为发送、接收在影像数据中复用了音乐数据等得到的复用数据而进行了说明,但除声音数据之外复用了与影像关联的字符数据等的数据也可以,不是复用数据而是影像数据本身也可以。
这样,将在上述各实施方式中表示的运动图像编码方法或运动图像解码方法用在上述哪种设备、系统中都可以,通过这样,能够得到在上述各实施方式中说明的效果。
此外,本发明并不限定于这样的上述实施方式,能够不脱离本发明的范围而进行各种变形或修正。
(实施方式4)
也可以通过将在上述各实施方式中示出的运动图像编码方法或装置、与依据MPEG-2、MPEG4-AVC、VC-1等不同的标准的运动图像编码方法或装置根据需要而适当切换,来生成影像数据。
这里,在生成分别依据不同的标准的多个影像数据的情况下,在解码时,需要选择对应于各个标准的解码方法。但是,由于不能识别要解码的影像数据依据哪个标准,所以产生不能选择适当的解码方法的问题。
为了解决该问题,在影像数据中复用了声音数据等的复用数据采用包含表示影像数据依据哪个标准的识别信息的结构。以下,说明包括通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据在内的复用数据的具体的结构。复用数据是MPEG-2传输流形式的数字流。
图36是表示复用数据的结构的图。如图36所示,复用数据通过将视频流、音频流、演示图形流(PG)、交互图形流中的1个以上进行复用而得到。视频流表示电影的主影像及副影像,音频流(IG)表示电影的主声音部分和与该主声音混合的副声音,演示图形流表示电影的字幕。这里,所谓主影像,表示显示在画面上的通常的影像,所谓副影像,是在主影像中用较小的画面显示的影像。此外,交互图形流表示通过在画面上配置GUI部件而制作的对话画面。视频流通过在上述各实施方式中示出的运动图像编码方法或装置、依据以往的MPEG-2、MPEG4-AVC、VC-1等标准的运动图像编码方法或装置编码。音频流由杜比AC-3、Dolby Digital Plus、MLP、DTS、DTS-HD、或线性PCM等的方式编码。
包含在复用数据中的各流通过PID被识别。例如,对在电影的影像中使用的视频流分配0x1011,对音频流分配0x1100到0x111F,对演示图形分配0x1200到0x121F,对交互图形流分配0x1400到0x141F,对在电影的副影像中使用的视频流分配0x1B00到0x1B1F,对与主声音混合的副声音中使用的音频流分配0x1A00到0x1A1F。
图37是示意地表示复用数据怎样被复用的图。首先,将由多个视频帧构成的视频流ex235、由多个音频帧构成的音频流ex238分别变换为PES包序列ex236及ex239,并变换为TS包ex237及ex240。同样,将演示图形流ex241及交互图形ex244的数据分别变换为PES包序列ex242及ex245,再变换为TS包ex243及ex246。复用数据ex247通过将这些TS包复用到1条流中而构成。
图38更详细地表示在PES包序列中怎样保存视频流。图38的第1段表示视频流的视频帧序列。第2段表示PES包序列。如图38的箭头yy1、yy2、yy3、yy4所示,视频流中的多个作为Video Presentation Unit的I图片、B图片、P图片按每个图片被分割并保存到PES包的有效载荷中。各PES包具有PES头,在PES头中,保存有作为图片的显示时刻的PTS(Presentation Time-Stamp)及作为图片的解码时刻的DTS(Decoding Time-Stamp)。
图39表示最终写入在复用数据中的TS包的形式。TS包是由具有识别流的PID等信息的4字节的TS头和保存数据的184字节的TS有效载荷构成的188字节固定长度的包,上述PES包被分割并保存到TS有效载荷中。在BD-ROM的情况下,对于TS包赋予4字节的TP_Extra_Header,构成192字节的源包,写入到复用数据中。在TP_Extra_Header中记载有ATS(Arrival_Time_Stamp)等信息。ATS表示该TS包向解码器的PID滤波器的转送开始时刻。在复用数据中,源包如图39下段所示排列,从复用数据的开头起递增的号码被称作SPN(源包号)。
此外,在复用数据所包含的TS包中,除了影像、声音、字幕等的各流以外,还有PAT(Program Association Table)、PMT(Program Map Table)、PCR(Program ClockReference)等。PAT表示在复用数据中使用的PMT的PID是什么,PAT自身的PID被登记为0。PMT具有复用数据所包含的影像、声音、字幕等的各流的PID、以及与各PID对应的流的属性信息,还具有关于复用数据的各种描述符。在描述符中,有指示许可/不许可复用数据的拷贝的拷贝控制信息等。PCR为了取得作为ATS的时间轴的ATC(Arrival Time Clock)与作为PTS及DTS的时间轴的STC(System Time Clock)的同步,拥有与该PCR包被转送至解码器的ATS对应的STC时间的信息。
图40是详细地说明PMT的数据构造的图。在PMT的开头,配置有记述了包含在该PMT中的数据的长度等的PMT头。在其后面,配置有多个关于复用数据的描述符。上述拷贝控制信息等被记载为描述符。在描述符之后,配置有多个关于包含在复用数据中的各流的流信息。流信息由记载有用来识别流的压缩编解码器的流类型、流的PID、流的属性信息(帧速率、纵横比等)的流描述符构成。流描述符存在复用数据中存在的流的数量。
在记录到记录介质等中的情况下,将上述复用数据与复用数据信息文件一起记录。
复用数据信息文件如图41所示,是复用数据的管理信息,与复用数据一对一地对应,由复用数据信息、流属性信息以及入口映射构成。
复用数据信息如图41所示,由系统速率、再现开始时刻、再现结束时刻构成。系统速率表示复用数据的向后述的系统目标解码器的PID滤波器的最大转送速率。包含在复用数据中的ATS的间隔设定为成为系统速率以下。再现开始时刻是复用数据的开头的视频帧的PTS,再现结束时刻设定为对复用数据的末端的视频帧的PTS加上1帧量的再现间隔的值。
流属性信息如图42所示,按每个PID登记有关于包含在复用数据中的各流的属性信息。属性信息具有按视频流、音频流、演示图形流、交互图形流而不同的信息。视频流属性信息具有该视频流由怎样的压缩编解码器压缩、构成视频流的各个图片数据的分辨率是多少、纵横比是多少、帧速率是多少等的信息。音频流属性信息具有该音频流由怎样的压缩编解码器压缩、包含在该音频流中的声道数是多少、对应于哪种语言、采样频率是多少等的信息。这些信息用于在播放器再现之前的解码器的初始化等中。
在本实施方式中,使用上述复用数据中的、包含在PMT中的流类型。此外,在记录介质中记录有复用数据的情况下,使用包含在复用数据信息中的视频流属性信息。具体而言,在上述各实施方式示出的运动图像编码方法或装置中,设置如下步骤或单元,该步骤或单元对包含在PMT中的流类型、或视频流属性信息,设定表示是通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据的固有信息。通过该结构,能够识别通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据、和依据其他标准的影像数据。
此外,在图43中表示本实施方式的运动图像解码方法的步骤。在步骤exS100中,从复用数据中取得包含在PMT中的流类型、或包含在复用数据信息中的视频流属性信息。接着,在步骤exS101中,判断流类型、或视频流属性信息是否表示是通过在上述各实施方式中示出的运动图像编码方法或装置生成的复用数据。并且,在判断为流类型、或视频流属性信息是通过在上述各实施方式中示出的运动图像编码方法或装置生成的复用数据情况下,在步骤exS102中,通过在上述各实施方式中示出的运动图像解码方法进行解码。此外,在流类型、或视频流属性信息表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的复用数据的情况下,在步骤exS103中,通过依据以往的标准的运动图像解码方法进行解码。
这样,通过在流类型、或视频流属性信息中设定新的固有值,在解码时能够判断是否能够通过在上述各实施方式中示出的运动图像解码方法或装置解码。因而,在被输入了依据不同的标准的复用数据的情况下,也能够选择适当的解码方法或装置,所以能够不发生错误地进行解码。此外,将在本实施方式中示出的运动图像编码方法或装置、或者运动图像解码方法或装置用在上述任何设备、系统中。
(实施方式5)
在上述各实施方式中示出的运动图像编码方法及装置、运动图像解码方法及装置典型地可以由作为集成电路的LSI实现。作为一例,在图44中表示1芯片化的LSIex500的结构。LSIex500具备以下说明的单元ex501、ex502、ex503、ex504、ex505、ex506、ex507、ex508、ex509,各单元经由总线ex510连接。电源电路部ex505通过在电源是开启状态的情况下对各部供给电力,起动为能够动作的状态。
例如在进行编码处理的情况下,LSIex500基于具有CPUex502、存储器控制器ex503、流控制器ex504、驱动频率控制部ex512等的控制部ex501的控制,通过AV I/Oex509从麦克风ex117及照相机ex113等输入AV信号。被输入的AV信号暂时储存在SDRAM等的外部的存储器ex511中。基于控制部ex501的控制,将储存的数据根据处理量及处理速度适当地分为多次等,向信号处理部ex507发送,在信号处理部ex507中进行声音信号的编码及/或影像信号的编码。这里,影像信号的编码处理是在上述各实施方式中说明的编码处理。在信号处理部ex507中,还根据情况而进行将编码的声音数据和编码的影像数据复用等的处理,从流I/Oex506向外部输出。将该输出的比特流向基站ex107发送、或写入到记录介质ex215中。另外,在复用时,可以暂时将数据储存到缓冲器ex508中以使其同步。
另外,在上述中,设存储器ex511为LSIex500的外部的结构进行了说明,但也可以是包含在LSIex500的内部中的结构。缓冲器ex508也并不限定于一个,也可以具备多个缓冲器。此外,LSIex500既可以形成1个芯片,也可以形成多个芯片。
此外,在上述中,假设控制部ex510具有CPUex502、存储器控制器ex503、流控制器ex504、驱动频率控制部ex512等,但控制部ex510的结构并不限定于该结构。例如,也可以是信号处理部ex507还具备CPU的结构。通过在信号处理部ex507的内部中也设置CPU,能够进一步提高处理速度。此外,作为其他例,也可以是CPUex502具备信号处理部ex507、或作为信号处理部ex507的一部分的例如声音信号处理部的结构。在这样的情况下,控制部ex501为具备具有信号处理部ex507或其一部分的CPUex502的结构。
另外,这里设为LSI,但根据集成度的差异,也有称作IC、系统LSI、超级(super)LSI、特级(ultra)LSI的情况。
此外,集成电路化的方法并不限定于LSI,也可以由专用电路或通用处理器实现。也可以利用在LSI制造后能够编程的FPGA(Field Programmable Gate Array)、或能够重构LSI内部的电路单元的连接及设定的可重构处理器。
进而,如果因半导体技术的进步或派生的其他技术而出现代替LSI的集成电路化的技术,则当然也可以使用该技术进行功能模块的集成化。有可能是生物技术的应用等。
(实施方式6)
在将通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据解码的情况下,考虑到与将依据以往的MPEG-2、MPEG4-AVC、VC-1等标准的影像数据的情况相比处理量会增加。因此,在LSIex500中,需要设定为比将依据以往的标准的影像数据解码时的CPUex502的驱动频率更高的驱动频率。但是,如果将驱动频率设得高,则发生消耗电力变高的问题。
为了解决该问题,电视机ex300、LSIex500等的运动图像解码装置采用识别影像数据依据哪个标准、并根据标准切换驱动频率的结构。图45表示本实施方式的结构ex800。驱动频率切换部ex803在影像数据是通过在上述各实施方式中示出的运动图像编码方法或装置生成的情况下,将驱动频率设定得高。并且,对执行在上述各实施方式中示出的运动图像解码方法的解码处理部ex801指示将影像数据解码。另一方面,在影像数据是依据以往的标准的影像数据的情况下,与影像数据是通过在上述各实施方式中示出的运动图像编码方法或装置生成的数据的情况相比,将驱动频率设定得低。并且,对依据以往的标准的解码处理部ex802指示将影像数据解码。
更具体地讲,驱动频率切换部ex803由图44的CPUex502和驱动频率控制部ex512构成。此外,执行在上述各实施方式中示出的运动图像解码方法的解码处理部ex801、以及依据以往的标准的解码处理部ex802对应于图44的信号处理部ex507。CPUex502识别影像数据依据哪个标准。并且,基于来自CPUex502的信号,驱动频率控制部ex512设定驱动频率。此外,基于来自CPUex502的信号,信号处理部ex507进行影像数据的解码。这里,可以考虑在影像数据的识别中使用例如在实施方式4中记载的识别信息。关于识别信息,并不限定于在实施方式4中记载的信息,只要是能够识别影像数据依据哪个标准的信息就可以。例如,在基于识别影像数据利用于电视机还是利用于盘等的外部信号,来能够识别影像数据依据哪个标准的情况下,也可以基于这样的外部信号进行识别。此外,CPUex502的驱动频率的选择例如可以考虑如图47所示的将影像数据的标准与驱动频率建立对应的查找表进行。将查找表预先保存到缓冲器ex508、或LSI的内部存储器中,CPUex502通过参照该查找表,能够选择驱动频率。
图46表示实施本实施方式的方法的步骤。首先,在步骤exS200中,在信号处理部ex507中,从复用数据中取得识别信息。接着,在步骤exS201中,在CPUex502中,基于识别信息识别影像数据是否是通过在上述各实施方式中示出的编码方法或装置生成的数据。在影像数据是通过在上述各实施方式中示出的编码方法或装置生成的数据的情况下,在步骤exS202中,CPUex502向驱动频率控制部ex512发送将驱动频率设定得高的信号。并且,在驱动频率控制部ex512中设定为高的驱动频率。另一方面,在表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的影像数据的情况下,在步骤exS203中,CPUex502向驱动频率控制部ex512发送将驱动频率设定得低的信号。并且,在驱动频率控制部ex512中,设定为与影像数据是通过在上述各实施方式中示出的编码方法或装置生成的数据的情况相比更低的驱动频率。
进而,通过与驱动频率的切换连动而变更对LSIex500或包括LSIex500的装置施加的电压,由此能够进一步提高节电效果。例如,在将驱动频率设定得低的情况下,随之,可以考虑与将驱动频率设定得高的情况相比,将对LSIex500或包括LSIex500的装置施加的电压设定得低。
此外,驱动频率的设定方法只要是在解码时的处理量大的情况下将驱动频率设定得高、在解码时的处理量小的情况下将驱动频率设定得低就可以,并不限定于上述的设定方法。例如,可以考虑在将依据MPEG4-AVC标准的影像数据解码的处理量大于将通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据解码的处理量的情况下,与上述的情况相反地进行驱动频率的设定。
进而,驱动频率的设定方法并不限定于使驱动频率低的结构。例如,也可以考虑在识别信息是通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据的情况下,将对LSIex500或包括LSIex500的装置施加的电压设定得高,在表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的影像数据的情况下,将对LSIex500或包括LSIex500的装置施加的电压设定得低。此外,作为另一例,也可以考虑在识别信息表示是通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据的情况下,不使CPUex502的驱动停止,在表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的影像数据的情况下,由于在处理中有富余,所以使CPUex502的驱动暂停。也可以考虑在识别信息表示是通过在上述各实施方式中示出的运动图像编码方法或装置生成的影像数据的情况下,也只要在处理中有富余则使CPUex502的驱动暂停。在此情况下,可以考虑与表示是依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的影像数据的情况相比,将停止时间设定得短。
这样,根据影像数据所依据的标准来切换驱动频率,由此能够实现节电化。此外,在使用电池来驱动LSIex500或包括LSIex500的装置的情况下,能够随着节电而延长电池的寿命。
(实施方式7)
在电视机、便携电话等上述的设备、系统中,有时被输入依据不同的标准的多个影像数据。这样,为了使得在被输入了依据不同的标准的多个影像数据的情况下也能够解码,LSIex500的信号处理部ex507需要对应于多个标准。但是,如果单独使用对应于各个标准的信号处理部ex507,则发生LSIex500的电路规模变大、此外成本增加的问题。
为了解决该问题,采用将用来执行在上述各实施方式中示出的运动图像解码方法的解码处理部、和依据以往的MPEG-2、MPEG4-AVC、VC-1等的标准的解码处理部一部分共用的结构。图48A的ex900表示该结构例。例如,在上述各实施方式中示出的运动图像解码方法和依据MPEG4-AVC标准的运动图像解码方法在熵编码、逆量化、解块滤波器、运动补偿等的处理中有一部分处理内容共通。可以考虑如下结构:关于共通的处理内容,共用对应于MPEG4-AVC标准的解码处理部ex902,关于不对应于MPEG4-AVC标准的本发明的一个方式所特有的其他的处理内容,使用专用的解码处理部ex901。特别是,本发明的一个方式在帧存储器控制方面具有特征,因此可以考虑例如对于帧存储器控制使用专用的解码处理部ex901,对于除此之外的逆量化、熵解码、解块滤波、运动补偿中的某一个或者全部的处理,共用解码处理部。关于解码处理部的共用,也可以是如下结构:关于共通的处理内容,共用用来执行在上述各实施方式中示出的运动图像解码方法的解码处理部,关于MPEG4-AVC标准所特有的处理内容,使用专用的解码处理部。
此外,用图48B的ex1000表示将处理一部分共用的另一例。在该例中,采用使用与本发明的一个方式所特有的处理内容对应的专用的解码处理部ex1001、和与其他的以往标准所特有的处理内容对应的专用的解码处理部ex1002、和与在本发明的一个方式的运动图像解码方法和其他的以往标准的运动图像解码方法中共通的处理内容对应的共用的解码处理部ex1003的结构。这里,专用的解码处理部ex1001、ex1002并不一定是为本发明的一个方式、或者其他的以往标准所特有的处理内容而特殊化的,可以是能够执行其他的通用处理的结构。此外,也能够由LSIex500安装本实施方式的结构。
这样,对于在本发明的一个方式的运动图像解码方法和以往的标准的运动图像解码方法中共通的处理内容,共用解码处理部,由此能够减小LSI的电路规模并且降低成本。
以上根据实施方式对多个方式的图像编码装置和图像解码装置进行了说明,但是,本发明不限于该实施方式。只要不脱离本发明的主旨,则对本实施方式施加本领域技术人员想到的各种变形而得到的方式、组合不同实施方式中的结构要素而构筑的方式也可以包含在一个或多个方式的范围内。
产业上的可利用性
本发明能够应用到图像编码方法、图像解码方法、图像编码装置及图像解码装置中。此外,本发明能够在具备图像编码装置的电视机、数字视频记录机、汽车导航仪、便携电话、数码相机及数字视频摄像机等的高分辨率的信息显示设备或摄像设备中使用。
附图标记说明
100 图像编码装置
101 减法器
102 正交变换部
103 量化部
104、204 逆量化部
105、205 逆正交变换部
106、206 加法器
107、207 块存储器
108、208 帧存储器
109、209 帧内预测部
110、210 帧间预测部
111、211 图片类型决定部
112 可变长编码部
113、213 帧存储器控制部
120 输入图像信号
121、125、225 预测误差数据
122、124、224 频率系数
123、223 量化值
126、127、128、226、227、228 解码图像数据
129、130、131、229、230、231 预测图像数据
132、132A、132B、132C、132D、132E、132F、132G、232、500 编码比特流
133、233 帧存储器控制信息
200 图像解码装置
212 可变长解码部
301、301B、301D、501 SPS(序列参数集)
302、302B、302C、302E、302F、302G、502 PPS(图片参数集)
303、503 图片数据
311 SPS识别符
312、512 缓冲器记述定义信息
313 参照列表记述定义信息
314 缓冲器记述数
315、515 缓冲器记述
316 参照列表记述
321 SPS选择信息
322、522 PPS识别符
323、323F、323G、523 缓冲器记述更新信息
324、324F、324G 参照列表记述更新信息
325 更新数信息
326 更新信息
327 缓冲器记述选择信息
328 缓冲器记述修正信息
329 参照列表定义信息
331、331A 图片头
332 图片数据部
333、533 PPS选择信息
334 缓冲器记述选择信息
335、535 切片数据
341、341A、341B、341D、341G、541 切片头
342、542 切片数据部
343、543 CU数据
351 缓冲器记述选择信息
352 缓冲器记述修正标志
515A 缓冲器元素
Claims (2)
1.一种解码方法,使用用来指定保持在缓冲器中的图片的缓冲器记述、和用来指定所参照的图片的参照列表,将图片解码,其特征在于,
包括:
缓冲器记述取得步骤,从编码比特流取得定义缓冲器记述的缓冲器记述定义信息;
参照列表生成步骤,生成包含由上述缓冲器记述表示的多个图片的初始设定的参照列表;
重新排列信息取得步骤,从上述编码比特流取得表示对于上述初始设定的参照列表中包含的图片的顺序进行重新排列的重新排列信息;
重新排列处理步骤,进行按照上述重新排列信息将上述初始设定的参照列表中包含的图片的顺序重新排列的重新排列处理;以及
解码步骤,使用上述缓冲器记述和通过上述重新排列处理得到的参照列表,将作为解码对象的图片或作为解码对象的切片解码;
在上述重新排列信息中,作为上述重新排列的对象的图片,由在该解码方法中在该重新排列信息之外也被使用的缓冲器元素索引来确定,
上述缓冲器元素索引,除了被用于上述重新排列信息之外,在上述缓冲器记述中分别与指定1张图片的缓冲器元素建立了对应,并且被用于确定上述缓冲器元素。
2.一种解码装置,使用用来指定保持在缓冲器中的图片的缓冲器记述、和用来指定所参照的图片的参照列表,将图片解码,其特征在于,
具备:
缓冲器记述取得部,从编码比特流取得定义缓冲器记述的缓冲器记述定义信息;
参照列表生成部,生成包含由上述缓冲器记述表示的多个图片的初始设定的参照列表;
重新排列信息取得部,从上述编码比特流取得表示对于上述初始设定的参照列表中包含的图片的顺序进行重新排列的重新排列信息;
重新排列处理部,进行按照上述重新排列信息将上述初始设定的参照列表中包含的图片的顺序重新排列的重新排列处理;以及
解码部,使用上述缓冲器记述和通过上述重新排列处理得到的参照列表,将作为解码对象的图片或作为解码对象的切片解码;
在上述重新排列信息中,作为上述重新排列的对象的图片,由在该解码装置中在该重新排列信息之外也被使用的缓冲器元素索引来确定,
上述缓冲器元素索引,除了被用于上述重新排列信息之外,在上述缓冲器记述中分别与指定1张图片的缓冲器元素建立了对应,并且被用于确定上述缓冲器元素。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161548842P | 2011-10-19 | 2011-10-19 | |
US61/548,842 | 2011-10-19 | ||
CN201280049463.6A CN104025598B (zh) | 2011-10-19 | 2012-09-28 | 图像编码方法、图像编码装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280049463.6A Division CN104025598B (zh) | 2011-10-19 | 2012-09-28 | 图像编码方法、图像编码装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107770548A CN107770548A (zh) | 2018-03-06 |
CN107770548B true CN107770548B (zh) | 2020-04-14 |
Family
ID=48135972
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280049463.6A Active CN104025598B (zh) | 2011-10-19 | 2012-09-28 | 图像编码方法、图像编码装置 |
CN201711214366.9A Active CN107770548B (zh) | 2011-10-19 | 2012-09-28 | 解码方法、解码装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280049463.6A Active CN104025598B (zh) | 2011-10-19 | 2012-09-28 | 图像编码方法、图像编码装置 |
Country Status (12)
Country | Link |
---|---|
US (4) | US9578346B2 (zh) |
EP (4) | EP4024871B1 (zh) |
JP (2) | JP5995111B2 (zh) |
KR (1) | KR102010100B1 (zh) |
CN (2) | CN104025598B (zh) |
CA (1) | CA2850598C (zh) |
ES (2) | ES2924280T3 (zh) |
IN (1) | IN2014CN02604A (zh) |
MX (1) | MX2014003992A (zh) |
PL (2) | PL4024871T3 (zh) |
RU (1) | RU2625944C2 (zh) |
WO (1) | WO2013057884A1 (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL2749027T3 (pl) | 2011-08-25 | 2020-10-19 | Sun Patent Trust | Sposoby i urządzenia do kodowania i dekodowania wideo z użyciem zaktualizowanego opisu bufora |
ES2685431T3 (es) | 2011-09-07 | 2018-10-09 | Sun Patent Trust | Procedimiento de decodificación de imágenes y aparato de decodificación de imágenes |
ES2844148T3 (es) | 2011-09-19 | 2021-07-21 | Sun Patent Trust | Procedimiento de descodificación de imágenes, dispositivo de descodificación de imágenes |
JP6078927B2 (ja) * | 2012-01-10 | 2017-02-15 | サン パテント トラスト | 動画像符号化方法、動画像符号化装置、動画像復号方法、及び、動画像復号装置 |
CN104350751B (zh) * | 2012-04-12 | 2017-12-12 | 瑞典爱立信有限公司 | 扩展数据处理 |
CN104365100A (zh) * | 2012-04-15 | 2015-02-18 | 三星电子株式会社 | 用于并行处理的视频编码方法和装置以及视频解码方法和装置 |
US9621905B2 (en) * | 2012-06-29 | 2017-04-11 | Qualcomm Incorporated | Tiles and wavefront parallel processing |
JP5789004B2 (ja) * | 2013-08-09 | 2015-10-07 | ソニー株式会社 | 送信装置、送信方法、受信装置、受信方法、符号化装置および符号化方法 |
CN118264801A (zh) * | 2017-12-14 | 2024-06-28 | Lg电子株式会社 | 图像解码和编码方法及数据的发送方法 |
CN112544084B (zh) * | 2018-05-15 | 2024-03-01 | 夏普株式会社 | 图像编码装置、编码流提取装置以及图像解码装置 |
EP3854099A4 (en) * | 2018-09-21 | 2022-06-29 | Sharp Kabushiki Kaisha | Systems and methods for signaling reference pictures in video coding |
US11196988B2 (en) | 2018-12-17 | 2021-12-07 | Apple Inc. | Reference picture management and list construction |
KR20220100710A (ko) | 2019-12-23 | 2022-07-15 | 엘지전자 주식회사 | Nal 유닛 타입 기반 영상 또는 비디오 코딩 |
WO2021132963A1 (ko) * | 2019-12-23 | 2021-07-01 | 엘지전자 주식회사 | 슬라이스 또는 픽처에 대한 nal 유닛 타입 기반 영상 또는 비디오 코딩 |
MX2022007897A (es) * | 2019-12-23 | 2022-09-26 | Lg Electronics Inc | Codificacion de imagen o video basada en informacion asociada a la unidad nal. |
US11367385B2 (en) | 2020-02-28 | 2022-06-21 | Apple Inc. | Power saving by reordering bit sequence of image data |
GB2592656B (en) | 2020-03-05 | 2023-04-19 | Canon Kk | High level syntax for video coding and decoding |
EP4154542A4 (en) * | 2020-06-09 | 2023-10-11 | ByteDance Inc. | CONSTRAINTS ON ADDITIONAL ENHANCEMENT INFORMATION IN VIDEO CODING |
WO2022226523A1 (en) * | 2021-04-23 | 2022-10-27 | Bytedance Inc. | Method, device, and medium for video processing |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101065780A (zh) * | 2004-10-14 | 2007-10-31 | 诺基亚公司 | 视频编码中的参考图像管理 |
CN101304530A (zh) * | 2007-05-07 | 2008-11-12 | 松下电器产业株式会社 | 活动图像解码集成电路、活动图像解码方法、装置及程序 |
CN101911706A (zh) * | 2008-01-09 | 2010-12-08 | 三菱电机株式会社 | 图像编码装置、图像解码装置、图像编码方法以及图像解码方法 |
CN102025992A (zh) * | 2010-11-23 | 2011-04-20 | 浙江大学 | 用于h.264视频解码系统中帧间预测过程的参考图像管理方法 |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI114527B (fi) | 2002-01-23 | 2004-10-29 | Nokia Corp | Kuvakehysten ryhmittely videokoodauksessa |
CN1288915C (zh) * | 2002-01-23 | 2006-12-06 | 诺基亚有限公司 | 视频序列的编码和解码方法及相关的视频编码器和解码器 |
JP4215197B2 (ja) | 2002-04-12 | 2009-01-28 | パナソニック株式会社 | 画像符号化方法および画像復号化方法 |
JP4724351B2 (ja) | 2002-07-15 | 2011-07-13 | 三菱電機株式会社 | 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、および通信装置 |
US8040949B2 (en) | 2003-01-09 | 2011-10-18 | The Regents Of The University Of California | Video encoding methods and devices |
CN100499788C (zh) | 2003-01-09 | 2009-06-10 | 加利福尼亚大学董事会 | 视频编码设备 |
US7380028B2 (en) | 2003-06-13 | 2008-05-27 | Microsoft Corporation | Robust delivery of video data |
KR101136629B1 (ko) | 2004-01-30 | 2012-04-23 | 파나소닉 주식회사 | 화상 부호화 방법, 화상 복호화 방법, 화상 부호화 장치,화상 복호화 장치, 및 그 프로그램 |
EP2190192B1 (en) * | 2004-06-02 | 2014-08-06 | Panasonic Corporation | Picture coding apparatus and picture decoding apparatus |
US20050276500A1 (en) * | 2004-06-15 | 2005-12-15 | Canon Kabushiki Kaisha | Image encoding apparatus, and image processing apparatus and its control method |
WO2006030694A1 (ja) | 2004-09-13 | 2006-03-23 | Sharp Kabushiki Kaisha | 画像符号化装置、画像復号装置、画像符号化プログラム、及び画像復号プログラム |
US20060083298A1 (en) * | 2004-10-14 | 2006-04-20 | Nokia Corporation | Reference picture management in video coding |
US8615038B2 (en) | 2004-12-06 | 2013-12-24 | Nokia Corporation | Video coding, decoding and hypothetical reference decoder |
KR100770704B1 (ko) | 2005-08-04 | 2007-10-29 | 삼성전자주식회사 | 픽쳐 스킵 방법 및 장치 |
CN101455084A (zh) | 2006-03-30 | 2009-06-10 | Lg电子株式会社 | 用于解码/编码视频信号的方法和装置 |
KR100934674B1 (ko) | 2006-03-30 | 2009-12-31 | 엘지전자 주식회사 | 비디오 신호를 디코딩/인코딩하기 위한 방법 및 장치 |
US8948256B2 (en) * | 2006-10-13 | 2015-02-03 | Thomson Licensing | Reference picture list management syntax for multiple view video coding |
US20100027615A1 (en) | 2006-10-24 | 2010-02-04 | Purvin Bibhas Pandit | Picture identification for multi-view video coding |
CN101529914A (zh) | 2006-10-24 | 2009-09-09 | 汤姆逊许可证公司 | 用于多视角视频编码的图像管理 |
JP5023739B2 (ja) | 2007-02-28 | 2012-09-12 | ソニー株式会社 | 画像情報符号化装置及び符号化方法 |
US8219778B2 (en) * | 2008-02-27 | 2012-07-10 | Microchip Technology Incorporated | Virtual memory interface |
JP5756921B2 (ja) | 2008-06-10 | 2015-07-29 | パナソニックIpマネジメント株式会社 | 画像復号装置、画像復号方法、画像符号化装置、画像符号化方法、プログラムおよび集積回路 |
US8300704B2 (en) | 2008-07-22 | 2012-10-30 | International Business Machines Corporation | Picture processing via a shared decoded picture pool |
WO2010086500A1 (en) | 2009-01-28 | 2010-08-05 | Nokia Corporation | Method and apparatus for video coding and decoding |
JPWO2010087157A1 (ja) | 2009-01-29 | 2012-08-02 | パナソニック株式会社 | 画像符号化方法及び画像復号方法 |
JP5332773B2 (ja) | 2009-03-18 | 2013-11-06 | ソニー株式会社 | 画像処理装置および方法 |
JP2011082683A (ja) * | 2009-10-05 | 2011-04-21 | Sony Corp | 画像処理装置、画像処理方法、及び、プログラム |
CA2807545C (en) | 2011-02-22 | 2018-04-10 | Panasonic Corporation | Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus |
PL3410725T3 (pl) * | 2011-06-30 | 2022-02-21 | Telefonaktiebolaget Lm Ericsson (Publ) | Sygnalizacja obrazu referencyjnego |
EP2687012A1 (en) | 2011-06-30 | 2014-01-22 | Telefonaktiebolaget L M Ericsson (PUBL) | Absolute or explicit reference picture signaling |
US9232233B2 (en) | 2011-07-01 | 2016-01-05 | Apple Inc. | Adaptive configuration of reference frame buffer based on camera and background motion |
PL2749027T3 (pl) | 2011-08-25 | 2020-10-19 | Sun Patent Trust | Sposoby i urządzenia do kodowania i dekodowania wideo z użyciem zaktualizowanego opisu bufora |
ES2685431T3 (es) | 2011-09-07 | 2018-10-09 | Sun Patent Trust | Procedimiento de decodificación de imágenes y aparato de decodificación de imágenes |
ES2844148T3 (es) | 2011-09-19 | 2021-07-21 | Sun Patent Trust | Procedimiento de descodificación de imágenes, dispositivo de descodificación de imágenes |
US9131245B2 (en) | 2011-09-23 | 2015-09-08 | Qualcomm Incorporated | Reference picture list construction for video coding |
WO2013048324A1 (en) | 2011-09-29 | 2013-04-04 | Telefonaktiebolaget L M Ericsson (Publ) | Reference picture list handling |
US8768079B2 (en) | 2011-10-13 | 2014-07-01 | Sharp Laboratories Of America, Inc. | Tracking a reference picture on an electronic device |
RU2604679C2 (ru) | 2011-10-27 | 2016-12-10 | Сан Пэтент Траст | Способ кодирования изображений, способ декодирования изображений, устройство кодирования изображений и устройство декодирования изображений |
KR101935976B1 (ko) | 2011-10-28 | 2019-01-07 | 선 페이턴트 트러스트 | 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치 및 화상 복호 장치 |
CN107948656B (zh) | 2011-10-28 | 2021-06-01 | 太阳专利托管公司 | 图像解码方法及图像解码装置 |
US20130114687A1 (en) | 2011-11-07 | 2013-05-09 | Sharp Laboratories Of America, Inc. | Fixed intra run-level mode for cavlc in hevc |
US9648321B2 (en) | 2011-12-02 | 2017-05-09 | Qualcomm Incorporated | Coding picture order count values identifying long-term reference frames |
US9319679B2 (en) | 2012-06-07 | 2016-04-19 | Qualcomm Incorporated | Signaling data for long term reference pictures for video coding |
US9584825B2 (en) | 2012-09-27 | 2017-02-28 | Qualcomm Incorporated | Long-term reference picture signaling in video coding |
US9756355B2 (en) | 2014-06-20 | 2017-09-05 | Qualcomm Incorporated | Value ranges for syntax elements in video coding |
-
2012
- 2012-09-28 CN CN201280049463.6A patent/CN104025598B/zh active Active
- 2012-09-28 JP JP2013539512A patent/JP5995111B2/ja active Active
- 2012-09-28 CN CN201711214366.9A patent/CN107770548B/zh active Active
- 2012-09-28 RU RU2014113564A patent/RU2625944C2/ru active
- 2012-09-28 KR KR1020147009160A patent/KR102010100B1/ko active IP Right Grant
- 2012-09-28 CA CA2850598A patent/CA2850598C/en active Active
- 2012-09-28 MX MX2014003992A patent/MX2014003992A/es active IP Right Grant
- 2012-09-28 PL PL22156088.1T patent/PL4024871T3/pl unknown
- 2012-09-28 WO PCT/JP2012/006235 patent/WO2013057884A1/ja active Application Filing
- 2012-09-28 PL PL20185492.4T patent/PL3742735T3/pl unknown
- 2012-09-28 EP EP22156088.1A patent/EP4024871B1/en active Active
- 2012-09-28 ES ES20185492T patent/ES2924280T3/es active Active
- 2012-09-28 IN IN2604CHN2014 patent/IN2014CN02604A/en unknown
- 2012-09-28 EP EP20185492.4A patent/EP3742735B1/en active Active
- 2012-09-28 EP EP24168897.7A patent/EP4373088A3/en active Pending
- 2012-09-28 EP EP12841179.0A patent/EP2770734B1/en active Active
- 2012-09-28 ES ES12841179T patent/ES2827213T3/es active Active
- 2012-10-18 US US13/654,854 patent/US9578346B2/en active Active
-
2016
- 2016-08-10 JP JP2016158088A patent/JP6183630B2/ja active Active
- 2016-10-25 US US15/333,393 patent/US10021415B2/en active Active
-
2018
- 2018-03-05 US US15/911,756 patent/US10390043B2/en active Active
- 2018-12-26 US US16/232,415 patent/US10602184B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101065780A (zh) * | 2004-10-14 | 2007-10-31 | 诺基亚公司 | 视频编码中的参考图像管理 |
CN101304530A (zh) * | 2007-05-07 | 2008-11-12 | 松下电器产业株式会社 | 活动图像解码集成电路、活动图像解码方法、装置及程序 |
CN101911706A (zh) * | 2008-01-09 | 2010-12-08 | 三菱电机株式会社 | 图像编码装置、图像解码装置、图像编码方法以及图像解码方法 |
CN102025992A (zh) * | 2010-11-23 | 2011-04-20 | 浙江大学 | 用于h.264视频解码系统中帧间预测过程的参考图像管理方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6172485B2 (ja) | 画像符号化方法及び画像符号化装置 | |
JP6183630B2 (ja) | 画像復号方法及び画像復号装置 | |
JP6108326B2 (ja) | 画像符号化方法、及び画像符号化装置 | |
CN109905710B (zh) | 动态图像编码方法及装置、动态图像解码方法及装置 | |
CN107396118B (zh) | 编码方法和编码装置 | |
KR101790401B1 (ko) | 주기적인 버퍼 기재를 사용하여 비디오를 부호화 및 복호하는 방법 및 장치 | |
CN107483959B (zh) | 图像解码方法及图像解码装置 | |
EP2843945B1 (en) | Image encoding method, image decoding method, image encoding device, image decoding device, and image encoding/decoding device | |
JP6489337B2 (ja) | 算術復号方法および算術符号化方法 | |
CN108683917B (zh) | 图像编码方法及图像编码装置 | |
CN105308972B (zh) | 图像编码方法及装置、记录介质、图像解码方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |