JP2020058075A - Moving image prediction encoding device, moving image prediction decoding device, moving image prediction encoding method, moving image prediction decoding method, and recording medium - Google Patents

Moving image prediction encoding device, moving image prediction decoding device, moving image prediction encoding method, moving image prediction decoding method, and recording medium Download PDF

Info

Publication number
JP2020058075A
JP2020058075A JP2020002270A JP2020002270A JP2020058075A JP 2020058075 A JP2020058075 A JP 2020058075A JP 2020002270 A JP2020002270 A JP 2020002270A JP 2020002270 A JP2020002270 A JP 2020002270A JP 2020058075 A JP2020058075 A JP 2020058075A
Authority
JP
Japan
Prior art keywords
image
frame size
images
mfsbuffer
reproduced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020002270A
Other languages
Japanese (ja)
Other versions
JP6875566B2 (en
Inventor
暁 藤林
Akira Fujibayashi
暁 藤林
ブン チュンセン
Chunsen Bun
チュンセン ブン
タン ティオ ケン
Tio Ken Tang
ティオ ケン タン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2020002270A priority Critical patent/JP6875566B2/en
Publication of JP2020058075A publication Critical patent/JP2020058075A/en
Application granted granted Critical
Publication of JP6875566B2 publication Critical patent/JP6875566B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

To efficiently use an image buffer memory to allow coding efficiency to be improved further.SOLUTION: A moving image prediction decoding method according to the present invention obtains an object image frame size indicating the frame size of an object image, MaxLumaFS indicating a maximum size of a reproduction image that can be stored in a decoded image buffer, and MFSBuffer expressed by the maximum number of reproduction images that can be stored in the decoded image buffer, and if it is determined that a half of MaxLumaFS is equal to or more than the object image frame size, doubles MFSBuffer, and sets maxDPBsize, which is an adaptive maximum number of reproduction images that can be stored in the decoded image buffer, to twice MFSBuffer. The number of reproduction images stored in the decoded image buffer is equal to or less than the number set in maxDPBsize.SELECTED DRAWING: Figure 5

Description

本発明は、動画像予測符号化装置、動画像予測復号装置、動画像予測符号化方法、動画像予測復号方法及び記録媒体に関するもので、とりわけ、復号画像バッファにおいて格納可能な再生画像の最大枚数を管理する動画像予測符号化装置、動画像予測復号装置、動画像予測符号化方法、動画像予測復号方法及び記録媒体に関わるものである。   The present invention relates to a video prediction encoding device, a video prediction decoding device, a video prediction encoding method, a video prediction decoding method, and a recording medium, and in particular, the maximum number of reproduced images that can be stored in a decoded image buffer. The present invention relates to a video prediction encoding device, a video prediction decoding device, a video prediction encoding method, a video prediction decoding method, and a recording medium that manages a video.

動画像データの伝送や蓄積を効率よく行うために、圧縮符号化技術が用いられる。動画像の場合ではMPEG1〜4やH.261〜H.264の方式が広く用いられている。   In order to efficiently transmit and store moving image data, a compression encoding technique is used. In the case of a moving image, MPEG1-4 or H.264. 261-H. The H.264 system is widely used.

これらの符号化方式では、符号化の対象となる画像を複数のブロックに分割した上で符号化・復号処理を行う。符号化効率を高めるため下記のような予測符号化方法が用いられる。画面内の予測符号化では、対象ブロックと同じ画面内にある隣接する既再生の画像信号(過去に圧縮された画像データを復元したもの)を用いて予測信号を生成した上で、それを対象ブロックの信号から引き算した差分信号を符号化する。画面間の予測符号化では、対象ブロックと異なる画面内にある既再生の画像信号を参照し、信号の変位を検索し、その動いた分を補償して予測信号を生成し、それを対象ブロックの信号から引き算した差分信号を符号化する。動きの検索・補償を行うために参照される既再生の画像を、参照画像という。   In these encoding methods, an image to be encoded is divided into a plurality of blocks before encoding and decoding processes are performed. The following predictive coding method is used to enhance the coding efficiency. In predictive coding in a screen, a predicted signal is generated using an image of a previously reproduced image (decompressed image data compressed in the past) adjacent to the target block in the same screen as the target block. The difference signal subtracted from the block signal is encoded. In predictive coding between screens, a previously reproduced image signal in a screen different from the target block is referred to, a displacement of the signal is searched, a moving signal is compensated for, and a predicted signal is generated. The difference signal obtained by subtracting from the signal is encoded. A previously reproduced image that is referred to for performing motion search / compensation is called a reference image.

また、双方向画面間予測では、表示時間順に過去にある画像だけではなくて、対象画像の後に表示される未来の画像もあわせて参照する場合がある(この未来画像は対象画像より先に符号化し、予め再生しておく必要がある)。過去の画像と未来の画像から取得された予測信号を平均化することによって、隠されていて新たに現れる物体の信号の予測に有効であると同時に、両予測信号に含まれている雑音を軽減する効果がある。   Further, in the bidirectional inter-screen prediction, not only images in the past in the order of display time but also future images displayed after the target image may be referred to in some cases. And it needs to be reproduced in advance). By averaging the predicted signals obtained from past and future images, it is effective in predicting the signal of hidden and newly appearing objects, while reducing the noise contained in both predicted signals Has the effect of doing

さらに、H.264の画面間予測符号化では、対象ブロックに対する予測信号は、過去に符号化した上で再生された複数の参照画像を参照し、動き検索しながら誤差の最も少ない画像信号を最適な予測信号として選択する。対象ブロックの画素信号とこの最適な予測信号との差分を求め、離散コサイン変換を施し、量子化した上でエントロピー符号化する。同時に、対象ブロックに対する最適な予測信号をどの参照画像のどの領域から取得するかに関する情報(それぞれ、参照インデックスと動きベクトルという)も合わせて符号化する。   Furthermore, H. In the H.264 inter-picture prediction coding, a prediction signal for a target block refers to a plurality of reference images that have been coded and reproduced in the past, and uses the image signal with the least error as an optimal prediction signal while performing motion search. select. The difference between the pixel signal of the target block and the optimal prediction signal is obtained, subjected to discrete cosine transform, quantized, and entropy-coded. At the same time, it encodes information (referred to as a reference index and a motion vector, respectively) regarding which region of a reference image obtains an optimal prediction signal for the target block.

ところで、H.264においては、複数の再生画像を参照することが可能である。これらの再生画像は予測に用いる参照画像として画像バッファメモリである復号画像バッファ(DPB: Decoded picture buffer)に保存される。復号画像バッファ(DPB)のサイズはプロファイル(profile)及びレベル(level)により定義されており、参照画像の枚数ではなく、ビット量として定義されている。つまり、同じプロファイル、レベルであっても画像のフレームサイズに応じて枚数が変化する。例えばメイン(Main)プロファイル、レベル3.2の場合、予測に用いる参照画像を格納するための画像バッファの最大サイズ(MaxDPBSize: Maximum Decoded Picture Buffer size)は7680.0×1024[bytes]と定義されており、1280×720 4:2:0の場合、復号画像バッファ(DPB)に保存できる再生画像は5枚、1280×1024 4:2:0の場合、復号画像バッファ(DPB)に保存可能な再生画像の最大枚数は4枚となる。図1に画像のフレームサイズによって格納可能な再生画像の最大枚数が4枚(図1(a))、5枚(図1(b))及び6枚(図1(c))のときの復号画像バッファの画像配置を示す。このように、あらかじめ用意された画像バッファメモリが再生画像のフレームサイズに応じて、メモリポインタを可変的に配置することで、メモリ配置を工夫しながら利用されることとなる。   By the way, H. In H.264, it is possible to refer to a plurality of reproduced images. These reproduced images are stored in a decoded image buffer (DPB: Decoded picture buffer) as an image buffer memory as a reference image used for prediction. The size of the decoded image buffer (DPB) is defined by a profile and a level, and is defined not as the number of reference images but as a bit amount. That is, the number of images changes according to the frame size of the image even with the same profile and level. For example, in the case of a main (Main) profile at level 3.2, the maximum size (MaxDPBSize: Maximum Decoded Picture Buffer size) of an image buffer for storing a reference image used for prediction is defined as 7680.0 × 1024 [bytes]. In the case of 1280 × 720 4: 2: 0, 5 playback images can be stored in the decoded image buffer (DPB). In the case of 1280 × 1024 4: 2: 0, the playback image can be stored in the decoded image buffer (DPB). Is four. FIG. 1 shows decoding when the maximum number of reproduced images that can be stored according to the frame size of the image is four (FIG. 1A), five (FIG. 1B), and six (FIG. 1C). 4 shows an image arrangement of an image buffer. As described above, by arranging the memory pointer variably in the image buffer memory prepared in advance according to the frame size of the reproduced image, the memory buffer can be used while devising the memory arrangement.

“H.264: Advancedvideo coding for generic audiovisual services,” Joint Video Team of ITU-T VCEGand ISO/IEC MPEG, ITU-T Rec. H.264 and ISO/IEC 14496-10 (MPEG4 - Part 10),November 2007“H.264: Advanced video coding for generic audiovisual services,” Joint Video Team of ITU-T VCEGand ISO / IEC MPEG, ITU-T Rec.H.264 and ISO / IEC 14496-10 (MPEG4-Part 10), November 2007

ここで、このような定義においてH.264の復号装置は、その復号装置がサポートする範囲のプロファイルやレベルで定義されるあらゆるフレームサイズの画像の復号が可能である必要があるため、画像バッファメモリに再生画像を格納する際に用いるメモリをどのように配置して格納するかが固定することができない。そのため、各再生画像が格納されるメモリ位置を示すメモリポインタを復号する画像のフレームサイズに応じて変動させる必要があるため、メモリ制御や実装が複雑となる。   Here, in such a definition, H. Since the H.264 decoding device needs to be able to decode an image of any frame size defined by a profile or level in a range supported by the decoding device, a memory used to store a reproduced image in an image buffer memory It is not possible to fix how to place and store. Therefore, it is necessary to change the memory pointer indicating the memory location where each reproduced image is stored according to the frame size of the image to be decoded, which complicates memory control and implementation.

これに対する解決策としては、実際の復号画像のフレームサイズによらず画像バッファメモリに格納可能な再生画像の最大枚数(max_dec_pic_buffering)を固定する手法が考えられる。この解決策により復号画像バッファ(DPB)のメモリ配置は図2(a)のように最大フレームサイズにより一意に決定されるため、メモリポインタも固定することができる。すなわち変動的なメモリポインタの制御に比べてメモリ制御が容易となる。しかし、この解決策では、復号画像のフレームサイズが最大フレームサイズよりも小さい場合や、インターレース画像のフィールド画像のように画像の縦幅がフレーム画像の半分である場合には、図2(b)に示すように未使用のメモリ領域が発生し、メモリの有効活用がされない課題が存在する。さらに、より多くの再生画像を格納することで、参照画像枚数を増加させて符号化効率向上する可能性を失うこととなる。   As a solution to this, a method of fixing the maximum number of reproduced images (max_dec_pic_buffering) that can be stored in the image buffer memory regardless of the actual frame size of the decoded image can be considered. With this solution, the memory arrangement of the decoded image buffer (DPB) is uniquely determined by the maximum frame size as shown in FIG. 2A, so that the memory pointer can be fixed. That is, the memory control becomes easier than the control of the variable memory pointer. However, in this solution, when the frame size of the decoded image is smaller than the maximum frame size, or when the vertical width of the image is half of the frame image like a field image of an interlaced image, FIG. As shown in (1), there is a problem that an unused memory area is generated and the memory is not effectively used. Furthermore, storing more reproduced images loses the possibility of increasing the number of reference images and improving the coding efficiency.

本発明は、上記の課題を解決し、再生画像のフレームサイズに応じて、画像バッファメモリに格納可能な再生画像の最大枚数を決定することにより、効率的に画像バッファメモリを利用し、更なる符号化効率向上も可能とする動画像予測符号化装置、動画像予測復号装置、動画像予測符号化方法、動画像予測復号方法及び記録媒体の提供を目的とする。   The present invention solves the above-described problems, and determines the maximum number of reproduced images that can be stored in the image buffer memory according to the frame size of the reproduced image. It is an object of the present invention to provide a moving picture prediction coding apparatus, a moving picture prediction decoding apparatus, a moving picture prediction coding method, a moving picture prediction decoding method, and a recording medium which can also improve the coding efficiency.

上記目的を達成するために、本発明に係る動画像予測符号化装置は、動画像予測符号化を実施するようにプログラム可能なCPUと、プログラムされた前記CPUによって、動画像を構成する複数の画像を受信するように実行可能な受信部と、プログラムされた前記CPUによって、受信された画像を、画面内予測もしくは画面間予測のいずれかの方法で符号化し、圧縮画像データを生成するように実行可能な符号化部と、プログラムされた前記CPUによって、圧縮画像データを復号し、再生画像に復元するように実行可能な復号部と、プログラムされた前記CPUによって、1つ以上の再生画像を、後続の画像を符号化するために用いられる参照画像として格納するように実行可能なフレームメモリと、プログラムされた前記CPUによって、前記フレームメモリを管理するように実行可能なメモリ管理部であって、対象画像のフレームサイズを示す対象画像フレームサイズと、レベル情報により予め規定され、前記フレームメモリ内に格納可能な再生画像の最大サイズを示す、最大フレームサイズ(MaxLumaFS)と、前記フレームメモリ内に格納可能な再生画像の予め設定される最大枚数によって表現されるフレームメモリサイズ(MFSBuffer)とを取得するように実行可能であるメモリ管理部と、を備え、前記メモリ管理部が、MaxLumaFSの1/2倍と対象画像フレームサイズとを比較し、MaxLumaFSの1/2倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを2倍にし、前記フレームメモリ内に格納可能な再生画像の適応最大枚数(maxDPBsize)をMFSBufferの2倍に設定する、ようにさらに実行可能であり、前記フレームメモリ内に格納された再生画像の枚数が、maxDPBsizeにおいて設定された枚数以下である。   In order to achieve the above object, a video predictive encoding apparatus according to the present invention includes a CPU that is programmable to perform video predictive encoding, and a plurality of CPUs that configure a video by the programmed CPU. A receiving unit that is executable to receive an image and the programmed CPU encodes the received image in one of an intra-screen prediction and an inter-screen prediction to generate compressed image data. An executable encoding unit, a decoding unit capable of decoding the compressed image data by the programmed CPU, and decoding the compressed image data into a reproduced image, and one or more reproduced images by the programmed CPU. A frame memory executable to be stored as a reference image used to encode a subsequent image; and A memory management unit executable to manage the frame memory, comprising: a target image frame size indicating a frame size of the target image; and a reproduced image pre-defined by level information and storable in the frame memory. And a frame memory size (MFSBuffer) represented by a preset maximum number of reproduced images that can be stored in the frame memory. A memory management unit, wherein the memory management unit compares L times MaxLumaFS with the target image frame size, and determines that 倍 times MaxLumaFS is equal to or larger than the target image frame size. The MFS Buffer is doubled and can be stored in the frame memory. The maximum number of reproduced images (maxDPBsize) may be set to twice the MFSBuffer, and the number of reproduced images stored in the frame memory is equal to or less than the number set in maxDPBsize. .

また、本発明に係る動画像予測符号化装置は、プログラムされた前記CPUによって、前記メモリ管理部が、MaxLumaFSの1/4倍と対象画像フレームサイズとを比較し、MaxLumaFSの1/4倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを4倍にし、maxDPBsizeをMFSBufferの4倍に設定する、ようにさらに実行可能であることとしてもよい。   In the moving picture prediction encoding apparatus according to the present invention, the programmed CPU causes the memory management unit to compare 1 / times MaxLumaFS with a target image frame size, and determine that 1 / times MaxLumaFS is When it is determined that the size is equal to or larger than the target image frame size, the MFSBuffer may be quadrupled, and the maxDPBsize may be set to four times the MFSBuffer.

上記目的を達成するために、本発明に係る動画像予測復号装置は、動画像予測復号を実施するようにプログラムされたCPUと、前記CPUによって、動画像を構成する複数の画像の圧縮された形態を表す圧縮画像データを含む符号化されたデータを受信するように実行可能な受信部であって、複数の画像が画面内予測もしくは画面間予測のいずれかの方法で符号化されている、受信部と、前記CPUによって、圧縮画像データを復号し、再生画像に復元するように実行可能な復号部と、前記CPUによって、1つ以上の再生画像を、後続の画像を復号するために用いられる参照画像として格納するように実行可能な復号画像バッファ(DPB:DecodedPictureBuffer)と、前記CPUによって、前記DPBを管理するように実行可能なバッファ管理部であって、対象画像のフレームサイズを示す対象画像フレームサイズと、レベル情報により予め規定され、前記DPB内に格納可能な再生画像の最大サイズを示す、最大フレームサイズ(MaxLumaFS)と、前記DPB内に格納可能な再生画像の予め設定される最大枚数によって表現されるフレームメモリサイズ(MFSBuffer)とを取得するように実行可能であるバッファ管理部と、を備え、前記バッファ管理部が、MaxLumaFSの1/2倍と対象画像フレームサイズとを比較し、MaxLumaFSの1/2倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを2倍にし、前記DPB内に格納可能な再生画像の適応最大枚数(maxDPBsize)をMFSBufferの2倍に設定する、ようにさらに実行可能であり、前記DPB内に格納された再生画像の枚数が、maxDPBsizeにおいて設定された枚数以下である。   In order to achieve the above object, a video predictive decoding device according to the present invention includes a CPU programmed to perform video predictive decoding, and a plurality of compressed images constituting a video being compressed by the CPU. A receiving unit that can be executed to receive encoded data including compressed image data representing a form, wherein a plurality of images are encoded by any of intra-screen prediction and inter-screen prediction. A receiving unit, a decoding unit executable by the CPU to decode the compressed image data, and decompress the decoded image data into a reproduced image; and the CPU uses one or more reproduced images to decode a subsequent image. A decoded picture buffer (DPB: Decoded Picture Buffer) executable to be stored as a reference picture to be stored, and the CPU manages the DPB. And a maximum frame size (predetermined by the level information and indicating the maximum size of the reproduced image that can be stored in the DPB). MaxLumaFS) and a buffer management unit that can be executed to acquire a frame memory size (MFSBuffer) represented by a preset maximum number of reproduction images that can be stored in the DPB. The management unit compares 1/2 of MaxLumaFS with the target image frame size, and when it is determined that 1/2 of MaxLumaFS is equal to or larger than the target image frame size, doubles the MFSBuffer and doubles the MFSBuffer in the DPB. The maximum number of playback images (maxDPBsize) that can be stored in Set to twice the FSBuffer, as is further executable, the number of stored reproduced image in the DPB is a number less set in MaxDPBsize.

また、本発明に係る動画像予測復号装置は、前記バッファ管理部が、MaxLumaFSの1/4倍と対象画像フレームサイズとを比較し、MaxLumaFSの1/4倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを4倍にし、maxDPBsizeをMFSBufferの4倍に設定する、ようにさらに実行可能であることとしてもよい。   Further, in the moving picture prediction decoding apparatus according to the present invention, the buffer management unit compares 1/4 times MaxLumaFS with the target image frame size, and determines that 1/4 times MaxLumaFS is equal to or larger than the target image frame size. If it is determined, the MFSBuffer may be quadrupled, and the maxDPBsize may be set to be four times MFSBuffer.

上記目的を達成するために、本発明に係る動画像予測符号化方法は、動画像予測符号化装置によって実行される動画像予測符号化方法であって、動画像を構成する複数の画像を受信するステップと、受信された画像を、画面内予測もしくは画面間予測のいずれかの方法で符号化し、圧縮画像データを生成するステップと、圧縮画像データを復号し、再生画像に復元するステップと、フレームメモリ内において、1つ以上の再生画像を、後続の画像を符号化するために用いられる参照画像として格納するステップと、対象画像のフレームサイズを示す対象画像フレームサイズと、レベル情報により予め規定され、前記フレームメモリ内に格納可能な再生画像の最大サイズを示す、最大フレームサイズ(MaxLumaFS)と、前記フレームメモリ内に格納可能な再生画像の予め設定される最大枚数によって表現されるフレームメモリサイズ(MFSBuffer)とを取得するステップと、MaxLumaFSの1/2倍と対象画像フレームサイズとを比較するステップと、MaxLumaFSの1/2倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを2倍にするステップと、前記フレームメモリ内に格納可能な再生画像の適応最大枚数(maxDPBsize)をMFSBufferの2倍に設定するステップと、を含み、前記フレームメモリ内に格納された再生画像の枚数が、maxDPBsizeにおいて設定された枚数以下である。   In order to achieve the above object, a video prediction encoding method according to the present invention is a video prediction encoding method executed by a video prediction encoding apparatus, and receives a plurality of images constituting a video. And the received image is encoded by any method of intra-screen prediction or inter-screen prediction, a step of generating compressed image data, a step of decoding the compressed image data, and restoring a reproduced image, Storing, in the frame memory, one or more reproduced images as a reference image used for encoding a subsequent image, a target image frame size indicating a frame size of the target image, and level information in advance. A maximum frame size (MaxLumaFS) indicating the maximum size of a reproduced image that can be stored in the frame memory; Acquiring a frame memory size (MFSBuffer) represented by a preset maximum number of reproduced images that can be stored in the memory, comparing the target image frame size with 1/2 times MaxLumaFS, When it is determined that 1/2 times MaxLumaFS is equal to or larger than the target image frame size, the step of doubling the MFSBuffer and the adaptive maximum number (maxDPBsize) of the reproduced images that can be stored in the frame memory are set to the MFSBuffer. Setting the number of reproduction images stored in the frame memory to be less than or equal to the number set in maxDPBsize.

また、本発明に係る動画像予測符号化方法は、MaxLumaFSの1/4倍と対象画像フレームサイズとを比較するステップと、MaxLumaFSの1/4倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを4倍にするステップと、maxDPBsizeをMFSBufferの4倍に設定するステップと、をさらに含むこととしてもよい。   Further, in the moving picture prediction encoding method according to the present invention, the step of comparing 1/4 times MaxLumaFS with the target image frame size, and determining that 1/4 times MaxLumaFS is equal to or larger than the target image frame size. In this case, the method may further include a step of quadrupling the MFSBuffer and a step of setting maxDPBsize to four times the MFSBuffer.

上記目的を達成するために、本発明に係る動画像予測復号方法は、動画像予測復号装置によって実行される動画像予測復号方法であって、動画像を構成する複数の画像の圧縮された形態を表す圧縮画像データを含む符号化されたデータを受信するステップであって、複数の画像が画面内予測もしくは画面間予測のいずれかの方法で符号化されている、ステップと、複数の画像の圧縮された形態を復号し、再生画像に復元するステップと、復号画像バッファ(DPB:DecodedPictureBuffer)内において、1つ以上の再生画像を、後続の画像を復号するために用いられる参照画像として格納するステップと、対象画像のフレームサイズを示す対象画像フレームサイズと、レベル情報により予め規定され、前記DPB内に格納可能な再生画像の最大サイズを示す、最大フレームサイズ(MaxLumaFS)と、前記DPB内に格納可能な再生画像の予め設定される最大枚数によって表現されるフレームメモリサイズ(MFSBuffer)とを取得するステップと、MaxLumaFSの1/2倍と対象画像フレームサイズとを比較するステップと、MaxLumaFSの1/2倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを2倍にするステップと、前記DPB内に格納可能な再生画像の適応最大枚数(maxDPBsize)をMFSBufferの2倍に設定するステップと、を含み、前記DPB内に格納された再生画像の枚数が、maxDPBsizeにおいて設定された枚数以下である。   In order to achieve the above object, a moving picture prediction decoding method according to the present invention is a moving picture prediction decoding method executed by a moving picture prediction decoding apparatus, wherein a compressed form of a plurality of pictures constituting a moving picture is provided. Receiving encoded data including compressed image data representing a plurality of images, wherein the plurality of images are encoded by any of intra-screen prediction or inter-screen prediction, and Decoding the compressed form and restoring it to a reproduced image; and storing, in a decoded image buffer (DPB: Decoded Picture Buffer), one or more reproduced images as reference images used for decoding subsequent images. A step, a target image frame size indicating a frame size of the target image, and level information, which are defined in advance in the DPB. Obtaining a maximum frame size (MaxLumaFS) indicating the maximum possible size of a reproduced image and a frame memory size (MFSBuffer) represented by a preset maximum number of reproduced images that can be stored in the DPB; Comparing the half of MaxLumaFS with the target image frame size, and doubling the MFSBuffer when it is determined that the half of MaxLumaFS is equal to or larger than the target image frame size, Setting the adaptive maximum number of reproduced images (maxDPBsize) that can be stored in the DPB to twice the MFSBuffer, wherein the number of reproduced images stored in the DPB is less than or equal to the number set in maxDPBsize. is there.

また、本発明に係る動画像予測復号方法は、MaxLumaFSの1/4倍と対象画像フレームサイズとを比較するステップと、MaxLumaFSの1/4倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを4倍にするステップと、maxDPBsizeをMFSBufferの4倍に設定するステップと、をさらに含むこととしてもよい。   Further, in the moving picture prediction decoding method according to the present invention, the step of comparing 1/4 times MaxLumaFS with the target image frame size, and the case where it is determined that 1/4 times MaxLumaFS is equal to or larger than the target image frame size. In addition, the method may further include a step of quadrupling MFSBuffer and a step of setting maxDPBsize to four times MFSBuffer.

また、本発明に係る動画像予測復号方法は、maxDPBsizeをMFSBufferの2倍に設定した後、メモリポインタを、MFSBufferに応じて分割された前記DPBの格納位置を示したままにするステップをさらに含むこととしてもよい。   In addition, the moving picture prediction decoding method according to the present invention further includes a step of setting maxDPBsize to twice MFSBuffer and then keeping a memory pointer indicating the storage position of the DPB divided according to MFSBuffer. It may be that.

また、本発明に係る動画像予測復号方法は、maxDPBsizeをMFSBufferの4倍に設定した後、メモリポインタを、MFSBufferに応じて分割された前記DPBの格納位置を示したままにするステップをさらに含むこととしてもよい。   In addition, the moving picture prediction decoding method according to the present invention further includes a step of setting maxDPBsize to four times MFSBuffer and then keeping a memory pointer indicating the storage position of the DPB divided according to MFSBuffer. It may be that.

上記目的を達成するために、本発明に係る記録媒体は、動画像予測復号プログラムを格納する記録媒体であって、前記動画像予測復号プログラムがCPUを、動画像を構成する複数の画像の圧縮された形態を表す圧縮画像データを含む符号化されたデータを受信するように実行可能な受信部であって、複数の画像が画面内予測もしくは画面間予測のいずれかの方法で符号化されている、受信部と、圧縮画像データを復号し、再生画像に復元するように実行可能な復号部と、1つ以上の再生画像を、後続の画像を復号するために用いられる参照画像として格納するように実行可能な復号画像バッファ(DPB:DecodedPictureBuffer)と、前記DPBを管理するように実行可能なバッファ管理部であって、対象画像のフレームサイズを示す対象画像フレームサイズと、レベル情報により予め規定され、前記DPB内に格納可能な再生画像の最大サイズを示す、最大フレームサイズ(MaxLumaFS)と、前記DPB内に格納可能な再生画像の予め設定される最大枚数によって表現されるフレームメモリサイズ(MFSBuffer)とを取得するように実行可能であるバッファ管理部と、を実行するようにプログラムし、前記バッファ管理部が、MaxLumaFSの1/2倍と対象画像フレームサイズとを比較し、MaxLumaFSの1/2倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを2倍にし、前記DPB内に格納可能な再生画像の適応最大枚数(maxDPBsize)をMFSBufferの2倍に設定する、ようにさらに実行可能であり、前記DPB内に格納された再生画像の枚数が、maxDPBsizeにおいて設定された枚数以下である。   In order to achieve the above object, a recording medium according to the present invention is a recording medium for storing a moving image prediction decoding program, wherein the moving image prediction decoding program instructs a CPU to compress a plurality of images constituting a moving image. A receiving unit that is capable of receiving encoded data including compressed image data representing a compressed form, wherein a plurality of images are encoded by any of intra-screen prediction and inter-screen prediction. A receiving unit, a decoding unit executable to decode the compressed image data and restore it to a reproduced image, and store one or more reproduced images as reference images used to decode subsequent images A decoded picture buffer (DPB: Decoded Picture Buffer) that can be executed as described above and a buffer management unit that can be executed so as to manage the DPB. The maximum frame size (MaxLumaFS), which is defined in advance by the target image frame size indicating the program size and the level information and indicates the maximum size of the reproduced image that can be stored in the DPB, A buffer management unit that is executable to obtain a frame memory size (MFSBuffer) represented by the set maximum number, and the buffer management unit is configured to execute L times MaxLumaFS. Is compared with the target image frame size, and when it is determined that 1/2 times MaxLumaFS is equal to or larger than the target image frame size, the MFSBuffer is doubled, and the adaptive maximum number of reproduced images that can be stored in the DPB (MaxDPBsize) is set to twice MFSBuffer , So that a further executable, the number of stored reproduced image in the DPB is a number less set in MaxDPBsize.

本発明による動画像予測符号化装置、動画像予測復号装置、動画像予測符号化方法、動画像予測復号方法及び記録媒体によれば、再生画像のフレームサイズに応じて、画像バッファメモリに格納可能な再生画像の最大枚数を決定することにより、効率的に画像バッファメモリを利用し、更なる符号化効率向上も可能とする。   ADVANTAGE OF THE INVENTION According to the moving image prediction encoding apparatus, the moving image prediction decoding apparatus, the moving image prediction encoding method, the moving image prediction decoding method, and the recording medium according to the present invention, it can be stored in the image buffer memory according to the frame size of the reproduced image. By determining the maximum number of reproduced images, the image buffer memory can be efficiently used, and the encoding efficiency can be further improved.

画像バッファメモリと格納画像枚数、可変メモリポインタ位置を示す図である。FIG. 3 is a diagram illustrating an image buffer memory, the number of stored images, and a variable memory pointer position. 画像バッファメモリにおいて、固定メモリポインタの課題を示す図である。FIG. 4 is a diagram illustrating a problem of a fixed memory pointer in an image buffer memory. 本発明の実施形態による動画像予測符号化装置を示すブロック図である。1 is a block diagram illustrating a moving picture prediction encoding device according to an embodiment of the present invention. 本発明の実施形態による動画像予測復号装置を示すブロック図である。FIG. 1 is a block diagram illustrating a video prediction decoding device according to an embodiment of the present invention. 本発明の実施形態による第1の動画像予測符号化・復号方法を示す流れ図である。5 is a flowchart illustrating a first moving picture prediction encoding / decoding method according to an embodiment of the present invention. 本発明の実施形態による第1の動画像予測符号化・復号方法の処理を説明するための模式図である。FIG. 4 is a schematic diagram for explaining processing of a first moving picture prediction encoding / decoding method according to an embodiment of the present invention. 記録媒体に記録されたプログラムを実行するためのコンピュータのハードウェア構成を示す図である。FIG. 2 is a diagram illustrating a hardware configuration of a computer for executing a program recorded on a recording medium. 記録媒体に記憶されたプログラムを実行するためのコンピュータの斜視図である。FIG. 11 is a perspective view of a computer for executing a program stored in a recording medium.

以下、本発明の実施の形態について、図3から図8を用いて説明する。   Hereinafter, embodiments of the present invention will be described with reference to FIGS. 3 to 8.

図3は本発明の実施形態による動画像予測符号化装置を示すブロック図である。301は入力端子、302はブロック分割器、303は予測信号生成器、304はフレームメモリ、305は減算器、306は変換器、307は量子化器、308は逆量子化器、309は逆変換器、310は加算器、311はエントロピー符号化器、312は出力端子、314はフレームメモリ管理器(またはバッファ管理器ともいう)である。入力端子301は入力手段に対応する。予測信号生成器303と減算器305と変換器306と量子化器307とエントロピー符号化器311とは符号化手段に対応する。逆量子化器308、逆変換器309と加算器310は復号手段に対応する。フレームメモリ304は画像格納手段に対応する。フレームメモリ管理器314はメモリ制御手段に対応する。   FIG. 3 is a block diagram showing a moving picture predictive coding apparatus according to an embodiment of the present invention. 301 is an input terminal, 302 is a block divider, 303 is a prediction signal generator, 304 is a frame memory, 305 is a subtractor, 306 is a transformer, 307 is a quantizer, 308 is an inverse quantizer, and 309 is an inverse transform. 310, an adder, 311 an entropy coder, 312 an output terminal, and 314 a frame memory manager (also referred to as a buffer manager). The input terminal 301 corresponds to an input unit. The prediction signal generator 303, the subtractor 305, the transformer 306, the quantizer 307, and the entropy encoder 311 correspond to an encoding unit. The inverse quantizer 308, the inverse transformer 309, and the adder 310 correspond to decoding means. The frame memory 304 corresponds to an image storage unit. The frame memory manager 314 corresponds to a memory control unit.

以上のように構成された動画像予測符号化装置について、以下その動作を述べる。複数枚の画像からなる動画像の信号は入力端子301に入力される。符号化の対象なる画像はブロック分割器302にて、複数の領域に分割される。本発明による実施形態では、8x8の画素からなるブロックに分割されるが、それ以外のブロックの大きさまたは形に分割してもよい。次に符号化処理の対象となる領域(以下対象ブロックとよぶ)に対して、予測信号を生成する。本発明による実施形態では、2種類の予測方法が用いられる。すなわち画面間予測と画面内予測である。   The operation of the moving picture predictive coding apparatus configured as described above will be described below. A signal of a moving image including a plurality of images is input to the input terminal 301. An image to be encoded is divided into a plurality of regions by a block divider 302. In the embodiment according to the present invention, the image data is divided into blocks each including 8 × 8 pixels. However, the image data may be divided into other block sizes or shapes. Next, a prediction signal is generated for a region to be subjected to the encoding process (hereinafter, referred to as a target block). In the embodiment according to the present invention, two types of prediction methods are used. That is, inter-screen prediction and intra-screen prediction.

画面間予測では、過去に符号化されたのちに復元された再生画像を参照画像として、この参照画像から対象ブロックに対する誤差の最も小さい予測信号を与える動き情報を求める。この処理は動き検出とよばれる。また場合に応じて、対象ブロックを再分割し、再分割された小領域に対し画面間予測方法を決定してもよい。この場合、各種の分割方法の中から、対象ブロック全体に対し最も効率のよい分割方法及びそれぞれの動き情報を決定する。本発明による実施形態では、予測信号生成器303にて行われ、対象ブロックはラインL302、参照画像はL304経由で入力される。参照画像としては、過去に符号化され復元された複数の画像を参照画像として用いる。詳細は従来の技術であるMPEG−2、4、H.264のいずれの方法と同じである。このように決定された動き情報及び小領域の分割方法はラインL312経由でエントロピー符号化器311に送られ符号化した上で出力端子312から送出される。また複数の参照画像の中で、予測信号がどの参照画像から取得するかに関する情報(リファレンスインデックス)もラインL312経由でエントロピー符号化器311に送られる。なお、本発明による実施形態では、M枚(Mは1以上の整数)の再生画像をフレームメモリ304に格納し、参照画像として用いる。予測信号生成器303では、小領域の分割方法及びそれぞれの小領域に対応する、参照画像と動き情報をもとにフレームメモリ304から参照画像信号を取得し、予測信号を生成する。このように生成された画面間予測信号はラインL303経由で減算器305に送られる。   In the inter prediction, a reproduced image that has been coded in the past and restored is used as a reference image, and motion information that gives a prediction signal with the smallest error with respect to the target block is obtained from the reference image. This process is called motion detection. Further, as occasion demands, the target block may be subdivided, and an inter-screen prediction method may be determined for the subdivided small area. In this case, among the various division methods, the most efficient division method for the entire target block and the respective motion information are determined. In the embodiment according to the present invention, the processing is performed by the prediction signal generator 303, and the target block is input via the line L302 and the reference image is input via the L304. As the reference image, a plurality of previously encoded and restored images are used as reference images. For details, see MPEG-2, 4, H.264, which is a conventional technique. H.264. The motion information and the small area dividing method determined in this way are sent to the entropy encoder 311 via the line L312, encoded, and then transmitted from the output terminal 312. Information (reference index) from which reference image the prediction signal is obtained from among the plurality of reference images is also sent to the entropy encoder 311 via the line L312. In the embodiment according to the present invention, M (M is an integer of 1 or more) reproduced images are stored in the frame memory 304 and used as reference images. The prediction signal generator 303 acquires a reference image signal from the frame memory 304 based on the method of dividing the small area and the reference image and the motion information corresponding to each small area, and generates a prediction signal. The generated inter-picture prediction signal is sent to the subtractor 305 via the line L303.

画面内予測では、対象ブロックに空間的に隣接する既再生の画素値を用いて画面内予測信号を生成する。具体的には予測信号生成器303では、フレームメモリ304から同じ画面内にある既再生の画素信号を取得し、これらの信号を外挿することによって画面内予測信号を生成する。外挿の方法に関する情報はラインL312経由でエントロピー符号化器311に送られ符号化した上で出力端子312から送出される。このように生成された画面内予測信号は減算器305に送られる。予測信号生成器303における画面内の予測信号生成方法は、従来の技術であるH.264の方法と同じである。上述のように求められた画面間予測信号と画面内予測信号に対し、誤差の最も小さいものが選択され、減算器305に送られる。   In intra prediction, an intra prediction signal is generated using previously reproduced pixel values spatially adjacent to the target block. Specifically, the prediction signal generator 303 obtains already reproduced pixel signals in the same screen from the frame memory 304 and extrapolates these signals to generate an intra-screen prediction signal. Information on the extrapolation method is sent to an entropy encoder 311 via a line L312, encoded, and then sent from an output terminal 312. The intra prediction signal generated in this way is sent to the subtractor 305. A method for generating a prediction signal in a screen in the prediction signal generator 303 is a conventional technique, which is described in H.264. H.264. For the inter-picture prediction signal and the intra-picture prediction signal obtained as described above, the one with the smallest error is selected and sent to the subtractor 305.

一枚目の画像については、それより前に画像がないため、全ての対象ブロックは画面内予測で処理される。   As for the first image, since there is no image before that, all target blocks are processed by intra prediction.

減算器305にて対象ブロックの信号(ラインL302経由)から予測信号(ラインL303経由)を引き算し、残差信号を生成する。この残差信号は変換器306にて離散コサイン変換され、その各係数は量子化器307にて量子化される。最後にエントロピー符号化器311にて量子化された変換係数を符号化して、予測方法に関する情報とともに出力端子312より送出される。   The subtractor 305 subtracts the prediction signal (via the line L303) from the signal of the target block (via the line L302) to generate a residual signal. This residual signal is subjected to a discrete cosine transform by a transformer 306, and each coefficient thereof is quantized by a quantizer 307. Finally, the transform coefficients quantized by the entropy encoder 311 are encoded, and transmitted from the output terminal 312 together with information on the prediction method.

後続の対象ブロックに対する画面内予測もしくは画面間予測を行うために、圧縮された対象ブロックの信号は逆処理し復元される。すなわち、量子化された変換係数は逆量子化器308にて逆量子化されたのちに逆変換器309にて逆離散コサイン変換され、残差信号を復元する。加算器310にて復元された残差信号とラインL303から送られた予測信号とを加算し、対象ブロックの信号を再生し、フレームメモリ304に格納する。本実施の形態では変換器306と逆変換器309を用いているが、これらの変換器に代わるほかの変換処理を用いてもよい。場合によって、変換器306と逆変換器309がなくてもよい。   In order to perform intra prediction or inter prediction for the subsequent target block, the signal of the compressed target block is inversely processed and restored. That is, the quantized transform coefficient is inversely quantized by the inverse quantizer 308 and then inverse discrete cosine transformed by the inverse transformer 309 to restore the residual signal. The residual signal restored by the adder 310 and the prediction signal sent from the line L303 are added, a signal of the target block is reproduced, and stored in the frame memory 304. Although the converter 306 and the inverse converter 309 are used in the present embodiment, other conversion processing may be used instead of these converters. In some cases, the converter 306 and the inverse converter 309 may not be provided.

フレームメモリ304は有限なものであり、すべての再生画像を格納することは不可能である。後続の画像の符号化に用いられる再生画像のみフレームメモリ304に格納される。このフレームメモリ304を制御するのがフレームメモリ管理器314である。フレームメモリ管理器314は、フレームメモリ304内にあるM枚(ここでMは整数)の再生画像の中から、最も古いものを消去し参照画像として用いられる直近の再生画像を格納できるように制御する。入力端子313より各画像のフレームサイズ及び符号化設定(プロファイル、レベル)にて定義される最大フレームサイズが入力され、この情報に基づいてフレームメモリ内に格納可能な再生画像の最大枚数が決定され、フレームメモリ管理器314が最大枚数を超えないよう格納するよう動作する。同時に、各画像のフレームサイズ及び符号化設定にて定義される最大フレームサイズ、フレームメモリ内に格納可能な再生画像の最大枚数の情報はラインL314経由でエントロピー符号化器311に送られ、符号化した上で圧縮された画像データとともに出力される。フレームサイズ及び符号化設定にて定義される最大フレームサイズ、フレームメモリ内に格納可能な再生画像の最大枚数は各画像に付随するもので、画像のフレームサイズそのままを示すものやフレームサイズを指数やべき乗の形で表現されたものでもよい。また、プロファイルやレベル情報としてあらかじめ最大フレームサイズが定められる場合であれば、それらの情報を利用して最大フレームサイズが入力されてもよい。本実施の形態では、フレームサイズの値がそのまま二値符号化に変換され、最大フレームサイズはレベル情報として定義されるものとする。本発明によるフレームメモリ管理器314の制御方法については後述する。   The frame memory 304 is finite and cannot store all reproduced images. Only the reproduced image used for encoding the subsequent image is stored in the frame memory 304. The frame memory 304 is controlled by a frame memory manager 314. The frame memory manager 314 controls so that the oldest one is deleted from the M (here, M is an integer) reproduced images in the frame memory 304 and the latest reproduced image used as a reference image can be stored. I do. The frame size of each image and the maximum frame size defined by the encoding settings (profile, level) are input from the input terminal 313, and the maximum number of reproduced images that can be stored in the frame memory is determined based on this information. , The frame memory manager 314 operates so as not to exceed the maximum number. At the same time, information on the frame size of each image, the maximum frame size defined by the encoding setting, and the maximum number of reproduced images that can be stored in the frame memory are sent to the entropy encoder 311 via the line L314, and are encoded. The image data is output together with the compressed image data. The maximum frame size defined by the frame size and the encoding setting, and the maximum number of reproduced images that can be stored in the frame memory are attached to each image. It may be expressed in the form of a power. If the maximum frame size is determined in advance as the profile or level information, the maximum frame size may be input using such information. In the present embodiment, it is assumed that the value of the frame size is directly converted to binary coding, and the maximum frame size is defined as level information. The control method of the frame memory manager 314 according to the present invention will be described later.

次に本発明による動画像予測復号方法について説明する。図4は本発明の実施形態による画像予測復号装置のブロック図を示す。401は入力端子、402はデータ解析器、403は逆量子化器、404は逆変換器、405は加算器、408は予測信号生成器、407はフレームメモリ、406は出力端子、409はフレームメモリ管理器である。入力端子401は入力手段に対応する。逆量子化器403と逆変換器404は復号手段に対応する。復号手段としてそれ以外のものを用いてもよい。フレームメモリ407は画像格納手段に対応する。フレームメモリ管理器409はメモリ制御手段に対応する。また逆変換器404がなくてもよい。   Next, a video prediction decoding method according to the present invention will be described. FIG. 4 is a block diagram of an image prediction decoding apparatus according to the embodiment of the present invention. 401 is an input terminal, 402 is a data analyzer, 403 is an inverse quantizer, 404 is an inverse transformer, 405 is an adder, 408 is a prediction signal generator, 407 is a frame memory, 407 is an output terminal, and 409 is a frame memory. It is a management device. The input terminal 401 corresponds to an input unit. The inverse quantizer 403 and the inverse transformer 404 correspond to decoding means. Other means may be used as the decoding means. The frame memory 407 corresponds to an image storage. The frame memory manager 409 corresponds to a memory control unit. Further, the inverter 404 may not be provided.

以上のように構成された動画像予測復号装置について、以下その動作を述べる。上述した方法で圧縮符号化された圧縮データは入力端子401から入力される。この圧縮データには、画像を複数のブロックに分割された対象ブロックを予測し符号化された残差信号及び予測信号の生成などに関連する情報が含まれている。予測信号の生成に関連する情報として、画面間予測の場合はブロック分割に関する情報(ブロックのサイズ)や、動き情報と上述のリファレンスインデックスが含まれ、画面内予測の場合は周辺の既再生の画素から外挿方法に関する情報が含まれている。   The operation of the video predictive decoding device configured as described above will be described below. The compressed data compressed and encoded by the method described above is input from the input terminal 401. The compressed data includes information relating to prediction of a target block obtained by dividing an image into a plurality of blocks and generation of a coded residual signal and a prediction signal. Information related to generation of a prediction signal includes information (block size) on block division in the case of inter-screen prediction, and motion information and the above-described reference index. In the case of intra-screen prediction, neighboring reproduced pixels Contains information about the extrapolation method.

データ解析器402にて、圧縮データから対象ブロックの残差信号、予測信号の生成に関連する情報、量子化パラメータ、画像のフレームサイズ及び符号化設定にて定義される最大フレームサイズ、フレームメモリ内に格納可能な再生画像の最大枚数を抽出する。対象ブロックの残差信号は逆量子化器403にて量子化パラメータ(ラインL402経由)をもとに逆量子化される。その結果は逆変換器404にて逆離散コサイン変換される。   In the data analyzer 402, the residual signal of the target block from the compressed data, information related to the generation of the prediction signal, the quantization parameter, the frame size of the image and the maximum frame size defined by the encoding setting, the frame memory To extract the maximum number of reproduced images that can be stored in. The residual signal of the target block is inversely quantized by the inverse quantizer 403 based on the quantization parameter (via the line L402). The result is subjected to inverse discrete cosine transform by an inverse transformer 404.

次にラインL406b経由で予測信号の生成に関連する情報が予測信号生成器408に送られる。予測信号生成器408では、予測信号の生成に関連する情報をもとに、フレームメモリ407にアクセスし、複数の参照画像の中から参照信号を取得し予測信号を生成する。この予測信号はラインL408経由で加算器405に送られ、復元された残差信号に加算され、対象ブロック信号を再生し、ラインL405経由で出力すると同時にフレームメモリ407に格納される。   Next, information related to the generation of the prediction signal is sent to the prediction signal generator 408 via the line L406b. The prediction signal generator 408 accesses the frame memory 407 based on information related to generation of a prediction signal, acquires a reference signal from a plurality of reference images, and generates a prediction signal. This prediction signal is sent to the adder 405 via the line L408, added to the restored residual signal, and the target block signal is reproduced, output via the line L405 and stored in the frame memory 407 at the same time.

フレームメモリ407には、後続の画像の復号・再生に用いられる再生画像が格納されている。フレームメモリ管理器409はフレームメモリ407を制御する。フレームメモリ407は、格納されているM枚(ここではMは整数)の再生画像の中から、最も古いものを消去し参照画像として用いられる直近の再生画像を格納できるように制御される。フレームメモリ管理器409は、ラインL406a経由で送られる対象画像のフレームサイズ及び符号化設定にて定義される最大フレームサイズ、フレームメモリ内に格納可能な再生画像の最大枚数の情報に基づいて動作する。本発明によるフレームメモリ管理器409の制御方法については後述する。   The frame memory 407 stores a reproduced image used for decoding and reproducing a subsequent image. The frame memory manager 409 controls the frame memory 407. The frame memory 407 is controlled so as to delete the oldest one of the stored M reproduced images (M is an integer in this case) and store the latest reproduced image used as a reference image. The frame memory manager 409 operates based on information on the frame size of the target image transmitted via the line L406a, the maximum frame size defined by the encoding setting, and the maximum number of reproduced images that can be stored in the frame memory. . The control method of the frame memory manager 409 according to the present invention will be described later.

次に図5と図6を用いて、本発明による動画像予測符号化方法及び動画像予測復号方法の動作を説明する。図5は本発明の実施形態による動画像予測符号化・復号方法を示す流れ図である。同図に用いられる変数の意味を説明する。pic_widthは再生画像の横幅の輝度画素数、pic_heightは再生画像の縦幅の輝度画素数、MaxLumaFSはレベル情報により定義される最大画像サイズ、MFSBufferはレベル情報として定義される復号画像バッファ(DPB)に格納可能な再生画像の最大枚数で表現されるメモリバッファ量、maxDPBsizeは復号画像バッファ(DPB)に格納可能な再生画像の最大枚数で表現されるメモリバッファ量、max_dec_pic_bufferingは復号時に利用される再生画像の最大格納枚数(メモリバッファ量)、DPBpointerは復号画像バッファで再生画像を格納する位置を示すポインタを示す変数である。   Next, the operation of the moving picture prediction encoding method and the moving picture prediction decoding method according to the present invention will be described with reference to FIGS. FIG. 5 is a flowchart illustrating a moving picture prediction encoding / decoding method according to an embodiment of the present invention. The meaning of the variables used in FIG. pic_width is the number of luminance pixels in the horizontal width of the reproduced image, pic_height is the number of luminance pixels in the vertical width of the reproduced image, MaxLumaFS is the maximum image size defined by the level information, and MFSBuffer is the decoded image buffer (DPB) defined as the level information. The memory buffer amount represented by the maximum number of reproducible images that can be stored, maxDPBsize is the memory buffer amount represented by the maximum number of reproducible images that can be stored in the decoded image buffer (DPB), and the max_dec_pic_buffering is the reproduced image used at the time of decoding. , DPBpointer is a variable indicating a pointer indicating a position where a reproduced image is stored in the decoded image buffer.

図5において、再生画像の横幅の画素数pic_width及び再生画像の縦幅の画素数pic_height及び符号化設定として定義される最大フレームサイズMaxLumaFS及び復号画像バッファ(DPB)に格納可能な再生画像の最大枚数で表現されるメモリバッファ量MFSBufferが入力される。次に入力された再生画像の横幅の画素数pic_widthと再生画像の縦幅の画素数pic_heightを積算した値と符号化設定として定義される最大画像サイズMaxLumaFSの半分の値(MaxLumaFS/2)と比較が行われる(ステップS502)。ここで、条件が満たされない場合(pic_widthとpic_heightを積算した値がMaxLumaFS/2の値より大きい場合)には、maxDPBsize=MFSBufferと設定される(ステップS503)。また条件が満たされる場合(pic_widthとpic_heightを積算した値がMaxLumaFS/2の値以下の場合)には、maxDPBsize=2*MFSBufferと設定される(ステップS504)。
(数式)
maxDPBsize=2*MFSBuffer(pic_width*pic_height≦(MaxLumaFS>>1)の時)
maxDPBsize=MFSBuffer(上記以外)
なお、上記数式における“>>”は右シフト演算を示し、MaxLumaFS/2と同じ意味である。
In FIG. 5, the number of pixels pic_width in the horizontal width of the reproduced image, the number pic_height in the vertical width of the reproduced image, the maximum frame size MaxLumaFS defined as the encoding setting, and the maximum number of reproduced images that can be stored in the decoded image buffer (DPB) The memory buffer amount MFSBuffer represented by is input. Next, the sum of pic_width, the number of pixels in the horizontal width of the input playback image, and pic_height, the number of pixels in the vertical width of the playback image, is compared with half the maximum image size MaxLumaFS (MaxLumaFS / 2) defined as the encoding setting. Is performed (step S502). Here, when the condition is not satisfied (when the value obtained by integrating pic_width and pic_height is larger than the value of MaxLumaFS / 2), maxDPBsize = MFSBuffer is set (step S503). When the condition is satisfied (when the value obtained by integrating pic_width and pic_height is equal to or less than the value of MaxLumaFS / 2), maxDPBsize = 2 * MFSBuffer is set (step S504).
(Formula)
maxDPBsize = 2 * MFSBuffer (when pic_width * pic_height ≦ (MaxLumaFS >> 1))
maxDPBsize = MFSBuffer (other than above)
Note that “>>” in the above formula indicates a right shift operation, and has the same meaning as MaxLumaFS / 2.

そして、復号時に利用される再生画像の最大格納枚数で表現されるメモリバッファ量max_dec_pic_bufferingがmaxDPBsize以下となるように設定される。
(数式)
max_dec_pic_buffering≦maxDPBsize
Then, the memory buffer amount max_dec_pic_buffering expressed by the maximum storage number of reproduced images used at the time of decoding is set to be equal to or less than maxDPBsize.
(Formula)
max_dec_pic_buffering ≦ maxDPBsize

また、maxDPBsize=MFSBufferの場合には図6(a)のように画像メモリバッファの先頭にDPBpointer=1が設定され、DPBpointer=2,3,4はDPBpointer=1の位置から最大フレームサイズの2倍、3倍、4倍分のメモリポインタの位置を進めた位置に設定される。   When maxDPBsize = MFSBuffer, DPBpointer = 1 is set at the head of the image memory buffer as shown in FIG. 6A, and DPBpointer = 2, 3, 4 is twice the maximum frame size from the position of DPBpointer = 1. The memory pointer is set to a position advanced by three times or four times the memory pointer position.

また、maxDPBsize=2*MFSBufferの場合には図6(b)のようにすでに設定されたDPBpointer1〜4に加えて、DPBpointer=1の位置から最大フレームサイズ分の1/2倍、3/2倍、5/2倍、7/2倍分のメモリポインタの位置を進めた位置に設定される。(ステップS505)。   In the case of maxDPBsize = 2 * MFSBuffer, in addition to the DPBpointers 1 to 4 already set as shown in FIG. The memory pointer is set to a position advanced by 5/2 times and 7/2 times. (Step S505).

設定されたmax_dec_pic_buffering及びDPBpointerは後述のステップS508のフレームメモリの制御に利用される。すなわち復号時に再生画像はフレームメモリに最大でmax_dec_pic_buffering枚まで格納となり、格納時には設定されたDPBpointerに基づき格納するよう制御される。符号化方法では、再生画像の横幅の輝度画素数pic_width、再生画像の縦幅の輝度画素数pic_heightに関する情報、最大画像サイズMaxLumaFS、復号画像バッファ(DPB)に格納可能な再生画像の最大枚数で表現されるメモリバッファ量MFSBufferを含むレベル情報は、外部から与えられる。図3では、入力端子313経由して、図示されていない制御装置から与えられる。   The set max_dec_pic_buffering and DPBpointer are used for controlling the frame memory in step S508 described later. That is, at the time of decoding, up to max_dec_pic_buffering sheets of reproduced images are stored in the frame memory, and at the time of storage, the reproduced images are controlled to be stored based on the set DPBpointer. In the encoding method, the number of luminance pixels pic_width in the horizontal width of the reproduced image, information on the number of luminance pixels pic_height in the vertical width of the reproduced image, the maximum image size MaxLumaFS, and the maximum number of reproduced images that can be stored in the decoded image buffer (DPB) are represented. The level information including the memory buffer amount MFSBuffer to be provided is externally given. In FIG. 3, it is provided from a control device (not shown) via the input terminal 313.

一方、ステップS506では、図3で説明した方法で処理の対象となる画像を符号化した上で復号する。符号化した画像のデータは外部に送出、または蓄積される。ステップS507では、対象画像は後続の処理で参照画像として用いられるかどうかを判断する。この判断は画像の符号化タイプ(画面内予測符号化、画面間予測符号化、双方向予測符号化)によって決まる。参照画像として用いられない場合はステップS510に進む。参照画像として用いられる場合はステップS508に進みDPBpointerが図6に記載の位置で制御され、ステップS509にて復号・再生された画像をフレームメモリに格納した上で、ステップS511に進む。ステップS511では、次の画像があればS506に進み、次の画像がなければ処理を終了する。このように最後の画像まで符号化処理を実行する。   On the other hand, in step S506, the image to be processed is encoded and decoded by the method described with reference to FIG. The encoded image data is sent out or stored outside. In step S507, it is determined whether the target image is used as a reference image in the subsequent processing. This determination is determined by the coding type of the image (intra-screen prediction coding, inter-screen prediction coding, bidirectional prediction coding). If it is not used as a reference image, the process proceeds to step S510. If it is used as a reference image, the process proceeds to step S508, where the DPBpointer is controlled at the position shown in FIG. 6, and the image decoded and reproduced in step S509 is stored in the frame memory, and then the process proceeds to step S511. In step S511, if there is a next image, the process proceeds to S506, and if there is no next image, the process ends. In this way, the encoding process is performed up to the last image.

上述した処理は、図3の動画像符号化方法全体の処理に該当するが、とりわけステップS502、S503、S504、S505とS508は本発明によるフレームメモリ管理器314内にて行われる。   The above-described processing corresponds to the processing of the entire moving picture encoding method in FIG. 3, and in particular, steps S502, S503, S504, S505, and S508 are performed in the frame memory manager 314 according to the present invention.

なお、図5は動画像の符号化方法として説明したが、動画像復号方法の処理にも適用できる。復号処理を行う場合、ステップS501では圧縮符号化された画像のデータ(ビットストリーム)が入力される。当該データから再生画像の横幅の画素数pic_width及び再生画像の縦幅の画素数pic_height及び符号化設定として定義される最大フレームサイズMaxLumaFS及び復号画像バッファ(DPB)に格納可能な再生画像の最大枚数で表現されるメモリバッファ量MFSBuffer、復号時に利用される再生画像の最大格納枚数(メモリバッファ量) max_dec_pic_bufferingを抽出して、上述と同じ方法でステップS502〜S505、S508の制御を行う。なお復号側では、ステップS505において復元されたmax_dec_pic_bufferingがmaxDPBsize以下であるかが確認される。ステップS506では対象画像の圧縮されたデータを復号し、画像を復元する処理を行う。ステップS507以降の処理は上述したとおりである。この処理は図4の動画像復号装置の処理に該当するが、とりわけステップS502、S503、S504、S505とS508は本発明による動画像復号装置のフレームメモリ管理器409内にて行われる。   Although FIG. 5 has been described as a moving image encoding method, the present invention can be applied to processing of a moving image decoding method. When performing the decoding process, in step S501, the data (bit stream) of the compression-encoded image is input. From the data, the number of pixels of the width of the reproduced image pic_width, the number of pixels of the vertical width of the reproduced image pic_height, the maximum frame size MaxLumaFS defined as the encoding setting, and the maximum number of reproduced images that can be stored in the decoded image buffer (DPB) The expressed memory buffer amount MFSBuffer and the maximum number of stored reproduction images (memory buffer amount) max_dec_pic_buffering used at the time of decoding are extracted, and the control of steps S502 to S505 and S508 is performed in the same manner as described above. The decoding side checks whether or not the max_dec_pic_buffering restored in step S505 is equal to or less than maxDPBsize. In step S506, a process of decoding the compressed data of the target image and restoring the image is performed. The processing after step S507 is as described above. This processing corresponds to the processing of the moving picture decoding apparatus in FIG. 4, and in particular, steps S502, S503, S504, S505, and S508 are performed in the frame memory manager 409 of the moving picture decoding apparatus according to the present invention.

図6は本発明の実施形態による動画像予測符号化・復号方法におけるフレームメモリのメモリポインタの位置を説明するための模式図である。図6(a)と(b)を比較するとわかるように、メモリポインタ番号1から4の位置は固定されている。また、ステップS503で条件を満たす場合には、新たにメモリポインタ5から8として制御される。つまり、ステップS503の判定によらず、メモリポインタの位置は固定されることになる。   FIG. 6 is a schematic diagram for explaining the position of the memory pointer of the frame memory in the moving picture prediction encoding / decoding method according to the embodiment of the present invention. As can be seen by comparing FIGS. 6A and 6B, the positions of the memory pointer numbers 1 to 4 are fixed. If the condition is satisfied in step S503, the control is newly performed as memory pointers 5 to 8. That is, the position of the memory pointer is fixed regardless of the determination in step S503.

(メモリポインタの位置)
なお、本実施形態のメモリポインタ番号を1から4と5から8を交互に設定したが、メモリポインタ番号を1から8の順番で割り当てても良い。
(Memory pointer position)
Although the memory pointer numbers of this embodiment are set alternately from 1 to 4 and 5 to 8, the memory pointer numbers may be assigned in the order of 1 to 8.

(メモリ分割数)
なお、本実施形態では再生画像の横幅の画素数pic_width及び再生画像の縦幅の画素数pic_heightと符号化設定として定義される最大フレームサイズMaxLumaFSの半分の値(MaxLumaFS/2)と比較を行ったが、再生画像の横幅の画素数pic_width及び再生画像の縦幅の画素数pic_heightと符号化設定として定義される最大フレームサイズMaxLumaFS/2L(Lは2以上の整数)とを比較してもよい。その際、再生画像の格納位置を示すメモリポインタの位置は、図6で示したとおり、既に配置されたポインタを固定したままMaxLumaFSの1/2の位置にメモリポインタを配置すればよい。
(Number of memory partitions)
In this embodiment, the number of pixels pic_width of the horizontal width of the reproduced image and the number of pixels pic_height of the vertical width of the reproduced image are compared with half the maximum frame size MaxLumaFS (MaxLumaFS / 2) defined as the encoding setting. May compare pic_width, the number of pixels in the horizontal width of the reproduced image, and pic_height, the number of pixels in the vertical width of the reproduced image, with a maximum frame size MaxLumaFS / 2 L (L is an integer of 2 or more) defined as an encoding setting. . At this time, as shown in FIG. 6, the position of the memory pointer indicating the storage position of the reproduced image may be set at 1/2 L of MaxLumaFS with the already set pointer fixed.

(フレームサイズの定義)
なお、本実施形態では、再生画像の横幅の画素数pic_width及び再生画像の縦幅の画素数pic_heightによってフレームサイズを表現したが、あらかじめ積算されたフレームサイズを示す値が利用されてもよい。また、それ以外の方法でフレームサイズが算出されてもよい。
(Definition of frame size)
In the present embodiment, the frame size is represented by the number of pixels pic_width of the horizontal width of the reproduced image and the number of pixels pic_height of the vertical width of the reproduced image. However, a value indicating the frame size integrated in advance may be used. Further, the frame size may be calculated by other methods.

なお、本実施形態では、最大画像サイズMaxLumaFS、復号画像バッファ(DPB)に格納可能なMaxLumaFSの大きさの再生画像の最大枚数で表現されるメモリバッファ量MFSBufferはレベル情報として定義されたが、レベル情報として送られることに限定されない。レベル情報以外の情報として加えられても良い。   In the present embodiment, the maximum image size MaxLumaFS and the memory buffer amount MFSBuffer expressed by the maximum number of reproduced images of the size of MaxLumaFS that can be stored in the decoded image buffer (DPB) are defined as level information. It is not limited to being sent as information. It may be added as information other than the level information.

なお、本実施形態ではFSBufferやmaxDPBsizeは、格納可能な再生画像の最大枚数で表現されたが、実際のメモリ量として表現されてもよい。その場合、再生画像の枚数は、メモリ量をフレームサイズで除算して算出すればよい。   In the present embodiment, FSBuffer and maxDPBsize are represented by the maximum number of storable reproduced images, but may be represented by an actual memory amount. In this case, the number of reproduced images may be calculated by dividing the memory amount by the frame size.

特に本発明は、画像のフレームサイズと符号化条件として定義される最大フレームサイズの関係に基づき、画像バッファメモリに格納可能な再生画像の最大枚数が決定されることで、実際のフレームサイズが最大フレームサイズよりも小さい場合に、フレームメモリの無駄を軽減し、更なる符号化効率向上を可能とする参照画像用のメモリ領域を確保する効果がある。   In particular, the present invention determines the maximum number of reproduced images that can be stored in the image buffer memory on the basis of the relationship between the frame size of an image and the maximum frame size defined as a coding condition. When the frame size is smaller than the frame size, there is an effect that a waste of the frame memory is reduced and a memory area for a reference image that can further improve the coding efficiency is secured.

コンピュータを上述の動画像予測符号化装置及び動画像予測復号装置として機能させるための本発明に係る動画像予測符号化プログラム及び動画像予測復号プログラムは、プログラムとして記録媒体に格納されて提供される。記録媒体としては、フロッピー(登録商標)ディスク、CD−ROM、DVD、あるいはROM等の記録媒体、あるいは半導体メモリ等が例示される。   A moving picture prediction encoding program and a moving picture prediction decoding program according to the present invention for causing a computer to function as the above-described moving picture prediction encoding apparatus and moving picture prediction decoding apparatus are provided by being stored in a recording medium as programs. . Examples of the recording medium include a recording medium such as a floppy (registered trademark) disk, a CD-ROM, a DVD, and a ROM, and a semiconductor memory.

具体的には、動画像予測符号化プログラムは、動画像を構成する複数の画像を入力する入力モジュールと、画像を、画面内予測もしくは画面間予測のいずれかの方法で符号化し、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び符号化設定として最大フレームサイズに関する情報を含む圧縮画像データを生成し、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報に関する符号化データとともに符号化する符号化モジュールと、圧縮画像データを復号し、再生画像に復元する復号モジュールと、再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上格納する画像格納モジュールと、画像格納モジュールにおいて画像バッファメモリを制御するメモリ制御モジュールと、を具備し、メモリ制御モジュールは、画像の最大フレームサイズに対して入力画像のフレームサイズが1/2(Lは1以上の整数)以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数を2倍に決定することを特徴とする動画像予測符号化プログラムである。 Specifically, the moving image prediction encoding program includes an input module for inputting a plurality of images constituting the moving image, and encoding the image by any of an intra-screen prediction and an inter-screen prediction. Generates compressed image data including information on the size, the maximum number of images that can be stored, and the maximum frame size as an encoding setting, and codes the information on the target image frame size, the maximum number of images that can be stored, and the information on the maximum frame size. An encoding module that encodes together with the encoded data, a decoding module that decodes the compressed image data and restores the reproduced image, and stores one or more of the reproduced images as reference images used to encode subsequent images. An image storage module, and a memory control module for controlling an image buffer memory in the image storage module. Comprising a Lumpur, a memory control module, when the frame size of the input image with respect to the maximum frame size of the image is 1/2 L (L is an integer of 1 or more) or less, can be stored in the frame memory This is a moving image prediction encoding program characterized in that the maximum number of reproduced images is determined to be 2L times.

同様に、動画像予測符号化プログラムは、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び符号化設定として最大フレームサイズに関する情報を含む圧縮画像データを示す符号化データを入力する入力モジュールと、圧縮画像データと対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報を示す圧縮画像データを復号し、再生画像と、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報とに復元する復号モジュールと、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納モジュールと、画像格納モジュールを制御するメモリ制御モジュールと、を具備し、メモリ制御モジュールは、画像の最大フレームサイズに対して入力画像のフレームサイズが1/2(Lは1以上の整数)倍以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数を2倍に決定することを特徴とする動画像予測符号化プログラムである。 Similarly, the moving image prediction encoding program encodes a plurality of images constituting a moving image by either intra-screen prediction or inter-screen prediction, and sets a target image frame size and a maximum number of images that can store a reproduced image. And an input module for inputting encoded data indicating compressed image data including information on the maximum frame size as an encoding setting, and information on the compressed image data and the target image frame size, the maximum number of images that can store reproduced images, and the maximum frame size A decoding module that decodes the compressed image data indicating the reproduction image, and restores the reproduced image to information on the target image frame size, the maximum number of images that can be stored and the maximum frame size, and decodes the reproduced image and the subsequent image Image storage module for storing one or more reference images used for Includes a memory control module that controls the module, a memory control module, the frame size is 1/2 L of the input image with respect to the maximum frame size of the image (L is an integer of 1 or more) in the case of times or less, A moving image prediction encoding program characterized in that the maximum number of reproduced images that can be stored in a frame memory is determined to be 2L times.

図7は、記録媒体に記録されたプログラムを実行するためのコンピュータのハードウェア構成を示す図であり、図8は、記録媒体に記憶されたプログラムを実行するためのコンピュータの斜視図である。コンピュータとして、CPUを具備しソフトウエアによる処理や制御を行なうDVDプレーヤ、セットトップボックス、携帯電話などを含む。   FIG. 7 is a diagram showing a hardware configuration of a computer for executing a program recorded on a recording medium, and FIG. 8 is a perspective view of a computer for executing a program stored on a recording medium. The computer includes a DVD player, a set-top box, a mobile phone, and the like that include a CPU and perform processing and control by software.

図7に示すように、コンピュータ30は、フロッピー(登録商標)ディスクドライブ装置、CD−ROMドライブ装置、DVDドライブ装置等の読取装置12と、オペレーティングシステムを常駐させた作業用メモリ(RAM)14と、記録媒体10に記憶されたプログラムを記憶するメモリ16と、ディスプレイといった表示装置18と、入力装置であるマウス20及びキーボード22と、データ等の送受を行うための通信装置24と、プログラムの実行を制御するCPU26とを備えている。コンピュータ30は、記録媒体10が読取装置12に挿入されると、読取装置12から記録媒体10に格納された動画像予測符号化・復号プログラムにアクセス可能になり、当該動画像予測符号化・復号プログラムによって、本発明による動画像符号化装置・復号装置として動作することが可能になる。   As shown in FIG. 7, the computer 30 includes a reading device 12 such as a floppy (registered trademark) disk drive device, a CD-ROM drive device, and a DVD drive device, a working memory (RAM) 14 in which an operating system is resident, and A memory 16 for storing a program stored in the recording medium 10, a display device 18 such as a display, a mouse 20 and a keyboard 22 as input devices, a communication device 24 for transmitting and receiving data and the like, and execution of the program. And a CPU 26 for controlling the CPU. When the recording medium 10 is inserted into the reading device 12, the computer 30 becomes able to access the moving image prediction encoding / decoding program stored in the recording medium 10 from the reading device 12, and the moving image prediction encoding / decoding is performed. The program makes it possible to operate as a moving picture encoding device / decoding device according to the present invention.

図8に示すように、動画像予測符号化プログラムもしくは動画像復号プログラは、搬送波に重畳されたコンピュータデータ信号40としてネットワークを介して提供されるものであってもよい。この場合、コンピュータ30は、通信装置24によって受信した動画像予測符号化プログラムもしくは動画像復号プログラムをメモリ16に格納し、当該動画像予測符号化プログラムもしくは動画像予測復号プログラムを実行することができる。   As shown in FIG. 8, the moving picture prediction coding program or the moving picture decoding program may be provided via a network as a computer data signal 40 superimposed on a carrier wave. In this case, the computer 30 can store the moving picture prediction coding program or the moving picture decoding program received by the communication device 24 in the memory 16 and execute the moving picture prediction coding program or the moving picture prediction decoding program. .

上記目的を達成するために、本発明に係る動画像予測符号化装置は、動画像を構成する複数の画像を入力する入力手段と、画像を、画面内予測もしくは画面間予測のいずれかの方法で符号化し、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び符号化設定として最大フレームサイズに関する情報を含む圧縮画像データを生成し、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報に関する符号化データとともに符号化する符号化手段と、圧縮画像データを復号し、再生画像に復元する復号手段と、再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上格納する画像格納手段と、を具備し、画像の最大フレームサイズに対して入力画像のフレームサイズが1/2倍以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数を2倍に決定することを特徴とする。   In order to achieve the above object, a moving picture predictive encoding apparatus according to the present invention comprises: an input unit for inputting a plurality of pictures constituting a moving picture; Generates compressed image data including information about the target image frame size, the maximum number of images that can be stored and the maximum frame size as an encoding setting, the target image frame size, the maximum number of images that can be stored, and Encoding means for encoding together with the encoded data relating to the information on the maximum frame size, decoding means for decoding the compressed image data and restoring it to a reproduced image, and a reference used for encoding the reproduced image to a subsequent image Image storage means for storing at least one image as an image, wherein the frame size of the input image is 1 / the maximum frame size of the image. If times below, and determines the maximum number of storable reproduced image to twice in the frame memory.

この動画像予測符号化装置では、動画像を構成する各画像または圧縮符号化された画像データに付随されるフレームサイズと符号化設定で定義される最大フレームサイズ関係に基づき、画像バッファメモリに格納可能な再生画像の最大枚数が決定される。より具体的には、例えば、入力画像のフレームサイズが符号化設定で定義される最大フレームサイズの1/2倍より大きい場合には再生画像を最大N枚格納(Nは1以上の整数)可能とし、入力画像のフレームサイズが最大フレームサイズの1/2倍以下の場合には、再生画像の格納に利用可能なメモリバッファ量を制御して、再生画像を最大2xN枚格納可能とする。これにより復号された再生画像のフレームサイズが符号化設定にて定義された最大フレームサイズの1/2倍以下の場合に、格納可能な再生画像の最大枚数を増加することができ、参照画像増加により符号化効率向上が可能となる。   In this moving picture predictive coding apparatus, a moving image is stored in an image buffer memory based on a relationship between a frame size attached to each image constituting a moving image or compression-encoded image data and a maximum frame size defined by an encoding setting. The maximum number of possible reproduced images is determined. More specifically, for example, when the frame size of the input image is larger than half the maximum frame size defined in the encoding setting, up to N reproduced images can be stored (N is an integer of 1 or more). When the frame size of the input image is equal to or less than の of the maximum frame size, the amount of memory buffer available for storing the reproduced image is controlled so that a maximum of 2 × N reproduced images can be stored. Accordingly, when the frame size of the decoded reproduced image is equal to or less than half the maximum frame size defined in the encoding setting, the maximum number of storable reproduced images can be increased, and the reference image can be increased. As a result, encoding efficiency can be improved.

また、本発明に係る動画像予測符号化装置は、画像の最大フレームサイズに対して入力画像のフレームサイズが1/4倍以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数を4倍に決定することを特徴とすることとしてもよい。   Further, the video predictive encoding apparatus according to the present invention, when the frame size of the input image is 1/4 or less of the maximum frame size of the image, sets the maximum number of reproduced images that can be stored in the frame memory. It may be characterized in that it is determined four times.

本発明に係る動画像予測復号装置は、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び符号化設定として最大フレームサイズに関する情報を含む圧縮画像データを示す符号化データを入力する入力手段と、圧縮画像データと対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報を示す圧縮画像データを復号し、再生画像と、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報とに復元する復号手段と、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納手段と、を具備し、画像の最大フレームサイズに対して入力画像のフレームサイズが1/2倍以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数を2倍に決定することを特徴とする。   The moving picture prediction decoding apparatus according to the present invention is configured such that a plurality of pictures constituting a moving picture are encoded by either intra-screen prediction or inter-screen prediction, a target image frame size, and a maximum number of images that can be stored in a reproduced image. Input means for inputting encoded data indicating compressed image data including information on the maximum frame size as encoding settings; information on the compressed image data and the target image frame size; the maximum number of images that can store reproduced images and the maximum frame size; Decoding means for decoding the compressed image data indicating the reproduction image, and restoring the reproduced image into information on the target image frame size, the maximum number of images that can be stored and the maximum frame size, and decodes the reproduced image into a subsequent image Image storage means for storing one or more reference images used for the If the frame size of the input image relative's is 1/2 times or less, and determines the maximum number of storable reproduced image to twice in the frame memory.

この動画像予測復号装置では、動画像を構成する各画像または圧縮符号化された画像データに付随されるフレームサイズと符号化設定で定義される最大フレームサイズ関係に基づき、画像バッファメモリに格納可能な再生画像の最大枚数が決定される。より具体的には、例えば、入力画像のフレームサイズが符号化設定で定義される最大フレームサイズの1/2倍より大きい場合には再生画像を最大N枚格納(Nは1以上の整数)可能とし、入力画像のフレームサイズが最大フレームサイズの1/2倍以下の場合には、再生画像を最大2N枚格納可能とする。これにより復号された再生画像のフレームサイズが符号化設定にて定義された最大フレームサイズの1/2倍以下の場合に、格納可能な再生画像の最大枚数を増加することができ、参照画像増加により符号化効率向上が可能となる。   In this video predictive decoding device, it is possible to store in the image buffer memory based on the frame size associated with each image constituting the video or the compression-coded image data and the maximum frame size defined by the coding setting. The maximum number of reproduced images is determined. More specifically, for example, when the frame size of the input image is larger than half the maximum frame size defined in the encoding setting, up to N reproduced images can be stored (N is an integer of 1 or more). When the frame size of the input image is equal to or less than 最大 of the maximum frame size, a maximum of 2N reproduced images can be stored. Accordingly, when the frame size of the decoded reproduced image is equal to or less than half the maximum frame size defined in the encoding setting, the maximum number of storable reproduced images can be increased, and the reference image can be increased. As a result, encoding efficiency can be improved.

また、本発明に係る動画像予測復号装置は、画像の最大フレームサイズに対して入力画像のフレームサイズが1/4倍以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数を4倍に決定することを特徴とすることとしてもよい。   Also, the video predictive decoding apparatus according to the present invention, when the frame size of the input image is 1/4 or less of the maximum frame size of the image, sets the maximum number of reproduced images that can be stored in the frame memory to 4 It may be characterized in that it is determined twice.

また、本発明に係る動画像予測符号化方法は、動画像予測符号化装置により実行される動画像予測符号化方法であって、動画像を構成する複数の画像を入力する入力ステップと、画像を、画面内予測もしくは画面間予測のいずれかの方法で符号化し、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び符号化設定として最大フレームサイズに関する情報を含む圧縮画像データを生成し、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報に関する符号化データとともに符号化する符号化ステップと、圧縮画像データを復号し、再生画像に復元する復号ステップと、再生画像を、後続の画像を符号化するために用いられる参照画像として1つ以上、画像格納手段によって格納する画像格納ステップと、を具備し、画像の最大フレームサイズに対して入力画像のフレームサイズが1/2倍以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数を2倍に決定することを特徴とする。   Also, the moving picture prediction encoding method according to the present invention is a moving picture prediction encoding method executed by a moving picture prediction encoding apparatus, comprising: an input step of inputting a plurality of pictures constituting a moving picture; Is encoded by any method of intra-screen prediction or inter-screen prediction, and generates compressed image data including information about the target image frame size, the maximum number of images that can be stored as a playback image, and the maximum frame size as an encoding setting, An encoding step of encoding the target image frame size, the maximum number of reproducible images that can be stored, and encoded data relating to information on the maximum frame size; a decoding step of decoding compressed image data and restoring the reproduced image; Image storage means for storing at least one reference image as a reference image used for encoding a subsequent image. And determining that the maximum number of reproduced images that can be stored in the frame memory is doubled when the frame size of the input image is 以下 or less of the maximum frame size of the image. Features.

また、本発明に係る動画像予測符号化方法は、画像の最大フレームサイズに対して入力画像のフレームサイズが1/4倍以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数を4倍に決定することを特徴とすることとしてもよい。   Also, the video predictive encoding method according to the present invention, when the frame size of the input image is 1/4 or less of the maximum frame size of the image, the maximum number of reproduced images that can be stored in the frame memory. It may be characterized in that it is determined four times.

また、本発明に係る動画像予測復号方法は、動画像予測復号装置によって実行される動画像予測復号方法であって、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び符号化設定として最大フレームサイズに関する情報を含む圧縮画像データを示す符号化データを入力する入力ステップと、圧縮画像データと対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報を示す圧縮画像データを復号し、再生画像と、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報とに復元する復号ステップと、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上、画像格納手段によって格納する画像格納ステップと、を具備し、画像の最大フレームサイズに対して入力画像のフレームサイズが1/2倍以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数を2倍に決定することを特徴とする。   Also, the moving picture prediction decoding method according to the present invention is a moving picture prediction decoding method executed by a moving picture prediction decoding apparatus, and performs intra-screen prediction or inter-screen prediction for a plurality of images constituting a moving image. An input step of inputting encoded data indicating compressed image data which is encoded by any of the above and includes information on a target image frame size, a maximum number of images that can be stored and a maximum frame size as an encoding setting, and compressed image data Decodes compressed image data indicating information about the target image frame size, the maximum number of frames that can store the reproduced image, and the maximum frame size, and reproduces the reproduced image, the target image frame size, the maximum number of frames that can store the reproduced image, and the maximum frame size. Decoding step to restore the reproduced image to information about the An image storage step of storing at least one reference image by an image storage unit, wherein the input image is stored in a frame memory when the frame size of the input image is 以下 or less of the maximum frame size of the image. The maximum number of possible reproduced images is determined to be twice.

また、本発明に係る動画像予測復号方法は、画像の最大フレームサイズに対して入力画像のフレームサイズが1/4倍以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数を4倍に決定することを特徴とすることとしてもよい。   Also, the moving picture prediction decoding method according to the present invention, when the frame size of the input image is 1/4 or less of the maximum frame size of the image, sets the maximum number of reproduced images that can be stored in the frame memory to four. It may be characterized in that it is determined twice.

また、本発明に係る動画像予測復号方法は、フレームメモリ内に格納可能な再生画像の最大枚数を決定する際に、メモリ内の再生画像の格納位置を示すメモリポインタを固定することを特徴とすることとしてもよい。   Further, the moving picture prediction decoding method according to the present invention is characterized in that when determining the maximum number of reproduced images that can be stored in the frame memory, a memory pointer indicating a storage position of the reproduced image in the memory is fixed. You may do it.

この動画像予測復号方法では、各再生画像の格納位置を示すメモリポインタは、例えば、最大フレームサイズとその1/2倍の位置で固定することができるため、フレームサイズによる可変的なメモリポインタ制御を必要とせず、より簡易で効率的なメモリ制御の実装が可能となる。また、メモリポインタの位置を算出する際も、例えば、1/2倍の変化に限定されるためシフト演算で実行可能であり、演算コストが少ない。   In this moving image predictive decoding method, the memory pointer indicating the storage position of each reproduced image can be fixed at, for example, the maximum frame size and a half of the maximum frame size. And a simpler and more efficient implementation of memory control becomes possible. Also, when calculating the position of the memory pointer, for example, it is possible to execute the shift operation because the change is limited to, for example, 1/2, and the operation cost is low.

また、本発明に係る動画像予測復号プログラムは、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び符号化設定として最大フレームサイズに関する情報を含む圧縮画像データを示す符号化データを入力する入力モジュールと、圧縮画像データと対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報を示す圧縮画像データを復号し、再生画像と、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報とに復元する復号モジュールと、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納モジュールと、を具備し、画像の最大フレームサイズに対して入力画像のフレームサイズが1/2倍以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数を2倍に決定することを特徴とする。   In addition, the moving image prediction decoding program according to the present invention can encode a plurality of images constituting a moving image by either intra-screen prediction or inter-screen prediction, and store a target image frame size and a reproduced image. An input module for inputting encoded data indicating compressed image data including information on the maximum frame size as the maximum number and encoding settings, the compressed image data and the target image frame size, the maximum number and the maximum frame size capable of storing the reproduced image A decoding module that decodes compressed image data indicating information about the reproduction image and restores the reproduction image and information on the target image frame size, the maximum number of images that can store the reproduction image, and information on the maximum frame size. An image storage module for storing one or more reference images used for decoding; Provided, when the frame size of the input image with respect to the maximum frame size of the image is 1/2 times or less, and determines the maximum number of storable reproduced image to twice in the frame memory.

当該動画像予測復号方法及び動画像予測復号プログラムは、上述の動画像予測復号装置と同様な効果を奏することができる。   The moving picture prediction decoding method and the moving picture prediction decoding program can provide the same effects as those of the above-described moving picture prediction decoding apparatus.

本発明に係る動画像予測復号方法は、動画像予測復号装置によって実行される動画像予測復号方法であって、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び符号化設定として最大フレームサイズに関する情報を含む圧縮画像データを示す符号化データを入力する入力ステップと、圧縮画像データと対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報を示す圧縮画像データを復号し、再生画像と、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報とに復元する復号ステップと、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上、画像格納手段によって格納する画像格納ステップと、を具備し、画像の最大フレームサイズと入力画像のフレームサイズとの関係に基づいて、フレームメモリ内に格納可能な再生画像の最大枚数を所定の値の等倍、2倍又は4倍に決定することを特徴とする。   A moving image prediction decoding method according to the present invention is a moving image prediction decoding method executed by a moving image prediction decoding device, and includes a method of performing either an intra-screen prediction or an inter-screen prediction for a plurality of images constituting a moving image. Inputting encoded data indicating compressed image data including information on the target image frame size, the maximum number of images that can be stored, and the maximum frame size as an encoding setting, and inputting the compressed image data and the target Decodes compressed image data indicating information about the image frame size, the maximum number of frames that can store a reproduced image, and the maximum frame size, and reproduces the reproduced image, the target image frame size, and the information about the maximum number and the maximum frame size that can store the reproduced image. Decoding step to restore the reproduced image to a reference used to decode the subsequent image An image storing step of storing at least one image as an image by an image storing means, wherein the maximum of a reproduced image that can be stored in the frame memory is determined based on a relationship between a maximum frame size of the image and a frame size of the input image. The number of sheets is determined to be equal to, twice, or four times a predetermined value.

また、本発明に係る動画像予測復号方法は、画像の最大フレームサイズに対して入力画像のフレームサイズが1/2倍以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数を所定の値の2倍に決定することを特徴とすることとしてもよい。   Further, in the moving picture prediction decoding method according to the present invention, when the frame size of the input image is equal to or less than 1 / times the maximum frame size of the image, the maximum number of reproduced images that can be stored in the frame memory is determined. The value may be determined to be twice the value of.

また、本発明に係る動画像予測復号方法は、画像の最大フレームサイズに対して入力画像のフレームサイズが1/4倍以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数を所定の値の4倍に決定することを特徴とすることとしてもよい。   Further, in the video predictive decoding method according to the present invention, when the frame size of the input image is 1/4 or less of the maximum frame size of the image, the maximum number of reproduced images that can be stored in the frame memory is determined. May be determined to be four times the value of.

本発明に係る動画像予測復号装置は、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び符号化設定として最大フレームサイズに関する情報を含む圧縮画像データを示す符号化データを入力する入力手段と、圧縮画像データと対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報を示す圧縮画像データを復号し、再生画像と、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報とに復元する復号手段と、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納手段と、を具備し、画像の最大フレームサイズと入力画像のフレームサイズとの関係に基づいて、フレームメモリ内に格納可能な再生画像の最大枚数を所定の値の等倍、2倍又は4倍に決定することを特徴とする。   The moving picture prediction decoding apparatus according to the present invention is configured such that a plurality of pictures constituting a moving picture are encoded by either intra-screen prediction or inter-screen prediction, a target image frame size, and a maximum number of images that can be stored in a reproduced image. Input means for inputting encoded data indicating compressed image data including information on the maximum frame size as encoding settings; information on the compressed image data and the target image frame size; the maximum number of images that can store reproduced images and the maximum frame size; Decoding means for decoding the compressed image data indicating the reproduction image, and restoring the reproduced image into information on the target image frame size, the maximum number of images that can be stored and the maximum frame size, and decodes the reproduced image into a subsequent image Image storage means for storing one or more reference images used for the Based on the relationship between the frame size's and the input image, magnification of a predetermined value the maximum number of storable reproduced image in the frame memory, and determining the double or quadruple.

上記目的を達成するために、本発明に係る動画像予測復号方法は、動画像予測復号装置によって実行される動画像予測復号方法であって、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び符号化設定として最大フレームサイズに関する情報を含む圧縮画像データを示す符号化データを入力する入力ステップと、圧縮画像データと対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報を示す圧縮画像データを復号し、再生画像と、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報とに復元する復号ステップと、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上、画像格納手段によって格納する画像格納ステップと、を具備し、画像の最大フレームサイズのシフト演算値と入力画像のフレームサイズとの関係に基づいて、フレームメモリ内に格納可能な再生画像の最大枚数は所定の値の等倍、2倍又は4倍に決定されていることを特徴とする。   In order to achieve the above object, a video predictive decoding method according to the present invention is a video predictive decoding method executed by a video predictive decoding device, wherein a plurality of images constituting a video are displayed on a screen. An input for inputting encoded data indicating compressed image data that is encoded by either prediction or inter-screen prediction and includes information on the target image frame size, the maximum number of reproducible images that can be stored, and the maximum frame size as an encoding setting Step: decoding the compressed image data and the target image frame size, the compressed image data indicating information on the maximum number of frames that can store the reproduced image and the maximum frame size, and storing the reproduced image, the target image frame size, and the reproduced image. A decoding step of restoring the information on the maximum number of frames and the maximum frame size; Image storing step of storing at least one reference image used by the image storage unit by an image storage unit, based on a relationship between a shift operation value of a maximum frame size of the image and a frame size of the input image. The maximum number of reproduced images that can be stored in the memory is determined to be equal, twice, or four times a predetermined value.

また、本発明に係る動画像予測復号方法は、入力画像のフレームサイズが、画像の最大フレームサイズを1ビット右シフト演算した値以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数は所定の値の2倍に決定されており、かつ、入力画像のフレームサイズが、画像の最大フレームサイズを2ビット右シフト演算した値以下の場合に、フレームメモリ内に格納可能な再生画像の最大枚数は所定の値の4倍に決定されていることを特徴とすることとしてもよい。   Also, in the moving picture prediction decoding method according to the present invention, when the frame size of the input image is equal to or smaller than a value obtained by shifting the maximum frame size of the image by 1 bit right, the maximum number of reproduced images that can be stored in the frame memory Is determined to be twice the predetermined value, and when the frame size of the input image is equal to or smaller than a value obtained by performing a right shift operation of the maximum frame size of the image by 2 bits, the reproduction image that can be stored in the frame memory is The maximum number may be determined to be four times a predetermined value.

本発明に係る動画像予測復号装置は、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び符号化設定として最大フレームサイズに関する情報を含む圧縮画像データを示す符号化データを入力する入力手段と、圧縮画像データと対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報を示す圧縮画像データを復号し、再生画像と、対象画像フレームサイズ、再生画像を格納可能な最大枚数及び最大フレームサイズに関する情報とに復元する復号手段と、再生画像を、後続の画像を復号するために用いられる参照画像として1つ以上格納する画像格納手段と、を具備し、画像の最大フレームサイズのシフト演算値と入力画像のフレームサイズとの関係に基づいて、フレームメモリ内に格納可能な再生画像の最大枚数は所定の値の等倍、2倍又は4倍に決定されていることを特徴とする。   The moving picture prediction decoding apparatus according to the present invention is configured such that a plurality of pictures constituting a moving picture are encoded by either intra-screen prediction or inter-screen prediction, a target image frame size, and a maximum number of images that can be stored in a reproduced image. Input means for inputting encoded data indicating compressed image data including information on the maximum frame size as encoding settings; information on the compressed image data and the target image frame size; the maximum number of images that can store reproduced images and the maximum frame size; Decoding means for decoding the compressed image data indicating the reproduction image, and restoring the reproduced image into information on the target image frame size, the maximum number of images that can be stored and the maximum frame size, and decodes the reproduced image into a subsequent image Image storage means for storing one or more reference images used for the The maximum number of reproduced images that can be stored in the frame memory is determined to be equal to, twice, or four times a predetermined value based on the relationship between the shift operation value of the shift and the frame size of the input image. Features.

301…入力端子、302…ブロック分割器、303…予測信号生成器、304…フレームメモリ、305…減算器、306…変換器、307…量子化器、308…逆量子化器、309…逆変換器、310…加算器、311…エントロピー符号化器、312…出力端子、313…入力端子、314…フレームメモリ管理器、401…入力端子、402…データ解析器、403…逆量子化器、404…逆変換器、405…加算器、406…出力端子、407…フレームメモリ、408…予測信号生成器、409…フレームメモリ管理器。   Reference numeral 301: input terminal, 302: block divider, 303: predicted signal generator, 304: frame memory, 305: subtractor, 306: converter, 307: quantizer, 308: inverse quantizer, 309: inverse transform Adder, 310 adder, 311 entropy coder, 312 output terminal, 313 input terminal, 314 frame memory manager, 401 input terminal, 402 data analyzer, 403 inverse quantizer, 404 … Inverter, 405 adder, 406 output terminal, 407 frame memory, 408 predicted signal generator, 409 frame memory manager

Claims (11)

動画像予測符号化を実施するようにプログラム可能なCPUと、
プログラムされた前記CPUによって、動画像を構成する複数の画像を受信するように実行可能な受信部と、
プログラムされた前記CPUによって、受信された画像を、画面内予測もしくは画面間予測のいずれかの方法で符号化し、圧縮画像データを生成するように実行可能な符号化部と、
プログラムされた前記CPUによって、圧縮画像データを復号し、再生画像に復元するように実行可能な復号部と、
プログラムされた前記CPUによって、1つ以上の再生画像を、後続の画像を符号化するために用いられる参照画像として格納するように実行可能なフレームメモリと、
プログラムされた前記CPUによって、前記フレームメモリを管理するように実行可能なメモリ管理部であって、対象画像のフレームサイズを示す対象画像フレームサイズと、レベル情報により予め規定され、前記フレームメモリ内に格納可能な再生画像の最大サイズを示す、最大フレームサイズ(MaxLumaFS)と、前記フレームメモリ内に格納可能な再生画像の予め設定される最大枚数によって表現されるフレームメモリサイズ(MFSBuffer)とを取得するように実行可能であるメモリ管理部と、
を備え、
前記メモリ管理部が、
MaxLumaFSの1/2倍と対象画像フレームサイズとを比較し、
MaxLumaFSの1/2倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを2倍にし、
前記フレームメモリ内に格納可能な再生画像の適応最大枚数(maxDPBsize)をMFSBufferの2倍に設定する、
ようにさらに実行可能であり、
前記フレームメモリ内に格納された再生画像の枚数が、maxDPBsizeにおいて設定された枚数以下である、
動画像予測符号化装置。
A CPU programmable to perform video prediction encoding;
A receiving unit executable by the programmed CPU to receive a plurality of images constituting a moving image;
An encoding unit that is executable by the programmed CPU to encode a received image by any of intra-screen prediction and inter-screen prediction, and to generate compressed image data;
A decoding unit capable of decoding compressed image data by the programmed CPU and executing decoding of the compressed image data into a reproduced image;
A frame memory executable by the programmed CPU to store one or more playback images as reference images used to encode subsequent images;
A memory management unit executable by the programmed CPU to manage the frame memory, the memory management unit being defined in advance by a target image frame size indicating frame size of a target image and level information, and stored in the frame memory. A maximum frame size (MaxLumaFS) indicating the maximum size of a storable playback image and a frame memory size (MFSBuffer) represented by a preset maximum number of playback images storable in the frame memory are acquired. A memory management unit, which is executable as
With
The memory management unit,
Compare 1/2 times MaxLumaFS with the target image frame size,
If it is determined that 1/2 times MaxLumaFS is equal to or larger than the target image frame size, MFSBuffer is doubled,
Setting the adaptive maximum number of reproduced images (maxDPBsize) that can be stored in the frame memory to twice the MFSBuffer;
Is even more feasible,
The number of reproduced images stored in the frame memory is equal to or less than the number set in maxDPBsize.
A moving picture prediction encoding device.
プログラムされた前記CPUによって、前記メモリ管理部が、
MaxLumaFSの1/4倍と対象画像フレームサイズとを比較し、
MaxLumaFSの1/4倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを4倍にし、
maxDPBsizeをMFSBufferの4倍に設定する、
ようにさらに実行可能である、請求項1に記載の動画像予測符号化装置。
The programmed CPU causes the memory management unit to:
Compare 1/4 times MaxLumaFS with the target image frame size,
When it is determined that 1/4 of MaxLumaFS is equal to or larger than the target image frame size, MFSBuffer is quadrupled,
set maxDPBsize to 4 times MFSBuffer,
The video prediction encoding apparatus according to claim 1, wherein the apparatus is further executable.
動画像予測復号を実施するようにプログラムされたCPUと、
前記CPUによって、動画像を構成する複数の画像の圧縮された形態を表す圧縮画像データを含む符号化されたデータを受信するように実行可能な受信部であって、複数の画像が画面内予測もしくは画面間予測のいずれかの方法で符号化されている、受信部と、
前記CPUによって、圧縮画像データを復号し、再生画像に復元するように実行可能な復号部と、
前記CPUによって、1つ以上の再生画像を、後続の画像を復号するために用いられる参照画像として格納するように実行可能な復号画像バッファ(DPB:Decoded Picture Buffer)と、
前記CPUによって、前記DPBを管理するように実行可能なバッファ管理部であって、対象画像のフレームサイズを示す対象画像フレームサイズと、レベル情報により予め規定され、前記DPB内に格納可能な再生画像の最大サイズを示す、最大フレームサイズ(MaxLumaFS)と、前記DPB内に格納可能な再生画像の予め設定される最大枚数によって表現されるフレームメモリサイズ(MFSBuffer)とを取得するように実行可能であるバッファ管理部と、
を備え、
前記バッファ管理部が、
MaxLumaFSの1/2倍と対象画像フレームサイズとを比較し、
MaxLumaFSの1/2倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを2倍にし、
前記DPB内に格納可能な再生画像の適応最大枚数(maxDPBsize)をMFSBufferの2倍に設定する、
ようにさらに実行可能であり、
前記DPB内に格納された再生画像の枚数が、maxDPBsizeにおいて設定された枚数以下である、
動画像予測復号装置。
A CPU programmed to perform video prediction decoding;
A receiving unit executable by said CPU to receive encoded data including compressed image data representing a compressed form of a plurality of images constituting a moving image, wherein Or a receiving unit encoded by any method of inter-screen prediction,
A decoding unit executable by the CPU to decode compressed image data and restore a reproduced image;
A decoded picture buffer (DPB: Decoded Picture Buffer) executable by the CPU to store one or more playback pictures as reference pictures used to decode subsequent pictures;
A buffer management unit executable by the CPU to manage the DPB, comprising a target image frame size indicating a frame size of a target image, and a reproduced image pre-defined by level information and storable in the DPB. And a frame memory size (MFSBuffer) represented by a preset maximum number of reproduction images that can be stored in the DPB. A buffer management unit;
With
The buffer management unit,
Compare 1/2 times MaxLumaFS with the target image frame size,
If it is determined that 1/2 times MaxLumaFS is equal to or larger than the target image frame size, MFSBuffer is doubled,
Setting the adaptive maximum number of reproduced images (maxDPBsize) that can be stored in the DPB to twice the MFSBuffer;
Is even more feasible,
The number of reproduced images stored in the DPB is equal to or less than the number set in maxDPBsize.
Video prediction decoding device.
前記バッファ管理部が、
MaxLumaFSの1/4倍と対象画像フレームサイズとを比較し、
MaxLumaFSの1/4倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを4倍にし、
maxDPBsizeをMFSBufferの4倍に設定する、
ようにさらに実行可能である、請求項3に記載の動画像予測復号装置。
The buffer management unit,
Compare 1/4 times MaxLumaFS with the target image frame size,
When it is determined that 1/4 of MaxLumaFS is equal to or larger than the target image frame size, MFSBuffer is quadrupled,
set maxDPBsize to 4 times MFSBuffer,
4. The moving image prediction decoding apparatus according to claim 3, wherein the apparatus is further executable.
動画像予測符号化装置によって実行される動画像予測符号化方法であって、
動画像を構成する複数の画像を受信するステップと、
受信された画像を、画面内予測もしくは画面間予測のいずれかの方法で符号化し、圧縮画像データを生成するステップと、
圧縮画像データを復号し、再生画像に復元するステップと、
フレームメモリ内において、1つ以上の再生画像を、後続の画像を符号化するために用いられる参照画像として格納するステップと、
対象画像のフレームサイズを示す対象画像フレームサイズと、レベル情報により予め規定され、前記フレームメモリ内に格納可能な再生画像の最大サイズを示す、最大フレームサイズ(MaxLumaFS)と、前記フレームメモリ内に格納可能な再生画像の予め設定される最大枚数によって表現されるフレームメモリサイズ(MFSBuffer)とを取得するステップと、
MaxLumaFSの1/2倍と対象画像フレームサイズとを比較するステップと、
MaxLumaFSの1/2倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを2倍にするステップと、
前記フレームメモリ内に格納可能な再生画像の適応最大枚数(maxDPBsize)をMFSBufferの2倍に設定するステップと、
を含み、
前記フレームメモリ内に格納された再生画像の枚数が、maxDPBsizeにおいて設定された枚数以下である、
動画像予測符号化方法。
A video prediction encoding method executed by the video prediction encoding device,
Receiving a plurality of images constituting a moving image;
Encoding the received image by any of intra-screen prediction or inter-screen prediction, and generating compressed image data;
Decoding the compressed image data and restoring it to a reproduced image;
Storing in the frame memory one or more reconstructed images as reference images used to encode subsequent images;
A target image frame size that indicates a frame size of the target image, a maximum frame size (MaxLumaFS) that is defined in advance by level information and indicates a maximum size of a reproduced image that can be stored in the frame memory, and stored in the frame memory. Acquiring a frame memory size (MFSBuffer) represented by a preset maximum number of possible playback images;
Comparing 1/2 of MaxLumaFS with the target image frame size;
Doubling MFSBuffer when it is determined that 1/2 times MaxLumaFS is equal to or larger than the target image frame size;
Setting the adaptive maximum number of reproduced images (maxDPBsize) that can be stored in the frame memory to twice MFSBuffer;
Including
The number of reproduced images stored in the frame memory is equal to or less than the number set in maxDPBsize.
Video prediction encoding method.
MaxLumaFSの1/4倍と対象画像フレームサイズとを比較するステップと、
MaxLumaFSの1/4倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを4倍にするステップと、
maxDPBsizeをMFSBufferの4倍に設定するステップと、
をさらに含む、請求項5に記載の動画像予測符号化方法。
Comparing 1/4 of MaxLumaFS with the target image frame size;
When it is determined that 1/4 of MaxLumaFS is equal to or larger than the target image frame size, quadrupling the MFSBuffer;
setting maxDPBsize to four times MFSBuffer;
The moving picture prediction encoding method according to claim 5, further comprising:
動画像予測復号装置によって実行される動画像予測復号方法であって、
動画像を構成する複数の画像の圧縮された形態を表す圧縮画像データを含む符号化されたデータを受信するステップであって、複数の画像が画面内予測もしくは画面間予測のいずれかの方法で符号化されている、ステップと、
複数の画像の圧縮された形態を復号し、再生画像に復元するステップと、
復号画像バッファ(DPB:Decoded Picture Buffer)内において、1つ以上の再生画像を、後続の画像を復号するために用いられる参照画像として格納するステップと、
対象画像のフレームサイズを示す対象画像フレームサイズと、レベル情報により予め規定され、前記DPB内に格納可能な再生画像の最大サイズを示す、最大フレームサイズ(MaxLumaFS)と、前記DPB内に格納可能な再生画像の予め設定される最大枚数によって表現されるフレームメモリサイズ(MFSBuffer)とを取得するステップと、
MaxLumaFSの1/2倍と対象画像フレームサイズとを比較するステップと、
MaxLumaFSの1/2倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを2倍にするステップと、
前記DPB内に格納可能な再生画像の適応最大枚数(maxDPBsize)をMFSBufferの2倍に設定するステップと、
を含み、
前記DPB内に格納された再生画像の枚数が、maxDPBsizeにおいて設定された枚数以下である、
動画像予測復号方法。
A video prediction decoding method executed by the video prediction decoding device,
Receiving encoded data including compressed image data representing a compressed form of a plurality of images constituting the moving image, wherein the plurality of images are encoded by either an intra-screen prediction or an inter-screen prediction. The steps being encoded;
Decoding the compressed form of the plurality of images and restoring the reproduced images;
Storing one or more playback images in a decoded image buffer (DPB) as a reference image used to decode subsequent images;
A target image frame size indicating the frame size of the target image, and a maximum frame size (MaxLumaFS) that is defined in advance by the level information and indicates the maximum size of the reproduced image that can be stored in the DPB; Obtaining a frame memory size (MFSBuffer) represented by a preset maximum number of reproduced images;
Comparing 1/2 of MaxLumaFS with the target image frame size;
Doubling MFSBuffer when it is determined that 1/2 times MaxLumaFS is equal to or larger than the target image frame size;
Setting the adaptive maximum number of reproduced images (maxDPBsize) that can be stored in the DPB to twice the MFSBuffer;
Including
The number of reproduced images stored in the DPB is equal to or less than the number set in maxDPBsize.
Video prediction decoding method.
MaxLumaFSの1/4倍と対象画像フレームサイズとを比較するステップと、
MaxLumaFSの1/4倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを4倍にするステップと、
maxDPBsizeをMFSBufferの4倍に設定するステップと、
をさらに含む、請求項7に記載の動画像予測復号方法。
Comparing 1/4 of MaxLumaFS with the target image frame size;
When it is determined that 1/4 of MaxLumaFS is equal to or larger than the target image frame size, quadrupling the MFSBuffer;
setting maxDPBsize to four times MFSBuffer;
The moving picture prediction decoding method according to claim 7, further comprising:
maxDPBsizeをMFSBufferの2倍に設定した後、メモリポインタを、MFSBufferに応じて分割された前記DPBの格納位置を示したままにするステップをさらに含む、請求項7に記載の動画像予測復号方法。   8. The moving picture prediction decoding method according to claim 7, further comprising, after setting maxDPBsize to twice MFSBuffer, keeping a memory pointer indicating a storage position of the DPB divided according to MFSBuffer. maxDPBsizeをMFSBufferの4倍に設定した後、メモリポインタを、MFSBufferに応じて分割された前記DPBの格納位置を示したままにするステップをさらに含む、請求項8に記載の動画像予測復号方法。   9. The moving picture prediction decoding method according to claim 8, further comprising, after setting maxDPBsize to four times MFSBuffer, keeping a memory pointer indicating a storage position of the DPB divided according to MFSBuffer. 動画像予測復号プログラムを格納する記録媒体であって、前記動画像予測復号プログラムがCPUを、
動画像を構成する複数の画像の圧縮された形態を表す圧縮画像データを含む符号化されたデータを受信するように実行可能な受信部であって、複数の画像が画面内予測もしくは画面間予測のいずれかの方法で符号化されている、受信部と、
圧縮画像データを復号し、再生画像に復元するように実行可能な復号部と、
1つ以上の再生画像を、後続の画像を復号するために用いられる参照画像として格納するように実行可能な復号画像バッファ(DPB:Decoded Picture Buffer)と、
前記DPBを管理するように実行可能なバッファ管理部であって、対象画像のフレームサイズを示す対象画像フレームサイズと、レベル情報により予め規定され、前記DPB内に格納可能な再生画像の最大サイズを示す、最大フレームサイズ(MaxLumaFS)と、前記DPB内に格納可能な再生画像の予め設定される最大枚数によって表現されるフレームメモリサイズ(MFSBuffer)とを取得するように実行可能であるバッファ管理部と、
を実行するようにプログラムし、
前記バッファ管理部が、
MaxLumaFSの1/2倍と対象画像フレームサイズとを比較し、
MaxLumaFSの1/2倍が対象画像フレームサイズ以上であると判定された場合に、MFSBufferを2倍にし、
前記DPB内に格納可能な再生画像の適応最大枚数(maxDPBsize)をMFSBufferの2倍に設定する、
ようにさらに実行可能であり、
前記DPB内に格納された再生画像の枚数が、maxDPBsizeにおいて設定された枚数以下である、
記録媒体。
A recording medium storing a moving image prediction decoding program, wherein the moving image prediction decoding program causes a CPU to:
A receiving unit capable of receiving encoded data including compressed image data representing a compressed form of a plurality of images constituting a moving image, wherein the plurality of images are intra-screen prediction or inter-screen prediction. A receiving unit, which is encoded by any one of the above methods,
A decoding unit that decodes the compressed image data and is executable to restore the reproduced image;
A decoded picture buffer (DPB) that is executable to store one or more replay pictures as reference pictures used to decode subsequent pictures;
A buffer management unit executable to manage the DPB, comprising: a target image frame size indicating a frame size of a target image; and a maximum size of a reproduced image that is defined in advance by level information and can be stored in the DPB. A buffer management unit executable to acquire a maximum frame size (MaxLumaFS) and a frame memory size (MFSBuffer) represented by a preset maximum number of reproduction images that can be stored in the DPB. ,
To execute
The buffer management unit,
Compare 1/2 times MaxLumaFS with the target image frame size,
If it is determined that 1/2 times MaxLumaFS is equal to or larger than the target image frame size, MFSBuffer is doubled,
Setting the adaptive maximum number of reproduced images (maxDPBsize) that can be stored in the DPB to twice the MFSBuffer;
Is even more feasible,
The number of reproduced images stored in the DPB is equal to or less than the number set in maxDPBsize.
recoding media.
JP2020002270A 2020-01-09 2020-01-09 Moving image prediction coding device, moving image prediction decoding device, moving image prediction coding method, moving image prediction decoding method and moving image prediction decoding program Active JP6875566B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020002270A JP6875566B2 (en) 2020-01-09 2020-01-09 Moving image prediction coding device, moving image prediction decoding device, moving image prediction coding method, moving image prediction decoding method and moving image prediction decoding program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020002270A JP6875566B2 (en) 2020-01-09 2020-01-09 Moving image prediction coding device, moving image prediction decoding device, moving image prediction coding method, moving image prediction decoding method and moving image prediction decoding program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018200969A Division JP6646125B2 (en) 2018-10-25 2018-10-25 Video prediction decoding method and video prediction decoding device

Publications (2)

Publication Number Publication Date
JP2020058075A true JP2020058075A (en) 2020-04-09
JP6875566B2 JP6875566B2 (en) 2021-05-26

Family

ID=70107848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020002270A Active JP6875566B2 (en) 2020-01-09 2020-01-09 Moving image prediction coding device, moving image prediction decoding device, moving image prediction coding method, moving image prediction decoding method and moving image prediction decoding program

Country Status (1)

Country Link
JP (1) JP6875566B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114760476A (en) * 2021-01-08 2022-07-15 脸萌有限公司 Video decoder initialization information signaling

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114760476A (en) * 2021-01-08 2022-07-15 脸萌有限公司 Video decoder initialization information signaling
US20220232256A1 (en) * 2021-01-08 2022-07-21 Lemon Inc. Video Decoder Initialization Information Signaling
CN114760476B (en) * 2021-01-08 2023-07-21 脸萌有限公司 Video decoder initialization information signaling
US12003777B2 (en) * 2021-01-08 2024-06-04 Lemon Inc. Video decoder initialization information signaling

Also Published As

Publication number Publication date
JP6875566B2 (en) 2021-05-26

Similar Documents

Publication Publication Date Title
KR101717510B1 (en) Device, method and program for image prediction encoding, device, method and program for image prediction decoding, and encoding/decoding system and method
RU2734616C1 (en) Prediction video decoding method and prediction video decoding device
JP6426648B2 (en) Moving picture predictive decoding method and moving picture predictive decoding apparatus
JP6875566B2 (en) Moving image prediction coding device, moving image prediction decoding device, moving image prediction coding method, moving image prediction decoding method and moving image prediction decoding program
KR101581399B1 (en) Motion video predict coding method, motion video predict coding device, motion video predict coding program, motion video predict decoding method, motion video predict decoding device, and motion video predict decoding program
JP6646125B2 (en) Video prediction decoding method and video prediction decoding device
JP5957558B2 (en) Video predictive encoding method, video predictive encoding device, video predictive encoding program, video predictive decoding method, video predictive decoding device, and video predictive decode program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210422

R150 Certificate of patent or registration of utility model

Ref document number: 6875566

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE

Ref document number: 6875566

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250