JP6510084B2 - Moving picture decoding method and electronic apparatus - Google Patents

Moving picture decoding method and electronic apparatus Download PDF

Info

Publication number
JP6510084B2
JP6510084B2 JP2018000599A JP2018000599A JP6510084B2 JP 6510084 B2 JP6510084 B2 JP 6510084B2 JP 2018000599 A JP2018000599 A JP 2018000599A JP 2018000599 A JP2018000599 A JP 2018000599A JP 6510084 B2 JP6510084 B2 JP 6510084B2
Authority
JP
Japan
Prior art keywords
block
motion information
prediction
unit
motion vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018000599A
Other languages
Japanese (ja)
Other versions
JP2018085751A (en
Inventor
太一郎 塩寺
太一郎 塩寺
昭行 谷沢
昭行 谷沢
山影 朋夫
朋夫 山影
中條 健
健 中條
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2018000599A priority Critical patent/JP6510084B2/en
Publication of JP2018085751A publication Critical patent/JP2018085751A/en
Application granted granted Critical
Publication of JP6510084B2 publication Critical patent/JP6510084B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明の実施形態は、動画像の符号化及び復号化における動き情報圧縮方法、動画像符号化方法及び動画像復号化方法に関する。   Embodiments of the present invention relate to a motion information compression method, a moving picture coding method and a moving picture decoding method in coding and decoding of a moving picture.

近年、大幅に符号化効率を向上させた画像符号化方法が、ITU-TとISO/IECとの共同で、ITU-T Rec. H.264及びISO/IEC 14496-10(以下、H.264という)として勧告されている。H.264では、予測処理、変換処理及びエントロピー符号化処理は、矩形ブロック単位(例えば、16×16画素ブロック単位、8×8画素ブロック単位等)で行われる。予測処理においては、符号化対象の矩形ブロック(符号化対象ブロック)に対して、既に符号化済みのフレーム(参照フレーム)を参照して、時間方向の予測を行う動き補償が行われる。このような動き補償では、符号化対象ブロックと参照フレーム内において参照されるブロックとの空間的シフト情報としての動きベクトルを含む動き情報を符号化して復号化側に送る必要がある。さらに、複数の参照フレームを用いて動き補償を行う場合、動き情報とともに参照フレーム番号も符号化する必要がある。このため、動き情報及び参照フレーム番号に関する符号量が増大する場合がある。また、参照フレームの動き情報メモリに格納されている動き情報を参照して、符号化対象ブロックの予測動き情報を導出する動き情報予測方法があり(特許文献1及び非特許文献2)、動き情報を格納する動き情報メモリの容量が増加する場合がある。   In recent years, the ITU-T and ISO / IEC jointly developed ITU-T Rec. H.264 and ISO / IEC 14496-10 (hereinafter referred to as H.264) jointly with ITU-T and ISO / IEC. Is recommended as In H.264, prediction processing, conversion processing, and entropy coding processing are performed in rectangular block units (for example, 16 × 16 pixel block units, 8 × 8 pixel block units, etc.). In the prediction processing, motion compensation is performed to perform prediction in the time direction with reference to a frame (reference frame) that has already been coded for a rectangular block to be coded (coding target block). In such motion compensation, it is necessary to encode motion information including a motion vector as spatial shift information between a current block to be encoded and a block referenced in a reference frame and send it to the decoding side. Furthermore, when motion compensation is performed using a plurality of reference frames, it is necessary to encode reference frame numbers as well as motion information. For this reason, the code amount regarding motion information and a reference frame number may increase. Also, there is a motion information prediction method for deriving prediction motion information of a coding target block with reference to motion information stored in motion information memory of a reference frame (Patent Document 1 and Non-patent Document 2), The capacity of the motion information memory for storing may be increased.

動き情報メモリの容量を削減する方法の一例として、(非特許文献2)では、予め定められたブロック内で代表する動き情報を導出し、代表する動き情報のみを動き情報メモリに格納する。   As an example of a method of reducing the capacity of the motion information memory, (Non-Patent Document 2) derives motion information that is represented in a predetermined block, and stores only the represented motion information in the motion information memory.

特許第4020789号Patent No. 4020789 J. Jung et al, “Temporal MV predictor modification for MV-Comp, Skip, Direct and Merge schemes”, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 Document, JCTVC-D164, January 20110.J. Jung et al, “Temporal MV predictor modification for MV-Comp, Skip, Direct and Merge schemes”, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO / IEC JTC1 / SC29 / WG11 Document, JCTVC-D164, January 20110. Yeping Su et al, “CE9: Reduced resolution storage of motion vector data”, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 Document, JCTVC-D072, January 20110.Yeping Su et al, “CE9: Reduced resolution storage of motion vector data”, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO / IEC JTC1 / SC29 / WG11 Document, JCTVC-D072, January 20110.

しかしながら、非特許文献1で示される予測動き情報の導出方法と非特許文献2で示される代表動き情報の導出方法が異なる場合に、予測動き情報の時間相関が低減するために、動き情報に関する符号量が増加される問題がある。   However, when the derivation method of predicted motion information shown in Non-Patent Document 1 and the derivation method of representative motion information shown in Non-Patent Document 2 are different, a code related to motion information is reduced because temporal correlation of the predicted motion information is reduced. There is a problem that the amount is increased.

本発明が解決しようとする課題は、上記問題点を解決するためになされたものであり、符号化効率を向上可能な動き情報圧縮装置を含んだ動画像符号化装置及び動画像復号化装置を提供することである。   The problem to be solved by the present invention is to solve the above problems, and a moving picture coding apparatus and a moving picture decoding apparatus including a motion information compression apparatus capable of improving the coding efficiency. It is to provide.

実施形態によれば、動画像符号化方法は、入力画像信号を画素ブロックに分割し、これら分割した画素ブロックに対してインター予測を行う方法である。この方法は、符号化済み領域における動き情報を保持する動き情報バッファの中から、予測動き情報を選択し、前記予測動き情報を用いて、符号化対象ブロックの動き情報を予測することを含み。さらに、この方法は符号化が終了した領域内の複数の動き情報の中から、前記予測動き情報の選択方法を示す第1情報に従って代表動き情報を取得し、前記代表動き情報のみを得ることを含む。   According to the embodiment, the moving picture coding method is a method of dividing an input image signal into pixel blocks and performing inter prediction on the divided pixel blocks. The method includes: selecting prediction motion information from a motion information buffer that holds motion information in a coded area; and predicting motion information of a current block to be coded using the prediction motion information. Furthermore, this method obtains representative motion information from a plurality of pieces of motion information in the region where encoding is completed according to first information indicating a method for selecting the predicted motion information, and obtains only the representative motion information. Including.

第1の実施形態に係る画像符号化装置の構成を概略的に示すブロック図。FIG. 1 is a block diagram schematically showing a configuration of an image coding apparatus according to a first embodiment. 画素ブロックの予測符号化順の説明図。Explanatory drawing of the prediction encoding order of a pixel block. 画素ブロックサイズの一例の説明図。Explanatory drawing of an example of pixel block size. 画素ブロックサイズの別の例の説明図。Explanatory drawing of another example of pixel block size. 画素ブロックサイズの別の例の説明図。Explanatory drawing of another example of pixel block size. コーディングツリーユニットにおける画素ブロックの一例の説明図。Explanatory drawing of an example of the pixel block in a coding tree unit. コーディングツリーユニットにおける画素ブロックの別の例の説明図。Explanatory drawing of another example of the pixel block in a coding tree unit. コーディングツリーユニットにおける画素ブロックの別の例の説明図。Explanatory drawing of another example of the pixel block in a coding tree unit. コーディングツリーユニットにおける画素ブロックの別の例の説明図。Explanatory drawing of another example of the pixel block in a coding tree unit. 図1のエントロピー符号化部の構成を概略的に示すブロック図。FIG. 2 is a block diagram schematically showing the configuration of the entropy coding unit of FIG. 1; 図1の動き情報メモリの構成を概略的に示す説明図。FIG. 2 is an explanatory view schematically showing a configuration of a motion information memory of FIG. 1; 図1のインター予測部が実行するインター予測処理の一例の説明図。Explanatory drawing of an example of the inter prediction process which the inter estimation part of FIG. 1 performs. 図1のインター予測部が実行するインター予測処理の別の例の説明図。Explanatory drawing of another example of the inter prediction process which the inter estimation part of FIG. 1 performs. プレディクションユニットの一例の説明図。Explanatory drawing of an example of a prediction unit. プレディクションユニットの別の例の説明図。Explanatory drawing of another example of a prediction unit. プレディクションユニットの別の例の説明図。Explanatory drawing of another example of a prediction unit. プレディクションユニットの別の例の説明図。Explanatory drawing of another example of a prediction unit. プレディクションユニットの別の例の説明図。Explanatory drawing of another example of a prediction unit. プレディクションユニットの別の例の説明図。Explanatory drawing of another example of a prediction unit. プレディクションユニットの別の例の説明図。Explanatory drawing of another example of a prediction unit. スキップモード、マージモード、インターモードを示す説明図。Explanatory drawing which shows skip mode, merge mode, and inter mode. 図4の動き情報符号化部の構成を概略的に示すブロック図。FIG. 5 is a block diagram schematically showing a configuration of a motion information coding unit of FIG. 4; 符号化対象プレディクションユニットに対する、予測動き情報候補の位置の例を示す説明図。Explanatory drawing which shows the example of the position of a prediction motion information candidate with respect to an encoding target prediction unit. 符号化対象プレディクションユニットに対する、予測動き情報候補の位置の更に別の例を示す説明図。Explanatory drawing which shows another example of the position of a prediction motion information candidate with respect to an encoding target prediction unit. 複数の予測動き情報候補のブロック位置とインデクスMvpidxの関係を示すリストの例を示す説明図。Explanatory drawing which shows the example of the list | wrist which shows the relationship between the block position of several prediction motion information candidate, and index Mvpidx. 符号化対象プレディクションユニットのサイズが32x32の場合の、プレディクションユニットの中心を示す参照動き情報取得位置の例を示す説明図。Explanatory drawing which shows the example of the reference motion information acquisition position which shows the center of a prediction unit in case the size of a coding object prediction unit is 32x32. 符号化対象プレディクションユニットのサイズが32x16の場合の、プレディクションユニットの中心を示す参照動き情報取得位置の例を示す説明図。Explanatory drawing which shows the example of the reference motion information acquisition position which shows the center of a prediction unit in case the size of a coding object prediction unit is 32x16. 符号化対象プレディクションユニットのサイズが16x32の場合の、プレディクションユニットの中心を示す参照動き情報取得位置の例を示す説明図。Explanatory drawing which shows the example of the reference motion information acquisition position which shows the center of a prediction unit in case the size of a coding object prediction unit is 16x32. 符号化対象プレディクションユニットのサイズが16x16の場合の、プレディクションユニットの中心を示す参照動き情報取得位置の例を示す説明図。Explanatory drawing which shows the example of the reference motion information acquisition position which shows the center of a prediction unit in case the size of a coding object prediction unit is 16x16. 符号化対象プレディクションユニットのサイズが16x8の場合の、プレディクションユニットの中心を示す参照動き情報取得位置の例を示す説明図。Explanatory drawing which shows the example of the reference motion information acquisition position which shows the center of a prediction unit in case the size of a coding object prediction unit is 16x8. 符号化対象プレディクションユニットのサイズが8x16の場合の、プレディクションユニットの中心を示す参照動き情報取得位置の例を示す説明図。Explanatory drawing which shows the example of the reference motion information acquisition position which shows the center of a prediction unit in case the size of a coding object prediction unit is 8x16. 符号化対象プレディクションユニットのサイズが32x32の場合の、プレディクションユニットの中心を示す参照動き情報取得位置の更に別の例を示す説明図。FIG. 14 is an explanatory diagram showing still another example of the reference motion information acquisition position indicating the center of the prediction unit when the size of the encoding target prediction unit is 32 × 32; 符号化対象プレディクションユニットのサイズが32x16の場合の、プレディクションユニットの中心を示す参照動き情報取得位置の更に別の例を示す説明図。FIG. 14 is an explanatory diagram showing still another example of the reference motion information acquisition position indicating the center of the prediction unit when the size of the encoding target prediction unit is 32 × 16. 符号化対象プレディクションユニットのサイズが16x32の場合の、プレディクションユニットの中心を示す参照動き情報取得位置の更に別の例を示す説明図。FIG. 14 is an explanatory diagram showing still another example of the reference motion information acquisition position indicating the center of the prediction unit when the size of the encoding target prediction unit is 16 × 32. 符号化対象プレディクションユニットのサイズが16x16の場合の、プレディクションユニットの中心を示す参照動き情報取得位置の更に別の例を示す説明図。FIG. 14 is an explanatory diagram showing still another example of the reference motion information acquisition position indicating the center of the prediction unit when the size of the encoding target prediction unit is 16 × 16. 符号化対象プレディクションユニットのサイズが16x8の場合の、プレディクションユニットの中心を示す参照動き情報取得位置の更に別の例を示す説明図。FIG. 14 is an explanatory diagram showing still another example of the reference motion information acquisition position indicating the center of the prediction unit when the size of the encoding target prediction unit is 16 × 8. 符号化対象プレディクションユニットのサイズが8x16の場合の、プレディクションユニットの中心を示す参照動き情報取得位置の更に別の例を示す説明図。FIG. 14 is an explanatory diagram showing still another example of the reference motion information acquisition position indicating the center of the prediction unit when the size of the encoding target prediction unit is 8 × 16. 空間方向参照動き情報メモリ501及び時間方向参照動き情報メモリ502に関する説明図。Explanatory drawing regarding space direction reference motion information memory 501 and time direction reference motion information memory 502. FIG. 図1の動き情報圧縮部の動作の一例を示すフローチャート。6 is a flowchart showing an example of the operation of the motion information compression unit of FIG. 1; 符号化対象プレディクションユニットのサイズが32x32の場合の、プレディクションユニットの左上端を示す参照動き情報取得位置の例を示す説明図。Explanatory drawing which shows the example of the reference motion information acquisition position which shows the upper left end of a prediction unit in case the size of a coding object prediction unit is 32x32. 符号化対象プレディクションユニットのサイズが32x16の場合の、プレディクションユニットの左上端を示す参照動き情報取得位置の例を示す説明図。Explanatory drawing which shows the example of the reference motion information acquisition position which shows the upper left end of a prediction unit in case the size of a coding object prediction unit is 32x16. 符号化対象プレディクションユニットのサイズが16x32の場合の、プレディクションユニットの左上端を示す参照動き情報取得位置の例を示す説明図。Explanatory drawing which shows the example of the reference motion information acquisition position which shows the upper left end of a prediction unit in case the size of a coding object prediction unit is 16x32. 符号化対象プレディクションユニットのサイズが16x16の場合の、プレディクションユニットの左上端を示す参照動き情報取得位置の例を示す説明図。Explanatory drawing which shows the example of the reference motion information acquisition position which shows the upper left end of a prediction unit in case the size of a coding object prediction unit is 16x16. 符号化対象プレディクションユニットのサイズが16x8の場合の、プレディクションユニットの左上端を示す参照動き情報取得位置の例を示す説明図。Explanatory drawing which shows the example of the reference motion information acquisition position which shows the upper left end of a prediction unit in case the size of a coding object prediction unit is 16x8. 符号化対象プレディクションユニットのサイズが8x16の場合の、プレディクションユニットの左上端を示す参照動き情報取得位置の例を示す説明図。Explanatory drawing which shows the example of the reference motion information acquisition position which shows the upper left end of a prediction unit in case the size of a coding object prediction unit is 8x16. 代表動き情報位置の例を示す説明図。Explanatory drawing which shows the example of a representative motion information position. 代表動き情報位置の別の例を示す説明図。Explanatory drawing which shows another example of a representative motion information position. 各プレディクションサイズにおけるプレディクションユニットの中心の例を示す説明図。Explanatory drawing which shows the example of the center of the prediction unit in each prediction size. 動き情報圧縮ブロック毎の複数の参照動き情報取得位置の重心を代表動き情報位置と設定した場合の代表動き情報位置の例を示す説明図。Explanatory drawing which shows the example of the representative motion information position at the time of setting the gravity center of several reference motion information acquisition positions for every motion information compression block as a representative motion information position. 動き情報圧縮ブロック毎の複数の参照動き情報取得位置の重心を代表動き情報位置と設定した場合の代表動き情報位置の別例を示す説明図。The explanatory view showing another example of the representative motion information position at the time of setting the gravity center of a plurality of reference motion information acquisition positions for every motion information compression block as a representative motion information position. 代表動き情報位置の例を示す説明図。Explanatory drawing which shows the example of a representative motion information position. 代表動き情報位置の別の例を示す説明図。Explanatory drawing which shows another example of a representative motion information position. 一実施形態に従うシンタクス構造を示す図である。FIG. 2 shows a syntax structure according to one embodiment. 一実施形態に従うシーケンスパラメータセットシンタクスの一例を示す図である。FIG. 7 is a diagram illustrating an example of sequence parameter set syntax according to an embodiment. 一実施形態に従うシーケンスパラメータセットシンタクスの別例を示す図である。FIG. 7 is a diagram showing another example of sequence parameter set syntax according to one embodiment. 一実施形態に従うプレディクションユニットシンタクスの一例を示す図である。FIG. 7 is a diagram illustrating an example of a prediction unit syntax according to an embodiment. 第2の実施形態に係る画像復号化装置を概略的に示すブロック図。FIG. 7 is a block diagram schematically showing an image decoding apparatus according to a second embodiment. 図25のエントロピー復号化部を概略的に示すブロック図。FIG. 26 is a block diagram schematically illustrating the entropy decoding unit of FIG. 25. 図26の動き情報復号化部を概略的に示すブロック図。FIG. 27 is a block diagram schematically showing the motion information decoding unit of FIG. 26.

以下、図面を参照して、各実施形態に係る動画像符号化装置及び動画像復号化装置について詳細に説明する。なお、以降の説明において、「画像」という用語は、「映像」「画素」「画像信号」、「画像データ」などの用語として適宜読み替えることができる。また、以下の実施形態では、同一の番号を付した部分については同様の動作を行うものとして、重ねての説明を省略する。
(第1の実施形態)
第1の実施形態は画像符号化装置に関する。本実施形態に係る画像符号化装置に対応する動画像復号化装置は、第2の実施形態において説明する。この画像符号化装置は、LSI(Large-Scale Integration)チップやDSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)などのハードウェアにより実現可能である。また、この画像符号化装置は、コンピュータに画像符号化プログラムを実行させることによっても実現可能である。
Hereinafter, with reference to the drawings, a moving picture coding apparatus and a moving picture decoding apparatus according to each embodiment will be described in detail. In the following description, the term "image" can be appropriately read as a term such as "image", "pixel", "image signal", "image data" and the like. Further, in the following embodiments, the same operation is performed for the portions given the same numbers, and the overlapping description will be omitted.
First Embodiment
The first embodiment relates to an image coding apparatus. A moving picture decoding apparatus corresponding to the picture coding apparatus according to the present embodiment will be described in the second embodiment. This image coding apparatus can be realized by hardware such as a large-scale integration (LSI) chip, a digital signal processor (DSP), or a field programmable gate array (FPGA). The image coding apparatus can also be realized by causing a computer to execute an image coding program.

図1に示すように、本実施形態に係る画像符号化装置100は、減算部101、直交変換部102、量子化部103、逆量子化部104、逆直交変換部105、加算部106、参照画像メモリ107、インター予測部108、動き情報圧縮部109、動き情報メモリ110、及びエントロピー符号化部112を含む。符号化制御部114、及び出力バッファ113は通常、画像符号化装置100の外部に設置される。   As shown in FIG. 1, the image coding apparatus 100 according to this embodiment includes a subtraction unit 101, an orthogonal transformation unit 102, a quantization unit 103, an inverse quantization unit 104, an inverse orthogonal transformation unit 105, an addition unit 106, and It includes an image memory 107, an inter prediction unit 108, a motion information compression unit 109, a motion information memory 110, and an entropy coding unit 112. The encoding control unit 114 and the output buffer 113 are usually installed outside the image encoding device 100.

図1の画像符号化装置100は、入力画像信号151を構成する各フレームまたは各フィールドまたは各スライスを複数の画素ブロックに分割し、これら分割した画素ブロックに対して予測符号化を行って、符号化データ163を出力する。以降の説明では、簡単化のために、図2Aに示されるように左上から右下に向かって画素ブロックの予測符号化が行われることを仮定する。図2Aでは、符号化処理対象のフレームfにおいて、符号化対象画素ブロックcよりも左側及び上側に符号化済み画素ブロックpが位置している。   The image coding apparatus 100 of FIG. 1 divides each frame or each field or each slice constituting the input image signal 151 into a plurality of pixel blocks, performs predictive coding on these divided pixel blocks, and Output the encoded data 163. In the following description, for the sake of simplicity, it is assumed that predictive coding of pixel blocks is performed from upper left to lower right as shown in FIG. 2A. In FIG. 2A, in the frame f to be encoded, the encoded pixel block p is located on the left and upper sides of the pixel block c to be encoded.

ここで、画素ブロックは、例えば、M×Nサイズのブロック(N及びMは自然数)、コーディングユニット、マクロブロック、サブブロック、1画素などの画像を処理する単位を指す。なお、以降の説明では、画素ブロックをコーディングユニットの意味で基本的に使用するが、説明を適宜読み替えることにより画素ブロックを上述した意味で解釈することも可能である。コーディングユニットは、典型的には、例えば図2Bに示す16×16画素ブロックであるが、図2Cに示す32×32画素ブロック、図2Dに示す64×64画素ブロックであってもよいし、図示しない8×8画素ブロック、4×4画素ブロックであってもよい。また、コーディングユニットは必ずしも正方形である必要はない。以下、入力画像信号151の符号化対象ブロックもしくはコーディングニットを「予測対象ブロック」と称することもある。また、符号化単位には、コーディングユニットのような画素ブロックに限らず、フレームまたはフィールド、スライス、或いはこれらの組み合わせを用いることができる。   Here, a pixel block refers to a unit that processes an image, for example, a block of M × N size (N and M are natural numbers), a coding unit, a macroblock, a subblock, and one pixel. In the following description, a pixel block is basically used in the meaning of a coding unit, but it is also possible to interpret the pixel block in the above-mentioned meaning by appropriately changing the explanation. The coding unit is typically, for example, a 16 × 16 pixel block shown in FIG. 2B, but may be a 32 × 32 pixel block shown in FIG. 2C or a 64 × 64 pixel block shown in FIG. 2D. Alternatively, it may be an 8 × 8 pixel block or 4 × 4 pixel block. Also, the coding unit does not have to be square. Hereinafter, the encoding target block or coding unit of the input image signal 151 may be referred to as a “prediction target block”. Further, the coding unit is not limited to the pixel block such as the coding unit, and a frame or a field, a slice, or a combination thereof can be used.

図3Aから図3Dまでは、コーディングユニットの具体例を示した図である。図3Aは、コーディングユニットのサイズが64×64(N=32)の場合の例を示している。ここでNは、基準となるコーディングユニットのサイズを表しており、分割された場合のサイズをNと定義し、分割されない場合を2Nと定義する。コーディングツリーユニットは四分木構造を持ち、分割された場合は、4つの画素ブロックに対してZスキャン順でインデックスが付される。図3Bに、図3Aの64x64画素ブロックを四分木分割した例を示す。図中に示される番号がZスキャンの順番を表している。また、コーディングユニットの1つの四分木のインデックス内でさらに四分木分割することが可能である。分割の深さをDepthで定義する。つまり、図3AはDepth=0の例を示している。図3CにDepth=1の場合の32×32(N=16)サイズのコーディングツリーユニットの例を示す。このようなコーディングツリーユニットの最も大きいユニットをラージコーディングツリーユニット若しくはツリーブロックと呼び、図2Aに示すように、この単位で入力画像信号がラスタースキャン順に符号化される。   3A to 3D are diagrams showing specific examples of the coding unit. FIG. 3A shows an example in the case where the size of the coding unit is 64 × 64 (N = 32). Here, N represents the size of the coding unit serving as a reference, and the size of the divided case is defined as N, and the case of not divided is defined as 2N. The coding tree unit has a quadtree structure, and when divided, four pixel blocks are indexed in Z scan order. FIG. 3B shows an example in which the 64 × 64 pixel block of FIG. 3A is divided into quadtrees. The numbers shown in the figure represent the order of the Z scan. It is also possible to further divide into quadtrees within the index of one quadtree of the coding unit. Define the depth of division with Depth. That is, FIG. 3A shows an example of Depth = 0. FIG. 3C shows an example of a 32 × 32 (N = 16) -sized coding tree unit in the case of Depth = 1. The largest unit of such a coding tree unit is called a large coding tree unit or tree block, and as shown in FIG. 2A, the input image signal is encoded in raster scan order in this unit.

図1の画像符号化装置100は、符号化制御部114から入力される符号化パラメータに基づいて、画素ブロックに対するインター予測(画面間予測、フレーム間予測、動き補償予測などとも称される)または図示されないイントラ予測(画面内予測、フレーム内予測などとも称される)を行って、予測画像信号159を生成する。この画像符号化装置100は、画素ブロック(入力画像信号151)と予測画像信号159との間の予測誤差信号152を直交変換及び量子化し、エントロピー符号化を行って符号化データ163を生成して出力する。   The image coding apparatus 100 of FIG. 1 performs inter prediction (also referred to as inter-frame prediction, inter-frame prediction, motion compensation prediction, or the like) on pixel blocks based on the coding parameters input from the coding control unit 114 or Intra prediction (not shown) (also referred to as intra prediction, intra prediction, etc.) is performed to generate a predicted image signal 159. The image coding apparatus 100 orthogonally transforms and quantizes a prediction error signal 152 between a pixel block (input image signal 151) and a predicted image signal 159, performs entropy coding, and generates coded data 163. Output.

図1の画像符号化装置100は、ブロックサイズ及び予測画像信号159の生成方法の異なる複数の予測モードを選択的に適用して符号化を行う。予測画像信号159の生成方法は、大別すると、符号化対象フレーム内で予測を行うイントラ予測と、時間的に異なる1つまたは複数の参照フレームを用いて予測を行うインター予測との2種類である。   The image coding apparatus 100 of FIG. 1 performs coding by selectively applying a plurality of prediction modes having different block sizes and a method of generating a predicted image signal 159. The method of generating the predicted image signal 159 can be roughly classified into two types: intra prediction that performs prediction within a coding target frame and inter prediction that performs prediction using one or more reference frames that differ in time. is there.

以下、図1の画像符号化装置100に含まれる各要素を説明する。
減算部101は、入力画像信号151の符号化対象ブロックから、対応する予測画像信号159を減算して予測誤差信号152を得る。減算部101は、予測誤差信号152を直交変換部102に入力する。
Hereinafter, each element included in the image coding apparatus 100 of FIG. 1 will be described.
The subtraction unit 101 subtracts the corresponding predicted image signal 159 from the encoding target block of the input image signal 151 to obtain a prediction error signal 152. The subtraction unit 101 inputs the prediction error signal 152 to the orthogonal transformation unit 102.

直交変換部102は、減算部101からの予測誤差信号152に対して、例えば離散コサイン変換(DCT)のような直交変換を行い、変換係数153を得る。直交変換部102は、変換係数153を量子化部103に出力する。   The orthogonal transformation unit 102 performs orthogonal transformation such as discrete cosine transformation (DCT) on the prediction error signal 152 from the subtraction unit 101 to obtain a transformation coefficient 153. The orthogonal transform unit 102 outputs the transform coefficient 153 to the quantization unit 103.

量子化部103は、直交変換部102からの変換係数153に対して量子化を行い、量子化変換係数154を得る。具体的には、量子化部103は、符号化制御部114によって指定される量子化パラメータ、量子化マトリクスなどの量子化情報に従って量子化を行う。量子化パラメータは、量子化の細かさを示す。量子化マトリクスは、量子化の細かさを変換係数の成分毎に重み付けするために使用されるが、量子化マトリクスの使用・不使用は本発明の実施形態の本質部分ではない。量子化部103は、量子化変換係数154をエントロピー符号化部112及び逆量子化部104に出力する。   The quantization unit 103 quantizes the transform coefficient 153 from the orthogonal transform unit 102 to obtain a quantized transform coefficient 154. Specifically, the quantization unit 103 performs the quantization in accordance with the quantization parameter designated by the coding control unit 114 and the quantization information such as the quantization matrix. The quantization parameter indicates the granularity of the quantization. The quantization matrix is used to weight the granularity of the quantization for each component of the transform coefficient, but the use or non-use of the quantization matrix is not an essential part of the embodiment of the present invention. The quantization unit 103 outputs the quantization transformation coefficient 154 to the entropy coding unit 112 and the dequantization unit 104.

エントロピー符号化部112は、量子化部103からの量子化変換係数154、インター予測部108からの動き情報160、符号化制御部114によって指定される予測情報165、符号化制御部114からの参照位置情報164、量子化情報などの様々な符号化パラメータに対してエントロピー符号化(例えば、ハフマン符号化、算術符号化など)を行い、符号化データ163を生成する。なお、符号化パラメータとは、予測情報165、変換係数に関する情報、量子化に関する情報、などの復号に必要となるパラメータである。例えば、符号化制御部114が内部メモリ(図示しない)を持ち、このメモリに符号化パラメータが保持され、予測対象ブロックを符号化する際に隣接する既に符号化済みの画素ブロックの符号化パラメータを用いる。   The entropy coding unit 112 includes the quantization transform coefficient 154 from the quantization unit 103, the motion information 160 from the inter prediction unit 108, the prediction information 165 specified by the coding control unit 114, and the reference from the coding control unit 114. Entropy coding (eg, Huffman coding, arithmetic coding, etc.) is performed on various coding parameters such as position information 164 and quantization information to generate coded data 163. The coding parameters are parameters necessary for decoding the prediction information 165, information on transform coefficients, information on quantization, and the like. For example, the encoding control unit 114 has an internal memory (not shown), the encoding parameter is held in this memory, and the encoding parameter of the already encoded pixel block adjacent to the prediction target block is encoded. Use.

具体的には、エントロピー符号化部112は、図4に示すように、パラメータ符号化部401、変換係数符号化部402、動き情報符号化部403、並びに多重化部404を備える。パラメータ符号化部401は、符号化制御部114から受け取った予測情報165などの符号化パラメータを符号化して符号化データ451Aを生成する。変換係数符号化部402は、量子化部103から受け取った量子化後の変換係数154を符号化して符号化データ451Bを生成する。   Specifically, as shown in FIG. 4, the entropy coding unit 112 includes a parameter coding unit 401, a transform coefficient coding unit 402, a motion information coding unit 403, and a multiplexing unit 404. The parameter coding unit 401 codes coding parameters such as the prediction information 165 received from the coding control unit 114 to generate coded data 451A. Transform coefficient coding section 402 encodes quantized transform coefficient 154 received from quantization section 103 to generate encoded data 451B.

動き情報符号化部403は、動き情報メモリ110から受け取った参照動き情報166、符号化制御部114から受け取った参照位置情報164を参照して、インター予測部108から受け取った動き情報160を符号化して符号化データ451Cを生成する。動き情報符号化部403に関してはその詳細を後述する。   The motion information coding unit 403 refers to the reference motion information 166 received from the motion information memory 110 and the reference position information 164 received from the coding control unit 114, and encodes the motion information 160 received from the inter prediction unit 108. To generate encoded data 451C. The details of the motion information encoding unit 403 will be described later.

多重化部404は、符号化データ451A、451B、451Cを多重化して符号化データ163を生成する。生成された符号化データ163は、動き情報160、予測情報165とともに、変換係数に関する情報、量子化に関する情報などの復号の際に必要になるあらゆるパラメータを含む。   The multiplexing unit 404 multiplexes the encoded data 451A, 451B, and 451C to generate encoded data 163. The generated encoded data 163 includes the motion information 160, the prediction information 165, and all parameters necessary for decoding of information on transform coefficients, information on quantization, and the like.

エントロピー符号化部112によって生成された符号化データ163は、例えば多重化を経て出力バッファ113に一時的に蓄積され、符号化制御部114が管理する適切な出力タイミングに従って符号化データ163として出力される。符号化データ163は、例えば、図示しない蓄積系(蓄積メディア)または伝送系(通信回線)へ出力される。   The encoded data 163 generated by the entropy encoding unit 112 is temporarily accumulated, for example, in the output buffer 113 through multiplexing, and is output as the encoded data 163 in accordance with the appropriate output timing managed by the encoding control unit 114. Ru. The encoded data 163 is output to, for example, a storage system (storage medium) or a transmission system (communication line) (not shown).

逆量子化部104は、量子化部103からの量子化変換係数154に対して逆量子化を行い、復元変換係数155を得る。具体的には、逆量子化部104は、量子化部103において使用された量子化情報に従って逆量子化を行う。量子化部103において使用された量子化情報は、符号化制御部114の内部メモリからロードされる。逆量子化部104は、復元変換係数155を逆直交変換部105に出力する。   The inverse quantization unit 104 inversely quantizes the quantized transformation coefficient 154 from the quantization unit 103 to obtain a reconstructed transformation coefficient 155. Specifically, the inverse quantization unit 104 performs inverse quantization in accordance with the quantization information used in the quantization unit 103. The quantization information used in the quantization unit 103 is loaded from the internal memory of the coding control unit 114. The inverse quantization unit 104 outputs the reconstruction transform coefficient 155 to the inverse orthogonal transform unit 105.

逆直交変換部105は、逆量子化部104からの復元変換係数155に対して、例えば逆離散コサイン変換などのような直交変換部102において行われた直交変換に対応する逆直交変換を行い、復元予測誤差信号156を得る。逆直交変換部105は、復元予測誤差信号156を加算部106に出力する。   The inverse orthogonal transformation unit 105 performs inverse orthogonal transformation corresponding to orthogonal transformation performed in the orthogonal transformation unit 102, such as inverse discrete cosine transformation, on the restoration transformation coefficient 155 from the inverse quantization unit 104, for example. A reconstructed prediction error signal 156 is obtained. The inverse orthogonal transform unit 105 outputs the restored prediction error signal 156 to the addition unit 106.

加算部106は、復元予測誤差信号156と、対応する予測画像信号159とを加算し、局所的な復号画像信号157を生成する。復号画像信号157は図示しないデブロッキングフィルタやウィナーフィルタなどを施し、参照画像メモリ107へと入力される。   The addition unit 106 adds the restored prediction error signal 156 and the corresponding predicted image signal 159 to generate a local decoded image signal 157. The decoded image signal 157 is subjected to a deblocking filter or a Wiener filter (not shown) and input to the reference image memory 107.

参照画像メモリ107は、メモリに局部復号後の被フィルタ画像信号158を蓄積しておりインター予測部108によって必要に応じて予測画像を生成する際に、参照画像信号158として参照される。   The reference image memory 107 stores the to-be-filtered image signal 158 after local decoding in the memory, and is referred to as the reference image signal 158 when the inter prediction unit 108 generates a prediction image as needed.

インター予測部108は、参照画像メモリ107に保存されている参照画像信号158を利用してインター予測を行う。具体的には、インター予測部108は、予測対象ブロックと参照画像信号158との間でブロックマッチング処理を行って動きのズレ量(動きベクトル)を導出する。インター予測部108は、この動きベクトルに基づいて動き補償(小数精度の動きの場合は補間処理)を行ってインター予測画像を生成する。H.264では、1/4画素精度までの補間処理が可能である。導出された動きベクトルは動き情報160の一部としてエントロピー符号化される。   The inter prediction unit 108 performs inter prediction using the reference image signal 158 stored in the reference image memory 107. Specifically, the inter prediction unit 108 performs block matching processing between the block to be predicted and the reference image signal 158 to derive the amount of movement shift (motion vector). The inter prediction unit 108 performs motion compensation (interpolation processing in the case of motion with decimal precision) based on the motion vector to generate an inter prediction image. H. In H.264, interpolation processing to 1/4 pixel accuracy is possible. The derived motion vector is entropy encoded as part of motion information 160.

動き情報メモリ110は、動き情報圧縮部109を有し、動き情報160に対して適宜圧縮処理を行い情報量を削減し、参照動き情報166として一時的に格納する。図5に示されるように、動き情報メモリ110がフレーム(またはスライス)単位で保持されており、同一フレーム上の動き情報160を参照動き情報166として格納する空間方向参照動き情報メモリ501及び、既に符号化が終了したフレームの動き情報160を参照動き情報166として格納する時間方向参照動き情報メモリ502を更に有する。時間方向参照動き情報メモリ502は符号化対象フレームが予測に用いる参照フレームの数に応じて、複数有しても構わない。   The motion information memory 110 includes a motion information compression unit 109, appropriately performs compression processing on the motion information 160, reduces the amount of information, and temporarily stores the information as reference motion information 166. As shown in FIG. 5, a spatial direction reference motion information memory 501 in which motion information memory 110 is held in frame (or slice) units and stores motion information 160 on the same frame as reference motion information 166, and It further includes a time direction reference motion information memory 502 that stores motion information 160 of the frame for which encoding has been completed as reference motion information 166. The temporal direction reference motion information memory 502 may have a plurality of encoding target frames according to the number of reference frames used for prediction.

また、空間方向参照動き情報メモリ501及び時間方向参照動き情報メモリ502は、物理的に同一のメモリを論理的に区切っても構わない。更に、空間方向参照動き情報メモリ501は、現在符号化を行っているフレームで必要な空間方向動き情報のみを保持し、参照が不要となった空間方向動き情報を順次圧縮して時間方向参照動き情報メモリ502に格納しても構わない。   Also, the spatial direction reference motion information memory 501 and the temporal direction reference motion information memory 502 may logically divide the physically same memory. Furthermore, the spatial direction reference motion information memory 501 holds only the spatial direction motion information necessary for the frame currently being encoded, sequentially compresses the spatial direction motion information for which no reference is required, and performs temporal direction reference motion. It may be stored in the information memory 502.

参照動き情報166は、所定の領域単位(例えば、4×4画素ブロック単位)で空間方向参照動き情報メモリ501及び時間方向参照動き情報メモリ502内に保持される。参照動き情報166は、その領域が後述するインター予測で符号化されたのか或いは後述するイントラ予測で符号化されたのかを示す情報をさらに有する。また、コーディングユニット(又はプレディクションユニット)がH.264で規定されるスキップモード、ダイレクトモード若しくは後述するマージモードのように、動き情報160内の動きベクトルの値が符号化されず、符号化済みの領域から予測された動き情報160を用いてインター予測される場合においても、当該コーディングユニット(又はプレディクションユニット)の動き情報が参照動き情報166として保持される。   The reference motion information 166 is held in the space direction reference motion information memory 501 and the time direction reference motion information memory 502 in predetermined area units (for example, 4 × 4 pixel block units). The reference motion information 166 further includes information indicating whether the region is encoded by inter prediction described later or encoded by intra prediction described later. In addition, the coding unit (or prediction unit) is H. As in the skip mode, the direct mode or the merge mode described later, the value of the motion vector in the motion information 160 is not encoded, and the motion information 160 predicted from the encoded area is used for inter Even when predicted, motion information of the coding unit (or prediction unit) is held as reference motion information 166.

符号化対象のフレーム又はスライスの符号化処理が終了したら、当該フレームの空間方向参照動き情報メモリ501は、次に符号化処理を行うフレームに用いる時間方向参照動き情報メモリ502としてその扱いが変更される。この際、時間方向参照動き情報メモリ502のメモリ容量を削減するために、後述する動き情報圧縮部109によって圧縮された動き情報160を時間方向参照動き情報メモリ502に格納する。   When the encoding process of the frame or slice to be encoded is completed, the spatial direction reference motion information memory 501 of the frame is changed as the temporal direction reference motion information memory 502 used for the next frame to be encoded. Ru. At this time, in order to reduce the memory capacity of the time direction reference motion information memory 502, the motion information 160 compressed by the motion information compression unit 109 described later is stored in the time direction reference motion information memory 502.

予測情報165は符号化制御部114が制御する予測モードに従っており、前述のように、予測画像信号159の生成のためにインター予測または図示されないイントラ予測またはインター予測が選択可能であるが、イントラ予測及びインター予測の夫々に複数のモードがさらに選択可能である。符号化制御部114はイントラ予測及びインター予測の複数の予測モードのうちの1つを最適な予測モードとして判定し、予測情報165を設定する。   The prediction information 165 follows the prediction mode controlled by the coding control unit 114, and as described above, it is possible to select inter prediction or intra prediction not shown for generation of the predicted image signal 159, but it is possible to select A plurality of modes can be further selected for each of and inter prediction. The coding control unit 114 determines one of a plurality of prediction modes of intra prediction and inter prediction as an optimum prediction mode, and sets prediction information 165.

例えば、符号化制御部114は、次の数式(1)に示すコスト関数を用いて最適な予測モードを判定する。   For example, the coding control unit 114 determines the optimal prediction mode using the cost function shown in the following equation (1).

数式(1)(以下、簡易符号化コストと呼ぶ)において、OHは予測情報160(例えば、動きベクトル情報、予測ブロックサイズ情報)に関する符号量を示し、SADは予測対象ブロックと予測画像信号159との間の差分絶対値和(即ち、予測誤差信号152の絶対値の累積和)を示す。また、λは量子化情報(量子化パラメータ)の値に基づいて決定されるラグランジュ未定乗数を示し、Kは符号化コストを示す。数式(1)を用いる場合には、符号化コストKを最小化する予測モードが発生符号量及び予測誤差の観点から最適な予測モードとして判定される。数式(1)の変形として、OHのみまたはSADのみから符号化コストを見積もってもよいし、SADにアダマール変換を施した値またはその近似値を利用して符号化コストを見積もってもよい。   In Equation (1) (hereinafter referred to as simplified coding cost), OH indicates a code amount related to prediction information 160 (for example, motion vector information, prediction block size information), SAD indicates a prediction target block and a prediction image signal 159 The difference absolute value sum (ie, the cumulative sum of the absolute values of the prediction error signal 152) between In addition, λ indicates a Lagrange undetermined multiplier determined based on the value of quantization information (quantization parameter), and K indicates a coding cost. When Equation (1) is used, the prediction mode that minimizes the coding cost K is determined as the optimum prediction mode from the viewpoint of the generated code amount and the prediction error. As a modification of Equation (1), the coding cost may be estimated from only OH or only SAD, or the coding cost may be estimated using a value obtained by performing Hadamard transformation on SAD or an approximation thereof.

また、図示しない仮符号化ユニットを用いることにより最適な予測モードを判定することも可能である。例えば、符号化制御部114は、次の数式(2)に示すコスト関数を用いて最適な予測モードを判定する。   Moreover, it is also possible to determine the optimal prediction mode by using a temporary coding unit (not shown). For example, the coding control unit 114 determines the optimal prediction mode using the cost function shown in the following equation (2).

数式(2)において、Dは予測対象ブロックと局所復号画像との間の二乗誤差和(即ち、符号化歪)を示し、Rは予測対象ブロックと予測モードの予測画像信号159との間の予測誤差について仮符号化によって見積もられた符号量を示し、Jは符号化コストを示す。数式(2)の符号化コストJ(以後、詳細符号化コストと呼ぶ)を導出する場合には予測モード毎に仮符号化処理及び局部復号化処理が必要なので、回路規模または演算量が増大する。反面、より正確な符号化歪と符号量とに基づいて符号化コストJが導出されるので、最適な予測モードを高精度に判定して高い符号化効率を維持しやすい。なお、数式(2)の変形として、RのみまたはDのみから符号化コストを見積もってもよいし、RまたはDの近似値を利用して符号化コストを見積もってもよい。また、これらのコストを階層的に用いてもよい。符号化制御部114は、予測対象ブロックに関して事前に得られる情報(周囲の画素ブロックの予測モード、画像解析の結果など)に基づいて、数式(1)または数式(2)を用いた判定を行う予測モードの候補の数を、予め絞り込んでおいてもよい。   In Equation (2), D indicates the sum of squared errors (ie, coding distortion) between the block to be predicted and the local decoded image, and R indicates the prediction between the block to be predicted and the predicted image signal 159 in the prediction mode. Indicate the amount of code estimated for the error by provisional coding, and J indicates the coding cost. In the case of deriving the coding cost J of equation (2) (hereinafter referred to as the detailed coding cost), the circuit size or the amount of operation increases because temporary coding processing and local decoding processing are required for each prediction mode. . On the other hand, since the coding cost J is derived based on the more accurate coding distortion and the code amount, it is easy to determine the optimum prediction mode with high accuracy and maintain high coding efficiency. As a modification of Equation (2), the coding cost may be estimated from only R or D alone, or the coding cost may be estimated using an approximate value of R or D. Also, these costs may be used hierarchically. The encoding control unit 114 performs determination using Equation (1) or Equation (2) based on information (a prediction mode of surrounding pixel blocks, a result of image analysis, and the like) obtained in advance with respect to a prediction target block. The number of prediction mode candidates may be narrowed down in advance.

本実施形態の変形例として、数式(1)と数式(2)を組み合わせた二段階のモード判定を行うことで、符号化性能を維持しつつ、予測モードの候補数をさらに削減することが可能となる。ここで、数式(1)で示される簡易符号化コストは、数式(2)と異なり局部復号化処理が必要ないため、高速に演算が可能である。本実施形態の動画像符号化装置では、H.264と比較しても予測モード数が多いため、詳細符号化コストを用いたモード判定は現実的ではない。そこで、第一ステップとして、簡易符号化コストを用いたモード判定を、当該画素ブロックで利用可能な予測モードに対して行い、予測モード候補を導出する。   As a modified example of the present embodiment, by performing two-step mode determination combining Equation (1) and Equation (2), it is possible to further reduce the number of prediction mode candidates while maintaining encoding performance. It becomes. Here, the simplified coding cost represented by the equation (1) can be calculated at high speed because the local decoding process is not necessary unlike the equation (2). In the moving picture coding apparatus of the present embodiment, H.264 is used. Since the number of prediction modes is large compared to H.264, mode determination using detailed coding cost is not realistic. Therefore, as a first step, mode determination using a simple coding cost is performed on a prediction mode available for the pixel block to derive prediction mode candidates.

ここで、量子化の粗さを定めた量子化パラメータの値が大きくなるほど、簡易符号化コストと詳細符号化コストの相関が高くなる性質を利用して、予測モード候補数を変更する。   Here, the number of prediction mode candidates is changed using the property that the correlation between the simplified coding cost and the detailed coding cost increases as the value of the quantization parameter that defines the quantization roughness increases.

次に、画像符号化装置100の予測処理について説明する。
図1の画像符号化装置100には、図示していないが、複数の予測モードが用意されており、各予測モードでは、予測画像信号159の生成方法及び動き補償ブロックサイズが互いに異なる。予測部108が予測画像信号159を生成する方法としては、具体的には大きく分けて、符号化対象フレーム(又は、フィールド)の参照画像信号158を用いて予測画像を生成するイントラ予測(フレーム内予測)と、1以上の符号化済みの参照フレーム(又は、参照フィールド)の参照画像信号158を用いて予測画像を生成するインター予測(フレーム間予測)とがある。予測部108は、イントラ予測及びインター予測を選択的に切り替えて、符号化対象ブロックの予測画像信号159を生成する。
Next, the prediction processing of the image coding apparatus 100 will be described.
Although not shown, a plurality of prediction modes are prepared in the image coding apparatus 100 of FIG. 1, and in each prediction mode, the method of generating the prediction image signal 159 and the motion compensation block size are different from each other. As a method of generating the predicted image signal 159, the prediction unit 108 roughly divides the method into intra prediction (in frame, in which a predicted image is generated using the reference image signal 158 of the encoding target frame (or field). Prediction) and inter prediction (interframe prediction) in which a prediction image is generated using the reference image signal 158 of one or more encoded reference frames (or reference fields). The prediction unit 108 selectively switches between intra prediction and inter prediction to generate a predicted image signal 159 of the current block.

図6Aは、インター予測の一例を示している。インター予測は、典型的にはプレディクションユニットの単位で実行され、プレディクションユニット単位で異なる動き情報160を有することが可能となる。インター予測では、図6Aに示されるように、既に符号化が完了している参照フレーム(例えば、1フレーム前の符号化済みフレーム)内の画素ブロックであって、符号化対象のプレディクションユニットと同じ位置のブロック601から、動き情報160に含まれる動きベクトルに応じて空間的にシフトした位置のブロック602の参照画像信号158を使用して、予測画像信号159が生成される。即ち、予測画像信号159の生成では、符号化対象ブロックの位置(座標)及び動き情報160に含まれる動きベクトルで特定される、参照フレーム内のブロック602の参照画像信号158が使用される。   FIG. 6A shows an example of inter prediction. Inter prediction is typically performed in units of prediction units, and it is possible to have different motion information 160 in units of prediction units. In inter prediction, as shown in FIG. 6A, it is a pixel block in a reference frame that has already been encoded (eg, an encoded frame one frame before), and a prediction unit to be encoded and From the block 601 at the same position, the predicted image signal 159 is generated using the reference image signal 158 of the block 602 at the position spatially shifted according to the motion vector included in the motion information 160. That is, in the generation of the predicted image signal 159, the reference image signal 158 of the block 602 in the reference frame specified by the position (coordinates) of the current block and the motion vector included in the motion information 160 is used.

インター予測では、少数画素精度(例えば、1/2画素精度又は1/4画素精度)の動き補償が可能であり、参照画像信号158に対してフィルタリング処理を行うことによって、補間画素の値が生成される。例えば、H.264では、輝度信号に対して1/4画素精度までの補間処理が可能である。当該補間処理は、H.264で規定されるフィルタリングの他に、任意のフィルタリングを用いることにより実行可能である。   In inter prediction, motion compensation with low pixel accuracy (for example, 1/2 pixel accuracy or 1/4 pixel accuracy) is possible, and interpolation pixel values are generated by performing filtering processing on the reference image signal 158. Be done. For example, H. In H.264, interpolation processing up to 1⁄4 pixel accuracy is possible for luminance signals. The interpolation process is performed according to H.1. In addition to the filtering defined in H.264, it can be implemented by using arbitrary filtering.

なお、インター予測では、図6Aに示されるような1フレーム前の参照フレームを使用する例に限らず、図6Bに示されるように、いずれの符号化済みの参照フレームが使用されてもよい。時間位置が異なる複数の参照フレームの参照画像信号158が保持されている場合、どの時間位置の参照画像信号158から予測画像信号159を生成したかを示す情報は、参照フレーム番号で表わされる。参照フレーム番号は、動き情報160に含まれる。参照フレーム番号は、領域単位(ピクチャ、スライス、ブロック単位など)で変更することができる。即ち、プレディクションユニット毎に異なる参照フレームが使用されることができる。一例として、符号化済みの1フレーム前の参照フレームを予測に使用した場合、この領域の参照フレーム番号は、0に設定され、符号化済みの2フレーム前の参照フレームを予測に使用した場合、この領域の参照フレーム番号は、1に設定される。他の例として、1フレーム分だけの参照画像信号158が参照画像メモリ107に保持されている(保持されている参照フレームの数が1つのみである)場合、参照フレーム番号は、常に0に設定される。   In addition, in inter prediction, not only the example which uses the reference frame of 1 frame before as shown to FIG. 6A but as shown to FIG. 6B, any reference frame of encoded may be used. When reference image signals 158 of a plurality of reference frames having different time positions are held, information indicating which time position of the reference image signal 158 from which the predicted image signal 159 is generated is represented by a reference frame number. The reference frame number is included in the motion information 160. The reference frame number can be changed in area units (picture, slice, block units, etc.). That is, different reference frames may be used for each prediction unit. As an example, when the reference frame of 1 frame before encoding is used for prediction, the reference frame number of this area is set to 0, and when the reference frame of 2 frames before encoding is used for prediction, The reference frame number in this area is set to 1. As another example, when the reference image signal 158 for one frame is held in the reference image memory 107 (only one reference frame is held), the reference frame number is always 0. It is set.

さらに、インター予測では、予め用意される複数のプレディクションユニットのサイズの中から符号化対象ブロックに適したサイズを選択して用いることができる。例えば、図7Aから図7Gに示されるようなコーディングツリーユニットを分割して得られるプレディクションユニット毎に動き補償を行うことが可能である。また、図7F、図7Gに示されるような矩形以外に分割して得られるプレディクションユニット毎に動き補償を行うことが可能である。   Furthermore, in inter prediction, it is possible to select and use a size suitable for a target block to be coded from among sizes of a plurality of prediction units prepared in advance. For example, motion compensation can be performed for each prediction unit obtained by dividing a coding tree unit as shown in FIGS. 7A to 7G. In addition, it is possible to perform motion compensation for each prediction unit obtained by dividing it into a non-rectangular shape as shown in FIGS. 7F and 7G.

前述したように、インター予測に使用する符号化対象フレーム内の符号化済みの画素ブロック(例えば、4×4画素ブロック)の動き情報160は参照動き情報166として保持されているので、入力画像信号151の局所的な性質に従って、最適な動き補償ブロックの形状及び動きベクトル、参照フレーム番号を利用することができる。また、コーディングユニット及びプレディクションユニットは任意に組み合わせることができる。コーディングツリーユニットが64×64画素ブロックである場合、64×64画素ブロックを分割した4つのコーディングツリーユニット(32×32画素ブロック)の各々に対して、さらにコーディングツリーユニットを4つに分割することで階層的に64×64画素ブロックから16×16画素ブロックを利用することができる。同様にして、階層的に64×64画素ブロックから8×8画素ブロックを利用することができる。ここで、プレディクションユニットがコーディングツリーユニットを4つに分割したものであるとすれば、64×64画素ブロックから4×4画素ブロックまでの階層的な動き補償処理を実行することが可能となる。   As described above, since the motion information 160 of the encoded pixel block (for example, 4 × 4 pixel block) in the encoding target frame used for inter prediction is held as the reference motion information 166, the input image signal According to the local nature of 151, optimal motion compensation block shapes and motion vectors, reference frame numbers can be used. Also, the coding unit and the prediction unit can be arbitrarily combined. When the coding tree unit is a 64 × 64 pixel block, further divide the coding tree unit into four for each of four coding tree units (32 × 32 pixel blocks) obtained by dividing the 64 × 64 pixel block. Hierarchically from 64 × 64 pixel blocks to 16 × 16 pixel blocks. Similarly, hierarchically 64 × 64 pixel blocks to 8 × 8 pixel blocks can be used. Here, assuming that the prediction unit is a coding tree unit divided into four, it is possible to execute hierarchical motion compensation processing from 64 × 64 pixel blocks to 4 × 4 pixel blocks. .

また、インター予測では、符号化対象画素ブロックに対して2種類の動き補償を用いた双方向予測を実行することができる。H.264では、符号化対象画素ブロックに対し2種類の動き補償を行い、2種類の予測画像信号を加重平均することで、新しい予測画像信号を得る(図示せず)。双方向予測において2種類の動き補償をそれぞれリスト0予測、リスト1予測と称する。   Further, in inter prediction, bi-directional prediction using two types of motion compensation can be performed on a pixel block to be encoded. H. In H.264, two types of motion compensation are performed on the encoding target pixel block, and two types of predicted image signals are weighted and averaged to obtain a new predicted image signal (not shown). Two types of motion compensation in bidirectional prediction are referred to as list 0 prediction and list 1 prediction, respectively.

<スキップモード、マージモード、インターモードの説明>
本実施形態に係る画像符号化装置100は、図8に示す符号化処理の異なる複数の予測モードを使用する。図中のスキップモードは後述する予測動き情報位置954に関するシンタクスのみを符号化し、その他のシンタクスは符号化しないモードである。マージモードは予測動き情報位置954に関するシンタクス、変換係数情報153のみを符号化し、その他のシンタクスは符号化しないモードである。インターモードは、予測動き情報位置954に関するシンタクス、後述する差分動き情報953、変換係数情報153を符号化するモードである。これらのモードは符号化制御部114が制御する予測情報165によって切り替えられる。
<Description of skip mode, merge mode, inter mode>
The image coding apparatus 100 according to the present embodiment uses a plurality of prediction modes with different coding processes shown in FIG. The skip mode in the drawing is a mode in which only the syntax related to the predicted motion information position 954 described later is encoded, and the other syntax is a mode not encoded. The merge mode is a mode in which only the syntax relating to the predicted motion information position 954, the transform coefficient information 153 is encoded, and the other syntax is not encoded. The inter mode is a mode in which the syntax relating to the predicted motion information position 954, the differential motion information 953 to be described later, and the transform coefficient information 153 are encoded. These modes are switched by the prediction information 165 controlled by the coding control unit 114.

<動き情報符号化部403>
以下、動き情報符号化部403について図9を用いて説明する。
<Motion Information Encoding Unit 403>
The motion information encoding unit 403 will be described below with reference to FIG.

動き情報符号化部403は、参照動きベクトル取得部901、予測動きベクトル選択スイッチ(予測動き情報選択スイッチ、とも称す)902、減算部903、差分動き情報符号化部904、予測動き情報位置符号化部905及び多重化部906を有する。   The motion information coding unit 403 includes a reference motion vector acquisition unit 901, a predicted motion vector selection switch (also referred to as a predicted motion information selection switch) 902, a subtraction unit 903, a differential motion information coding unit 904, and predicted motion information position coding. A unit 905 and a multiplexing unit 906 are included.

参照動きベクトル取得部901は、参照動き情報166及び参照位置情報164を入力として、少なくとも一つ以上の予測動き情報候補(予測動きベクトル候補、とも称す)951(951A、951B、…)を生成する。図10、図11は、対象プレディクションユニットに対する、予測動き情報候補951の位置の一例を示している。図10は対象プレディクションユニットに空間的に隣接するプレディクションユニットの位置を示している。AX(X=0〜nA−1)は、対象プレディクションユニットに対して左に隣接するプレディクションユニット、BY(Y=0〜nB−1)は対象プレディクションユニットに対して上に隣接するプレディクションユニット、C、D、Eは対象プレディクションユニットに対してそれぞれ右上、左上、左下に隣接するプレディクションユニットを示している。また、図11は符号化対象プレディクションユニットに対して、既に符号化済みの参照フレームにおけるプレディクションユニットの位置を示している。図11中のColは、参照フレーム内であって符号化対象プレディクションユニットと同一位置にあるプレディクションユニットを示している。図12は、複数の予測動き情報候補951のブロック位置とインデクスMvpidxの関係を示すリストの一例を示す。Mvpidxが0〜2は空間方向に位置する予測動きベクトル候補951、Mvpidxが3は時間方向に位置する予測動きベクトル候補951をそれぞれ示している。プレディクションユニット位置Aは図10に示されるAXの内、インター予測である、つまり参照動き情報166を有するプレディクションユニットであって、Xの値が最も小さい位置をプレディクションユニット位置Aとする。また、プレディクションユニット位置Bは図10に示されるBYの内、インター予測である、つまり参照動き情報166を有するプレディクションユニットであって、Yの値が最も小さい位置をプレディクションユニット位置Aとする。プレディクションユニット位置Cがインター予測ではない場合、プレディクションユニット位置Dの参照動き情報166をプレディクションユニット位置Cの参照動き情報166として置き換える。プレディクションユニット位置C及びDがインター予測ではない場合、プレディクションユニット位置Eの参照動き情報166をプレディクションユニット位置Cの参照動き情報166として置き換える。   The reference motion vector acquisition unit 901 receives at least the reference motion information 166 and the reference position information 164, and generates at least one or more prediction motion information candidates (also referred to as motion motion vector candidates) 951 (951A, 951B, ...). . 10 and 11 show an example of the position of the predicted motion information candidate 951 with respect to the target prediction unit. FIG. 10 shows the position of the prediction unit spatially adjacent to the target prediction unit. AX (X = 0 to nA-1) is a prediction unit adjacent on the left with respect to the target prediction unit, and BY (Y = 0 to nB-1) is a prediment adjacent on the target prediction unit. , C, D, and E indicate the prediction units adjacent to the upper right, upper left, and lower left, respectively, with respect to the target prediction unit. Further, FIG. 11 shows the position of the prediction unit in the reference frame which has already been coded, with respect to the prediction target prediction unit. Col in FIG. 11 indicates a prediction unit in the reference frame and at the same position as the prediction unit to be coded. FIG. 12 shows an example of a list showing the relationship between block positions of a plurality of motion prediction information candidates 951 and an index Mvpidx. Mvpidx 0 to 2 indicates a motion vector predictor candidate 951 located in the space direction, and Mvpidx 3 indicates a motion vector predictor candidate 951 located in the time direction. The prediction unit position A is inter prediction among AX shown in FIG. 10, that is, the prediction unit having the reference motion information 166 and the position where the value of X is the smallest is taken as the prediction unit position A. Further, the prediction unit position B is inter prediction among BY shown in FIG. 10, that is, it is a prediction unit having the reference motion information 166 and a position where the value of Y is smallest is taken as the prediction unit position A and Do. When the prediction unit position C is not inter prediction, the reference motion information 166 of the prediction unit position D is replaced as the reference motion information 166 of the prediction unit position C. When the prediction unit positions C and D are not inter predictions, the reference motion information 166 of the prediction unit position E is replaced as the reference motion information 166 of the prediction unit position C.

符号化対象プレディクションユニットのサイズが最小プレディクションユニットより大きい場合には、プレディクションユニット位置Colは、複数の参照動き情報166を時間方向参照動き情報メモリ502に保持している可能性がある。この場合、参照位置情報164に従って位置Colのプレディクションユニット中の参照動き情報166を取得する。以降、位置Colのプレディクションユニット中の参照動き情報166の取得位置を参照動き情報取得位置と称する。図13A〜Fは、参照位置情報164が位置Colのプレディクションユニットの中心を示す場合の参照動き情報取得位置の一例を符号化対象プレディクションユニットのサイズ(32x32〜16x16)毎に示す。図中のブロックはそれぞれ4x4プレディクションユニットを示し、丸印は予測動き情報候補951として取得する4x4プレディクションユニットの位置を示している。参照動き情報取得位置の別の一例を図14A〜Fに示す。図14A〜Fにおいて、丸印の位置は4x4プレディクションユニットが存在しないため、丸印に隣接する4つの4x4プレディクションユニットにおける参照動き情報166の平均値やメディアン値といった予め定められた方式で、予測動き情報候補951を生成する。参照動き情報取得位置の更に別の一例として、位置Colのプレディクションユニットの左上端に位置する4x4プレディクションユニットの参照動き情報166を予測動き情報候補951としても構わない。上記の例以外に置いても、予め定められた方式であれば、いずれの位置及び方式を用いて予測動き情報候補951を生成しても構わない。   When the size of the encoding target prediction unit is larger than the minimum prediction unit, the prediction unit position Col may hold a plurality of pieces of reference motion information 166 in the temporal direction reference motion information memory 502. In this case, reference motion information 166 in the prediction unit at the position Col is acquired according to the reference position information 164. Hereinafter, the acquisition position of the reference motion information 166 in the prediction unit at the position Col will be referred to as a reference motion information acquisition position. 13A to 13F illustrate an example of the reference motion information acquisition position in the case where the reference position information 164 indicates the center of the prediction unit at the position Col for each size (32 × 32 to 16 × 16) of the encoding target prediction unit. Each block in the figure indicates a 4 × 4 prediction unit, and a circle indicates the position of the 4 × 4 prediction unit to be acquired as the prediction motion information candidate 951. Another example of the reference motion information acquisition position is shown in FIGS. In FIGS. 14A to 14F, since the position of the circle is not 4x4 prediction unit, the predetermined method such as the average value or the median value of the reference motion information 166 in the four 4x4 prediction units adjacent to the circle is Predictive motion information candidate 951 is generated. As another example of the reference motion information acquisition position, the reference motion information 166 of the 4x4 prediction unit located at the upper left end of the prediction unit at the position Col may be used as the prediction motion information candidate 951. Even if other than the above example, the predicted motion information candidate 951 may be generated using any position and method as long as it is a predetermined method.

なお、参照動き情報166が存在しない場合、ゼロベクトルを有する動き情報160を、予測動き情報候補951として出力する。   When the reference motion information 166 does not exist, the motion information 160 having a zero vector is output as the predicted motion information candidate 951.

以上により、少なくとも一つ以上の予測動き情報候補951が参照動きブロックから出力される。上記の予測動き情報候補951が有する参照フレーム番号と符号化対象プレディクションユニットの参照フレーム番号が異なる場合は、予測動き情報候補951を予測動き情報候補951が有する参照フレーム番号と符号化対象プレディクションユニットの参照フレーム番号に従ってスケーリングしても構わない。   By the above, at least one or more prediction motion information candidates 951 are output from the reference motion block. When the reference frame number of the prediction motion information candidate 951 is different from the reference frame number of the encoding target prediction unit, the reference frame number of the prediction motion information candidate 951 and the encoding target prediction of the prediction motion information candidate 951 It may be scaled according to the unit's reference frame number.

予測動き情報選択スイッチ902は、符号化制御部114からの指令に応じて複数の予測動き情報候補951から一つを選択し、予測動き情報952を出力する。また予測動き情報選択スイッチ902が、後述する予測動き情報位置情報954を出力してもよい。上記、選択には数式(1)や(2)といった評価関数を用いて選択しても構わない。減算部903は、動き情報160から予測動きベクトル情報952を減算し、差分動き情報953を差分動き情報符号化部904に出力する。差分動き情報符号化部904は、差分動き情報953を符号化処理し符号化データ960Aを出力する。なお、スキップモード及びマージモードでは差分動き情報符号化部904において、差分動き情報953の符号化は不要となる。   The prediction motion information selection switch 902 selects one of the plurality of prediction motion information candidates 951 in response to a command from the coding control unit 114, and outputs prediction motion information 952. Also, the predicted motion information selection switch 902 may output predicted motion information position information 954 described later. The selection may be made using an evaluation function such as Equation (1) or (2). Subtraction unit 903 subtracts prediction motion vector information 952 from motion information 160, and outputs difference motion information 953 to difference motion information coding unit 904. The differential motion information encoding unit 904 encodes the differential motion information 953 and outputs encoded data 960A. In the skip mode and the merge mode, encoding of the differential motion information 953 is unnecessary in the differential motion information encoding unit 904.

予測動き情報位置符号化部905は、図12で示されるリストのうち、どの予測動き情報候補951を選択したかを示す予測動き情報位置情報954(Mvpidx)を符号化し、符号化データ960Bを出力する。予測動き情報位置情報954は予測動き情報候補951の総数から生成される等長符号化や可変長符号化を用いて符号化される。隣接ブロックとの相関を利用して可変長符号化しても構わない。更に、複数の予測動き情報候補951で重複する情報を有する場合、重複する予測動き情報候補951を削除した予測動き情報候補951の総数から符号表を作成し、予測動き情報位置情報954を符号化しても構わない。また、予測動き情報候補951の総数が1種類である場合、当該予測動き情報候補951が予測動き情報952と決定されるため、予測動き情報位置情報954を符号化する必要はない。   The prediction motion information position coding unit 905 codes prediction motion information position information 954 (Mvpidx) indicating which prediction motion information candidate 951 is selected from the list shown in FIG. 12, and outputs the coded data 960B. Do. The prediction motion information position information 954 is encoded using isometric coding or variable length coding generated from the total number of prediction motion information candidates 951. Variable-length coding may be performed using correlation with adjacent blocks. Furthermore, when there is information overlapping in a plurality of prediction motion information candidates 951, a code table is created from the total number of prediction motion information candidates 951 from which overlapping prediction motion information candidates 951 have been deleted, and prediction motion information position information 954 is encoded It does not matter. In addition, when the total number of prediction motion information candidates 951 is one type, the prediction motion information candidates 951 are determined to be prediction motion information 952, so it is not necessary to encode the prediction motion information position information 954.

また、スキップモード、マージモード、インターモードそれぞれにおいて、予測動き情報候補951の導出方法は同一である必要はなく、それぞれ独立に予測動き情報候補951の導出方法を設定しても構わない。本実施形態では、スキップモードとインターモードの予測動き情報候補951の導出方法は同一で、マージモードの予測動き情報候補951の導出方法は異なるものとして説明する。   Further, in each of the skip mode, the merge mode and the inter mode, it is not necessary to derive the prediction motion information candidate 951 in the same derivation method, and the derivation method of the prediction motion information candidate 951 may be set independently. In this embodiment, the method of deriving prediction motion information candidate 951 in the skip mode and the inter mode is the same, and the method of deriving prediction motion information candidate 951 in the merge mode is different.

<動き情報圧縮部109の詳細>
まず、動き情報圧縮処理について図15を用いて説明する。図15は、空間方向参照動き情報メモリ501の参照動き情報166を圧縮し、時間方向参照動き情報メモリ502へ格納する。空間方向参照動き情報メモリ501では動き情報圧縮ブロック(同図では16x16画素ブロック)毎に代表動き情報位置に保持される参照動き情報166を時間方向参照動き情報メモリ502に格納する。上述の動き情報符号化処理を行う場合には、前述の参照動き情報取得位置に保持される参照動き情報166を予測動き情報候補951として設定する。このとき、仮想的に動き情報圧縮ブロック内は同一の参照動き情報166を持つこととして、前述の参照動き情報取得位置に保持される参照動き情報166を予測動き情報候補951として設定しても構わない(同一の予測動き情報候補951が導出される。)
次に、動き情報圧縮部109について図16に示すフローチャートを用いて説明する。
動き情報圧縮部109は、フレーム(もしくはスライス、コーディングユニットなど任意の単位)の符号化処理が終了した際に、動き情報160を圧縮して時間方向参照動き情報メモリ502に動き情報160を格納する。
<Details of Motion Information Compression Unit 109>
First, motion information compression processing will be described using FIG. FIG. 15 compresses the reference motion information 166 of the space direction reference motion information memory 501 and stores it in the time direction reference motion information memory 502. In the spatial direction reference motion information memory 501, the reference motion information 166 held at the representative motion information position is stored in the time direction reference motion information memory 502 for each motion information compression block (16 × 16 pixel blocks in the figure). When the above-described motion information coding process is performed, the reference motion information 166 held at the above-described reference motion information acquisition position is set as a predicted motion information candidate 951. At this time, the reference motion information 166 held at the above-described reference motion information acquisition position may be set as the predicted motion information candidate 951 as the motion information compression block virtually has the same reference motion information 166. None (the same prediction motion information candidate 951 is derived)
Next, the motion information compression unit 109 will be described using the flowchart shown in FIG.
The motion information compression unit 109 compresses the motion information 160 and stores the motion information 160 in the time direction reference motion information memory 502 when the encoding process of a frame (or an arbitrary unit such as a slice or a coding unit) is completed. .

まず、符号化制御部114から参照位置情報164を取得し(ステップS1601)、フレームを動き情報160の圧縮単位である動き情報圧縮ブロックに分割する(ステップS1602)。動き情報圧縮ブロックは、動き補償処理により動き情報160が保持される単位(典型的には4x4画素ブロック)より大きい画素ブロックであり、典型的には16x16画素ブロックである。動き情報圧縮ブロックは64x64画素ブロックや32x32画素ブロック、8x8画素ブロック、長方形画素ブロック、任意の形状の画素領域であっても構わない。   First, reference position information 164 is acquired from the encoding control unit 114 (step S1601), and a frame is divided into motion information compression blocks which are compression units of the motion information 160 (step S1602). The motion information compression block is a pixel block larger than a unit (typically 4 × 4 pixel block) in which motion information 160 is held by motion compensation processing, and is typically a 16 × 16 pixel block. The motion information compression block may be a 64x64 pixel block, a 32x32 pixel block, an 8x8 pixel block, a rectangular pixel block, or a pixel region of any shape.

次に、参照位置情報164に従って代表動き情報位置を生成する(ステップS1603)。代表動き情報位置を生成する一例として、動き情報圧縮ブロックが16x16画素ブロックの場合、図13D、図14D、図17Dにそれぞれ示されるプレディクションユニットのサイズが16x16の場合の参照動き情報取得位置を代表動き情報位置とする。次に、生成した代表動き情報位置の参照動き情報166を代表動き情報に設定し(ステップS1604)、当該代表動き情報を時間方向参照動き情報メモリに格納する(ステップS1605)。上記のステップS1604〜S1605をすべての動き情報圧縮ブロックに対して実行する。   Next, a representative motion information position is generated according to the reference position information 164 (step S1603). As an example of generating a representative motion information position, when the motion information compression block is a 16 × 16 pixel block, the reference motion information acquisition position is representatively represented when the size of the prediction unit shown in FIGS. 13D, 14D, and 17D is 16 × 16. The motion information position. Next, reference motion information 166 of the generated representative motion information position is set as representative motion information (step S1604), and the representative motion information is stored in the time direction reference motion information memory (step S1605). The above steps S1604 to S1605 are performed on all motion information compression blocks.

動き情報160が保持される単位をMxMブロック、動き情報圧縮ブロックのサイズをNxN(NはMの倍数)とすると、上記動き情報圧縮処理を実行することにより、参照動き情報メモリの容量を(MxM)/(NxN)に削減することが可能となる。   Assuming that the unit in which the motion information 160 is held is MxM blocks and the size of the motion information compression block is NxN (N is a multiple of M), the capacity of the reference motion information memory is reduced to (MxM ) / (NxN) can be reduced.

<代表動き情報位置の別の実施形態>
代表動き情報位置を生成する別の例として、複数の参照動き情報取得位置の中心位置を代表動き情報位置としても構わない。図18A及び図18Bはサイズが16x16である動き圧縮ブロック毎の代表動き情報位置を示している。図18Aは、参照動き情報取得位置が図13Dに示される位置である場合の代表動き情報位置、同様に図18Bは、参照動き情報取得位置が図17Dに示される位置である場合の代表動き情報位置をそれぞれ示している。図18A及び図18B中の丸印は、プレディクションユニットが16x16ブロックである際の、参照動き情報取得位置を示しており、4点の参照動き情報取得位置の中心位置(重心位置とも称す)にバツ印で示される代表動き情報位置を配置している。
Another Embodiment of Representative Motion Information Position
As another example of generating a representative motion information position, the central position of a plurality of reference motion information acquisition positions may be used as the representative motion information position. FIGS. 18A and 18B show representative motion information positions for each motion compression block whose size is 16 × 16. FIG. 18A is a representative motion information position when the reference motion information acquisition position is the position shown in FIG. 13D, and similarly FIG. 18B is a representative motion information when the reference motion information acquisition position is the position shown in FIG. The position is shown respectively. Circles in FIG. 18A and FIG. 18B indicate reference motion information acquisition positions when the prediction unit is a 16 × 16 block, and are located at the center positions (also referred to as center of gravity positions) of four reference motion information acquisition positions. The representative motion information positions indicated by crosses are arranged.

代表動き情報位置を生成する更に別の例として、複数のプレディクションユニットのサイズ毎の参照動き情報取得位置を参照位置情報164として有し、複数の参照動き情報取得位置から代表動き情報位置を生成しても構わない。   As another example of generating a representative motion information position, a reference motion information acquisition position for each size of a plurality of prediction units is included as the reference position information 164, and a representative motion information position is generated from the plurality of reference motion information acquisition positions It does not matter.

代表動き情報位置を生成する一例として、複数のプレディクションユニットのサイズ毎の参照動き情報取得位置を参照位置情報164として有し、複数の参照動き情報取得位置から代表動き情報位置を生成しても構わない。図19は、ツリーブロックが64x64画素ブロックである場合の、プレディクションユニットのサイズが16x16以上の各サイズにおけるプレディクションユニットの中心(参照動き情報取得位置)をそれぞれ示している。   As an example of generating a representative motion information position, a reference motion information acquisition position for each size of a plurality of prediction units is included as the reference position information 164, and even if a representative motion information position is generated from a plurality of reference motion information acquisition positions I do not care. FIG. 19 shows the centers (reference motion information acquisition positions) of the prediction units at each size of the prediction unit of 16 × 16 or more when the tree block is a 64 × 64 pixel block.

代表動き情報位置を生成する別の一例として、代表動き情報位置は動き情報圧縮ブロック毎に配置される参照動き情報取得位置を用いて設定されても構わない。図20Aは、動き情報圧縮ブロック毎の複数の参照動き情報取得位置の重心を代表動き情報位置と設定した場合の例を示す。重心位置が4x4ブロックの位置と一致しない場合には、最近傍の4x4ブロックを代表動き情報位置としてもよいし、共一次内挿法などの内挿法を用いて重心位置の参照動きベクトル166を生成しても構わない。   As another example of generating a representative motion information position, the representative motion information position may be set using a reference motion information acquisition position arranged for each motion information compression block. FIG. 20A shows an example where the center of gravity of a plurality of reference motion information acquisition positions for each motion information compression block is set as a representative motion information position. If the position of the center of gravity does not coincide with the position of the 4x4 block, the nearest 4x4 block may be used as the representative motion information position, or a reference motion vector 166 of the center of gravity position is obtained using interpolation such as bilinear interpolation. You may generate it.

また、図20Bは動き情報圧縮ブロック毎に複数の参照動き情報取得位置のいずれかを選択し、代表動き情報位置と設定した場合の例を示す。   Further, FIG. 20B shows an example where one of a plurality of reference motion information acquisition positions is selected for each motion information compression block, and a representative motion information position is set.

更に、図21A、図21Bにツリーブロック内で各動き情報圧縮ブロックで参照動き情報取得位置を同一にした場合の例を更に示す。全ての動き情報圧縮ブロック内で同一の代表動き情報位置であるため、ツリーブロック内の位置に応じて、代表動き情報位置を切り替える必要はない。また、代表動き情報位置は図21A、図21B以外にも、動き情報圧縮ブロック内の左上端や右上端など、いずれの位置にあっても構わない。   Further, FIGS. 21A and 21B further show an example in which reference motion information acquisition positions are made identical in each motion information compression block in a tree block. Since the representative motion information positions are the same in all the motion information compression blocks, it is not necessary to switch the representative motion information positions according to the position in the tree block. Further, the representative motion information position may be located at any position, such as the upper left end or the upper right end in the motion information compression block, as well as in FIGS. 21A and 21B.

代表動き情報位置を生成する一例、動き情報圧縮ブロック内の4x4ブロック位置をZスキャン順で示すBlkIdxを用いて代表動き情報位置を示しても構わない。動き情報圧縮ブロックのサイズが16x16である場合に、図21Aに示される代表動き情報位置はBlkIdx=12の位置に相当する。また、図21Bに示される代表動き情報位置はBlkIdx=15の位置に相当する。   The representative motion information position may be indicated using BlkIdx indicating the 4x4 block position in the motion information compression block in Z scan order as an example of generating the representative motion information position. When the size of the motion information compression block is 16 × 16, the representative motion information position shown in FIG. 21A corresponds to the position of BlkIdx = 12. The representative motion information position shown in FIG. 21B corresponds to the position of BlkIdx = 15.

動き情報圧縮処理における別の一例として、参照フレーム番号に関するメモリ容量を削減するために、動き情報圧縮処理に参照フレーム番号を含めても構わない。この場合、代表動き情報位置に保持される参照フレーム番号を参照フレーム番号に関するメモリ容量に格納する。従って、図5に示される空間方向参照動き情報メモリ501及び空間方向参照動き情報メモリ502は動きベクトル情報に追加して参照フレーム番号を格納する。   As another example of the motion information compression process, the reference information may be included in the motion information compression process in order to reduce the memory capacity of the reference frame number. In this case, the reference frame number held at the representative motion information position is stored in the memory capacity related to the reference frame number. Therefore, the spatial direction reference motion information memory 501 and the spatial direction reference motion information memory 502 shown in FIG. 5 store the reference frame number in addition to the motion vector information.

動き情報圧縮処理における更に別の一例として、動き情報圧縮処理に参照フレーム番号を含めない場合に、代表動き情報位置にある動き情報内の動きベクトル情報を、参照フレーム番号を用いてスケーリング処理を施して、動き情報メモリ110に格納しても構わない。スケーリング処理の典型例として、参照フレーム番号ゼロを基準とした線形スケーリング処理がある。これは、参照フレーム番号がゼロ以外の値である場合に、動きベクトル情報が参照フレーム番号ゼロに対応する参照フレームを参照するように線形スケーリング処理するものである。上述のスケーリング処理の基準は参照フレーム番号がゼロ以外の値であっても構わない。上述の線形スケーリング処理を行う場合に除算が発生する場合には、予め除算処理をテーブル化しておき、都度テーブルを引くことで上記除算を実現しても構わない。   As another example of the motion information compression processing, when the motion information compression processing does not include the reference frame number, the motion vector information in the motion information at the representative motion information position is subjected to scaling processing using the reference frame number May be stored in the motion information memory 110. As a typical example of the scaling process, there is a linear scaling process based on the reference frame number zero. This is to perform linear scaling processing so that motion vector information refers to a reference frame corresponding to the reference frame number zero when the reference frame number is a value other than zero. The reference of the scaling process described above may be a value other than zero for the reference frame number. When division occurs when the above-described linear scaling processing is performed, the division processing may be previously made into a table, and the division may be realized by drawing a table each time.

動き情報圧縮ブロックのサイズが16x16ブロック以外の場合、上述と同様の処理を用いて代表動き情報位置を生成する。一例では、動き情報圧縮ブロックのサイズが64x64の場合、プレディクションユニットのサイズが64x64における参照動き情報取得位置を代表動き情報位置とする。更に別の一例では、図21A、図21B等で示される動き情報圧縮ブロックのサイズが16x16ブロックにおける代表動き情報位置を、動き情報圧縮ブロックのサイズに従って水平方向及び垂直方向でスケーリングした位置を代表動き情報位置としても構わない。   When the size of the motion information compression block is other than 16 × 16 blocks, the representative motion information position is generated using the same process as described above. In one example, when the size of the motion information compression block is 64x64, the reference motion information acquisition position where the size of the prediction unit is 64x64 is taken as the representative motion information position. In yet another example, the motion information compression block size shown in FIG. 21A, FIG. 21B, etc. represents the representative motion information position in the 16x16 block, and the horizontal and vertical scaled position according to the motion information compression block size represents the representative motion It does not matter as an information position.

代表動き情報位置が、ピクチャやスライスの外であるとして参照動き情報が存在しない場合には、動き情報圧縮ブロックの左上端といった動き情報圧縮ブロック内で参照動き情報が取得可能な位置を新しい代表動き情報位置として置き換えても構わない。また、代表動き情報位置が、イントラ予測が適用された領域であって、参照動き情報が存在しない場合にも同様の処理を実行して、新しい代表動き情報位置として置き換えても構わない。   If the reference motion information does not exist because the representative motion information position is outside the picture or slice, a new representative motion is a position where the reference motion information can be acquired in the motion information compression block, such as the upper left end of the motion information compression block. It may be replaced as an information position. Also, even when the representative motion information position is an area to which intra prediction is applied and there is no reference motion information, the same processing may be performed to replace it as a new representative motion information position.

<シンタクス構成>
以下、図1の画像符号化装置100が利用するシンタクスについて説明する。
シンタクスは、画像符号化装置が動画像データを符号化する際の符号化データ(例えば、図1の符号化データ163)の構造を示している。この符号化データを復号化する際に、同じシンタクス構造を参照して動画像復号化装置がシンタクス解釈を行う。図1の動画像符号化装置が利用するシンタクス2200を図22に例示する。
<Syntax configuration>
Hereinafter, the syntax used by the image coding apparatus 100 of FIG. 1 will be described.
The syntax indicates the structure of encoded data (for example, encoded data 163 in FIG. 1) when the image encoding apparatus encodes moving image data. When decoding this encoded data, the moving picture decoding apparatus performs syntax interpretation with reference to the same syntax structure. A syntax 2200 used by the moving picture coding apparatus of FIG. 1 is illustrated in FIG.

シンタクス2200は、ハイレベルシンタクス2201、スライスレベルシンタクス2202及びコーディングツリーレベルシンタクス2203の3つのパートを含む。ハイレベルシンタクス2201は、スライスよりも上位のレイヤのシンタクス情報を含む。スライスとは、フレームまたはフィールドに含まれる矩形領域もしくは連続領域を指す。スライスレベルシンタクス2202は、各スライスを復号化するために必要な情報を含む。コーディングツリーレベルシンタクス2203は、各コーディングツリー(即ち、各コーディングツリーユニット)を復号化するために必要な情報を含む。これら各パートは、さらに詳細なシンタクスを含む。   The syntax 2200 includes three parts of high level syntax 2201, slice level syntax 2202 and coding tree level syntax 2203. The high level syntax 2201 includes syntax information of a layer higher than the slice. A slice refers to a rectangular area or continuous area included in a frame or field. The slice level syntax 2202 includes information necessary to decode each slice. The coding tree level syntax 2203 includes information necessary to decode each coding tree (ie, each coding tree unit). Each of these parts contains further detailed syntax.

ハイレベルシンタクス2201は、シーケンスパラメータセットシンタクス2204及びピクチャパラメータセットシンタクス2205などの、シーケンス及びピクチャレベルのシンタクスを含む。スライスレベルシンタクス2202は、スライスヘッダーシンタクス2206及びスライスデータシンタクス2207などを含む。コーディングツリーレベルシンタクス2203は、コーディングツリーユニットシンタクス2208、トランスフォームユニットシンタクス2209及びプレディクションユニットシンタクス2210などを含む。   High level syntax 2201 includes sequence and picture level syntax, such as sequence parameter set syntax 2204 and picture parameter set syntax 2205. The slice level syntax 2202 includes a slice header syntax 2206, a slice data syntax 2207, and the like. The coding tree level syntax 2203 includes a coding tree unit syntax 2208, a transform unit syntax 2209, a prediction unit syntax 2210, and the like.

コーディングツリーユニットシンタクス2208は、四分木構造を持つことができる。
具体的には、コーディングツリーユニットシンタクス2208のシンタクス要素として、さらにコーディングツリーユニットシンタクス2208を再帰呼び出しすることができる。即ち、1つのコーディングツリーユニットを四分木で細分化することができる。また、コーディングツリーユニットシンタクス2208内にはトランスフォームユニットシンタクス2209及びプレディクッションユニットシンタクス2210が含まれている。トランスフォームユニットシンタクス2209及びプレディクッションユニットシンタクス2210は、四分木の最末端の各コーディングツリーユニットシンタクス2208において呼び出される。プレディクッションユニットシンタクス2210は予測に関わる情報、トランスフォームユニットシンタクス2209は、逆直交変換及び量子化などに関わる情報がそれぞれ記述されている。
The coding tree unit syntax 2208 can have a quadtree structure.
Specifically, coding tree unit syntax 2208 can be further recursively called as a syntax tree unit syntax 2208 syntax element. That is, one coding tree unit can be subdivided into quadtrees. In addition, transform unit syntax 2209 and pre-discussion unit syntax 2210 are included in coding tree unit syntax 2208. Transform unit syntax 2209 and Predi Cushion unit syntax 2210 are called in each coding tree unit syntax 2208 at the end of the quadtree. Information related to prediction is described in the pre-de-cushion unit syntax 2210, and information related to inverse orthogonal transformation, quantization, etc. is described in the transform unit syntax 2209, respectively.

図23は、本実施形態に係るシーケンスパラメータセットシンタクス2204を例示する。図23A及び図23Bに示されるmotion_vector_buffer_comp_flagは、当該シーケンスに関して本実施形態に係る動き情報圧縮の有効/無効を示すシンタクスである。motion_vector_buffer_comp_flagが0である場合、当該シーケンスに関して本実施形態に係る動き情報圧縮は無効である。従って、図1に示される動き情報圧縮部の処理はスキップされる。一例として、motion_vector_buffer_comp_flagが1である場合、当該シーケンスに関して本実施携帯に係る動き情報圧縮は有効である。図23及び図23Bに示されるmotion_vector_buffer_comp_ratio_log2は、動き情報圧縮処理の単位を示す情報であり、motion_vector_buffer_comp_flagが1である場合に示される。motion_vector_buffer_comp_ratio_log2は、例えば本実施形態に係る動き情報圧縮ブロックのサイズの情報を示し、motion_vector_buffer_comp_ratio_log2は、動き補償の最小単位に2(motion_vector_buffer_comp_ratio_log2)を乗じた値が動き情報圧縮ブロックのサイズとなる。動き補償の最小単位が4x4画素ブロックである、つまり参照動き情報メモリが4x4画素ブロック単位に保持される場合の例を以下に示す。motion_vector_buffer_comp_ratio_log2が1の場合、本実施形態に係る動き情報圧縮ブロックのサイズは8x8画素ブロックとなる。同様に、motion_vector_buffer_comp_ratio_log2が2の場合、本実施形態に係る動き情報圧縮ブロックのサイズは16x16画素ブロックとなる。図23Bに示されるmotion_vector_buffer_comp_positionは、動き情報圧縮ブロック内の代表動き情報位置を示す情報であり、motion_vector_buffer_comp_flagが1である場合に示される。motion_vector_buffer_comp_positionは、例えば図21A、図21Bに示されるような動き情報圧縮ブロック内の参照動き情報位置を示したり、図20A、図20Bに示されるように動き情報圧縮ブロック毎の参照動き情報位置を示しても構わない。また、複数のブロックの中心にあっても構わない。 FIG. 23 exemplifies a sequence parameter set syntax 2204 according to the present embodiment. Motion_vector_buffer_comp_flag shown in FIG. 23A and FIG. 23B is syntax that indicates validity / invalidity of motion information compression according to the present embodiment with respect to the sequence. When motion_vector_buffer_comp_flag is 0, the motion information compression according to the present embodiment is invalid for the sequence. Therefore, the processing of the motion information compression unit shown in FIG. 1 is skipped. As an example, when motion_vector_buffer_comp_flag is 1, motion information compression according to the present embodiment is effective for the sequence. Motion_vector_buffer_comp_ratio_log 2 shown in FIG. 23 and FIG. 23B is information indicating a unit of motion information compression processing, and is shown when motion_vector_buffer_comp_flag is 1. motion_vector_buffer_comp_ratio_log2 indicates, for example, information on the size of the motion information compression block according to the present embodiment, and motion_vector_buffer_comp_ratio_log2 is the motion information compression block size obtained by multiplying the minimum unit of motion compensation by 2 (motion_vector_buffer_comp_ratio_log2) . An example in which the minimum unit of motion compensation is a 4 × 4 pixel block, that is, the reference motion information memory is held in 4 × 4 pixel block units, will be shown below. When motion_vector_buffer_comp_ratio_log2 is 1, the size of the motion information compression block according to the present embodiment is an 8 × 8 pixel block. Similarly, when motion_vector_buffer_comp_ratio_log2 is 2, the size of the motion information compression block according to the present embodiment is a 16 × 16 pixel block. Motion_vector_buffer_comp_position shown in FIG. 23B is information indicating a representative motion information position in a motion information compression block, and is shown when motion_vector_buffer_comp_flag is 1. motion_vector_buffer_comp_position indicates, for example, the reference motion information position in the motion information compression block as shown in FIGS. 21A and 21B, or indicates the reference motion information position for each motion information compression block as shown in FIGS. 20A and 20B. It does not matter. Also, it may be at the center of a plurality of blocks.

また、別の例として、motion_vector_buffer_comp_flag、motion_vector_buffer_comp_ratio_log2、motion_vector_buffer_comp_positionより下位のレイヤ(ピクチャパラメータセットシンタクス、スライスレベルシンタクス、コーディングツリーユニット、トランスフォームユニットなど)のシンタクスにおいて当該スライス内部の局所領域毎に本実施形態に係る予測の有効/無効が規定されてもよい。   Further, as another example, in the syntax of layers lower than motion_vector_buffer_comp_flag, motion_vector_buffer_comp_ratio_log2, motion_vector_buffer_comp_position (picture parameter set syntax, slice level syntax, coding tree unit, transform unit, etc.) The validity / invalidity of such prediction may be defined.

図24に、プレディクションユニットシンタクスの一例を示す。図中のskip_flagは、プレディクションユニットシンタクスが属するコーディングユニットの予測モードがスキップモードであるか否かを示すフラグである。skip_flagが1である場合、予測動き情報位置情報954以外のシンタクス(コーディングユニットシンタクス、プレディクションユニットシンタクス、トランスフォームユニットシンタクス)を符号化しないことを示す。NumMVPCand(L0)、NumMVPCand(L1)は、それぞれリスト0予測、リスト1予測における予測動き情報候補951の数を示す。予測動き情報候補951が存在する(NumMVPCand(LX)>0、X=0若しくは1)場合、予測動き情報位置情報954を示すmvp_idx_lXが符号化される。   FIG. 24 shows an example of the prediction unit syntax. The skip_flag in the drawing is a flag indicating whether the prediction mode of the coding unit to which the prediction unit syntax belongs is the skip mode. If skip_flag is 1, it indicates that syntax (coding unit syntax, prediction unit syntax, transform unit syntax) other than predicted motion information position information 954 is not encoded. NumMVPCand (L0) and NumMVPCand (L1) indicate the number of prediction motion information candidates 951 in list 0 prediction and list 1 prediction, respectively. When a prediction motion information candidate 951 exists (NumMVPCand (LX)> 0, X = 0 or 1), mvp_idx_lX indicating prediction motion information position information 954 is encoded.

skip_flagが0である場合、プレディクションユニットシンタクスが属するコーディングユニットの予測モードがスキップモードではないことを示す。NumMergeCandidatesは、図12などで導出される予測動き情報候補951の数を示す。予測動き情報候補951が存在する(NumMergeCandidates>0)場合、プレディクションユニットがマージモードであるか否かを示すフラグであるmerge_flagが符号化される。merge_flagは、その値が1である場合、プレディクションユニットがマージモードであることを示し、その値が0である場合、プレディクションユニットがインターモードを用いることを示す。merge_flagが1且つ予測動き情報候補951が2つ以上存在する(NumMergeCandidates>1)場合、予測動き情報候補951の内、どのブロックからマージするかを示す予測動き情報952であるmerge_idxが符号化される。   When skip_flag is 0, it indicates that the prediction mode of the coding unit to which the prediction unit syntax belongs is not the skip mode. NumMergeCandidates indicates the number of prediction motion information candidates 951 derived in FIG. If a prediction motion information candidate 951 exists (NumMergeCandidates> 0), merge_flag, which is a flag indicating whether the prediction unit is in merge mode, is encoded. merge_flag indicates that the prediction unit is in merge mode when the value is 1, and indicates that the prediction unit uses inter mode when the value is 0. When merge_flag is 1 and there are two or more prediction motion information candidates 951 (NumMergeCandidates> 1), merge_idx which is prediction motion information 952 indicating which block of prediction motion information candidates 951 is to be merged is encoded .

merge_flagが1である場合、merge_flag、merge_idx以外のプレディクションユニットシンタクスは符号化する必要はない。   When merge_flag is 1, prediction unit syntaxes other than merge_flag and merge_idx do not need to be encoded.

merge_flagが0である場合、プレディクションユニットがインターモードであることを示す。インターモードでは差分動き情報953が含む差分動きベクトル情報を示すmvd_lX(X=0若しくは1)や参照フレーム番号ref_idx_lX、Bスライスの場合、プレディクションユニットが単方向予測(リスト0若しくはリスト1)であるか双方向予測であるかを示すinter_pred_idcが符号化される。また、スキップモードと同様にNumMVPCand(L0)、NumMVPCand(L1)を取得し、予測動き情報候補951が存在する(NumMVPCand(LX)>0、X=0若しくは1)場合、予測動き情報位置情報954を示すmvp_idx_lXが符号化される。   If merge_flag is 0, it indicates that the prediction unit is in the inter mode. In inter mode, in the case of mvd_lX (X = 0 or 1) indicating difference motion vector information included in the difference motion information 953, reference frame number ref_idx_lX, and B slice, the prediction unit is unidirectional prediction (list 0 or list 1) Inter_pred_idc indicating whether it is bi-directional prediction is encoded. Also, as in the skip mode, NumMVPCand (L0) and NumMVPCand (L1) are acquired, and when there is a predicted motion information candidate 951 (NumMVPCand (LX)> 0, X = 0 or 1), predicted motion information position information 954 Mvp_idx_lX indicating is encoded.

以上が、本実施形態に係るシンタクス構成である。   The above is the syntax configuration according to the present embodiment.

(第2の実施形態)
第2の実施形態は動画像復号化装置に関する。本実施形態に係る動画像復号化装置に対応する動画像符号化装置は、第1の実施形態において説明した通りである。即ち、本実施形態に係る動画像復号化装置は、例えば第1の実施形態に係る動画像符号化装置によって生成された符号化データを復号化する。
Second Embodiment
The second embodiment relates to a moving picture decoding apparatus. The moving picture coding apparatus corresponding to the moving picture decoding apparatus according to the present embodiment is as described in the first embodiment. That is, the moving picture decoding apparatus according to the present embodiment decodes, for example, coded data generated by the moving picture coding apparatus according to the first embodiment.

図25に示すように、本実施形態に係る動画像復号化装置は、エントロピー復号化部2501、逆量子化部2502、逆直交変換部2503、加算部2504、参照画像メモリ2505、インター予測部2506、参照動き情報メモリ2507、参照動き情報圧縮部2508及び復号化制御部2510を含む。   As shown in FIG. 25, the moving picture decoding apparatus according to this embodiment includes an entropy decoding unit 2501, an inverse quantization unit 2502, an inverse orthogonal transformation unit 2503, an addition unit 2504, a reference image memory 2505, and an inter prediction unit 2506. , A reference motion information memory 2507, a reference motion information compression unit 2508, and a decoding control unit 2510.

図25の動画像復号化装置は、符号化データ2550を復号し、復号画像信号2554を出力バッファ2511に蓄積して出力画像として出力する。符号化データ2550は、例えば図1の動画像符号化装置などから出力され、図示しない蓄積系または伝送系を経て、動画像復号化装置2500に入力される。   The moving picture decoding apparatus shown in FIG. 25 decodes the encoded data 2550, stores the decoded picture signal 2554 in the output buffer 2511 and outputs it as an output picture. The encoded data 2550 is output from, for example, the moving picture coding apparatus shown in FIG. 1, and is input to the moving picture decoding apparatus 2500 through a storage system or a transmission system (not shown).

エントロピー復号化部2501は、符号化データ2550の復号化のために、シンタクスに基づいて解読を行う。エントロピー復号化部2501は、各シンタクスの符号列を順次エントロピー復号化し、動き情報2559、量子化変換係数2551などの符号化対象ブロックの符号化パラメータを再生する。符号化パラメータとは、予測情報、変換係数に関する情報、量子化に関する情報、などの復号に必要となるパラメータである。   The entropy decoding unit 2501 performs decoding based on the syntax to decode the encoded data 2550. The entropy decoding unit 2501 performs entropy decoding on the code sequence of each syntax sequentially to reproduce the coding parameters of the current block, such as the motion information 2559 and the quantization transformation coefficient 2551. The coding parameter is a parameter necessary for decoding prediction information, information on transform coefficients, information on quantization, and the like.

具体的には、エントロピー復号化部2501は、図26に示すように、分離部2601、パラメータ復号化部2602、変換係数復号化部2603、並びに動き情報復号化部2604を備える。分離部2601は符号化データ2550を分離し、パラメータに関する符号化データ2651Aをパラメータ復号化部2602、変換係数に関する符号化データ2651Bを変換係数復号化部2603、動き情報に関する符号化データ2651Cを動き情報復号化部2604にそれぞれ出力する。パラメータ復号化部2602は、予測情報などの符号化パラメータ2570を復号化し符号化パラメータ2570を出力し復号化制御部2510に出力する。変換係数復号化部2603は、符号化データ2651Bを入力し、変換係数情報2551を復号化して逆量子化部2502に出力する。   Specifically, as shown in FIG. 26, the entropy decoding unit 2501 includes a separation unit 2601, a parameter decoding unit 2602, a transform coefficient decoding unit 2603 and a motion information decoding unit 2604. A separating unit 2601 separates the encoded data 2550, and encodes the encoded data 2651A relating to parameters into a parameter decoding unit 2602, the encoded data 2651B relating to transform coefficients into a transform coefficient decoding unit 2603, and the encoded data 2651C relating to motion information into motion information It outputs to the decoding unit 2604 respectively. The parameter decoding unit 2602 decodes the coding parameter 2570 such as prediction information and outputs the coding parameter 2570 to the decoding control unit 2510. Transform coefficient decoding section 2603 receives as input encoded data 2651 B, decodes transform coefficient information 2551, and outputs the result to inverse quantization section 2502.

動き情報復号化部2604は、分離部2601から符号化データ2651C、復号化制御部2510から参照位置情報2560、参照動き情報メモリ2507から参照動き情報2558をそれぞれ受け取り、動き情報2559を出力する。出力された動き情報2559はインター予測部2506に入力される。   The motion information decoding unit 2604 receives the encoded data 2651 C from the separation unit 2601, the reference position information 2560 from the decoding control unit 2510, and the reference motion information 2558 from the reference motion information memory 2507, and outputs the motion information 2559. The output motion information 2559 is input to the inter prediction unit 2506.

動き情報復号化部2604は、図27に示すように、分離部2701、差分動き情報復号化部2702、予測動き情報位置復号化部2503、参照動き情報取得部2704、予測動き情報選択スイッチ2705及び加算部2706を含む。   The motion information decoding unit 2604 is, as shown in FIG. 27, a separation unit 2701, a differential motion information decoding unit 2702, a predicted motion information position decoding unit 2503, a reference motion information acquisition unit 2704, a predicted motion information selection switch 2705, An adder 2706 is included.

動き情報に関する符号化データ2651Cを分離部2701に入力し、差分動き情報に関する符号化データ2751と予測動き情報位置に関する符号化データ2752に分離する。差分動き情報符号化部2702は、差分動き情報に関する符号化データ2751を入力し、差分動き情報2753を復号化する。差分動き情報2753は加算部2706にて後述する予測動き情報2756と加算され、動き情報2759が出力される。予測動き情報位置復号化部2703は予測動き情報位置に関する符号化データ2752を入力し、予測動き情報位置2754を復号化する。   The encoded data 2651 C relating to motion information is input to the separation unit 2701, and is separated into encoded data 2751 relating to differential motion information and encoded data 2752 relating to the predicted motion information position. The differential motion information encoding unit 2702 receives the encoded data 2751 related to differential motion information, and decodes the differential motion information 2753. The differential motion information 2753 is added to predicted motion information 2756 to be described later by the addition unit 2706, and motion information 2759 is output. The prediction motion information position decoding unit 2703 receives the coded data 2752 related to the prediction motion information position, and decodes the prediction motion information position 2754.

予測動き情報位置2754は予測動き情報選択スイッチ2705に入力され、予測動き情報候補2755の中から予測動き情報2756を選択する。予測動き情報位置情報2560は予測動き情報候補2755の数から生成される等長復号化や可変長復号化を用いて復号化される。隣接ブロックとの相関を利用して可変長復号化しても構わない。更に、複数の予測動き情報候補2755で重複する場合、重複を削除した予測動き情報候補2755の総数から生成される符号表から、予測動き情報位置情報2560を復号化しても構わない。また、予測動き情報候補2755の総数が1種類である場合、当該予測動き情報候補2755が予測動き情報2556と決定されるため、予測動き情報位置情報2754を復号化する必要はない。   The prediction motion information position 2754 is input to the prediction motion information selection switch 2705, and selects prediction motion information 2756 from among the prediction motion information candidates 2755. The predicted motion information position information 2560 is decoded using isometric decoding or variable length decoding generated from the number of predicted motion information candidates 2755. Variable length decoding may be performed using the correlation with the adjacent block. Furthermore, when a plurality of prediction motion information candidates 2755 overlap, prediction motion information position information 2560 may be decoded from a code table generated from the total number of prediction motion information candidates 2755 from which duplication has been deleted. Further, when the total number of prediction motion information candidates 2755 is one type, the prediction motion information candidate 2755 is determined to be prediction motion information 2556, and therefore there is no need to decode the prediction motion information position information 2754.

参照動き情報取得部2704は第1の実施形態で説明した参照動き情報取得部901とその構成、処理内容は同一である。   The reference motion information acquisition unit 2704 has the same configuration and processing content as the reference motion information acquisition unit 901 described in the first embodiment.

参照動き情報取得部2704は、参照動き情報2558及び参照位置情報2560を入力として、少なくとも一つ以上の予測動き情報候補2755(2755A、2755B、…)を生成する。図10、図11は、復号化対象プレディクションユニットに対する、予測動き情報候補2755の位置の一例を示している。図10は復号化対象プレディクションユニットに空間的に隣接するプレディクションユニットの位置を示している。AX(X=0〜nA−1)は、対象プレディクションユニットに対して左に隣接するプレディクションユニット、BY(Y=0〜nB−1)は対象プレディクションユニットに対して上に隣接するプレディクションユニット、C、D、Eは復号化対象プレディクションユニットに対してそれぞれ右上、左上、左下に隣接するプレディクションユニットを示している。
また、図11は復号化対象プレディクションユニットに対して、既に復号化済みの参照フレームにおけるプレディクションユニットの位置を示している。図中のColは、参照フレーム内であって復号化対象プレディクションユニットと同一位置にあるプレディクションユニットを示している。図12は、複数の予測動き情報候補2755のブロック位置とインデクスMvpidxの関係を示すリストの一例を示す。Mvpidxが0〜2は空間方向に位置する予測動き情報候補2755、Mvpidxが3は時間方向に位置する測動きベクトル候補2755をそれぞれ示している。プレディクションユニット位置Aは図10に示されるAXの内、インター予測である、つまり参照動き情報2558を有するプレディクションユニットであって、Xの値が最も小さい位置をプレディクションユニット位置Aとする。また、プレディクションユニット位置Bは図10に示されるBYの内、インター予測である、つまり参照動き情報2558を有するプレディクションユニットであって、Yの値が最も小さい位置をプレディクションユニット位置Aとする。プレディクションユニット位置Cがインター予測ではない場合、プレディクションユニット位置Dの参照動き情報2558をプレディクションユニット位置Cの参照動き情報2558として置き換える。プレディクションユニット位置C及びDがインター予測ではない場合、プレディクションユニット位置Eの参照動き情報2558をプレディクションユニット位置Cの参照動き情報2558として置き換える。
The reference motion information acquisition unit 2704 receives the reference motion information 2558 and the reference position information 2560, and generates at least one or more predicted motion information candidates 2755 (2755A, 2755B,...). FIGS. 10 and 11 show an example of the position of the predicted motion information candidate 2755 with respect to the prediction target prediction unit. FIG. 10 shows the position of the prediction unit spatially adjacent to the decoding target prediction unit. AX (X = 0 to nA-1) is a prediction unit adjacent on the left with respect to the target prediction unit, and BY (Y = 0 to nB-1) is a prediment adjacent on the target prediction unit. , C, D, and E indicate prediction units adjacent to the upper right, upper left, and lower left, respectively, for the prediction target prediction unit.
Further, FIG. 11 shows the position of the prediction unit in the reference frame that has already been decoded, with respect to the prediction target prediction unit. Col in the figure indicates a prediction unit in the reference frame and at the same position as the prediction unit to be decoded. FIG. 12 shows an example of a list showing the relationship between the block positions of the plurality of predicted motion information candidates 2755 and the index Mvpidx. Mvpidx of 0 to 2 indicates a predicted motion information candidate 2755 located in the space direction, and Mvpidx of 3 indicates a motion estimation vector candidate 2755 located in the time direction. The prediction unit position A is inter prediction among AX shown in FIG. 10, that is, the prediction unit having the reference motion information 2558, and the position at which the value of X is smallest is taken as the prediction unit position A. Further, the prediction unit position B is inter prediction among BY shown in FIG. 10, that is, it is a prediction unit having the reference motion information 2558 and a position where the value of Y is the smallest is the prediction unit position A Do. When the prediction unit position C is not inter prediction, the reference motion information 2558 of the prediction unit position D is replaced as the reference motion information 2558 of the prediction unit position C. When the prediction unit positions C and D are not inter prediction, the reference motion information 2558 of the prediction unit position E is replaced as the reference motion information 2558 of the prediction unit position C.

復号化対象プレディクションユニットのサイズが最小プレディクションユニットより大きい場合には、プレディクションユニット位置Colは、複数の参照動き情報2558を時間方向参照動き情報メモリ2507に保持している可能性がある。この場合、参照位置情報2560に従って位置Colのプレディクションユニット中の参照動き情報2558を取得する。以降、位置Colのプレディクションユニット中の参照動き情報2558の取得位置を参照動き情報取得位置と称する。図13A〜Fは、参照位置情報2560が位置Colのプレディクションユニットの中心を示す場合の参照動き情報取得位置の一例を復号化対象プレディクションユニットのサイズ(32x32〜16x16)毎に示す。図中のブロックはそれぞれ4x4プレディクションユニットを示し、丸印は予測動き情報候補2755として取得する4x4プレディクションユニットの位置を示している。参照動き情報取得位置の別の一例を図14A〜Fに示す。図14A〜Fにおいて、丸印の位置は4x4プレディクションユニットが存在しないため、丸印に隣接する4つのx4プレディクションユニットにおける参照動き情報2558の平均値やメディアン値といった予め定められた方式で、予測動き情報候補2755を生成する。参照動き情報取得位置の更に別の一例として、位置Colのプレディクションユニットの左上端に位置する4x4プレディクションユニットの参照動き情報2558を予測動き情報候補2755としても構わない。上記の例以外に置いても、予め定められた方式であれば、いずれの位置及び方式を用いて予測動き情報候補2755を生成しても構わない。   When the size of the prediction target prediction unit is larger than the minimum prediction unit, the prediction unit position Col may hold a plurality of reference motion information 2558 in the temporal direction reference motion information memory 2507. In this case, reference motion information 2558 in the prediction unit at position Col is obtained in accordance with reference position information 2560. Hereinafter, the acquisition position of the reference motion information 2558 in the prediction unit at the position Col will be referred to as a reference motion information acquisition position. 13A to 13F show an example of the reference motion information acquisition position when the reference position information 2560 indicates the center of the prediction unit at the position Col, for each size (32 × 32 to 16 × 16) of the decoding target prediction unit. Each block in the figure indicates a 4 × 4 prediction unit, and a circle indicates the position of the 4 × 4 prediction unit to be acquired as the predicted motion information candidate 2755. Another example of the reference motion information acquisition position is shown in FIGS. In FIGS. 14A to 14F, since the position of the circle is 4 × 4 prediction unit not present, the predetermined method such as the average value or the median value of the reference motion information 2558 in the four x4 prediction units adjacent to the circle is Predictive motion information candidate 2755 is generated. As another example of the reference motion information acquisition position, the reference motion information 2558 of the 4x4 prediction unit located at the upper left end of the prediction unit at the position Col may be used as the prediction motion information candidate 2755. Even if other than the above example, the predicted motion information candidate 2755 may be generated using any position and method as long as it is a predetermined method.

なお、参照動き情報2558が存在しない場合、ゼロベクトルを有する動き情報2559を、予測動き情報候補2755として出力する。   When the reference motion information 2558 does not exist, motion information 2559 having a zero vector is output as a predicted motion information candidate 2755.

以上により、少なくとも一つ以上の予測動き情報候補2755が参照動きブロックから出力される。上記の予測動き情報候補2755が有する参照フレーム番号と復号化対象プレディクションユニットの参照フレーム番号が異なる場合、予測動き情報候補2755を予測動き情報候補2755が有する参照フレーム番号と復号化対象プレディクションユニットの参照フレーム番号に従ってスケーリングしても構わない。予測動き情報選択スイッチ2705は、複数の予測動き情報候補2755から予測動き情報位置2754に従って一つを選択し、予測動き情報952を出力する。   By the above, at least one or more prediction motion information candidates 2755 are output from the reference motion block. When the reference frame number of the above prediction motion information candidate 2755 is different from the reference frame number of the decoding target prediction unit, the reference frame number of the prediction motion information candidate 2755 and the decoding target prediction unit of the prediction motion information candidate 2755 It may be scaled according to the reference frame number of. The prediction motion information selection switch 2705 selects one of the plurality of prediction motion information candidates 2755 according to the prediction motion information position 2754, and outputs prediction motion information 952.

逆量子化部2502は、エントロピー復号化部2501からの量子化変換係数2551に逆量子化を行って、復元変換係数2552を得る。具体的には、逆量子化部2502は、エントロピー復号化部2501によって復号化された量子化に関する情報に従って逆量子化を行う。逆量子化部2502は、復元変換係数2552を逆直交変換部2503に出力する。   The inverse quantization unit 2502 performs inverse quantization on the quantized transformation coefficient 2551 from the entropy decoding unit 2501 to obtain a reconstructed transformation coefficient 2552. Specifically, the inverse quantization unit 2502 performs inverse quantization in accordance with the information on the quantization decoded by the entropy decoding unit 2501. The inverse quantization unit 2502 outputs the restoration transform coefficient 2552 to the inverse orthogonal transformation unit 2503.

逆直交変換部2503は、逆量子化部2502からの復元変換係数2552に対して、符号化側において行われた直交変換に対応する逆直交変換を行い、復元予測誤差信号2553を得る。逆直交変換部2503は、復元予測誤差信号2553を加算部2504に入力する。   The inverse orthogonal transformation unit 2503 performs inverse orthogonal transformation corresponding to the orthogonal transformation performed on the encoding side on the reconstruction transform coefficient 2552 from the inverse quantization unit 2502 to obtain a reconstruction prediction error signal 2553. The inverse orthogonal transform unit 2503 inputs the restored prediction error signal 2553 to the addition unit 2504.

加算部2504は、復元予測誤差信号2553と、対応する予測画像信号2556とを加算し、復号画像信号2554を生成する。復号画像信号2554は、図示されないデブロッキングフィルタやウィナーフィルタなどを施し、出力画像のために出力バッファ2511に一時的に蓄積されると共に、参照画像信号2555のために参照画像メモリ2505にも保存される。参照画像メモリ2505に保存された復号画像信号2554は、参照画像信号2555としインター予測部2506によって必要に応じてフレーム単位またはフィールド単位で参照される。出力バッファ2511に一時的に蓄積された復号画像信号2554は、復号化制御部2510によって管理される出力タイミングに従って出力される。   The addition unit 2504 adds the restored prediction error signal 2553 and the corresponding predicted image signal 2556 to generate a decoded image signal 2554. Decoded image signal 2554 is subjected to a deblocking filter, a Wiener filter, etc., not shown, and temporarily stored in output buffer 2511 for an output image, and also stored in reference image memory 2505 for reference image signal 2555. Ru. The decoded image signal 2554 stored in the reference image memory 2505 is referred to as a reference image signal 2555 by the inter prediction unit 2506 in units of frames or fields as necessary. The decoded image signal 2554 temporarily stored in the output buffer 2511 is output according to the output timing managed by the decoding control unit 2510.

インター予測部2506は、参照画像メモリ2505に保存されている参照画像信号2555を利用してインター予測を行う。具体的には、インター予測部2506は、予測対象ブロックと参照画像信号2555との間の動きのズレ量(動きベクトル)を含む動き情報2559をエントロピー復号化部2501から取得し、この動きベクトルに基づいて補間処理(動き補償)を行ってインター予測画像を生成する。インター予測画像の生成に関しては、第一の実施形態と同一であるので、説明を省略する。   The inter prediction unit 2506 performs inter prediction using the reference image signal 2555 stored in the reference image memory 2505. Specifically, the inter prediction unit 2506 obtains, from the entropy decoding unit 2501, motion information 2559 including the shift amount (motion vector) of motion between the block to be predicted and the reference image signal 2555, and uses this motion vector. Interpolation processing (motion compensation) is performed to generate an inter prediction image. The generation of the inter prediction image is the same as that of the first embodiment, and thus the description thereof is omitted.

復号化制御部2510は、図25の動画像復号化装置の各要素を制御する。具体的には、復号化制御部2510は、後述する参照位置情報2560をエントロピー復号化部2501に出力したり、上述の動作を含む復号化処理のための種々の制御を行う。   The decoding control unit 2510 controls each element of the moving picture decoding apparatus shown in FIG. Specifically, the decoding control unit 2510 outputs reference position information 2560 to be described later to the entropy decoding unit 2501, and performs various controls for the decoding process including the above-described operation.

<スキップモード、マージモード、インターモードの説明>
本実施形態に係る画像復号化装置2500は、図8に示す復号化処理の異なる複数の予測モードを使用する。図中のスキップモードは後述する予測動き情報位置2754に関するシンタクスのみを復号化し、その他のシンタクスは復号化しないモードである。マージモードは予測動き情報位置2754に関するシンタクス、変換係数情報2551のみを復号化し、その他のシンタクスは復号化しないモードである。インターモードは、予測動き情報位置2754に関するシンタクス、後述する差分動き情報2753、変換係数情報2551を復号化するモードである。これらのモードは復号化制御部2510が制御する予測情報2571によって切り替えられる。
<Description of skip mode, merge mode, inter mode>
The image decoding apparatus 2500 according to the present embodiment uses a plurality of different prediction modes of the decoding process shown in FIG. The skip mode in the drawing is a mode in which only the syntax related to the predicted motion information position 2754 described later is decoded, and the other syntaxes are not decoded. The merge mode is a mode in which only the syntax related to the predicted motion information position 2754 and the transform coefficient information 2551 are decoded, and the other syntax is not decoded. The inter mode is a mode for decoding syntax relating to the predicted motion information position 2754, differential motion information 2753 described later, and transform coefficient information 2551. These modes are switched by prediction information 2571 controlled by the decoding control unit 2510.

また、図25の動画像復号化装置は、図28説明したシンタクスと同一または類似のシンタクスを利用するのでその詳細な説明を省略する。   Further, since the moving picture decoding apparatus shown in FIG. 25 uses syntax the same as or similar to the syntax described in FIG. 28, its detailed description will be omitted.

<動き情報圧縮部2508の詳細>
次に、動き情報圧縮部2508について図16に示すフローチャートを用いて説明する。動き情報圧縮部2508は、フレーム(もしくはスライス、コーディングユニットなど任意の単位)の復号化処理が終了した際に、動き情報2559を圧縮して時間方向参照動き情報メモリ502に動き情報2559を格納する。
<Details of Motion Information Compression Unit 2508>
Next, the motion information compression unit 2508 will be described using the flowchart shown in FIG. The motion information compression unit 2508 compresses the motion information 2559 and stores the motion information 2559 in the time direction reference motion information memory 502 when the decoding processing of a frame (or an arbitrary unit such as a slice or a coding unit) is completed. .

まず、復号化制御部2510から参照位置情報2560を取得し(ステップS1601)、フレームを動き情報2559の圧縮単位である動き情報圧縮ブロックに分割する(ステップS1602)。動き情報圧縮ブロックは、動き補償処理により動き情報2559が保持される単位(典型的には4x4画素ブロック)より大きい画素ブロックであり、典型的には16x16画素ブロックである。動き情報圧縮ブロックは32x32画素ブロックや8x8画素ブロック、長方形画素ブロック、任意の形状の画素領域であっても構わない。   First, reference position information 2560 is acquired from the decoding control unit 2510 (step S1601), and the frame is divided into motion information compression blocks which are compression units of the motion information 2559 (step S1602). The motion information compression block is a pixel block larger than a unit (typically, 4 × 4 pixel block) in which motion information 2559 is held by motion compensation processing, and is typically a 16 × 16 pixel block. The motion information compression block may be a 32 × 32 pixel block, an 8 × 8 pixel block, a rectangular pixel block, or a pixel region of any shape.

次に、参照位置情報2560に従って代表動き情報位置を生成する(ステップS1603)。代表動き情報位置を生成する一例として、動き情報圧縮ブロックが16x16画素ブロックの場合、図13D、図14D、図17Dにそれぞれ示されるプレディクションユニットのサイズが16x16の場合の参照動き情報取得位置を代表動き情報位置とする。
次に、生成した代表動き情報位置の参照動き情報2558を代表動き情報に設定し(ステップS1605)、当該代表動き情報を時間方向参照動き情報メモリに格納する(ステップS1606)。上記のステップS1604〜S1605をすべての動き情報圧縮ブロックに対して実行する。
Next, the representative motion information position is generated according to the reference position information 2560 (step S1603). As an example of generating a representative motion information position, when the motion information compression block is a 16 × 16 pixel block, the reference motion information acquisition position is representatively represented when the size of the prediction unit shown in FIG. 13D, FIG. The motion information position.
Next, reference motion information 2558 of the generated representative motion information position is set as representative motion information (step S1605), and the representative motion information is stored in the time direction reference motion information memory (step S1606). The above steps S1604 to S1605 are performed on all motion information compression blocks.

動き情報2559が保持される単位をMxMブロック、動き情報圧縮ブロックのサイズをNxN(NはMの倍数)とすると、上記動き情報圧縮処理を実行することにより、参照動き情報メモリの容量を(MxM)/(NxN)に削減することが可能となる。   Assuming that the unit in which the motion information 2559 is held is MxM blocks and the size of the motion information compression block is NxN (N is a multiple of M), the capacity of the reference motion information memory is reduced to (MxM ) / (NxN) can be reduced.

<代表動き情報位置の別の実施形態>
代表動き情報位置を生成する別の例として、複数の参照動き情報取得位置の中心位置を代表動き情報位置としても構わない。図18A及び図18Bはサイズが16x16である動き圧縮ブロック毎の代表動き情報位置を示している。図18Aは、参照動き情報取得位置が図13Dに示される位置である場合の代表動き情報位置、同様に図18Bは、参照動き情報取得位置が図17Dに示される位置である場合の代表動き情報位置をそれぞれ示している。図18A及び図18B中の丸印は、プレディクションユニットが16x16である際の、参照動き情報取得位置を示しており、4点の参照動き情報取得位置の中心位置にバツ印で示される代表動き情報位置を配置している。
Another Embodiment of Representative Motion Information Position
As another example of generating a representative motion information position, the central position of a plurality of reference motion information acquisition positions may be used as the representative motion information position. FIGS. 18A and 18B show representative motion information positions for each motion compression block whose size is 16 × 16. FIG. 18A is a representative motion information position when the reference motion information acquisition position is the position shown in FIG. 13D, and similarly FIG. 18B is a representative motion information when the reference motion information acquisition position is the position shown in FIG. The position is shown respectively. Circles in FIGS. 18A and 18B indicate reference motion information acquisition positions when the prediction unit is 16 × 16, and representative motions indicated by crosses at the center positions of the four reference motion information acquisition positions It arranges the information position.

代表動き情報位置を生成する更に別の例として、複数のプレディクションユニットのサイズ毎の参照動き情報取得位置を参照位置情報2560として有し、複数の参照動き情報取得位置から代表動き情報位置を生成しても構わない。図19は、ツリーブロックが64x64画素ブロックである場合の、プレディクションユニットのサイズが16x16以上の各サイズにおけるプレディクションユニットの中心(参照動き情報取得位置)をそれぞれ示している。   As another example of generating a representative motion information position, a reference motion information acquisition position for each size of a plurality of prediction units is included as reference position information 2560, and a representative motion information position is generated from the plurality of reference motion information acquisition positions It does not matter. FIG. 19 shows the centers (reference motion information acquisition positions) of the prediction units at each size of the prediction unit of 16 × 16 or more when the tree block is a 64 × 64 pixel block.

代表動き情報位置を生成する別の一例として、代表動き情報位置は動き情報圧縮ブロック毎に配置される参照動き情報取得位置を用いて設定されても構わない。図20Aは、動き情報圧縮ブロック毎の複数の参照動き情報取得位置の重心を代表動き情報位置と設定した場合の例を示す。重心位置が4x4ブロックの位置と一致しない場合には、最近傍の4x4ブロックを代表動き情報位置としてもよいし、共一次内挿法などの内挿法を用いて重心位置の参照動きベクトル166を生成しても構わない。   As another example of generating a representative motion information position, the representative motion information position may be set using a reference motion information acquisition position arranged for each motion information compression block. FIG. 20A shows an example where the center of gravity of a plurality of reference motion information acquisition positions for each motion information compression block is set as a representative motion information position. If the position of the center of gravity does not coincide with the position of the 4x4 block, the nearest 4x4 block may be used as the representative motion information position, or a reference motion vector 166 of the center of gravity position is obtained using interpolation such as bilinear interpolation. You may generate it.

また、図20Bは動き情報圧縮ブロック毎に複数の参照動き情報取得位置のいずれかを選択し、代表動き情報位置と設定した場合の例を示す。   Further, FIG. 20B shows an example where one of a plurality of reference motion information acquisition positions is selected for each motion information compression block, and a representative motion information position is set.

更に、図21A、Bにツリーブロック内で各動き情報圧縮ブロックで参照動き情報取得位置を同一にした場合の例を更に示す。全ての動き情報圧縮ブロック内で同一の代表動き情報位置であるため、ツリーブロック内の位置に応じて、代表動き情報位置を切り替える必要はない。また、代表動き情報位置は図21A、B以外にも、動き情報圧縮ブロック内の左上端や右上端等いずれの位置にあっても構わない。   Further, FIGS. 21A and 21B further show an example in which the reference motion information acquisition position is made the same in each motion information compression block in the tree block. Since the representative motion information positions are the same in all the motion information compression blocks, it is not necessary to switch the representative motion information positions according to the position in the tree block. Further, the representative motion information position may be located at any position, such as the upper left end or the upper right end in the motion information compression block, as well as in FIGS. 21A and 21B.

代表動き情報位置を生成する一例、動き情報圧縮ブロック内の4x4ブロック位置をZスキャン順で示すBlkIdxを用いて代表動き情報位置を示しても構わない。動き情報圧縮ブロックのサイズが16x16である場合に、図21Aに示される代表動き情報位置はBlkIdx=12の位置に相当する。また、図21Bに示される代表動き情報位置はBlkIdx=15の位置に相当する。   The representative motion information position may be indicated using BlkIdx indicating the 4x4 block position in the motion information compression block in Z scan order as an example of generating the representative motion information position. When the size of the motion information compression block is 16 × 16, the representative motion information position shown in FIG. 21A corresponds to the position of BlkIdx = 12. The representative motion information position shown in FIG. 21B corresponds to the position of BlkIdx = 15.

動き情報圧縮処理における別の一例として、参照フレーム番号に関するメモリ容量を削減するために、動き情報圧縮処理に参照フレーム番号を含めても構わない。この場合、代表動き情報位置に保持される参照フレーム番号を参照フレーム番号に関するメモリ容量に格納する。従って、図5に示される空間方向参照動き情報メモリ501及び空間方向参照動き情報メモリ502は動きベクトル情報に追加して参照フレーム番号を格納する。   As another example of the motion information compression process, the reference information may be included in the motion information compression process in order to reduce the memory capacity of the reference frame number. In this case, the reference frame number held at the representative motion information position is stored in the memory capacity related to the reference frame number. Therefore, the spatial direction reference motion information memory 501 and the spatial direction reference motion information memory 502 shown in FIG. 5 store the reference frame number in addition to the motion vector information.

動き情報圧縮処理における更に別の一例として、動き情報圧縮処理に参照フレーム番号を含めない場合に、代表動き情報位置にある動き情報内の動きベクトル情報を、参照フレーム番号を用いてスケーリング処理を施して、動き情報メモリ110に格納しても構わない。スケーリング処理の典型例として、参照フレーム番号ゼロを基準とした線形スケーリング処理がある。これは、参照フレーム番号がゼロ以外の値である場合に、動きベクトル情報が参照フレーム番号ゼロに対応する参照フレームを参照するように線形スケーリング処理するものである。上述のスケーリング処理の基準は参照フレーム番号がゼロ以外の値であっても構わない。上述の線形スケーリング処理を行う場合に除算が発生する場合には、予め除算処理をテーブル化しておき、都度テーブルを引くことで上記除算を実現しても構わない。   As another example of the motion information compression processing, when the motion information compression processing does not include the reference frame number, the motion vector information in the motion information at the representative motion information position is subjected to scaling processing using the reference frame number May be stored in the motion information memory 110. As a typical example of the scaling process, there is a linear scaling process based on the reference frame number zero. This is to perform linear scaling processing so that motion vector information refers to a reference frame corresponding to the reference frame number zero when the reference frame number is a value other than zero. The reference of the scaling process described above may be a value other than zero for the reference frame number. When division occurs when the above-described linear scaling processing is performed, the division processing may be previously made into a table, and the division may be realized by drawing a table each time.

動き情報圧縮ブロックのサイズが16x16ブロック以外の場合、上述と同様の処理を用いて代表動き情報位置を生成する。一例では、動き情報圧縮ブロックのサイズが64x64の場合、プレディクションユニットのサイズが64x64における参照動き情報取得位置を代表動き情報位置とする。更に別の一例では、図21A、図21B等で示される動き情報圧縮ブロックのサイズが16x16ブロックにおける代表動き情報位置を、動き情報圧縮ブロックのサイズに従って水平方向及び垂直方向でスケーリングした位置を代表動き情報位置としても構わない。   When the size of the motion information compression block is other than 16 × 16 blocks, the representative motion information position is generated using the same process as described above. In one example, when the size of the motion information compression block is 64x64, the reference motion information acquisition position where the size of the prediction unit is 64x64 is taken as the representative motion information position. In yet another example, the motion information compression block size shown in FIG. 21A, FIG. 21B, etc. represents the representative motion information position in the 16x16 block, and the horizontal and vertical scaled position according to the motion information compression block size represents the representative motion It does not matter as an information position.

代表動き情報位置が、ピクチャやスライスの外であるとして参照動き情報が存在しない場合には、動き情報圧縮ブロックの左上端といった動き情報圧縮ブロック内で参照動き情報が取得可能な位置を新しい代表動き情報位置として置き換えても構わない。また、代表動き情報位置がイントラ予測が適用された領域であって、参照動き情報が存在しない場合にも同様の処理を実行して、新しい代表動き情報位置として置き換えても構わない。   If the reference motion information does not exist because the representative motion information position is outside the picture or slice, a new representative motion is a position where the reference motion information can be acquired in the motion information compression block, such as the upper left end of the motion information compression block. It may be replaced as an information position. Also, even if the representative motion information position is an area to which intra prediction is applied and there is no reference motion information, the same processing may be performed to replace it as a new representative motion information position.

以下、各実施形態の変形例を列挙して紹介する。
第1及び第2の実施形態において、フレームを16×16画素サイズなどの矩形ブロックに分割し、画面左上のブロックから右下に向かって順に符号化/復号化を行う例について説明している(図2Aを参照)。しかしながら、符号化順序及び復号化順序はこの例に限定されない。例えば、右下から左上に向かって順に符号化及び復号化が行われてもよいし、画面中央から画面端に向かって渦巻を描くように符号化及び復号化が行われてもよい。さらに、右上から左下に向かって順に符号化及び復号化が行われてもよいし、画面端から画面中央に向かって渦巻きを描くように符号化及び復号化が行われてもよい。
Hereinafter, modifications of each embodiment will be listed and introduced.
In the first and second embodiments, an example in which a frame is divided into rectangular blocks having a size of 16 × 16 pixels, and encoding / decoding is sequentially performed from the block on the upper left of the screen to the lower right is described. See Figure 2A). However, the coding order and the decoding order are not limited to this example. For example, encoding and decoding may be sequentially performed from the lower right to the upper left, or may be performed so as to draw a spiral from the center of the screen to the edge of the screen. Furthermore, encoding and decoding may be sequentially performed from the upper right to lower left, or may be performed so as to draw a spiral from the screen edge toward the screen center.

第1及び第2の実施形態において、4×4画素ブロック、8×8画素ブロック、16×16画素ブロックなどの予測対象ブロックサイズを例示して説明を行ったが、予測対象ブロックは均一なブロック形状でなくてもよい。例えば、予測対象ブロック(プレディクションユニット)サイズは、16×8画素ブロック、8×16画素ブロック、8×4画素ブロック、4×8画素ブロックなどであってもよい。また、1つのコーディングツリーユニット内で全てのブロックサイズを統一させる必要はなく、複数の異なるブロックサイズを混在させてもよい。1つのコーディングツリーユニット内で複数の異なるブロックサイズを混在させる場合、分割数の増加に伴って分割情報を符号化または復号化するための符号量も増加する。そこで、分割情報の符号量と局部復号画像または復号画像の品質との間のバランスを考慮して、ブロックサイズを選択することが望ましい。   The first and second embodiments have been described by exemplifying the block sizes to be predicted such as 4 × 4 pixel blocks, 8 × 8 pixel blocks, and 16 × 16 pixel blocks, but the blocks to be predicted are uniform blocks It does not have to be in shape. For example, the size of the block to be predicted (prediction unit) may be 16 × 8 pixel block, 8 × 16 pixel block, 8 × 4 pixel block, 4 × 8 pixel block, or the like. Moreover, it is not necessary to unify all block sizes in one coding tree unit, and a plurality of different block sizes may be mixed. When a plurality of different block sizes are mixed in one coding tree unit, the amount of code for encoding or decoding division information also increases as the number of divisions increases. Therefore, it is desirable to select the block size in consideration of the balance between the code amount of the division information and the quality of the local decoded image or the decoded image.

第1及び第2の実施形態において、簡単化のために、輝度信号と色差信号とを区別せず、色信号成分に関して包括的な説明を記述した。しかしながら、予測処理が輝度信号と色差信号との間で異なる場合には、同一または異なる予測方法が用いられてよい。輝度信号と色差信号との間で異なる予測方法が用いられるならば、色差信号に対して選択した予測方法を輝度信号と同様の方法で符号化または復号化できる。   In the first and second embodiments, for the sake of simplicity, the luminance signal and the color difference signal are not distinguished, and a comprehensive description is described regarding color signal components. However, if the prediction process is different between the luminance signal and the color difference signal, the same or different prediction methods may be used. If a different prediction method is used between the luminance signal and the chrominance signal, the selected prediction method for the chrominance signal can be encoded or decoded in the same manner as the luminance signal.

第1及び第2の実施形態において、簡単化のために、輝度信号と色差信号とを区別せず、色信号成分に関して包括的な説明を記述した。しかしながら、直交変換処理が輝度信号と色差信号との間で異なる場合には、同一または異なる直交変換方法が用いられてよい。
輝度信号と色差信号との間で異なる直交変換方法が用いられるならば、色差信号に対して選択した直交変換方法を輝度信号と同様の方法で符号化または復号化できる。
In the first and second embodiments, for the sake of simplicity, the luminance signal and the color difference signal are not distinguished, and a comprehensive description is described regarding color signal components. However, if orthogonal transform processing differs between the luminance signal and the color difference signal, the same or different orthogonal transform method may be used.
If a different orthogonal transformation method is used between the luminance signal and the chrominance signal, the orthogonal transformation method selected for the chrominance signal can be encoded or decoded in the same manner as the luminance signal.

第1及び第2までの実施形態において、シンタクス構成に示す表の行間には、実施形態で規定していないシンタクス要素が挿入されることも可能であるし、それ以外の条件分岐に関する記述が含まれていても構わない。或いは、シンタクステーブルを複数のテーブルに分割、統合することも可能である。また、必ずしも同一の用語を用いる必要は無く、利用する形態によって任意に変更しても構わない。   In the first and second embodiments, syntax elements not defined in the embodiment can be inserted between the rows of the table shown in the syntax configuration, and the descriptions regarding other conditional branches are included. It does not matter. Alternatively, the syntax table can be divided and integrated into a plurality of tables. Further, the same term need not necessarily be used, and may be arbitrarily changed depending on the form to be used.

以上説明したように、各実施形態は、ハードウェア実装及びソフトウェア実装における困難性を緩和しつつ、高効率な直交変換及び逆直交変換を実現することができる。故に、各実施形態によれば、符号化効率が向上し、ひいては主観画質も向上する。   As described above, each embodiment can realize highly efficient orthogonal transformation and inverse orthogonal transformation while alleviating the difficulty in hardware implementation and software implementation. Therefore, according to each embodiment, the coding efficiency is improved, and the subjective image quality is also improved.

また、上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した実施形態の動画像符号化装置及び動画像復号化装置による効果と同様な効果を得ることも可能である。
上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RWなど)、半導体メモリ、またはこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の動画像符号化装置及び動画像復号化装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合または読み込む場合はネットワークを通じて取得または読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本願発明の実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。また、上記各実施形態の処理を実現するプログラムを、インターネットなどのネットワークに接続されたコンピュータ(サーバ)上に格納し、ネットワーク経由でコンピュータ(クライアント)にダウンロードさせてもよい。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本発明の実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
Also, the instructions shown in the processing procedure shown in the above-described embodiment can be executed based on a program that is software. A general-purpose computer system can store this program in advance and read this program to obtain the same effects as those of the moving picture coding apparatus and the moving picture decoding apparatus according to the above-described embodiment. is there.
The instructions described in the above-described embodiment are a program that can be executed by a computer, such as a magnetic disk (flexible disk, hard disk, etc.), an optical disk (CD-ROM, CD-R, CD-RW, DVD-ROM, DVD ± R, DVD ± RW, etc.), semiconductor memory, or similar recording media. The storage format may be any form as long as the storage medium is readable by a computer or an embedded system. If a computer reads a program from the recording medium and causes the CPU to execute an instruction described in the program based on the program, the computer is similar to the video encoding device and the video decoding device according to the above-described embodiment. The operation can be realized. Of course, when a computer acquires or loads a program, it may acquire or load through a network.
In addition, an operating system (OS) operating on a computer based on instructions of a program installed in a computer or an embedded system from a recording medium, database management software, MW (middleware) such as a network, etc. realize this embodiment. You may perform a part of each process for doing.
Furthermore, the recording medium in the embodiment of the present invention is not limited to a medium independent of a computer or an embedded system, and includes a recording medium downloaded and stored or temporarily stored a program transmitted by a LAN, the Internet or the like. Further, the program for realizing the processing of each of the above embodiments may be stored on a computer (server) connected to a network such as the Internet, and downloaded to the computer (client) via the network.
Further, the recording medium is not limited to one, and even when the processing in the present embodiment is executed from a plurality of media, it is included in the recording medium in the embodiment of the present invention, and the configuration of the medium is any configuration. Good.

なお、本願発明の実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本願発明の実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本発明の実施形態における機能を実現することが可能な機器、装置を総称している。
The computer or the embedded system in the embodiment of the present invention is for executing each process in the present embodiment based on the program stored in the recording medium, and is an apparatus comprising one of a personal computer, a microcomputer and the like. The configuration may be any system such as a system in which a plurality of devices are connected to a network.
Further, the computer in the embodiment of the present invention is not limited to a personal computer, but includes an arithmetic processing unit, a microcomputer and the like included in an information processing device, and a device capable of realizing the function in the embodiment of the present invention by a program. It is a generic term for the device.

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   While certain embodiments of the present invention have been described, these embodiments have been presented by way of example only, and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, substitutions, and modifications can be made without departing from the scope of the invention. These embodiments and modifications thereof are included in the scope and the gist of the invention, and are included in the invention described in the claims and the equivalent scope thereof.

100…画像符号化装置、101…減算部、102…直交変換部、103…量子化部、104、2502…逆量子化部、105、2503…逆直交変換部、106、2504、2706…加算部、107、2505…参照画像メモリ、108、2506…インター予測部、109…動き情報圧縮部、110…動き情報メモリ、112…エントロピー符号化部、113…出力バッファ、114…符号化制御部、401…パラメータ符号化部、402…変換係数符号化部、403…動き情報符号化部、404…多重化部、901…参照動きベクトル取得部、902…予測動きベクトル選択スイッチ、903…減算部、904…差分動き情報符号化部、905…予測動き情報位置符号化部、906…多重化部、2500…動画像復号化装置、2501…エントロピー復号化部、2507…参照動き情報メモリ、2508…参照動き情報圧縮部、2510…復号化制御部、2601、2701…分離部、2602…パラメータ復号化部、2603…変換係数復号化部、2604…動き情報復号化部、2702…差分動き情報復号化部、2503…予測動き情報位置復号化部、2704…参照動き情報取得部、2705…予測動き情報選択スイッチ。 DESCRIPTION OF SYMBOLS 100 ... Image coding apparatus, 101 ... Subtraction part, 102 ... Orthogonal transformation part, 103 ... Quantization part, 104, 2502 ... Dequantization part, 105, 2503 ... Inverse orthogonal transformation part, 106, 2504, 2706 ... Addition part 107, 2505 Reference image memory 108, 2506 Inter prediction unit 109 Motion information compression unit 110 Motion information memory 112 Entropy coding unit 113 Output buffer 114 Coding control unit 401 ... Parameter coding unit 402 ... Transform coefficient coding unit 403 ... Motion information coding unit 404 ... Multiplexing unit 901 ... Reference motion vector acquisition unit 902 ... Predicted motion vector selection switch 903 ... Subtraction unit 904 ... Differential motion information coding unit, 905 ... Predictive motion information position coding unit, 906 ... Multiplexing unit, 2500 ... Moving picture decoding apparatus, 250 ... Entropy decoding unit, 2507 ... Reference motion information memory, 2508 ... Reference motion information compression unit, 2510 ... Decoding control unit, 2601, 2701 ... Separation unit, 2602 ... Parameter decoding unit, 2603 ... Transform coefficient decoding unit, 2604 ... motion information decoding unit, 2702 ... differential motion information decoding unit, 2503 ... predicted motion information position decoding unit, 2704 ... reference motion information acquisition unit, 2705 ... prediction motion information selection switch.

Claims (18)

第1フレームにおいて少なくとも復号対象ブロックを有する符号化データを復号するための方法であって、
インター予測にかかる少なくとも動きベクトルが、マージブロックから導かれるかどうかを示すマージフラグを復号し、
前記インター予測にかかる少なくとも動きベクトルが前記マージブロックから導かれることを前記マージフラグが示す場合に、前記第1フレームにおける前記復号対象ブロックの少なくとも1つの隣接ブロックから第1動きベクトル候補を導き、
前記インター予測にかかる少なくとも動きベクトルが前記マージブロックから導かれることを前記マージフラグが示す場合に、前記第1フレームとは異なる第2フレームにおける、参照ブロックの代表位置から第2動きベクトル候補を導き、
前記少なくとも1つの隣接ブロックと前記参照ブロックとの中から前記マージブロックを特定するマージインデックスを復号し、
前記マージインデックスに従って前記第1動きベクトル候補と前記第2動きベクトル候補とのいずれか1つから前記復号対象ブロックの第1動きベクトルを導く、ことを備え、
前記参照ブロックは、前記復号対象ブロックの前記第1フレーム上の第1位置に基づき決定されるものであって、前記第2フレーム上の前記第1位置を有するブロックであり、
前記代表位置は、前記参照ブロックの第2位置及びサイズに従って決定される位置であって、前記代表位置は前記参照ブロックの中の位置と、前記参照ブロックの中心以外の位置とのうちいずれかと決定されるものであって、
前記参照ブロックの中心の位置と、前記参照ブロックの中心以外の位置とのうちいずれが前記代表位置であるかを特定する情報は、少なくとも前記第2位置または前記サイズに基づいて決定される、方法。
A method for decoding encoded data having at least a decoding target block in a first frame, the method comprising:
Decode a merge flag indicating whether at least motion vectors for inter prediction are derived from the merge block,
The first motion vector candidate is derived from at least one adjacent block of the block to be decoded in the first frame, when the merge flag indicates that at least a motion vector for inter prediction is derived from the merge block,
The second motion vector candidate is derived from the representative position of the reference block in a second frame different from the first frame when the merge flag indicates that at least a motion vector involved in the inter prediction is derived from the merge block. ,
Decoding a merge index identifying the merge block from among the at least one neighboring block and the reference block;
Deriving a first motion vector of the current block from any one of the first motion vector candidate and the second motion vector candidate according to the merge index,
The reference block is determined based on a first position on the first frame of the decoding target block, and is a block having the first position on the second frame,
The representative position is a position determined in accordance with the second position and the size of the reference block, the representative position is a position of the center of the said reference block, and one of the positions other than the center of the reference block To be determined,
Information specifying which of the position of the center of the reference block and the position other than the center of the reference block is the representative position is determined based on at least the second position or the size. .
前記第1動きベクトルに従って参照画像を導き、
前記参照画像を使用する前記インター予測により予測画像を生成する、ことをさらに備える請求項1に記載の方法。
Derive a reference image according to the first motion vector;
The method according to claim 1, further comprising generating a predicted image by the inter prediction using the reference image.
前記符号化データから変換係数を復号し、
前記変換係数の少なくとも逆変換により予測誤差値を導き、
少なくとも前記予測誤差値と前記予測画像との加算により復号画像を導く、ことをさらに備える請求項2に記載の方法。
Decoding transform coefficients from the encoded data;
Deriving a prediction error value by at least an inverse transformation of the transformation coefficients;
3. The method of claim 2, further comprising: deriving a decoded image by addition of at least the prediction error value and the predicted image.
前記少なくとも1つの隣接ブロックは、(1)前記復号対象ブロックの左下側のブロック、(2)前記復号対象ブロックの左側のブロック、(3)前記復号対象ブロックの右上側のブロック、(4)前記復号対象ブロックの上側のブロック、(5)前記復号対象ブロックの左上側のブロック、のうちの少なくとも1つである、請求項1乃至請求項3のいずれか1項に記載の方法。   The at least one adjacent block is (1) a block on the lower left side of the block to be decoded, (2) a block on the left side of the block to be decoded, (3) a block on the upper right side of the block to be decoded, The method according to any one of claims 1 to 3, which is at least one of an upper block of a block to be decoded and (5) a block on the upper left side of the block to be decoded. 前記マージブロックとして前記第1動きベクトル候補を示すマージインデックスの第1数は、前記マージブロックとして前記第2動きベクトル候補を示す前記マージインデックスの第2数より少ない、請求項1乃至請求項3のいずれか1項に記載の方法。   The first number of merge indices indicating the first motion vector candidate as the merge block is smaller than the second number of the merge indices indicating the second motion vector candidate as the merge block. The method according to any one of the preceding claims. 前記参照ブロックは、前記復号対象ブロックの位置に従って決定される位置を含むブロックである、請求項1乃至請求項5のいずれか1項に記載の方法。   The method according to any one of claims 1 to 5, wherein the reference block is a block including a position determined according to a position of the block to be decoded. 前記代表位置は、前記参照ブロックの前記中心だけでなく、前記参照ブロックの端位置に従って決定される位置をも含むブロックである、請求項1乃至請求項6のいずれか1項に記載の方法。   The method according to any one of claims 1 to 6, wherein the representative position is a block including not only the center of the reference block but also a position determined according to an end position of the reference block. 通信リンクを介して前記符号化データを受信し、
バッファに前記符号化データの少なくとも一部を一時的に格納し、
前記バッファから前記符号化データの少なくとも一部を中央処理装置(CPU)によって読み出し、
前記符号化データから前記第1動きベクトルを前記中央処理装置によって導く、ことをさらに備える請求項1乃至請求項7のいずれか1項に記載の方法。
Receiving the encoded data via a communication link;
Temporarily storing at least a portion of the encoded data in a buffer;
Reading at least a part of the encoded data from the buffer by a central processing unit (CPU);
The method according to any of the preceding claims, further comprising: deriving the first motion vector from the encoded data by the central processing unit.
通信リンクを介して前記符号化データを受信し、
バッファに前記符号化データの少なくとも一部を一時的に格納し、
前記バッファから前記符号化データの少なくとも一部を電子回路によって読み出し、
前記符号化データから前記第1動きベクトルを前記電子回路によって導く、ことをさらに備え、
前記電子回路はフィールドプログラマブルゲートアレイ(FPGA)またはデジタルシグナルプロセッサ(DSP)である請求項1乃至請求項7のいずれか1項に記載の方法。
Receiving the encoded data via a communication link;
Temporarily storing at least a portion of the encoded data in a buffer;
Reading at least a part of the encoded data from the buffer by an electronic circuit;
The electronic circuit may further derive the first motion vector from the encoded data.
The method according to any one of claims 1 to 7, wherein the electronic circuit is a field programmable gate array (FPGA) or a digital signal processor (DSP).
第1フレームにおいて少なくとも復号対象ブロックを有する符号化データを復号するための電子装置であって、
インター予測にかかる少なくとも動きベクトルが、マージブロックから導かれるかどうかを示すマージフラグを復号し、
前記インター予測にかかる少なくとも動きベクトルが前記マージブロックから導かれることを前記マージフラグが示す場合に、前記第1フレームにおける前記復号対象ブロックの少なくとも1つの隣接ブロックから第1動きベクトル候補を導き、
前記インター予測にかかる少なくとも動きベクトルが前記マージブロックから導かれることを前記マージフラグが示す場合に、前記第1フレームとは異なる第2フレームにおける、参照ブロックの代表位置から第2動きベクトル候補を導き、
前記少なくとも1つの隣接ブロックと前記参照ブロックとの中から前記マージブロックを特定するマージインデックスを復号し、
前記マージインデックスに従って前記第1動きベクトル候補と前記第2動きベクトル候補とのいずれか1つから前記復号対象ブロックの第1動きベクトルを導く、復号器を備え、
前記参照ブロックは、前記復号対象ブロックの前記第1フレーム上の第1位置に基づき決定されるものであって、前記第2フレーム上の前記第1位置を有するブロックであり、
前記代表位置は、前記参照ブロックの第2位置及びサイズに従って決定される位置であって、前記代表位置は前記参照ブロックの中の位置と、前記参照ブロックの中心以外の位置とのうちいずれかと決定されるものであって、
前記参照ブロックの中心の位置と、前記参照ブロックの中心以外の位置とのうちいずれが前記代表位置であるかを特定する情報は、少なくとも前記第2位置または前記サイズに基づいて決定される、電子装置。
An electronic apparatus for decoding encoded data having at least a decoding target block in a first frame, the electronic apparatus comprising:
Decode a merge flag indicating whether at least motion vectors for inter prediction are derived from the merge block,
The first motion vector candidate is derived from at least one adjacent block of the block to be decoded in the first frame, when the merge flag indicates that at least a motion vector for inter prediction is derived from the merge block,
The second motion vector candidate is derived from the representative position of the reference block in a second frame different from the first frame when the merge flag indicates that at least a motion vector involved in the inter prediction is derived from the merge block. ,
Decoding a merge index identifying the merge block from among the at least one neighboring block and the reference block;
The decoder is configured to derive a first motion vector of the current block from any one of the first motion vector candidate and the second motion vector candidate according to the merge index.
The reference block is determined based on a first position on the first frame of the decoding target block, and is a block having the first position on the second frame,
The representative position is a position determined in accordance with the second position and the size of the reference block, the representative position is a position of the center of the said reference block, and one of the positions other than the center of the reference block To be determined,
Information specifying which of the position of the center of the reference block and the position other than the center of the reference block is the representative position is determined based on at least the second position or the size. apparatus.
前記復号器はさらに、
前記第1動きベクトルに従って参照画像を導き、
前記参照画像を使用する前記インター予測により予測画像を生成する、請求項10に記載の電子装置。
The decoder further comprises
Derive a reference image according to the first motion vector;
The electronic device according to claim 10, wherein a predicted image is generated by the inter prediction using the reference image.
前記復号器はさらに、
前記符号化データから変換係数を復号し、
前記変換係数の少なくとも逆変換により予測誤差値を導き、
少なくとも前記予測誤差値と前記予測画像との加算により復号画像を導く、請求項11に記載の電子装置。
The decoder further comprises
Decoding transform coefficients from the encoded data;
Deriving a prediction error value by at least an inverse transformation of the transformation coefficients;
The electronic device according to claim 11, wherein a decoded image is derived by adding at least the prediction error value and the predicted image.
前記少なくとも1つの隣接ブロックは、(1)前記復号対象ブロックの左下側のブロック、(2)前記復号対象ブロックの左側のブロック、(3)前記復号対象ブロックの右上側のブロック、(4)前記復号対象ブロックの上側のブロック、(5)前記復号対象ブロックの左上側のブロック、のうちの少なくとも1つである、請求項10乃至請求項12のいずれか1項に記載の電子装置。   The at least one adjacent block is (1) a block on the lower left side of the block to be decoded, (2) a block on the left side of the block to be decoded, (3) a block on the upper right side of the block to be decoded, The electronic device according to any one of claims 10 to 12, wherein the electronic device is at least one of an upper block of a block to be decoded and (5) a block on the upper left side of the block to be decoded. 前記マージブロックとして前記第1動きベクトル候補を示すマージインデックスの第1数は、前記マージブロックとして前記第2動きベクトル候補を示す前記マージインデックスの第2数より少ない、請求項10乃至請求項12のいずれか1項に記載の電子装置。   The first number of merge indices indicating the first motion vector candidate as the merge block is smaller than the second number of the merge indices indicating the second motion vector candidate as the merge block. Electronic device given in any 1 paragraph. 前記参照ブロックは、前記復号対象ブロックの位置に従って決定される位置を含むブロックである、請求項10乃至請求項14のいずれか1項に記載の電子装置。   The electronic device according to any one of claims 10 to 14, wherein the reference block is a block including a position determined according to a position of the block to be decoded. 前記代表位置は、前記参照ブロックの前記中心だけでなく、前記参照ブロックの端位置に従って決定される位置をも含むブロックである、請求項10乃至請求項15のいずれか1項に記載の電子装置。   The electronic device according to any one of claims 10 to 15, wherein the representative position is a block including not only the center of the reference block but also a position determined according to an end position of the reference block. . 通信リンクを介して前記符号化データを受信する通信回路と、
前記符号化データの少なくとも一部を一時的に格納するバッファと、をさらに備え、
前記復号器はさらに、
前記バッファから前記符号化データの少なくとも一部を中央処理装置(CPU)によって読み出し、
前記符号化データから前記第1動きベクトルを前記中央処理装置によって導く、請求項10乃至請求項16のいずれか1項に記載の電子装置。
A communication circuit for receiving the encoded data via a communication link;
A buffer for temporarily storing at least a part of the encoded data;
The decoder further comprises
Reading at least a part of the encoded data from the buffer by a central processing unit (CPU);
The electronic device according to any one of claims 10 to 16, wherein the central processing unit derives the first motion vector from the encoded data.
通信リンクを介して前記符号化データを受信する通信回路と、
前記符号化データの少なくとも一部を一時的に格納するバッファと、をさらに備え、
前記復号器はさらに、
前記バッファから前記符号化データの少なくとも一部を読み出し、
前記符号化データから前記第1動きベクトルを導き、
前記復号器はフィールドプログラマブルゲートアレイ(FPGA)またはデジタルシグナルプロセッサ(DSP)である請求項10乃至請求項16のいずれか1項に記載の電子装置。
A communication circuit for receiving the encoded data via a communication link;
A buffer for temporarily storing at least a part of the encoded data;
The decoder further comprises
Read at least a part of the encoded data from the buffer;
Deriving the first motion vector from the encoded data;
The electronic device according to any one of claims 10 to 16, wherein the decoder is a field programmable gate array (FPGA) or a digital signal processor (DSP).
JP2018000599A 2018-01-05 2018-01-05 Moving picture decoding method and electronic apparatus Active JP6510084B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018000599A JP6510084B2 (en) 2018-01-05 2018-01-05 Moving picture decoding method and electronic apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018000599A JP6510084B2 (en) 2018-01-05 2018-01-05 Moving picture decoding method and electronic apparatus

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017118823A Division JP6503014B2 (en) 2017-06-16 2017-06-16 Moving picture coding method and moving picture decoding method

Publications (2)

Publication Number Publication Date
JP2018085751A JP2018085751A (en) 2018-05-31
JP6510084B2 true JP6510084B2 (en) 2019-05-08

Family

ID=62237681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018000599A Active JP6510084B2 (en) 2018-01-05 2018-01-05 Moving picture decoding method and electronic apparatus

Country Status (1)

Country Link
JP (1) JP6510084B2 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101452859B1 (en) * 2009-08-13 2014-10-23 삼성전자주식회사 Method and apparatus for encoding and decoding motion vector
WO2011125211A1 (en) * 2010-04-08 2011-10-13 株式会社 東芝 Image encoding method and image decoding method
JP2012186760A (en) * 2011-03-08 2012-09-27 Jvc Kenwood Corp Video decoding device, video decoding method, and video decoding program
JP5807588B2 (en) * 2011-03-08 2015-11-10 株式会社Jvcケンウッド Moving picture encoding apparatus, moving picture encoding method, moving picture encoding program, transmission apparatus, transmission method, and transmission program
GB2488815C (en) * 2011-03-09 2018-03-28 Canon Kk Video decoding

Also Published As

Publication number Publication date
JP2018085751A (en) 2018-05-31

Similar Documents

Publication Publication Date Title
US11647219B2 (en) Image encoding and decoding method with merge flag and motion vectors
US20140105295A1 (en) Moving image encoding method and apparatus, and moving image decoding method and apparatus
JP6503014B2 (en) Moving picture coding method and moving picture decoding method
JP6871447B2 (en) Moving image coding method and moving image decoding method
JP6528635B2 (en) Moving picture coding apparatus, moving picture coding method, and computer program for moving picture coding
JP6510084B2 (en) Moving picture decoding method and electronic apparatus
JP6871442B2 (en) Moving image coding method and moving image decoding method
JP6871343B2 (en) Moving image coding method and moving image decoding method
JP2016106494A (en) Moving image encoding method and moving image decoding method
JP5893178B2 (en) Video encoding method and video decoding method
JP5680778B2 (en) Video encoding method and video decoding method
CN105933709B (en) Moving image encoding method, moving image encoding device, moving image decoding method, and moving image decoding device

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181030

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190104

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190204

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20190213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190403

R151 Written notification of patent or utility model registration

Ref document number: 6510084

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151