JP5442688B2 - Moving picture coding apparatus and method, and moving picture decoding apparatus and method - Google Patents

Moving picture coding apparatus and method, and moving picture decoding apparatus and method Download PDF

Info

Publication number
JP5442688B2
JP5442688B2 JP2011207689A JP2011207689A JP5442688B2 JP 5442688 B2 JP5442688 B2 JP 5442688B2 JP 2011207689 A JP2011207689 A JP 2011207689A JP 2011207689 A JP2011207689 A JP 2011207689A JP 5442688 B2 JP5442688 B2 JP 5442688B2
Authority
JP
Japan
Prior art keywords
image
moving image
prediction
stereo
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011207689A
Other languages
Japanese (ja)
Other versions
JP2012019547A (en
Inventor
禎篤 加藤
チュンセン ブン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2011207689A priority Critical patent/JP5442688B2/en
Publication of JP2012019547A publication Critical patent/JP2012019547A/en
Application granted granted Critical
Publication of JP5442688B2 publication Critical patent/JP5442688B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、いわゆる右目画像(右眼用画像ともいう)と、いわゆる左目画像(左眼用画像ともいう)を縦1列ごとに交互に並べた動画像(いわゆるステレオ動画像)、および奇数行画像と偶数行画像を横1行ごとに交互に並べた動画像(いわゆるインターレース動画像)を符号化する動画像符号化装置および方法、並びに、上記ステレオ動画像およびインターレース動画像を復号化する動画像復号化装置および方法に関する。   The present invention relates to a so-called right-eye image (also referred to as a right-eye image) and a so-called left-eye image (also referred to as a left-eye image) alternately arranged in vertical columns (so-called stereo moving images), and odd rows Moving image encoding apparatus and method for encoding moving images (so-called interlaced moving images) in which images and even-numbered row images are arranged alternately every horizontal row, and moving images for decoding the stereo moving images and interlaced moving images The present invention relates to an image decoding apparatus and method.

なお、「左フィールド画像」とは、右目画像と左目画像とを縦1列ごとに交互に並べられたステレオ動画像において、左目画像のみを抽出して得られる画像を意味し、「右フィールド画像」とは、上記のステレオ動画像において、右目画像のみを抽出して得られる画像を意味する。   The “left field image” means an image obtained by extracting only the left eye image in a stereo moving image in which the right eye image and the left eye image are alternately arranged in a vertical column. "Means an image obtained by extracting only the right-eye image from the stereo moving image.

立体動画像表示装置の一つとして、図1に示すような多数の画像配列から成るフィルター10を具備した液晶ディスプレイ11の前面に、多数の孔が開設されたスリット板12を配置した構成のパララックスバリア方式の立体映像表示装置が知られている。この立体映像表示装置は、視聴者の左目13からはフィルター上の左目画像Lのみが見え、視聴者の右目14からはフィルター上の右目画像Rのみが見えるように構成されているため、視聴者は立体動画像を視認することができる。なお、図1のスリット板12に代えて、レンチキュラー板を配置した構成の立体映像表示装置も知られている。   As one of the stereoscopic moving image display devices, a parallax having a configuration in which a slit plate 12 having a large number of holes is arranged on the front surface of a liquid crystal display 11 having a filter 10 having a large number of image arrays as shown in FIG. Lux barrier type stereoscopic image display devices are known. This stereoscopic image display apparatus is configured so that only the left eye image L on the filter can be seen from the viewer's left eye 13 and only the right eye image R on the filter can be seen from the viewer's right eye 14, so that the viewer Can visually recognize a stereoscopic moving image. In addition, it replaces with the slit board 12 of FIG. 1, and the three-dimensional video display apparatus of the structure which has arrange | positioned the lenticular board is also known.

また、他の立体動画像符号化方式としては、例えば下記の特許文献1に開示された「立体映像伝送方法及び装置」が知られている。この技術では、図2(a)に示す縦1列ごとに交互に左目画像と右目画像が配置された立体画像に対し、まず図2(b)に示すように画像の左半分に左目画像を、右半分に右目画像を集めて再配置することで変換画像を作成する。次に、作成された変換画像に対し、動画像符号化、符号化データの送信、符号化データの受信、動画像復号化といった処理が行われる。その後、復号化された変換画像の画素配置を、再度、縦1列ごとに交互に左目画像と右目画像を配置し直して、入力信号である立体画像と同じ画像を再現する。   As another stereoscopic video encoding method, for example, a “stereoscopic video transmission method and apparatus” disclosed in Patent Document 1 below is known. In this technique, a left-eye image is first placed on the left half of the image as shown in FIG. 2 (b) with respect to the stereoscopic image in which the left-eye image and the right-eye image are alternately arranged for each vertical column shown in FIG. 2 (a). The right eye image is collected in the right half and rearranged to create a converted image. Next, processing such as video encoding, transmission of encoded data, reception of encoded data, and video decoding is performed on the created converted image. Thereafter, the pixel arrangement of the decoded converted image is re-arranged with the left-eye image and the right-eye image alternately for each vertical column, and the same image as the stereoscopic image that is the input signal is reproduced.

特開平11−18111号公報Japanese Patent Laid-Open No. 11-18111

立体画像では、近くの物体は左目画像と右目画像との視差が大きいが、遠くの物体は左目画像と右目画像との視差はほとんどない。そのため、特に遠くの物体を示すブロックにおいて、左目画像と右目画像との相関性を利用することにより、データ圧縮効率を向上させることができる。   In a stereoscopic image, a nearby object has a large parallax between the left-eye image and the right-eye image, but a distant object has little parallax between the left-eye image and the right-eye image. Therefore, data compression efficiency can be improved by utilizing the correlation between the left-eye image and the right-eye image, particularly in a block indicating a distant object.

ところが、上記の従来技術では、変換画像において、左半分に左目画像を、右半分に右目画像を配置しているため、動画像符号化を行う場合、左目画像と右目画像との相関性を利用できず、データ圧縮効率を向上させることができない、という課題がある。   However, in the above prior art, in the converted image, the left eye image is arranged in the left half and the right eye image is arranged in the right half. Therefore, when performing video coding, the correlation between the left eye image and the right eye image is used. There is a problem that data compression efficiency cannot be improved.

また、変換画像において、一度、左半分に左目画像を、右半分に右目画像を配置して符号化するため、前述したパララックスバリア方式の立体動画像表示装置で表示する場合には、復号化処理後の画像の画素配置を変更することで、再度、左目画像と右目画像とを縦1列ごとに交互に配置し直す必要がある。このため、処理の効率化が困難であるという課題がある。   In addition, in the converted image, the left eye image is arranged once in the left half and the right eye image is arranged in the right half and encoded. Therefore, when the converted image is displayed on the above-described parallax barrier stereoscopic moving image display device, decoding is performed. By changing the pixel arrangement of the processed image, it is necessary to again arrange the left-eye image and the right-eye image alternately for each vertical column. For this reason, there exists a subject that the efficiency of a process is difficult.

本発明は、上記課題を解決するために成されたものであり、立体動画像に対する画像処理を効率良く行うことができる動画像符号化装置および方法、並びに動画像復号化装置および方法を提供することを目的とする。   The present invention has been made to solve the above-described problems, and provides a moving image encoding apparatus and method, and a moving image decoding apparatus and method capable of efficiently performing image processing on a stereoscopic moving image. For the purpose.

上記目的を達成するために、本発明の動画像符号化装置は、右目画像と左目画像を縦1列ごとに交互に並べたステレオ動画像、および奇数行画像と偶数行画像を横1行ごとに交互に並べたインターレース動画像を符号化する動画像符号化装置であって、符号化対象の動画像がステレオ動画像であるか否かを判定する動画像種別判定部と、符号化対象の動画像がステレオ動画像であると判定された場合に、当該動画像における縦方向が横方向に変わるように、当該動画像を所定方向に所定角度回転させる動画像回転部と、ステレオ動画像でないと判定された動画像、およびステレオ動画像であると判定され前記所定角度回転した動画像をインターレース符号化する動画像インターレース符号化部と、符号化対象の動画像がステレオ動画像であるか否かを示すステレオ画像識別子を符号化するステレオ画像識別子符号化部と、前記動画像インターレース符号化部によるインターレース符号化で得られた符号化ビットストリームと、前記ステレオ画像識別子符号化部による符号化で得られたステレオ画像識別子の符号とを多重化することで多重化符号化ビットストリームを作成する多重化部とを備えることを特徴とする。   In order to achieve the above object, the moving image encoding apparatus of the present invention includes a stereo moving image in which a right eye image and a left eye image are alternately arranged in a vertical column, and an odd row image and an even row image in each horizontal row. A moving image encoding apparatus that encodes interlaced moving images arranged alternately, a moving image type determining unit that determines whether or not a moving image to be encoded is a stereo moving image, and an encoding target When it is determined that the moving image is a stereo moving image, a moving image rotating unit that rotates the moving image by a predetermined angle in a predetermined direction so that the vertical direction of the moving image changes to a horizontal direction, and a non-stereo moving image A moving image interlace encoding unit that interlace-codes the moving image determined to be a stereo moving image and the moving image that has been rotated by the predetermined angle, and the encoding target moving image is a stereo moving image A stereo image identifier encoding unit that encodes a stereo image identifier indicating whether or not, an encoded bitstream obtained by interlace encoding by the moving image interlace encoding unit, and encoding by the stereo image identifier encoding unit And a multiplexing unit that creates a multiplexed encoded bit stream by multiplexing the codes of the stereo image identifiers obtained in the above.

なお、上記の動画像種別判定部は、入力された画像信号に基づいて、符号化対象の動画像がステレオ動画像であるか否かを判定してもよいし、予め定めた規則に従って符号化対象の動画像がステレオ動画像であるか否かを判定してもよい。   The moving image type determination unit may determine whether the moving image to be encoded is a stereo moving image based on the input image signal, or may perform encoding according to a predetermined rule. It may be determined whether or not the target moving image is a stereo moving image.

また、上記の動画像回転部は、符号化対象の動画像がステレオ動画像であると判定された場合に、当該動画像における縦方向が横方向に変わるように、例えば、当該動画像を右に+90°回転させてもよいし、当該動画像を右に−90°回転させてもよい。   In addition, when the moving image to be encoded is determined to be a stereo moving image, the moving image rotating unit described above, for example, moves the moving image to the right so that the vertical direction in the moving image changes to the horizontal direction. May be rotated + 90 °, or the moving image may be rotated −90 ° to the right.

このとき、前記ステレオ画像識別子符号化部は、前記動画像回転部によって符号化対象の動画像に対し行われた回転に関する情報を、ステレオ画像識別子に含めて符号化することが望ましい。   At this time, it is preferable that the stereo image identifier encoding unit encodes the stereo image identifier including information on rotation performed on the moving image to be encoded by the moving image rotation unit.

上記目的を達成するために、本発明の動画像符号化装置は、右目画像と左目画像を縦1列ごとに交互に並べたステレオ動画像、および奇数行画像と偶数行画像を横1行ごとに交互に並べたインターレース動画像を符号化する動画像符号化装置であって、符号化対象の動画像を表す入力画像信号に基づいて、当該符号化対象の動画像がステレオ動画像であるかインターレース動画像であるかの種別を判定する動画像種別判定部と、フレーム間予測モードが選択され且つ前記判定により得られた動画像の種別がステレオ動画像である場合、入力画像をフレーム画像としてフレーム間予測したケースと入力画像を右目画像と左目画像とに分離してフレーム間予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム間予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム間予測」を、入力画像を右目画像と左目画像とに分離してフレーム間予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム間予測」を、予測モードとして選択し、フレーム間予測モードが選択され且つ前記判定により得られた動画像の種別がインターレース動画像である場合、入力画像をフレーム画像としてフレーム間予測したケースと入力画像を奇数行画像と偶数行画像とに分離してフレーム間予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム間予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム間予測」を、入力画像を奇数行画像と偶数行画像とに分離してフレーム間予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム間予測」を、予測モードとして選択し、フレーム内予測モードが選択され且つ前記判定により得られた動画像の種別がステレオ動画像である場合、入力画像をフレーム画像としてフレーム内予測したケースと入力画像を右目画像と左目画像とに分離してフレーム内予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム内予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム内予測」を、入力画像を右目画像と左目画像とに分離してフレーム内予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム内予測」を、予測モードとして選択し、フレーム内予測モードが選択され且つ前記判定により得られた動画像の種別がインターレース動画像である場合、入力画像をフレーム画像としてフレーム内予測したケースと入力画像を奇数行画像と偶数行画像とに分離してフレーム内予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム内予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム内予測」を、入力画像を奇数行画像と偶数行画像とに分離してフレーム内予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム内予測」を、予測モードとして選択し、予測モードとして「フレーム画像でのフレーム間予測」又は「フィールド画像でのフレーム間予測」が選択された場合、当該符号化対象の動画像に対する動きベクトルを検出する動き検出部と、前記動画像の種別、前記選択された予測モードおよび前記検出された動きベクトルに基づいて、前記動画像に対し、動き補償を行う動き補償部と、前記動画像の種別および前記選択された予測モードに基づいて、前記動画像に対し、空間予測を行う空間予測部と、前記動画像の種別および前記選択された予測モードに基づいて、前記動き補償または前記空間予測により得られた予測画像信号と前記入力画像信号との差分として得られる予測残差信号に対し、直交変換を行う直交変換部と、前記動画像の種別および前記選択された予測モードに基づいて、前記直交変換後の画像データに対し、可変長符号化を含む所定の画像処理を行う可変長符号化部と、前記動画像の種別および前記選択された予測モードに基づいて、前記直交変換後の画像データに対し、逆直交変換を含む所定の画像処理を行う逆直交変換部とを備えることを特徴とする。 In order to achieve the above object, the moving image encoding apparatus of the present invention includes a stereo moving image in which a right eye image and a left eye image are alternately arranged in a vertical column, and an odd row image and an even row image in each horizontal row. A video encoding device that encodes interlaced video images alternately arranged on the basis of an input video signal representing a video to be encoded, and whether the video to be encoded is a stereo video A moving image type determining unit that determines the type of an interlaced moving image, and when the inter-frame prediction mode is selected and the moving image type obtained by the determination is a stereo moving image, the input image is used as a frame image. Compare the coding efficiency of the case of inter-frame prediction and the case of inter-frame prediction by separating the input image into a right-eye image and a left-eye image, and inter-frame prediction using the input image as a frame image If the coding efficiency of the case is higher, if the inter-frame prediction is performed with the input image separated into the right-eye image and the left-eye image, the inter-frame prediction is performed. When “interframe prediction in a field image” is selected as a prediction mode, when the interframe prediction mode is selected and the type of moving image obtained by the determination is an interlaced moving image, the input image is used as a frame image. The coding efficiency of the case where the inter prediction was compared with the case where the inter prediction was compared with the case where the input image was separated into the odd row image and the even row image and the inter frame prediction was compared. If it is higher, the inter-frame prediction with the frame image is used for the case where the input image is separated into the odd-numbered image and the even-numbered row image and the inter-frame prediction is performed. When the coding efficiency is higher, “inter-frame prediction with field image” is selected as the prediction mode, the intra-frame prediction mode is selected, and the type of moving image obtained by the determination is a stereo moving image The intra-frame prediction using the input image as the frame image and the case where the input image is separated into the right-eye image and the left-eye image and the intra-frame prediction is compared. When the encoding efficiency of the case is higher than that of the case where the intra-frame prediction is performed by separating the input image into the right-eye image and the left-eye image, and the intra-frame prediction is performed. Selects “intraframe prediction in a field image” as the prediction mode, the intraframe prediction mode is selected, and the type of moving image obtained by the above determination When the other is an interlaced video, the encoding efficiency is compared between the case where the input image is predicted in the frame as a frame image and the case where the input image is separated into the odd row image and the even row image and predicted in the frame, When the intra-frame prediction is performed with the input image as the frame image, the intra-frame prediction is performed by separating the intra-frame prediction with the frame image into the odd-numbered and even-numbered row images. If the encoding efficiency of the selected case is higher, select “intraframe prediction in the field image” as the prediction mode, and select “interframe prediction in the frame image” or “interframe prediction in the field image” as the prediction mode. If the "is selected, a motion detection unit for detecting a motion vector for the moving picture of the coding target, the type of the moving image, which is the selected Based on the measurement mode and the detected motion vector, a motion compensation unit that performs motion compensation on the moving image, and on the moving image based on the type of the moving image and the selected prediction mode, Obtained as a difference between the predicted image signal obtained by the motion compensation or the spatial prediction and the input image signal based on the spatial prediction unit that performs spatial prediction, the type of the moving image, and the selected prediction mode. An orthogonal transform unit that performs orthogonal transform on the prediction residual signal, and a predetermined length including variable length coding for the image data after the orthogonal transform based on the type of the moving image and the selected prediction mode A variable-length encoding unit that performs image processing, and a predetermined value including inverse orthogonal transform for the image data after the orthogonal transform based on the type of the moving image and the selected prediction mode Characterized in that it comprises an inverse orthogonal transform unit for performing image processing.

このとき、前記動き検出部は、符号化対象の動画像がステレオ動画像で、前記選択した予測モードに基づき符号化対象領域をフィールド画像として予測する場合に、符号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、動きベクトルを検出することが望ましい。   At this time, the motion detection unit determines that the encoding target region is a left field image when the encoding target moving image is a stereo moving image and the encoding target region is predicted as a field image based on the selected prediction mode. It is desirable to detect a motion vector for each field separated right and left as a right field image.

またこのとき、前記動き補償部は、符号化対象の動画像がステレオ動画像で、前記選択した予測モードに基づき符号化対象領域をフィールド画像として予測する場合に、符号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、動き補償を行うことが望ましい。   Further, at this time, the motion compensation unit, when the encoding target moving image is a stereo moving image and predicting the encoding target region as a field image based on the selected prediction mode, the encoding target region is set to the left field image. It is desirable to perform motion compensation for each field separated into right and left as a right field image.

またこのとき、前記空間予測部は、符号化対象の動画像がステレオ動画像で、前記選択した予測モードに基づき符号化対象領域をフィールド画像として予測する場合に、符号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、空間予測を行うことが望ましい。   Also, at this time, the spatial prediction unit determines that the encoding target region is a left field image when the encoding target moving image is a stereo moving image and the encoding target region is predicted as a field image based on the selected prediction mode. It is desirable to perform spatial prediction for each field separated right and left as a right field image.

またこのとき、前記直交変換部は、符号化対象の動画像がステレオ動画像で、前記選択した予測モードに基づき符号化対象領域をフィールド画像として予測する場合に、前記予測残差信号に基づく予測残差画像を左フィールド予測残差画像と右フィールド予測残差画像として左右に分離したフィールドごとに、直交変換を行うことが望ましい。   Further, at this time, the orthogonal transform unit predicts based on the prediction residual signal when the video to be encoded is a stereo video and predicts the encoding target region as a field image based on the selected prediction mode. It is desirable to perform orthogonal transform for each field in which the residual image is separated into left and right as a left field prediction residual image and a right field prediction residual image.

またこのとき、前記逆直交変換部は、符号化対象の動画像がステレオ動画像で、前記選択した予測モードに基づき符号化対象領域をフィールド画像として予測する場合に、前記直交変換後の画像データを左フィールド画像データと右フィールド画像データとして左右に分離したフィールドごとに、逆直交変換を含む所定の画像処理を行うことが望ましい。   Further, at this time, the inverse orthogonal transform unit, when the encoding target moving image is a stereo moving image and predicting the encoding target region as a field image based on the selected prediction mode, the image data after the orthogonal transform It is desirable to perform predetermined image processing including inverse orthogonal transformation for each of the fields separated into left and right as left field image data and right field image data.

また、上記目的を達成するために、本発明の動画像復号化装置は、右目画像と左目画像を縦1列ごとに交互に並べたステレオ動画像、および奇数行画像と偶数行画像を横1行ごとに交互に並べたインターレース動画像を復号化する動画像復号化装置であって、復号化対象の動画像がステレオ動画像であるか否かの種別情報、復号化対象領域に関する予測モード情報、および復号化対象領域の直交変換済み画像データを復号化する可変長復号化部と、前記復号化により得られた種別情報および予測モード情報に基づいて、復号化対象領域の動きベクトルを復元する動きベクトル復元部と、前記種別情報、予測モード情報および前記復元された動きベクトルに基づいて、復号化対象領域に関する動き補償を行う動き補償部と、前記種別情報および予測モード情報に基づいて、復号化対象領域に関する空間予測を行う空間予測部と、前記種別情報および予測モード情報に基づいて、前記復号化により得られた復号化対象領域の直交変換済み画像データに対し、逆直交変換を含む所定の画像処理を行う逆直交変換部と、前記逆直交変換部による画像処理により得られた予測残差信号と、前記動き補償または前記空間予測により得られた予測画像信号とから、復号化対象領域の画像データを生成する画像データ生成部とを備えることを特徴とする。   In order to achieve the above object, the moving picture decoding apparatus according to the present invention includes a stereo moving picture in which a right-eye picture and a left-eye picture are alternately arranged in a vertical column, and an odd-numbered picture and an even-numbered picture in a horizontal direction. A moving picture decoding apparatus for decoding interlaced moving pictures arranged alternately for each row, type information indicating whether or not a decoding target moving picture is a stereo moving picture, and prediction mode information regarding a decoding target area And a variable length decoding unit that decodes the orthogonally transformed image data of the decoding target area, and a motion vector of the decoding target area is restored based on the type information and the prediction mode information obtained by the decoding A motion vector restoration unit; a motion compensation unit that performs motion compensation on a decoding target region based on the type information, prediction mode information, and the restored motion vector; and the type information and A spatial prediction unit that performs spatial prediction on the decoding target region based on the measurement mode information, and orthogonally transformed image data of the decoding target region obtained by the decoding based on the type information and the prediction mode information. On the other hand, an inverse orthogonal transform unit that performs predetermined image processing including inverse orthogonal transform, a prediction residual signal obtained by image processing by the inverse orthogonal transform unit, and a predicted image obtained by the motion compensation or the spatial prediction And an image data generation unit configured to generate image data of a decoding target area from the signal.

このとき、前記動きベクトル復元部は、復号化対象の動画像がステレオ動画像で、前記予測モード情報に基づき復号化対象領域をフィールド画像として予測する場合に、復号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、動きベクトルを復元することが望ましい。   At this time, the motion vector restoration unit determines that the decoding target region is a left field image when the decoding target moving image is a stereo moving image and the decoding target region is predicted as a field image based on the prediction mode information. It is desirable to restore a motion vector for each field separated into right and left as a right field image.

またこのとき、前記動き補償部は、復号化対象の動画像がステレオ動画像で、前記予測モード情報に基づき復号化対象領域をフィールド画像として予測する場合に、復号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、動き補償を行うことが望ましい。   Also, at this time, the motion compensation unit, when the decoding target moving image is a stereo moving image and predicting the decoding target region as a field image based on the prediction mode information, the decoding target region is defined as a left field image. It is desirable to perform motion compensation for each field separated right and left as a right field image.

またこのとき、前記空間予測部は、復号化対象の動画像がステレオ動画像で、前記予測モード情報に基づき復号化対象領域をフィールド画像として予測する場合に、復号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、空間予測を行うことが望ましい。   Also, at this time, the spatial prediction unit, when the decoding target moving image is a stereo moving image and predicting the decoding target region as a field image based on the prediction mode information, the decoding target region is defined as a left field image. It is desirable to perform spatial prediction for each field separated right and left as the right field image.

またこのとき、前記逆直交変換部は、復号化する動画像がステレオ動画像で、前記予測モード情報に基づき復号化対象領域をフィールド画像として予測する場合に、復号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、逆直交変換を行うことが望ましい。   Further, at this time, when the moving image to be decoded is a stereo moving image and the decoding target region is predicted as a field image based on the prediction mode information, the inverse orthogonal transform unit sets the decoding target region as the left field image. It is desirable to perform inverse orthogonal transform for each field separated into right and left as the right field image.

上記の動画像符号化装置および動画像復号化装置によれば、少なくとも動画像の種別および選択された予測モードに基づく符号化および復号化を行うことにより、左目画像と右目画像の相関性を利用して、データ圧縮の効率を向上させることができる。   According to the above moving image encoding device and moving image decoding device, the correlation between the left eye image and the right eye image is used by performing encoding and decoding based on at least the type of moving image and the selected prediction mode. Thus, the efficiency of data compression can be improved.

また、入力したステレオ動画像信号と同じ画素配置の出力画像が得られるため、パララックスバリア方式の立体動画像表示装置で表示する場合に、復号化処理後の画像信号のラインの順番を変更し直すことなく、入力画像と同じ画像信号を得ることができる。   In addition, since an output image having the same pixel arrangement as the input stereo moving image signal is obtained, the order of the lines of the image signal after decoding processing is changed when displaying on a parallax barrier type stereoscopic moving image display device. The same image signal as the input image can be obtained without correction.

さらに、縦1列ごとに交互に左目画像と右目画像が配置されたステレオ動画像信号、および横1行ごとに交互に奇数行画像と偶数行画像が配置されたインターレース動画像信号を、同一の動画像符号化装置、および動画像復号化装置でそれぞれ符号化、復号化を行うことができ、装置の有効利用が可能である。   Furthermore, a stereo moving image signal in which left-eye images and right-eye images are alternately arranged every vertical column, and an interlaced moving image signal in which odd-numbered row images and even-numbered row images are alternately arranged every horizontal row are identical to each other. Encoding and decoding can be performed by the moving image encoding device and the moving image decoding device, respectively, and the device can be used effectively.

以上のような動画像符号化装置および動画像復号化装置に係る発明は、以下のような動画像符号化方法および動画像復号化方法に係る発明として捉えることができ、同様の効果を得ることができる。   The invention relating to the moving image encoding device and the moving image decoding device as described above can be regarded as the invention relating to the following moving image encoding method and moving image decoding method, and obtain the same effect. Can do.

即ち、本発明に係る動画像符号化方法は、右目画像と左目画像を縦1列ごとに交互に並べたステレオ動画像、および奇数行画像と偶数行画像を横1行ごとに交互に並べたインターレース動画像を符号化する動画像符号化方法であって、符号化対象の動画像がステレオ動画像であるか否かを判定する動画像種別判定ステップと、符号化対象の動画像がステレオ動画像であると判定された場合に、当該動画像における縦方向が横方向に変わるように、当該動画像を所定方向に所定角度回転させる動画像回転ステップと、ステレオ動画像でないと判定された動画像、およびステレオ動画像であると判定され前記所定角度回転した動画像をインターレース符号化する動画像インターレース符号化ステップと、符号化対象の動画像がステレオ動画像であるか否かを示すステレオ画像識別子を符号化するステレオ画像識別子符号化ステップと、前記インターレース符号化で得られた符号化ビットストリームと、前記符号化で得られたステレオ画像識別子の符号とを多重化することで多重化符号化ビットストリームを作成する多重化ステップとを有することを特徴とする。   That is, in the moving image encoding method according to the present invention, the stereo moving image in which the right eye image and the left eye image are alternately arranged in every vertical column, and the odd row image and the even row image are alternately arranged in every horizontal row. A moving image encoding method for encoding an interlaced moving image, the moving image type determining step for determining whether or not the moving image to be encoded is a stereo moving image, and the moving image to be encoded is a stereo moving image. A moving image rotation step for rotating the moving image by a predetermined angle in a predetermined direction so that the vertical direction of the moving image changes to a horizontal direction when the image is determined to be an image, and a moving image determined not to be a stereo moving image A video interlace encoding step for interlace encoding the video that has been determined to be an image and a stereo video and rotated by the predetermined angle, and the video to be encoded is a stereo video A stereo image identifier encoding step for encoding a stereo image identifier indicating whether or not, an encoded bitstream obtained by the interlaced encoding, and a code of the stereo image identifier obtained by the encoding are multiplexed And a multiplexing step of creating a multiplexed encoded bitstream.

本発明に係る動画像符号化方法は、右目画像と左目画像を縦1列ごとに交互に並べたステレオ動画像、および奇数行画像と偶数行画像を横1行ごとに交互に並べたインターレース動画像を符号化する動画像符号化方法であって、符号化対象の動画像を表す入力画像信号に基づいて、当該符号化対象の動画像がステレオ動画像であるかインターレース動画像であるかの種別を判定する動画像種別判定ステップと、フレーム間予測モードが選択され且つ前記判定により得られた動画像の種別がステレオ動画像である場合、入力画像をフレーム画像としてフレーム間予測したケースと入力画像を右目画像と左目画像とに分離してフレーム間予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム間予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム間予測」を、入力画像を右目画像と左目画像とに分離してフレーム間予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム間予測」を、予測モードとして選択し、フレーム間予測モードが選択され且つ前記判定により得られた動画像の種別がインターレース動画像である場合、入力画像をフレーム画像としてフレーム間予測したケースと入力画像を奇数行画像と偶数行画像とに分離してフレーム間予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム間予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム間予測」を、入力画像を奇数行画像と偶数行画像とに分離してフレーム間予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム間予測」を、予測モードとして選択し、フレーム内予測モードが選択され且つ前記判定により得られた動画像の種別がステレオ動画像である場合、入力画像をフレーム画像としてフレーム内予測したケースと入力画像を右目画像と左目画像とに分離してフレーム内予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム内予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム内予測」を、入力画像を右目画像と左目画像とに分離してフレーム内予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム内予測」を、予測モードとして選択し、フレーム内予測モードが選択され且つ前記判定により得られた動画像の種別がインターレース動画像である場合、入力画像をフレーム画像としてフレーム内予測したケースと入力画像を奇数行画像と偶数行画像とに分離してフレーム内予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム内予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム内予測」を、入力画像を奇数行画像と偶数行画像とに分離してフレーム内予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム内予測」を、予測モードとして選択し、予測モードとして「フレーム画像でのフレーム間予測」又は「フィールド画像でのフレーム間予測」が選択された場合、当該符号化対象の動画像に対する動きベクトルを検出する動き検出ステップと、前記動画像の種別、前記選択された予測モードおよび前記検出された動きベクトルに基づいて、前記動画像に対し、動き補償を行う動き補償ステップと、前記動画像の種別および前記選択された予測モードに基づいて、前記動画像に対し、空間予測を行う空間予測ステップと、前記動画像の種別および前記選択された予測モードに基づいて、前記動き補償または前記空間予測により得られた予測画像信号と前記入力画像信号との差分として得られる予測残差信号に対し、直交変換を行う直交変換ステップと、前記動画像の種別および前記選択された予測モードに基づいて、前記直交変換後の画像データに対し、可変長符号化を含む所定の画像処理を行う可変長符号化ステップと、前記動画像の種別および前記選択された予測モードに基づいて、前記直交変換後の画像データに対し、逆直交変換を含む所定の画像処理を行う逆直交変換ステップとを有することを特徴とする。 The moving image encoding method according to the present invention includes a stereo moving image in which right-eye images and left-eye images are alternately arranged in vertical columns, and an interlaced moving image in which odd-numbered images and even-numbered rows images are alternately arranged in horizontal rows. A video encoding method for encoding an image, wherein, based on an input image signal representing a video to be encoded, whether the video to be encoded is a stereo video or an interlace video A moving image type determining step for determining a type, and a case in which an inter-frame prediction mode is selected and the type of moving image obtained by the determination is a stereo moving image, and an input image is used as a frame image and input Compare the coding efficiency of the case where the image is divided into the right-eye image and the left-eye image and the inter-frame prediction is performed, and the inter-frame prediction is performed using the input image as the frame image. If the rate is higher, the inter-frame prediction in the frame image is performed. If the input image is divided into the right-eye image and the left-eye image and the inter-frame prediction is performed, the coding efficiency is higher in the field image. When the inter-frame prediction mode is selected as the prediction mode, and when the inter-frame prediction mode is selected and the type of the moving image obtained by the determination is an interlaced moving image, the input image is used as the frame image for the inter-frame prediction. Compare the encoding efficiency with the case where the input image is divided into odd-numbered and even-numbered images and the inter-frame prediction is performed, and the encoding efficiency is higher when the input image is inter-frame predicted as the frame image Is the encoding efficiency in the case where the inter-frame prediction is performed by separating the input image into odd-numbered and even-numbered images, and “inter-frame prediction with frame images”. In the case where the inter-frame prediction in the field image is selected as the prediction mode, the intra-frame prediction mode is selected, and the moving image type obtained by the determination is a stereo moving image, the input image is framed. Compare the coding efficiency of the case of intra-frame prediction as an image and the case of intra-frame prediction by separating the input image into a right-eye image and a left-eye image, and the coding efficiency of the case of intra-frame prediction using the input image as a frame image If the coding efficiency is higher in the case where the intra-frame prediction is performed when the input image is separated into the right-eye image and the left-eye image and the intra-frame prediction is performed. “Intra-frame prediction” is selected as the prediction mode, the intra-frame prediction mode is selected, and the type of moving image obtained by the above determination is If the input image is a frame image, the encoding efficiency is compared between the case where the input image is predicted as a frame image and the case where the input image is divided into an odd-numbered image and an even-numbered row image and is predicted within the frame. When the coding efficiency of the case where the intra-frame prediction is performed as a frame image is higher, the intra-frame prediction is performed by separating the input image into an odd-numbered image and an even-numbered row image for “intra-frame prediction with a frame image” When the encoding efficiency of the above is higher, “intraframe prediction in a field image” is selected as a prediction mode, and “interframe prediction in a frame image” or “interframe prediction in a field image” is selected as a prediction mode. If selected, the prediction mode in which the code and the motion detection step of detecting a motion vector for encoding target moving image, the type of the moving image, which is the selected And a motion compensation step for performing motion compensation on the moving image based on the detected motion vector, and spatial prediction for the moving image based on the type of the moving image and the selected prediction mode. And a prediction residual obtained as a difference between the predicted image signal obtained by the motion compensation or the spatial prediction and the input image signal based on the type of the moving image and the selected prediction mode. Predetermined image processing including variable length coding for the image data after the orthogonal transformation based on the orthogonal transformation step for performing orthogonal transformation on the difference signal, and the type of the moving image and the selected prediction mode A variable length encoding step for performing the orthogonal transformation on the image data after the orthogonal transformation based on the type of the moving image and the selected prediction mode. And having an inverse orthogonal transform step of performing a predetermined image processing including conversion.

また、本発明に係る動画像復号化方法は、右目画像と左目画像を縦1列ごとに交互に並べたステレオ動画像、および奇数行画像と偶数行画像を横1行ごとに交互に並べたインターレース動画像を復号化する動画像復号化方法であって、復号化対象の動画像がステレオ動画像であるか否かの種別情報、復号化対象領域に関する予測モード情報、および復号化対象領域の直交変換済み画像データを復号化する可変長復号化ステップと、前記復号化により得られた種別情報および予測モード情報に基づいて、復号化対象領域の動きベクトルを復元する動きベクトル復元ステップと、前記種別情報、予測モード情報および前記復元された動きベクトルに基づいて、復号化対象領域に関する動き補償を行う動き補償ステップと、前記種別情報および予測モード情報に基づいて、復号化対象領域に関する空間予測を行う空間予測ステップと、前記種別情報および予測モード情報に基づいて、前記復号化により得られた復号化対象領域の直交変換済み画像データに対し、逆直交変換を含む所定の画像処理を行う逆直交変換ステップと、前記画像処理により得られた予測残差信号と、前記動き補償または前記空間予測により得られた予測画像信号とから、復号化対象領域の画像データを生成する画像データ生成ステップとを有することを特徴とする。   In addition, the moving picture decoding method according to the present invention includes a stereo moving picture in which the right eye image and the left eye picture are alternately arranged in the vertical column, and an odd line image and the even line image in the horizontal line alternately. A moving picture decoding method for decoding an interlaced moving picture, wherein the decoding target moving picture is a stereo moving picture, type information about the decoding target area, prediction mode information about the decoding target area, and decoding target area A variable length decoding step for decoding orthogonally transformed image data; a motion vector restoration step for restoring a motion vector of a decoding target region based on the type information and prediction mode information obtained by the decoding; Based on the type information, the prediction mode information, and the restored motion vector, a motion compensation step for performing motion compensation on the decoding target region, the type information and the prediction A spatial prediction step for performing spatial prediction on the decoding target area based on the mode information, and orthogonally transformed image data of the decoding target area obtained by the decoding based on the type information and prediction mode information. On the other hand, an inverse orthogonal transform step for performing predetermined image processing including inverse orthogonal transform, a prediction residual signal obtained by the image processing, and a prediction image signal obtained by the motion compensation or the spatial prediction are decoded. And an image data generation step for generating image data of the region to be converted.

本発明によれば、左目画像と右目画像の相関性を利用して、データ圧縮の効率を向上させることができる。   According to the present invention, the efficiency of data compression can be improved by utilizing the correlation between the left eye image and the right eye image.

また、入力したステレオ動画像信号と同じ画素配置の出力画像が得られるため、パララックスバリア方式の立体動画像表示装置で表示する場合に、復号化処理後の画像信号のラインの順番を変更し直すことなく、入力画像と同じ画像信号を得ることができる。   In addition, since an output image having the same pixel arrangement as the input stereo moving image signal is obtained, the order of the lines of the image signal after decoding processing is changed when displaying on a parallax barrier type stereoscopic moving image display device. The same image signal as the input image can be obtained without correction.

さらに、縦1列ごとに交互に左目画像と右目画像が配置されたステレオ動画像信号、および横1行ごとに交互に奇数行画像と偶数行画像が配置されたインターレース動画像信号を、同一の動画像符号化装置、および動画像復号化装置でそれぞれ符号化、復号化を行うことができ、装置の有効利用が可能である。   Furthermore, a stereo moving image signal in which left-eye images and right-eye images are alternately arranged every vertical column, and an interlaced moving image signal in which odd-numbered row images and even-numbered row images are alternately arranged every horizontal row are identical to each other. Encoding and decoding can be performed by the moving image encoding device and the moving image decoding device, respectively, and the device can be used effectively.

パララックスバリア方式による立体映像表示の原理を説明する図である。It is a figure explaining the principle of the stereoscopic image display by a parallax barrier system. 従来の立体動画像符号化方式を示す図である。It is a figure which shows the conventional stereoscopic video coding system. 第1実施形態における動画像符号化装置を示す図である。It is a figure which shows the moving image encoder in 1st Embodiment. (a)はステレオ画像の画素配置を、(b)はインターレース画像の画素配置を示す図である。(A) is a pixel arrangement | positioning of a stereo image, (b) is a figure which shows the pixel arrangement | positioning of an interlaced image. (a)はステレオ画像の画素配置を、(b)はステレオ画像を右に+90°回転したときの画素配置を、(c)はステレオ画像を右に−90°回転したときの画素配置を示す図である。(A) shows the pixel arrangement of the stereo image, (b) shows the pixel arrangement when the stereo image is rotated by + 90 ° to the right, and (c) shows the pixel arrangement when the stereo image is rotated by −90 ° to the right. FIG. 外部へ伝送される多重化符号化ビットストリームの例を示した図である。It is the figure which showed the example of the multiplex encoding bit stream transmitted to the exterior. 外部へ伝送される多重化符号化ビットストリームの例を示した図である。It is the figure which showed the example of the multiplex encoding bit stream transmitted to the exterior. 外部へ伝送される多重化符号化ビットストリームの例を示した図である。It is the figure which showed the example of the multiplex encoding bit stream transmitted to the exterior. 外部へ伝送される多重化符号化ビットストリームの例を示した図である。It is the figure which showed the example of the multiplex encoding bit stream transmitted to the exterior. 第1実施形態における動画像符号化装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the moving image encoder in 1st Embodiment. 第1実施形態における動画像復号化装置を示す図である。It is a figure which shows the moving image decoding apparatus in 1st Embodiment. (a)はスイッチ1104から送られた動画像信号の一つの画素配置を、(b)はスイッチ1104から送られた動画像信号のもう一つの画素配置を、(c)は(a)を左に+90°または(b)を左に−90°回転したときの画素配置を示す図である。(A) shows one pixel arrangement of the moving picture signal sent from the switch 1104, (b) shows another pixel arrangement of the moving picture signal sent from the switch 1104, and (c) shows the left (a). It is a figure which shows pixel arrangement | positioning when +90 degrees or (b) is rotated to -90 degrees to the left. 第1実施形態における動画像復号化装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the moving image decoding apparatus in 1st Embodiment. 第2実施形態における動画像符号化装置を示す図である。It is a figure which shows the moving image encoder in 2nd Embodiment. (a)はステレオ画像のフレーム画像を、(b)はステレオ画像の左フィールド画像を、(c)はステレオ画像の右フィールド画像を示す図である。(A) is a frame image of a stereo image, (b) is a left field image of the stereo image, and (c) is a diagram showing a right field image of the stereo image. (a)はインターレース画像のフレーム画像を、(b)はインターレース画像の上フィールド画像を、(c)はインターレース画像の下フィールド画像を示す図である。(A) shows a frame image of an interlaced image, (b) shows an upper field image of the interlaced image, and (c) shows a lower field image of the interlaced image. (a)はステレオ画像の予測残差信号の画素配置におけるフレーム画像での直交変換ブロックを、(b)はステレオ画像の予測残差信号の画素配置におけるフィールド画像での直交変換ブロックを示す図である。(A) is a figure which shows the orthogonal transformation block in the frame image in the pixel arrangement | positioning of the prediction residual signal of a stereo image, (b) is a figure which shows the orthogonal transformation block in the field image in the pixel arrangement | positioning of the prediction residual signal of a stereo image. is there. (a)はインターレース画像の予測残差信号の画素配置におけるフレーム画像での直交変換ブロックを、(b)はインターレース画像の予測残差信号の画素配置におけるフィールド画像での直交変換ブロックを示す図である。(A) is a figure which shows the orthogonal transformation block in the frame image in the pixel arrangement | positioning of the prediction residual signal of an interlaced image, (b) is a figure which shows the orthogonal transformation block in the field image in the pixel arrangement | positioning of the prediction residual signal of an interlaced image. is there. (a)はステレオ画像に対する逆直交変換後の予測残差信号の画素配置におけるフレーム画像での画素配置を、(b)はステレオ画像に対する逆直交変換後の予測残差信号の画素配置におけるフィールド画像での画素配置を示す図である。(A) is a pixel arrangement in a frame image in a pixel arrangement of a prediction residual signal after inverse orthogonal transformation for a stereo image, and (b) is a field image in a pixel arrangement of a prediction residual signal after inverse orthogonal transformation for a stereo image. It is a figure which shows pixel arrangement | positioning in. (a)はインターレース画像に対する逆直交変換後の予測残差信号の画素配置におけるフレーム画像での画素配置を、(b)はインターレース画像に対する逆直交変換後の予測残差信号の画素配置におけるフィールド画像での画素配置を示す図である。(A) is a pixel arrangement in a frame image in a pixel arrangement of a prediction residual signal after inverse orthogonal transformation for an interlaced image, and (b) is a field image in a pixel arrangement of a prediction residual signal after inverse orthogonal transformation for an interlaced image. It is a figure which shows pixel arrangement | positioning in. 第2実施形態における動画像復号化装置を示す図である。It is a figure which shows the moving image decoding apparatus in 2nd Embodiment. 第1実施形態に係る動画像符号化プログラムの構成を示す図である。It is a figure which shows the structure of the moving image encoding program which concerns on 1st Embodiment. 第1実施形態に係る動画像復号化プログラムの構成を示す図である。It is a figure which shows the structure of the moving image decoding program which concerns on 1st Embodiment. 第2実施形態に係る動画像符号化プログラムの構成を示す図である。It is a figure which shows the structure of the moving image encoding program which concerns on 2nd Embodiment. 第2実施形態に係る動画像復号化プログラムの構成を示す図である。It is a figure which shows the structure of the moving image decoding program which concerns on 2nd Embodiment.

以下、図面を参照しながら、本発明の実施形態に係る動画像符号化装置および方法、並びに動画像復号化装置および方法を説明する。なお、各図において、同一要素には同一符号を付して重複する説明を省略する。   Hereinafter, a moving picture coding apparatus and method, and a moving picture decoding apparatus and method according to embodiments of the present invention will be described with reference to the drawings. In addition, in each figure, the same code | symbol is attached | subjected to the same element and the overlapping description is abbreviate | omitted.

[第1実施形態]
(動画像符号化装置の構成)
まず、図3を用いて、本実施形態に係る動画像符号化装置を説明する。本実施形態に係る動画像符号化装置30は、その機能的な構成要素として、動画像種別判定部301と、スイッチ302と、動画像回転部303と、スイッチ304と、動画像インターレース符号化部305と、ステレオ画像識別子符号化部306と、多重化部307とを備えて構成される。
[First embodiment]
(Configuration of video encoding device)
First, the moving picture coding apparatus according to the present embodiment will be described with reference to FIG. The moving image coding apparatus 30 according to the present embodiment includes, as its functional components, a moving image type determination unit 301, a switch 302, a moving image rotation unit 303, a switch 304, and a moving image interlace coding unit. 305, a stereo image identifier encoding unit 306, and a multiplexing unit 307.

動画像種別判定部301は、入力された動画像信号308を受信し、受信した動画像の種別を判定する。受信した動画像が、図4(a)のように縦1列ごとに交互に左目画像と右目画像とが配置されたステレオ画像信号であった場合、動画像種別判定部301は、入力画像がステレオ画像であるという情報(例えば「1」にセットしたステレオ画像識別子)310をスイッチ302と、スイッチ304と、ステレオ画像識別子符号化部306とへ送る。一方、受信した動画像が、図4(b)のように横1行ごとに交互に奇数行画像と偶数行画像とが配置されたインターレース画像信号であった場合、動画像種別判定部301は、入力画像がステレオ画像でないという情報(例えば「0」にセットしたステレオ画像識別子)310をスイッチ302と、スイッチ304と、ステレオ画像識別子符号化部306とへ送る。また、動画像種別判定部301は、受信した動画像信号309をスイッチ302に送る。なお、上記の図4は、入力画像が横352画素、縦288画素であった場合の例を示す。   The moving image type determination unit 301 receives the input moving image signal 308 and determines the type of the received moving image. When the received moving image is a stereo image signal in which left-eye images and right-eye images are alternately arranged for each vertical column as shown in FIG. 4A, the moving image type determination unit 301 determines that the input image is Information that is a stereo image (for example, a stereo image identifier set to “1”) 310 is sent to the switch 302, the switch 304, and the stereo image identifier encoding unit 306. On the other hand, when the received moving image is an interlaced image signal in which odd-numbered row images and even-numbered row images are alternately arranged for each horizontal row as shown in FIG. , Information that the input image is not a stereo image (for example, a stereo image identifier set to “0”) 310 is sent to the switch 302, the switch 304, and the stereo image identifier encoding unit 306. In addition, the moving image type determination unit 301 sends the received moving image signal 309 to the switch 302. Note that FIG. 4 shows an example where the input image is 352 pixels wide and 288 pixels long.

動画像種別判定部301での画像種別の判定は、例えば、入力画像に付加された画像種別に関する情報を検出し、検出した情報に基づいて行うことができる。また、動画像種別判定部301での画像種別の判定は、符号化前に外部から与えられた設定ファイル等の画像種別に関する情報に基づいて行っても良い。   The determination of the image type in the moving image type determination unit 301 can be performed based on, for example, detecting information related to the image type added to the input image. In addition, the determination of the image type in the moving image type determination unit 301 may be performed based on information on the image type such as a setting file given from the outside before encoding.

また、動画像種別判定部301での画像種別の判定は、以下のように、入力された画像の輝度値の関係を解析した結果を基に行っても良い。例えば、入力された画像を縦1列ごとに交互に分離して左フィールド画像と右フィールド画像を作成し、それらの分離した各フィールド画像の横方向の輝度値の相関が、分離前のフレーム画像の横方向の輝度値の相関に比べて高い場合、入力された画像をステレオ画像と判定しても良い。また、例えば、入力された画像を横1列ごとに交互に分離して上フィールド画像と下フィールド画像を作成し、それらの分離した各フィールド画像の縦方向の輝度値の相関が、分離前のフレーム画像の縦方向の輝度値の相関に比べて高い場合、入力された画像をインターレース画像と判定しても良い。   Further, the determination of the image type in the moving image type determination unit 301 may be performed based on the result of analyzing the relationship between the luminance values of the input images as follows. For example, a left field image and a right field image are created by alternately separating input images for each vertical column, and the correlation between the luminance values in the horizontal direction of the separated field images is a frame image before separation. When the correlation is higher than the horizontal luminance value, the input image may be determined as a stereo image. Further, for example, the input image is alternately separated for each horizontal row to create an upper field image and a lower field image, and the correlation between the vertical luminance values of the separated field images is the same as that before the separation. If it is higher than the correlation between the luminance values in the vertical direction of the frame image, the input image may be determined as an interlaced image.

なお、画像種別の判定法は、上記例示した方法に限定されるものではない。   Note that the image type determination method is not limited to the method exemplified above.

スイッチ302は、動画像種別判定部301から送られた動画像信号309と、ステレオ画像識別子310を受信し、ステレオ画像識別子が1の場合は、動画像信号309を動画像回転部303に送り、ステレオ画像識別子が0の場合は、動画像信号309をスイッチ304に送る。   The switch 302 receives the moving image signal 309 and the stereo image identifier 310 sent from the moving image type determination unit 301. When the stereo image identifier is 1, the switch 302 sends the moving image signal 309 to the moving image rotation unit 303. When the stereo image identifier is 0, the moving image signal 309 is sent to the switch 304.

動画像回転部303は、スイッチ302から送られた動画像信号309を受信し、動画像信号309により表される動画像を右に+90°回転して、インターレース動画像と同様に横1行ごとに交互に右目画像と左目画像が配置された動画像を表す動画像信号311に変換し、動画像信号311をスイッチ304に送る。   The moving image rotating unit 303 receives the moving image signal 309 sent from the switch 302, rotates the moving image represented by the moving image signal 309 to the right by + 90 °, and each horizontal row as in the case of the interlaced moving image. Are converted into a moving image signal 311 representing a moving image in which the right eye image and the left eye image are alternately arranged, and the moving image signal 311 is sent to the switch 304.

図5は、動画像回転部303によってステレオ動画像を右に+90°回転した例を示し、このうち図5(a)はスイッチ302から送られた動画像信号309により表される動画像を示し、図5(b)は図5(a)の動画像を右に+90°回転した動画像を示す。なお、上記の図5は、入力画像が横352画素、縦288画素であった場合の例を示す。   FIG. 5 shows an example in which the stereo moving image is rotated to the right by + 90 ° by the moving image rotating unit 303, and FIG. 5A shows a moving image represented by the moving image signal 309 sent from the switch 302. FIG. 5B shows a moving image obtained by rotating the moving image of FIG. 5A to the right by + 90 °. Note that FIG. 5 shows an example in which the input image is 352 pixels wide and 288 pixels long.

スイッチ304は動画像種別判定部301から送られたステレオ画像識別子310を基に、動画像回転部303から送られた動画像信号311、およびスイッチ302から送られた動画像信号309のうち一方を選択する。即ち、スイッチ304は、ステレオ画像識別子310が1の場合、動画像回転部303から送られた動画像信号311を、ステレオ画像識別子310が0の場合、スイッチ302から送られた動画像信号309を、それぞれ選択し、選択した動画像信号を動画像信号312として動画像インターレース符号化部305に送る。   The switch 304 selects one of the moving image signal 311 transmitted from the moving image rotation unit 303 and the moving image signal 309 transmitted from the switch 302 based on the stereo image identifier 310 transmitted from the moving image type determination unit 301. select. That is, the switch 304 displays the moving image signal 311 sent from the moving image rotation unit 303 when the stereo image identifier 310 is 1, and the moving image signal 309 sent from the switch 302 when the stereo image identifier 310 is 0. , Respectively, and the selected moving image signal is sent to the moving image interlace coding unit 305 as a moving image signal 312.

動画像インターレース符号化部305は、スイッチ304から送られた動画像信号312を受けて動画像のインターレース符号化を行うことで符号化ビットストリーム313を作成する。そして、動画像インターレース符号化部305は、作成された符号化ビットストリーム313を多重化部307へ送る。なお、動画像インターレース符号化部305で使用するインターレース符号化方式の一例としては、H.264/AVC符号化方式(Joint Video Team (JVT) of ISO/IEC MPEG and ITU-VCEG, “Editor’s Proposed Draft Text Modifications for Joint Video Specification (ITU-T Rec.H.264|ISO/IEC 14496-10 AVC), Geneva modifications draft 37”を参照)が挙げられる。但し、上記のH.264/AVC符号化方式に限らず、インターレース画像の符号化に対応するあらゆる方式の符号化法を適用することができる。   The moving image interlace encoding unit 305 receives the moving image signal 312 transmitted from the switch 304 and performs interlace encoding of the moving image to generate an encoded bit stream 313. Then, the moving image interlace encoding unit 305 sends the generated encoded bit stream 313 to the multiplexing unit 307. An example of an interlace encoding method used in the moving image interlace encoding unit 305 is H.264. H.264 / AVC coding (Joint Video Team (JVT) of ISO / IEC MPEG and ITU-VCEG, “Editor's Proposed Draft Text Modifications for Joint Video Specification (ITU-T Rec.H.264 | ISO / IEC 14496-10 AVC ), See Geneva modifications draft 37 ”). However, the above H.P. Not only the H.264 / AVC encoding method but also any encoding method corresponding to the encoding of the interlaced image can be applied.

ステレオ画像識別子符号化部306は、動画像種別判定部301から送られたステレオ画像識別子310を符号化し、符号化で得られた符号314を多重化部307へ送る。   The stereo image identifier encoding unit 306 encodes the stereo image identifier 310 sent from the moving image type determination unit 301 and sends the code 314 obtained by the encoding to the multiplexing unit 307.

多重化部307は、動画像インターレース符号化部305から送られた符号化ビットストリーム313と、ステレオ画像識別子符号化部306から送られたステレオ画像識別子の符号314とを多重化し、多重化で得られたビットストリームを多重化符号化ビットストリーム315として外部へ伝送する。   The multiplexing unit 307 multiplexes the encoded bit stream 313 sent from the moving image interlace coding unit 305 and the stereo image identifier code 314 sent from the stereo image identifier coding unit 306, and obtains them by multiplexing. The transmitted bit stream is transmitted to the outside as a multiplexed encoded bit stream 315.

図6〜図9は、外部へ伝送する多重化符号化ビットストリーム315の例を示したものである。   6 to 9 show examples of the multiplexed encoded bit stream 315 transmitted to the outside.

多重化符号化ビットストリーム315は、各シーケンスの先頭を表す同期信号の後に、動画像全体に関する符号化情報(シーケンスヘッダ)、動画像の各フレームに関する符号化情報(フレームヘッダ)、動画像の符号化単位であるマクロブロックを何個か合わせた各スライスに関する符号化情報(スライスヘッダ)、動画像の各マクロブロックに関する符号化情報(マクロブロックヘッダ)、およびマクロブロックごとの符号化情報が多重化されて構成される。   The multiplexed encoded bit stream 315 includes, after a synchronization signal indicating the head of each sequence, encoding information (sequence header) regarding the entire moving image, encoding information (frame header) regarding each frame of the moving image, and code of the moving image. Encoding information (slice header) related to each slice obtained by combining several macroblocks as a unit of encoding, encoding information (macroblock header) related to each macroblock of a moving image, and encoding information for each macroblock are multiplexed. Configured.

入力された動画像の種別に関する情報であるステレオ画像識別子の符号は、図6のようにシーケンスヘッダに含んで伝送しても良いし、図7のようにフレームヘッダに含んで伝送しても良い。また、上記ステレオ画像識別子の符号は、図8のようにスライスヘッダに含んで伝送しても良いし、図9のようにマクロブロックヘッダに含んで伝送しても良い。   The stereo image identifier code, which is information related to the type of the input moving image, may be transmitted by being included in the sequence header as shown in FIG. 6, or may be transmitted by being included in the frame header as shown in FIG. . The stereo image identifier code may be transmitted by being included in a slice header as shown in FIG. 8, or may be transmitted by being included in a macroblock header as shown in FIG.

なお、動画像回転部303は、スイッチ302から送られた動画像信号309を受信し、図5(a)に示す動画像信号309により表される動画像を右に−90°回転(即ち、左に+90°回転)して、インターレース動画像と同様に横1行ごとに交互に左目画像と右目画像が配置された動画像(図5(c)参照)を表す動画像信号311に変換し、動画像信号311をスイッチ304に送っても良い。   The moving image rotating unit 303 receives the moving image signal 309 sent from the switch 302 and rotates the moving image represented by the moving image signal 309 shown in FIG. 5A to the right by −90 ° (ie, The image is converted to a moving image signal 311 representing a moving image (see FIG. 5C) in which a left eye image and a right eye image are alternately arranged for each horizontal line in the same manner as an interlaced moving image. The moving image signal 311 may be sent to the switch 304.

動画像回転部303が、スイッチ302から送られた動画像信号309を、右に+90°回転するか、−90°回転するかは、予め決定された回転方法に従う。   Whether the moving image rotation unit 303 rotates the moving image signal 309 sent from the switch 302 to the right by + 90 ° or −90 ° depends on a predetermined rotation method.

また、動画像回転部303が動画像信号309を、右に+90°回転するか、−90°回転するかを示す情報は、動画像の符号化に関する情報として、ステレオ画像識別子とともに多重化符号化ビットストリーム315で送信しても良い。例えば、ステレオ画像識別子が1で、動画像回転部303がスイッチ302から送られた動画像信号309を右に+90°回転して動画像信号311に変換する場合は符号「10」を、ステレオ画像識別子が1で、動画像回転部303がスイッチ302から送られた動画像信号309を右に−90°回転して動画像信号311に変換する場合は符号「11」を、ステレオ画像識別子が0の場合は符号「0」を、それぞれ動画像の符号化に関する情報として、ステレオ画像識別子とともに多重化部307で多重化して、多重化符号化ビットストリーム315として伝送しても良い。   Information indicating whether the moving image rotation unit 303 rotates the moving image signal 309 to the right by + 90 ° or −90 ° is multiplexed and encoded with a stereo image identifier as information related to moving image encoding. The bit stream 315 may be transmitted. For example, when the stereo image identifier is 1 and the moving image rotation unit 303 converts the moving image signal 309 sent from the switch 302 to the moving image signal 311 by rotating the moving image signal 309 to the right by + 90 °, the code “10” is displayed. When the identifier is 1 and the moving image rotation unit 303 converts the moving image signal 309 sent from the switch 302 to the moving image signal 311 by rotating the moving image signal 309 to the right by −90 °, the code “11” is set, and the stereo image identifier is 0. In this case, the code “0” may be multiplexed by the multiplexing unit 307 together with the stereo image identifier as information relating to the encoding of the moving image and transmitted as a multiplexed encoded bit stream 315.

(動画像符号化装置の動作)
次に、図10を用いて、本発明における動画像符号化装置30の動作を説明する。
(Operation of video encoding device)
Next, the operation of the moving picture coding apparatus 30 according to the present invention will be described with reference to FIG.

まず、動画像種別判定部301が、入力された動画像の画像種別判定として、当該動画像がステレオ画像であるか否かを判定する(ステップS1001)。ここで、入力された動画像がステレオ画像であった場合、動画像種別判定部301はステレオ画像識別子を「1」とし(ステップS1002)、動画像回転部303は予め決定された回転方法に従って、入力された動画像を右に+90°または−90°回転させる(ステップS1004)。一方、入力された動画像がステレオ画像でなかった場合、動画像種別判定部301はステレオ画像識別子を「0」とする(ステップS1003)。   First, the moving image type determination unit 301 determines whether or not the moving image is a stereo image as the image type determination of the input moving image (step S1001). If the input moving image is a stereo image, the moving image type determining unit 301 sets the stereo image identifier to “1” (step S1002), and the moving image rotating unit 303 follows a predetermined rotation method. The input moving image is rotated to the right by + 90 ° or −90 ° (step S1004). On the other hand, when the input moving image is not a stereo image, the moving image type determination unit 301 sets the stereo image identifier to “0” (step S1003).

前述したように、スイッチ304は、ステレオ画像識別子310が1の場合、動画像回転部303から送られた動画像信号311を、ステレオ画像識別子310が0の場合、スイッチ302から送られた動画像信号309を、それぞれ選択し、選択した動画像信号を動画像信号312として動画像インターレース符号化部305に送る。   As described above, the switch 304 uses the moving image signal 311 sent from the moving image rotation unit 303 when the stereo image identifier 310 is 1 and the moving image sent from the switch 302 when the stereo image identifier 310 is 0. Each of the signals 309 is selected, and the selected moving image signal is sent to the moving image interlace coding unit 305 as a moving image signal 312.

動画像信号312を受信した動画像インターレース符号化部305は、動画像のインターレース符号化を行い(ステップS1005)、符号化ビットストリーム313を作成する。また、ステレオ画像識別子符号化部306は、ステレオ画像識別子の符号化を行い(ステップS1006)、符号化情報314を作成する。   The moving image interlace encoding unit 305 that has received the moving image signal 312 performs interlace encoding of the moving image (step S1005), and generates an encoded bit stream 313. Also, the stereo image identifier encoding unit 306 encodes the stereo image identifier (step S1006), and generates encoded information 314.

最後に、多重化部307は、符号化ビットストリーム313と符号化情報314とを多重化して多重化符号化ビットストリーム315を作成し(ステップS1007)、図10の処理を終了する。   Finally, the multiplexing unit 307 multiplexes the encoded bit stream 313 and the encoded information 314 to create a multiplexed encoded bit stream 315 (step S1007), and ends the process of FIG.

(動画像復号化装置の構成)
次に、図11を用いて、本発明に係る動画像復号化装置を説明する。本発明に係る動画像復号化装置110は、その機能的な構成要素として、分離部1101と、動画像インターレース復号化部1102と、ステレオ画像識別子復号化部1103と、スイッチ1104と、動画像逆回転部1105と、スイッチ1106とを備えて構成される。
(Configuration of video decoding device)
Next, the moving picture decoding apparatus according to the present invention will be described with reference to FIG. The moving image decoding apparatus 110 according to the present invention includes, as its functional components, a separating unit 1101, a moving image interlace decoding unit 1102, a stereo image identifier decoding unit 1103, a switch 1104, and a moving image inverse unit. A rotating unit 1105 and a switch 1106 are provided.

分離部1101は、入力された多重化符号化ビットストリーム315を、動画像の符号化ビットストリーム1107とステレオ画像識別子の符号1108とに分離し、符号化ビットストリーム1107を動画像インターレース復号化部1102に、ステレオ画像識別子の符号1108をステレオ画像識別子復号化部1103に、それぞれ送る。   The separation unit 1101 separates the input multiplexed encoded bit stream 315 into a moving image encoded bit stream 1107 and a stereo image identifier code 1108, and the encoded bit stream 1107 is converted into a moving image interlace decoding unit 1102. The stereo image identifier code 1108 is sent to the stereo image identifier decoding unit 1103.

動画像インターレース復号化部1102は、分離部1101から送られた動画像の符号化ビットストリームに対し復号化を行うことで動画像信号1109を得る。そして、動画像インターレース復号化部1102は、復号化で得られた動画像信号1109をスイッチ1104に送る。なお、動画像インターレース復号化部1102で使用するインターレース復号化方式の一例としては、H.264/AVC復号化方式が挙げられる。但し、H.264/AVC復号化方式に限らず、インターレース画像の復号化に対応するあらゆる方式の復号化法を適用することができる。   The moving image interlace decoding unit 1102 obtains a moving image signal 1109 by decoding the encoded bit stream of the moving image sent from the separation unit 1101. Then, the moving image interlace decoding unit 1102 sends the moving image signal 1109 obtained by decoding to the switch 1104. An example of the interlace decoding method used in the moving image interlace decoding unit 1102 is H.264. H.264 / AVC decoding method. However, H. Not only the H.264 / AVC decoding method but also any decoding method corresponding to decoding of interlaced images can be applied.

ステレオ画像識別子復号化部1103は、分離部1101から送られたステレオ画像識別子の符号1108に対し復号化を行い、復号化されたステレオ画像識別子1110をスイッチ1104およびスイッチ1106に送る。   Stereo image identifier decoding section 1103 decodes stereo image identifier code 1108 sent from demultiplexing section 1101, and sends the decoded stereo image identifier 1110 to switch 1104 and switch 1106.

スイッチ1104は、動画像インターレース復号化部1102から送られた動画像信号1109と、ステレオ画像識別子復号化部1103から送られたステレオ画像識別子1110とを受信し、ステレオ画像識別子が1の場合は、動画像信号1109を動画像逆回転部1105に送り、ステレオ画像識別子が0の場合は、動画像信号1109をスイッチ1106に送る。   The switch 1104 receives the moving image signal 1109 sent from the moving image interlace decoding unit 1102 and the stereo image identifier 1110 sent from the stereo image identifier decoding unit 1103. When the stereo image identifier is 1, The moving image signal 1109 is sent to the moving image reverse rotation unit 1105, and if the stereo image identifier is 0, the moving image signal 1109 is sent to the switch 1106.

動画像逆回転部1105は、スイッチ1104から送られた動画像信号1109を受信し、図12(a)に示す動画像信号1109で表される動画像を左に+90°回転することで、図12(c)に示す縦1列ごとに交互に右目画像と左目画像とが配置された動画像信号1110に変換し、動画像信号1110をスイッチ1106に送る。この動画像逆回転部1105は、特許請求の範囲に記載した「処理制御部」に対応する。なお、上記の図12は、入力画像が横352画素、縦288画素であった場合の例を示す。   The moving image reverse rotation unit 1105 receives the moving image signal 1109 sent from the switch 1104 and rotates the moving image represented by the moving image signal 1109 shown in FIG. 12 (c) is converted into a moving image signal 1110 in which a right eye image and a left eye image are alternately arranged for each vertical column, and the moving image signal 1110 is sent to the switch 1106. The moving image reverse rotation unit 1105 corresponds to a “processing control unit” recited in the claims. Note that FIG. 12 shows an example in which the input image is 352 pixels wide and 288 pixels long.

スイッチ1106は、ステレオ画像識別子復号化部1103から送られたステレオ画像識別子1110を基に、動画像逆回転部1105から送られた動画像信号1111およびスイッチ1104から送られた動画像信号1109のうち一方を選択する。即ち、スイッチ1106は、ステレオ画像識別子1110が1の場合、動画像逆回転部1105から送られた動画像信号1111を、ステレオ画像識別子1110が0の場合、スイッチ1104から送られた動画像信号1109を、それぞれ選択し、選択した動画像信号を動画像信号1112として所定のタイミングで表示デバイス(図示せず)へ出力し、入力映像信号を再生する。   Based on the stereo image identifier 1110 sent from the stereo image identifier decoding unit 1103, the switch 1106 is based on the moving image signal 1111 sent from the moving image reverse rotation unit 1105 and the moving image signal 1109 sent from the switch 1104. Select one. That is, the switch 1106 displays the moving image signal 1111 sent from the moving image reverse rotation unit 1105 when the stereo image identifier 1110 is 1, and the moving image signal 1109 sent from the switch 1104 when the stereo image identifier 1110 is 0. Are selected, and the selected moving image signal is output as a moving image signal 1112 to a display device (not shown) at a predetermined timing to reproduce the input video signal.

なお、動画像逆回転部1105は、スイッチ1104から送られた動画像信号1109を受信し、図12(b)に示す動画像信号1109により表される動画像を左に−90°回転することで、図12(c)に示す縦1列ごとに交互に左目画像と右目画像とが配置された動画像信号1110に変換し、動画像信号1110をスイッチ1106に送っても良い。   The moving image reverse rotation unit 1105 receives the moving image signal 1109 sent from the switch 1104 and rotates the moving image represented by the moving image signal 1109 shown in FIG. 12B to the left by −90 °. Thus, the moving image signal 1110 may be converted to the moving image signal 1110 in which the left eye image and the right eye image are alternately arranged for each vertical column shown in FIG.

動画像逆回転部1105が、スイッチ1104から送られた動画像信号1109を受信し、動画像信号1109により表される動画像を左に+90°回転するか−90°回転するかは、予め決定された回転方法に従う。   The moving image reverse rotation unit 1105 receives the moving image signal 1109 sent from the switch 1104, and determines in advance whether to rotate the moving image represented by the moving image signal 1109 to the left by + 90 ° or −90 °. Follow the rotation method.

また、動画像逆回転部1105が動画像信号1109を、左に+90°回転するか−90°回転するかの処理は、動画像の符号化に関する情報として、ステレオ画像識別子とともに多重化符号化ビットストリーム315に含まれた符号に基づいて行っても良い。例えば、以下のような処理を行ってもよい。多重化符号化ビットストリーム315の動画像の符号化に関する符号が「10」の場合は、ステレオ画像識別子を1とし、動画像逆回転部1105がスイッチ1104から送られた動画像信号1109を左に+90°回転する。上記符号が「11」の場合は、ステレオ画像識別子を1とし、動画像逆回転部1105がスイッチ1104から送られた動画像信号1109を左に−90°回転する。上記符号が「0」の場合は、ステレオ画像識別子を0とする。   In addition, the process of whether the moving image reverse rotation unit 1105 rotates the moving image signal 1109 to the left by + 90 ° or −90 ° is a multiplexed coding bit together with a stereo image identifier as information on moving image coding. You may perform based on the code | symbol contained in the stream 315. FIG. For example, the following processing may be performed. When the code relating to the moving image encoding of the multiplexed encoded bit stream 315 is “10”, the stereo image identifier is set to 1, and the moving image reverse rotation unit 1105 moves the moving image signal 1109 sent from the switch 1104 to the left. Rotate + 90 °. When the code is “11”, the stereo image identifier is set to 1, and the moving image reverse rotation unit 1105 rotates the moving image signal 1109 sent from the switch 1104 to the left by −90 °. When the code is “0”, the stereo image identifier is set to 0.

(動画像復号化装置の動作)
次に、図13を用いて、本発明における動画像復号化装置110の動作を説明する。
(Operation of video decoding device)
Next, the operation of the moving picture decoding apparatus 110 according to the present invention will be described with reference to FIG.

まず、分離部1101が、入力された多重化符号化ビットストリームを受信し、動画像の符号化ビットストリーム1107とステレオ画像識別子の符号1108とに分離する(ステップS1301)。   First, the separation unit 1101 receives an input multiplexed encoded bit stream and separates it into a moving image encoded bit stream 1107 and a stereo image identifier code 1108 (step S1301).

次に、動画像インターレース復号化部1102が、動画像の符号化ビットストリーム1107を復号化することで動画像信号1109を復元する(ステップS1302)。次に、ステレオ画像識別子復号化部1103が、ステレオ画像識別子の符号1108を復号化することでステレオ画像識別子1110を復元する(ステップS1303)。   Next, the moving image interlace decoding unit 1102 restores the moving image signal 1109 by decoding the encoded bit stream 1107 of the moving image (step S1302). Next, the stereo image identifier decoding unit 1103 restores the stereo image identifier 1110 by decoding the stereo image identifier code 1108 (step S1303).

次に、ステレオ画像識別子が1であるか否かを判定し(ステップS1304)、ステレオ画像識別子が1であった場合、動画像逆回転部1105が上記復元された動画像信号1109を左に+90°または−90°回転する(ステップS1305)。一方、ステレオ画像識別子が1でなかった場合は、ステップS1305の回転処理をスキップして、後述のステップS1306へ進む。   Next, it is determined whether or not the stereo image identifier is 1 (step S1304). If the stereo image identifier is 1, the moving image reverse rotation unit 1105 adds the restored moving image signal 1109 to the left by +90. It is rotated by 90 ° or −90 ° (step S1305). On the other hand, if the stereo image identifier is not 1, the rotation process in step S1305 is skipped and the process proceeds to step S1306 described later.

最後に、スイッチ1106は、ステレオ画像識別子が1の場合、動画像逆回転部1105から送られた動画像信号1111を、ステレオ画像識別子1110が0の場合、スイッチ1104から送られた動画像信号1109を、それぞれ選択し、選択された動画像信号を動画像信号1112として所定のタイミングで表示デバイス(図示せず)へ出力する(ステップS1306)。   Finally, the switch 1106 displays the moving image signal 1111 sent from the moving image reverse rotation unit 1105 when the stereo image identifier is 1, and the moving image signal 1109 sent from the switch 1104 when the stereo image identifier 1110 is 0. Are selected, and the selected moving image signal is output as a moving image signal 1112 to a display device (not shown) at a predetermined timing (step S1306).

以上述べた第1実施形態によれば、縦1列ごとに交互に左目画像と右目画像とが配置されたステレオ動画像信号を+90°または−90°回転してインターレース画像と同様の画素配置にした後、インターレース符号化することで、左目画像と右目画像との相関性を利用して、データ圧縮の効率を向上させることができる。   According to the first embodiment described above, the stereo moving image signal in which the left-eye image and the right-eye image are alternately arranged every vertical column is rotated by + 90 ° or −90 ° to obtain the same pixel arrangement as that of the interlaced image. After that, by performing interlace encoding, it is possible to improve the efficiency of data compression by utilizing the correlation between the left-eye image and the right-eye image.

また、動画像回転部303でステレオ画像を+90°または−90°回転させてインターレース画像と同様の画素配置にしてインターレース符号化し、動画像逆回転部1105で復号画像を+90°または−90°逆回転させてステレオ画像に復元することで、パララックスバリア方式の立体動画像表示装置で表示する場合に、復号化処理後の画像信号のラインの順番を変更し直すことなく、入力画像と同じ画像信号を得ることができる。   Further, the moving image rotating unit 303 rotates the stereo image by + 90 ° or −90 ° to perform interlace encoding with the same pixel arrangement as the interlaced image, and the moving image reverse rotating unit 1105 reverses the decoded image by + 90 ° or −90 °. The same image as the input image without changing the order of the lines of the decoded image signal when displaying on a parallax barrier stereoscopic video display device by rotating and restoring to a stereo image A signal can be obtained.

さらに、縦1列ごとに交互に左目画像と右目画像が配置されたステレオ動画像信号、および横1行ごとに交互に奇数行画像と偶数行画像が配置されたインターレース動画像信号に対し、同一の動画像符号化装置で符号化を行うことができるとともに、同一の動画像復号化装置で復号化を行うことができ、装置の有効利用が可能である。   Furthermore, it is the same for a stereo moving image signal in which left-eye images and right-eye images are alternately arranged for each vertical column, and an interlaced moving image signal in which odd-numbered row images and even-numbered row images are alternately arranged for each horizontal row. Can be encoded by the same moving picture encoding apparatus, and can be decoded by the same moving picture decoding apparatus, so that the apparatus can be used effectively.

なお、動画像回転部303および動画像逆回転部1105は、動画像信号309および動画像信号1109を、それぞれフレーム単位で右に+90°または−90°回転、および左に+90°または−90°回転しても良い。   The moving image rotation unit 303 and the moving image reverse rotation unit 1105 rotate the moving image signal 309 and the moving image signal 1109 to the right by + 90 ° or −90 ° and to the left by + 90 ° or −90 °, respectively. It may rotate.

また、動画像回転部303および動画像逆回転部1105は、動画像信号309および動画像信号1109を、それぞれスライス単位で右に+90°または−90°回転、および左に+90°または−90°回転しても良い。   The moving image rotating unit 303 and the moving image reverse rotating unit 1105 rotate the moving image signal 309 and the moving image signal 1109 to the right by + 90 ° or −90 ° and to the left by + 90 ° or −90 °, respectively. It may rotate.

また、動画像回転部303および動画像逆回転部1105は、動画像信号309および動画像信号1109を、それぞれマクロブロック単位で右に+90°または−90°回転、および左に+90°または−90°回転しても良い。   The moving image rotation unit 303 and the moving image reverse rotation unit 1105 rotate the moving image signal 309 and the moving image signal 1109 to the right by + 90 ° or −90 ° and to the left by + 90 ° or −90, respectively, in units of macroblocks. ° May rotate.

上記では、右に+90°または−90°回転、および左に+90°または−90°回転という例を示したが、回転角度はこれらに限定されるものではなく、動画像における縦方向が横方向に変わるように回転させればよい。例えば、右に+270°または−270°回転、および左に+270°または−270°回転という回転パターンを採用してもよい。   In the above, an example of + 90 ° or −90 ° rotation to the right and + 90 ° or −90 ° rotation to the left is shown, but the rotation angle is not limited to these, and the vertical direction in the moving image is the horizontal direction Rotate to change to For example, a rotation pattern of + 270 ° or −270 ° rotation to the right and + 270 ° or −270 ° rotation to the left may be employed.

また、上記では、動画像信号を、動画像回転部303により所定方向に回転させ、動画像逆回転部1105により当該所定方向とは逆方向に回転させる(即ち、逆回転させる)例を示したが、これに限定されるものではなく、動画像逆回転部1105により当該所定方向と同じ方向に回転させることで、元の動画像信号を復元してもよい。例えば、動画像信号を、動画像回転部303により右に+90°回転させ、動画像逆回転部1105により右に+270°回転させることで、元の動画像信号を復元してもよい。   In the above description, an example in which a moving image signal is rotated in a predetermined direction by the moving image rotation unit 303 and rotated in a direction opposite to the predetermined direction by the moving image reverse rotation unit 1105 (that is, reverse rotation) is shown. However, the present invention is not limited to this, and the original moving image signal may be restored by rotating the moving image reverse rotation unit 1105 in the same direction as the predetermined direction. For example, the original moving image signal may be restored by rotating the moving image signal to the right by + 90 ° by the moving image rotating unit 303 and rotating the moving image signal by + 270 ° to the right by the moving image reverse rotating unit 1105.

[第2実施形態]
(動画像符号化装置の構成)
まず、図14を用いて、本発明に係る動画像符号化装置140について説明する。以下に説明する動画像符号化装置140は、H.264/AVC符号化方式に準拠した符号化装置である。
[Second Embodiment]
(Configuration of video encoding device)
First, the moving picture coding apparatus 140 according to the present invention will be described with reference to FIG. The moving picture encoding apparatus 140 described below is an This is an encoding device compliant with the H.264 / AVC encoding system.

ここで、動画像符号化装置140に入力される動画像信号としての入力映像信号は、右目画像と左目画像とを縦1列ごとに交互に並べたステレオ動画像、または奇数行画像と偶数行画像とを横1行ごとに交互に並べたインターレース動画像を表す動画像信号である。本実施形態では、入力された動画像信号により表される画像は、16画素×16ライン固定の正方矩形領域であるマクロブロックに分割され、マクロブロック単位で以下の符号化処理が行われる。   Here, an input video signal as a moving image signal input to the moving image encoding device 140 is a stereo moving image in which right-eye images and left-eye images are alternately arranged in vertical columns, or odd-numbered images and even-numbered rows. It is a moving image signal representing an interlaced moving image in which images are alternately arranged for each horizontal line. In the present embodiment, an image represented by an input moving image signal is divided into macroblocks that are square pixels having a fixed size of 16 pixels × 16 lines, and the following encoding process is performed in units of macroblocks.

動画像符号化装置140は、図14に示すように、機能的な構成要素として、動画像種別判定部1401と、ステレオ/インターレース動き検出部1402と、ステレオ/インターレース動き補償部1403と、フレームメモリ1404と、ステレオ/インターレース空間予測部1405と、スイッチ1406と、減算器1407と、ステレオ/インターレース直交変換部1408と、量子化部1409と、可変長符号化部1410と、逆量子化部1411と、ステレオ/インターレース逆直交変換部1412と、加算器1413とを備えて構成される。以下、各構成要素について説明する。   As shown in FIG. 14, the moving image coding apparatus 140 includes, as functional components, a moving image type determination unit 1401, a stereo / interlace motion detection unit 1402, a stereo / interlace motion compensation unit 1403, and a frame memory. 1404, stereo / interlace space prediction unit 1405, switch 1406, subtractor 1407, stereo / interlace orthogonal transform unit 1408, quantization unit 1409, variable length coding unit 1410, and inverse quantization unit 1411 , A stereo / interlace inverse orthogonal transform unit 1412 and an adder 1413. Hereinafter, each component will be described.

動画像種別判定部1401は、符号化対象の動画像を表す外部から入力された動画像信号としての入力映像信号1421を受信した後、入力映像信号1421により表される画像(以下「入力画像」という)をマクロブロックに分割し、マクロブロック単位で減算器1407およびステレオ/インターレース動き検出部1402に対し、それぞれ入力画像信号1422、1423を送る。また、動画像種別判定部1401は、入力画像がステレオ画像であるか否かを判定し、ステレオ画像である場合、画像の種別に関する情報であるステレオ画像識別子を「1」とし、ステレオ画像でない場合、上記ステレオ画像識別子を「0」とする。そして、動画像種別判定部1401は、動画像全体での符号化に関する情報(シーケンス情報)、各フレーム画像単位での符号化に関する情報(フレーム情報)、1個以上のマクロブロックをまとめた各スライス単位での符号化に関する情報(スライス情報)、および各マクロブロック単位での符号化に関する情報(マクロブロック情報)とともに、上記ステレオ画像識別子の情報を信号1440としてステレオ/インターレース動き検出部1402と可変長符号化部1410へ送る。なお、上記ステレオ画像識別子の符号は、図6のようにシーケンスヘッダに含んで伝送しても良いし、図7のようにフレームヘッダに含んで伝送しても良い。また、上記ステレオ画像識別子の符号は、図8のようにスライスヘッダに含んで伝送しても良いし、図9のようにマクロブロックヘッダに含んで伝送しても良い。   The moving image type determination unit 1401 receives an input video signal 1421 as a moving image signal input from the outside representing a moving image to be encoded, and then displays an image represented by the input video signal 1421 (hereinafter “input image”). ) Are divided into macro blocks, and input image signals 1422 and 1423 are sent to the subtracter 1407 and the stereo / interlace motion detector 1402 in units of macro blocks, respectively. In addition, the moving image type determination unit 1401 determines whether or not the input image is a stereo image. If the input image is a stereo image, the stereo image identifier that is information regarding the type of the image is set to “1”, and the input image is not a stereo image. The stereo image identifier is set to “0”. Then, the moving image type determination unit 1401 includes information related to encoding of the entire moving image (sequence information), information related to encoding of each frame image (frame information), and each slice in which one or more macroblocks are collected. Stereo / interlace motion detection unit 1402 and variable length using information on the stereo image identifier as signal 1440 together with information on encoding in units (slice information) and information on encoding in units of macroblocks (macroblock information) The data is sent to the encoding unit 1410. In addition, the code | symbol of the said stereo image identifier may be included and transmitted in a sequence header like FIG. 6, and may be included and transmitted in a frame header like FIG. The stereo image identifier code may be transmitted by being included in a slice header as shown in FIG. 8, or may be transmitted by being included in a macroblock header as shown in FIG.

フレームメモリ1404は、過去に符号化済みのフレーム画像信号を記憶しておく部分である。   The frame memory 1404 is a part for storing previously encoded frame image signals.

ステレオ/インターレース動き検出部1402は、動画像種別判定部1401から送られた画像の種別に関する情報、シーケンス情報、フレーム情報、スライス情報、およびマクロブロック情報を合わせた信号1440を基に、予測モードの選択と動きベクトルの検出を行う部分である。H.264/AVC符号化方式では、マクロブロックごとに、予測モードとして、入力された映像信号と時間的に異なる複数の符号化済みフレーム画像信号を参照して予測を行う複数のフレーム間予測モードと、同一空間上の符号化済みである近傍の画素値を用いて空間予測を行う複数のフレーム内予測モードとが用意されている。具体的には、動き検出部1402は、予測モードとしてフレーム間予測モードを選択した場合、参照画像信号1424および隣接ブロックの動きベクトル1442を用いて、予めフレームメモリ1404に蓄積されている複数の符号化済み画像の中から所定の探索範囲内で、符号化対象領域の画像信号パターンに類似する画像信号パターンを探し出す。そして、符号化対象領域の画像信号パターンと、当該類似する画像信号パターンとの間の空間的な変位量である動きベクトルを検出する。   The stereo / interlace motion detection unit 1402 is based on a signal 1440 that is a combination of information related to the type of image, sequence information, frame information, slice information, and macroblock information sent from the moving image type determination unit 1401. This is the part that performs selection and motion vector detection. H. In the H.264 / AVC encoding method, for each macroblock, as a prediction mode, a plurality of inter-frame prediction modes that perform prediction with reference to a plurality of encoded frame image signals temporally different from the input video signal; There are prepared a plurality of intra-frame prediction modes that perform spatial prediction using neighboring pixel values that have been encoded in the same space. Specifically, when the inter-frame prediction mode is selected as the prediction mode, the motion detection unit 1402 uses a plurality of codes stored in the frame memory 1404 in advance using the reference image signal 1424 and the motion vector 1442 of the adjacent block. An image signal pattern similar to the image signal pattern of the encoding target region is searched for from the encoded image within a predetermined search range. Then, a motion vector that is a spatial displacement amount between the image signal pattern of the encoding target region and the similar image signal pattern is detected.

より詳細には、ステレオ/インターレース動き検出部1402は、入力画像がステレオ画像である場合(即ち、ステレオ画像識別子が「1」にセットされている場合)に、入力画像をフレーム画像(図15(a)参照)としてフレーム間予測した場合(即ち、フレーム画像でのフレーム間予測を行った場合)と、入力画像を左フィールド画像(図15(b)参照)と右フィールド画像(図15(c)参照)とに分離してフレーム間予測した場合(即ち、フィールド画像でのフレーム間予測を行った場合)との符号化効率を比較し、符号化効率の高い方のフレーム間予測を選択する。   More specifically, when the input image is a stereo image (that is, when the stereo image identifier is set to “1”), the stereo / interlace motion detection unit 1402 converts the input image into a frame image (FIG. 15 ( a) (see FIG. 15B) and when the input image is a left field image (see FIG. 15B) and a right field image (see FIG. 15C). ) Reference) and the coding efficiency compared with the case where the inter-frame prediction is performed separately (that is, when the inter-frame prediction is performed on the field image), and the inter-frame prediction having the higher coding efficiency is selected. .

また、ステレオ/インターレース動き検出部1402は、入力画像がインターレース画像である場合(即ち、ステレオ画像識別子が「0」にセットされている場合)に、入力画像をフレーム画像(図16(a)参照)としてフレーム間予測した場合(即ち、フレーム画像でのフレーム間予測を行った場合)と、入力画像を奇数行画像(上フィールド画像:図16(b)参照)と偶数行画像(下フィールド画像:図16(c)参照)とに分離してフレーム間予測した場合(即ち、フィールド画像でのフレーム間予測を行った場合)との符号化効率を比較し、符号化効率の高い方のフレーム間予測を選択する。   The stereo / interlace motion detection unit 1402 converts the input image into a frame image (see FIG. 16A) when the input image is an interlaced image (that is, when the stereo image identifier is set to “0”). ) When inter-frame prediction is performed (that is, when inter-frame prediction is performed on a frame image), and the input image is an odd-numbered row image (upper field image: see FIG. 16B) and even-numbered row image (lower field image) : See FIG. 16 (c)), and the encoding efficiency is compared with the case where the inter-frame prediction is performed separately (that is, when the inter-frame prediction is performed on the field image). Select between predictions.

ステレオ/インターレース動き検出部1402は、検出された動きベクトルと、符号化済みの隣接ブロックの動きベクトル1442から算出される最適予測動きベクトル(動きベクトル予測値)との差分情報である動きベクトル差分値と、動きベクトルの検出に用いた参照フレーム画像信号を示す参照フレーム番号と、選択された予測モードとを含む信号1425を可変長符号化部1410へ送る。同時に、動き検出部1402は、選択された予測モードと、動きベクトルと、参照フレーム番号とを含む信号1426をステレオ/インターレース動き補償部1403に送る。   The stereo / interlace motion detection unit 1402 is a motion vector difference value that is difference information between the detected motion vector and the optimal prediction motion vector (motion vector prediction value) calculated from the motion vector 1442 of the encoded adjacent block. Then, a signal 1425 including the reference frame number indicating the reference frame image signal used for motion vector detection and the selected prediction mode is sent to the variable length coding unit 1410. At the same time, the motion detection unit 1402 sends a signal 1426 including the selected prediction mode, motion vector, and reference frame number to the stereo / interlace motion compensation unit 1403.

また、ステレオ/インターレース動き検出部1402は、予測モードの情報の一部である、「選択された予測モードがフレーム画像でのフレーム間予測かフィールド画像でのフレーム間予測であるか」の情報および「入力画像がステレオ画像であるかインターレース画像であるか」の情報を表す信号1441を、ステレオ/インターレース動き補償部1403と、ステレオ/インターレース直交変換部1408と、ステレオ/インターレース逆直交変換部1412とに送る。   The stereo / interlace motion detection unit 1402 also includes information on “whether the selected prediction mode is inter-frame prediction in a frame image or inter-frame prediction in a field image”, which is a part of prediction mode information, and A signal 1441 representing information indicating whether the input image is a stereo image or an interlaced image is converted into a stereo / interlace motion compensation unit 1403, a stereo / interlace orthogonal transform unit 1408, and a stereo / interlace inverse orthogonal transform unit 1412. Send to.

ステレオ/インターレース動き補償部1403は、ステレオ/インターレース動き検出部1402から送られた上記の信号1426を用いて、フレームメモリ1404中の参照フレーム番号で示される符号化済み画像信号(参照画像信号1424)を参照して、各マクロブロックの予測画像信号1427を作成しスイッチ1406に送る。   The stereo / interlace motion compensation unit 1403 uses the above-described signal 1426 sent from the stereo / interlace motion detection unit 1402 to encode an encoded image signal (reference image signal 1424) indicated by a reference frame number in the frame memory 1404. , A predicted image signal 1427 for each macroblock is generated and sent to the switch 1406.

より詳細には、ステレオ/インターレース動き補償部1403は、上記の信号1441を基に、ステレオ/インターレース動き検出部1402から送られた上記の信号1426を用いて、フレームメモリ1404中の参照フレーム番号で示される符号化済み画像信号(参照画像信号1424)を参照して、各マクロブロックの予測画像信号1427を作成する。   More specifically, the stereo / interlace motion compensation unit 1403 uses the signal 1426 sent from the stereo / interlace motion detection unit 1402 based on the signal 1441, and the reference frame number in the frame memory 1404. The predicted image signal 1427 of each macroblock is created with reference to the encoded image signal (reference image signal 1424) shown.

入力画像がステレオ画像で(ステレオ画像識別子が「1」の場合)、選択された予測モードが「フレーム画像でのフレーム間予測」であるとき、ステレオ/インターレース動き補償部1403は、符号化対象のマクロブロックを一つのフレーム画像として動き補償を行った後、予測画像信号1427を作成する。また、入力画像がステレオ画像で、選択された予測モードが「フィールド画像でのフレーム間予測」であるとき、ステレオ/インターレース動き補償部1403は、符号化対象のマクロブロックを左フィールド画像と右フィールド画像とに分けて動き補償を行った後、左フィールドの予測画像信号と右フィールドの予測画像信号とを縦1列ごとに交互に並べて予測画像信号1427を作成する。   When the input image is a stereo image (when the stereo image identifier is “1”) and the selected prediction mode is “inter-frame prediction with a frame image”, the stereo / interlace motion compensation unit 1403 selects the encoding target. After performing motion compensation using a macroblock as one frame image, a predicted image signal 1427 is created. In addition, when the input image is a stereo image and the selected prediction mode is “interframe prediction with a field image”, the stereo / interlace motion compensation unit 1403 converts the macroblock to be encoded into a left field image and a right field. After performing motion compensation for each image, a predicted image signal 1427 is generated by alternately arranging the predicted image signal of the left field and the predicted image signal of the right field for each vertical column.

入力画像がインターレース画像で(ステレオ画像識別子が「0」の場合)、選択された予測モードが「フレーム画像でのフレーム間予測」であるとき、ステレオ/インターレース動き補償部1403は、符号化対象のマクロブロックを一つのフレーム画像として動き補償を行った後、予測画像信号1427を作成する。また、入力画像がインターレース画像で、選択された予測モードが「フィールド画像でのフレーム間予測」であるとき、ステレオ/インターレース動き補償部1403は、符号化対象のマクロブロックを上フィールド画像と下フィールド画像とに分けて動き補償を行った後、上フィールドの予測画像信号と下フィールドの予測画像信号とを横1行ごとに交互に並べて予測画像信号1427を作成する。   When the input image is an interlaced image (when the stereo image identifier is “0”) and the selected prediction mode is “inter-frame prediction with a frame image”, the stereo / interlace motion compensation unit 1403 is the encoding target. After performing motion compensation using a macroblock as one frame image, a predicted image signal 1427 is created. When the input image is an interlaced image and the selected prediction mode is “interframe prediction in a field image”, the stereo / interlace motion compensation unit 1403 converts the macroblock to be encoded into an upper field image and a lower field. After performing motion compensation for each image, a predicted image signal 1427 is generated by alternately arranging the predicted image signal of the upper field and the predicted image signal of the lower field for each horizontal row.

一方、ステレオ/インターレース動き検出部1402は、予測モードとして「フレーム内予測モード」を選択した場合、同一画像上の符号化済みである近傍のブロックの画素値を用いた空間予測を行い、予測モードを含む信号1425を可変長符号化部1410へ送る。この場合、ステレオ/インターレース動き検出部1402は、時間的な動きに関する情報である動きベクトル差分値および参照フレーム番号の信号を可変長符号化部1410へ送信する処理は行わない。また、ステレオ/インターレース動き検出部1402は、予測モードの情報の一部である、「選択された予測モードがフレーム画像でのフレーム内予測かフィールド画像でのフレーム内予測であるか」の情報および「入力画像がステレオ画像であるかインターレース画像であるか」の情報を表す信号1428を、ステレオ/インターレース直交変換部1408と、ステレオ/インターレース逆直交変換部1412と、ステレオ/インターレース空間予測部1405とに送る。   On the other hand, when the “intraframe prediction mode” is selected as the prediction mode, the stereo / interlace motion detection unit 1402 performs spatial prediction using pixel values of neighboring blocks that are already encoded on the same image, and performs prediction mode. Is sent to the variable length coding unit 1410. In this case, the stereo / interlace motion detection unit 1402 does not perform the process of transmitting the motion vector difference value and the reference frame number signal, which are information about temporal motion, to the variable length coding unit 1410. In addition, the stereo / interlace motion detection unit 1402 includes information on “whether the selected prediction mode is intra-frame prediction in a frame image or intra-frame prediction in a field image”, which is a part of prediction mode information, and A signal 1428 representing information indicating whether the input image is a stereo image or an interlaced image is converted into a stereo / interlace orthogonal transform unit 1408, a stereo / interlace inverse orthogonal transform unit 1412, and a stereo / interlace space prediction unit 1405. Send to.

より詳細には、ステレオ/インターレース動き検出部1402は、入力画像がステレオ画像である場合(ステレオ画像識別子が「1」の場合)、入力画像をフレーム画像(図15(a)参照)としてフレーム内予測した場合(即ち、フレーム画像でのフレーム内予測を行う場合)と、入力画像を左フィールド画像(図15(b)参照)と右フィールド画像(図15(c)参照)とに分離してフレーム内予測した場合(即ち、フィールド画像でのフレーム内予測を行う場合)との符号化効率を比較し、符号化効率の高い方のフレーム内予測を選択する。   More specifically, when the input image is a stereo image (when the stereo image identifier is “1”), the stereo / interlace motion detection unit 1402 uses the input image as a frame image (see FIG. 15A). When prediction is performed (that is, when intra-frame prediction is performed with a frame image), an input image is separated into a left field image (see FIG. 15B) and a right field image (see FIG. 15C). The encoding efficiency is compared with the case where intra-frame prediction is performed (that is, when intra-frame prediction is performed on a field image), and the intra-frame prediction having the higher encoding efficiency is selected.

また、ステレオ/インターレース動き検出部1402は、入力画像がインターレース画像である場合(ステレオ画像識別子が「0」の場合)、入力画像をフレーム画像(図16(a)参照)としてフレーム内予測した場合(即ち、フレーム画像でのフレーム内予測を行う場合)と、入力画像を奇数行画像(上フィールド画像:図16(b)参照)と偶数行画像(下フィールド画像:図16(c)参照)とに分離してフレーム内予測した場合(即ち、フィールド画像でのフレーム内予測を行う場合)との符号化効率を比較し、符号化効率の高い方のフレーム内予測を選択する。   Also, when the input image is an interlaced image (when the stereo image identifier is “0”), the stereo / interlace motion detection unit 1402 performs intraframe prediction using the input image as a frame image (see FIG. 16A). (That is, when intra-frame prediction is performed with a frame image), and the input image is an odd-numbered row image (upper field image: see FIG. 16B) and even-numbered row image (lower field image: see FIG. 16C)) Are compared with each other when the intra-frame prediction is performed separately (that is, when intra-frame prediction is performed with a field image), and the intra-frame prediction with the higher encoding efficiency is selected.

ステレオ/インターレース空間予測部1405は、ステレオ/インターレース動き検出部1402から送られた信号1428を基に、フレームメモリ1404中の符号化済みである近傍のブロックの画像信号(参照画像信号1429)を参照して、各マクロブロックの予測画像信号1430を生成し、スイッチ1406に送る。   The stereo / interlace space prediction unit 1405 refers to the image signal (reference image signal 1429) of a neighboring block that has been encoded in the frame memory 1404 based on the signal 1428 sent from the stereo / interlace motion detection unit 1402. Then, a predicted image signal 1430 of each macro block is generated and sent to the switch 1406.

このとき、入力画像がステレオ画像で(ステレオ画像識別子が「1」の場合)、選択された予測モードが「フレーム画像でのフレーム内予測」であるとき、ステレオ/インターレース空間予測部1405は、符号化対象のマクロブロックを一つのフレーム画像として空間予測した後、予測画像信号1430を作成する。また、入力画像がステレオ画像で、選択された予測モードが「フィールド画像でのフレーム内予測」であるとき、ステレオ/インターレース空間予測部1405は、符号化対象のマクロブロックを左フィールド画像と右フィールド画像とに分けて空間予測した後、左フィールドの予測画像信号と右フィールドの予測画像信号とを縦1列ごとに交互に並べて予測画像信号1430を作成する。   At this time, when the input image is a stereo image (when the stereo image identifier is “1”) and the selected prediction mode is “intraframe prediction in a frame image”, the stereo / interlace space prediction unit 1405 After predicting the macroblock to be converted into a single frame image, a predicted image signal 1430 is generated. When the input image is a stereo image and the selected prediction mode is “intraframe prediction with a field image”, the stereo / interlace space prediction unit 1405 converts the macroblock to be encoded into a left field image and a right field. After performing spatial prediction separately for images, the predicted image signal 1430 is generated by alternately arranging the predicted image signal of the left field and the predicted image signal of the right field for each vertical column.

一方、入力画像がインターレース画像で(ステレオ画像識別子が「0」の場合)、選択された予測モードが「フレーム画像でのフレーム内予測」であるとき、ステレオ/インターレース空間予測部1405は、符号化対象のマクロブロックを一つのフレーム画像として空間予測した後、予測画像信号1430を作成する。また、入力画像がインターレース画像で、選択された予測モードが「フィールド画像でのフレーム内予測」であるとき、ステレオ/インターレース空間予測部1405は、符号化対象のマクロブロックを上フィールド画像と下フィールド画像とに分けて空間予測した後、上フィールドの予測画像信号と下フィールドの予測画像信号とを横1行ごとに交互に並べて予測画像信号1430を作成する。   On the other hand, when the input image is an interlaced image (when the stereo image identifier is “0”) and the selected prediction mode is “intraframe prediction with a frame image”, the stereo / interlace space prediction unit 1405 performs encoding. After spatial prediction of the target macroblock as one frame image, a predicted image signal 1430 is created. When the input image is an interlaced image and the selected prediction mode is “intraframe prediction with a field image”, the stereo / interlace space prediction unit 1405 converts the macroblock to be encoded into an upper field image and a lower field. After performing spatial prediction separately for images, the predicted image signal 1430 is generated by alternately arranging the predicted image signal of the upper field and the predicted image signal of the lower field for each horizontal row.

スイッチ1406は、ステレオ/インターレース動き検出部1402から送られた予測モード1431に応じて、予測画像信号1427と予測画像信号1430のうちいずれかを選択し、選択した予測画像信号1432を減算器1407に送る。   The switch 1406 selects one of the predicted image signal 1427 and the predicted image signal 1430 according to the prediction mode 1431 sent from the stereo / interlace motion detection unit 1402, and sends the selected predicted image signal 1432 to the subtracter 1407. send.

減算器1407は、入力画像信号1422と予測画像信号1432との差分値(予測残差信号1433)を生成し、ステレオ/インターレース直交変換部1408に送る。   The subtractor 1407 generates a difference value (prediction residual signal 1433) between the input image signal 1422 and the predicted image signal 1432 and sends the difference value to the stereo / interlace orthogonal transform unit 1408.

ステレオ/インターレース直交変換部1408は、ステレオ/インターレース動き検出部1402から送られた信号1428又は1441を基に、減算器1407から送られた予測残差信号1433の画素配置を変更して直交変換を行うことにより、直交変換係数1434を生成して、量子化部1409に送る。   The stereo / interlace orthogonal transform unit 1408 changes the pixel arrangement of the prediction residual signal 1433 sent from the subtractor 1407 based on the signal 1428 or 1441 sent from the stereo / interlace motion detection unit 1402 to perform orthogonal transform. By doing so, an orthogonal transform coefficient 1434 is generated and sent to the quantization unit 1409.

このとき、入力画像がステレオ画像であった場合(ステレオ画像識別子が「1」の場合)の予測残差信号1433の画素配置を図17に示す。予測モードが「フレーム画像でのフレーム間予測」または「フレーム画像でのフレーム内予測」の場合は、ステレオ/インターレース直交変換部1408は、図17(a)のように予測残差信号1433の画素配置を変更することなく、4画素×4ラインのブロックに分割して、直交変換を行う。一方、予測モードが「フィールド画像でのフレーム間予測」または「フィールド画像でのフレーム内予測」の場合は、ステレオ/インターレース直交変換部1408は、図17(b)のように予測残差信号1433を左フィールド予測残差信号と右フィールド予測残差信号とに分離した画素配置に変更し、フィールドごとに4画素×4ラインのブロックに分割して、直交変換を行う。   At this time, FIG. 17 shows the pixel arrangement of the prediction residual signal 1433 when the input image is a stereo image (when the stereo image identifier is “1”). When the prediction mode is “inter-frame prediction with a frame image” or “intra-frame prediction with a frame image”, the stereo / interlace orthogonal transform unit 1408 uses the pixels of the prediction residual signal 1433 as shown in FIG. The orthogonal transform is performed by dividing the block into 4 pixels × 4 lines without changing the arrangement. On the other hand, when the prediction mode is “inter-frame prediction in a field image” or “intra-frame prediction in a field image”, the stereo / interlace orthogonal transform unit 1408 performs the prediction residual signal 1433 as shown in FIG. Is changed to a pixel arrangement separated into a left field prediction residual signal and a right field prediction residual signal, and is divided into blocks of 4 pixels × 4 lines for each field, and orthogonal transformation is performed.

一方、入力画像がインターレース画像であった場合(ステレオ画像識別子が「0」の場合)の予測残差信号1433の画素配置を図18に示す。予測モードが「フレーム画像でのフレーム間予測」または「フレーム画像でのフレーム内予測」の場合は、ステレオ/インターレース直交変換部1408は、図18(a)のように予測残差信号1433の画素配置を変更することなく、4画素×4ラインのブロックに分割して、直交変換を行う。予測モードが「フィールド画像でのフレーム間予測」または「フィールド画像でのフレーム内予測」の場合は、ステレオ/インターレース直交変換部1408は、図18(b)のように予測残差信号1433を上フィールド予測残差信号と下フィールド予測残差信号とに分離した画素配置に変更し、フィールドごとに4画素×4ラインのブロックに分割して、直交変換を行う。   On the other hand, FIG. 18 shows the pixel arrangement of the prediction residual signal 1433 when the input image is an interlaced image (when the stereo image identifier is “0”). When the prediction mode is “inter-frame prediction with a frame image” or “intra-frame prediction with a frame image”, the stereo / interlace orthogonal transform unit 1408 uses the pixels of the prediction residual signal 1433 as shown in FIG. The orthogonal transform is performed by dividing the block into 4 pixels × 4 lines without changing the arrangement. When the prediction mode is “interframe prediction with a field image” or “intraframe prediction with a field image”, the stereo / interlace orthogonal transform unit 1408 increases the prediction residual signal 1433 as shown in FIG. The pixel arrangement is divided into a field prediction residual signal and a lower field prediction residual signal, and is divided into blocks of 4 pixels × 4 lines for each field, and orthogonal transformation is performed.

なお、直交変換の単位は4画素×4ラインには限らず、16画素×16ライン、8画素×8ライン、16画素×8ライン、8画素×16ラインのような単位で行うこともできる。   The unit of orthogonal transformation is not limited to 4 pixels × 4 lines, but can be performed in units of 16 pixels × 16 lines, 8 pixels × 8 lines, 16 pixels × 8 lines, 8 pixels × 16 lines.

量子化部1409は、ステレオ/インターレース直交変換部1408から送られた直交変換係数1434を量子化することにより、量子化直交変換係数1435を生成し、可変長符号化部1410および逆量子化部1411に送る。   The quantization unit 1409 quantizes the orthogonal transform coefficient 1434 sent from the stereo / interlace orthogonal transform unit 1408 to generate a quantized orthogonal transform coefficient 1435, and a variable length coding unit 1410 and an inverse quantization unit 1411. Send to.

次に、可変長符号化部1410が、動画像種別判定部1401から送られた復号画像の種別に関する情報(ステレオ画像識別子)、シーケンス情報、フレーム情報、スライス情報、およびマクロブロック情報を含む符号化に関する情報を合わせた信号1440と、量子化部1409から送られた量子化直交変換係数1435と、動き検出部1402から送られた予測モード、動きベクトル差分値および参照フレーム番号を含む信号1425とについて、エントロピー符号化を行って圧縮ストリーム1436に多重化して、外部へ伝送する。   Next, the variable length coding unit 1410 performs coding including information (stereo image identifier) regarding the type of decoded image sent from the moving image type determination unit 1401, sequence information, frame information, slice information, and macroblock information. A signal 1440 combining information on the information, a quantized orthogonal transform coefficient 1435 sent from the quantizing unit 1409, and a signal 1425 containing a prediction mode, a motion vector difference value, and a reference frame number sent from the motion detecting unit 1402 Then, entropy coding is performed, multiplexed into the compressed stream 1436, and transmitted to the outside.

また、逆量子化部1411は、量子化部1409から送られた量子化直交変換係数1435について逆量子化を行うことにより、直交変換係数1437を生成して、ステレオ/インターレース逆直交変換部1412に送る。   In addition, the inverse quantization unit 1411 generates an orthogonal transform coefficient 1437 by performing inverse quantization on the quantized orthogonal transform coefficient 1435 sent from the quantization unit 1409, and sends it to the stereo / interlace inverse orthogonal transform unit 1412. send.

そして、ステレオ/インターレース逆直交変換部1412は、ステレオ/インターレース動き検出部1402から送られた信号1428又は1441を基に、逆量子化部1411から送られた直交変換係数1437について逆直交変換を行い、画素配置を変更して予測残差信号1438を生成し、加算器1413に送る。   Then, the stereo / interlace inverse orthogonal transform unit 1412 performs inverse orthogonal transform on the orthogonal transform coefficient 1437 sent from the inverse quantization unit 1411 based on the signal 1428 or 1441 sent from the stereo / interlace motion detection unit 1402. , The pixel arrangement is changed, and a prediction residual signal 1438 is generated and sent to the adder 1413.

このとき、入力画像がステレオ画像であった場合(ステレオ画像識別子が「1」の場合)の予測残差信号の画素配置変更を図19に示す。予測モードが「フレーム画像でのフレーム間予測」または「フレーム画像でのフレーム内予測」の場合は、ステレオ/インターレース逆直交変換部1412は、図19(a)のように4画素×4ラインのブロックごとに逆直交変換した画素配置を変更することなく予測残差信号1433を生成する。一方、予測モードが「フィールド画像でのフレーム間予測」または「フィールド画像でのフレーム内予測」の場合は、ステレオ/インターレース逆直交変換部1412は、図19(b)のように逆直交変換した左フィールド予測残差信号と右フィールド予測残差信号とを縦1列ごとに交互に並べて合成し、予測残差信号1438を生成する。   At this time, FIG. 19 shows the pixel arrangement change of the prediction residual signal when the input image is a stereo image (when the stereo image identifier is “1”). When the prediction mode is “inter-frame prediction with a frame image” or “intra-frame prediction with a frame image”, the stereo / interlace inverse orthogonal transform unit 1412 has 4 pixels × 4 lines as shown in FIG. The prediction residual signal 1433 is generated without changing the pixel arrangement subjected to inverse orthogonal transform for each block. On the other hand, when the prediction mode is “interframe prediction in a field image” or “intraframe prediction in a field image”, the stereo / interlace inverse orthogonal transform unit 1412 performs inverse orthogonal transform as shown in FIG. The left field prediction residual signal and the right field prediction residual signal are alternately arranged and combined for each vertical column, and a prediction residual signal 1438 is generated.

一方、入力画像がインターレース画像であった場合(ステレオ画像識別子が「0」の場合)の予測残差信号の画素配置変更を図20に示す。予測モードが「フレーム画像でのフレーム間予測」または「フレーム画像でのフレーム内予測」の場合は、ステレオ/インターレース逆直交変換部1412は、図20(a)のように4画素×4ラインのブロックごとに逆直交変換した画素配置を変更することなく予測残差信号1433を生成する。一方、予測モードが「フィールド画像でのフレーム間予測」または「フィールド画像でのフレーム内予測」の場合は、ステレオ/インターレース逆直交変換部1412は、図20(b)のように逆直交変換した上フィールド予測残差信号と下フィールド予測残差信号とを横1行ごとに交互に並べて合成し、予測残差信号1438を生成する。   On the other hand, FIG. 20 shows a change in the pixel arrangement of the prediction residual signal when the input image is an interlaced image (when the stereo image identifier is “0”). When the prediction mode is “inter-frame prediction with a frame image” or “intra-frame prediction with a frame image”, the stereo / interlace inverse orthogonal transform unit 1412 has 4 pixels × 4 lines as shown in FIG. The prediction residual signal 1433 is generated without changing the pixel arrangement subjected to inverse orthogonal transform for each block. On the other hand, when the prediction mode is “interframe prediction in a field image” or “intraframe prediction in a field image”, the stereo / interlace inverse orthogonal transform unit 1412 performs inverse orthogonal transform as shown in FIG. The upper field prediction residual signal and the lower field prediction residual signal are alternately arranged for each horizontal row and combined to generate a prediction residual signal 1438.

加算器1413は、ステレオ/インターレース逆直交変換部1412から送られた予測残差信号1438と、スイッチ1406から送られた予測画像信号1432とを加算することで、局所復号画像であるフレーム画像信号1439を生成し、フレームメモリ1404に送る。このフレーム画像信号1439は、フレームメモリ1404に格納され、以降の符号化処理で、参照画像信号として用いられる。また、動きベクトルや参照フレーム番号に関する情報も、参照フレーム画像に含まれ、同時に格納される。   The adder 1413 adds the prediction residual signal 1438 sent from the stereo / interlace inverse orthogonal transform unit 1412 and the prediction image signal 1432 sent from the switch 1406 to add a frame image signal 1439 that is a locally decoded image. Is sent to the frame memory 1404. The frame image signal 1439 is stored in the frame memory 1404 and used as a reference image signal in the subsequent encoding process. Information about motion vectors and reference frame numbers is also included in the reference frame image and stored at the same time.

次に、図21に示す動画像復号化装置210の動作について説明する。以下に説明する動画像復号化装置210は、動画像符号化装置140と同様に、H.264/AVC符号化方式に準拠した復号化装置である。   Next, the operation of the moving picture decoding apparatus 210 shown in FIG. 21 will be described. The moving picture decoding apparatus 210 described below is similar to the moving picture encoding apparatus 140 in the H.264 format. This is a decoding device compliant with the H.264 / AVC encoding system.

動画像復号化装置210は、動画像符号化装置140により出力された圧縮ストリーム1436を入力信号として用い、これを入力映像信号に復号化する機能を有する。   The moving picture decoding apparatus 210 has a function of using the compressed stream 1436 output from the moving picture encoding apparatus 140 as an input signal and decoding it into an input video signal.

動画像復号化装置210は、図21に示すように、機能的な構成要素として、可変長復号化部2101と、ステレオ/インターレース動きベクトル復元部2102と、ステレオ/インターレース動き補償部2103と、フレームメモリ2104と、ステレオ/インターレース空間予測部2105と、スイッチ2106と、逆量子化部2107と、ステレオ/インターレース逆直交変換部2108と、加算器2109とを備えて構成される。以下、各構成要素について説明する。   As shown in FIG. 21, the moving picture decoding apparatus 210 includes, as functional components, a variable length decoding unit 2101, a stereo / interlace motion vector restoration unit 2102, a stereo / interlace motion compensation unit 2103, a frame A memory 2104, a stereo / interlace space prediction unit 2105, a switch 2106, an inverse quantization unit 2107, a stereo / interlace inverse orthogonal transform unit 2108, and an adder 2109 are configured. Hereinafter, each component will be described.

可変長復号化部2101は、圧縮ストリーム1436を受信した後、圧縮ストリーム1436を復号化することで、シーケンスの先頭を表す同期記号およびシーケンスヘッダ、フレームヘッダ、スライスヘッダ、マクロブロックヘッダと、画像の種別に関する情報(ステレオ画像識別子)と、「マクロブロック単位の予測モードがフレーム画像でのフレーム間予測であるかフィールド画像でのフレーム間予測であるかの情報、または、予測モードがフレーム画像でのフレーム内予測であるかフィールド画像でのフレーム内予測であるかの情報」とを合わせた信号2134に復号し、当該信号2134を、ステレオ/インターレース動きベクトル復元部2102と、ステレオ/インターレース空間予測部2105と、ステレオ/インターレース逆直交変換部2108とに送る。また、可変長復号化部2101は、マクロブロック符号化情報として、マクロブロック単位で予測モードと量子化直交変換係数を復号する。   After receiving the compressed stream 1436, the variable-length decoding unit 2101 decodes the compressed stream 1436, thereby decoding a synchronization symbol representing the head of the sequence, a sequence header, a frame header, a slice header, a macroblock header, and an image Information on the type (stereo image identifier) and “information on whether the prediction mode in units of macroblocks is inter-frame prediction in a frame image or inter-frame prediction in a field image, or the prediction mode is in a frame image The information 2134 is combined with information indicating whether the prediction is intraframe prediction or intraframe prediction in a field image, and the signal 2134 is decoded into a stereo / interlace motion vector restoration unit 2102 and a stereo / interlace space prediction unit. 2105 and stereo / interlace Sent to the orthogonal transform unit 2108. Also, the variable length decoding unit 2101 decodes the prediction mode and the quantized orthogonal transform coefficient in units of macro blocks as macro block coding information.

また、予測モードがフレーム間予測モードである場合、可変長復号化部2101は、動きベクトル差分値と参照フレーム番号の復号も合わせて行う。なお、可変長復号化部2101は、復号した量子化直交変換係数2122を逆量子化部2107に送る。   When the prediction mode is the inter-frame prediction mode, the variable length decoding unit 2101 also performs decoding of the motion vector difference value and the reference frame number. The variable length decoding unit 2101 sends the decoded quantized orthogonal transform coefficient 2122 to the inverse quantization unit 2107.

また、予測モードがフレーム間予測モードである場合、可変長復号化部2101は、復号した予測モードと動きベクトル差分値と参照フレーム番号とを含む信号2121をステレオ/インターレース動きベクトル復元部2102に送るとともに、復元した予測モード2126をスイッチ2106に送る。一方、予測モードがフレーム内予測モードである場合、可変長復号化部2101は、復号した予測モード2126をスイッチ2106およびステレオ/インターレース空間予測部2105に送る。   When the prediction mode is the inter-frame prediction mode, the variable length decoding unit 2101 sends a signal 2121 including the decoded prediction mode, the motion vector difference value, and the reference frame number to the stereo / interlace motion vector restoration unit 2102. At the same time, the restored prediction mode 2126 is sent to the switch 2106. On the other hand, when the prediction mode is the intraframe prediction mode, the variable length decoding unit 2101 sends the decoded prediction mode 2126 to the switch 2106 and the stereo / interlace space prediction unit 2105.

予測モードがフレーム間予測モードである場合、ステレオ/インターレース動きベクトル復元部2102は、可変長復号化部2101から送信された信号2134と、動きベクトル差分値と、復号化済みの隣接ブロックの動きベクトル2124から算出した動きベクトル予測値とを用いて動きベクトルを復元し、上記の信号2134と、復元で得られた動きベクトル、予測モードおよび参照フレーム番号を含む信号2123とをステレオ/インターレース動き補償部2103に送る。   When the prediction mode is the inter-frame prediction mode, the stereo / interlace motion vector restoration unit 2102, the signal 2134 transmitted from the variable length decoding unit 2101, the motion vector difference value, and the motion vector of the decoded adjacent block The motion vector is restored using the motion vector prediction value calculated from 2124, and the above-described signal 2134 and the signal 2123 including the motion vector, the prediction mode, and the reference frame number obtained by the restoration are stereo / interlace motion compensation units. 2103.

より詳細には、ステレオ/インターレース動きベクトル復元部2102は、復号化対象の画像(以下「復号画像」という)がステレオ画像で(即ち、ステレオ画像識別子が「1」の場合)、予測モードが「フレーム画像でのフレーム間予測」である場合、可変長復号化部2101から送信された動きベクトル差分値と、復号化済みの隣接ブロックの動きベクトル2124から算出した動きベクトル予測値とを用いて、マクロブロック単位でのフレーム画像の動きベクトルを復元する。一方、復号画像がステレオ画像で(即ち、ステレオ画像識別子が「1」の場合)、予測モードが「フィールド画像でのフレーム間予測」である場合、可変長復号化部2101から送信された動きベクトル差分値と、復号化済みの隣接ブロックの動きベクトル2124から算出した動きベクトル予測値とを用いて、左フィールド画像と右フィールド画像の各フィールド単位での動きベクトルを復元する。   More specifically, the stereo / interlaced motion vector restoration unit 2102 has a decoding target image (hereinafter referred to as “decoded image”) as a stereo image (that is, when the stereo image identifier is “1”) and the prediction mode is “ In the case of “inter-frame prediction in a frame image”, using the motion vector difference value transmitted from the variable length decoding unit 2101 and the motion vector prediction value calculated from the motion vector 2124 of the decoded adjacent block, Restores the motion vector of the frame image in units of macroblocks. On the other hand, when the decoded image is a stereo image (that is, when the stereo image identifier is “1”) and the prediction mode is “inter-frame prediction with a field image”, the motion vector transmitted from the variable length decoding unit 2101. Using the difference value and the motion vector prediction value calculated from the motion vector 2124 of the adjacent block that has been decoded, the motion vector in each field unit of the left field image and the right field image is restored.

また、ステレオ/インターレース動きベクトル復元部2102は、復号画像がインターレース画像で(即ち、ステレオ画像識別子が「0」の場合)、予測モードが「フレーム画像でのフレーム間予測」である場合、可変長復号化部2101から送信された動きベクトル差分値と、復号化済みの隣接ブロックの動きベクトル2124から算出した動きベクトル予測値とを用いて、マクロブロック単位でのフレーム画像の動きベクトルを復元する。一方、復号画像がインターレース画像で(即ち、ステレオ画像識別子が「0」の場合)、予測モードが「フィールド画像でのフレーム間予測」である場合、可変長復号化部2101から送信された動きベクトル差分値と、復号化済みの隣接ブロックの動きベクトル2124から算出した動きベクトル予測値とを用いて、上フィールド画像と下フィールド画像の各フィールド単位での動きベクトルを復元する。   Also, the stereo / interlaced motion vector restoration unit 2102 has a variable length when the decoded image is an interlaced image (that is, when the stereo image identifier is “0”) and the prediction mode is “inter-frame prediction with a frame image”. Using the motion vector difference value transmitted from the decoding unit 2101 and the motion vector prediction value calculated from the motion vector 2124 of the neighboring block that has been decoded, the motion vector of the frame image in units of macroblocks is restored. On the other hand, when the decoded image is an interlaced image (that is, when the stereo image identifier is “0”) and the prediction mode is “inter-frame prediction with a field image”, the motion vector transmitted from the variable length decoding unit 2101. Using the difference value and the motion vector prediction value calculated from the motion vector 2124 of the neighboring block that has been decoded, the motion vector in each field unit of the upper field image and the lower field image is restored.

ステレオ/インターレース動き補償部2103は、ステレオ/インターレース動きベクトル復元部2102から送られた信号2134と、動きベクトルと、予測モードと、参照フレーム番号とに基づいて、フレームメモリ2104から送信される参照フレーム画像2127を用いて、予測画像信号2125を生成し、スイッチ2106に送る。なお、フレームメモリ2104には、過去の復号化済みのフレーム画像信号が格納されている。   The stereo / interlace motion compensation unit 2103 receives the reference frame transmitted from the frame memory 2104 based on the signal 2134 transmitted from the stereo / interlace motion vector restoration unit 2102, the motion vector, the prediction mode, and the reference frame number. A predicted image signal 2125 is generated using the image 2127 and sent to the switch 2106. The frame memory 2104 stores past decoded frame image signals.

より詳細には、ステレオ/インターレース動き補償部2103は、復号画像がステレオ画像で(即ち、ステレオ画像識別子が「1」の場合)、予測モードが「フレーム画像でのフレーム間予測」である場合、ステレオ/インターレース動きベクトル復元部2102から送信された信号2134と、動きベクトルと、予測モードと、参照フレーム番号とに基づいて、フレームメモリ2104から送信される参照画像2127を用いて、マクロブロック単位でのフレーム画像の予測画像信号2125を生成する。一方、復号画像がステレオ画像で(即ち、ステレオ画像識別子が「1」の場合)、予測モードが「フィールド画像でのフレーム間予測」である場合、ステレオ/インターレース動きベクトル復元部2102から送信された信号2134と、動きベクトルと、予測モードと、参照フレーム番号とに基づいて、フレームメモリ2104から送信される参照画像2127を用いて、左フィールド画像と右フィールド画像の各フィールド単位で予測画像信号を生成した後、左フィールドの予測画像信号と右フィールドの予測画像信号とを縦1列ごとに交互に並べて予測画像信号2125を作成する。   More specifically, the stereo / interlace motion compensation unit 2103, when the decoded image is a stereo image (that is, when the stereo image identifier is “1”) and the prediction mode is “inter-frame prediction with a frame image”, Based on the signal 2134 transmitted from the stereo / interlaced motion vector restoration unit 2102, the motion vector, the prediction mode, and the reference frame number, the reference image 2127 transmitted from the frame memory 2104 is used for each macroblock. The predicted image signal 2125 of the frame image is generated. On the other hand, when the decoded image is a stereo image (that is, when the stereo image identifier is “1”) and the prediction mode is “inter-frame prediction with a field image”, it is transmitted from the stereo / interlace motion vector restoration unit 2102. Based on the signal 2134, the motion vector, the prediction mode, and the reference frame number, the reference image 2127 transmitted from the frame memory 2104 is used to generate the prediction image signal for each field of the left field image and the right field image. After the generation, the predicted image signal 2125 is created by alternately arranging the predicted image signal of the left field and the predicted image signal of the right field for each vertical column.

また、ステレオ/インターレース動き補償部2103は、復号画像がインターレース画像(即ち、ステレオ画像識別子が「0」の場合)で、予測モードが「フレーム画像でのフレーム間予測」である場合、ステレオ/インターレース動きベクトル復元部2102から送信された信号2134と、動きベクトルと、予測モードと、参照フレーム番号とに基づいて、フレームメモリ2104から送信される参照画像2127を用いて、マクロブロック単位でのフレーム画像の予測画像信号2125を生成する。一方、ステレオ/インターレース動き補償部2103は、復号画像がインターレース画像(即ち、ステレオ画像識別子が「0」の場合)で、予測モードが「フィールド画像でのフレーム間予測」である場合、ステレオ/インターレース動きベクトル復元部2102から送信された信号2134と、動きベクトルと、予測モードと、参照フレーム番号とに基づいて、フレームメモリ2104から送信される参照画像2127を用いて、上フィールド画像と下フィールド画像の各フィールド単位で予測画像信号を生成した後、上フィールドの予測画像信号と下フィールドの予測画像信号とを横1行ごとに交互に並べて予測画像信号2125を作成する。   Also, the stereo / interlace motion compensation unit 2103, when the decoded image is an interlaced image (that is, when the stereo image identifier is “0”) and the prediction mode is “inter-frame prediction with a frame image”, is stereo / interlaced. Based on the signal 2134 transmitted from the motion vector restoration unit 2102, the motion vector, the prediction mode, and the reference frame number, a reference image 2127 transmitted from the frame memory 2104 is used to generate a frame image in units of macroblocks. The predicted image signal 2125 is generated. On the other hand, when the decoded image is an interlaced image (that is, when the stereo image identifier is “0”) and the prediction mode is “interframe prediction in a field image”, the stereo / interlace motion compensation unit 2103 is stereo / interlaced. Based on the signal 2134 transmitted from the motion vector restoration unit 2102, the motion vector, the prediction mode, and the reference frame number, the reference image 2127 transmitted from the frame memory 2104 is used, and the upper field image and the lower field image Then, the predicted image signal is generated in units of each field, and the predicted image signal 2125 is generated by alternately arranging the predicted image signal of the upper field and the predicted image signal of the lower field for each horizontal row.

また、予測モードが「フレーム内予測モード」である場合、ステレオ/インターレース空間予測部2105は、符号化済みの近傍ブロックの画像信号(参照画像信号2127)を参照して予測画像信号2128を生成し、スイッチ2106に送る。   When the prediction mode is “intraframe prediction mode”, the stereo / interlace space prediction unit 2105 generates a predicted image signal 2128 by referring to the image signal (reference image signal 2127) of the encoded neighboring block. , To the switch 2106.

より詳細には、ステレオ/インターレース空間予測部2105は、復号画像がステレオ画像で(即ち、ステレオ画像識別子が「1」の場合)、予測モードが「フレーム画像でのフレーム内予測」である場合、可変長復号化部2101から送信された信号2134と予測モード2126とに基づいて、フレームメモリ2104から送信される参照画像2127を用いて、マクロブロック単位でのフレーム画像の予測画像信号2128を生成する。一方、復号画像がステレオ画像で(即ち、ステレオ画像識別子が「1」の場合)、予測モードが「フィールド画像でのフレーム内予測」である場合、ステレオ/インターレース空間予測部2105は、可変長復号化部2101から送信された信号2134と予測モード2126とに基づいて、フレームメモリ2104から送信される参照画像2127を用いて、左フィールド画像と右フィールド画像の各フィールド単位で予測画像信号を生成した後、左フィールドの予測画像信号と右フィールドの予測画像信号とを縦1列ごとに交互に並べて予測画像信号2128を作成する。   More specifically, the stereo / interlace space prediction unit 2105, when the decoded image is a stereo image (that is, when the stereo image identifier is “1”) and the prediction mode is “intra-frame prediction with a frame image”, Based on the signal 2134 and the prediction mode 2126 transmitted from the variable length decoding unit 2101, a reference image 2127 transmitted from the frame memory 2104 is used to generate a predicted image signal 2128 of a frame image in units of macroblocks. . On the other hand, when the decoded image is a stereo image (that is, when the stereo image identifier is “1”) and the prediction mode is “intraframe prediction with a field image”, the stereo / interlace space prediction unit 2105 performs variable length decoding. Based on the signal 2134 transmitted from the conversion unit 2101 and the prediction mode 2126, a reference image 2127 transmitted from the frame memory 2104 is used to generate a predicted image signal for each field of the left field image and the right field image. Thereafter, the predicted image signal 2128 is generated by alternately arranging the predicted image signal of the left field and the predicted image signal of the right field for each vertical column.

また、ステレオ/インターレース空間予測部2105は、復号画像がインターレース画像で(即ち、ステレオ画像識別子が「0」の場合)、予測モードが「フレーム画像でのフレーム内予測」である場合、可変長復号化部2101から送信された信号2134と予測モード2126とに基づいて、フレームメモリ2104から送信される参照画像2127を用いて、マクロブロック単位でのフレーム画像の予測画像信号2128を生成する。一方、復号画像がインターレース画像で(即ち、ステレオ画像識別子が「0」の場合)、予測モードが「フィールド画像でのフレーム内予測」である場合、ステレオ/インターレース空間予測部2105は、可変長復号化部2101から送信された信号2134と予測モード2126とに基づいて、フレームメモリ2104から送信される参照画像2127を用いて、上フィールド画像と下フィールド画像の各フィールド単位で予測画像信号を生成した後、上フィールドの予測画像信号と下フィールドの予測画像信号とを横1行ごとに交互に並べて予測画像信号2128を作成する。   Also, the stereo / interlace space prediction unit 2105 performs variable length decoding when the decoded image is an interlaced image (that is, when the stereo image identifier is “0”) and the prediction mode is “intraframe prediction with a frame image”. Based on the signal 2134 and the prediction mode 2126 transmitted from the conversion unit 2101, a reference image 2127 transmitted from the frame memory 2104 is used to generate a predicted image signal 2128 of a frame image in units of macroblocks. On the other hand, when the decoded image is an interlaced image (that is, when the stereo image identifier is “0”) and the prediction mode is “intraframe prediction with a field image”, the stereo / interlace space prediction unit 2105 performs variable length decoding. Based on the signal 2134 transmitted from the conversion unit 2101 and the prediction mode 2126, a reference image 2127 transmitted from the frame memory 2104 is used to generate a predicted image signal for each field of the upper field image and the lower field image. Thereafter, the predicted image signal 2128 is generated by alternately arranging the predicted image signal of the upper field and the predicted image signal of the lower field for each horizontal row.

次に、スイッチ2106が、可変長復号化部2101から送信された予測モード2126に応じて、予測画像信号2125と予測画像信号2128のうちいずれかを選択し、選択した信号を予測画像信号2129として加算器2109に送る。   Next, the switch 2106 selects either the prediction image signal 2125 or the prediction image signal 2128 according to the prediction mode 2126 transmitted from the variable length decoding unit 2101, and the selected signal is used as the prediction image signal 2129. Send to adder 2109.

一方、逆量子化部2107は、可変長復号化部2101により送信された量子化直交変換係数2122を逆量子化することで、量子化直交変換係数2122を直交変換係数2130に復元し、ステレオ/インターレース逆直交変換部2108に送る。   On the other hand, the inverse quantization unit 2107 dequantizes the quantized orthogonal transform coefficient 2122 transmitted by the variable length decoding unit 2101 to restore the quantized orthogonal transform coefficient 2122 to the orthogonal transform coefficient 2130, and The data is sent to the interlace inverse orthogonal transform unit 2108.

ステレオ/インターレース逆直交変換部2108は、直交変換係数2130を逆直交変換することで、直交変換係数2130を予測残差信号2131に復号する。   The stereo / interlace inverse orthogonal transform unit 2108 performs inverse orthogonal transform on the orthogonal transform coefficient 2130 to decode the orthogonal transform coefficient 2130 into the prediction residual signal 2131.

ステレオ/インターレース逆直交変換部2108に関するより詳細な説明は、動画像符号化装置140のステレオ/インターレース逆直交変換部1412と同様であるので、再度、図19および図20を使って説明する。   A more detailed description of the stereo / interlace inverse orthogonal transform unit 2108 is the same as that of the stereo / interlace inverse orthogonal transform unit 1412 of the moving picture coding apparatus 140, and therefore will be described again using FIGS. 19 and 20.

入力画像がステレオ画像であった場合(即ち、ステレオ画像識別子が「1」の場合)における予測残差信号の画素配置変更を図19に示す。予測モードが「フレーム画像でのフレーム間予測」または「フレーム画像でのフレーム内予測」の場合は、ステレオ/インターレース逆直交変換部2108は、図19(a)のように4画素×4ラインのブロックごとに逆直交変換した画素配置を変更することなく予測残差信号2131を生成する。一方、予測モードが「フィールド画像でのフレーム間予測」または「フィールド画像でのフレーム内予測」の場合は、ステレオ/インターレース逆直交変換部2108は、図19(b)のように逆直交変換した左フィールド予測残差信号と右フィールド予測残差信号とを縦1列ごとに交互に並べて合成することで、予測残差信号2131を生成する。   FIG. 19 shows the pixel arrangement change of the prediction residual signal when the input image is a stereo image (that is, when the stereo image identifier is “1”). When the prediction mode is “inter-frame prediction with a frame image” or “intra-frame prediction with a frame image”, the stereo / interlace inverse orthogonal transform unit 2108 has 4 pixels × 4 lines as shown in FIG. The prediction residual signal 2131 is generated without changing the pixel arrangement subjected to inverse orthogonal transform for each block. On the other hand, when the prediction mode is “interframe prediction in a field image” or “intraframe prediction in a field image”, the stereo / interlace inverse orthogonal transform unit 2108 performs inverse orthogonal transform as shown in FIG. A prediction residual signal 2131 is generated by alternately synthesizing the left field prediction residual signal and the right field prediction residual signal for each vertical column.

また、入力画像がインターレース画像であった場合(即ち、ステレオ画像識別子が「0」の場合)における予測残差信号の画素配置変更を図20に示す。予測モードが「フレーム画像でのフレーム間予測」または「フレーム画像でのフレーム内予測」の場合は、ステレオ/インターレース逆直交変換部2108は、図20(a)のように4画素×4ラインのブロックごとに逆直交変換した画素配置を変更することなく予測残差信号2131を生成する。一方、予測モードが「フィールド画像でのフレーム間予測」または「フィールド画像でのフレーム内予測」の場合は、ステレオ/インターレース逆直交変換部2108は、図20(b)のように逆直交変換した上フィールド予測残差信号と下フィールド予測残差信号とを横1行ごとに交互に並べて合成することで、予測残差信号2131を生成する。   Further, FIG. 20 shows the pixel arrangement change of the prediction residual signal when the input image is an interlaced image (that is, when the stereo image identifier is “0”). When the prediction mode is “inter-frame prediction with a frame image” or “intra-frame prediction with a frame image”, the stereo / interlace inverse orthogonal transform unit 2108 has 4 pixels × 4 lines as shown in FIG. The prediction residual signal 2131 is generated without changing the pixel arrangement subjected to inverse orthogonal transform for each block. On the other hand, when the prediction mode is “interframe prediction with a field image” or “intraframe prediction with a field image”, the stereo / interlace inverse orthogonal transform unit 2108 performs inverse orthogonal transform as shown in FIG. A prediction residual signal 2131 is generated by alternately combining the upper field prediction residual signal and the lower field prediction residual signal for each horizontal row.

加算器2109は、スイッチ2106から送信された予測画像信号2129と、ステレオ/インターレース逆直交変換部2108から送信された予測残差信号2131とを加算することで、フレーム画像信号2132として復号する。この加算器2109は、特許請求の範囲に記載した「画像データ生成部」に対応し、フレーム画像信号2132は、特許請求の範囲に記載した「画像データ」に対応する。   The adder 2109 adds the predicted image signal 2129 transmitted from the switch 2106 and the predicted residual signal 2131 transmitted from the stereo / interlace inverse orthogonal transform unit 2108 to decode the frame image signal 2132. The adder 2109 corresponds to the “image data generation unit” recited in the claims, and the frame image signal 2132 corresponds to the “image data” recited in the claims.

復号されたフレーム画像信号2132は、以降の復号化処理に用いられるため、参照フレーム画像信号としてフレームメモリ2104に格納される。ここで、フレーム画像信号2132は、動画像符号化装置140における同一番号のフレーム画像信号1439と同一の値となる。また、動きベクトルや参照フレーム番号に関する情報も、参照フレーム画像信号に含まれ同時に格納される。   The decoded frame image signal 2132 is stored in the frame memory 2104 as a reference frame image signal for use in subsequent decoding processing. Here, the frame image signal 2132 has the same value as the frame image signal 1439 having the same number in the moving image encoding device 140. Information about motion vectors and reference frame numbers is also included in the reference frame image signal and stored simultaneously.

最後に、フレーム画像信号2133は、所定の表示タイミングで表示デバイス(図示せず)へ出力され、入力映像信号(動画像信号)1421が再生される。   Finally, the frame image signal 2133 is output to a display device (not shown) at a predetermined display timing, and an input video signal (moving image signal) 1421 is reproduced.

以上述べた第2実施形態によれば、縦1列ごとに交互に左目画像と右目画像とが配置されたステレオ動画像信号に対し、フレーム画像として、または左フィールドと右フィールドからなるフィールド画像として、符号化および復号化を行うことにより、左目画像と右目画像の相関性を利用して、データ圧縮の効率を向上させることができる。   According to the second embodiment described above, as a frame image or a field image composed of a left field and a right field, a stereo moving image signal in which a left-eye image and a right-eye image are alternately arranged every vertical column. By performing the encoding and decoding, it is possible to improve the efficiency of data compression by utilizing the correlation between the left eye image and the right eye image.

また、入力したステレオ動画像信号と同じ画素配置の出力画像が得られるため、パララックスバリア方式の立体動画像表示装置で表示する場合に、復号化処理後の画像信号のラインの順番を変更し直すことなく、入力画像と同じ画像信号を得ることができる。   In addition, since an output image having the same pixel arrangement as the input stereo moving image signal is obtained, the order of the lines of the image signal after decoding processing is changed when displaying on a parallax barrier type stereoscopic moving image display device. The same image signal as the input image can be obtained without correction.

さらに、縦1列ごとに交互に左目画像と右目画像が配置されたステレオ動画像信号、および横1行ごとに交互に奇数行画像と偶数行画像が配置されたインターレース動画像信号に対し、同一の動画像符号化装置で符号化を行うことができるとともに、同一の動画像復号化装置で復号化を行うことができ、装置の有効利用が可能である。   Furthermore, it is the same for a stereo moving image signal in which left-eye images and right-eye images are alternately arranged for each vertical column, and an interlaced moving image signal in which odd-numbered row images and even-numbered row images are alternately arranged for each horizontal row. Can be encoded by the same moving picture encoding apparatus, and can be decoded by the same moving picture decoding apparatus, so that the apparatus can be used effectively.

なお、上記では、入力画像を、縦に2つに分割又は横に2つに分割することで得られる2つのフィールド画像に分離して、フレーム間予測又はフレーム内予測を行う例を示したが、入力画像の分離方法はこれに限定されるものではなく、入力画像を斜めの境界線によって分離してもよいし、上下方向に3つ以上に分離してもよいし、左右方向に3つ以上に分離してもよい。   In the above, an example is shown in which the input image is divided into two field images obtained by dividing the input image vertically into two or divided into two horizontally, and inter-frame prediction or intra-frame prediction is performed. The input image separation method is not limited to this, and the input image may be separated by an oblique boundary line, or may be separated into three or more in the vertical direction, or three in the horizontal direction. You may isolate | separate above.

さて、以下では図22〜図25を用いて、上記の各実施形態の符号化処理プログラムおよび復号化処理プログラムについて概説する。   Now, the encoding processing program and the decoding processing program of each of the above embodiments will be outlined below with reference to FIGS.

図22には、第1実施形態の動画像符号化処理に関する動画像符号化プログラム910の構成を示す。この図22に示すように、動画像符号化プログラム910は、処理を統括するメインモジュール911と、動画像種別判定モジュール912と、動画像回転モジュール913と、動画像インターレース符号化モジュール914と、ステレオ画像識別子符号化モジュール915と、多重化モジュール916とを備える。動画像種別判定モジュール912、動画像回転モジュール913、動画像インターレース符号化モジュール914、ステレオ画像識別子符号化モジュール915、多重化モジュール916がコンピュータに行わせる機能はそれぞれ、前述した図3の動画像種別判定部301、動画像回転部303、動画像インターレース符号化部305、ステレオ画像識別子符号化部306、多重化部307の機能に相当する。   FIG. 22 shows a configuration of a moving image encoding program 910 related to the moving image encoding process of the first embodiment. As shown in FIG. 22, the moving image encoding program 910 includes a main module 911 that supervises processing, a moving image type determination module 912, a moving image rotation module 913, a moving image interlaced encoding module 914, and a stereo. An image identifier encoding module 915 and a multiplexing module 916 are provided. The functions that the moving image type determination module 912, the moving image rotation module 913, the moving image interlace encoding module 914, the stereo image identifier encoding module 915, and the multiplexing module 916 perform on the computer are the moving image types shown in FIG. This corresponds to the functions of the determination unit 301, the moving image rotation unit 303, the moving image interlace encoding unit 305, the stereo image identifier encoding unit 306, and the multiplexing unit 307.

図23には、第1実施形態の動画像復号化処理に関する動画像復号化プログラム920の構成を示す。この図23に示すように、動画像復号化プログラム920は、処理を統括するメインモジュール921と、分離モジュール922と、動画像インターレース復号化モジュール923と、ステレオ画像識別子復号化モジュール924と、処理制御モジュール925とを備える。分離モジュール922、動画像インターレース復号化モジュール923、ステレオ画像識別子復号化モジュール924がコンピュータに行わせる機能はそれぞれ、前述した図11の分離部1101、動画像インターレース復号化部1102、ステレオ画像識別子復号化部1103の機能に相当する。また、処理制御モジュール925がコンピュータに行わせる機能は、図11の動画像逆回転部1105、スイッチ1104および1106の機能に相当する。   FIG. 23 shows the configuration of a moving picture decoding program 920 related to the moving picture decoding process of the first embodiment. As shown in FIG. 23, the moving picture decoding program 920 includes a main module 921 that supervises processing, a separation module 922, a moving picture interlace decoding module 923, a stereo picture identifier decoding module 924, and processing control. A module 925. The functions that the separation module 922, the moving image interlace decoding module 923, and the stereo image identifier decoding module 924 cause the computer to perform are the separation unit 1101, the moving image interlace decoding unit 1102, and the stereo image identifier decoding of FIG. This corresponds to the function of the unit 1103. The function that the processing control module 925 causes the computer to perform corresponds to the functions of the moving image reverse rotation unit 1105 and the switches 1104 and 1106 in FIG.

図24には、第2実施形態の動画像符号化処理に関する動画像符号化プログラム930の構成を示す。この図24に示すように、動画像符号化プログラム930は、処理を統括するメインモジュール931と、動画像種別判定モジュール932と、動き検出モジュール933と、動き補償モジュール934と、空間予測モジュール935と、直交変換モジュール936と、可変長符号化モジュール937と、逆直交変換モジュール938とを備える。動画像種別判定モジュール932、動き検出モジュール933、動き補償モジュール934、空間予測モジュール935がコンピュータに行わせる機能はそれぞれ、前述した図14の動画像種別判定部1401、ステレオ/インターレース動き検出部1402、ステレオ/インターレース動き補償部1403、ステレオ/インターレース空間予測部1405の機能に相当する。また、直交変換モジュール936がコンピュータに行わせる機能は、図14のスイッチ1406、減算器1407およびステレオ/インターレース直交変換部1408の機能に相当する。可変長符号化モジュール937がコンピュータに行わせる機能は、図14の量子化部1409および可変長符号化部1410の機能に相当する。逆直交変換モジュール938がコンピュータに行わせる機能は、図14の量子化部1409、逆量子化部1411およびステレオ/インターレース逆直交変換部1412の機能に相当する。   FIG. 24 shows the configuration of a moving image encoding program 930 related to the moving image encoding process of the second embodiment. As shown in FIG. 24, the moving image encoding program 930 includes a main module 931 that controls processing, a moving image type determination module 932, a motion detection module 933, a motion compensation module 934, and a spatial prediction module 935. , An orthogonal transform module 936, a variable length encoding module 937, and an inverse orthogonal transform module 938. The functions that the moving image type determination module 932, motion detection module 933, motion compensation module 934, and spatial prediction module 935 cause the computer to perform are the moving image type determination unit 1401, the stereo / interlaced motion detection unit 1402 in FIG. This corresponds to the functions of the stereo / interlace motion compensation unit 1403 and the stereo / interlace space prediction unit 1405. The functions that the orthogonal transform module 936 causes the computer to perform correspond to the functions of the switch 1406, the subtracter 1407, and the stereo / interlace orthogonal transform unit 1408 in FIG. The functions that the variable length encoding module 937 causes the computer to perform correspond to the functions of the quantization unit 1409 and the variable length encoding unit 1410 in FIG. The functions that the inverse orthogonal transform module 938 performs on the computer correspond to the functions of the quantization unit 1409, the inverse quantization unit 1411, and the stereo / interlace inverse orthogonal transform unit 1412 in FIG.

図25には、第2実施形態の動画像復号化処理に関する動画像復号化プログラム940の構成を示す。この図25に示すように、動画像復号化プログラム940は、処理を統括するメインモジュール941と、可変長復号化モジュール942と、動きベクトル復元モジュール943と、動き補償モジュール944と、空間予測モジュール945と、逆直交変換モジュール946と、画像データ生成モジュール947とを備える。可変長復号化モジュール942、動きベクトル復元モジュール943、動き補償モジュール944、空間予測モジュール945がコンピュータに行わせる機能はそれぞれ、前述した図21の可変長復号化部2101、ステレオ/インターレース動きベクトル復元部2102、ステレオ/インターレース動き補償部2103、ステレオ/インターレース空間予測部2105の機能に相当する。また、逆直交変換モジュール946がコンピュータに行わせる機能は、図21の逆量子化部2107およびステレオ/インターレース逆直交変換部2108の機能に相当する。画像データ生成モジュール947がコンピュータに行わせる機能は、図21の加算器2109の機能に相当する。   FIG. 25 shows the configuration of a moving picture decoding program 940 related to the moving picture decoding process of the second embodiment. As shown in FIG. 25, the moving picture decoding program 940 includes a main module 941 that supervises processing, a variable length decoding module 942, a motion vector restoration module 943, a motion compensation module 944, and a spatial prediction module 945. And an inverse orthogonal transform module 946 and an image data generation module 947. The functions that the variable length decoding module 942, motion vector restoration module 943, motion compensation module 944, and spatial prediction module 945 perform on the computer are the variable length decoding unit 2101 and stereo / interlace motion vector restoration unit shown in FIG. 2102, a stereo / interlace motion compensation unit 2103, and a stereo / interlace space prediction unit 2105. Further, the functions that the inverse orthogonal transform module 946 causes the computer to perform correspond to the functions of the inverse quantization unit 2107 and the stereo / interlace inverse orthogonal transform unit 2108 in FIG. The function that the image data generation module 947 causes the computer to perform corresponds to the function of the adder 2109 in FIG.

なお、上記の各プログラムは、コンピュータ読取り可能な記録媒体(以下、単に「記録媒体」と記す)に記録されて流通してもよいし、その一部若しくは全部を他の機器から通信回線等の伝送媒体を介して、本発明に係る動画像符号化装置または動画像復号化装置により受信され、記録される構成にしてもよい。反対に、上記の各プログラムは、本発明に係る動画像符号化装置または動画像復号化装置から伝送媒体を介して他の機器に伝送され、インストールされる構成としてもよい。   Each of the above-mentioned programs may be recorded and distributed on a computer-readable recording medium (hereinafter simply referred to as “recording medium”), or a part or all of the program may be transmitted from another device to a communication line or the like. It may be configured to be received and recorded by the moving picture coding apparatus or moving picture decoding apparatus according to the present invention via a transmission medium. On the contrary, each of the above programs may be transmitted from the moving picture encoding apparatus or moving picture decoding apparatus according to the present invention to another device via a transmission medium and installed.

10…フィルター、11…液晶ディスプレイ、12…スリット板、13…左目、14…右目、30、140…動画像符号化装置、110、210…動画像復号化装置、301…動画像種別判定部、302…スイッチ、303…動画像回転部、304…スイッチ、305…動画像インターレース符号化部、306…ステレオ画像識別子符号化部、307…多重化部、910、930…動画像符号化プログラム、920、940…動画像符号化プログラム、1101…分離部、1102…動画像インターレース復号化部、1103…ステレオ画像識別子復号化部、1104…スイッチ、1105…動画像逆回転部、1106…スイッチ、1401…動画像種別判定部、1402…ステレオ/インターレース動き検出部、1403…ステレオ/インターレース動き補償部、1404…フレームメモリ、1405…ステレオ/インターレース空間予測部、1406…スイッチ、1407…減算器、1408…ステレオ/インターレース直交変換部、1409…量子化部、1410…可変長符号化部、1411…逆量子化部、1412…ステレオ/インターレース逆直交変換部、1413…加算器、2101…可変長復号化部、2102…ステレオ/インターレース動きベクトル復元部、2103…ステレオ/インターレース動き補償部、2104…フレームメモリ、2105…ステレオ/インターレース空間予測部、2106…スイッチ、2107…逆量子化部、2108…ステレオ/インターレース逆直交変換部、2109…加算器。   DESCRIPTION OF SYMBOLS 10 ... Filter, 11 ... Liquid crystal display, 12 ... Slit board, 13 ... Left eye, 14 ... Right eye, 30, 140 ... Moving picture encoding apparatus, 110, 210 ... Moving picture decoding apparatus, 301 ... Moving picture type determination part, 302 ... Switch, 303 ... Moving image rotating unit, 304 ... Switch, 305 ... Moving image interlace coding unit, 306 ... Stereo image identifier coding unit, 307 ... Multiplexing unit, 910, 930 ... Moving image coding program, 920 , 940 ... moving picture coding program, 1101 ... separation part, 1102 ... moving picture interlace decoding part, 1103 ... stereo picture identifier decoding part, 1104 ... switch, 1105 ... moving picture reverse rotation part, 1106 ... switch, 1401 ... Moving image type determination unit, 1402... Stereo / interlace motion detection unit, 1403... Stereo / In -Race motion compensation unit, 1404 ... frame memory, 1405 ... stereo / interlace space prediction unit, 1406 ... switch, 1407 ... subtractor, 1408 ... stereo / interlace orthogonal transform unit, 1409 ... quantization unit, 1410 ... variable length coding unit , 1411: inverse quantization unit, 1412: stereo / interlace inverse orthogonal transform unit, 1413 ... adder, 2101 ... variable length decoding unit, 2102 ... stereo / interlace motion vector restoration unit, 2103 ... stereo / interlace motion compensation unit, 2104 ... Frame memory, 2105 ... Stereo / interlace space prediction unit, 2106 ... Switch, 2107 ... Inverse quantization unit, 2108 ... Stereo / interlace inverse orthogonal transform unit, 2109 ... Adder.

Claims (17)

右目画像と左目画像を縦1列ごとに交互に並べたステレオ動画像、および奇数行画像と偶数行画像を横1行ごとに交互に並べたインターレース動画像を符号化する動画像符号化装置であって、
符号化対象の動画像がステレオ動画像であるか否かを判定する動画像種別判定部と、
符号化対象の動画像がステレオ動画像であると判定された場合に、当該動画像における縦方向が横方向に変わるように、当該動画像を所定方向に所定角度回転させる動画像回転部と、
ステレオ動画像でないと判定された動画像、およびステレオ動画像であると判定され前記所定角度回転した動画像をインターレース符号化する動画像インターレース符号化部と、
符号化対象の動画像がステレオ動画像であるか否かを示すステレオ画像識別子を符号化するステレオ画像識別子符号化部と、
前記動画像インターレース符号化部によるインターレース符号化で得られた符号化ビットストリームと、前記ステレオ画像識別子符号化部による符号化で得られたステレオ画像識別子の符号とを多重化することで多重化符号化ビットストリームを作成する多重化部と、
を備える動画像符号化装置。
A moving image encoding device that encodes a stereo moving image in which a right eye image and a left eye image are alternately arranged in a vertical column and an interlaced moving image in which an odd row image and an even row image are alternately arranged in a horizontal row. There,
A moving image type determination unit that determines whether the moving image to be encoded is a stereo moving image;
A moving image rotating unit that rotates the moving image by a predetermined angle in a predetermined direction so that the vertical direction in the moving image is changed to a horizontal direction when it is determined that the moving image to be encoded is a stereo moving image;
A moving image interlace encoding unit that interlace-codes a moving image determined not to be a stereo moving image and a moving image determined to be a stereo moving image and rotated by the predetermined angle;
A stereo image identifier encoding unit that encodes a stereo image identifier indicating whether the moving image to be encoded is a stereo moving image;
A multiplexed code is obtained by multiplexing a coded bitstream obtained by interlace coding by the moving image interlace coding unit and a stereo image identifier code obtained by coding by the stereo image identifier coding unit. A multiplexing unit for creating a generalized bitstream;
A video encoding device comprising:
前記ステレオ画像識別子符号化部は、前記動画像回転部によって符号化対象の動画像に対し行われた回転に関する情報を、ステレオ画像識別子に含めて符号化することを特徴とする請求項1に記載の動画像符号化装置。   The stereo image identifier encoding unit includes the stereo image identifier so as to encode the information related to the rotation performed on the moving image to be encoded by the moving image rotation unit. Video encoding device. 右目画像と左目画像を縦1列ごとに交互に並べたステレオ動画像、および奇数行画像と偶数行画像を横1行ごとに交互に並べたインターレース動画像を符号化する動画像符号化装置であって、
符号化対象の動画像を表す入力画像信号に基づいて、当該符号化対象の動画像がステレオ動画像であるかインターレース動画像であるかの種別を判定する動画像種別判定部と、
フレーム間予測モードが選択され且つ前記判定により得られた動画像の種別がステレオ動画像である場合、入力画像をフレーム画像としてフレーム間予測したケースと入力画像を右目画像と左目画像とに分離してフレーム間予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム間予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム間予測」を、入力画像を右目画像と左目画像とに分離してフレーム間予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム間予測」を、予測モードとして選択し、
フレーム間予測モードが選択され且つ前記判定により得られた動画像の種別がインターレース動画像である場合、入力画像をフレーム画像としてフレーム間予測したケースと入力画像を奇数行画像と偶数行画像とに分離してフレーム間予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム間予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム間予測」を、入力画像を奇数行画像と偶数行画像とに分離してフレーム間予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム間予測」を、予測モードとして選択し、
フレーム内予測モードが選択され且つ前記判定により得られた動画像の種別がステレオ動画像である場合、入力画像をフレーム画像としてフレーム内予測したケースと入力画像を右目画像と左目画像とに分離してフレーム内予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム内予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム内予測」を、入力画像を右目画像と左目画像とに分離してフレーム内予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム内予測」を、予測モードとして選択し、
フレーム内予測モードが選択され且つ前記判定により得られた動画像の種別がインターレース動画像である場合、入力画像をフレーム画像としてフレーム内予測したケースと入力画像を奇数行画像と偶数行画像とに分離してフレーム内予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム内予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム内予測」を、入力画像を奇数行画像と偶数行画像とに分離してフレーム内予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム内予測」を、予測モードとして選択し、
予測モードとして「フレーム画像でのフレーム間予測」又は「フィールド画像でのフレーム間予測」が選択された場合、当該符号化対象の動画像に対する動きベクトルを検出する動き検出部と、
前記動画像の種別、前記選択された予測モードおよび前記検出された動きベクトルに基づいて、前記動画像に対し、動き補償を行う動き補償部と、
前記動画像の種別および前記選択された予測モードに基づいて、前記動画像に対し、空間予測を行う空間予測部と、
前記動画像の種別および前記選択された予測モードに基づいて、前記動き補償または前記空間予測により得られた予測画像信号と前記入力画像信号との差分として得られる予測残差信号に対し、直交変換を行う直交変換部と、
前記動画像の種別および前記選択された予測モードに基づいて、前記直交変換後の画像データに対し、可変長符号化を含む所定の画像処理を行う可変長符号化部と、
を備える動画像符号化装置。
A moving image encoding device that encodes a stereo moving image in which a right eye image and a left eye image are alternately arranged in a vertical column and an interlaced moving image in which an odd row image and an even row image are alternately arranged in a horizontal row. There,
A moving image type determination unit that determines a type of whether the moving image to be encoded is a stereo moving image or an interlaced moving image based on an input image signal representing the moving image to be encoded;
When the inter-frame prediction mode is selected and the type of the moving image obtained by the determination is a stereo moving image, the input image is separated into a right-eye image and a left-eye image when the inter-frame prediction is performed using the input image as a frame image. Compare the coding efficiency with the case predicted by inter-frame prediction, and if the coding efficiency of the case where the input image is frame-predicted as the frame image is higher, select `` inter-frame prediction with frame image ''. If the coding efficiency of the case where the inter-frame prediction is separated into the right-eye image and the left-eye image is higher, select “inter-frame prediction in the field image” as the prediction mode,
When the inter-frame prediction mode is selected and the type of moving image obtained by the determination is an interlaced moving image, the case of inter-frame prediction using the input image as a frame image and the input image as an odd-numbered image and an even-numbered row image Compare the encoding efficiency with the case where the inter-frame prediction is performed separately, and if the encoding efficiency of the case where the inter-frame prediction is performed using the input image as the frame image, input “inter-frame prediction with the frame image”. If the coding efficiency is higher in the case where the image is divided into an odd row image and an even row image and the inter-frame prediction is performed, select “inter-frame prediction in the field image” as the prediction mode,
When the intra-frame prediction mode is selected and the type of moving image obtained by the determination is a stereo moving image, the case where the input image is used as a frame image and the input image is separated into a right-eye image and a left-eye image. Compare the encoding efficiency with the case predicted in the frame, and if the encoding efficiency of the case predicted in the frame using the input image as the frame image is higher, select “intraframe prediction in the frame image”. If the coding efficiency of the case of intra-frame prediction separated into right-eye image and left-eye image is higher, select `` Intra-frame prediction with field image '' as the prediction mode,
When the intra-frame prediction mode is selected and the type of moving image obtained by the determination is an interlaced moving image, the case of intra-frame prediction using the input image as a frame image, and the input image as an odd-numbered image and an even-numbered row image Compare the coding efficiency with the case where the intra-frame prediction is performed separately, and if the coding efficiency of the case where intra-frame prediction is performed using the input image as the frame image, input "Intra-frame prediction with frame image". If the coding efficiency of the case where the image is separated into the odd-numbered image and the even-numbered row image and the intraframe prediction is higher, select “intraframe prediction in the field image” as the prediction mode,
When “prediction between frames in frame image” or “interframe prediction in field image” is selected as the prediction mode, a motion detection unit that detects a motion vector for the moving image to be encoded;
A motion compensation unit that performs motion compensation on the moving image based on the type of the moving image, the selected prediction mode, and the detected motion vector;
A spatial prediction unit that performs spatial prediction on the video based on the type of the video and the selected prediction mode;
Based on the type of the moving image and the selected prediction mode, an orthogonal transformation is performed on a prediction residual signal obtained as a difference between the prediction image signal obtained by the motion compensation or the spatial prediction and the input image signal. An orthogonal transform unit for performing
A variable-length encoding unit that performs predetermined image processing including variable-length encoding on the image data after the orthogonal transformation based on the type of the moving image and the selected prediction mode;
A video encoding device comprising:
前記動画像の種別および前記選択された予測モードに基づいて、前記直交変換後の画像データに対し、逆直交変換を含む所定の画像処理を行う逆直交変換部をさらに備える請求項記載の動画像符号化装置。 The moving image according to claim 3 , further comprising: an inverse orthogonal transform unit that performs predetermined image processing including inverse orthogonal transform on the image data after the orthogonal transform based on the type of the moving image and the selected prediction mode. Image encoding device. 前記動き検出部は、符号化対象の動画像がステレオ動画像で、前記選択した予測モードに基づき符号化対象領域をフィールド画像として予測する場合に、符号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、動きベクトルを検出することを特徴とする請求項に記載の動画像符号化装置。 The motion detection unit, when the encoding target moving image is a stereo moving image and predicts the encoding target region as a field image based on the selected prediction mode, the encoding target region is a left field image and a right field image. 4. The moving picture encoding apparatus according to claim 3 , wherein a motion vector is detected for each of the left and right separated fields. 前記動き補償部は、符号化対象の動画像がステレオ動画像で、前記選択した予測モードに基づき符号化対象領域をフィールド画像として予測する場合に、符号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、動き補償を行うことを特徴とする請求項に記載の動画像符号化装置。 The motion compensation unit, when the moving image to be encoded is a stereo moving image and predicts the encoding target region as a field image based on the selected prediction mode, the encoding target region is a left field image and a right field image. 4. The moving picture coding apparatus according to claim 3 , wherein motion compensation is performed for each of the fields separated into left and right as described above. 前記空間予測部は、符号化対象の動画像がステレオ動画像で、前記選択した予測モードに基づき符号化対象領域をフィールド画像として予測する場合に、符号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、空間予測を行うことを特徴とする請求項に記載の動画像符号化装置。 The spatial prediction unit, when the encoding target moving image is a stereo moving image and predicts the encoding target region as a field image based on the selected prediction mode, the encoding target region is defined as a left field image and a right field image. The video encoding apparatus according to claim 3 , wherein spatial prediction is performed for each of the fields separated as left and right. 前記直交変換部は、符号化対象の動画像がステレオ動画像で、前記選択した予測モードに基づき符号化対象領域をフィールド画像として予測する場合に、前記予測残差信号に基づく予測残差画像を左フィールド予測残差画像と右フィールド予測残差画像として左右に分離したフィールドごとに、直交変換を行うことを特徴とする請求項に記載の動画像符号化装置。 The orthogonal transform unit, when the encoding target moving image is a stereo moving image and predicting the encoding target region as a field image based on the selected prediction mode, the prediction residual image based on the prediction residual signal is 4. The moving picture coding apparatus according to claim 3 , wherein orthogonal transformation is performed for each of the left and right fields separated as a left field prediction residual image and a right field prediction residual image. 前記逆直交変換部は、符号化対象の動画像がステレオ動画像で、前記選択した予測モードに基づき符号化対象領域をフィールド画像として予測する場合に、前記直交変換後の画像データを左フィールド画像データと右フィールド画像データとして左右に分離したフィールドごとに、逆直交変換を含む所定の画像処理を行うことを特徴とする請求項に記載の動画像符号化装置。 The inverse orthogonal transform unit, when the encoding target moving image is a stereo moving image and predicting the encoding target region as a field image based on the selected prediction mode, the image data after the orthogonal transform is a left field image 5. The moving image encoding apparatus according to claim 4 , wherein predetermined image processing including inverse orthogonal transformation is performed for each field separated into left and right as data and right field image data. 右目画像と左目画像を縦1列ごとに交互に並べたステレオ動画像、および奇数行画像と偶数行画像を横1行ごとに交互に並べたインターレース動画像を復号化する動画像復号化装置であって、
復号化対象の動画像がステレオ動画像であるか否かの種別情報、復号化対象領域に関する予測モード情報、および復号化対象領域の直交変換済み画像データを復号化する可変長復号化部と、
前記復号化により得られた種別情報および予測モード情報に基づいて、復号化対象領域の動きベクトルを復元する動きベクトル復元部と、
前記種別情報、予測モード情報および前記復元された動きベクトルに基づいて、復号化対象領域に関する動き補償を行う動き補償部と、
前記種別情報および予測モード情報に基づいて、復号化対象領域に関する空間予測を行う空間予測部と、
前記種別情報および予測モード情報に基づいて、前記復号化により得られた復号化対象領域の直交変換済み画像データに対し、逆直交変換を含む所定の画像処理を行う逆直交変換部と、
前記逆直交変換部による画像処理により得られた予測残差信号と、前記動き補償または前記空間予測により得られた予測画像信号とから、復号化対象領域の画像データを生成する画像データ生成部と、
を備える動画像復号化装置。
A moving image decoding apparatus that decodes a stereo moving image in which right-eye images and left-eye images are alternately arranged in vertical columns and an interlaced moving image in which odd-numbered rows and even-numbered rows are alternately arranged in horizontal rows. There,
Type information indicating whether or not a moving image to be decoded is a stereo moving image, prediction mode information regarding a decoding target region, and a variable length decoding unit that decodes orthogonally transformed image data of the decoding target region;
A motion vector restoration unit that restores a motion vector of a decoding target region based on the type information and prediction mode information obtained by the decoding;
A motion compensation unit that performs motion compensation on a decoding target region based on the type information, prediction mode information, and the restored motion vector;
Based on the type information and prediction mode information, a spatial prediction unit that performs spatial prediction on a decoding target region;
Based on the type information and prediction mode information, an inverse orthogonal transform unit that performs predetermined image processing including inverse orthogonal transform on the orthogonal transformed image data of the decoding target region obtained by the decoding;
An image data generation unit that generates image data of a decoding target region from the prediction residual signal obtained by the image processing by the inverse orthogonal transform unit and the prediction image signal obtained by the motion compensation or the spatial prediction; ,
A video decoding device comprising:
前記動きベクトル復元部は、復号化対象の動画像がステレオ動画像で、前記予測モード情報に基づき復号化対象領域をフィールド画像として予測する場合に、復号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、動きベクトルを復元することを特徴とする請求項10に記載の動画像復号化装置。 The motion vector restoration unit, when the decoding target moving image is a stereo moving image and predicting the decoding target region as a field image based on the prediction mode information, the decoding target region is defined as a left field image and a right field image. The moving picture decoding apparatus according to claim 10 , wherein a motion vector is restored for each field separated as left and right. 前記動き補償部は、復号化対象の動画像がステレオ動画像で、前記予測モード情報に基づき復号化対象領域をフィールド画像として予測する場合に、復号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、動き補償を行うことを特徴とする請求項10に記載の動画像復号化装置。 The motion compensation unit, when the decoding target moving image is a stereo moving image and predicting the decoding target region as a field image based on the prediction mode information, the decoding target region as a left field image and a right field image 11. The moving picture decoding apparatus according to claim 10 , wherein motion compensation is performed for each field separated into right and left. 前記空間予測部は、復号化対象の動画像がステレオ動画像で、前記予測モード情報に基づき復号化対象領域をフィールド画像として予測する場合に、復号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、空間予測を行うことを特徴とする請求項10に記載の動画像復号化装置。 When the decoding target moving image is a stereo moving image and the decoding target region is predicted as a field image based on the prediction mode information, the spatial prediction unit sets the decoding target region as a left field image and a right field image. The moving picture decoding apparatus according to claim 10 , wherein spatial prediction is performed for each field separated into right and left. 前記逆直交変換部は、復号化する動画像がステレオ動画像で、前記予測モード情報に基づき復号化対象領域をフィールド画像として予測する場合に、復号化対象領域を左フィールド画像と右フィールド画像として左右に分離したフィールドごとに、逆直交変換を行うことを特徴とする請求項10に記載の動画像復号化装置。 When the moving image to be decoded is a stereo moving image and the decoding target region is predicted as a field image based on the prediction mode information, the inverse orthogonal transform unit sets the decoding target region as a left field image and a right field image. The moving picture decoding apparatus according to claim 10 , wherein inverse orthogonal transformation is performed for each field separated into right and left. 右目画像と左目画像を縦1列ごとに交互に並べたステレオ動画像、および奇数行画像と偶数行画像を横1行ごとに交互に並べたインターレース動画像を符号化する動画像符号化方法であって、
符号化対象の動画像がステレオ動画像であるか否かを判定する動画像種別判定ステップと、
符号化対象の動画像がステレオ動画像であると判定された場合に、当該動画像における縦方向が横方向に変わるように、当該動画像を所定方向に所定角度回転させる動画像回転ステップと、
ステレオ動画像でないと判定された動画像、およびステレオ動画像であると判定され前記所定角度回転した動画像をインターレース符号化する動画像インターレース符号化ステップと、
符号化対象の動画像がステレオ動画像であるか否かを示すステレオ画像識別子を符号化するステレオ画像識別子符号化ステップと、
前記インターレース符号化で得られた符号化ビットストリームと、前記符号化で得られたステレオ画像識別子の符号とを多重化することで多重化符号化ビットストリームを作成する多重化ステップと、
を有する動画像符号化方法。
A moving image encoding method for encoding a stereo moving image in which a right eye image and a left eye image are alternately arranged in a vertical column, and an interlaced moving image in which an odd row image and an even row image are alternately arranged in a horizontal row. There,
A moving image type determining step for determining whether or not the moving image to be encoded is a stereo moving image;
A moving image rotation step for rotating the moving image by a predetermined angle in a predetermined direction so that the vertical direction in the moving image is changed to the horizontal direction when it is determined that the moving image to be encoded is a stereo moving image;
A moving image interlaced encoding step for interlace encoding a moving image determined not to be a stereo moving image and a moving image determined to be a stereo moving image and rotated by the predetermined angle;
A stereo image identifier encoding step for encoding a stereo image identifier indicating whether or not the moving image to be encoded is a stereo moving image;
A multiplexing step of creating a multiplexed encoded bitstream by multiplexing the encoded bitstream obtained by the interlaced encoding and the stereo image identifier code obtained by the encoding;
A video encoding method comprising:
右目画像と左目画像を縦1列ごとに交互に並べたステレオ動画像、および奇数行画像と偶数行画像を横1行ごとに交互に並べたインターレース動画像を符号化する動画像符号化方法であって、
符号化対象の動画像を表す入力画像信号に基づいて、当該符号化対象の動画像がステレオ動画像であるかインターレース動画像であるかの種別を判定する動画像種別判定ステップと、
フレーム間予測モードが選択され且つ前記判定により得られた動画像の種別がステレオ動画像である場合、入力画像をフレーム画像としてフレーム間予測したケースと入力画像を右目画像と左目画像とに分離してフレーム間予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム間予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム間予測」を、入力画像を右目画像と左目画像とに分離してフレーム間予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム間予測」を、予測モードとして選択し、
フレーム間予測モードが選択され且つ前記判定により得られた動画像の種別がインターレース動画像である場合、入力画像をフレーム画像としてフレーム間予測したケースと入力画像を奇数行画像と偶数行画像とに分離してフレーム間予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム間予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム間予測」を、入力画像を奇数行画像と偶数行画像とに分離してフレーム間予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム間予測」を、予測モードとして選択し、
フレーム内予測モードが選択され且つ前記判定により得られた動画像の種別がステレオ動画像である場合、入力画像をフレーム画像としてフレーム内予測したケースと入力画像を右目画像と左目画像とに分離してフレーム内予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム内予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム内予測」を、入力画像を右目画像と左目画像とに分離してフレーム内予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム内予測」を、予測モードとして選択し、
フレーム内予測モードが選択され且つ前記判定により得られた動画像の種別がインターレース動画像である場合、入力画像をフレーム画像としてフレーム内予測したケースと入力画像を奇数行画像と偶数行画像とに分離してフレーム内予測したケースとの符号化効率を比較し、入力画像をフレーム画像としてフレーム内予測したケースの符号化効率の方が高い場合は「フレーム画像でのフレーム内予測」を、入力画像を奇数行画像と偶数行画像とに分離してフレーム内予測したケースの符号化効率の方が高い場合は「フィールド画像でのフレーム内予測」を、予測モードとして選択し、
予測モードとして「フレーム画像でのフレーム間予測」又は「フィールド画像でのフレーム間予測」が選択された場合、当該符号化対象の動画像に対する動きベクトルを検出する動き検出ステップと、
前記動画像の種別、前記選択された予測モードおよび前記検出された動きベクトルに基づいて、前記動画像に対し、動き補償を行う動き補償ステップと、
前記動画像の種別および前記選択された予測モードに基づいて、前記動画像に対し、空間予測を行う空間予測ステップと、
前記動画像の種別および前記選択された予測モードに基づいて、前記動き補償または前記空間予測により得られた予測画像信号と前記入力画像信号との差分として得られる予測残差信号に対し、直交変換を行う直交変換ステップと、
前記動画像の種別および前記選択された予測モードに基づいて、前記直交変換後の画像データに対し、可変長符号化を含む所定の画像処理を行う可変長符号化ステップと、
を有する動画像符号化方法。
A moving image encoding method for encoding a stereo moving image in which a right eye image and a left eye image are alternately arranged in a vertical column, and an interlaced moving image in which an odd row image and an even row image are alternately arranged in a horizontal row. There,
A moving image type determining step for determining a type of whether the moving image to be encoded is a stereo moving image or an interlaced moving image based on an input image signal representing the moving image to be encoded;
When the inter-frame prediction mode is selected and the type of the moving image obtained by the determination is a stereo moving image, the input image is separated into a right-eye image and a left-eye image when the inter-frame prediction is performed using the input image as a frame image. Compare the coding efficiency with the case predicted by inter-frame prediction, and if the coding efficiency of the case where the input image is frame-predicted as the frame image is higher, select `` inter-frame prediction with frame image ''. If the coding efficiency of the case where the inter-frame prediction is separated into the right-eye image and the left-eye image is higher, select “inter-frame prediction in the field image” as the prediction mode,
When the inter-frame prediction mode is selected and the type of moving image obtained by the determination is an interlaced moving image, the case of inter-frame prediction using the input image as a frame image and the input image as an odd-numbered image and an even-numbered row image Compare the encoding efficiency with the case where the inter-frame prediction is performed separately, and if the encoding efficiency of the case where the inter-frame prediction is performed using the input image as the frame image, input “inter-frame prediction with the frame image”. If the coding efficiency is higher in the case where the image is divided into an odd row image and an even row image and the inter-frame prediction is performed, select “inter-frame prediction in the field image” as the prediction mode,
When the intra-frame prediction mode is selected and the type of moving image obtained by the determination is a stereo moving image, the case where the input image is used as a frame image and the input image is separated into a right-eye image and a left-eye image. Compare the encoding efficiency with the case predicted in the frame, and if the encoding efficiency of the case predicted in the frame using the input image as the frame image is higher, select “intraframe prediction in the frame image”. If the coding efficiency of the case of intra-frame prediction separated into right-eye image and left-eye image is higher, select `` Intra-frame prediction with field image '' as the prediction mode,
When the intra-frame prediction mode is selected and the type of moving image obtained by the determination is an interlaced moving image, the case where intra-frame prediction is performed using the input image as a frame image, and the input image is divided into an odd-numbered image and an even-numbered row image. Compare the coding efficiency with the case where the intra-frame prediction is performed separately, and if the coding efficiency of the case where intra-frame prediction is performed using the input image as the frame image, input "Intra-frame prediction with frame image". If the coding efficiency of the case where the image is separated into the odd-numbered image and the even-numbered row image and the intraframe prediction is higher, select “intraframe prediction in the field image” as the prediction mode,
When “prediction between frames in frame image” or “interframe prediction in field image” is selected as the prediction mode, a motion detection step of detecting a motion vector for the moving image to be encoded;
A motion compensation step of performing motion compensation on the moving image based on the type of the moving image, the selected prediction mode, and the detected motion vector;
A spatial prediction step of performing spatial prediction on the moving image based on the type of the moving image and the selected prediction mode;
Based on the type of the moving image and the selected prediction mode, an orthogonal transformation is performed on a prediction residual signal obtained as a difference between the prediction image signal obtained by the motion compensation or the spatial prediction and the input image signal. Performing an orthogonal transformation step,
A variable-length encoding step for performing predetermined image processing including variable-length encoding on the image data after the orthogonal transformation based on the type of the moving image and the selected prediction mode;
A video encoding method comprising:
右目画像と左目画像を縦1列ごとに交互に並べたステレオ動画像、および奇数行画像と偶数行画像を横1行ごとに交互に並べたインターレース動画像を復号化する動画像復号化方法であって、
復号化対象の動画像がステレオ動画像であるか否かの種別情報、復号化対象領域に関する予測モード情報、および復号化対象領域の直交変換済み画像データを復号化する可変長復号化ステップと、
前記復号化により得られた種別情報および予測モード情報に基づいて、復号化対象領域の動きベクトルを復元する動きベクトル復元ステップと、
前記種別情報、予測モード情報および前記復元された動きベクトルに基づいて、復号化対象領域に関する動き補償を行う動き補償ステップと、
前記種別情報および予測モード情報に基づいて、復号化対象領域に関する空間予測を行う空間予測ステップと、
前記種別情報および予測モード情報に基づいて、前記復号化により得られた復号化対象領域の直交変換済み画像データに対し、逆直交変換を含む所定の画像処理を行う逆直交変換ステップと、
前記画像処理により得られた予測残差信号と、前記動き補償または前記空間予測により得られた予測画像信号とから、復号化対象領域の画像データを生成する画像データ生成ステップと、
を有する動画像復号化方法。
A moving image decoding method for decoding a stereo moving image in which right-eye images and left-eye images are alternately arranged every vertical column, and an interlaced moving image in which odd-numbered rows and even-numbered rows are alternately arranged every horizontal row. There,
A variable length decoding step for decoding type information on whether or not a moving image to be decoded is a stereo moving image, prediction mode information on a decoding target region, and orthogonally transformed image data of the decoding target region;
A motion vector restoration step for restoring a motion vector of a decoding target region based on the type information and prediction mode information obtained by the decoding;
A motion compensation step for performing motion compensation on a decoding target region based on the type information, prediction mode information, and the restored motion vector;
Based on the type information and prediction mode information, a spatial prediction step for performing spatial prediction on the decoding target region;
Based on the type information and the prediction mode information, an inverse orthogonal transform step for performing predetermined image processing including inverse orthogonal transform on the orthogonally transformed image data of the decoding target region obtained by the decoding;
An image data generation step of generating image data of a decoding target region from the prediction residual signal obtained by the image processing and the prediction image signal obtained by the motion compensation or the spatial prediction;
A video decoding method comprising:
JP2011207689A 2011-09-22 2011-09-22 Moving picture coding apparatus and method, and moving picture decoding apparatus and method Expired - Fee Related JP5442688B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011207689A JP5442688B2 (en) 2011-09-22 2011-09-22 Moving picture coding apparatus and method, and moving picture decoding apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011207689A JP5442688B2 (en) 2011-09-22 2011-09-22 Moving picture coding apparatus and method, and moving picture decoding apparatus and method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009146683A Division JP2009260983A (en) 2009-06-19 2009-06-19 Moving image encoding device and method, and moving image decoding device and method

Publications (2)

Publication Number Publication Date
JP2012019547A JP2012019547A (en) 2012-01-26
JP5442688B2 true JP5442688B2 (en) 2014-03-12

Family

ID=45604381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011207689A Expired - Fee Related JP5442688B2 (en) 2011-09-22 2011-09-22 Moving picture coding apparatus and method, and moving picture decoding apparatus and method

Country Status (1)

Country Link
JP (1) JP5442688B2 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0638244A (en) * 1992-07-02 1994-02-10 Sony Corp Video signal output device and video signal display device
JPH07123447A (en) * 1993-10-22 1995-05-12 Sony Corp Method and device for recording image signal, method and device for reproducing image signal, method and device for encoding image signal, method and device for decoding image signal and image signal recording medium
JPH0870475A (en) * 1994-06-23 1996-03-12 Sanyo Electric Co Ltd Method and device for encoding and decoding stereoscopic animation
JPH09238345A (en) * 1995-12-28 1997-09-09 Sony Corp Image signal coding method and device therefor, image signal transmission method, image signal decoding method, device therefor and recording medium
JP3691444B2 (en) * 2002-03-11 2005-09-07 三洋電機株式会社 Stereo imaging device
JP4154569B2 (en) * 2002-07-10 2008-09-24 日本電気株式会社 Image compression / decompression device

Also Published As

Publication number Publication date
JP2012019547A (en) 2012-01-26

Similar Documents

Publication Publication Date Title
JP4421940B2 (en) Moving picture coding apparatus and method, and moving picture decoding apparatus and method
KR100667830B1 (en) Method and apparatus for encoding multiview video
KR100636785B1 (en) Multi-view image system and method for compressing and decompressing applied to the same
KR101450670B1 (en) Method and apparatus for generating block-based stereoscopic image format, and method and apparatus for reconstructing stereoscopic images from the block-based stereoscopic image format
KR100728009B1 (en) Method and apparatus for encoding multiview video
KR101385884B1 (en) Method for cording and decording multiview video and apparatus for the same
JP5059766B2 (en) Disparity vector prediction method, and method and apparatus for encoding and decoding a multi-view video using the method
EP2538675A1 (en) Apparatus for universal coding for multi-view video
JP2009505604A (en) Method and apparatus for encoding multi-view video
WO2013039031A1 (en) Image encoder, image-decoding unit, and method and program therefor
JP2008034892A (en) Multi-viewpoint image encoder
JP4960400B2 (en) Stereo image encoding method and stereo image decoding method
KR101386651B1 (en) Multi-View video encoding and decoding method and apparatus thereof
US20120195381A1 (en) Image processing apparatus and method for processing image
US9001892B2 (en) Moving image encoder and moving image decoder
JP5442688B2 (en) Moving picture coding apparatus and method, and moving picture decoding apparatus and method
JP2005110113A (en) Multi-visual point image transmission system and method, multi-visual point image compression apparatus and method, and multi-visual point image decompression apparatus, method and program
KR101910609B1 (en) System and method for providing user selective view
JP5343792B2 (en) Image encoding apparatus, image encoding method and program thereof
JP2009260983A (en) Moving image encoding device and method, and moving image decoding device and method
KR20120084628A (en) Apparatus and method for encoding and decoding multi-view image
JP2008034893A (en) Multi-viewpoint image decoder
JP6232117B2 (en) Image encoding method, image decoding method, and recording medium
JP2013211777A (en) Image coding device, image decoding device, image coding method, image decoding method and program
KR20070033239A (en) Apparatus and method for encoding and decoding multiview video

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111013

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20130122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20130604

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131218

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees