JP2014112749A - Image coding device and image decoding device - Google Patents
Image coding device and image decoding device Download PDFInfo
- Publication number
- JP2014112749A JP2014112749A JP2011060980A JP2011060980A JP2014112749A JP 2014112749 A JP2014112749 A JP 2014112749A JP 2011060980 A JP2011060980 A JP 2011060980A JP 2011060980 A JP2011060980 A JP 2011060980A JP 2014112749 A JP2014112749 A JP 2014112749A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- block
- image
- prediction mode
- blocks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2213/00—Details of stereoscopic systems
- H04N2213/003—Aspects relating to the "2D+depth" image format
Abstract
Description
本発明は、画像符号化装置および画像復号装置に関する。 The present invention relates to an image encoding device and an image decoding device.
被写体の三次元形状を、正確に、且つ、効率良く記録することは重要なテーマであり、従来からさまざまな方法が提案されている。その方法の一つとして、被写空間を各被写体および背景の色で表現した一般的な二次元画像であるテクスチャ画像と、被写空間を各被写体および背景までの視点からの距離で表現した画像(以下、「距離画像」と呼ぶ)との二種類の画像データを関連付けて記録する方法がある。距離画像とは、画素ごとに、被写空間中の対応する地点までの視点からの距離値(深度値)を表現する画像である。この距離画像は、例えば、テクスチャ画像を記録するカメラ近傍に設置された、デプスカメラ等の測距装置によって取得できる。あるいは、多視点カメラの撮影によって得られる複数のテクスチャ画像を解析することによっても距離画像を取得することができ、その解析手法も数多く提案されている。 Accurate and efficient recording of the three-dimensional shape of the subject is an important theme, and various methods have been proposed. As one of the methods, a texture image that is a general two-dimensional image that represents the subject space with the color of each subject and the background, and an image that represents the subject space with the distance from the viewpoint to each subject and the background. There is a method of recording in association with two types of image data (hereinafter referred to as “distance image”). A distance image is an image that expresses a distance value (depth value) from a viewpoint to a corresponding point in a subject space for each pixel. This distance image can be acquired, for example, by a distance measuring device such as a depth camera installed in the vicinity of the camera that records the texture image. Alternatively, a distance image can be acquired by analyzing a plurality of texture images obtained by photographing with a multi-viewpoint camera, and many analysis methods have been proposed.
また、距離画像に関する規格として、国際標準化機構/国際電機標準会議(ISO/IEC)のワーキンググループであるMoving Picture Experts Group(MPEG)において、距離値を256段階(8ビットの輝度値)で表現する規格であるMPEG−C part3が定められており、標準的な距離画像は8ビットのグレースケール画像となる。また、視点からの距離が近いほど高い輝度値を割り当てるように規定されているため、標準的な距離画像では、手前に位置する被写体ほど白く、奥に位置する被写体ほど黒く表現される。距離画像の特徴として、テクスチャ画像と比べてより広い領域において単一の画素値が表れる傾向が強いと言える。例えば、テクスチャ画像に派手な柄の服を着ている人物が描かれていても、距離画像においては、服の部分の距離値がほぼ一定になる。 In addition, distance values are expressed in 256 levels (8-bit luminance values) in the Moving Picture Experts Group (MPEG), which is a working group of the International Organization for Standardization / ISO / IEC, as a standard for distance images. The standard MPEG-C part3 is defined, and the standard distance image is an 8-bit grayscale image. In addition, since it is defined that a higher luminance value is assigned as the distance from the viewpoint is shorter, in a standard distance image, a subject located in front is expressed as white and a subject located in the back is expressed in black. As a feature of the distance image, it can be said that a single pixel value tends to appear in a wider area than the texture image. For example, even if a person wearing a fancy pattern is drawn on the texture image, the distance value of the clothes portion is almost constant in the distance image.
同一の被写空間を表現したテクスチャ画像と距離画像とが得られれば、テクスチャ画像に描画されている被写体像を構成する各画素の視点からの距離が距離画像から分かるため、被写体を奥行きが最大256段階で表現される三次元形状として復元することができる。さらに、三次元形状を二次元平面上に幾何的に投影することにより、元のテクスチャ画像を、元の角度から一定範囲にある別の角度から被写体を撮影した場合の被写空間のテクスチャ画像に変換することが可能である。すなわち、1組のテクスチャ画像および距離画像によって一定範囲にある任意の角度から見たときの三次元形状を復元できるため、複数組のテクスチャ画像および距離画像を用いることにより三次元形状の自由視点画像を少ないデータ量で表すことが可能である。 If a texture image and a distance image representing the same subject space are obtained, the distance from the viewpoint of each pixel constituting the subject image drawn in the texture image is known from the distance image, so that the subject has the maximum depth. It can be restored as a three-dimensional shape expressed in 256 stages. Furthermore, by projecting the 3D shape onto the 2D plane geometrically, the original texture image is converted into a texture image in the subject space when the subject is photographed from another angle within a certain range from the original angle. It is possible to convert. That is, since a 3D shape can be restored when viewed from an arbitrary angle within a certain range by a set of texture images and distance images, a free viewpoint image of 3D shapes can be obtained by using multiple sets of texture images and distance images. Can be expressed with a small amount of data.
ところで、動画圧縮規格であるH.264のように、映像が内部に持つ時間的あるいは空間的な冗長性を効率良く排除することにより、映像を圧縮符号化する技術が知られている(例えば、非特許文献1)。この技術を用いた符号化装置により、テクスチャ映像(テクスチャ画像を各フレームとする映像)と距離映像(距離画像を各フレームとする映像)との各映像を符号化すると、各映像が有する冗長性を排除することが可能となり、復号装置に伝送される各映像のデータ量をさらに削減することができる。 By the way, the video compression standard H.264. As in the case of H.264, a technique for compressing and encoding video by efficiently eliminating temporal or spatial redundancy in the video is known (for example, Non-Patent Document 1). When each video of a texture video (video having a texture image as each frame) and a distance video (video having a distance image as each frame) is encoded by an encoding device using this technology, the redundancy that each video has Can be eliminated, and the data amount of each video transmitted to the decoding device can be further reduced.
このH.264規格では、画面内予測符号化と呼ばれる方法を用いて情報圧縮を図っている。画面内予測符号化とは、符号化対象の一枚の画像を正方形のブロックに分割し、例えばラスタスキャン順に符号化していくとき、符号化対象ブロックの周囲の符号化済みブロックに含まれる画素群から予め符号化対象ブロックを予測するものである。符号化対象ブロックから、この予測ブロックを差し引いた差分信号を直交変換することにより、符号化対象ブロックを直接、直交変換する場合と比べ、直交変換後の周波数スペクトルのエネルギーが低次領域に集中するため、効率的に情報圧縮することができる。 This H. In the H.264 standard, information compression is performed using a method called intra prediction encoding. In-screen predictive encoding is a group of pixels included in an encoded block around an encoding target block when one image to be encoded is divided into square blocks and encoded in, for example, raster scan order. To predict the encoding target block in advance. By performing orthogonal transform on the difference signal obtained by subtracting the prediction block from the encoding target block, the energy of the frequency spectrum after the orthogonal conversion is concentrated in the low-order region compared to the case where the encoding target block is directly orthogonally converted. Therefore, information can be efficiently compressed.
この画面内予測符号化は、輝度信号に対して、4×4画素のサブブロックまたは、16×16画素のマクロブロック単位で行うことができる。サブブロックの場合に対し9種類の予測モードがあり、マクロブロックに対しては4種類の予測モードがある。また、色差信号に対しては、8×8画素のブロックに対して、輝度のマクロブロックの場合と同じ、4種類の予測モードがある。 This intra prediction encoding can be performed on the luminance signal in units of 4 × 4 pixel sub-blocks or 16 × 16 pixel macroblocks. There are nine types of prediction modes for sub-blocks and four types of prediction modes for macroblocks. For color difference signals, there are four types of prediction modes for the 8 × 8 pixel block, the same as in the case of the luminance macroblock.
図19、図20は、サブブロックに対する9種類の予測モードを模式的に表した図である。図19に示す4×4画素の符号化対象サブブロックB1に対し、その周辺の画素A〜Mを用いて予測を行う。図20がそれらの画素を用いる方向を示したものであり、例えば、モード1の場合、複写方向は左から右への水平方向であるので、画素I、J、K、Lを右に向かって複写を繰り返したものが予測ブロックとなる。モード2はDCモードと呼ばれ、画素群を指定方向に複写して作成するのではなく、画素A〜DとI〜Lとの8つの画素の平均値によって予測ブロックを作成するものである。モード3〜8は、図20に示すように、矢印の方向に複写を繰り返したものが予測ブロックとなる。
19 and 20 are diagrams schematically showing nine types of prediction modes for sub-blocks. For the 4 × 4 pixel encoding target sub-block B1 shown in FIG. 19, prediction is performed using the surrounding pixels A to M. FIG. 20 shows the direction in which these pixels are used. For example, in the case of
また、図21、図22は、マクロブロックに対する4種類の予測モードを同様に表した図である。符号化対象マクロブロックに対し、その周辺の画素00〜0F、10〜1Fを用いて予測を行う。図22に示すように、予測する方向は垂直方向(モード0)と水平方向(モード1)の2種類のみで、そのほか、前述したDCモード(モード2)と、Planeモード(モード3)がある。Planeモードとは、画素群が滑らかに繋がるようにその間を補間することによって予測ブロックを得るものである。色差信号に対する4種類の予測モードは、周辺の画素群の数が異なるだけで、同じ内容の予測モードとなっている。
FIG. 21 and FIG. 22 are diagrams similarly showing four types of prediction modes for macroblocks. The encoding target macroblock is predicted using the surrounding
そして、サブブロックに対する予測モードの符号化に際しては、符号化対象ブロックの左と上に隣接するブロックの予測モードのうち、番号が小さいモードを符号化対象ブロックの予測モードの予測値とし、その予測値と同じ予測モードの場合は、予測モードの番号の符号化を省略することにより、さらなる圧縮率の向上を図っている。 When encoding the prediction mode for the sub-block, the prediction mode of the prediction mode of the encoding target block is set as the prediction value of the prediction mode of the encoding target block among the prediction modes of the blocks adjacent to the left and above the encoding target block. In the case of the same prediction mode as the value, the compression rate is further improved by omitting the encoding of the prediction mode number.
ところで、距離画像は、被写体との距離を表しているため、同じ深度値の一まとまりの範囲が、テクスチャ画像の同じ深度値の一まとまりの範囲と比べ、一般的に非常に大きくなるという特徴を有している。距離画像において、被写体の輪郭部分以外では、距離深度値が画素単位で急激に変化することは稀である。すなわち、隣接ブロック同士で、同じ深度値を持つ確率が非常に高い。これらの特徴から、広い範囲に亘るブロック間の相関は高く、特に、同じ深度値が連続する確率が高い。さらに、被写体の輪郭は、他の被写体と重ならない限り連続するので、一本の輪郭線に沿ったブロック同士では、画面内予測の方向の相関が高くなる。そのほか、距離画像はテクスチャ画像と比べて画面の構成が単純となる傾向が強いため、サブブロックだけでなく、マクロブロックのような大きい単位でのブロック間の相関も非常に高くなることが期待できる。 By the way, since the distance image represents the distance to the subject, the group of the same depth value is generally much larger than the group of the same depth value of the texture image. Have. In the distance image, it is rare that the distance depth value changes abruptly in units of pixels other than the contour portion of the subject. That is, the probability that adjacent blocks have the same depth value is very high. From these features, the correlation between blocks over a wide range is high, and in particular, there is a high probability that the same depth value is continuous. Furthermore, since the contour of the subject is continuous as long as it does not overlap with other subjects, the correlation between the prediction directions in the screen is high between the blocks along one contour line. In addition, distance images tend to have a simpler screen structure than texture images, so not only sub-blocks but also the correlation between blocks in large units such as macroblocks can be expected to be very high. .
しかしながら、H.264規格を距離映像に適用した場合、上述の画面内予測において、情報圧縮が非効率的になってしまうという問題がある。前述した特徴を有する距離画像に対して、上述の画面内予測方法では、DC予測やPlane予測のように、距離画像に対してはあまり有効とならないモードが含まれているために、圧縮効率に無駄が生じる。なぜならば、距離画像は前述したように、広い範囲に亘るブロックにおいて、同じ深度値が連続する確率が高いが、DC予測やPlane予測では、実際の深度値の中間値を作成することになるため、距離画像における精度のよい予測には適さないからである。さらに、前述したように、隣接ブロックとの予測の方向に関して相関が高いが、その相関に関しては、同じでない限り、ビットが省略できないため、相関性が利用しきれていない。そのうえ、マクロブロックについては、4種類のモードしかなく、そのうち方向を有するものは、DCモードとPlaneモード以外の2種類しかないため、距離画像のような単純な画像に対しては、不向きであるという問題がある。 However, H.C. When the H.264 standard is applied to a distance video, there is a problem that information compression becomes inefficient in the above-described intra prediction. For the distance image having the above-described features, the above-described intra-screen prediction method includes a mode that is not so effective for the distance image, such as DC prediction and Plane prediction. Waste occurs. This is because, as described above, the distance image has a high probability that the same depth value continues in a block over a wide range, but in the DC prediction and the Plane prediction, an intermediate value of the actual depth value is created. This is because it is not suitable for accurate prediction in a distance image. Furthermore, as described above, although the correlation is high with respect to the prediction direction with the adjacent block, since the bit cannot be omitted unless the correlation is the same, the correlation is not fully utilized. In addition, since there are only four types of macroblocks, and there are only two types other than the DC mode and the Plane mode, the macroblock is not suitable for a simple image such as a distance image. There is a problem.
本発明は、このような事情に鑑みてなされたもので、距離画像の符号化データの符号量を従来よりも削減することが可能な画像符号化装置、および、この画像符号化装置から供給された符号化データから距離画像を復号する復号装置を提供することを目的とする。 The present invention has been made in view of such circumstances, and is supplied from an image encoding device capable of reducing the amount of code of encoded data of a distance image as compared with the conventional image encoding device. An object of the present invention is to provide a decoding device that decodes a distance image from encoded data.
本発明は、距離画像をブロックに分割し、隣接するブロックの特徴に基づいて画面内予測を行うことにより符号化する画像符号化装置であって、予測モードの中から、前記距離画像の各ブロックに対して適用する予測モードを選択する選択手段と、隣接する符号化済みブロック内に複数の深度値を含むか否かを判定する第1の判定手段と、前記第1の判定手段により、複数の深度値を含むと判定されたブロックが、符号化対象ブロックに向かう方向に対応する予測モードを持っているか否かを判定する第2の判定手段と、前記第2の判定手段により、持っていると判定されたブロックの予測モードと同一のものを前記ブロックの予測モードの予測値とする予測手段と、前記予測モードの予測値を用いて、前記符号化対象ブロックを符号化し伝送する符号化手段とを備えたことを特徴とする。 The present invention is an image encoding device that encodes by dividing a distance image into blocks and performing intra-screen prediction based on features of adjacent blocks, and each block of the distance image is selected from prediction modes. Selection means for selecting a prediction mode to be applied to, a first determination means for determining whether or not adjacent coded blocks include a plurality of depth values, and a plurality of the first determination means, The second determination means for determining whether or not the block determined to include the depth value has a prediction mode corresponding to the direction toward the encoding target block, and the second determination means. A prediction unit that uses a prediction value of the prediction mode of the block that is the same as the prediction mode of the block determined to be present, and the prediction value of the prediction mode. Characterized by comprising an encoding means for.
本発明は、前記隣接する複数の符号化済みブロックは、上と左に隣接するブロックとし、そのいずれからも前記予測値が得られない場合は、左斜め上と右斜め上に隣接するブロックとすることを特徴とする。 According to the present invention, the plurality of adjacent encoded blocks are adjacent to the upper and left blocks, and when the predicted value cannot be obtained from any of the blocks, the blocks adjacent to the upper left and the upper right are It is characterized by doing.
本発明は、前記予測モードは、8通りの方向に対応する予測モードのみから成ることを特徴とする。 The present invention is characterized in that the prediction mode includes only prediction modes corresponding to eight directions.
本発明は、前記予測値が得られるブロックが2つ存在する場合には、それぞれの予測方向の中間方向に対応する予測モードを予測値とすることを特徴とする。 The present invention is characterized in that, when there are two blocks from which the predicted value is obtained, a prediction mode corresponding to an intermediate direction of each prediction direction is used as the predicted value.
本発明は、前記選択した1つのモードを符号化する際、前記予測値の予測方向との方向の差分を符号化することによって、選択した1つのモードを符号化することを特徴とする。 The present invention is characterized in that, when the selected one mode is encoded, the selected one mode is encoded by encoding a difference of a direction of the predicted value from a prediction direction.
本発明は、前記符号化対象ブロックは、4×4画素、8×8画素、16×16画素のいずれか、あるいは、それらの組み合わせであることを特徴とする。 The present invention is characterized in that the encoding target block is any one of 4 × 4 pixels, 8 × 8 pixels, 16 × 16 pixels, or a combination thereof.
本発明は、請求項1から6のいずれかに記載された画像符号化装置により符号化された距離画像を復号する画像復号装置であって、前記距離画像の各ブロックに対して、隣接する複数の復号済みブロックに対し、ブロック内に複数の深度値を含むか否かを判定する第1の判定手段と、前記第1の判定手段により、複数の深度値を含むと判定されたブロックが、前記ブロックに向かう方向に対応する予測モードを持っているか否かを判定する第2の判定手段と、前記第2の判定手段により、持っていると判定されたブロックの予測モードと同一のものを、前記ブロックの予測モードの予測値とする予測手段と、前記予測値を用いて、受信した符号化ブロックの予測モードを復号する復号手段とを備えたことを特徴とする。
The present invention is an image decoding device that decodes a distance image encoded by the image encoding device according to any one of
本発明は、コンピュータを請求項1から6のいずれかに記載の画像符号化装置として機能させることを特徴とする。
The present invention causes a computer to function as the image encoding apparatus according to any one of
本発明は、コンピュータを請求項7に記載の画像復号装置として機能させることを特徴とする。
According to the present invention, a computer is caused to function as the image decoding device according to
本発明は、距離画像の符号化データであって、画像の各ブロックに対して、複数通りの予測方向のみから構成される予測モードの中から1つのモードを選択し、隣接する複数の符号化済みブロックに対し、ブロック内に複数の深度値を含むか否かを判定し、複数の深度値を含むと判定されたブロックが、前記ブロックに向かう方向に対応する予測モードを持っているか否かを判定し、持っていると判定されたブロックの予測モードと同一のものを、前記ブロックの予測モードの予測値とし、前記予測モードを予測値を用いて符号化したことを特徴とする。 The present invention is encoded data of a distance image, and for each block of the image, one mode is selected from prediction modes composed of only a plurality of prediction directions, and a plurality of adjacent encodings are selected. Whether or not a block that has been determined to include a plurality of depth values has a prediction mode corresponding to a direction toward the block. The prediction mode of the block determined to have the same prediction mode as the prediction mode of the block is used, and the prediction mode is encoded using the prediction value.
本発明によれば、距離画像の符号化データの符号量を従来よりも削減することができる符号化装置およびこの符号化装置から供給された符号化データから距離画像を復号する復号装置を実現することができるという効果が得られる。 According to the present invention, an encoding device capable of reducing the code amount of encoded data of a distance image and a decoding device that decodes a distance image from encoded data supplied from the encoding device are realized. The effect that it can be obtained.
以下、図面を参照して、本発明の一実施形態による画像符号化装置および画像復号装置を説明する。図1は同実施形態の構成を示すブロック図である。この図において、符号1は、距離画像を入力し、入力した距離画像を所定の画素数で構成するブロックに分割し、ブロック毎に符号化して、伝送路を介して符号化ブロックデータを伝送する画像符号化装置である。符号2は、伝送路を介して、画像符号化装置から伝送された符号化ブロックデータを受信し、受信した符号化ブロックデータを復号して、距離画像を復元し、復元した距離画像を出力する画像復号装置である。
Hereinafter, an image encoding device and an image decoding device according to an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the configuration of the embodiment. In this figure,
次に、図2〜図5を参照して、画面内予測符号化処理について説明する。輝度信号のサブブロックの画面内予測に用いる周辺画素群は、H.264規格と同様、図2に示すように、A〜Mの13個の画素群である。そして、色差信号のブロックの画面内予測に用いる周辺画素群は、図3に示すように、A〜Yの25個の画素群である。また、輝度信号のマクロブロックの画面内予測に用いる周辺画素群は、図4に示すように、00〜2F、10〜1F、30の49個の画素群である。予測モードは、図5に示すように、モード0〜7の8方向に対する予測である。
Next, the intra prediction encoding process will be described with reference to FIGS. The peripheral pixel group used for the intra prediction of the luminance signal sub-block is H.264. Similarly to the H.264 standard, as shown in FIG. 2, there are 13 pixel groups A to M. And the surrounding pixel group used for the prediction in a screen of the block of a color difference signal is 25 pixel groups of AY as shown in FIG. Further, the peripheral pixel groups used for the intra prediction of the macro block of the luminance signal are 49 pixel groups of 00 to 2F, 10 to 1F, and 30, as shown in FIG. As shown in FIG. 5, the prediction mode is prediction for eight directions of
図6〜図13は、画素の複写形式の種類の一例である。図6〜図13において、右下に位置する16×16画素のブロックが符号化対象ブロックであり、それ以外が符号化済みの隣接ブロックである。図6〜図13において、各ブロック内の方眼一つ一つは画素を表現しており、矢印付きの線は、画素の複写先を表現している。例えば、図6において、符号化対象ブロックは、その上に隣接する符号化済みブロックの最下行の画素を複写して作成する。具体的には、符号化対象ブロックにおいて、左からn列目に位置する画素群は全て、上に隣接するブロックの最下行の左からn番目の画素を複写する。その他の図においても同様である。矢印の意味をさらに説明すると、例えば図12の矢印群のうちの一つを抜き出して示したものが図14である。この場合、図15に示すように黒く塗り潰して示した画素が、上に隣接するブロックの最下行左から9番目の画素を複写するということになる。 6 to 13 are examples of the types of pixel copying formats. 6 to 13, a 16 × 16 pixel block located at the lower right is an encoding target block, and the other blocks are encoded adjacent blocks. 6 to 13, each grid in each block represents a pixel, and a line with an arrow represents a copy destination of the pixel. For example, in FIG. 6, the encoding target block is created by copying the pixel in the lowermost row of the encoded block adjacent thereto. Specifically, in the encoding target block, all the pixel groups located in the nth column from the left copy the nth pixel from the left in the bottom row of the adjacent block above. The same applies to the other drawings. The meaning of the arrow will be further described. For example, FIG. 14 shows one of the arrows in FIG. In this case, as shown in FIG. 15, the pixel shown in black is copied as the ninth pixel from the left in the bottom row of the adjacent block.
なお、サブブロックに対して、それぞれの予測モードにおける周辺画素の複写の仕方は、H.264規格と同様とする。このように、サブブロックとマクロブロックの両方に対して、距離画像では符号化効率にあまり貢献しないDCブロックやPlaneブロックを使用せず、代わりにさまざまな方向の予測モードを用意することで、精度のよい予測が可能となる。どの予測モードを選択するかについては、各モードについて全画素に対する歪み(差分の二乗和)を計算し、最小のものを選択する。 For sub-blocks, how to copy neighboring pixels in each prediction mode is described in H.264. The same as the H.264 standard. In this way, for both sub-blocks and macro-blocks, the DC and Plane blocks that do not contribute much to the coding efficiency in the distance image are not used, but instead, prediction modes in various directions are prepared. Can be predicted well. As to which prediction mode is selected, the distortion (sum of squares of differences) for all pixels is calculated for each mode, and the minimum one is selected.
次に、図1に示す画像符号化装置1における予測モードの符号化方法について説明する。予測モードを符号化する際、H.264規格のサブブロックの画面内予測における場合と同様、隣接ブロックから予測モードの予測を行う。ただし、その予測処理は、H.264規格のそれと異なる。予測処理動作を図16を参照して説明する。
Next, a prediction mode encoding method in the
まず、符号化対象ブロックの上と左に隣接する符号化済みブロックのうち、輪郭が含まれるブロックの予測モードを参照する。これは、輪郭が含まれるブロックからは、輪郭が連続している場合が多く、また輪郭に沿って方向が変化するため、その隣接ブロックからの変化量は大きくない場合が多いからである。輪郭が含まれるか否かの判定は、その隣接ブロックが複数の深度値を含んでいるかかによって決定する。すなわち、その隣接ブロックに輪郭が含まれる場合、必ず複数の深度値を含むからである。したがって、単一の深度値のみから成る隣接ブロックに関しては、予測モードの予測を行うのに使用しないということになる。 First, a prediction mode of a block including a contour is referred to among encoded blocks adjacent to the upper and left sides of the encoding target block. This is because the contour is often continuous from the block including the contour, and the direction changes along the contour, so that the amount of change from the adjacent block is often not large. Whether or not the contour is included is determined depending on whether or not the adjacent block includes a plurality of depth values. That is, when the adjacent block includes an outline, it always includes a plurality of depth values. Therefore, the adjacent block consisting of only a single depth value is not used for prediction mode prediction.
よって、まず、符号化対象ブロックの上と左に隣接する符号化済みブロックのうち、複数の深度値を含む符号化済みブロックが存在するか否か判定する(ステップS1)。この判定の結果、複数の深度値を含む符号化済みブロックが存在する場合、そのブロック内の輪郭を含む可能性のあるブロックの輪郭が、符号化対象ブロックの方向に伸びているか否かを判定する(ステップS2)。具体的には、左に隣接するブロックについては、予測モードが、モード1、モード3、モード4、モード5及びモード7のいずれかである場合に、存在すると判定する。上に隣接するブロックについては、予測モードが、モード0、モード2、モード3、モード4、モード5及びモード6のいずれかである場合に、存在すると判定する。ステップS1、S2における判定の結果、いずれも存在しない場合、符号化対象ブロックの左斜め上と右斜め上の符号化済みブロックに、複数の深度値を含む符号化済みブロックが存在するか否か判定する(ステップS3)。これも存在しない場合、予測モードの予測値は「なし」とし、図5に示す予測モードの番号をそのまま符号化する(ステップS4)。
Therefore, first, it is determined whether there is an encoded block including a plurality of depth values among the encoded blocks adjacent to the upper and left sides of the encoding target block (step S1). As a result of the determination, if there is an encoded block including a plurality of depth values, it is determined whether or not the contour of a block that may include the contour in the block extends in the direction of the encoding target block. (Step S2). Specifically, the block adjacent to the left is determined to exist when the prediction mode is any one of
一方、左斜め上と右斜め上の符号化済みブロックのうち、複数の深度値を含む符号化済みブロックが存在する場合、そのブロック内の輪郭を含む可能性のあるブロックの輪郭が、符号化対象ブロックの方向に伸びているか否かを判定する(ステップS5)。左斜め上に隣接するブロックについては、予測モードがモード3の場合に、存在すると判定する。右斜め上に隣接するブロックについては、予測モードが2またはモード6の場合に、存在すると判定する。
On the other hand, if there is an encoded block including a plurality of depth values among the encoded blocks on the upper left and the upper right, the contour of the block that may include the contour in the block is encoded. It is determined whether or not it extends in the direction of the target block (step S5). It is determined that a block adjacent on the upper left is present when the prediction mode is
次に、ステップS2、S5における判定の結果、該当するブロックが存在する場合、判定されたブロックは2つのブロックのうち両方(上と左、または左斜め上と右斜め上)のブロックであったか否かを判定する(ステップS6)。この判定の結果、両方とも該当した場合、2つの予測モード番号の中間の方向を基準にする(ステップS7)。中間が1つの方向に定まらない場合は、モード番号の小さい方を採用する。一方、片方のブロックのみ該当する場合は、該当する方の予測モードの方向を基準にする(ステップS8)。 Next, as a result of the determination in steps S2 and S5, if there is a corresponding block, whether or not the determined block is a block of both of the two blocks (upper and left, or upper left and upper right). Is determined (step S6). As a result of this determination, if both are applicable, the middle direction between the two prediction mode numbers is used as a reference (step S7). When the middle is not fixed in one direction, the smaller mode number is adopted. On the other hand, when only one of the blocks is applicable, the direction of the corresponding prediction mode is used as a reference (step S8).
例えば、図5において示すモード4が基準になったとき、その方向を0とし、次にその両隣のうち番号が小さい方を1、大きい方を2として、その後は基準方向を軸にして交互に外側に番号を割り振っていく。それ以上、どちらか一方の外側に番号が無くなった場合は、その逆側の外側に順に連続して番号を振っていく(図17参照)。そして、例えばそれぞれの番号に対し、図18に示すように、指数ゴロム符号語を割り当てる。この方法は、隣接ブロックから予測した予測方向と符号化対象ブロックの予測方向が近い場合が大多数であるときは、符号語長が短くなるので、情報圧縮の効率化が期待できる。あるいは、そのような符号語の割り当てではなく、4ビットの固定長符号語b0 b1 b2 b3を用意し、b0には隣接ブロックから予測した予測方向と符号化対象ブロックの予測方向が同じか否かを示すフラグを割り当て、もしそれが異なる場合には、図5に示す予測モードの番号をそのままb1 b2 b3の3ビットを用いて符号化するなどしてもよい。あるいは、H.264規格における、輝度信号に対するマクロブロックと色差信号に対するブロックの予測モードのように、3ビットの固定長符号語b0 b1 b2を用意し、全てのブロックに対し、その3ビットを用いて図5に示す予測モードの数字をそのまま符号化するなどしてもよい。
For example, when the
また、最上行や左端列に含まれるブロックが符号化対象の場合など、上と左の隣接ブロックのうち片方しか存在しない場合は当然、存在しないブロックを参照できない。このような場合には、参照できるブロックのみを用いて前述の予測処理を行う。すなわち、図16のステップS6とS7が省略され、それらの代わりにステップS8が位置し、処理としては、ステップS4かステップS8のいずれかとなる。 In addition, when only one of the upper and left adjacent blocks exists, such as when the block included in the uppermost row or the leftmost column is an encoding target, it is naturally not possible to refer to the nonexistent block. In such a case, the above prediction process is performed using only blocks that can be referred to. That is, steps S6 and S7 in FIG. 16 are omitted, and step S8 is substituted for them, and the process is either step S4 or step S8.
次に、図1に示す画像復号装置2の処理動作を説明する。画像復号装置2では、符号化した順番にブロック単位で復号していく。符号化時は、符号化済みのブロックに含まれる画素群を参照し、予測値を計算したが、復号側では、復号済みブロックに含まれる画素群を参照して、同様の方法で予測値を計算する。符号化側における符号化済みブロックと、そのブロックを復号側で復号したときのブロックは同じであるため、符号化側と同じ予測値が復号側で得られる。そして、前述のように、符号化側で、この予測値を用いて予測モードを符号化した場合は、画像復号装置2において予測値を用いてその予測モードを復元することができる。
Next, the processing operation of the
前述した方法は、輝度信号に対するサブマクロブロックとマクロブロック、そして色差信号に対するブロックそれぞれに対して適用できる。以上説明した処理動作により、前述した特徴を有する距離画像に対して効率のよい画面内予測符号化を実行することができ、より効率のよい情報圧縮が可能となる。 The method described above can be applied to each of the sub-macroblock and macroblock for the luminance signal and the block for the color difference signal. Through the processing operations described above, efficient intra prediction encoding can be performed on the distance image having the above-described features, and more efficient information compression can be performed.
なお、図1における画像符号化装置及び画像復号装置2の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより画像符号化処理・画像復号処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
The program for realizing the functions of the image encoding device and the
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。 The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, what is called a difference file (difference program) may be sufficient.
距離画像の符号化・復号を行うことが不可欠な用途に適用できる。 The present invention can be applied to applications where it is indispensable to encode / decode range images.
1・・・画像符号化装置、2・・・画像復号装置
DESCRIPTION OF
Claims (10)
予測モードの中から、前記距離画像の各ブロックに対して適用する予測モードを選択する選択手段と、
隣接する符号化済みブロック内に複数の深度値を含むか否かを判定する第1の判定手段と、
前記第1の判定手段により、複数の深度値を含むと判定されたブロックが、符号化対象ブロックに向かう方向に対応する予測モードを持っているか否かを判定する第2の判定手段と、
前記第2の判定手段により、持っていると判定されたブロックの予測モードと同一のものを前記ブロックの予測モードの予測値とする予測手段と、
前記予測モードの予測値を用いて、前記符号化対象ブロックを符号化し伝送する符号化手段と
を備えたことを特徴とする画像符号化装置。 An image coding apparatus that divides a distance image into blocks and performs coding by performing intra prediction based on features of adjacent blocks,
Selecting means for selecting a prediction mode to be applied to each block of the distance image from among the prediction modes;
First determination means for determining whether or not to include a plurality of depth values in adjacent encoded blocks;
Second determination means for determining whether or not the block determined to include a plurality of depth values by the first determination means has a prediction mode corresponding to the direction toward the encoding target block;
Prediction means that uses the same prediction mode as the prediction mode of the block determined to have by the second determination means as a prediction value of the prediction mode of the block;
An image encoding apparatus comprising: encoding means for encoding and transmitting the encoding target block using a prediction value of the prediction mode.
前記距離画像の各ブロックに対して、隣接する複数の復号済みブロックに対し、ブロック内に複数の深度値を含むか否かを判定する第1の判定手段と、
前記第1の判定手段により、複数の深度値を含むと判定されたブロックが、前記ブロックに向かう方向に対応する予測モードを持っているか否かを判定する第2の判定手段と、
前記第2の判定手段により、持っていると判定されたブロックの予測モードと同一のものを、前記ブロックの予測モードの予測値とする予測手段と、
前記予測値を用いて、受信した符号化ブロックの予測モードを復号する復号手段と
を備えたことを特徴とする画像復号装置。 An image decoding device that decodes a distance image encoded by the image encoding device according to any one of claims 1 to 6,
First determination means for determining whether or not a plurality of adjacent decoded blocks include a plurality of depth values in each block of the distance image;
Second determination means for determining whether or not the block determined to include a plurality of depth values by the first determination means has a prediction mode corresponding to the direction toward the block;
Prediction means that uses the same prediction mode of the block determined to be possessed by the second determination means as the prediction value of the prediction mode of the block;
An image decoding apparatus comprising: decoding means for decoding a prediction mode of a received encoded block using the prediction value.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011060980A JP2014112749A (en) | 2011-03-18 | 2011-03-18 | Image coding device and image decoding device |
PCT/JP2012/056875 WO2012128211A1 (en) | 2011-03-18 | 2012-03-16 | Image encoding device, image decoding device, program, and encoded data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011060980A JP2014112749A (en) | 2011-03-18 | 2011-03-18 | Image coding device and image decoding device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014112749A true JP2014112749A (en) | 2014-06-19 |
Family
ID=46879358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011060980A Withdrawn JP2014112749A (en) | 2011-03-18 | 2011-03-18 | Image coding device and image decoding device |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2014112749A (en) |
WO (1) | WO2012128211A1 (en) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101390131B (en) * | 2006-02-27 | 2013-03-13 | 皇家飞利浦电子股份有限公司 | Rendering an output image |
JP4799438B2 (en) * | 2007-02-06 | 2011-10-26 | キヤノン株式会社 | Image recording apparatus, image recording method, image encoding apparatus, and program |
JP5529040B2 (en) * | 2008-01-10 | 2014-06-25 | トムソン ライセンシング | Intra-predicted video illumination compensation method and apparatus |
JP4995789B2 (en) * | 2008-08-27 | 2012-08-08 | 日本電信電話株式会社 | Intra-screen predictive encoding method, intra-screen predictive decoding method, these devices, their programs, and recording media recording the programs |
-
2011
- 2011-03-18 JP JP2011060980A patent/JP2014112749A/en not_active Withdrawn
-
2012
- 2012-03-16 WO PCT/JP2012/056875 patent/WO2012128211A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2012128211A1 (en) | 2012-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6625680B2 (en) | Video encoding method and apparatus, and decoding method and apparatus | |
JP5421408B2 (en) | Alpha channel video decoding apparatus, alpha channel decoding method, and recording medium | |
JP6807987B2 (en) | Image coding device, moving image decoding device, moving image coding data and recording medium | |
TW201220855A (en) | Image encoding method and apparatus, image decoding method and apparatus, and programs therefor | |
US11870982B2 (en) | Method and apparatus for processing image signal | |
US9503751B2 (en) | Method and apparatus for simplified depth coding with extended prediction modes | |
JP7408856B2 (en) | Video coding method and device based on conversion | |
JP6212890B2 (en) | Moving picture coding apparatus, moving picture coding method, and moving picture coding program | |
US20230379472A1 (en) | Image coding method based on transform and apparatus therefor | |
US20230239563A1 (en) | Transform-based image coding method and device therefor | |
US11943456B2 (en) | Transform-based image coding method and apparatus therefor | |
US11563979B2 (en) | Image coding method on basis of transform, and apparatus therefor | |
KR20180090971A (en) | Method and apparatus for image encoding | |
KR102482781B1 (en) | Image coding method and device based on transformation | |
JP2015128252A (en) | Prediction image generating method, prediction image generating device, prediction image generating program, and recording medium | |
WO2012153771A1 (en) | Image encoding device, image encoding method, image encoding program, image decoding device, image decoding method, and image decoding program | |
WO2012128209A1 (en) | Image encoding device, image decoding device, program, and encoded data | |
KR101761278B1 (en) | Method and apparatus for image decoding | |
KR20150090010A (en) | Method and apparatus for image encoding, and method and apparatus for image decoding | |
WO2012128211A1 (en) | Image encoding device, image decoding device, program, and encoded data | |
KR101606683B1 (en) | Method and apparatus for image encoding, and method and apparatus for image decoding | |
KR20200004348A (en) | Method and apparatus for processing video signal through target region correction | |
JP7418561B2 (en) | Video coding method and device based on conversion | |
KR101886259B1 (en) | Method and apparatus for image encoding, and computer-readable medium including encoded bitstream | |
KR20150091283A (en) | Method and apparatus for image encoding, and method and apparatus for image decoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20140701 |