JPWO2015098948A1 - 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム - Google Patents
映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム Download PDFInfo
- Publication number
- JPWO2015098948A1 JPWO2015098948A1 JP2015554948A JP2015554948A JPWO2015098948A1 JP WO2015098948 A1 JPWO2015098948 A1 JP WO2015098948A1 JP 2015554948 A JP2015554948 A JP 2015554948A JP 2015554948 A JP2015554948 A JP 2015554948A JP WO2015098948 A1 JPWO2015098948 A1 JP WO2015098948A1
- Authority
- JP
- Japan
- Prior art keywords
- depth
- image
- encoding
- viewpoint
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/204—Image signal generators using stereoscopic image cameras
- H04N13/239—Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/271—Image signal generators wherein the generated image signals comprise depth maps or disparity maps
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/537—Motion estimation other than block-based
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/547—Motion estimation performed in a transform domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N2013/0074—Stereoscopic image analysis
- H04N2013/0081—Depth or disparity estimation from stereoscopic image signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本願は、2013年12月27日に日本へ出願された特願2013−273523号に基づき優先権を主張し、その内容をここに援用する。
図1は、本発明の一実施形態における、映像符号化装置の構成を示すブロック図である。映像符号化装置100は、符号化対象画像入力部101と、符号化対象画像メモリ102と、参照視点画像入力部103と、参照視点画像メモリ104と、デプスマップ入力部105と、視差ベクトル生成部106(代表デプス設定部、変換行列設定部、代表位置設定部、視差情報設定部、デプス領域設定部、デプス参照視差ベクトル設定部)と、画像符号化部107(予測画像生成部)とを備える。
図2は、本発明の一実施形態における、映像符号化装置100の動作を示すフローチャートである。
符号化対象画像入力部101は、符号化対象画像Orgを、符号化対象画像メモリ102に入力する。符号化対象画像メモリ102は、符号化対象画像Orgを記憶する。参照視点画像入力部103は、参照視点画像Refを、参照視点画像メモリ104に入力する。参照視点画像メモリ104は、参照視点画像Refを記憶する(ステップS101)。
符号化対象領域ごとに繰り返される処理では、まず、符号化対象領域blkに対応するデプスマップ(デプスマップ上の対応領域であるデプス領域)を設定する(ステップS103)。
画像符号化部107は、blkがnumBlks未満であるか否か、を判定する(ステップS107)。blkがnumBlks未満である場合(ステップS107:Yes)、画像符号化部107は、ステップS103に処理を戻す。一方、blkがnumBlks未満でない場合(ステップS107:No)、画像符号化部107は、処理を終了する。
視差ベクトルを生成する処理では、まず、符号化対象領域blkのデプスマップから、代表画素位置pos及び代表デプスrepを設定する(ステップS1403)。代表画素位置pos及び代表デプスrepをどのような方法を用いて設定しても構わないが、復号側と同じ方法を用いる必要がある。
dt(pi)は、符号化対象画像上の点piにおけるデプスが代表デプスであるとしたときの、符号化対象視点から点piにおける被写体までの光軸上の距離を示す。
sは任意の実数であるが、カメラパラメータの誤差がない場合、sは参照視点の画像上の点qiにおける参照視点から点qiにおける被写体までの光軸上の距離dr(qi)と等しい。
また、上記定義に従い式(2)を計算すると、次の式(3)となる。なお、内部パラメータA、回転行列R、並進ベクトルtの添え字はカメラを表し、tとrはそれぞれ符号化対象視点と参照視点を表す。
視差ベクトル生成部106は、符号化対象領域blkを分割する(ステップS1401)。
numSBlksは、符号化対象領域blk内のサブ領域数を示す。視差ベクトル生成部106は、サブ領域インデックス「sblk」を、0で初期化する(ステップS1402)。
視差ベクトル生成部106は、代表デプス値から変換行列を求める(ステップS1404)。
視差ベクトル生成部106は、参照視点に対する視差ベクトルを求める。つまり、視差ベクトル生成部106は、サブ領域sblkのデプスマップから、視差ベクトルを求める(ステップS1405)。
視差ベクトル生成部106は、sblkがnumSBlks未満であるか否かを判定する(ステップS1407)。sblkがnumSBlks未満である場合(ステップS1407:Yes)、視差ベクトル生成部106は、ステップS1403に処理を戻す。つまり、視差ベクトル生成部106は、分割によって得られたサブ領域ごとに、デプスマップから視差ベクトルを求める「ステップS1403〜S1407」を繰り返す。一方、sblkがnumSBlks未満でない場合(ステップS1407:No)、視差ベクトル生成部106は、処理を終了する。
図5は、本発明の一実施形態における、映像復号装置200の構成を示すブロック図である。映像復号装置200は、ビットストリーム入力部201と、ビットストリームメモリ202と、参照視点画像入力部203と、参照視点画像メモリ204と、デプスマップ入力部205と、視差ベクトル生成部206(代表デプス設定部、変換行列設定部、代表位置設定部、視差情報設定部、デプス領域設定部、デプス参照視差ベクトル設定部)と、画像復号部207(予測画像生成部)とを備える。
図6は、本発明の一実施形態における、映像復号装置200の動作を示すフローチャートである。
ビットストリーム入力部201は、復号対象画像を符号化したビットストリームを、ビットストリームメモリ202に入力する。ビットストリームメモリ202は、復号対象画像を符号化したビットストリームを記憶する。参照視点画像入力部203は、参照視点画像Refを、参照視点画像メモリ204に入力する。参照視点画像メモリ204は、参照視点画像Refを記憶する(ステップS201)。
復号対象領域ごとに繰り返される処理では、まず、復号対象領域blkのデプスマップを設定する(ステップS203)。
画像復号部207は、blkがnumBlks未満であるか否か、を判定する(ステップS207)。blkがnumBlks未満である場合(ステップS207:Yes)、画像復号部207は、ステップS203に処理を戻す。一方、blkがnumBlks未満でない場合(ステップS207:No)、画像復号部207は、処理を終了する。
図7は、本発明の一実施形態における、映像符号化装置100をコンピュータとソフトウェアプログラムとによって構成する場合のハードウェア構成の例を示すブロック図である。システムは、CPU(Central Processing Unit)50と、メモリ51と、符号化対象画像入力部52と、参照視点画像入力部53と、デプスマップ入力部54と、プログラム記憶装置55と、ビットストリーム出力部56とを備える。各部は、バスを介して通信可能に接続されている。
その三次元点を別の視点へ再投影することで、別の視点からの画像上での点を計算する必要がある。しかしながら、このような変換では複雑な演算が必要となり、演算量が増加してしまうという問題がある。つまり、映像符号化の効率が低いという問題があった。
[0019]
上記事情に鑑み、本発明は、複数の視点に対する映像とデプスマップとを構成要素に持つ自由視点映像データの符号化において、視点の向きが平行でない場合でも、デプスマップから計算する視差ベクトルの精度を向上させることで、映像符号化の効率を向上させることができる映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラムを提供することを目的としている。
課題を解決するための手段
[0020]
本発明の一態様は、複数の異なる視点の映像からなる多視点映像の1フレームである符号化対象画像を符号化する際に、前記符号化対象画像の視点とは異なる参照視点に対する画像である参照視点画像と、前記多視点映像中の被写体に対するデプスマップとを用いて、前記符号化対象画像を分割した領域である符号化対象領域ごとに、異なる視点間で予測しながら符号化を行う映像符号化装置であって、前記デプスマップから代表デプスを設定する代表デプス設定部と、前記代表デプスに基づいて、前記符号化対象画像上の位置を前記参照視点画像上の位置へと変換する変換行列を設定する変換行列設定部と、前記符号化対象領域内の位置から代表位置を設定する代表位置設定部と、前記代表位置と前記変換行列を用いて、前記符号化対象領域に対する前記符号化対象の前記視点と前記参照視点の視差情報を設定する視差情報設定部と、前記視差情報を用いて、前記符号化対象領域に対する予測画像を生成する予測画像生成部と、前記符号化対象領域に対して、前記デプスマップ上での対応領域であるデプス領域を設定するデプス領域設定部と、前記符号化対象領域に対して、前記デプスマップに対する視差ベクトルであるデプス参照視差ベクトルを設定するデプス参照視差ベクトル設定部とを有し、前記代表デプス設定部は、前記デプス領域に対する前記デプスマップから前記代表デプスを設定し、前記デプス領域設定部は、前記デプス参照視差ベクトルによって示される領域を前記デプス領域として設定する。
[0021]
[0022]
[0023]
好ましくは、本発明の一態様において、前記デプス参照視差ベクトル設定部は、前記符号化対象領域に隣接する領域を符号化する際に使用した視差ベクトルを用いて、前記デプス参照視差ベクトルを設定する。
[0024]
好ましくは、本発明の一態様において、前記代表デプス設定部は、前記符号化対象領域の4頂点の画素に対応する前記デプス領域内のデプスのうち、最も前記符号化対象画像の前記視点に近いことを示すデプスを前記代表デプスとして設定する。
[0025]
本発明の一態様は、複数の異なる視点の映像からなる多視点映像の符号データから、復号対象画像を復号する際に、前記復号対象画像の視点とは異なる参照視点に対する画像である参照視点画像と、前記多視点映像中の被写体に対するデプスマップとを用いて、前記復号対象画像を分割した領域である復号対象領域ごとに、異なる視点間で予測しながら復号を行う映像復号装置であって、前記デプスマップから代表デプスを設定する代表デプス設定部と、前記代表デプスに基づいて、前記復号対象画像上の位置を前記参照視点画像上の位置へと変換する変換行列を設定する変換行列設定部と、前記復号対象領域内の位置から代表位置を設定する代表位置設定部と、前記代表位置と前記変換行列を用いて、前記復号対象領域に対する前記復号対象の前記視点と前記参照視点の視差情報を設定する視差情報設定部と、前記視差情報を用いて、前記復号対象領域に対する予測画像を生成する予測画像生成部と、前記復号対象領域に対して、前記デプスマップ上での対応領域であるデプス領域を設定するデプス領域設定部と、前記復号対象領域に対して、前記デプスマップに対する視差ベクトルであるデプス参照視差ベクトルを設定するデプス参照視差ベクトル設定部とを有し、前記代表デプス設定部は、前記デプス領域に対する前記デプスマップから前記代表デプスを設定し、前記デプス領域設定部は、前記デプス参照視差ベクトルによって示される領域を前記デプス領域として設定する。
[0026]
[0027]
[0028]
好ましくは、本発明の一態様において、前記デプス参照視差ベクトル設定部は、前記復号対象領域に隣接する領域を復号する際に使用した視差ベクトルを用いて、前記デプス参照視差ベクトルを設定する。
[0029]
好ましくは、本発明の一態様において、前記代表デプス設定部は、前記復号対象領域の4頂点の画素に対応する前記デプス領域内のデプスのうち、最も前記復号対象画像の前記視点に近いことを示すデプスを前記代表デプスとして設定する。
[0030]
本発明の一態様は、複数の異なる視点の映像からなる多視点映像の1フレームである符号化対象画像を符号化する際に、前記符号化対象画像の視点とは異なる参照視点に対する画像である参照視点画像と、前記多視点映像中の被写体に対するデプスマップとを用いて、前記符号化対象画像を分割した領域である符号化対象領域ごとに、異なる視点間で予測しながら符号化を行う映像符号化方法であって、前記デプスマップから代表デプスを設定する代表デプス設定ステップと、前記代表デプスに基づいて、前記符号化対象画像上の位置を前記参照視点画像上の位置へと変換する変換行列を設定する変換行列設定ステップと、前記符号化対象領域内の位置から代表位置を設定する代表位置設定ステップと、前記代表位置と前記変換行列を用いて、前記符号化対象領域に対する前記符号化対象の前記視点と前記参照視点の視差情報を設定する視差情報設置ステップと、前記視差情報を用いて、前記符号化対象領域に対する予測画像を生成する予測画像生成ステップと、前記符号化対象領域に対して、前記デプスマップ上での対応領域であるデプス領域を設定するデプス領域設定ステップと、前記符号化対象領域に対して、前記デプスマップに対する視差ベクトルであるデプス参照視差ベクトルを設定するデプス参照視差ベクトル設定ステップとを有し、前記代表デプス設定ステップは、前記デプス領域に対する前記デプスマップから前記代表デプスを設定し、前記デプス領域設定ステップは、前記デプス参照視差ベクトルによって示される領域を前記デプス領域として設定する。
[0031]
本発明の一態様は、複数の異なる視点の映像からなる多視点映像の符号データから、復号対象画像を復号する際に、前記復号対象画像の視点とは異な
る参照視点に対する画像である参照視点画像と、前記多視点映像中の被写体に対するデプスマップとを用いて、前記復号対象画像を分割した領域である復号対象領域ごとに、異なる視点間で予測しながら復号を行う映像復号方法であって、前記デプスマップから代表デプスを設定する代表デプス設定ステップと、前記代表デプスに基づいて、前記復号対象画像上の位置を前記参照視点画像上の位置へと変換する変換行列を設定する変換行列設定ステップと、前記復号対象領域内の位置から代表位置を設定する代表位置設定ステップと、前記代表位置と前記変換行列を用いて、前記復号対象領域に対する前記復号対象の前記視点と前記参照視点の視差情報を設定する視差情報設置ステップと、前記視差情報を用いて、前記復号対象領域に対する予測画像を生成する予測画像生成ステップと、前記復号対象領域に対して、前記デプスマップ上での対応領域であるデプス領域を設定するデプス領域設定ステップと、前記復号対象領域に対して、前記デプスマップに対する視差ベクトルであるデプス参照視差ベクトルを設定するデプス参照視差ベクトル設定ステップとを有し、前記代表デプス設定ステップは、前記デプス領域に対する前記デプスマップから前記代表デプスを設定し、前記デプス領域設定ステップは、前記デプス参照視差ベクトルによって示される領域を前記デプス領域として設定する。
本発明の一態様は、複数の異なる視点の映像からなる多視点映像の1フレームである符号化対象画像を符号化する際に、前記符号化対象画像の視点とは異なる参照視点に対する画像である参照視点画像と、前記多視点映像中の被写体に対するデプスマップとを用いて、前記符号化対象画像を分割した領域である符号化対象領域ごとに、異なる視点間で予測しながら符号化を行う映像符号化装置であって、前記デプスマップから代表デプスを設定する代表デプス設定部と、前記代表デプスに基づいて、前記符号化対象画像上の位置を前記参照視点画像上の位置へと変換する変換行列を設定する変換行列設定部と、前記符号化対象領域内の位置から代表位置を設定する代表位置設定部と、前記代表位置と前記変換行列を用いて、前記符号化対象領域に対する前記符号化対象の前記視点と前記参照視点の視差情報を設定する視差情報設定部と、前記視差情報を用いて、前記符号化対象領域に対する予測画像を生成する予測画像生成部とを有し、前記変換行列設定部は、前記符号化対象画像の視点と前記参照視点との位置関係の変化が所定の値よりも大きいときに、前記変換行列を求め直す。
本発明の一態様は、複数の異なる視点の映像からなる多視点映像の符号データから、復号対象画像を復号する際に、前記復号対象画像の視点とは異なる参照視点に対する画像である参照視点画像と、前記多視点映像中の被写体に対するデプスマップとを用いて、前記復号対象画像を分割した領域である復号対象領域ごとに、異なる視点間で予測しながら復号を行う映像復号装置であって、前記デプスマップから代表デプスを設定する代表デプス設定部と、前記代表デプスに基づいて、前記復号対象画像上の位置を前記参照視点画像上の位置へと変換する変換行列を設定する変換行列設定部と、前記復号対象領域内の位置から代表位置を設定する代表位置設定部と、前記代表位置と前記変換行列を用いて、前記復号対象領域に対する前記復号対象の前記視点と前記参照視点の視差情報を設定する視差情報設定部と、前記視差情報を用いて、前記復号対象領域に対する予測画像を生成する予測画像生成部とを有し、前記変換行列設定部は、前記復号対象画像の視点と前記参照視点との位置関係の変化が所定の値よりも大きいときに、前記変換行列を求め直す。
本発明の一態様は、複数の異なる視点の映像からなる多視点映像の1フレームである符号化対象画像を符号化する際に、前記符号化対象画像の視点とは異なる参照視点に対する画像である参照視点画像と、前記多視点映像中の被写体に対するデプスマップとを用いて、前記符号化対象画像を分割した領域である符号化対象領域ごとに、異なる視点間で予測しながら符号化を行う映像符号化方法であって、前記デプスマップから代表デプスを設定する代表デプス設定ステップと、前記代表デプスに基づいて、前記符号化対象画像上の位置を前記参照視点画像上の位置へと変換する変換行列を設定する変換行列設定ステップと、前記符号化対象領域内の位置から代表位置を設定する代表位置設定ステップと、前記代表位置と前記変換行列を用いて、前記符号化対象領域に対する前記符号化対象の前記視点と前記参照視点の視差情報を設定する視差情報設置ステップと、前記視差情報を用いて、前記符号化対象領域に対する予測画像を生成する予測画像生成ステップとを有し、前記変換行列設定ステップは、前記符号化対象画像の視点と前記参照視点との位置関係の変化が所定の値よりも大きいときに、前記変換行列を求め直す。
本発明の一態様は、複数の異なる視点の映像からなる多視点映像の符号データから、復号対象画像を復号する際に、前記復号対象画像の視点とは異なる参照視点に対する画像である参照視点画像と、前記多視点映像中の被写体に対するデプスマップとを用いて、前記復号対象画像を分割した領域である復号対象領域ごとに、異なる視点間で予測しながら復号を行う映像復号方法であって、前記デプスマップから代表デプスを設定する代表デプス設定ステップと、前記代表デプスに基づいて、前記復号対象画像上の位置を前記参照視点画像上の位置へと変換する変換行列を設定する変換行列設定ステップと、前記復号対象領域内の位置から代表位置を設定する代表位置設定ステップと、前記代表位置と前記変換行列を用いて、前記復号対象領域に対する前記復号対象の前記視点と前記参照視点の視差情報を設定する視差情報設置ステップと、前記視差情報を用いて、前記復号対象領域に対する予測画像を生成する予測画像生成ステップとを有し、前記変換行列設定ステップは、前記復号対象画像の視点と前記参照視点との位置関係の変化が所定の値よりも大きいときに、前記変換行列を求め直す。
[0032]
本発明の一態様は、コンピュータに、映像符号化方法を実行させるための映像符号化プログラムである。
[0033]
本発明の一態様は、コンピュータに、映像復号方法を実行させるための映像復号プログラムである。
発明の効果
[0034]
本発明によれば、複数の視点に対する映像とデプスマップとを構成要素に持つ自由視点映像データの符号化において、視点の向きが平行でない場合でも、デプスマップから計算する視差ベクトルの精度を向上させ、映像符号化の効率を向上させることが可能となる。
図面の簡単な説明
[0035]
[図1]本発明の一実施形態における、映像符号化装置の構成を示すブロック図である。
[図2]本発明の一実施形態における、映像符号化装置の動作を示すフローチャートである。
[図3]本発明の一実施形態において、視差ベクトル生成部が視差ベクトルを生成する処理(ステップS104)を示すフローチャートである。
[図4]本発明の一実施形態において、符号化対象領域をサブ領域に分割して視
Claims (14)
- 複数の異なる視点の映像からなる多視点映像の1フレームである符号化対象画像を符号化する際に、前記符号化対象画像の視点とは異なる参照視点に対する画像である参照視点画像と、前記多視点映像中の被写体に対するデプスマップとを用いて、前記符号化対象画像を分割した領域である符号化対象領域ごとに、異なる視点間で予測しながら符号化を行う映像符号化装置であって、
前記デプスマップから代表デプスを設定する代表デプス設定部と、
前記代表デプスに基づいて、前記符号化対象画像上の位置を前記参照視点画像上の位置へと変換する変換行列を設定する変換行列設定部と、
前記符号化対象領域内の位置から代表位置を設定する代表位置設定部と、
前記代表位置と前記変換行列を用いて、前記符号化対象領域に対する前記符号化対象の前記視点と前記参照視点の視差情報を設定する視差情報設定部と、
前記視差情報を用いて、前記符号化対象領域に対する予測画像を生成する予測画像生成部と
を有する映像符号化装置。 - 前記符号化対象領域に対して、前記デプスマップ上での対応領域であるデプス領域を設定するデプス領域設定部をさらに有し、
前記代表デプス設定部は、前記デプス領域に対する前記デプスマップから前記代表デプスを設定する請求項1に記載の映像符号化装置。 - 前記符号化対象領域に対して、前記デプスマップに対する視差ベクトルであるデプス参照視差ベクトルを設定するデプス参照視差ベクトル設定部をさらに有し、
前記デプス領域設定部は、前記デプス参照視差ベクトルによって示される領域を前記デプス領域として設定する請求項2に記載の映像符号化装置。 - 前記デプス参照視差ベクトル設定部は、前記符号化対象領域に隣接する領域を符号化する際に使用した視差ベクトルを用いて、前記デプス参照視差ベクトルを設定する請求項3に記載の映像符号化装置。
- 前記代表デプス設定部は、前記符号化対象領域の4頂点の画素に対応する前記デプス領域内のデプスのうち、最も前記符号化対象画像の前記視点に近いことを示すデプスを前記代表デプスとして設定する請求項2から請求項4のいずれか1項に記載の映像符号化装置。
- 複数の異なる視点の映像からなる多視点映像の符号データから、復号対象画像を復号する際に、前記復号対象画像の視点とは異なる参照視点に対する画像である参照視点画像と、前記多視点映像中の被写体に対するデプスマップとを用いて、前記復号対象画像を分割した領域である復号対象領域ごとに、異なる視点間で予測しながら復号を行う映像復号装置であって、
前記デプスマップから代表デプスを設定する代表デプス設定部と、
前記代表デプスに基づいて、前記復号対象画像上の位置を前記参照視点画像上の位置へと変換する変換行列を設定する変換行列設定部と、
前記復号対象領域内の位置から代表位置を設定する代表位置設定部と、
前記代表位置と前記変換行列を用いて、前記復号対象領域に対する前記復号対象の前記視点と前記参照視点の視差情報を設定する視差情報設定部と、
前記視差情報を用いて、前記復号対象領域に対する予測画像を生成する予測画像生成部と
を有する映像復号装置。 - 前記復号対象領域に対して、前記デプスマップ上での対応領域であるデプス領域を設定するデプス領域設定部をさらに有し、
前記代表デプス設定部は、前記デプス領域に対する前記デプスマップから前記代表デプスを設定する請求項6に記載の映像復号装置。 - 前記復号対象領域に対して、前記デプスマップに対する視差ベクトルであるデプス参照視差ベクトルを設定するデプス参照視差ベクトル設定部をさらに有し、
前記デプス領域設定部は、前記デプス参照視差ベクトルによって示される領域を前記デプス領域として設定する請求項7に記載の映像復号装置。 - 前記デプス参照視差ベクトル設定部は、前記復号対象領域に隣接する領域を復号する際に使用した視差ベクトルを用いて、前記デプス参照視差ベクトルを設定する請求項8に記載の映像復号装置。
- 前記代表デプス設定部は、前記復号対象領域の4頂点の画素に対応する前記デプス領域内のデプスのうち、最も前記復号対象画像の前記視点に近いことを示すデプスを前記代表デプスとして設定する請求項7から請求項9のいずれか1項に記載の映像復号装置。
- 複数の異なる視点の映像からなる多視点映像の1フレームである符号化対象画像を符号化する際に、前記符号化対象画像の視点とは異なる参照視点に対する画像である参照視点画像と、前記多視点映像中の被写体に対するデプスマップとを用いて、前記符号化対象画像を分割した領域である符号化対象領域ごとに、異なる視点間で予測しながら符号化を行う映像符号化方法であって、
前記デプスマップから代表デプスを設定する代表デプス設定ステップと、
前記代表デプスに基づいて、前記符号化対象画像上の位置を前記参照視点画像上の位置へと変換する変換行列を設定する変換行列設定ステップと、
前記符号化対象領域内の位置から代表位置を設定する代表位置設定ステップと、
前記代表位置と前記変換行列を用いて、前記符号化対象領域に対する前記符号化対象の前記視点と前記参照視点の視差情報を設定する視差情報設置ステップと、
前記視差情報を用いて、前記符号化対象領域に対する予測画像を生成する予測画像生成ステップと
を有する映像符号化方法。 - 複数の異なる視点の映像からなる多視点映像の符号データから、復号対象画像を復号する際に、前記復号対象画像の視点とは異なる参照視点に対する画像である参照視点画像と、前記多視点映像中の被写体に対するデプスマップとを用いて、前記復号対象画像を分割した領域である復号対象領域ごとに、異なる視点間で予測しながら復号を行う映像復号方法であって、
前記デプスマップから代表デプスを設定する代表デプス設定ステップと、
前記代表デプスに基づいて、前記復号対象画像上の位置を前記参照視点画像上の位置へと変換する変換行列を設定する変換行列設定ステップと、
前記復号対象領域内の位置から代表位置を設定する代表位置設定ステップと、
前記代表位置と前記変換行列を用いて、前記復号対象領域に対する前記復号対象の前記視点と前記参照視点の視差情報を設定する視差情報設置ステップと、
前記視差情報を用いて、前記復号対象領域に対する予測画像を生成する予測画像生成ステップと
を有する映像復号方法。 - コンピュータに、請求項11に記載の映像符号化方法を実行させるための映像符号化プログラム。
- コンピュータに、請求項12に記載の映像復号方法を実行させるための映像復号プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013273523 | 2013-12-27 | ||
JP2013273523 | 2013-12-27 | ||
PCT/JP2014/084118 WO2015098948A1 (ja) | 2013-12-27 | 2014-12-24 | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015098948A1 true JPWO2015098948A1 (ja) | 2017-03-23 |
JP6232076B2 JP6232076B2 (ja) | 2017-11-22 |
Family
ID=53478799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015554948A Active JP6232076B2 (ja) | 2013-12-27 | 2014-12-24 | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20160316224A1 (ja) |
JP (1) | JP6232076B2 (ja) |
KR (1) | KR20160086941A (ja) |
CN (1) | CN106134197A (ja) |
WO (1) | WO2015098948A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102098322B1 (ko) | 2017-09-07 | 2020-04-07 | 동의대학교 산학협력단 | 평면모델링을 통한 깊이 영상 부호화에서 움직임 추정 방법 및 장치와 비일시적 컴퓨터 판독가능 기록매체 |
US10645417B2 (en) * | 2017-10-09 | 2020-05-05 | Google Llc | Video coding using parameterized motion model |
EP4375917A3 (en) * | 2017-10-19 | 2024-10-09 | Panasonic Intellectual Property Corporation of America | Three-dimensional data encoding method, three-dimensional data decoding method, three-dimensional data encoding device, and three-dimensional data decoding device |
FR3075540A1 (fr) * | 2017-12-15 | 2019-06-21 | Orange | Procedes et dispositifs de codage et de decodage d'une sequence video multi-vues representative d'une video omnidirectionnelle. |
KR102074929B1 (ko) | 2018-10-05 | 2020-02-07 | 동의대학교 산학협력단 | 깊이 영상을 통한 평면 검출 방법 및 장치 그리고 비일시적 컴퓨터 판독가능 기록매체 |
US11190803B2 (en) * | 2019-01-18 | 2021-11-30 | Sony Group Corporation | Point cloud coding using homography transform |
CN110012310B (zh) * | 2019-03-28 | 2020-09-25 | 北京大学深圳研究生院 | 一种基于自由视点的编解码方法及装置 |
KR102224272B1 (ko) | 2019-04-24 | 2021-03-08 | 동의대학교 산학협력단 | 깊이 영상을 통한 평면 검출 방법 및 장치 그리고 비일시적 컴퓨터 판독가능 기록매체 |
CN111954032A (zh) * | 2019-05-17 | 2020-11-17 | 阿里巴巴集团控股有限公司 | 视频处理方法、装置、电子设备及存储介质 |
CN111189460B (zh) * | 2019-12-31 | 2022-08-23 | 广州展讯信息科技有限公司 | 一种含高精度地图轨迹的视频合成转换方法及装置 |
CN111163319B (zh) * | 2020-01-10 | 2023-09-15 | 上海大学 | 一种视频编码方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007036800A (ja) * | 2005-07-28 | 2007-02-08 | Nippon Telegr & Teleph Corp <Ntt> | 映像符号化方法、映像復号方法、映像符号化プログラム、映像復号プログラム及びそれらのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2009116532A (ja) * | 2007-11-05 | 2009-05-28 | Nippon Telegr & Teleph Corp <Ntt> | 仮想視点画像生成方法および仮想視点画像生成装置 |
JP2013030898A (ja) * | 2011-07-27 | 2013-02-07 | Nippon Telegr & Teleph Corp <Ntt> | 画像伝送方法、画像伝送装置、画像送信装置、画像受信装置、画像送信プログラム及び画像受信プログラム |
US20130159326A1 (en) * | 2011-12-15 | 2013-06-20 | Microsoft Corporation | Solution monitoring system |
-
2014
- 2014-12-24 CN CN201480070358.XA patent/CN106134197A/zh active Pending
- 2014-12-24 WO PCT/JP2014/084118 patent/WO2015098948A1/ja active Application Filing
- 2014-12-24 KR KR1020167016393A patent/KR20160086941A/ko not_active Application Discontinuation
- 2014-12-24 JP JP2015554948A patent/JP6232076B2/ja active Active
- 2014-12-24 US US15/105,450 patent/US20160316224A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007036800A (ja) * | 2005-07-28 | 2007-02-08 | Nippon Telegr & Teleph Corp <Ntt> | 映像符号化方法、映像復号方法、映像符号化プログラム、映像復号プログラム及びそれらのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2009116532A (ja) * | 2007-11-05 | 2009-05-28 | Nippon Telegr & Teleph Corp <Ntt> | 仮想視点画像生成方法および仮想視点画像生成装置 |
JP2013030898A (ja) * | 2011-07-27 | 2013-02-07 | Nippon Telegr & Teleph Corp <Ntt> | 画像伝送方法、画像伝送装置、画像送信装置、画像受信装置、画像送信プログラム及び画像受信プログラム |
US20130159326A1 (en) * | 2011-12-15 | 2013-06-20 | Microsoft Corporation | Solution monitoring system |
Non-Patent Citations (3)
Title |
---|
GERHARD TECH(外3名): "3D-HEVC Test Model 1", JOINT COLLABORATIVE TEAM ON 3D VIDEO CODING EXTENSION DEVELOPMENT OF ITU-T SG16 WP3 AND ISO/IEC JTC1, JPN6017008853, 20 September 2012 (2012-09-20), US, pages 12 - 21, ISSN: 0003518747 * |
YU-LIN CHANG,YI-WEN CHEN,JIAN-LIANG LIN,NA ZHANG,JICHENG AN,YU-WEN HUANG,SHAWMIN LEI: "3D-CE2.h related:Simplified DV derivation for DoNBDV and BVSP", JOINT COLLABORATIVE TEAM ON 3D VIDEO CODING EXTENSION DEVELOPMENT OF ITU-T SG16 WP3 AND ISO/IEC JTC, vol. JCT3V-D0138, JPN6017008854, 13 April 2013 (2013-04-13), US, pages 1 - 4, ISSN: 0003518748 * |
志水信哉(外3名): "多視点デプスマップの情報を用いた高効率多視点映像符号化", 映像情報メディア学会誌, vol. 第63巻, 第4号, JPN6017008852, 1 April 2009 (2009-04-01), JP, pages 524 - 532, ISSN: 0003518746 * |
Also Published As
Publication number | Publication date |
---|---|
WO2015098948A1 (ja) | 2015-07-02 |
US20160316224A1 (en) | 2016-10-27 |
JP6232076B2 (ja) | 2017-11-22 |
CN106134197A (zh) | 2016-11-16 |
KR20160086941A (ko) | 2016-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6232076B2 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム | |
KR20120000485A (ko) | 예측 모드를 이용한 깊이 영상 부호화 장치 및 방법 | |
JP6307152B2 (ja) | 画像符号化装置及び方法、画像復号装置及び方法、及び、それらのプログラム | |
JP6027143B2 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、および画像復号プログラム | |
JP6053200B2 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム | |
US20150249839A1 (en) | Picture encoding method, picture decoding method, picture encoding apparatus, picture decoding apparatus, picture encoding program, picture decoding program, and recording media | |
TWI499277B (zh) | 多視點畫像編碼方法、多視點畫像解碼方法、多視點畫像編碼裝置、多視點畫像解碼裝置及這些程式 | |
JPWO2014168082A1 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム | |
JP6232075B2 (ja) | 映像符号化装置及び方法、映像復号装置及び方法、及び、それらのプログラム | |
JP5926451B2 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、および画像復号プログラム | |
WO2015056712A1 (ja) | 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、動画像符号化プログラム、及び動画像復号プログラム | |
JP5706291B2 (ja) | 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置およびそれらのプログラム | |
JP6386466B2 (ja) | 映像符号化装置及び方法、及び、映像復号装置及び方法 | |
JP2015128252A (ja) | 予測画像生成方法、予測画像生成装置、予測画像生成プログラム及び記録媒体 | |
WO2015098827A1 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム | |
JP5759357B2 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム | |
WO2015141549A1 (ja) | 動画像符号化装置及び方法、及び、動画像復号装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170321 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171017 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171020 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6232076 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |