JP2015536112A - 3dビデオコーディングのための予測パラメータ継承 - Google Patents

3dビデオコーディングのための予測パラメータ継承 Download PDF

Info

Publication number
JP2015536112A
JP2015536112A JP2015535651A JP2015535651A JP2015536112A JP 2015536112 A JP2015536112 A JP 2015536112A JP 2015535651 A JP2015535651 A JP 2015535651A JP 2015535651 A JP2015535651 A JP 2015535651A JP 2015536112 A JP2015536112 A JP 2015536112A
Authority
JP
Japan
Prior art keywords
encoded
inherited
view
prediction parameters
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015535651A
Other languages
English (en)
Inventor
デン、ズピン
チウ、イ−ジェン
シュ、リドン
ザン、ウェンハオ
ハン、ユ
カイ、シャオシャ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of JP2015536112A publication Critical patent/JP2015536112A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)

Abstract

3次元(3D)ビデオコーディックは、3Dビデオについての多重ビューを符号化し、それぞれが、テクスチャ要素および深さ要素を有する。コーディックの複数のエンコーダは、例えば、複数の四分木分割フラグ、複数の予測モード、複数の分割サイズ、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、および複数のクロマ・イントラモードなどの一連の複数の予測パラメータに基づき、それぞれのビューについての複数のビデオブロックを符号化する。複数の予測パラメータは、異なる複数のビュー、並びにテクスチャ要素および深さ要素の異なるいくつかにわたり、継承されてよい。

Description

関連出願の相互参照
本出願は、2012年10月4日に出願された米国仮特許出願番号61/709,688の優先権を主張する。
背景技術
3次元(3D)ビデオは多重ビューを含み、それぞれは異なるカメラの視点または角度から撮影される。各ビューは、テクスチャ要素(テクスチャビューとも称される)および深度マップ要素を有する。3Dビデオ符号化は、多重テクスチャビューおよびそれらに関連する深度マップを符号化すること、そして多重の符号化されたテクスチャビューおよび深度マップをビットストリームへと多重化すること、を含む。そのような3Dビデオ符号化(または圧縮)では、テクスチャおよび深度マップ要素の冗長性を排除するべく、インターやイントラ予測等の複数の異なるタイプのビデオ予測を採用する。そうした予測は、予測を制御するための一連の予測パラメータを用いることで実行される。より効果的な符号化および復号処理を促進するために、それらの複数の予測パラメータが、異なる複数ビューまたは対応するテクスチャ/深度マップ要素等の異なるコンテキスト間で継承されまたは受け渡されてもよいような状況に関連して、現在の3Dコーディングの規格および関連する技術は、柔軟性がなく制限的である。
最大符号化ユニット(LCU)、複数の符号化ユニット(CU)、複数の予測ユニット(PU)、および複数の変換ユニット(TU)の例示的な関係の図である。 予測パラメータ継承(PPI)が3Dビデオの符号化および復号に用いられてよい例示的な3次元(3D)ビデオコーディング(3DVC)コーデックシステムのブロック図である。 一実施形態における多重ビューエンコーダを備えた、図2のコーデックシステムの送信側の拡張されたブロック図である。 一実施形態における図3の複数のエンコーダを備えた、ツー・ビュー・エンコーダの詳細なブロック図である。 一実施形態におけるPPIシンタックスの図であって、符号化されたビットストリームに埋め込まれてよい、 図4Aのツー・ビュー・エンコーダシステムに対応する、例示的なツー・ビュー・デコーダシステムの詳細なブロック図である。 図5のデコーダにより生成された視差ベクトルの一例の図であり、ビュー間のPPIで復号されるべき現在のブロックに対応する参照ブロックを決定する。 図3、4の異なる複数エンコーダおよび図5の複数デコーダ間における多様な方向でのPPIを示すブロック図である。 ビデオブロックにおける複数サブブロック間でのイントラ、インターおよびハイブリッド予測モードの継承を示す一連のブロック図(a)、(b)(c)である。 現在のブロックによってハイブリッド符号化されたソースブロックからの他の例示的なPPIのブロック図である。 符号化ツリー階層における異なるレベルでの、即ち、大きいCUから小さいCUへのPPIの例示的な図示である。 符号化ツリー階層における異なるレベルでの、即ち、大きいCUから小さいCUへのPPIの他の例示的な図示である。 PPIを用いて多重ビューテクスチャおよび深度ビデオ/複数要素を符号化する例示的な方法のフローチャートである。 図9Aの方法の符号化を拡張した例示的な方法のフローチャートである。 PPIを用いて、符号化された多重ビューテクスチャおよび深度ビデオ/複数要素を復号する例示的な方法のフローチャートである。 エンコーダおよびデコーダにおいて複数のPPI実施形態を実行するように構成された、例示的なコンピュータシステムのブロック図である。 PPI装備のエンコーダおよびPPI装備のデコーダの複数の実施形態が実装されうるシステムの一実施形態を示す。 図12のシステムが実装されうる小型フォームファクタデバイスの複数の実施形態を示す。
これらの図面中、参照番号の最も左側の桁(または複数の桁)は、その参照番号が最初に登場した図面を特定する。
3次元(3D)ビデオコーディング(3DVC)は、数々の3Dディスプレイをターゲットとするビデオ圧縮規格である。3DVCは、国際標準化機構/国際電気標準会議(ISO/IEC)エムペグ(MPEG)で開発中である。標準化の2つの主要部門として、高効率ビデオコーディング(HEVC)と従来のH.264/AVCに基づく3DVCとを有する。ここで用いられる「コーディング」および「符号化」という用語は、同義語であり交換可能である。多重ビュー3Dビデオの符号化および復号環境で用いられる予測パラメータ継承(PPI)を対象とする複数の実施形態が、後述される。複数の実施形態がHEVCに関連して説明されるが、他の任意のビデオ規格が使用されてもよい。従って、関連するHEVCプロトコルの概要がここで提示され、続いて述べられるPPIの符号化および復号の複数の実施形態のための基礎を形成する。
HEVCプロトコルの概要 ビデオコンテンツを様々な解像度で表現するために、HEVCは、符号化ユニット(CU)、予測ユニット(PU)、および変換ユニット(TU)を含む3重のユニットを定義する。CUは圧縮の基本単位であり、H.264規格のマクロブロックの概念と類似するが、より柔軟である。PUは、インター/イントラ予測の単位であり、単一のCUの中に多数のPUが存在してよい。TUは、変換の単位であり、1又は複数のPUを有しうる。従ってCUは、そのCUに関連する多数のPUと多数のTUとを有してよい。
ビデオは、連続する複数ビデオフレームまたは複数ピクチャを備える。各ピクチャは、1又は複数のスライスへと分割されてよい。HVECでは、各スライスは、一連のツリーブロックまたは最大符号化ユニット(LCU)へと分割され、これらは、ルマおよびクロマの両方の標本を有する。LCUは、マクロブロックとして、同様の目的を有する。スライスは、多数の連続する重複しないLCUを、コーディング順に有する。各LCUは、再帰的な四分木構造に従って、複数のCUからなる階層へと分割または細分化されてよい。例えば、四分木のルートノードとして、LCUは4つの子ノードへと分割されてよく、次にそれぞれの子ノードが親ノードとなり、他の4つの子ノードへと分割されてよい。この分割は、複数の四分木分割フラグを用いて成し遂げられる。四分木の葉節点として、最後の、分割されない子ノードまたは終端ノードは、符号化ノード、即ち、符号化したビデオブロックを備える。CUのサイズは、8×8ピクセルから最大64×64ピクセルまたはそれより大きいLCUのサイズにまで及んでよい。符号化されたビットストリームに関連したシンタックスデータはCU分割を定義してよく、四分木構造、LCUが分割されうる最大回数、および複数の符号化ノードの複数のサイズ、を含む。
複数の予測方法が、さらには分割できない複数の終端のCU、即ち、CUの階層的四分木における複数の葉節点(複数の符号化ノード)に対して規定される。複数のCU葉節点は、予測のための複数の基本単位へと分割され、複数のPUとして参照される。PUは、予測方法を規定する。具体的には、2つの主要パラメータが、そのPUに関連する予測方法、即ち、予測タイプ/モードおよびPU分割を規定する。予測モード(ここでは、コーディングモードとしても参照される)は、例えば、イントラ予測、インター予測、およびスキップの1つから選択される。イントラ予測は、同一ピクチャ内における、他の複数ビデオブロックに対する現在のビデオブロックの予測を含む。インター予測は、時間的に離れた、即ち、より前のおよび/またはより後の、隣接する複数ピクチャに対する現在のビデオブロックの予測を含む。現在のブロックに対するインター予測を定義するPUは、参照ブロックのための動きベクトルを有する。動きベクトルを定義するデータは、例えば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルに対する解像度(1/4ピクセル精度、1/8ピクセル精度)、動きベクトルが示す参照ピクチャ、および/または、動きベクトルのための参照ピクチャリスト(リスト0、リスト1、リストCなど)、を記述してよい。
TUは、変換および量子化処理のために用いられる。1又は複数のPUを含むCUは、また、1又は複数の変換ユニット(TU)を有してよい。予測に続けて、そのPUに対応する複数の残差値が計算されてよい。複数の残差値は、ビデオデータの現在のブロックとビデオデータの予測ブロックとの間のピクセル差分値を複数備える。複数の残差値は、複数の変換係数へと変換され、量子化され、複数のTUを用いてスキャンされ、エントロピー符号化のための直列化された変換係数を生成する。「ビデオブロック」または単なる「ブロック」という用語は、ここでは、文脈に応じて(1)任意の分割レベルで符号化されるべきビデオ情報(2)任意の分割レベルで復号されるべき符号化済ビデオ情報(3)復号処理に由来する復号済ビデオ情報、のいずれかを意味するものとして広く解釈され、分割レベルとは、例えば、フレーム、スライス、LCU,CU(符号化ノードでもそうでなくてもよい)、PUまたはTUのいずれであってもよい。
HEVCと関連するシンタックスデータは、LCUまたはCUを、四分木構造に従って、より低いレベルの複数のCUへと分割すること、そして葉節点の複数のCUを複数のPUへと分割すること、を記述してよい。シンタックスデータは、予測モード(例えば、イントラ、インター、スキップ)およびPU分割、または、複数の葉節点に対するサイズを記述する。CUに関連するシンタックスデータは、また、例えば、そのCUを1又は複数のTUへと分割すること、並びに、複数のTUについての複数のサイズおよび複数の形状を記述してよい。そのようなシンタックスデータは、また、ここでは、「複数の予測パラメータ」として参照され、これらを使用することで、符号化されるべきHEVCの葉節点レベルと関連した複数のビデオブロックの予測を制御する。言い換えると、複数のビデオブロックは、その複数のビデオブロックに関連する複数の予測パラメータに基づいて符号化される。
図1は、LCU、複数のCU、複数のPU、および複数のTUの例示的な関係100の図である。
上述のように、HEVCビデオフレームは、重複しない複数のLCUへと分割される。LCUは多数のCUへと分割され、複数の終端のCUは、イントラ予測または動き補償されたインター予測のために複数のPUへ、そして変換のために複数のTUへと分割される。
コーデックシステム
図2は、予測パラメータ継承(PPI)がビデオの符号化および復号のために用いられてよい例示的な3DVCコーデックシステム200のブロック図である。コーデックシステム200は、HEVCに従って動作してよい。3DVCは、3Dビデオコンテンツを表現するためにVideo plus Depth(MVD)コントラクトに基づく。MVDは、ビデオにおける多重ビュー(ここでは、多重ビュービデオとして参照される)を含む。各ビューは、異なるカメラの視点、例えば、角度、高さ等からキャプチャされたビデオを表す。各ビューは、テクスチャビデオ、および、それに関連する深度ビデオを含む。テクスチャビデオは、ピクチャをレンダリングするためのビデオ情報を有し、そこでは輝度標本およびクロマ標本を含む。深度ビデオ情報は、例えば深度マップのような情報を有し、当該情報は、例えばピクセル基準の複数の深度値のような3Dビデオを形成するためのテクスチャビデオに対応する。
コーデックシステム200は、送信側202および受信側204を有する。送信側202は、3D多重ビュービデオ208を、符号化されたビットストリーム210へと符号化するための3D多重ビュービデオエンコーダ206を有する。エンコーダ206は、多重ビュービデオにおけるテクスチャビデオおよび深度ビデオの両方を符号化し、符号化されたビットストリーム210とする。エンコーダ206は、また、制御およびシンタックス関連情報を、符号化されたビットストリームに組み込むかパックし、そこでは、多重ビュービデオ208を符号化するために用いられる複数の予測パラメータと、カメラの角度、高さ、識別子等の複数のカメラパラメータとを含む。送信側202は、符号化されたビットストリーム210を受信側204へ伝送する。
受信側204は、符号化されたビットストリーム210を受信する。受信側210はエンコーダ206と相補的な3D多重ビュービデオデコーダ212を有し、埋め込まれた制御およびシンタックス関連情報に基づいて符号化されたビットストリームを復号し、多重ビュービデオを214で再生する。深度画像ベースのレンダリング(DIBR)エンジン216は、復号された/再生されたビデオ214に基づいて3D表示画像218を構築する。
エンコーダ
図3は、一実施形態による、多重ビューエンコーダ206を備えた、コーデックシステム200の送信側202の拡張されたブロック図である。図3には、3D多重ビュービデオ208の多重の例示的なビューであるビュー(0)、ビュー(1)、ビュー(N−1)が図示される。各ビュー(i)は、それぞれのビューの左側に図示されたテクスチャビデオと、それぞれのビューの右側に図示された深度ビデオとを有する。ここでは、「テクスチャビデオ」および「深度ビデオ」という用語はまた、それぞれ「テクスチャ要素」および「深さ要素」として参照される。各ビュー(i)は対応する一対のビデオエンコーダと関連し、エンコーダ206におけるテクスチャビデオエンコーダTiおよび対応する深度ビデオエンコーダDiを含む。エンコーダTiは、ビューiのテクスチャビデオを符号化し、一方で、深度エンコーダDiは、ビュー(i)の深度ビデオを符号化する。例えば、テクスチャビデオエンコーダT0は、 ビュー(0)のテクスチャビデオを符号化し、一方で、深度ビデオエンコーダD0は、ビュー(0)の深度ビデオを符号化する。従って、所定のビュー(i)を符号化することは、ビュー(i)に関連するテクスチャビデオと深度ビデオとを符号化することを意味する。エンコーダTi、Diは、それぞれのビュー(i)を、本明細書で記載される複数のPPI実施形態に従って拡張されるHEVC符号化技術を用いて、符号化する。エンコーダTi、Diは、それぞれ符号化されたテクスチャおよび符号化された深度ビデオをエンコーダ206におけるマルチプレクサ310へ提供し、マルチプレクサは、符号化されたそれぞれのビューに由来する符号化されたテクスチャおよび深度ビデオを、符号化されたビットストリーム210へと組み合わせる。
ビュー0は、基準のあるいは独立したビューとして参照される。なぜなら、ビュー0は他の複数のビューから独立して、即ち、参照することなく符号化されるからである。例えばビュー0は、他の複数のビューのいずれが符号化されるよりも前に符号化されてよい。テクスチャビデオと関連する深度ビデオを含んだ他の複数のビュー、即ち、ビュー(1)からビュー(N−1)は、従属するまたは補助的な複数のビューとして参照される。なぜなら、これらは他の複数のビューからの情報を使用して符号化されてよいからである。より詳細には、ここで記載される複数の実施形態は、柔軟かつ両立的であって、選択的に適用された予測パラメータ継承モード(PPI)(またここでは単純にPPIとして参照される)を有するべく、エンコーダTi、Diによって用いられるHEVC符号化技術を拡張し、当該技術において、任意の多重の選択可能な複数の方向において、エンコーダTi、Diのうちの選択されたいくつかが、エンコーダTi、Diのうちの選択された他のいくつかから複数の予測パラメータを継承する。
エンコーダ206は、PPIを選択的に適用し、これにより、それら複数のビデオブロックのそれぞれを符号化するために他の複数のエンコーダによって用いられるべく、任意の多重の選択可能な複数のPPI方向で、複数のビデオブロックのそれぞれ(テクスチャまたは深度)を符号化するための任意のエンコーダTi、Diによって用いられる複数の予測パラメータが、それぞれのエンコーダから継承されてよい。上記で述べたように、エンコーダがそれぞれのビデオブロックを符号化するやり方、例えば予測するやり方を、複数の予測パラメータが制御する。「方向」とは、複数の予測パラメータが、複数の予測パラメータのソース側(エンコーダ/ブロック)から、複数の予測パラメータの受け手側(エンコーダ/ブロック)へと渡される方向を意味する。複数ブロック/複数エンコーダが異なるビューからのものである場合、多重の選択可能な複数のPPI方向は、ビュー間での方向を複数含み、複数ブロック/複数エンコーダがテクスチャ要素および深さ要素の中の異なるいくつかからのものである場合には、要素間での方向を複数含む。複数の方向とは、ビュー間および要素間の両方の複数の方向の組み合わせ、であってよい。
例えば、多重ビューにわたる時間的およびビュー間の冗長性を排除するために、ビュー間でのインター予測が用いられてよく、ここでは、テクスチャビデオおよび深度ビデオが、同一ビューで時間的に隣接する複数ピクチャから予測されるだけでなく、隣接するビューにおいて対応するビュー間の複数ピクチャから予測されてよい。他の複数の例では、ビュー間でのイントラ予測がサポートされる。更には、テクスチャビデオと深度ビデオとの間の要素間の冗長性を排除するために、要素間でのインターおよびイントラ予測が、また、深度/テクスチャビデオへと適用されてよく、ここでは、複数の深度/テクスチャビデオが、同一ビューのテクスチャ/深度ビデオから予測される。要素間の例では、複数の予測パラメータが、テクスチャ要素および深さ要素の間で継承される。
PPIは、また、異なる複数エンコーダ/複数ブロックの間の複数の予測モードの継承をサポートする。例えば、エンコーダ/ビデオブロック(テクスチャまたは深度)は、同じ場所に位置したまたはそれに代えて動き補償される等した、対応するビデオブロックから複数の予測パラメータを継承してよく、このビデオブロックは複数のサブブロックへ細分化され、このサブブロック中では、(i)全サブブロックがイントラ予測され、(ii)全サブブロックがインター予測され、(iii)複数のサブブロックがハイブリッド予測される、即ち、複数のサブブロックのいくつかはインター予測され、複数のサブブロックのいくつかがイントラ予測される。
従って、PPIで継承された複数の予測パラメータは、これには限定されるものではないが、ピクチャ符号化構造を有し、この構造は、CU/PUのサブ分割を定義する複数の四分木分割フラグのような四分木構造;インター、イントラおよびハイブリッド予測モード;複数の分割サイズおよび複数の形状(例えば、複数のPUのための);複数の動きベクトルと複数の動き場;複数のインター方向;複数の参照インデックス;ルマのインターおよびイントラ(予測)モード、並びにクロマのインターおよびイントラ(予測)モード、を含む。
エンコーダ206は、多重のPPI通信パスを有し、これらのパスは、図3に図示されるようにPPI通信基礎構造を備え、上記で述べた選択可能な様々な複数の方向において、即ち、
a)ビュー内のテクスチャ−深度方向およびビュー内の深度−テクスチャ312方向、
b)ビュー間のテクスチャ−テクスチャ方向であって、独立−従属314および従属−従属316を含む方向、
c)ビュー間の深度−深度方向であって、独立−従属318および従属−従属320を含む方向、
d)ビュー間のテクスチャ−深度方向であって、独立テクスチャ−深度322および従属テクスチャ−深度324を含む方向、
e)ビュー間の深度−テクスチャ方向であって、独立深度−テクスチャ318および従属深度−テクスチャ320を含む方向、でPPIをサポートする。
エンコーダ206は、上でリストされた選択可能な複数の方向の全てにおいてPPIをサポートし、かつ、必要に応じて、これらの選択可能な複数の方向のうちの1つ又は複数において、任意の所定の時間でPPIの選択が可能であるか、或いは、全く選択しない。このように、ここで記載される複数のPPI実施形態は柔軟であり、PPIが許可されない場合よりも、より多くの符号化利得を提供することができる。また、PPIは計算負荷を低減する。なぜならば、符号化で使用する目的で複数の予測パラメータを継承すれば、複数の予測パラメータをビデオブロックの符号化のたびに分析的に導出した場合に関連する計算上のオーバヘッドを低減するからである。
上記の複数の例に関連して説明したように、複数のエンコーダ間における複数の予測パラメータの継承としてPPIが考慮・参照されてよく、この場合、第1の複数のビデオブロックを符号化するために第1エンコーダによって用いられる複数の予測パラメータは、任意の多重の選択可能な複数のPPI方向において、第1エンコーダから第2エンコーダにより継承され、継承された複数の予測パラメータを用いて第2の複数のブロックを符号化するべく、第2エンコーダによって用いられる。代替的および同等的には、複数のビデオブロック間における継承として、PPIが考慮・参照されてよく、この場合、第1の複数のビデオブロックを符号化するために用いられる複数の予測パラメータは、任意の多重の選択可能な複数のPPI方向において、第1の複数のビデオブロックから継承され、第2の複数のビデオブロックを符号化するために用いられる。
図4Aは、ツー・ビュー・エンコーダの詳細なブロック図であり、一実施形態における図3のビュー(0)についてのエンコーダT0、D0とビュー(1)についてのエンコーダT1、D1とを含む。エンコーダT0、D0、T1、D1のそれぞれは、他の複数のエンコーダと実質的に同じやり方で動作するように構成され、そのそれぞれのビデオ要素、テクスチャまたは深度のいずれかを、ビットストリーム210へとパックされるべき対応する符号化されたビデオ要素へと、符号化する。エンコーダT0、D0、T1、D1のそれぞれは、変換量子化器、逆変換量子化器、インループフィルタ、イントラおよびインター予測モジュール、および加算器のような複数の既知のエンコーダモジュールを有する。
加えて、各エンコーダは、(i)複数のビデオブロックを符号化するためにPPIを使用/適用するべきかどうか(即ちPPI符号化モードを適用すべきかどうか)を決定し、(ii)PPIが適用されるべきと決定された場合には、継承された複数の予測パラメータの中で示された予測モードに従って選択されるように、継承された複数の予測パラメータを、イントラ予測モジュールまたはインター予測モジュールのいずれかに送るように構成された、モード決定モジュールを有する。この結果、選択された予測モジュールは、継承された複数の予測パラメータを用いて複数のビデオブロックを予測できる。
PPIを使用するかどうかを決定するために、モード決定モジュールは、一連の最善の複数の予測パラメータを決定し、それによって複数のビデオブロックを、(i)局所的に導出された複数の予測パラメータ(ii)継承された複数の予測パラメータ、または(iii)局所的に導出された複数のパラメータと継承された複数のパラメータの混合として、異なる複数の場合(即ち、局所的に導出される、継承される、および、局所的に導出されるのと継承されるのとの混合)に対するレート歪みコストの比較に基づいて、符号化する。継承された複数の予測パラメータが(単独でまたは部分的にのいずれかで)最善の選択だと決定された場合に、モード決定モジュールは、複数の予測モジュールのうちの選択された1つが、適切なPPI方向からの複数の予測パラメータを継承するように、PPI符号化モードを起動する(即ち、PPIを適用する)。最善の複数のパラメータを決定する方法は、図9Bに関連して議論される。
複数のエンコーダT0、D0、T1、D1は、複数ビデオ要素におけるそれぞれの入力ブロックを、複数のビデオ要素の符号化ブロックへと符号化し、次にそれらは、符号化されたビットストリーム210へとコンパイルされる。複数のエンコーダは、また、PPIに関連するシンタックスをビットストリーム210へ埋め込む。PPIシンタックスは、PPI符号化モード、即ち、PPIの使用を示した複数のPPIフラグを含む。複数のPPIフラグは、シーケンス毎、ビュー毎、スライス毎、ピクチャ毎、CU毎、PU毎、TU毎のうちの任意のレベルで、PPIの使用を信号で伝えるために用いられてよい。複数のPPIフラグは、シーケンス毎、ビュー毎、スライス毎、ピクチャ毎、CU毎、PU毎、TU毎のうちの任意のレベルで、要素間のPPIまたはビュー間のPPI(または両方の組み合わせ)の使用を信号で伝えるために用いられてもよい。
シンタックスは、また、複数のPPIフラグに関連する以下の複数の情報フィールドの1つ又は複数を有してよい。
複数の予測パラメータが継承されるべき、ソースエンコーダおよび複数の符号化されたビデオブロックにおける複数の識別子は、対応するソースビュー(例えば、ビュー0、1等)およびソースビデオ要素(深度またはテクスチャビデオ)の複数の識別子を有する。これはまた(1又は複数の符号化ブロック識別子等の)情報を有してよく、複数の予測パラメータが継承されるべき符号化ブロックが、その情報から決定されてよい。
継承された複数の予測パラメータの受け手側エンコーダ/複数ブロックにおける複数の識別子は、対応する受け手側のビューおよび受け手側のビデオ要素における複数の識別子および継承された複数の予測パラメータを有する。
図4Bは、符号化されたビットストリーム210に埋め込まれてよいPPIシンタックス450の図である。PPIシンタックスは、複数のPPIフラグ、PPI方向(ビュー、要素、1又は複数のブロックの身元等の継承された複数のパラメータのソースを示すもの)および継承された複数の予測パラメータを含む。
例示的な選択可能なPPI通信または複数の継承パス(図3に示される複数のPPI通信パスに対応する)が、図4Aでは太字で示され、これらはエンコーダT0、D0、T1、D1の間の様々な方向でPPIをサポートする。複数のPPI通信パスは、また、PPIをサポートする、エンコーダ毎に異なる複数のモード決定モジュール間での相互通信を許可し、その結果、受け手側エンコーダは、継承されるべき複数の予測パラメータのソースであるエンコーダへ、PPIを用いるための決定を伝達することができる。以下の複数の通信パスが図4Aで図示される。a)ビュー内(即ち、同じビュー)の複数のテクスチャ−深度PPIパス404、406は、テクスチャエンコーダT0から深度エンコーダD0およびテクスチャエンコーダT1から深度エンコーダD1という、示された複数の方向で、複数の予測パラメータの継承をサポートする。例えば、複数のテクスチャビデオブロックを符号化するためにテクスチャエンコーダT0によって用いられる複数の予測パラメータは、深度エンコーダD0によりテクスチャエンコーダ(ビュー内の、テクスチャ−深度方向)から継承されてよく、深度エンコーダは、継承された複数のパラメータを使用して複数の深度ビデオブロックを符号化することができる。b)ビュー間のテクスチャ−テクスチャPPIパス408は、テクスチャエンコーダT0からテクスチャエンコーダT1へ、複数の予測パラメータの継承をサポートする。
c)ビュー間の深度−深度PPIパス410は、深度エンコーダD0から深度エンコーダD1へ、複数の予測パラメータの継承をサポートする。以下の複数のPPI通信パスが、また存在するが、過度に複雑となることを避けるために図4Aから省略されている。
d)ビュー内の深度−テクスチャ、およびe)ビュー間の深度−テクスチャ。
複数のPPIパス404−410は、複数の予測パラメータをソースエンコーダ/ブロックから受け手側エンコーダ/ブロックへ、示された複数の方向で送る。複数の経路404−410のそれぞれは、信号経路と記憶バッファとを有し、受け手側エンコーダによるアクセスに対してソースエンコーダから複数の予測パラメータを受信して格納する。複数のPPIパス404−410は、ソースエンコーダから、受け手側エンコーダにおけるそれぞれのモード決定モジュールの入力へ、継承された複数の予測パラメータを案内する。PPIが選択/適用されると、選択された予測モジュールにより複数の符号化ビデオブロックにおいて使用するために、適切な受け手側エンコーダにおけるモード決定モジュールは、モード決定モジュールの入力で提示された継承された複数の予測パラメータを、イントラおよびインター予測モジュールのうちの選択された1つへ送る。継承された複数の予測パラメータは、複数の予測モード(インター/イントラ)を既に含んでおり、使用されるべき適切な予測モジュールを示す。
複数のPPI通信パスは、複数のモード決定モジュールと共に、エンコーダにおいてPPIをサポートするPPI通信基礎構造を備える。
複数の実施形態において、複数のエンコーダは、それぞれ、1又は複数のオブジェクト指向コンピュータプログラムモジュールを有する1又は複数のコンピュータプログラムモジュールとして実装されてよく、これらのモジュールは、複数のエンコーダコンピュータプログラムモジュールにおける他のいくつかから、複数の予測パラメータを継承する。
デコーダ
図5は、図4Aのツー・ビューエンコーダシステムに対応する、例示的なツー・ビューデコーダシステムの詳細なブロック図である。図5のデコーダDl、Tl、DO、TOのそれぞれは、図4AのエンコーダD1、Tl、DO、TOのそれぞれの1つに対応し、ペアとなるエンコーダからの符号化要素を復号する。デコーダTO、DO、Tl、Dlのそれぞれは、他の複数のデコーダと実質的に同様に動作するよう構成され、ビットストリーム210から受信した、それぞれ符号化されたビデオ要素、テクスチャまたは深度のいずれかを、対応する出力テクスチャビデオまたは出力深度ビデオへと、適宜、復号する。エンコーダTO、DO、Tl、Dlのそれぞれは、変換量子化器、逆変換量子化器、インループフィルタ、イントラおよびインター予測モジュール、および加算器等の複数の既知のデコーダモジュールを有する。
加えて各デコーダは、ビットストリーム210に埋め込まれたPPIシンタックスを決定し、そして決定されたシンタックスに基づいて適切なアクションを取るように構成されたモード決定モジュールを有し、(i)複数のビデオブロックを復号するためにPPIを適用するべきかどうかを含んでおり、PPIが指示されている場合には、(ii)継承された複数の予測パラメータを、イントラおよびインター予測モジュールの選択された1つに送り、その結果、選択された予測モジュールは、継承された複数の予測パラメータを用いて複数のビデオブロックを予測することができる。
例示的な選択可能なPPI通信パス504、506、508、510(図4AのエンコーダにおけるPPI通信パス404、406、408、410に対応する)が、図5では太字で示され、これらは複数のデコーダT0、D0、T1、D1間の様々な方向でPPIをサポートする。 過度な複雑性を図面に追加しないようにすべく、サポートされる全PPI通信パスが図5に示されているわけではない。複数のPPI通信パスは、異なる複数のモード決定モジュール間でのPPIをサポートする相互通信を許可し、その結果、受け手側デコーダは、継承されるべき複数の予測パラメータのソースであるデコーダへ、PPIを用いるための決定を伝達することができる。デコーダにおける複数のPPI通信パスは、図4Aのエンコーダにおける通信パスと同様に動作するように構成される。従って、ここではさらに説明されない。ツー・ビューデコーダは、図4Aのエンコーダによってサポートされる同じ方向の全てにおいて、PPIをサポートする。
それぞれの(デコーダ)モード決定モジュールは、受信したビットストリーム210に埋め込まれたPPIシンタックスを決定する。複数のPPIフラグがPPIを示す場合、決定モジュールは、継承された複数の予測パラメータを含む複数のPPIフラグに関連した複数のPPIシンタックス情報フィールドに従って、受信した複数の符号化されたビデオブロックを、それぞれのデコーダに、PPIを用いて復号させる。モード決定モジュールは、継承された複数の予測パラメータに含まれる複数の予測モードに従って、継承された複数の予測パラメータの指定ソースからインターおよびイントラ予測モジュールのうちの1つの方向へ、複数の予測パラメータを送る。
複数のPPI通信パスおよび複数のモード決定モジュールは、共に、デコーダにおいてPPIをサポートするPPI通信基礎構造を備える。デコーダPPI通信基礎構造は、上述したエンコーダにおいてサポートされる複数のPPI方向の全てをサポートする。複数のデコーダは、複数のエンコーダに対して上でリストされた全方向でPPIをサポートし、かつ、必要に応じて、任意の所定の時間でこれらの複数方向のうちの1つ又は複数においてPPIを選択可能であるか、或いは全く選択をしない。
複数の実施形態において、複数のデコーダは、それぞれ、1又は複数のオブジェクト指向コンピュータプログラムモジュールを有する1又は複数のコンピュータプログラムモジュールとして実装されてよく、これらのモジュールは、複数のデコーダコンピュータプログラムモジュールにおける他のいくつかから、複数の予測パラメータを継承する。
PPIシンタックスは、深度ビデオ等のビュー間の要素から、または要素間のブロックから、複数の予測パラメータが継承されるPPIを示してよい。例えば、複数の予測パラメータが深度マップ等のビュー間の深さ要素から継承される場合には、図6に関連して後述するように、ビュー間の深度マップにおいて対応するブロックが生成された視差ベクトル(ディスパリティベクトル)を用いて取得されてよい。
図6は、図5のデコーダにより生成された視差ベクトルの一例の図であり、ビュー間のPPIで復号されるべき現在のブロックに対応する参照ブロックを決定する。
生成された視差ベクトルは、深度変換された視差ベクトル、グローバル視差ベクトル、または隣接する符号化前の複数ブロックからの選択的視差ベクトル等であってよい。ブロックベースでの符号化/復号の結果、例えば深度マップなどの符号化前のビュー間の要素(図6の上部の複数ブロックを参照)における視差補償されたブロックは、1つの完全なブロックとはならないことがありうる。例えば、視差補償されたブロックは、図6のA、B、C、Dで示される多数の符号化前のブロックの1つより多くと重なり合ってよい。異なる複数の方法が、対応ブロックを選択するために用いられてよく、例えば、i)図6で"B"と示される支配的な重複ブロックが対応ブロックとして選択されること、ii)重複する複数ブロックの全てであるA、B、C、Dがレート歪みコストに基づいて一致度をチェックされ、最善のレート歪みコストに基づいて複数ブロックのうちの最適な1つが選択されること、等を含む。複数のPPIフラグが、ビュー間のPPIではなくビュー内のPPIを示す場合には、複数の予測パラメータは、同じビュー内で同じ場所に位置するブロックからコピーされる(即ち、継承される)。
PPIの例
図7Aは、複数のエンコーダD0、T0、D1、T1間における様々な選択可能な方向でのPPIを示すブロック図である。矢印で示される選択可能な複数のPPI方向としては、同じビュー内の異なる要素間、異なるビュー間での異なる要素間、異なるビュー間での同じ要素間、の方向を含む。このブロック図は、図5の複数のデコーダD0、T0、D1、T1間において適用されうる複数のPPI方向に対しても同様に適用される。
示されているように、
a)(ビュー(0)の)ビデオブロックD0が、(ビュー(0)の)ビデオブロックT0から継承された複数の予測パラメータに基づいて符号化/復号されてよく、
b)ビデオブロックT0は、ビデオブロックD0から複数の予測パラメータを継承してよく、
c)ビデオブロックD1は、複数のビデオブロックD0、T0、T1のうちの選択可能な1つから、複数の予測パラメータを継承してよく、
d)ビデオブロックT1は、複数のビデオブロックD0、T0、D1のうちの選択可能な1つから、複数の予測パラメータを継承してよい。
図7Bは、一連のブロック図であり、上部から底部へ向かって、以下を有する:
a)イントラであって、右側の複数ブロックは、左側の全てのイントラ符号化された複数ブロックから、構造と複数のイントラ予測モードとを継承する。
b)インターであって、右側の複数ブロックは、左側の全てのインター符号化された複数ブロックから、構造と複数のインター予測モードとを継承する。
c)ハイブリッドであって、右側の複数の符号化ブロックは、左側のハイブリッド(インタ−およびイントラ)符号化された複数ブロックから、構造と複数のハイブリッド予測モードとを継承する。
図7Cは、現在のブロック(即ち、右側のブロック)によりハイブリッド符号化されたソースブロック(即ち、左側のブロック)からの他の例示的なPPIのブロック図である。ソースブロックにおける各サブブロックの、たとえば四分木分割(即ち、複数の分割フラグ)、複数の予測モード、分割サイズ、動き場、インター方向、参照インデックス、ルマ・イントラモード、クロマ・イントラモード等の複数の予測パラメータは、完全または部分的に継承されうる。
PPIは、ツリーブロック(即ち、符号化ツリー)階層の任意のレベルでのものであってよい。従って、図8Aおよび8Bに関連して以下で議論されるように、ソース側CUおよび受け手側CUは、階層中の異なるレベルでのものであってよく、かつ、異なるサイズを有してよい。
図8Aは、符号化ツリー階層における異なるレベルでの、即ち、大きいCUから小さいCUへのPPIの例示的な図示である。この場合、PPIは、四分木のより低いレベルで示され、継承のために用いられるソース側CU(より高いレベルのCU)のサイズより小さな受け手側CU(現在のCU)のサイズに対応する。従って、現在のCUと同じサイズを有する図8Aの影付きブロックは、継承される信号のソース(即ち、継承のソース)として示されている。例えば複数の予測モード、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、複数のクロマ・イントラモード、等の複数の予測パラメータが、継承される信号から完全または部分的に継承される。また、現在のCUの四分木分割フラグは、偽に設定され、現在のCUの分割サイズは、2N×2Nに設定される。
図8Bは、符号化ツリー階層における異なるレベルでの、即ち、大きいCUから小さいCUへのPPIの他の例示的な図示である。この場合、PPIは、四分木のより低いレベルで示され、継承される信号(即ち、継承のソース)のために用いられるCUサイズより小さなCUサイズに対応する。継承される信号(即ち、継承されるPPIソース)として示される図8Bの複数の影付きブロックは、現在のCUと同じサイズを有する。例えば複数の四分木分割フラグ(CU/PUのサブ分割)、複数の予測モード、複数の分割サイズ、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、複数のクロマ・イントラモード等の、複数の予測パラメータが、継承される信号から、完全または部分的に継承される。
方法のフローチャート
図9Aは、PPIを用いて多重ビューテクスチャおよび深度ビデオ/複数要素を符号化する例示的な方法900のフローチャートである。
905は、多重ビュービデオの多重ビューにおける第1ビューのテクスチャ要素、第1ビューの深さ要素、多重ビューにおける第2ビューのテクスチャ要素、および第2ビューの深さ要素のそれぞれの/それぞれから符号化されるべき、区別できるビデオブロックを受信する段階を有する。多重ビュービデオは、3D多重ビュービデオであってよい。
910は、他の複数の区別できるビデオブロックのうちの選択可能な1つから継承される複数の予測パラメータのうちの選択可能な1つ、および、他の複数の区別できるビデオブロックのうちの1つからは継承されない複数の予測パラメータ、に基づいて、それぞれ区別できるビデオブロックを符号化する段階を有する。
継承された複数の予測パラメータに基づいてそれぞれ区別できるビデオブロックを符号化する段階は、
a)第1ビューのテクスチャ要素および深さ要素のうちの1つにおけるそれぞれのビデオブロックを、第1ビューのテクスチャ要素および深さ要素のうちの他の1つにおける他の複数のビデオブロックのうちの1つから継承された複数の予測パラメータに基づいて符号化する段階、および
b)第2ビューのテクスチャ要素および深さ要素のうちの1つにおけるそれぞれのビデオブロックを、
第1ビューのテクスチャ要素、
第1ビューの深さ要素、および
第2ビューのテクスチャ要素および深さ要素のうちの他の1つにおける他の複数のビデオブロックの選択可能な1つから継承された複数の予測パラメータに基づいて符号化する段階、を有してよい。
継承された複数の予測パラメータは、また、
a)他の複数のビデオブロックのうちの1つが、複数のインター予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、それらの複数のインター予測モードを、
b)他の複数のビデオブロックのうちの1つが、複数のイントラ予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、それらの複数のイントラ予測モードを、
c)他の複数のビデオブロックのうちの1つがインターおよびイントラモードの組み合わせに基づいて符号化された複数の符号化ブロックを有する場合には、それらのインターおよびイントラ予測モードの組み合わせを、有してよい。
915は、多重ビューのそれぞれにおいて、テクスチャ要素および深さ要素について複数の符号化されたビデオブロックを備える符号化されたビットストリームを生成する段階を有する。
920は、継承された複数の予測パラメータに基づいて複数の符号化されたビデオブロックのそれぞれと関連するPPIシンタックスを、符号化されたビットストリームへと埋め込む段階を有し、このPPIシンタックスは、符号化されたビデオブロックが継承された複数の予測パラメータに基づいて符号化されたことを示すPPIフラグ、複数の予測パラメータが継承された他の複数のビデオブロックのうちの1つが、そこから決定される情報と(例えば、複数の予測パラメータが継承されたかもしれないブロックまたはいくつかの候補ブロックを具体的に特定し、そのビューおよび要素を特定する等)、および継承された複数の予測パラメータ、を含む。
図9Bは、方法900における910の符号化を拡張した例示的な方法のフローチャートである。
930は、複数のビデオブロックのそれぞれを、一連の継承された複数の予測パラメータに基づいて、または一連の継承されない複数の予測パラメータに基づいて、符号化するかどうかを決定する段階を有する。930の決定する段階は、例えば、図4Aの複数の多重ビューエンコーダにおける複数のエンコーダT0、D0、T1、D1のそれぞれのモード決定モジュールによって実行されてよい。
930においてそうするように決定された場合、935は、一連の継承された複数の予測パラメータに基づいて、それぞれのビデオブロックを符号化する段階を有する。
930においてそうするように決定された場合、940は、一連の継承されない複数の予測パラメータに基づいて、それぞれのビデオブロックを符号化する段階を有する。
930の決定する段階は、950、955および960で更に説明される。
950は、符号化されるべきそれぞれのビデオブロックと、ビデオブロックを符号化する複数の予測パラメータの複数の候補のセットとを受信する段階を有し、この複数の候補のセットは、一連の継承された複数の予測パラメータと、例えばデフォルトで局所的に生成される複数の予測パラメータ(即ち、それぞれのビデオブロックを符号化するための複数エンコーダのうちのそれぞれの1つで生成される)等の、継承された複数の予測パラメータではない一連の複数の予測パラメータとを含む。
955は、レート歪みコスト関数に基づき、それぞれのビデオブロックに関する候補となる複数の予測パラメータの複数セットのそれぞれに対して、レート歪みコストを推定する段階を有する。関連技術における当業者にとっては明らかであるように、例えば、量子化された複数のビデオ信号、差の2乗和、ラグランジュ係数等に基づく、任意の適切なレート歪みコスト関数が用いられてよい。
960は、推定されたレート歪みコストを最小化する、複数の予測パラメータの複数セットにおける最善の1つを選択する段階を有する。
一実施形態では、継承された複数の予測パラメータと継承されない複数の予測パラメータとの組み合わせが選択されてよく、かつ、それぞれのビデオブロックを符号化するために用いられてよく、この組み合わせがレート歪みコスト関数を最小化する。
図10は、PPIを用いて、符号化された多重ビューテクスチャおよび深度ビデオ/複数要素を復号する例示的な方法1000のフローチャートである。
1005は、多重ビュービデオにおける多重ビューの第1ビューのテクスチャ要素、その第1ビューの深さ要素、多重ビューにおける第2ビューのテクスチャ要素、およびその第2ビューの深さ要素、のそれぞれの符号化されたビデオブロックを受信する段階を有する。多重ビュービデオは、3D多重ビュービデオであってよい。
1010は、符号化されたビデオブロックのそれぞれがPPI関連するかどうかを決定する段階を有しており、このPPIは、符号化されたビデオブロックのそれぞれが、継承された複数の予測パラメータに基づいて符号化されたことを示す。
1015は、継承された複数の予測パラメータがそれぞれ符号化されたビデオブロックに対して示される場合に、PPIシンタックスで示される他の複数の符号化されたビデオブロックのうちの選択可能な1つから継承された複数の予測パラメータに基づいて、それぞれの符号化されたビデオブロックを復号する段階を有する。
1020は、継承された複数の予測パラメータが示されない場合には、継承されていない複数の予測パラメータに基づいてそれぞれの符号化されたビデオブロックを復号する段階を有する。
複数エンコーダおよび複数デコーダにおけるPPIの複数の実施形態は、以下の1つ又は複数を有し/提供する。
1.3Dビデオコーディックの性能を改善すべく、3Dビデオコーディングへの予測パラメータ継承を実行するメカニズム。
2.具体的なシーケンス/ビュー/スライス/ピクチャ/CU/PU/TUのレベルでPPIを選択的に適用するメカニズム。
3.追加のコーディングモードとして、即ち、PPIコーディングモードとして、PPIを適応的に適用するメカニズム。PPIがシーケンス/ビュー/スライス/ピクチャ/CU/PU/TUへ適用されるべきか否かを信号で伝えるために、シーケンス毎/ビュー毎/スライス毎/ピクチャ毎/CU毎/PU毎/TU毎のフラグを用いることができ、そして、PPIを使用するという決定はレート歪みコスト分析に基づいてなされてよい。
4.PPIを要素間のまたはビュー間の複数方向から、適応的および選択的に適用するメカニズム。この場合、複数の予測パラメータが、要素間のテクスチャの方向またはビュー間のテクスチャ/深度の方向のいずれかから継承されるか、を信号で伝えるために、シーケンス毎/ビュー毎/スライス毎/ピクチャ毎/CU毎/PU毎/TU毎のフラグを用いることができ、PPIを適用するための決定は、レート歪みコスト分析に基づいてなされてよい。
5.独立/従属の深度マップ符号化、および/または従属のテクスチャビデオ符号化を改善するためにPPIを実行するメカニズム。継承の方向は、テクスチャ−深度、および/または、深度−深度、および/または、テクスチャ−テクスチャ、であってよい。
PPIを独立/従属の深度マップの複数ブロックへと適用するためのメカニズムであって、複数の予測パラメータが、同じ場所に位置した複数のテクスチャビデオブロックによって継承される。「同じ場所に位置する」の例は、深度マップに対する現在のブロックの複数の座標およびテクスチャフレームに対するテクスチャブロックの複数の座標が同じ場合である。
従属する複数の深度ブロックへPPIを適用するためのメカニズムであって、複数の予測パラメータは、対応するビュー間の複数の深度ブロックから継承される。対応するビュー間の複数のブロックは、例えばi)深度変換された視差ベクトル、ii)グローバル視差ベクトル、iii)隣接する符号化前の複数ブロックからの選択的視差ベクトル等の、生成された視差ベクトルを用いて取得されうる。ブロックベースでの符号化の結果として、符号化前のビュー間の深度マップにおける視差補償されたブロックは完全なブロックでなくてよく、かつ、それは1より多くの符号化前ブロックと重なり合ってよい。この場合、異なる複数の方法が、対応ブロックを選択するために用いられてよく、例えば、i)対応ブロックとして支配的な重複ブロックが選択され、ii)重複する複数ブロックの全てがテストされ、レート歪みコスト分析に基づいて最適な1つが決定される。
従属する複数のテクスチャブロックへPPIを適用するためのメカニズムであって、複数の予測パラメータは、対応するビュー間の複数のテクスチャブロックから継承される。対応する複数のブロックの導出には、上記したように、生成された視差ベクトルを用いてよい。
6.PPIを適用するためのメカニズムであって、継承される信号のソースである、その複数のサブブロックは、全インター予測/全イントラ予測/ハイブリッド予測を用いて符号化されてよい。例えば、独立した深度マップブロックは、複数の予測パラメータを、その同じ場所に位置するテクスチャビデオブロックから継承してよく、そこでは、a)全サブブロックがイントラ符号化される、b)全サブブロックがインター符号化される、および、c)いくつかのサブブロックがイントラ符号化され、いくつかのサブブロックがインター符号化される。
7.ツリーブロック階層の任意のレベルで、PPIを適用するためのメカニズムである。
PPIモードが符号化ツリーのより高いレベルで示される場合には、継承される信号のために用いられるCUサイズより大きいかまたは同じCUサイズが対応し、PPIモードが符号化ツリーのより低いレベルで示される場合には、継承される信号のために用いられるCUサイズより小さいCUサイズが対応する。
コンピュータシステム
本明細書で開示された複数の方法および複数のシステムは、ハードウェア、ソフトウェア、ファームウェア、およびそれらの組み合わせで実装されてよく、個別および集積回路論理、特定用途向け集積回路(ASIC)論理、および複数のマイクロコントローラを含み、そして、領域特化型集積回路パッケージの一部および/または複数の集積回路パッケージの組み合わせとして実装されてもよい。ソフトウェアは、複数の命令を含んだコンピュータプログラムが符号化されたコンピュータ可読媒体を有してよく、命令に応じて1又は複数の機能をプロセッサに実行させる。コンピュータ可読媒体は、一時的および/または非一時的の媒体を有してよい。プロセッサは、汎用命令プロセッサ、コントローラ、マイクロコントローラ、および/または、他の命令ベースのプロセッサを有してよい。
図11は、上記の1又は複数の例の中で述べたように、エンコーダおよびデコーダにおいてPPIの複数の実施形態を実行するように構成された、コンピュータシステム1100のブロック図である。
コンピュータシステム1100は、1又は複数のコンピュータ命令処理ユニットおよび/またはプロセッサコアを備え、ここではプロセッサ1102として図示され、ここでは複数のコンピュータ可読命令を実行するためのコンピュータプログラムロジックとしても参照される。
コンピュータシステム1100は、ここではメモリ1104として図示されるメモリ、キャッシュ、複数のレジスタ、および/またはストレージを備えてよく、これらはコンピュータプログラムが符号化された非一時的コンピュータ可読媒体を有してよく、ここではコンピュータプログラム1106として図示される、
メモリ1104は、コンピュータプログラム1106を実行する際にプロセッサ1102によって用いられる、および/または、コンピュータプログラム1106の実行中にプロセッサ1102によって生成される、データ1108を有してよい。データ1108は、テクスチャビデオおよび複数の深度マップ要素1108a、複数の予測パラメータ1108b、および符号化された複数の要素1108cを含む多重ビデオを有してよい。
コンピュータプログラム1106は、複数のPPI通信基礎構造命令を含む複数のエンコーダ命令1110を有してよく、上記の1又は複数の例の中で述べたように、PPIを用いてプロセッサ1102に3Dビデオを符号化させる。
コンピュータプログラム1106は、複数のPPI通信基礎構造命令を含む複数のデコーダ命令1112を有してよく、上記の1又は複数の例の中で述べたように、PPIを用いてプロセッサ1102に3Dビデオを復号させる。
複数の実施形態において、複数の符号化実施形態を対象とするシステム1100の複数の要素および複数の復号化の実施形態を対象とする複数の要素は、物理的に別個のデバイスに存在してよく、関連技術における当業者にとっては明らかであるように、例えば、複数の符号化要素は送信側デバイスに存在し、その一方で、複数の復号化要素は受信側デバイスに存在してよい。
複数のデバイスシステム
本明細書で開示される複数の方法および複数のシステムは、例えば図12を参照して後述されるような1又は複数の消費者用システムを含む様々なシステムのうちの1つ又は複数に、実装されてよい。しかしながら、ここで開示される複数の方法および複数のシステムは、図12の例には限定されない。
図12は、ここで記載される、PPIエンコーダおよびデコーダの複数の実施形態が実装されうるシステム1200の一実施形態を例示する。複数の実施形態において、システム1200はメディアシステムであってよいが、システム1200はこの文脈には限定されない。例えば、システム1200は、パーソナルコンピュータ(PC)、ラップトップコンピュータ、ウルトララップトップコンピュータ、タブレット、タッチパッド、ポータブルコンピュータ、ハンドヘルドコンピュータ、パームトップコンピュータ、パーソナルデジタルアシスタント(PDA)、携帯電話、携帯電話/PDAの組み合わせ、テレビ、スマートデバイス(スマートフォン、スマートタブレット、またはスマートテレビ等)、モバイルインターネットデバイス(MID)、メッセージングデバイス、データ通信デバイスなどへ組み込まれてよい。
複数の実施形態において、システム1200は、ディスプレイ1220に結合されたプラットフォーム1202を備える。プラットフォーム1202は、1又は複数のコンテンツサービスデバイス1230などのコンテンツデバイス、1又は複数のコンテンツ配信デバイス1240、または同様のコンテンツソースなどから、コンテンツを受信してよい。1又は複数のナビゲーション機能を備えるナビゲーションコントローラ1250は、例えば、プラットフォーム1202および/またはディスプレイ1220と情報をやりとりするために用いられてよい。これらの要素のそれぞれが、以下でより詳細に記載される。
複数の実施形態において、プラットフォーム1202は、チップセット1205、プロセッサ1210、メモリ1212、ストレージ1214、グラフィクスサブシステム1215、複数のアプリケーション1216および/または無線部1218の任意の組み合わせを有してよい。チップセット1205は、プロセッサ1210、メモリ1212、ストレージ1214、グラフィクスサブシステム1215、複数のアプリケーション1216および/または無線部1218との間での相互通信を提供してよい。例えば、チップセット1205は、ストレージ1214との相互通信を提供可能な記憶アダプタ(不図示)を有してよい。
プロセッサ1210は、複合命令セットコンピュータ(CISC)もしくは縮小命令セットコンピュータ(RISC)の複数プロセッサ、複数のx86命令セット互換プロセッサ、マルチコア、任意の他のマイクロプロセッサ、または中央処理装置(CPU)として実装されてよい。複数の実施形態において、プロセッサ1210は、1又は複数のデュアルコアプロセッサ、および1又は複数のデュアルコアモバイルプロセッサなどを備えてよい。
メモリ1212は、これに限定されるものではないが、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、またはスタティックRAM(SRAM)等の揮発性メモリデバイスとして実装されてよい。
ストレージ1214は、これに限定されるものではないが、例えば磁気ディスクドライブ、光ディスクドライブ、テープドライブ、内部ストレージデバイス、取付型ストレージデバイス、フラッシュメモリ、バッテリバックアップ型のSDRAM(シンクロナスDRAM)、および/または、ネットワークアクセス可能なデバイス等の不揮発性ストレージデバイスとして実装されてよい。複数の実施形態において、ストレージ1214は、例えば、多数のハードドライブが含まれる場合に、デジタルメディア用に保護強化された記憶性能を高めるための技術を備えてよい。
グラフィクスサブシステム1215は、表示のために静止画又は動画等の複数の画像の処理を実行してよい。グラフィクスサブシステム1215は、例えば、グラフィクスプロセッシングユニット(GPU)またはビジュアルプロセッシングユニット(VPU)であってよい。グラフィクスサブシステム1215およびディスプレイ1220を通信可能に結合するために、アナログまたはデジタルのインターフェースが用いられてよい。例えば、このインターフェースは、高精細度マルチメディアインターフェース、ディスプレイポート、ワイヤレスのHDMI(登録商標)、および/または、ワイヤレスHD準拠技術のいずれであってもよい。グラフィクスサブシステム1215は、プロセッサ1210またはチップセット1205へと集積されうる。グラフィクスサブシステム1215は、チップセット1205に通信可能に結合されるスタンドアロンのカードでありうる。
ここで記載されるグラフィクスおよび/またはビデオ処理技術は、様々なハードウェアキテクチャのかたちで実装されてよい。例えば、グラフィクスおよび/または動画機能が、チップセット内に集積されてよい。これに代えて、別々のグラフィクスおよび/またはビデオプロセッサが用いられてもよい。さらに他の実施形態として、複数のグラフィクスおよび/またはビデオ機能が、マルチコアプロセッサを含む、一般的な汎用プロセッサによって実装されてよい。さらなる実施形態では、複数の機能が家電機器のかたちで実装されてよい。
無線部1218は、様々な好適な無線通信技術を用いて複数の信号を送信および受信することが可能な、1又は複数の無線機を有してよい。そうした複数の技術は、1又は複数の無線ネットワークにわたる複数の通信を含んでよい。例示的な複数の無線ネットワークとしては(限定されるものではないが)、複数の無線ローカルエリアネットワーク(WLAN)、複数の無線パーソナルエリアネットワーク(WPAN)、複数のワイヤレス大都市圏ネットワーク(WMAN)、複数のセルラーネットワークおよび複数の衛星ネットワークを含む。そのような複数のネットワークにわたる通信において、無線部1218は、1又は複数の適用し得る任意のバージョンの規格に従って動作してよい。
複数の実施形態において、ディスプレイ1220は、任意のテレビ型のモニタやディスプレイを備えてよい。ディスプレイ1220は、例えば、コンピュータディスプレイスクリーン、タッチスクリーンディスプレイ、ビデオモニタ、テレビ型デバイス、および/またはテレビを備えてよい。ディスプレイ1220は、デジタル式および/またはアナログ式であってよい。複数の実施形態において、ディスプレイ1220は、ホログラフィックディスプレイであってよい。また、ディスプレイ1220は、視覚投影を受信しうる透明な面であってよい。そのような投影では、情報、画像および/またはオブジェクトを様々な形態で伝送してよい。例えば、そのような投影は、モバイル拡張現実(MAR)アプリケーションのための視覚オーバーレイであってよい。1又は複数のソフトウェアアプリケーション1216の制御下で、プラットフォーム1202は、ディスプレイ1220におけるユーザインタフェース1222を表示してよい。
複数の実施形態において、1又は複数のコンテンツサービスデバイス1230は、任意の国内外および/または独立したサービスによって主催されてよく、従って、例えばインターネットを介してプラットフォーム1202にアクセス可能であってよい。1又は複数のコンテンツサービスデバイス1230は、プラットフォーム1202および/またはディスプレイ1220に結合されてよい。プラットフォーム1202および/または1又は複数のコンテンツサービスデバイス1230は、メディア情報をネットワーク1260から/ネットワーク1260へ伝達するために(例えば、送信および/または受信)、ネットワーク1260に結合されてよい。1又は複数のコンテンツ配信デバイス1240は、また、プラットフォーム1202および/またはディスプレイ1220に結合されてよい。
複数の実施形態において、1又は複数のコンテンツサービスデバイス1230は、ケーブルテレビボックス、パーソナルコンピュータ、ネットワーク、電話、デジタル情報および/またはコンテンツを配信可能なインターネット対応デバイスまたは電化製品、および、複数のコンテンツプロバイダとプラットフォーム1202およびディスプレイ1220との間で、ネットワーク1260を介してまたは直接的に、コンテンツを一方向または双方向で通信可能なその他の同様な任意のデバイス、を備えてよい。コンテンツは、ネットワーク1260を介して、一方向および/または双方向で、システム1200における複数要素の任意の1つおよびコンテンツプロバイダへ/から伝達されてよいことが理解されよう。コンテンツの例は、任意のメディア情報を含んでよく、例えば、ビデオ、音楽、医療、ゲーム情報等を備えてよい。
1又は複数のコンテンツサービスデバイス1230はケーブルテレビプログラム等のコンテンツを受信し、メディア情報、デジタル情報および/またはその他のコンテンツを含む。コンテンツプロバイダの例は、任意のケーブルまたは衛星テレビ、ラジオ、インターネットコンテンツプロバイダを備えてよい。提示されたこれらの例は、本発明の実施形態を限定するものではない。
複数の実施形態において、プラットフォーム1202は、1又は複数のナビゲーション機能を有するナビゲーションコントローラ1250から複数の制御信号を受信してよい。コントローラ1250のナビゲーション機能は、例えば、ユーザインタフェース1222と情報をやりとりするために用いられてよい。複数の実施形態において、ナビゲーションコントローラ1250はポインティングデバイスであってよく、このデバイスはコンピュータハードウェア構成要素(具体的には、ヒューマンインターフェースデバイス)であってよく、ユーザに空間(連続する多次元の)データをコンピュータへ入力させることを許容する。グラフィカルユーザインタフェース(GUI)、テレビ、およびモニタ等の多くのシステムが、物理的ジェスチャを用いて、ユーザにデータを制御させ、コンピュータやテレビへ提供させることができる。
コントローラ1250のナビゲーション機能の動きは、ディスプレイ上に表示されるポインタ、カーソル、焦点リング、またはその他の視覚的なインジケータの動きによって、ディスプレイ(例えば、ディスプレイ1220)上においてそのまま繰り返されてよい。例えば、ソフトウェアアプリケーション1216の制御のもとで、ナビゲーションコントローラ1250に位置する複数のナビゲーション機能が、例えば、ユーザインタフェース1222上に表示される複数の仮想的なナビゲーション機能へとマッピングされてよい。複数の実施形態において、コントローラ1250は、別個の要素ではなく、プラットフォーム1202および/またはディスプレイ1220へ集積されてよい。しかしながら、実施形態は、これら複数の要素に、あるいはここで示されまたは記載された文脈において、限定されない。
複数の実施形態において、複数のドライバ(不図示)は、例えば、機能が有効化された場合、初期ブートアップ後にボタンに触れることでそうなるテレビのように、ユーザにプラットフォーム1202をただちにオン・オフ可能とさせる技術を備えてよい。プラットフォームが"オフ"にされた場合に、プログラムロジックは、プラットフォーム1202に、複数のメディアアダプター、他の1又は複数のコンテンツサービスデバイス1230、または1又は複数のコンテンツ配信デバイス1240へ、コンテンツをストリーム配信させることを許容してよい。加えてチップセット1205は、例えば、5.1サラウンドおよび/または高品質の12.1サラウンドをサポートするハードウェアおよび/またはソフトウェアを備えてよい。複数のドライバは、集中画像表示プラットフォームのためのグラフィクスドライバを有してよい。複数の実施形態において、グラフィクスドライバは、ペリフェラルコンポーネントインターコネクト(PCI)エクスプレスグラフィクスカードを備えてよい。
様々な実施形態において、システム1200において示された複数の要素の1つ又は複数のいずれが統合化されてもよい。例えば、プラットフォーム1202と1又は複数のコンテンツサービスデバイス1230とが統合されてよく、プラットフォーム1202と1又は複数のコンテンツ配信デバイス1240が統合化されてよく、例えば、プラットフォーム1202と1又は複数のコンテンツサービスデバイス1230と1又は複数のコンテンツ配信デバイス1240とが統合化されてもよい。様々な実施形態において、プラットフォーム1202とディスプレイ1220とは、統合化されたユニットであってよい。例えば、ディスプレイ1220と1又は複数のコンテンツサービスデバイス1230が統合化されてよく、ディスプレイ1220と1又は複数のコンテンツ配信デバイス1240が統合化されてよい。これらの複数の例は、本発明を限定するものではない。
様々な実施形態において、システム1200は、無線システム、有線システム、または両方の組み合わせとして実装されてよい。無線システムとして実装された場合、システム1200は、例えば、1又は複数のアンテナ、送信機、受信機、トランシーバ、アンプ、フィルタ、制御ロジック等の、無線共有媒体で通信するのに好適な複数コンポーネントおよび複数インターフェースを備えてよい。無線共有媒体の一例として、RFスペクトル等の無線スペクトルの部分を有してよい。有線システムとして実装された場合、システム1200は、入出力(I/O)アダプタ、I/Oアダプタを対応する有線通信媒体と接続するための物理コネクタ、ネットワークインタフェースカード(NIC)、ディスクコントローラ、ビデオコントローラ、オーディオコントローラ等の有線通信媒体で通信するのに好適な複数コンポーネントおよび複数インターフェースを備えてよい。有線通信媒体の例は、ワイヤ、ケーブル、金属リード線、プリント回路基板(PCB)、バックプレーン、スイッチファブリック、半導体材料、ツイストペアワイヤ、同軸ケーブル、光ファイバ等を有してよい。
プラットフォーム1202は、情報を伝達するために、1又は複数の論理チャネル又は物理チャネルを確立してよい。この情報は、メディア情報および制御情報を含んでよい。メディア情報は、ユーザ向けのコンテンツを表す任意のデータを参照してよい。コンテンツの例は、例えば、音声会話、ビデオ会議、ストリーミングビデオ、電子通信メールメッセージ(電子メール)、ボイスメールメッセージ、英数字記号、グラフィクス、画像、ビデオ、テキスト等からのデータを有してよい。音声会話からのデータは、例えば、音声情報、沈黙時間、背景雑音、快適雑音、トーン等であってよい。制御情報は、自動化されたシステム向けの、コマンド、命令、制御単語を表す任意のデータを参照してよい。例えば、制御情報は、メディア情報をシステムを介して送信するために、または、所定のやり方でメディア情報を処理させるようノードに指示するために用いられてよい。しかしながら、実施形態は、これら複数の要素に、あるいは図12で示されまたは記載された文脈において、限定されない。
上述のように、システム1200は、物理的な様式やフォームファクターを変化させながら実装されてよい。
図13は、システム1200が実装されてよい小型フォームファクタデバイス1300の複数の実施形態を示す。複数の実施形態において、例えばデバイス1300は、無線機能を備えるモバイルコンピューティングデバイスとして実装されてよい。モバイルコンピューティングデバイスは、プロセッシングシステムおよび、例えば1又は複数のバッテリ等の電源を備える任意のデバイスを参照してよい。
上述のように、モバイルコンピューティングデバイスの例は、パーソナルコンピュータ(PC),ラップトップコンピュータ、ウルトララップトップコンピュータ、タブレット、タッチパッド、ポータブルコンピュータ、ハンドヘルドコンピュータ、パームトップコンピュータ、パーソナルデジタルアシスタント(PDA)、携帯電話、携帯電話/PDAの組み合わせ、テレビ、スマートデバイス(スマートフォン、スマートタブレット、またはスマートテレビなど),モバイルインターネットデバイス(MID)、メッセージングデバイス、データ通信デバイス等を含んでよい。
モバイルコンピューティングデバイスの例は、また、人の身に着けられるよう構成された複数のコンピュータを有してよく、例えば、リストコンピュータ、フィンガーコンピュータ、リングコンピュータ、アイグラスコンピュータ、ベルトクリップコンピュータ、アームバンドコンピュータ、靴コンピュータ、衣服コンピュータ、その他の身に着けることが可能なコンピュータ等である。複数の実施形態において、例えば、モバイルコンピューティングデバイスは、音声通信および/またはデータ通信だけでなくコンピュータアプリケーションを実行することが可能なスマートフォンとして実装されてよい。例を挙げる目的で、幾つかの実施形態が、スマートフォンとして実装されたモバイルコンピューティングデバイスと共に説明されるかもしれないが、他の実施形態が、他の無線モバイルモバイルコンピューティングデバイスを同様に用いて実装されうることは当然であってよい。複数の実施形態は、この文脈において、限定されない。
図13に示されるように、デバイス1300は、ハウジング1302、ディスプレイ1304、入力/出力(I/O)デバイス1306およびアンテナ1308を備える。デバイス1300はまた、ナビゲーション機能1312を備えてよい。ディスプレイ1304は、モバイルコンピューティングデバイスに対して適切な情報を表示させるための任意の好適なディスプレイユニットを備えてよい。I/Oデバイス1306は、モバイルコンピューティングデバイスに情報を入力するための任意の好適なI/Oデバイスを備えてよい。I/Oデバイス1306の例は、英数字キーボード、テンキーパッド、タッチパッド、入力キー、ボタン、スイッチ、ロッカースイッチ、マイク、スピーカ、音声認識デバイス、ソフトウェア等を含んでよい。情報は、また、マイクを用いてデバイス1300入力されてよい。そのような情報は、音声認識デバイスによってデジタル化されてよい。複数の実施形態は、この文脈において、限定されない。
複数のハードウェア要素、複数のソフトウェア要素、または両方の組み合わせを用いて、様々な実施形態が実装されてよい。複数のハードウェア要素の例は、プロセッサ、マイクロプロセッサ、回路、回路素子(例えばトランジスタ、抵抗、キャパシタ、インダクタ等)、集積回路、特定用途向け集積回路(ASIC)、プログラム式論理デバイス(PLD)、デジタルシグナルプロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、論理ゲート、レジスタ、半導体デバイス、チップ、マイクロチップ、チップセット等、を含んでよい。複数のソフトウェアの例は、ソフトウェアコンポーネント、プログラム、アプリケーション、コンピュータプログラム、アプリケーションプログラム、システムプログラム、機械プログラム、オペレーティングシステムソフトウェア、ミドルウェア、ファームウェア、ソフトウェアモジュール、ルーチン、サブルーチン、ファンクション、メソッド、プロシージャ、ソフトウェアインターフェース、アプリケーション・プログラム・インターフェース(API)、命令セット、演算コード、コンピュータコード、コードセグメント、コンピュータ・コード・セグメント、ワード、値、記号、またはこれらの任意の組み合わせを含んでよい。ある実施形態がハードウェア要素および/またはソフトウェア要素を用いて実装されるか否かを決定することは、望ましい演算レート、電力レベル、耐熱性、処理サイクルバジェット、入力データレート、出力データレート、メモリリソース、データバススピード、およびその他の設計上または性能上の制約などの要因の任意の数によって異なってよい。
ここでは、複数の機能、複数の特徴、およびそれらの複数の関係性を例示する複数の機能的な構成要素単位の助けをかりて、複数の方法および複数のシステムが開示される。これらの機能的な構成要素ブロックにおける複数の境界の少なくともいくつかは、ここでは説明の便宜上、任意に定義された。特定された複数の機能およびその関係性は適切に実行される限り、複数の代替的な境界が規定されてよい。
様々なコンピュータプログラム製品、装置、および方法の実施形態が、ここで開示される。
一実施形態では、コンピュータプログラムが符号化された非一時的コンピュータ可読媒体を有し、コンピュータ可読媒体は、
多重ビュービデオの多重ビューにおける第1ビューのテクスチャ要素、前記第1ビューの深さ要素、前記多重ビューにおける第2ビューのテクスチャ要素、および前記第2ビューの深さ要素、のそれぞれからビデオブロックをプロセッサに符号化させる複数の命令を備え、
前記プロセッサに各ビデオブロックを符号化させる前記複数の命令は、他の複数のビデオブロックのうちの選択可能な1つから継承された複数の予測パラメータおよび前記他の複数のビデオブロックのうちの1つから継承されない複数の予測パラメータ、のうちの選択可能な1つに基づいて、それぞれの前記ビデオブロックを前記プロセッサに符号化させる複数の命令を有する。
前記多重ビュービデオは、3次元(3D)の多重ビュービデオである、
前記他の複数のブロックのうちの1つから継承された複数の予測パラメータに基づいて、前記各ビデオブロックを前記プロセッサに符号化させる前記複数の命令は、前記プロセッサに、
前記第1ビューの前記テクスチャ要素および前記深さ要素のうちの1つにおける前記各ビデオブロックを、前記第1ビューの前記テクスチャ要素および前記深さ要素のうちの他の1つにおける前記他の複数のビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて符号化させ、
前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記1つにおける前記各ビデオブロックを、前記第1ビューの前記テクスチャ要素、前記第1ビューの前記深さ要素、および前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つにおける前記他の複数のビデオブロックの選択可能な1つから継承された複数の予測パラメータに基づいて符号化させる、複数の命令、を有する。
前記継承された複数の予測パラメータは、
前記他の複数のビデオブロックのうちの前記1つが、複数のインター予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインター予測モードを有し、
前記他の複数のビデオブロックのうちの前記1つが、複数のイントラ予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のイントラ予測モードを有し、
前記他の複数のビデオブロックのうちの前記1つがインターおよびイントラモードの組み合わせに基づいて符号化された複数の符号化ブロックを有する場合には、複数のインターおよびイントラ予測モードの組み合わせを有する。
前記符号化するための複数の命令は、前記他の複数のビデオブロックのうちの1つから継承された複数の予測パラメータに基づいて、前記各ビデオブロックへの複数の命令を有し、
前記継承された複数の予測パラメータは、複数のビデオブロックを、複数の符号化ユニット(CU)、複数の予測ユニット(PU)、前記複数のPUの複数のサイズ、および、前記複数のPUを符号化するために用いられるインターおよびイントラ予測モードへと分割する四分木構造を有する。
前記継承された複数の予測パラメータは、更に、動き、動きベクトル、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、および複数のクロマ・イントラモードのうちの少なくとも2またはそれより多くを、さらに含む。
前記プロセッサに、
継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化するかどうかを決定させ、
継承された複数の予測パラメータに基づいて符号化されることが決定された場合には、前記継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化させ、
継承された複数の予測パラメータに基づいて符号化されないことが決定された場合には、継承されない複数の予測パラメータに基づいて前記各ビデオブロックを符号化させる、複数の命令を更に備えてよい。
複数の命令は、さらに前記プロセッサに、
前記多重ビューのそれぞれにおいて、前記テクスチャ要素および前記深さ要素について複数の符号化されたビデオブロックを備えた符号化されたビットストリームを生成させ、
継承された複数の予測パラメータに基づいて符号化された複数の符号化されたビデオブロックのそれぞれと関連する予測パラメータ継承(PPI)シンタックスを前記符号化されたビットストリームへと埋め込みさせてよく、
前記PPIシンタックスは、
前記符号化されたビデオブロックが、継承された複数の予測パラメータに基づいて符号化されたことを示すPPIフラグと、
前記複数の予測パラメータが継承された前記他の複数のビデオブロックのうちの前記1つが、そこから決定される情報と、
前記継承された複数の予測パラメータと、を有する。
多重ビュービデオの多重ビューにおける第1ビューのテクスチャ要素、前記第1ビューの深さ要素、前記多重ビューにおける第2ビューのテクスチャ要素、および前記第2ビューの深さ要素のそれぞれからビデオブロックを符号化するエンコーダ
を備え、
前記エンコーダは、他の複数のビデオブロックのうちの選択可能な1つから継承された複数の予測パラメータおよび前記他の複数のビデオブロックのうちの1つから継承されない複数の予測パラメータ、のうちの選択可能な1つに基づいて、前記各ビデオブロックを符号化するように構成される、装置の実施形態。
前記多重ビュービデオは、3次元(3D)の多重ビュービデオであってよい。
前記エンコーダは、
前記第1ビューの前記テクスチャ要素および深さ要素のうちの1つにおける前記各ビデオブロックを、前記第1ビューの前記テクスチャ要素および深さ要素のうちの他の1つにおける前記他の複数のビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて符号化し、
前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記1つにおける前記各ビデオブロックを、
前記第1ビューの前記テクスチャ要素、
前記第1ビューの前記深さ要素、および
前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つにおける前記他の複数のビデオブロックの選択可能な1つから継承された複数の予測パラメータに基づいて符号化するように構成されてよい。
前記エンコーダは、前記他の複数のビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化するように構成されてよく、
前記継承された複数の予測パラメータは、
前記他の複数のビデオブロックのうちの前記1つが、複数のインター予測モードに基づいて前記エンコーダにより符号化された複数の符号化ブロックを有する場合には、前記複数のインター予測モードを有し、
前記他の複数のビデオブロックのうちの前記1つが、複数のイントラ予測モードに基づいて前記エンコーダにより符号化された複数の符号化ブロックを有する場合には、前記複数のイントラ予測モードを有し、
前記他の複数のビデオブロックのうちの前記1つがインターおよびイントラモードの組み合わせに基づいて前記エンコーダにより符号化された複数の符号化ブロックを有する場合には、前記複数のインターおよびイントラ予測モードの組み合わせを有する。
前記エンコーダは、
前記他の複数のビデオブロックのうちの1つから継承された複数の予測パラメータに基づいて、前記各ビデオブロックを符号化するように構成されてよく、
前記継承された複数の予測パラメータは、複数のビデオブロックを、複数の符号化ユニット(CU)、複数の予測ユニット(PU)、前記複数のPUの複数のサイズ、および、前記複数のPUを符号化するために用いられるインターおよびイントラ予測モードへと分割する四分木構造を有する。
前記継承された複数の予測パラメータは、さらに、動き、動きベクトル、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、および複数のクロマ・イントラモードのうちの少なくとも2またはそれより多くを、更に含んでよい。
前記エンコーダは、
継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化するかどうかを決定し、
継承された複数の予測パラメータに基づいて符号化されることが決定された場合には、前記継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化し、
継承された複数の予測パラメータに基づいて符号化されないことが決定された場合には、継承されない複数の予測パラメータに基づいて前記各ビデオブロックを符号化するように、さらに構成されてよい。
前記エンコーダは、
前記多重ビューのそれぞれにおいて、前記テクスチャ要素および前記深さ要素について複数の符号化されたビデオブロックを備えた符号化されたビットストリームを生成し、
継承された複数の予測パラメータに基づいて符号化された複数の符号化されたビデオブロックのそれぞれと関連する予測パラメータ継承(PPI)シンタックスを前記符号化されたビットストリームへと埋め込むようにさらに構成されてよく、
前記PPIシンタックスは、
前記符号化されたビデオブロックが、継承された複数の予測パラメータに基づいて符号化されたことを示すPPIフラグと、
前記複数の予測パラメータが継承された前記他の複数のビデオブロックのうちの前記1つが、そこから決定される情報と、
前記継承された複数の予測パラメータと、を有する。
上記装置は、さらに、
通信ネットワークと通信する複数の通信コンポーネント、
ユーザインタフェース、
前記複数の通信コンポーネントおよび前記ユーザインタフェースと通信するプロセッサおよびメモリ、
前記エンコーダ、前記プロセッサおよびメモリ、前記複数の通信コンポーネント、および、前記ユーザインタフェースを収容するハウジング、を備えてよい。
方法の実施形態は、
多重ビュービデオの多重ビューにおける第1ビューのテクスチャ要素、前記第1ビューの深さ要素、前記多重ビューにおける第2ビューのテクスチャ要素、および前記第2ビューの深さ要素のそれぞれからビデオブロックを符号化する段階、を備え、
前記各ビデオブロックを符号化する段階は、他の複数のビデオブロックのうちの選択可能な1つから継承された複数の予測パラメータおよび前記他の複数のビデオブロックのうちの1つから継承されない複数の予測パラメータ、のうちの選択可能な1つに基づいて、前記各ビデオブロックを符号化する段階を有する。
前記多重ビュービデオは、3次元(3D)の多重ビュービデオであってよい。
前記各ビデオブロックを符号化する段階は、
前記第1ビューの前記テクスチャ要素および深さ要素のうちの1つにおける前記各ビデオブロックを、前記第1ビューの前記テクスチャ要素および深さ要素のうちの他の1つにおける前記他の複数のビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて符号化する段階、および
前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記1つにおける前記各ビデオブロックを、
前記第1ビューの前記テクスチャ要素、
前記第1ビューの前記深さ要素、および
前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つにおける前記他の複数のビデオブロックの選択可能な1つから継承された複数の予測パラメータに基づいて符号化する段階、を有してよい。
前記符号化する段階は、前記他の複数のビデオブロックのうちの1つから継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化する段階を有してよく、
前記継承された複数の予測パラメータは、
前記他の複数のビデオブロックのうちの前記1つが、複数のインター予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインター予測モードを有し、
前記他の複数のビデオブロックのうちの前記1つが、複数のイントラ予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のイントラ予測モードを有し、
前記他の複数のビデオブロックのうちの前記1つがインターおよびイントラモードの組み合わせに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインターおよびイントラ予測モードの組み合わせを有する。
前記符号化する段階は、前記他の複数のビデオブロックのうちの1つから継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化する段階を有してよく、
前記継承された複数の予測パラメータは、複数のビデオブロックを、複数の符号化ユニット(CU)、複数の予測ユニット(PU)、前記複数のPUの複数のサイズ、および、前記複数のPUを符号化するために用いられるインターおよびイントラ予測モードへと分割する四分木構造を有する。
前記継承された複数の予測パラメータは、動き、動きベクトル、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、および複数のクロマ・イントラモードのうちの少なくとも2またはそれより多くを、さらに含んでよい。
上記方法は、前記各ビデオブロックを符号化するに先立って、
継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化するかどうかを決定する段階と、
継承された複数の予測パラメータに基づいて符号化されることが決定された場合には、前記継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化する段階と、
継承された複数の予測パラメータに基づいて符号化されないことが決定された場合には、継承されない複数の予測パラメータに基づいて前記各ビデオブロックを符号化する段階と、
を更に備えてよい。
上記方法はさらに、
前記多重ビューのそれぞれにおいて、前記テクスチャ要素および前記深さ要素について複数の符号化されたビデオブロックを備えた符号化されたビットストリームを生成する段階と、
継承された複数の予測パラメータに基づいて符号化された複数の符号化されたビデオブロックのそれぞれと関連する予測パラメータ継承(PPI)シンタックスを前記符号化されたビットストリームへと埋め込みさせる段階と、を備えてよく、
前記PPIシンタックスは、
前記符号化されたビデオブロックが、継承された複数の予測パラメータに基づいて符号化されたことを示すPPIフラグと、
前記複数の予測パラメータが継承された前記他の複数のビデオブロックのうちの前記1つが、そこから決定される情報と、
前記継承された複数の予測パラメータと、を有する。
他の実施形態は、コンピュータプログラムが符号化された非一時的コンピュータ可読媒体を備え、コンピュータ可読媒体は、プロセッサに、
多重ビュービデオの多重ビューにおける第1ビューのテクスチャ要素、前記第1ビューの深さ要素、前記多重ビューにおける第2ビューのテクスチャ要素、および前記第2ビューの深さ要素、のそれぞれから符号化されたビデオブロックを受信させ、
符号化されたビデオブロックのそれぞれが、前記符号化されたビデオブロックのそれぞれが継承された複数の予測パラメータに基づいて符号化されたことを示す予測パラメータ継承(PPI)シンタックスと関連するかどうかを決定させ、
継承された複数の予測パラメータが前記各符号化されたビデオブロックに対して示される場合には、前記PPIシンタックスにおいて示される前記他の複数の符号化されたビデオブロックのうちの選択可能な1つから継承された複数の予測パラメータに基づいて、前記各符号化されたビデオブロックを復号させる、複数の命令を有する。
前記多重ビュービデオは、3次元(3D)の多重ビュービデオを備えてよい。
前記プロセッサに復号させる上記複数の命令は、前記プロセッサに、
前記第1ビューの前記テクスチャ要素および深さ要素のうちの1つにおける前記各符号化されたビデオブロックを、前記第1ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つにおける前記他の複数の符号化されたビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて復号させ、かつ、
前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記1つにおける前記各符号化されたビデオブロックを、前記第1ビューの前記テクスチャ要素、前記第1ビューの前記深さ要素、および前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つにおける前記他の複数の符号化されたビデオブロックの選択可能な1つから継承された複数の予測パラメータに基づいて復号させる、複数の命令を有してよい。
前記継承された複数の予測パラメータは、
前記他の複数の符号化されたビデオブロックのうちの前記1つが、複数のインター予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインター予測モードを有してよく、
前記他の複数の符号化されたビデオブロックのうちの前記1つが、複数のイントラ予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のイントラ予測モードを有し、
前記他の複数の符号化されたビデオブロックのうちの前記1つが、インターおよびイントラモードの組み合わせに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインターおよびイントラ予測モードの組み合わせを有する。
前記継承された複数の予測パラメータは、複数の符号化されたビデオブロックを、複数の符号化ユニット(CU)、複数の予測ユニット(PU)、前記複数のPUについての複数のサイズ、および、前記複数のPUを符号化するために用いられるインターおよびイントラ予測モードへと分割する四分木構造を有してよい。
前記継承された複数の予測パラメータは、さらに、動き、動きベクトル、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、および複数のクロマ・イントラモードのうちの少なくとも2またはそれより多くを含んでよい。
前記プロセッサに復号させる前記複数の命令は、前記プロセッサに、
前記複数の予測パラメータが、前記各符号化されたビデオブロックのビューとは異なる、前記多重ビューのうちの前記複数のビューの1つについて符号化されたビデオブロックから継承されたものであることを前記PPIシンタックスが示す場合に、生成された視差ベクトルに基づいて前記他の複数の符号化されたビデオブロックの前記1つを特定させる複数の命令、を有してよい。
前記復号のための命令は、さらに、前記プロセッサに、継承された複数の予測パラメータが示されない場合に、継承されていない複数の予測パラメータに基づいて前記各符号化されたビデオブロックを復号させる複数の命令、を有してよい。
装置の実施形態は、
多重ビュービデオの多重ビューにおける第1ビューのテクスチャ要素、前記第1ビューの深さ要素、前記多重ビューにおける第2ビューのテクスチャ要素、および前記第2ビューの深さ要素、のそれぞれから符号化されたビデオブロックを受信し、
符号化されたビデオブロックのそれぞれが、前記各符号化されたビデオブロックが継承された複数の予測パラメータに基づいて符号化されたことを示す予測パラメータ継承(PPI)シンタックスと関連するかどうかを決定し、
継承された複数の予測パラメータが前記各符号化されたビデオブロックに対して示される場合には、前記PPIシンタックスにおいて示される前記他の複数の符号化されたビデオブロックのうちの選択可能な1つから継承された複数の予測パラメータに基づいて、前記各符号化されたビデオブロックを復号するように構成されるデコーダを備える。
前記デコーダは、
前記第1ビューの前記テクスチャ要素および深さ要素のうちの1つにおける前記各符号化されたビデオブロックを、前記第1ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つにおける前記他の複数の符号化されたビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて復号し、
前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記1つにおける前記各符号化されたビデオブロックを、前記第1ビューの前記テクスチャ要素、前記第1ビューの前記深さ要素、および前記第2ビューの前記テクスチャおよぶ深さ要素のうちの前記他の1つにおける前記他の複数の符号化されたビデオブロックの選択可能な1つから継承された複数の予測パラメータに基づいて復号するように構成されてよい。
前記継承された複数の予測パラメータは、
前記他の複数の符号化されたビデオブロックのうちの前記1つが、複数のインター予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインター予測モードを有し、
前記他の複数の符号化されたビデオブロックのうちの前記1つが、複数のイントラ予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のイントラ予測モードを有し、
前記他の複数の符号化されたビデオブロックのうちの前記1つが、インターおよびイントラモードの組み合わせに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインターおよびイントラ予測モードの組み合わせを有してよい。
前記継承された複数の予測パラメータは、複数の符号化されたビデオブロックを、複数の符号化ユニット(CU)、複数の予測ユニット(PU)、前記複数のPUの複数のサイズ、および、前記複数のPUを符号化するために用いられるインターおよびイントラ予測モードへと分割する四分木構造を有してよい。
前記継承された複数の予測パラメータは、さらに、動き、動きベクトル、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、および複数のクロマ・イントラモードのうちの少なくとも2またはそれより多くを含んでよい。
前記デコーダは、
前記複数の予測パラメータが、前記各符号化されたビデオブロックのビューとは異なる、前記多重ビューのうちの前記複数のビューの1つについて符号化されたビデオブロックから継承されたものであることを前記PPIシンタックスが示す場合に、生成された視差ベクトルに基づいて前記他の複数の符号化されたビデオブロックの前記1つを特定させるようにさらに構成されてよい。
前記デコーダは、更に、
継承された複数の予測パラメータが示されない場合に、継承されていない複数の予測パラメータに基づいて前記各符号化されたビデオブロックを復号するようにさらに構成されてよい。
上記装置は、さらに、
通信ネットワークと通信する複数の通信コンポーネント、
ユーザインタフェース、
前記複数の通信コンポーネントおよび前記ユーザインタフェースと通信するプロセッサおよびメモリ、
前記デコーダ、前記プロセッサおよびメモリ、前記複数の通信コンポーネント、および、前記ユーザインタフェースを収容するハウジング、を備えてよい。
方法の実施形態は、
多重ビュービデオの多重ビューにおける第1ビューのテクスチャ要素、前記第1ビューの深さ要素、前記多重ビューにおける第2ビューのテクスチャ要素、および前記第2ビューの深さ要素、のそれぞれから符号化されたビデオブロックを受信する段階、
符号化されたビデオブロックのそれぞれが、継承された複数の予測パラメータに基づいて前記各符号化されたビデオブロックが符号化されたことを示す予測パラメータ継承(PPI)シンタックスと関連するかどうかを決定する段階、
継承された複数の予測パラメータが前記各符号化されたビデオブロックに対して示される場合には、前記PPIシンタックスにおいて示される前記他の複数の符号化されたビデオブロックのうちの選択可能な1つから継承された複数の予測パラメータに基づいて、前記各符号化されたビデオブロックを復号する段階、を備える。
前記復号する段階は、
前記第1ビューの前記テクスチャ要素および深さ要素のうちの1つにおける前記各符号化されたビデオブロックを、前記第1ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つからの前記他の複数の符号化されたビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて復号する段階と、
前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記1つにおける前記各符号化されたビデオブロックを、前記第1ビューの前記テクスチャ要素、前記第1ビューの前記深さ要素、および前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つ、における前記他の複数の符号化されたビデオブロックの選択可能な1つから継承された複数の予測パラメータに基づいて復号する段階と、を有してよい。
前記継承された複数の予測パラメータは、
前記他の複数の符号化されたビデオブロックのうちの前記1つが、複数のインター予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインター予測モードを有し、
前記他の複数の符号化されたビデオブロックのうちの前記1つが、複数のイントラ予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のイントラ予測モードを有し、
前記他の複数の符号化されたビデオブロックのうちの前記1つが、インターおよびイントラモードの組み合わせに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインターおよびイントラ予測モードの組み合わせを有してよい。
前記継承された複数の予測パラメータは、複数の符号化されたビデオブロックを、複数の符号化ユニット(CU)、複数の予測ユニット(PU)、前記複数のPUの複数のサイズ、および、前記複数のPUを符号化するために用いられるインターおよびイントラ予測モードへと分割する四分木構造を有してよい。
前記継承された複数の予測パラメータは、さらに、動き、動きベクトル、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、および複数のクロマ・イントラモードのうちの少なくとも2またはそれより多くを、含んでよい。
前記復号する段階は、
前記複数の予測パラメータが、前記各符号化されたビデオブロックのビューとは異なる、前記多重ビューのうちの前記複数ビューの1つについて符号化されたビデオブロックから継承されたものであることを前記PPIシンタックスが示す場合に、生成された視差ベクトルに基づいて前記他の複数の符号化されたビデオブロックの前記1つを特定する段階を有してよい。
上記方法は、さらに、継承された複数の予測パラメータが示されない場合に、継承されていない複数の予測パラメータに基づいて前記各符号化されたビデオブロックを復号する段階を備えてよい。
ここでは様々な実施形態が開示されるが、これらは例として提示されただけであり、限定としてではないことが理解されるべきである。関連技術の当業者には、ここで開示された複数の方法及び複数のシステムの精神および範囲から逸脱することなく、形および詳細について様々な変更がなされうることが、明らかであろう。従って、請求項の幅および範囲は、本明細書で開示された複数の例のいずれによっても限定されるべきではない。

Claims (50)

  1. コンピュータプログラムが符号化された非一時的コンピュータ可読媒体であって、
    多重ビュービデオの多重ビューにおける第1ビューのテクスチャ要素、前記第1ビューの深さ要素、前記多重ビューにおける第2ビューのテクスチャ要素、および前記第2ビューの深さ要素、のそれぞれからビデオブロックをプロセッサに符号化させる複数の命令を備え、
    前記プロセッサに各ビデオブロックを符号化させる前記複数の命令は、他の複数のビデオブロックのうちの選択可能な1つから継承された複数の予測パラメータおよび前記他の複数のビデオブロックのうちの1つから継承されない複数の予測パラメータ、のうちの選択可能な1つに基づいて、前記各ビデオブロックを前記プロセッサに符号化させる複数の命令を有する、コンピュータ可読媒体。
  2. 前記多重ビュービデオは、3次元(3D)の多重ビュービデオである、請求項1に記載のコンピュータ可読媒体。
  3. 前記他の複数のブロックのうちの1つから継承された複数の予測パラメータに基づいて、前記各ビデオブロックを前記プロセッサに符号化させる前記複数の命令は、前記プロセッサに、
    前記第1ビューの前記テクスチャ要素および深さ要素のうちの1つにおける前記各ビデオブロックを、前記第1ビューの前記テクスチャ要素および深さ要素のうちの他の1つにおける前記他の複数のビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて符号化させ、かつ、
    前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記1つにおける前記各ビデオブロックを、
    前記第1ビューの前記テクスチャ要素、
    前記第1ビューの前記深さ要素、および
    前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つ、における前記他の複数のビデオブロックの選択可能な1つから継承された複数の予測パラメータに基づいて符号化させる、複数の命令を有する、請求項1に記載のコンピュータ可読媒体。
  4. 符号化するための前記複数の命令は、
    前記他の複数のブロックのうちの1つから継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化するための命令を有し、
    前記継承された複数の予測パラメータは、
    前記他の複数のビデオブロックのうちの前記1つが、複数のインター予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインター予測モードを有し、
    前記他の複数のビデオブロックのうちの前記1つが、複数のイントラ予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のイントラ予測モードを有し、
    前記他の複数のビデオブロックのうちの前記1つがインターおよびイントラモードの組み合わせに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインターおよびイントラ予測モードの組み合わせを有する、請求項1に記載のコンピュータ可読媒体。
  5. 前記符号化するための複数の命令は、前記他の複数のビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて、前記各ビデオブロックへの複数の命令を有し、
    前記継承された複数の予測パラメータは、複数のビデオブロックを、複数の符号化ユニット(CU)、複数の予測ユニット(PU)、前記複数のPUの複数のサイズ、および、前記複数のPUを符号化するために用いられるインターおよびイントラ予測モードへと分割する四分木構造を有する、請求項1に記載のコンピュータ可読媒体。
  6. 前記継承された複数の予測パラメータは、さらに、動き、動きベクトル、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、および複数のクロマ・イントラモードのうちの少なくとも2またはそれより多くを、含む、請求項5に記載のコンピュータ可読媒体。
  7. 前記プロセッサに、
    継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化するかどうかを決定させ、
    継承された複数の予測パラメータに基づいて符号化されることが決定された場合には、前記継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化させ、
    継承された複数の予測パラメータに基づいて符号化されないことが決定された場合には、継承されない複数の予測パラメータに基づいて前記各ビデオブロックを符号化させる、複数の命令を更に備える、請求項に1に記載のコンピュータ可読媒体。
  8. 前記プロセッサに、
    前記多重ビューのそれぞれにおいて、前記テクスチャ要素および前記深さ要素について複数の符号化されたビデオブロックを備えた符号化されたビットストリームを生成させ、
    継承された複数の予測パラメータに基づいて符号化された複数の符号化されたビデオブロックのそれぞれと関連する予測パラメータ継承(PPI)シンタックスを前記符号化されたビットストリームへと埋め込みさせる複数の命令を更に備え、
    前記PPIシンタックスは、
    前記符号化されたビデオブロックが、継承された複数の予測パラメータに基づいて符号化されたことを示すPPIフラグと、
    前記複数の予測パラメータが継承された前記他の複数のビデオブロックのうちの前記1つが、そこから決定される情報と、
    前記継承された複数の予測パラメータと、を有する、請求項1に記載のコンピュータ可読媒体。
  9. 多重ビュービデオの多重ビューにおける第1ビューのテクスチャ要素、前記第1ビューの深さ要素、前記多重ビューにおける第2ビューのテクスチャ要素、および前記第2ビューの深さ要素のそれぞれからビデオブロックを符号化するエンコーダ
    を備え、
    前記エンコーダは、他の複数のビデオブロックのうちの選択可能な1つから継承された複数の予測パラメータおよび前記他の複数のビデオブロックのうちの1つから継承されない複数の予測パラメータ、のうちの選択可能な1つに基づいて、各ビデオブロックを符号化するように構成される、装置。
  10. 前記多重ビュービデオは、3次元(3D)の多重ビュービデオである、請求項9に記載の装置。
  11. 前記エンコーダは、
    前記第1ビューの前記テクスチャ要素および深さ要素のうちの1つにおける前記各ビデオブロックを、前記第1ビューの前記テクスチャ要素および深さ要素のうちの他の1つにおける前記他の複数のビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて符号化し、
    前記第2ビューの前記テクスチャ要素および深さ要素の前記1つからの前記各ビデオブロックを、
    前記第1ビューの前記テクスチャ要素、
    前記第1ビューの前記深さ要素、および
    前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つ、における前記他の複数のビデオブロックの選択可能な1つから継承された複数の予測パラメータに基づいて符号化するように構成される、請求項9に記載の装置。
  12. 前記エンコーダは、前記他の複数のビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化するように構成され、
    前記継承された複数の予測パラメータは、
    前記他の複数のビデオブロックのうちの前記1つが、複数のインター予測モードに基づいて前記エンコーダにより符号化された複数の符号化ブロックを有する場合には、前記複数のインター予測モードを有し、
    前記他の複数のビデオブロックのうちの前記1つが、複数のイントラ予測モードに基づいて前記エンコーダにより符号化された複数の符号化ブロックを有する場合には、前記複数のイントラ予測モードを有し、
    前記他の複数のビデオブロックのうちの前記1つがインターおよびイントラモードの組み合わせに基づいて前記エンコーダにより符号化された複数の符号化ブロックを有する場合には、前記複数のインターおよびイントラ予測モードの組み合わせを有する、請求項9に記載の装置。
  13. 前記エンコーダは、
    前記他の複数のビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて、前記各ビデオブロックを符号化するように構成され、
    前記継承された複数の予測パラメータは、複数のビデオブロックを、複数の符号化ユニット(CU)、複数の予測ユニット(PU)、前記複数のPUの複数のサイズ、および、前記複数のPUを符号化するために用いられるインターおよびイントラ予測モードへと分割する四分木構造を有する、請求項9に記載の装置。
  14. 前記継承された複数の予測パラメータは、更に、動き、動きベクトル、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、および複数のクロマ・イントラモードのうちの少なくとも2またはそれより多くを、含む、請求項13に記載の装置。
  15. 前記エンコーダは、更に、
    継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化するかどうかを決定し、
    継承された複数の予測パラメータに基づいて符号化されることが決定された場合には、前記継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化し、
    継承された複数の予測パラメータに基づいて符号化されないことが決定された場合には、継承されない複数の予測パラメータに基づいて前記各ビデオブロックを符号化するように構成される、請求項に9に記載の装置。
  16. 前記エンコーダは、更に、
    前記多重ビューのそれぞれにおいて、前記テクスチャ要素および前記深さ要素について複数の符号化されたビデオブロックを備えた符号化されたビットストリームを生成し、
    継承された複数の予測パラメータに基づいて符号化された複数の符号化されたビデオブロックのそれぞれと関連する予測パラメータ継承(PPI)シンタックスを前記符号化されたビットストリームへと埋め込むように構成され、
    前記PPIシンタックスは、
    前記符号化されたビデオブロックが、継承された複数の予測パラメータに基づいて符号化されたことを示すPPIフラグと、
    前記複数の予測パラメータが継承された前記他の複数のビデオブロックのうちの前記1つが、そこから決定される情報と、
    前記継承された複数の予測パラメータと、を有する、請求項9に記載の装置。
  17. 通信ネットワークと通信する複数の通信コンポーネント、
    ユーザインタフェース、
    前記複数の通信コンポーネントおよび前記ユーザインタフェースと通信するプロセッサおよびメモリ、
    前記エンコーダ、前記プロセッサおよびメモリ、前記複数の通信コンポーネント、および、前記ユーザインタフェースを収容するハウジング、
    を更に備える、請求項9に記載の装置。
  18. 多重ビュービデオの多重ビューにおける第1ビューのテクスチャ要素、前記第1ビューの深さ要素、前記多重ビューにおける第2ビューのテクスチャ要素、および前記第2ビューの深さ要素のそれぞれからビデオブロックを符号化する段階
    を備え、
    前記各ビデオブロックを符号化する段階は、他の複数のビデオブロックのうちの選択可能な1つから継承された複数の予測パラメータおよび前記他の複数のビデオブロックのうちの1つから継承されない複数の予測パラメータ、のうちの選択可能な1つに基づいて、前記各ビデオブロックを符号化する段階を有する、方法。
  19. 前記多重ビュービデオは、3次元(3D)の多重ビュービデオである、請求項18に記載の方法。
  20. 前記各ビデオブロックを符号化する段階は、
    前記第1ビューの前記テクスチャ要素および深さ要素のうちの1つにおける前記各ビデオブロックを、前記第1ビューの前記テクスチャ要素および深さ要素のうちの他の1つにおける前記他の複数のビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて符号化する段階、および
    前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記1つにおける前記各ビデオブロックを、
    前記第1ビューの前記テクスチャ要素、
    前記第1ビューの前記深さ要素、および
    前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つ、における前記他の複数のビデオブロックの選択可能な1つから継承された複数の予測パラメータに基づいて符号化する段階、を有する、請求項18に記載の方法。
  21. 前記符号化する段階は、前記他の複数のビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化する段階を有し、
    前記継承された複数の予測パラメータは、
    前記他の複数のビデオブロックのうちの前記1つが、複数のインター予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインター予測モードを有し、
    前記他の複数のビデオブロックのうちの前記1つが、複数のイントラ予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のイントラ予測モードを有し、
    前記他の複数のビデオブロックのうちの前記1つがインターおよびイントラモードの組み合わせに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインターおよびイントラ予測モードの組み合わせを有する、請求項18に記載の方法。
  22. 前記符号化する段階は、前記他の複数のビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化する段階を有し、
    前記継承された複数の予測パラメータは、複数のビデオブロックを、複数の符号化ユニット(CU)、複数の予測ユニット(PU)、前記複数のPUの複数のサイズ、および、前記複数のPUを符号化するために用いられるインターおよびイントラ予測モードへと分割する四分木構造を有する、請求項18に記載の方法。
  23. 前記継承された複数の予測パラメータは、動き、動きベクトル、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、および複数のクロマ・イントラモードのうちの少なくとも2またはそれより多くを、更に含む、請求項22に記載の方法。
  24. 前記各ビデオブロックを符号化するのに先立って、
    継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化するかどうかを決定する段階と、
    継承された複数の予測パラメータに基づいて符号化されることが決定された場合には、前記継承された複数の予測パラメータに基づいて前記各ビデオブロックを符号化する段階と、
    継承された複数の予測パラメータに基づいて符号化されないことが決定された場合には、継承されない複数の予測パラメータに基づいて前記各ビデオブロックを符号化する段階と、
    を更に備える、請求項に18に記載の方法。
  25. 前記多重ビューのそれぞれにおいて、前記テクスチャ要素および前記深さ要素について複数の符号化されたビデオブロックを備えた符号化されたビットストリームを生成する段階と、
    継承された複数の予測パラメータに基づいて符号化された複数の符号化されたビデオブロックのそれぞれと関連する予測パラメータ継承(PPI)シンタックスを前記符号化されたビットストリームへと埋め込みさせる段階と、
    を更に備え、
    前記PPIシンタックスは、
    前記符号化されたビデオブロックが、継承された複数の予測パラメータに基づいて符号化されたことを示すPPIフラグと、
    前記複数の予測パラメータが継承された前記他の複数のビデオブロックのうちの前記1つが、そこから決定される情報と、
    前記継承された複数の予測パラメータと、を有する、請求項18に記載の方法。
  26. コンピュータプログラムが符号化された非一時的コンピュータ可読媒体であって、プロセッサに、
    多重ビュービデオの多重ビューにおける第1ビューのテクスチャ要素、前記第1ビューの深さ要素、前記多重ビューにおける第2ビューのテクスチャ要素、および前記第2ビューの深さ要素、のそれぞれから符号化されたビデオブロックを受信させ、
    符号化されたビデオブロックのそれぞれが、前記各符号化されたビデオブロックが継承された複数の予測パラメータに基づいて符号化されたことを示す予測パラメータ継承(PPI)シンタックスと関連するかどうかを決定させ、
    継承された複数の予測パラメータが前記各符号化されたビデオブロックに対して示される場合には、前記PPIシンタックスにおいて示される前記他の複数の符号化されたビデオブロックのうちの選択可能な1つから継承された複数の予測パラメータに基づいて、前記各符号化されたビデオブロックを復号させる、複数の命令を有する、コンピュータ可読媒体。
  27. 前記多重ビュービデオは、3次元(3D)の多重ビュービデオである、請求項26に記載のコンピュータ可読媒体。
  28. 前記プロセッサに復号させる前記複数の命令は、前記プロセッサに、
    前記第1ビューの前記テクスチャ要素および深さ要素のうちの1つにおける前記各符号化されたビデオブロックを、前記第1ビューの前記テクスチャ要素および深さ要素のうちの他の1つから前記他の複数の符号化されたビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて復号させ、かつ、
    前記第2ビューの前記テクスチャ要素および深さ要素ののうちの前記1つにおける前記各符号化されたビデオブロックを、
    前記第1ビューの前記テクスチャ要素、
    前記第1ビューの前記深さ要素、および
    前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つ、における前記他の複数の符号化されたビデオブロックの選択可能な1つから継承された複数の予測パラメータに基づいて復号させる、複数の命令を有する、請求項26に記載のコンピュータ可読媒体。
  29. 前記継承された複数の予測パラメータは、
    前記他の複数の符号化されたビデオブロックのうちの前記1つが、複数のインター予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインター予測モードを有し、
    前記他の複数の符号化されたビデオブロックのうちの前記1つが、複数のイントラ予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のイントラ予測モードを有し、
    前記他の複数の符号化されたビデオブロックのうちの前記1つが、インターおよびイントラモードの組み合わせに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインターおよびイントラ予測モードの組み合わせを有する、請求項26に記載のコンピュータ可読媒体。
  30. 前記継承された複数の予測パラメータは、複数の符号化されたビデオブロックを、複数の符号化ユニット(CU)、複数の予測ユニット(PU)、前記複数のPUの複数のサイズ、および、前記複数のPUを符号化するために用いられるインターおよびイントラ予測モードへと分割する四分木構造を有する、請求項26に記載のコンピュータ可読媒体。
  31. 前記継承された複数の予測パラメータは、更に、動きベクトル、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、および複数のクロマ・イントラモードのうちの少なくとも2またはそれより多くを含む、請求項30に記載のコンピュータ可読媒体。
  32. 前記プロセッサに復号させる前記複数の命令は、前記プロセッサに、
    前記複数の予測パラメータが、前記各符号化されたビデオブロックのビューとは異なる、前記多重ビューのうちの前記複数ビューの1つについて符号化されたビデオブロックから継承されたものであることを前記PPIシンタックスが示す場合に、生成された視差ベクトルに基づいて前記他の複数の符号化されたビデオブロックの前記1つを特定させる複数の命令、を有する、請求項26に記載のコンピュータ可読媒体。
  33. 前記復号のための命令は、更に、前記プロセッサに、継承された複数の予測パラメータが示されない場合に、継承されていない複数の予測パラメータに基づいて前記各符号化されたビデオブロックを復号させる複数の命令、を有する、請求項26に記載のコンピュータ可読媒体。
  34. 多重ビュービデオの多重ビューにおける第1ビューのテクスチャ要素、前記第1ビューの深さ要素、前記多重ビューにおける第2ビューのテクスチャ要素、および前記第2ビューの深さ要素、のそれぞれから符号化されたビデオブロックを受信し、
    符号化されたビデオブロックのそれぞれが、前記各符号化されたビデオブロックが継承された複数の予測パラメータに基づいて符号化されたことを示す予測パラメータ継承(PPI)シンタックスと関連するかどうかを決定し、
    継承された複数の予測パラメータが前記各符号化されたビデオブロックに対して示される場合には、前記PPIシンタックスにおいて示される前記他の複数の符号化されたビデオブロックのうちの選択可能な1つから継承された複数の予測パラメータに基づいて、前記各符号化されたビデオブロックを復号するように構成されるデコーダ
    を備える、装置。
  35. 前記多重ビュービデオは、3次元(3D)の多重ビュービデオである、請求項34に記載の装置。
  36. 前記デコーダは、
    前記第1ビューの前記テクスチャ要素および深さ要素のうちの1つにおける前記各符号化されたビデオブロックを、前記第1ビューの前記テクスチャ要素および深さ要素のうちの他の1つから前記他の複数の符号化されたビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて復号し、
    前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記1つにおける前記各符号化されたビデオブロックを、
    前記第1ビューの前記テクスチャ要素、
    前記第1ビューの前記深さ要素、および
    前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つ、における前記他の複数の符号化されたビデオブロックの選択可能な1つから継承された複数の予測パラメータに基づいて復号するように構成される、請求項34に記載の装置。
  37. 前記継承された複数の予測パラメータは、
    前記他の複数の符号化されたビデオブロックのうちの前記1つが、複数のインター予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインター予測モードを有し、
    前記他の複数の符号化されたビデオブロックのうちの前記1つが、複数のイントラ予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のイントラ予測モードを有し、
    前記他の複数の符号化されたビデオブロックのうちの前記1つが、インターおよびイントラモードの組み合わせに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインターおよびイントラ予測モードの組み合わせを有する、請求項34に記載の装置。
  38. 前記継承された複数の予測パラメータは、複数の符号化されたビデオブロックを、複数の符号化ユニット(CU)、複数の予測ユニット(PU)、前記複数のPUの複数のサイズ、および、前記複数のPUを符号化するために用いられるインターおよびイントラ予測モードへと分割する四分木構造を有する、請求項34に記載の装置。
  39. 前記継承された複数の予測パラメータは、更に、動きベクトル、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、および複数のクロマ・イントラモードのうちの少なくとも2またはそれより多くを含む、請求項38に記載の装置。
  40. 前記デコーダは、更に、
    前記複数の予測パラメータが、前記各符号化されたビデオブロックのビューとは異なる、前記多重ビューのうちの前記複数ビューの1つについて符号化されたビデオブロックから継承されたものであることを前記PPIシンタックスが示す場合に、生成された視差ベクトルに基づいて前記他の複数の符号化されたビデオブロックの前記1つを特定するように構成される、請求項34に記載の装置。
  41. 前記デコーダは、更に、継承された複数の予測パラメータが示されない場合に、継承されていない複数の予測パラメータに基づいて前記各符号化されたビデオブロックを復号するように構成される、請求項34に記載の装置。
  42. 通信ネットワークと通信する複数の通信コンポーネント、
    ユーザインタフェース、
    前記複数の通信コンポーネントおよび前記ユーザインタフェースと通信するプロセッサおよびメモリ、
    前記デコーダ、前記プロセッサおよびメモリ、前記複数の通信コンポーネント、および、前記ユーザインタフェースを収容するハウジング、
    を更に備える、請求項34に記載の装置。
  43. 多重ビュービデオの多重ビューにおける第1ビューのテクスチャ要素、前記第1ビューの深さ要素、前記多重ビューにおける第2ビューのテクスチャ要素、および前記第2ビューの深さ要素、のそれぞれから符号化されたビデオブロックを受信する段階、
    符号化されたビデオブロックのそれぞれが、継承された複数の予測パラメータに基づいて前記各符号化されたビデオブロックが符号化されたことを示す予測パラメータ継承(PPI)シンタックスと関連するかどうかを決定する段階、
    継承された複数の予測パラメータが前記各符号化されたビデオブロックに対して示される場合には、前記PPIシンタックスにおいて示される前記他の複数の符号化されたビデオブロックのうちの選択可能な1つから継承された複数の予測パラメータに基づいて、前記各符号化されたビデオブロックを復号する段階、
    を備える、方法。
  44. 前記多重ビュービデオは、3次元(3D)の多重ビュービデオである、請求項43に記載の方法。
  45. 前記復号する段階は、
    前記第1ビューの前記テクスチャ要素および深さ要素のうちの1つにおける前記各符号化されたビデオブロックを、前記第1ビューの前記テクスチャ要素および深さ要素のうちの他の1つから前記他の複数の符号化されたビデオブロックのうちの前記1つから継承された複数の予測パラメータに基づいて復号する段階と、
    前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記1つにおける前記各符号化されたビデオブロックを、
    前記第1ビューの前記テクスチャ要素、
    前記第1ビューの前記深さ要素、および
    前記第2ビューの前記テクスチャ要素および深さ要素のうちの前記他の1つ、における前記他の複数の符号化されたビデオブロックの選択可能な1つから継承された複数の予測パラメータに基づいて復号する段階と、
    を有する請求項43に記載の方法。
  46. 前記継承された複数の予測パラメータは、
    前記他の複数の符号化されたビデオブロックのうちの前記1つが、複数のインター予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインター予測モードを有し、
    前記他の複数の符号化されたビデオブロックのうちの前記1つが、複数のイントラ予測モードに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のイントラ予測モードを有し、
    前記他の複数の符号化されたビデオブロックのうちの前記1つが、インターおよびイントラモードの組み合わせに基づいて符号化された複数の符号化ブロックを有する場合には、前記複数のインターおよびイントラ予測モードの組み合わせを有する、請求項43に記載の方法。
  47. 前記継承された複数の予測パラメータは、複数の符号化されたビデオブロックを、複数の符号化ユニット(CU)、複数の予測ユニット(PU)、前記複数のPUの複数のサイズ、および、前記複数のPUを符号化するために用いられるインターおよびイントラ予測モードへと分割する四分木構造を有する、請求項43に記載の方法。
  48. 前記継承された複数の予測パラメータは、更に、動きベクトル、複数の動き場、複数のインター方向、複数の参照インデックス、複数のルマ・イントラモード、および複数のクロマ・イントラモードのうちの少なくとも2またはそれより多くを、含む、請求項47に記載の方法。
  49. 前記復号する段階は、
    前記複数の予測パラメータが、前記各符号化されたビデオブロックのビューとは異なる、前記多重ビューのうちの前記複数ビューの1つについて符号化されたビデオブロックから継承されたものであることを前記PPIシンタックスが示す場合に、生成された視差ベクトルに基づいて前記他の複数の符号化されたビデオブロックの前記1つを特定する段階を有する、請求項43に記載の方法。
  50. 継承された複数の予測パラメータが示されない場合に、継承されていない複数の予測パラメータに基づいて前記各符号化されたビデオブロックを復号する段階を更に備える、請求項43に記載の方法。
JP2015535651A 2012-10-04 2013-06-17 3dビデオコーディングのための予測パラメータ継承 Pending JP2015536112A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261709688P 2012-10-04 2012-10-04
US61/709,688 2012-10-04
PCT/US2013/046128 WO2014055140A1 (en) 2012-10-04 2013-06-17 Prediction parameter inheritance for 3d video coding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2015196090A Division JP6415414B2 (ja) 2012-10-04 2015-10-01 3dビデオエンコーダ、システム、プログラム、コンピュータ可読記録媒体

Publications (1)

Publication Number Publication Date
JP2015536112A true JP2015536112A (ja) 2015-12-17

Family

ID=50432373

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015535651A Pending JP2015536112A (ja) 2012-10-04 2013-06-17 3dビデオコーディングのための予測パラメータ継承
JP2015196090A Active JP6415414B2 (ja) 2012-10-04 2015-10-01 3dビデオエンコーダ、システム、プログラム、コンピュータ可読記録媒体
JP2018087738A Active JP6550633B2 (ja) 2012-10-04 2018-04-27 3dビデオコーディングのための予測パラメータ継承

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2015196090A Active JP6415414B2 (ja) 2012-10-04 2015-10-01 3dビデオエンコーダ、システム、プログラム、コンピュータ可読記録媒体
JP2018087738A Active JP6550633B2 (ja) 2012-10-04 2018-04-27 3dビデオコーディングのための予測パラメータ継承

Country Status (6)

Country Link
US (3) US9544612B2 (ja)
EP (2) EP2904775B1 (ja)
JP (3) JP2015536112A (ja)
KR (2) KR101741940B1 (ja)
SG (3) SG10201707190RA (ja)
WO (1) WO2014055140A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018092868A1 (ja) * 2016-11-21 2018-05-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
US11399176B2 (en) 2016-11-21 2022-07-26 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
JP7471314B2 (ja) 2019-03-01 2024-04-19 コーニンクレッカ フィリップス エヌ ヴェ 画像信号を生成する装置及び方法

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102113326A (zh) * 2008-08-04 2011-06-29 杜比实验室特许公司 重叠块差异估计和补偿体系结构
CA2869322C (en) * 2012-04-20 2021-04-13 Affirmation, Llc Systems and methods for real-time conversion of video into three-dimensions
US9544612B2 (en) * 2012-10-04 2017-01-10 Intel Corporation Prediction parameter inheritance for 3D video coding
CN104838658B (zh) * 2012-12-14 2018-07-20 高通股份有限公司 具有不对称空间分辨率的纹理和深度视图分量当中的内部视图运动预测
US9648299B2 (en) 2013-01-04 2017-05-09 Qualcomm Incorporated Indication of presence of texture and depth views in tracks for multiview coding plus depth
US9521389B2 (en) * 2013-03-06 2016-12-13 Qualcomm Incorporated Derived disparity vector in 3D video coding
US20140301463A1 (en) * 2013-04-05 2014-10-09 Nokia Corporation Method and apparatus for video coding and decoding
US10080036B2 (en) * 2013-05-16 2018-09-18 City University Of Hong Kong Method and apparatus for depth video coding using endurable view synthesis distortion
US9667990B2 (en) 2013-05-31 2017-05-30 Qualcomm Incorporated Parallel derived disparity vector for 3D video coding with neighbor-based disparity vector derivation
WO2015004606A1 (en) * 2013-07-09 2015-01-15 Nokia Corporation Method and apparatus for video coding involving syntax for signalling motion information
KR20150010660A (ko) * 2013-07-18 2015-01-28 삼성전자주식회사 인터 레이어 비디오 복호화 및 부호화 장치 및 방법을 위한 깊이 영상의 화면내 예측 방법
US9948915B2 (en) * 2013-07-24 2018-04-17 Qualcomm Incorporated Sub-PU motion prediction for texture and depth coding
SG11201510554RA (en) 2013-07-24 2016-02-26 Qualcomm Inc Simplified advanced motion prediction for 3d-hevc
US9906768B2 (en) * 2013-07-26 2018-02-27 Qualcomm Incorporated Use of a depth condition in 3DV codec
JP6396493B2 (ja) * 2013-12-30 2018-09-26 クゥアルコム・インコーポレイテッドQualcomm Incorporated 3dビデオコーディングにおける大型予測ブロックのセグメントごとのdcコーディングの簡易化
US10244223B2 (en) * 2014-01-10 2019-03-26 Ostendo Technologies, Inc. Methods for full parallax compressed light field 3D imaging systems
EP2894857A1 (en) * 2014-01-10 2015-07-15 Thomson Licensing Method and apparatus for encoding image data and method and apparatus for decoding image data
US9536351B1 (en) * 2014-02-03 2017-01-03 Bentley Systems, Incorporated Third person view augmented reality
US10567799B2 (en) 2014-03-07 2020-02-18 Qualcomm Incorporated Simplified sub-prediction unit (sub-PU) motion parameter inheritance (MPI)
WO2016056822A1 (ko) * 2014-10-08 2016-04-14 엘지전자 주식회사 3d 비디오 코딩 방법 및 장치
CN104717515A (zh) * 2015-03-24 2015-06-17 上海大学 基于3d-hevc的纹理视频和深度图码率分配方法
EP3286737A1 (en) 2015-04-23 2018-02-28 Ostendo Technologies, Inc. Methods for full parallax compressed light field synthesis utilizing depth information
CN107431797B (zh) 2015-04-23 2019-10-11 奥斯坦多科技公司 用于全视差光场显示系统的方法和装置
JP6636615B2 (ja) * 2015-08-24 2020-01-29 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 動きベクトル場の符号化方法、復号方法、符号化装置、および復号装置
US10448030B2 (en) 2015-11-16 2019-10-15 Ostendo Technologies, Inc. Content adaptive light field compression
WO2017099371A1 (ko) * 2015-12-11 2017-06-15 삼성전자 주식회사 인트라 프레임 스킵 모드 정보의 부호화 방법 및 장치, 복호화 방법 및 장치
CN106878751B (zh) 2015-12-11 2022-01-14 北京三星通信技术研究有限公司 视频帧内编码模式的标识方法、处理方法和装置
US10694187B2 (en) * 2016-03-18 2020-06-23 Lg Electronics Inc. Method and device for deriving block structure in video coding system
US10390026B2 (en) * 2016-03-25 2019-08-20 Google Llc Smart reordering in recursive block partitioning for advanced intra prediction in video coding
US10939099B2 (en) * 2016-04-22 2021-03-02 Lg Electronics Inc. Inter prediction mode-based image processing method and device therefor
US10453431B2 (en) 2016-04-28 2019-10-22 Ostendo Technologies, Inc. Integrated near-far light field display systems
US10812795B2 (en) * 2016-09-30 2020-10-20 Lg Electronic Inc. Method for processing picture based on intra-prediction mode and apparatus for same
FR3068557A1 (fr) 2017-07-05 2019-01-04 Orange Procede de codage et decodage d'images,dispositif de codage et decodage et programmes d'ordinateur correspondants
FR3068558A1 (fr) 2017-07-05 2019-01-04 Orange Procede de codage et decodage d'images,dispositif de codage et decodage et programmes d'ordinateur correspondants
FR3062010A1 (fr) * 2017-07-05 2018-07-20 Orange Procedes et dispositifs de codage et de decodage d'un flux de donnees representatif d'une sequence d'images
JP7285789B2 (ja) * 2018-01-19 2023-06-02 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
US10652567B2 (en) 2018-03-28 2020-05-12 Apple Inc. Applications for decoder-side modeling of objects identified in decoded video data
US10638151B2 (en) * 2018-05-31 2020-04-28 Verizon Patent And Licensing Inc. Video encoding methods and systems for color and depth data representative of a virtual reality scene
WO2019234613A1 (en) 2018-06-05 2019-12-12 Beijing Bytedance Network Technology Co., Ltd. Partition tree with partition into 3 sub-blocks by horizontal and vertical splits
WO2020036389A1 (en) * 2018-08-13 2020-02-20 Lg Electronics Inc. Method for transmitting video, apparatus for transmitting video, method for receiving video, and apparatus for receiving video
US11087549B2 (en) * 2018-10-15 2021-08-10 University Of Maryland, College Park Methods and apparatuses for dynamic navigable 360 degree environments
WO2020125795A1 (en) * 2018-12-22 2020-06-25 Beijing Bytedance Network Technology Co., Ltd. Indication of two step cross-component prediction mode
US11477444B2 (en) 2019-08-06 2022-10-18 Hfi Innovation Inc. Method and apparatus of encoding or decoding video data with intra prediction mode mapping
CN117376556A (zh) 2019-08-14 2024-01-09 北京字节跳动网络技术有限公司 位置相关帧内预测样点滤波
WO2021027928A1 (en) 2019-08-14 2021-02-18 Beijing Bytedance Network Technology Co., Ltd. Weighting factors for prediction sample filtering in intra mode
CN110662040B (zh) * 2019-10-30 2022-02-18 西安邮电大学 基于可重构阵列处理器的深度图cu快速划分方法
US10999592B1 (en) * 2020-04-23 2021-05-04 Alibaba Group Holding Limited Estimated optimal video encoding parameter set systems and methods
CN114374675B (zh) 2020-10-14 2023-02-28 腾讯科技(深圳)有限公司 媒体文件的封装方法、媒体文件的解封装方法及相关设备
CN112929705B (zh) * 2021-02-02 2022-04-22 腾讯科技(深圳)有限公司 纹理压缩和解压方法、装置、计算机设备和存储介质
WO2023164245A1 (en) * 2022-02-28 2023-08-31 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for decoder-side intra mode derivation
US11388445B1 (en) * 2022-03-10 2022-07-12 Yendo Hu Mosquito noise smoothing between different video subsections encoded with different compression methods within a video frame
US11425423B1 (en) * 2022-03-10 2022-08-23 Yendo Hu Memory storage for motion estimation and visual artifact redcution

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009543508A (ja) * 2006-07-12 2009-12-03 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
JP2012010053A (ja) * 2010-06-24 2012-01-12 Sony Corp 情報処理装置および情報処理方法
WO2012070500A1 (ja) * 2010-11-22 2012-05-31 ソニー株式会社 符号化装置および符号化方法、並びに、復号装置および復号方法

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5614952A (en) * 1994-10-11 1997-03-25 Hitachi America, Ltd. Digital video decoder for decoding digital high definition and/or digital standard definition television signals
US6057884A (en) * 1997-06-05 2000-05-02 General Instrument Corporation Temporal and spatial scaleable coding for video object planes
KR100285599B1 (ko) * 1998-03-14 2001-04-02 전주범 격행 부호화에서의 움직임 추정을 위한 텍스쳐 패딩 장치 및그 패딩 방법
US6157396A (en) * 1999-02-16 2000-12-05 Pixonics Llc System and method for using bitstream information to process images for use in digital display systems
WO2004030369A1 (en) 2002-09-27 2004-04-08 Videosoft, Inc. Real-time video coding/decoding
KR100513732B1 (ko) 2002-12-05 2005-09-08 삼성전자주식회사 3차원 객체 데이터 부호화 및 복호화 방법 및 장치
KR100519780B1 (ko) 2004-02-17 2005-10-07 삼성전자주식회사 3차원 체적 데이터 부호화/복호화 방법 및 장치
US7837937B2 (en) 2004-07-09 2010-11-23 Hamilton Sundstrand Corporation Biological agent detector
US20060153295A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Method and system for inter-layer prediction mode coding in scalable video coding
EP1946563A2 (en) * 2005-10-19 2008-07-23 Thomson Licensing Multi-view video coding using scalable video coding
US20120269458A1 (en) * 2007-12-11 2012-10-25 Graziosi Danillo B Method for Generating High Resolution Depth Images from Low Resolution Depth Images Using Edge Layers
US8787685B2 (en) * 2008-02-21 2014-07-22 France Telecom Encoding and decoding an image or image sequence divided into pixel blocks
US8213503B2 (en) 2008-09-05 2012-07-03 Microsoft Corporation Skip modes for inter-layer residual video coding and decoding
US8179960B2 (en) * 2008-11-12 2012-05-15 Alcatel Lucent Method and apparatus for performing video coding and decoding with use of virtual reference data
US8837592B2 (en) * 2010-04-14 2014-09-16 Mediatek Inc. Method for performing local motion vector derivation during video coding of a coding unit, and associated apparatus
KR101291071B1 (ko) * 2010-06-08 2013-08-01 주식회사 에스칩스 입체 영상 오류 개선 방법 및 장치
KR101385514B1 (ko) * 2010-06-08 2014-04-16 주식회사 에스칩스 깊이 맵 정보를 이용한 입체 영상 변환 방법 및 장치
US9008175B2 (en) * 2010-10-01 2015-04-14 Qualcomm Incorporated Intra smoothing filter for video coding
US9025661B2 (en) * 2010-10-01 2015-05-05 Qualcomm Incorporated Indicating intra-prediction mode selection for video coding
US9071851B2 (en) * 2011-01-10 2015-06-30 Qualcomm Incorporated Adaptively performing smoothing operations
US9565449B2 (en) 2011-03-10 2017-02-07 Qualcomm Incorporated Coding multiview video plus depth content
US20120236934A1 (en) 2011-03-18 2012-09-20 Qualcomm Incorporated Signaling of multiview video plus depth content with a block-level 4-component structure
US9191646B2 (en) * 2011-08-29 2015-11-17 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding
US20140205007A1 (en) * 2011-08-31 2014-07-24 Sony Corporation Image processing devices and methods
CN107105279B (zh) * 2011-09-23 2020-03-06 株式会社Kt 用于引导合并候选块的方法和使用该方法的设备
KR101935976B1 (ko) * 2011-10-28 2019-01-07 선 페이턴트 트러스트 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치 및 화상 복호 장치
US9485503B2 (en) * 2011-11-18 2016-11-01 Qualcomm Incorporated Inside view motion prediction among texture and depth view components
US20130202194A1 (en) * 2012-02-05 2013-08-08 Danillo Bracco Graziosi Method for generating high resolution depth images from low resolution depth images using edge information
KR101877867B1 (ko) * 2012-02-21 2018-07-12 삼성전자주식회사 비디오 파라미터를 이용한 복잡도 측정 기반의 병렬 인-루프 화소 보정에 대한 부호화/복호화 장치 및 방법
US9565450B2 (en) * 2012-03-07 2017-02-07 Lg Electronics Inc. Method and device for processing video signal
US9445076B2 (en) * 2012-03-14 2016-09-13 Qualcomm Incorporated Disparity vector construction method for 3D-HEVC
US9338451B2 (en) * 2012-04-12 2016-05-10 Qualcomm Incorporated Common spatial candidate blocks for parallel motion estimation
US10205961B2 (en) * 2012-04-23 2019-02-12 Qualcomm Incorporated View dependency in multi-view coding and 3D coding
CN104604232A (zh) * 2012-04-30 2015-05-06 数码士控股有限公司 用于编码多视点图像的方法及装置,以及用于解码多视点图像的方法及装置
US20130343465A1 (en) 2012-06-26 2013-12-26 Qualcomm Incorporated Header parameter sets for video coding
US9258389B2 (en) * 2012-08-13 2016-02-09 Gurulogic Microsystems Oy Encoder and method
WO2014044908A1 (en) * 2012-09-21 2014-03-27 Nokia Corporation Method and apparatus for video coding
EP2911397A1 (en) * 2012-09-28 2015-08-26 Intel Corporation Inter-layer pixel sample prediction
US9544612B2 (en) 2012-10-04 2017-01-10 Intel Corporation Prediction parameter inheritance for 3D video coding
US9426465B2 (en) * 2013-08-20 2016-08-23 Qualcomm Incorporated Sub-PU level advanced residual prediction
US20150063455A1 (en) * 2013-09-02 2015-03-05 Humax Holdings Co., Ltd. Methods and apparatuses for predicting depth quadtree in three-dimensional video
US9667996B2 (en) * 2013-09-26 2017-05-30 Qualcomm Incorporated Sub-prediction unit (PU) based temporal motion vector prediction in HEVC and sub-PU design in 3D-HEVC

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009543508A (ja) * 2006-07-12 2009-12-03 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
JP2012010053A (ja) * 2010-06-24 2012-01-12 Sony Corp 情報処理装置および情報処理方法
WO2012070500A1 (ja) * 2010-11-22 2012-05-31 ソニー株式会社 符号化装置および符号化方法、並びに、復号装置および復号方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DMYTRO RUSANOVSKYY(外1名): "Suggestion for a depth-enhanced multiview video coding extension to H.264 Annex A: Nokia 3DV Test Mo", ITU-TELECOMMUNICATIONS STANDARDIZATION SECTOR STUDY GROUP 16 QUESTION 6 VIDEO CODING EXPERTS GROUP (, JPN6017008092, 10 February 2012 (2012-02-10), US, pages 1 - 14, ISSN: 0003515231 *
GERHARD TECH(外3名): "3D-HEVC Test Model 1", JOINT COLLABORATIVE TEAM ON 3D VIDEO CODING EXTENSION DEVELOPMENT OF ITU-T SG 16 WP 3 AND ISO/IEC JT, JPN6016022682, 20 September 2012 (2012-09-20), US, pages 1 - 82, ISSN: 0003339256 *
HAITAO YANG(外5名): "Regional Disparity Based Motion and Disparity Prediction for MVC", JOINT VIDEO TEAM (JVT) OF ISO/IEC MPEG & ITU-T VCEG(ISO/IEC JTC1/SC29/WG11 AND ITU-T SG16 Q.6) JVT-V, JPN6017000289, 19 January 2007 (2007-01-19), US, pages 1 - 4, ISSN: 0003822221 *
JACEK KONIECZNY(外1名): "Depth-Enhanced Compression for 3D video", IEEE VISUAL COMMUNICATIONS AND IMAGE PROCESSING (VCIP), JPN6016022683, 6 November 2011 (2011-11-06), US, pages 1 - 4, XP032081429, ISSN: 0003339257, DOI: 10.1109/VCIP.2011.6116058 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018092868A1 (ja) * 2016-11-21 2018-05-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
US10652536B2 (en) 2016-11-21 2020-05-12 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
US11350091B2 (en) 2016-11-21 2022-05-31 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
US11399176B2 (en) 2016-11-21 2022-07-26 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
US11736693B2 (en) 2016-11-21 2023-08-22 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
US11889078B2 (en) 2016-11-21 2024-01-30 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
JP7471314B2 (ja) 2019-03-01 2024-04-19 コーニンクレッカ フィリップス エヌ ヴェ 画像信号を生成する装置及び方法

Also Published As

Publication number Publication date
KR101741940B1 (ko) 2017-05-30
KR20150126713A (ko) 2015-11-12
SG10201508813UA (en) 2015-11-27
US9716897B2 (en) 2017-07-25
US9584822B2 (en) 2017-02-28
KR20150040346A (ko) 2015-04-14
WO2014055140A1 (en) 2014-04-10
US20150110193A1 (en) 2015-04-23
EP3029939B1 (en) 2020-04-29
JP6550633B2 (ja) 2019-07-31
SG11201501643YA (en) 2015-05-28
US20140098189A1 (en) 2014-04-10
EP2904775A4 (en) 2016-06-29
KR101662985B1 (ko) 2016-10-06
EP2904775A1 (en) 2015-08-12
JP6415414B2 (ja) 2018-10-31
EP2904775B1 (en) 2020-09-09
EP3029939A1 (en) 2016-06-08
SG10201707190RA (en) 2017-10-30
JP2018137817A (ja) 2018-08-30
US20160029040A1 (en) 2016-01-28
US9544612B2 (en) 2017-01-10
JP2016029814A (ja) 2016-03-03

Similar Documents

Publication Publication Date Title
JP6550633B2 (ja) 3dビデオコーディングのための予測パラメータ継承
JP6030230B2 (ja) パノラマベースの3dビデオコーディング
KR101636269B1 (ko) 3차원 비디오 코딩을 위한 뷰 간 필터 파라미터 재사용
TWI571109B (zh) 交叉頻道殘差預測之技術(二)
JP5985053B2 (ja) 関心領域ベースの3dビデオコーディング
JP5976696B2 (ja) 処理方法及びビデオコーディングシステム
US9860514B2 (en) 3D video coding including depth based disparity vector calibration
KR101626683B1 (ko) 멀티뷰 비디오 코딩 방안
JP6005865B2 (ja) スケーラブルビデオ符号化のためのエンハンスド参照領域の利用
JP2016506165A (ja) インターレイヤの動きデータ継承
RU2637480C2 (ru) Упрощенное кодирование глубины с модифицированным внутрикадровым кодированием для кодирования трехмерных видеоданных

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150401

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150401

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170314

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170609

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180328

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20180405

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20180622