JP2016167823A - 立体視および裸眼立体視ディスプレイのための奥行きマップ送達フォーマット - Google Patents

立体視および裸眼立体視ディスプレイのための奥行きマップ送達フォーマット Download PDF

Info

Publication number
JP2016167823A
JP2016167823A JP2016075000A JP2016075000A JP2016167823A JP 2016167823 A JP2016167823 A JP 2016167823A JP 2016075000 A JP2016075000 A JP 2016075000A JP 2016075000 A JP2016075000 A JP 2016075000A JP 2016167823 A JP2016167823 A JP 2016167823A
Authority
JP
Japan
Prior art keywords
depth map
data
depth
picture
rpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016075000A
Other languages
English (en)
Other versions
JP6309993B2 (ja
Inventor
ラクシュミナラヤナン,ゴーピ
Lakshminarayanan Gopi
ヒュルヤルカール,サミール
Hulyalkar Samir
チェン,タオ
Tao Cheng
ヘインリッヒ シュオイアー,クラース
Heinrich Schueuer Klaas
ヘインリッヒ シュオイアー,クラース
グラティ,アミット
Gulati Amit
ガナパシィ,ハリハラン
Ganapathy Hariharan
クラエツァー,フイリップ
Kraetzer Philipp
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Dolby Laboratories Licensing Corp
Original Assignee
Dolby International AB
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB, Dolby Laboratories Licensing Corp filed Critical Dolby International AB
Publication of JP2016167823A publication Critical patent/JP2016167823A/ja
Application granted granted Critical
Publication of JP6309993B2 publication Critical patent/JP6309993B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/139Format conversion, e.g. of frame-rate or size
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2213/00Details of stereoscopic systems
    • H04N2213/005Aspects relating to the "3D+depth" image format

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】立体視および裸眼立体視ディスプレイのための奥行きマップ送達フォーマットを提供する。
【解決手段】3D入力ピクチャーおよび対応する入力奥行きマップ・データを与えられて、入力ピクチャーに基づいて隣り合わせ式および上下式ピクチャーが生成される。エンコーダを使って隣り合わせ式ピクチャーが符号化されて、符号化された基本層を生成する。前記エンコーダおよびテクスチャー参照処理ユニット(RPU)を使って上下式ピクチャーがエンコードされて、第一の向上層を生成する。第一の向上層は基本層ストリームに基づいて符号化される。前記エンコーダおよび奥行きマップRPUを使って、前記隣り合わせ式ピクチャーについての奥行きデータがエンコードされて、第二の向上層を生成する。第二の向上層は基本層に基づいて符号化される。
【選択図】図1A

Description

〈関連出願への相互参照〉
本願は、2012年6月14日に出願された米国仮特許出願第61/659,588号、2012年10月10日に出願された米国仮特許出願第61/712,131号、2012年12月20日に出願された米国仮特許出願第61/739,886号、2013年2月21日に出願された米国仮特許出願第61/767,416号、2013年4月1日に出願された米国仮特許出願第61/807,013号、2013年4月2日に出願された米国仮特許出願第61/807,688号、2013年5月10日に出願された米国仮特許出願第61/822,060号の優先権を主張するものである。これらの出願の内容はみなここに参照によって組み込まれる。
〈技術〉
本発明は概括的には画像に関する。より詳細には、本発明のある実施形態は、立体視および裸眼立体視ディスプレイのための奥行きマップの送達のためのフォーマットに関する。
3Dビデオ・システムは、映画館であれ家庭であれ、消費者の経験を高めるために多大な関心を集めている。これらのシステムは、次のものを含む立体視または裸眼立体視の提示方法を使う。
(i)アナグリフ――通例一方の目のための赤および他方の目のためのシアンの二色フィルタを通じて光をフィルタリングすることにより左右の目の分離を提供する。
(ii)線形偏光――(通例)垂直配向の線形偏光子を通じて左目をフィルタリングし、水平配向の線形偏光子を通じて右目画像をフィルタリングすることによってプロジェクターにおいて分離を提供する。
(iii)円偏光――(通例)左巻きの円偏光子を通じて左目画像をフィルタリングし、右巻きの円偏光子を通じて右目画像をフィルタリングすることによってプロジェクターにおいて分離を提供する。
(iv)シャッター眼鏡――左右の画像を時間的に多重化することによって分離を提供する。
(v)左右の目をスペクトル的にフィルタリングすることによってプロジェクターにおいて分離を提供する。左右の目はそれぞれ赤、緑および青スペクトルの相補的な部分を受け取る。
市場で入手可能な3Dディスプレイの大半は立体視テレビであり、3D効果を経験するためにはユーザーが特殊な3D眼鏡を装着することを要求する。これらのディスプレイへの3Dコンテンツの送達は、左ビューおよび右ビューの二つの別個のビューを搬送することを要求するだけである。裸眼立体視(眼鏡なし)ディスプレイが登場しつつある。これらのディスプレイは、いくらかの動き視差(motion parallax)を与える。閲覧者は、自分が動くにつれて異なるアングルから対象を閲覧しているかのように頭を動かすことができる。
伝統的な立体視ディスプレイは単一の3Dビューを与えるが、裸眼立体視ディスプレイは、ディスプレイの設計に基づき5ビュー、9ビュー、28ビューなどといった複数のビューを与えることが求められる。通常の立体視コンテンツが裸眼立体視ディスプレイに与えられると、該ディスプレイは奥行きマップを抽出し、この奥行きマップに基づいて複数のビューを生成またはレンダリングする。本稿での用法では、用語「奥行きマップ」は、視点からのシーン・オブジェクトの表面の距離に関係した情報を含む画像または他のビットストリームを表わす。奥行きマップは、容易に両眼差マップ(disparity map)に変換でき、本稿のコンテキストでは、奥行きマップおよび両眼差マップの用語は同じであり、交換可能である。
国際公開第2010/123909号、Tourapis, A., et al. "Directed Interpolation/Post-processing Methods for Video Encoded Data" 国際公開第2011/995624号、Tourapis, A., et al. "Encoding and Decoding Architecture for Frame Compatible 3D Video Delivery"
Daniel Scharstein and Richard Szeliski、"High-Accuracy Stereo Depth Maps Using Structured Light"、IEEE Computer Society Conference on Computer Vision and Pattern Recognition, vol.1, pp.195-202, June 2003
奥行きマップは、3D経験を、種々の解像度をもつ種々のディスプレイ型(たとえば1080pディスプレイまたは2Kディスプレイ)のために適応させ直すために使用されてもよい。いくつかの研究は、3D映画館のために設計された奥行き量はより小さなモバイル装置には好適でなく、逆にモバイル装置のために設計された奥行き量はより大きな3D映画館には好適でないことを示している。また、3D奥行きの量に対する閲覧者の好みもある。これは、年齢依存(若者は高齢者より大きな奥行き体験を好む)、文化依存(アジアの文化は西洋文化よりも大きな奥行きを好む)または単に閲覧者依存でありうる。奥行きマップ情報は、知覚される奥行きおよび他の調整を増大または減少させるようステレオ・ビューをレンダリングし直すために使用できる。本願の発明者によって認識されたように、裸眼立体視および立体視ディスプレイでのユーザー経験を改善するために、コンテンツとともに奥行きマップ情報を送達するための改善された技法が望ましい。
上記のセクションで記述されたアプローチは、追求されることができたが必ずしも以前に着想または追求されたアプローチではない。したがって、特に断りのない限り、該セクションにおいて記述されるアプローチはいずれも、該セクションに含まれているというだけのために従来技術の資格をもつと想定されるべきではない。同様に、特に断りのない限り、一つまたは複数のアプローチに関して特定されている問題は、該セクションに基づいて何らかの従来技術において認識されていたと想定されるべきではない。
本発明の実施形態は、限定ではなく例として付属の図面に示される。図面において、同様の参照符号は同様の要素を指す。
3Dビデオのための例示的なフレーム互換フル解像度(FCFR: Frame-Compatible-Full-Resolution)エンコーダを描く図である。 3Dビデオのための例示的なフレーム互換フル解像度(FCFR: Frame-Compatible-Full-Resolution)デコーダを描く図である。 奥行きデータをもたない3D FCFRフォーマットの簡略化された表現である。 対応するデコーダの簡略化された表現である。 基本層が隣り合わせ式3D信号を有する、本発明のある実施形態に基づく、例示的な3層奥行きマップ送達フォーマットを描く図である。 好適なデコーダによって抽出されることができる対応するビットストリームの例を描く図である。 基本層が上下式3D信号を有する、本発明のある実施形態に基づく、例示的な3層奥行きマップ送達フォーマットを描く図である。 Aは、本発明のある実施形態に基づく、例示的な3層奥行きマップ送達フォーマットを描く図である。Bは、好適なデコーダによって抽出されることができる対応するビットストリームの例を描く図である。 Aは、本発明のある実施形態に基づく、例示的な3層奥行きマップ送達フォーマットを描く図である。Bは、好適なデコーダによって抽出されることができる対応するビットストリームの例を描く図である。 本発明のある実施形態に基づく、例示的な単一層奥行きマップ送達フォーマットを描く図である。 本発明のある実施形態に基づく、例示的な二層奥行きマップ送達フォーマットを描く図である。 Aは、本発明のある実施形態に基づく、例示的な2層奥行きマップ送達フォーマットを描く図である。Bは、好適なデコーダによって抽出されることができる対応するビットストリームの例を描く図である。 Aは、本発明のある実施形態に基づく、例示的な3層奥行きマップ送達フォーマットを描く図である。Bは、好適なデコーダによって抽出されることができる対応するビットストリームの例を描く図である。 Aは、本発明のある実施形態に基づく、例示的な3層奥行きマップ送達フォーマットを描く図である。Bは、好適なデコーダによって抽出されることができる対応するビットストリームの例を描く図である。 Aは、本発明のある実施形態に基づく、例示的な2層奥行きマップ送達フォーマットを描く図である。Bは、好適なデコーダによって抽出されることができる対応するビットストリームの例を描く図である。 Aは、本発明のある実施形態に基づく、例示的な2層奥行きマップ送達フォーマットを描く図である。Bは、好適なデコーダによって抽出されることができる対応するビットストリームの例を描く図である。 AおよびBは、本発明の諸実施形態に基づく、単一層奥行きマップ送達フォーマットの例を描く図である。 Aは、本発明のある実施形態に基づく、例示的な2層奥行きマップ送達フォーマットを描く図である。Bは、好適なデコーダによって抽出されることができる対応するビットストリームの例を描く図である。 本発明のある実施形態に基づく、例示的な単一層奥行きマップ送達フォーマットを描く図である。 AおよびBは、本発明の諸実施形態に基づく、例示的な単一層奥行きマップ送達フォーマットを描く図である。Cは、本発明のある実施形態に基づく、セグメント化された奥行きマップ多重化の例を描く図である。 本発明の諸実施形態に基づく、例示的な3層奥行きマップ送達フォーマットを描く図である。 本発明の諸実施形態に基づく、例示的な3層奥行きマップ送達フォーマットを描く図である。 本発明の諸実施形態に基づく、例示的な3層奥行きマップ送達フォーマットを描く図である。 本発明の諸実施形態に基づく、例示的な3層奥行きマップ送達フォーマットを描く図である。 本発明の諸実施形態に基づく、例示的な3層奥行きマップ送達フォーマットを描く図である。 AおよびBは、本発明の諸実施形態に基づく、例示的な2層奥行きマップ送達フォーマットを描く図である。
本稿では、立体視および裸眼立体視ディスプレイのための奥行きマップの送達フォーマットが記載される。これらのフォーマットは、伝統的なケーブル、衛星または空中放送およびオーバーザトップ(over-the-top)送達を含む多様なビデオ送達シナリオをサポートする。いくつかの実施形態では、これらのフォーマットは、より新しいデコーダが複数のビューおよび関連する奥行きマップ・データを立体視または裸眼立体視ディスプレイのためにレンダリングできる一方、レガシー・デコーダが後方互換な2Dまたは3Dストリームを抽出することを許容する。以下の記述では、説明のために、数多くの個別的詳細が、本発明の十全な理解を与えるために記述される。しかしながら、本発明がそうした個別的詳細なしでも実施されうることは明白であろう。他方、よく知られた構造および装置は、本発明を無用に埋没させるのを避けるために、網羅的な詳細さでは記述されない。
〈概観〉
本稿に記述される例示的な実施形態は、立体視および裸眼立体視ディスプレイのための奥行きマップ情報の送達フォーマットに関する。3D入力ピクチャーおよび対応する入力奥行きマップ・データが与えられたとき、隣り合わせ(side-by-side)または上下(top-and-bottom)式のピクチャーが入力ピクチャーに基づいて生成される。エンコーダを使って、隣り合わせ式のピクチャーは符号化されて符号化された基本層を生成する。前記エンコーダおよびテクスチャー参照処理ユニット(RPU: reference processing unit)を使って、上下式のピクチャーがエンコードされて第一の向上層を生成する。ここで、第一の向上層は部分的に前記基本層ストリームに基づいて符号化される。前記エンコーダおよび奥行きマップRPU(以下ではZ-RPUまたはRPUZと表わされる)を使って、前記隣り合わせ式ピクチャーのための奥行きデータがエンコードされて、第二の向上層を生成する。第二の向上層は部分的に前記基本層に基づいて符号化される。
いくつかの実施形態では、奥行きマップ・データを直接基本層および向上層に符号化する代わりに、エンコーダは、残差奥行きマップ・データをエンコードしてもよい。残差奥行きマップ・データは、入力奥行きマップ・データと、Z-RPUによって生成された推定された奥行きマップ・データとの間の差を含む。
いくつかの実施形態では、奥行きマップ・データおよびビデオ・データは単一層にエンコードされる。該単一層は、第一のビューの二分の一解像度のデータと、第二のビューの二分の一解像度のデータまたは第一のビューの前記二分の一解像度のデータについての奥行きマップのいずれかとを含む。
いくつかの実施形態では、奥行きマップ・データおよびビデオ・データは二つの基本層にエンコードされる。第一の基本層は第一のビューのフル解像度データを含み、第二の基本層は第二のビューのフル解像度のデータまたは第一のビューのフル解像度奥行きデータのいずれかとを含む。
いくつかの実施形態では、奥行きマップ・データおよびビデオ・データは三つの層にエンコードされる。基本層は第一のビューの二分の一解像度データおよびその対応する奥行きマップ・データを含む。第一の向上層は、上下式のピクチャーを含み、第二の向上層は、第二のビューの二分の一解像度のデータおよびその対応する奥行きマップ・データを含む。
いくつかの実施形態では、奥行きマップ・データおよびビデオ・データは二つの層にエンコードされる。第一の基本層は、隣り合わせ式ピクチャーのルミナンスおよびクロマ成分の両方を含む。向上層のルーマ成分は上下式のピクチャーのルーマ成分を含み、向上層のクロマ成分は前記上下式のピクチャーについての奥行きマップ・データを含む。
いくつかの実施形態では、前記隣り合わせ式ピクチャーおよび前記上下式ピクチャーは、水平方向および垂直方向の空間寸法があらかじめ定義されたマクロブロック・サイズ(たとえば16)の整数倍になるよう、パディングされる。その際、パディングされたデータは、もとの奥行きマップ・データのサブサンプリングされたバージョンを含む。
いくつかの実施形態では、向上層におけるクロマ・ピクセル値はまた、奥行きマップ・データまたは残差奥行きマップ・データで置き換えられてもよい。
〈3Dのための例示的なFCFRフォーマット〉
図1Aは、いかなる奥行き情報もない、3Dビデオ・データのエンコーダのフレーム互換フル解像度(FCFR)の例を描いている。エンコーダは、2011年9月29日に出願された、T. Chenらによる「Dual-layer frame-compatible full-resolution stereospcopic 3D delivery」という米国仮特許出願第61/541,005号に記載される方法に従って動作する。この出願は、2012年9月26日にPCT出願第PCT/US2012/057302号としても出願されており、ここに参照によってその全体において組み込まれる。
図1Aに描かれるように、入力3D信号(105)のフル解像度(たとえば1920×1080)の左右のビュー(105−1、105−2)がフィルタリングされ、(水平方向および垂直方向に)サブサンプリングされ、多重化されて隣り合わせ式のビュー112および上下式のビュー117を生成する。隣り合わせ式および上下式のピクチャーは、入力の両方のビューを含むが、各ビューはより低い解像度になっている。たとえば、1920×1080の入力については、隣り合わせ式のサブピクチャー(L、R)はそれぞれ960×1080であることがあり、上下式のサブピクチャー(L'、R')はそれぞれ1920×540であることがある。隣り合わせ式信号112はBLエンコーダ120によってエンコードされて符号化された基本層(BL)ビットストリーム122を生成する。BLエンコーダ120は、ISO/IEC MPEG-2、MPEG-4パート2またはH.264(AVC)規格によって規定されるものまたはグーグルのVP8、マイクロソフトのVC-1、HEVCなどといった他のエンコーダのような、既知のビデオ・エンコーダのいずれであってもよい。
上下式信号117は、第二のエンコーダである向上層(EL)エンコーダ130によってエンコードされて、符号化された向上層(EL)ストリーム132を生成してもよい。ELエンコーダは、BLエンコーダ120と同じフォーマット(たとえばH.264)でエンコードしてもよいし、あるいは別個のフォーマットでエンコードしてもよい。いくつかの実施形態では、ELエンコーダ130は、上下式信号117および隣り合わせ式信号112の両方からの参照フレームを使うことによって、信号117をエンコードしてもよい。たとえば、BLエンコーダ120、ELエンコーダ130および関連する記憶部(図示せず)は、マルチビュー・コーデック(MVC)のためのISO/IEC H.264規格によって規定されているマルチビュー・コーデックを有していてもよい。
いくつかの実施形態では、図1Aのエンコーダは、参照プロセッサユニット(RPU)125をも含んでいてもよい。RPUとの関係で本稿で使われるところでは、「参照」という用語は、このピクチャーが完全な符号化プロセス内で参照として(たとえば「参照ピクチャー」の意味で)明示的に使われることを含意も明示もすることを意図されておらず、よってそのような意味に解釈すべきではない。RPUは、特許協力条約(PCT)に従って出願された特許文献1、2に記載されている説明に準拠してもよい。RPUの以下の記述は、特にそうでないことが明記されるのでない限り、エンコーダのRPUおよびデコーダのRPUの両方に当てはまる。ビデオ符号化に関係する分野の当業者はその差を理解し、本開示を読めば、エンコーダ固有、デコーダ固有および一般的なRPUの記述、機能およびプロセスを区別できるであろう。図1Aに描かれるような3Dビデオ符号化システムのコンテキスト内では、RPU(125)は、種々のRPUフィルタおよびプロセスを選択する一組の規則に従って、BLエンコーダ120からのデコードされた画像にアクセスし、これを補間する。
RPU 125は、補間プロセスが領域レベルで適応的であることを可能にする。ここで、ピクチャー/シーケンスの各領域はその領域の特性に従って補間される。RPU 125は、水平方向、垂直方向または二次元(2D)フィルタ、エッジ適応式または周波数ベースの領域依存フィルタおよび/またはピクセル複製フィルタまたは補間および画像処理のための他の方法または手段を使うことができる。
たとえば、あるピクセル複製フィルタは、単に零次ホールドを実行してもよい。たとえば、補間された画像における各サンプルは、低解像度画像における近隣サンプルの値に等しくなる。別のピクセル複製フィルタは、ビュー横断コピー動作を実行してもよい。たとえば、あるビューにおける補間された各サンプルは、反対側のビューからの補間されていない共位置のサンプルに等しくなる。
代替的または追加的に、両眼差補償されるコピー方式がRPUにおいて使われることができる。たとえば、フィルタは、サンプルの非共位置領域をコピーしてもよい。ここでも、コピーされるべき領域の位置は異なるビューからの領域であってもよいが、両眼差ベクトルを使って指定されることができる。両眼差ベクトルは、整数またはサブピクセル精度を使って指定されてもよく、単純な、たとえば並進動きパラメータ、あるいはアフィンまたはパースペクティブ動き情報および/またはその他のようなより複雑な動きモデルに関わってもよい。
エンコーダは、RPUフィルタを選択して、領域的な処理信号を出力してもよい。その出力はデコーダRPU(たとえば140)に入力データとして与えられる。信号伝達(たとえばRPUL 127)が、領域ごとにフィルタリング方法を指定する。たとえば、数、サイズ、形および他の特性といった領域属性に関係するパラメータがRPULに関係したデータ・ヘッダにおいて指定されてもよい。フィルタのいくつかは、固定したフィルタ係数を有していてもよく、その場合、フィルタ係数はRPUによって明示的に信号伝達される必要はない。他のフィルタ・モードは、係数値および水平方向/垂直方向タップの数といったフィルタ・パラメータが明示的に信号伝達される明示モードを含みうる。
フィルタは、各色成分ごとに指定されてもよい。RPUは線形フィルタを指定してもよい。エッジ適応的フィルタ、二側面フィルタなどといった非線形フィルタがRPUにおいて指定されてもよい。さらに、アフィンまたはパースペクティブ動きモデルといった高度な動き補償方法を指定する予測モデルが信号伝達されてもよい。
RPUデータ信号伝達127は、エンコードされたビットストリームに埋め込まれることも、あるいはデコーダに別個に伝送されることもできる。RPUデータは、RPU処理が実行される層とともに信号伝達されてもよい。追加的または代替的に、すべての層のRPUデータが一つのRPUデータ・パケット内で信号伝達されてもよく、該パケットはレイヤー2エンコードされたデータを埋め込む前または後にビットストリームに埋め込まれる。RPUデータの提供は、所与の層については任意的であってもよい。RPUデータが利用可能でない場合には、デフォルトの方式がその層の上方変換〔アップコンバージョン〕のために使用されてもよい。似ていなくもないが、向上層エンコードされたビットストリームの提供も任意的である。
ある実施形態は、各RPUにおけるフィルタおよびフィルタリングされる領域を最適に選択する複数の可能な方法を許容する。いくつかの基準が、最適なRPU選択を決定することにおいて、別個にまたは関連して使用されてもよい。最適なRPU選択基準は、基本層ビットストリームのデコードされた品質、向上層ビットストリームのデコードされた品質、RPUデータを含む各層のエンコードのために必要とされるビットレートおよび/またはデータのデコードおよびRPU処理の複雑さを含みうる。
RPUは、向上層におけるその後の処理とは独立に最適化されてもよい。よって、RPUについての最適なフィルタ選択は、ビットレートおよびフィルタ複雑さなどのような他の制約条件のもとで、補間された基本層画像ともとの左目および右目の画像との間の予測誤差が最小化されるように決定されてもよい。
RPU 125は、BLエンコーダ120からの情報を、該情報がELエンコーダ130における向上層のための潜在的な予測子として利用する前に処理する前処理段のはたらきをしてもよい。RPU処理に関係した情報は、RPU層(RPUL: RPU Layer)ストリーム127を使って、図1Bに描かれているようなデコーダに(たとえばメタデータとして)通信されてもよい。RPU処理は、色空間変換、非線形量子化、ルーマおよびクロマ・アップサンプリングおよびフィルタリングといった多様な画像処理動作を含みうる。ある典型的な実装では、EL 132、BL 122およびRPUL 127信号は単一の符号化されたビットストリーム(図示せず)に多重化される。
図1Bは、図1Aに描かれたエンコーダによってエンコードされたビットストリームをデコードする例示的なデコーダを描いている。デコーダは、受領されたビットストリームを多重分離してBLストリーム122、ELストリーム132およびRPULストリーム127を生成する。単一のBLデコーダ135をもつデコーダは、BLストリーム122をそれ自身でデコードして、デコードされた隣り合わせ式ビットストリーム137を生成できる。デコーダは信号137を使って、単一の2Dストリームを(信号137の左または右ビューのいずれかを選択することによって)、あるいは後方互換の3Dストリームを生成してもよい。追加的なELデコーダ145をサポートするデコーダは、上下ストリーム147をもデコードして、それをBLストリーム137と組み合わせてフル解像度の3Dストリーム152を生成してもよい。上下式および隣り合わせ式のストリームを多重分離して組み合わせてフル解像度の3Dビデオ・ストリームを生成することは、先述した米国仮特許出願第61/541,005号に記載される方法に基づいて実行されてもよい。
BLデコーダ135(たとえばMPEG-2またはH.264デコーダ)はBLエンコーダ120に対応する。ELデコーダ145(たとえばMPEG-2またはH.264デコーダ)はELエンコーダ130に対応する。デコーダRPU 140はエンコーダRPU 125に対応し、RPUL入力127からのガイダンスにより、エンコーダRPU 125によって実行される動作に対応する動作を実行することによってEL層132のデコードにおいて支援してもよい。
図1Cは、図1Aに描かれた二層エンコーダによってエンコードされた3D FCFR符号化フォーマットの簡略化された表現を描いている。図1Cの記号法によれば、符号化されたBL信号は、ルミナンスまたはルーマ成分(112-Y)および対応するクロマ成分(112-UV)を含む隣り合わせ式信号112を含む。たとえば、いくつかの実施形態では、BL信号112は4:2:0 YUVフォーマットでエンコードされてもよい。他のいくつかの実施形態では、4:2:0 YCbCrフォーマットでエンコードされてもよい。図1Cに描かれるように、入力信号のクロマ成分は、ルーマ成分より低いピクセル解像度を有することがあるが、本稿に記載されるすべての方法は、クロマがルーマ成分と同じ解像度であってもよい色フォーマット(たとえば4:4:4 YCbCrまたは4:4:4 YUV)にも当てはまる。BL信号112は、図1Aに描かれているエンコーダを使ってそれ自身でエンコードされてもよい。EL上下式ストリーム117は、BLストリーム112からの参照データに基づいてRPUT 125を使って部分的にエンコードされてもよい。ELストリーム117は独自のルーマ(117-Y)およびクロマ(117-UV)成分を有する。
図1Cに描かれるエンコーダ表現によって生成される符号化されたビットストリームを与えられて、図1Dは、対応する受信器実施形態のための簡略化された表現を描いている。図1Dは、図1Bの簡略化されたバージョンと見ることもできる。先に説明したように、単一のBLデコーダ135をもつレガシー・デコーダはこのストリームから、レガシー(たとえば二分の一解像度)フレーム互換(FC)3Dストリームを抽出できる。一方、より新しいデコーダ(たとえばH.264 MVCデコーダまたはELデコーダ145およびRPU 140をもつデコーダ)は向上層を抽出し、それにより、より高い解像度および品質のFCFR 3Dストリームを再構成してもよい。記号法のため、BLデコーダ135とELデコーダ145の間などの二つのデコーダ間の接続(たとえば137)は、そのELデコーダが、たとえばデコーダRPU 140(図示せず)を通じ、基本層から抽出されて後処理されたフレームを参照フレームとして利用してもよいことを表わす。換言すれば、符号化されたELストリームは部分的には、BLストリームからのデータに基づいてデコードされる。
〈後方互換な層をもつ3Dのための例示的な奥行きフォーマット〉
図2Aは、FCFR 3Dデータに加えて奥行きマップ・データを送達するための例示的な三層送達フォーマットを描いている。図2Aに記されるように、最初の二つの層BL 212およびEL-1 217は伝統的な3D FCFR層BL 112およびEL 117に対応する。3D FCFRエンコードと同様に、EL-1層217は、RPUT 225を使ってBL層212への参照によって符号化されてもよい。EL-2層219Sは、一次チャネル219S-Aおよび二次チャネル219S-Bとしてエンコードされた奥行きマップ情報を表わす。奥行きマップ・データは、典型的には8ビット・グレースケール・データとしてエンコードされる。すなわち、いかなるクロマ情報も含まない。EL-2 219Sでは、ZLは左ビュー(たとえば105-1)のための水平方向にサブサンプリングされた奥行きデータを表わし、ZRは右ビュー(たとえば105-2)のための水平方向にサブサンプリングされた奥行きデータを表わす。この実施形態では奥行きデータはサブサンプリングされるので、欠けている奥行き情報も二次奥行きチャネル219S-Bに組み込まれてもよい。たとえば、ある実施形態では、左ビューのためのもとのw×hの奥行きマップを与えられて、垂直方向のサブサンプリング後に、結果的なw×h/2の奥行きマップが、ZL'およびZL''として表わされる二つのw/2×h/2の奥行きマップに分割されてもよい。
EL-2層219Sは、第二のELエンコーダを使って独自にエンコードされてもよく、あるいは、図2Aに描かれるように、BLストリーム212から抽出された奥行きデータを参照することによってRPUZ 230を使ってエンコードされることもできる。
奥行きマップRPU 230(奥行きまたはZバッファ・データに対して作用するのでRPUZまたはZ-RPUとも称される)は、動作および機能において、テクスチャーRPU 225(またはRPU 125)(テクスチャー・データに対して作用するのでRPUTとも称される)と非常によく似ているが、奥行きマップRPUは、ベースライン入力(たとえばBL 212)から推定奥行きマップ・データを抽出(または予測)する追加された機能をもつ。奥行きマップ情報は、ここに参照によってその全体において組み込まれる非特許文献1のような、当技術分野における既知の技法のいずれを使って2Dまたは3Dデータから抽出されることもできる。
いくつかの実施形態では、EL-2層219Sは以下のデータを担持してもよい:何の修正もないもとの奥行きマップ(たとえば、カメラによって捕捉されら奥行きマップ)または該もとの奥行きマップとRPUZによって予測された奥行きマップとの間の差またはもとの奥行きマップからの個別的な諸領域。同じフォーマットは、奥行きデータの一部としてまたはRPUTビットストリーム(たとえば127)と同様の別個のRPUZビットストリームの一部として、RPUZ処理を定義するために必要とされるさまざまなパラメータを担持するために使われてもよい。
図2Aの奥行きマップ符号化フォーマットが与えられて、受信器の機能に依存して、図2Bは、いくつかの代替的なデコードされたビットストリームを描いている。たとえば、単一のデコーダ、BLデコーダ250をもつ受信器は、フレーム互換(FC)3Dストリームのみを抽出できる。BLデコーダ250およびELデコーダ1 255(たとえばMVCデコーダ)の両方をもつ受信器はFCFR 3Dストリームをデコードすることもできる。第二のELデコーダ(265)およびデコーダRPUZ(図示せず)をもつ受信器は、奥行きマップZLおよびZRをもデコードしてもよい。BLデコーダ250およびELデコーダ2(265)のみをもつ受信器は、FC 3Dストリームおよび奥行きマップZLおよびZRをデコードしてもよい。
図2Aに描かれるように、基本層212は隣り合わせ式の多重化L/R符号化データ(たとえば112)を含み、EL-1層は上下式のL'/R'多重化データ(たとえば117)を含むが、本稿で論じる奥行きマップのための送達フォーマットすべてにおいて、基本層において隣り合わせ式3Dデータを使うことは、上下式3Dデータを使うことと交換可能である。よって、図2Cに描かれるように、ある代替的な実施形態では、BLは上下式のL'/R'信号217(たとえば117)を含んでいてもよく、EL-1は隣り合わせ式のL/R信号212(たとえば112)を含んでいてもよく、EL-2は上下式の奥行きマップ・データZL'/ZR'(219T)を含んでいてもよい。同様の実施形態は、本明細書に記載される他の例示的な実施形態についても導出されうる。
図3のAは、図2Aに描かれた奥行きマップ送達フォーマットの変形を描いている。図3のAに描かれるように、奥行きマップ・データは第二の基本層BL-2 319を使って符号化される。符号化効率を改善するために、もとの奥行きデータZLおよびZRを符号化する代わりに、エンコーダは任意的なRPUZ 330を利用して推定奥行きマップ・データを生成してもよい。
ある実施形態では、RPUZ 330は、予測された奥行きデータZELおよびZERを導出するために、基本層312からの情報を利用してもよい。次いで、BL-2のためのエンコーダは、直接ZLおよびZRを符号化する代わりに、奥行き残差RZL=ZL−ZELおよびRZR=ZR−ZERをエンコードしてもよい。同様の奥行きマップ残差符号化は、本明細書に記載されるすべての例示的実施形態に適用可能である。
図3のAに基づいてエンコードされた奥行きマップ・データが与えられて、受信器の機能に依存して、図3のBは、いくつかの代替的なデコード・シナリオを描いている。たとえば、単一のBLデコーダ、BLデコーダ1 350をもつ受信器は、FC 3Dストリームをデコードしうる。第二のBLデコーダ(BLデコーダ2360)をもつ受信器は、奥行きデータZLおよびZRまたは残差奥行きデータ(RZL,RZR)のいずれかをデコードしうる。第二のBLデコーダ360およびデコーダRPUZをもつ受信器は、BLストリームを使って推定奥行きデータ(ZELおよびZER)を再構成し、それが(たとえば加算器365を介して)デコードされた残差奥行きデータ(RZL,RZR)に加えられて、出力奥行きデータZLおよびZRを生成してもよい。追加的な機能365はデコーダのRPUZによって、あるいは別個の処理回路によって実装されてもよいことを注意しておく。最後に、BLデコーダ1 350およびELデコーダ355をもつ受信器は、ビットストリームEL-1と、BLビットストリームからの参照データを使って、FCFR 3Dストリームを再構成しうる。
図4のAは、多重化された二分の一解像度3Dデータの基本層と二つの向上層とを使う、左ビューおよび右ビューのための奥行きマップ送達フォーマットを描いている。ある例示的な実施形態では、EL-1 417はL'およびR'上下式信号(117)の「上」半分(L')およびZLデータを担持する。EL-2 419はL'およびR'上下式信号(117)の「下」半分およびZRデータを担持する。向上層の符号化効率は、テクスチャーおよびZバッファRPU(425および430)を使うことによって改善されうる。RPUT 425はL'およびR'データの符号化のために使用され、一方、RPUZ 430はZLおよびZRデータの符号化のために使用される。前と同様に、EL-1およびEL-2クロマ・チャネル(417-UVおよび419-UV)は対応するL'またはR'データのためのクロマ・データ(たとえばL'uおよびL'v)または追加的な奥行きデータ(ZL'およびZL'')を担持するために使用されてもよい。
図4のAに基づいてエンコードされた奥行きマップ・データが与えられて、図4のBは、いくつかの代替的なデコード・シナリオを描いている。単一のBLデコーダ450をもつ受信器は、FC 3Dストリームをデコードしうる。追加的なELデコーダ(455または460)およびRPUTおよびRPUZの(または同様の)機能をもつ受信器は、フル解像度(FR)左ビュー・ストリーム、二分の一解像度(HR)右ビュー・ストリームおよび左ビュー奥行きデータ(ZL)をもデコードでき、あるいはFR右ビュー、HR左ビューおよび右ビュー奥行きデータ(ZR)をデコードできる。二つの追加的なELデコーダ(455および460)をもつ受信器は、両方のビューからのFCFR 3Dストリームおよび奥行きデータをもデコードできる。
図7のAは、基本層712および向上層717を使って奥行きマップ情報を送達するための二層アプローチの例示的な実施形態を描いている。BL層712は両方のビューの二分の一解像度を送達する(たとえば隣り合わせ式ピクチャー)。EL層717はそれらの対応する奥行きマップを送達する。エンコーダはRPUZ(730)を利用してもよく、それにより、BL 712から抽出される奥行きマップ・データが、ELデータ717をエンコードするために参照として使用されうる。
いくつかの実施形態では、RPUZ 730は完全にスキップされてもよく、EL層717は、基本層を参照することなく、第二の基本層としてそれ自身でエンコードされてもよい。
いくつかの実施形態では、RPUZ 730は、基本層712からの情報を利用して、推定奥行きデータZELおよびZERを抽出してもよい。その際、向上層717は、もとのZLおよびZR奥行きデータを含む代わりに、RZL=ZL−ZELおよびRZR=ZR−ZERのような奥行き残差を含んでいてもよい。
もう一つの実施形態では、隣り合わせ式L/Rデータ(たとえば112)をBL層712として使う代わりに、上下式L'/R'データ(たとえば117)を使ってもよい。そのような実施形態では、ELストリーム717は対応する上下式の奥行きマップ・データも担持することになる。
〈後方互換でない層をもつ3Dのための例示的な奥行きフォーマット〉
これまで述べてきた奥行きマップ・データ送達フォーマットの大半は、レガシー受信器が少なくとも、ある後方互換な二分の一解像度の(FC)3Dストリームをデコードすることを許容する。単一デコーダとの後方互換性が要件ではない場合には、代替的な実施形態が導出されうる。
図5は、奥行きマップを送達するための単一層アプローチの例を描いている。信号BL 512は二分の一解像度の左ビュー(L)およびその関連する奥行きマップ(ZL)を有する。ZLに関連付けられたクロマ・チャネル(512-UV)は、ZLのための追加解像度データを伝送するために使われてもよい。エンコーダは、左ビュー奥行きデータZLの代わりに、二分の一解像度右ビュー・データ(R)を代用し、伝送してもよい。デコーダ側では、単一BLデコーダをもつビデオ・デコーダは、二分の一解像度左ビューおよびその奥行きマップまたは隣り合わせ式ピクチャーを抽出してFC 3Dビデオ・ストリームを生成できる。ピクチャー毎にピクチャー配置についての情報を含む補助データ(またはメタデータ)も伝送されてもよい。
同じ送達フォーマットは、BL 512において、二分の一解像度左ビュー(L)が二分の一解像度右ビュー(R)または上下式L'/R'信号(147)の上(L')または上下式L'/R'信号(147)の下(R')によって置き換えられてもよく、左ビュー奥行きマップが対応する奥行きマップによって置き換えられる代替的な実施形態において使用されてもよい。
図6は、奥行きマップ情報を送達するための二層アプローチの例示的な実施形態を描いている。図6に描かれるように、BL-1(612)およびBL-2(617)層はいずれも互いから独立して符号化される。BL-1層612は左ビュー(L)のフル解像度を含む。BL-2層617は左ビュー奥行きマップのフル解像度または右ビュー(R)のフル解像度を含む。層BL-2が奥行きマップ・データZLを担持する場合、対応するクロマ・データ(617-UV)はブランクのままにされてもよいし、他のメタデータを担持してもよい。
このフォーマットのデコードは、少なくとも二つのBLデコーダを必要とする。左ビュー・データ(L)のデコードのために一つ、左ビュー奥行きマップ・データまたは右ビュー・データのデコードのために一つである。ピクチャー毎にピクチャー配置についての情報を含む補助データ(またはメタデータ)も伝送されてもよい。このフォーマットは、一つのデコーダをもつ受信器が2Dビデオを再構成し、二つのデコーダをもつ受信器がFCFR 3DまたはFC 3Dビデオを再構成することを許容する。
いくつかの実施形態では、BL-1(612)が右ビュー・データ(R)を担持してもよく、BL-2(617)が右ビュー奥行きデータ(ZR)または左ビュー・データ(L)を担持してもよい。
図8のAは、基本層(BL)および二つの向上層(EL-1およびEL-2)を使う奥行きマップ送達フォーマットを描いている。基本層812はフル解像度左ビューを含む。EL-1層はフル解像度右ビューを含む。層BLおよびEL-1は、伝統的なMVCエンコーダを使ってエンコードされてもよく、あるいはテクスチャーRPU(図示せず、たとえばRPU 125)を用いてもよい。第二の向上層EL-2 819は、左ビューおよび右ビューの両方について二分の一解像度の奥行きマップ・データを含む。EL-2層のクロマ成分(819-B)は、コア奥行きデータ(819-A)の解像度を高めるために追加的な奥行きマップ・データをも含んでいてもよい。RPUZ 830は、入力フル解像度LおよびRピクチャーから抽出される奥行きマップ予測データを提供してもよく、これはEL-2ストリームの符号化効率を高めるために使用されることができる。
図8のAに描かれている送達フォーマットが与えられて、図8のBは、レガシーおよび互換デコーダを使ういくつかの代替的なデコード・シナリオを描いている。単一のBLデコーダ850をもつ受信器は2Dストリームを抽出しうる。MVCデコーダをもつまたはELデコーダ855をもつデコーダはFCFR 3Dストリームを抽出しうる。追加的なELデコーダ860をもつデコーダ(または3層MVCデコーダ)は、左ビューおよび右ビュー奥行きマップ・データを抽出してもよい。単一のBLデコーダ850およびELデコーダ2をもつデコーダは、2Dストリームに加えて対応する奥行きデータを抽出しうる。
図9のAは、基本層912と二つの向上層(917、919)を使う奥行きマップ送達の実施形態を描いている。基本層912は二分の一解像度の左ビュー(L)およびその対応する奥行きマップZLを含む。層EL-1はL'/R'上下式ピクチャー(たとえば147画像)を含む。EL-1 917のL'を符号化するとき、BL 912のL成分に基づいて適切な参照フレームを生成することによって符号化効率を改善するためにRPUT(925)が使用されてもよい。EL-2層も二分の一解像度右ビュー(R)およびその対応する奥行きマップ・データZRを含む。EL-2 919のR成分を符号化するとき、EL-1 917のR'成分に基づいて適切な参照フレームを生成するために、RPUT(925)が使用されてもよい。RPUT 925Aおよび925Bの動作は、同じRPU 925によって、または別個のRPUによって実行されうる。先の諸実施形態において論じたように、RPUZ 930は、EL-2 919におけるZRデータの符号化効率を改善するために、BL 912およびEL-1 917ストリームのL、L'およびR'成分から奥行きマップ・データを抽出してもよい。ある実施形態では、BLおよびEL-2層が入れ替えられてもよい。
図9のAに描かれた送達フォーマットが与えられて、図9のBは受信器におけるデコード・シナリオの例を描いている。単一のBLデコーダ950をもつ受信器は二分の一解像度(HR)左ビューおよび二分の一解像度ZLをデコードしてもよい。追加的なELデコーダ1 955をもつ受信器はL'/R'上下式信号をもデコードでき、よってフル解像度左ビュー(またはFR右ビュー)および二分の一解像度右ビュー(またはHR左ビュー)を再構成できる。これらの信号の両方が、3Dビューを再現するために使用できる。第二のELデコーダ(たとえば960)をもつ受信器は、二分の一解像度右ビューRおよび二分の一解像度ZRをもデコードでき、よって、FCFR 3D信号を生成できる。BLデコーダ950および第二のELデコーダ960のみをもつ受信器は、フレーム互換な3D信号に加えて奥行きデータをデコードしうる。
図10のAは、基本層1012が二分の一解像度左ビューおよび二分の一解像度左ビュー奥行きマップ(ZL)を担持し、向上層(1017)が二分の一解像度右ビューおよび二分の一解像度右ビュー奥行きマップ(ZR)を担持する奥行きマップ送達フォーマットを描いている。エンコーダは、これら二つの層をエンコードするために標準的なMVCエンコーダを使ってもよく、あるいはRPUT(図示せず)(たとえばRPU 125)を使ってもよい。
受信器では、図10のBに描かれるように、単一のBLデコーダ1035をもつ受信器は二分の一解像度左ビューおよびその奥行きマップをデコードしうる。追加的なELデコーダ1045(たとえば、受信器RPU 140を含んでいてもいなくてもよいMVCデコーダ)をもつ受信器は、二分の一解像度右ビューおよびその奥行きマップをもデコードできる。二つのビューを組み合わせることによって、受信器は二分の一解像度(またはフレーム・レート互換)3D信号をレンダリングすることができる。
ある代替的な実施形態では、図10のAにおいて、ELストリーム1017において、水平方向の二分の一解像度R信号および水平方向の二分の一解像度ZR信号を伝送する代わりに、垂直方向の二分の一解像度信号R'(たとえば上下式信号117の下)および垂直方向の二分の一解像度ZR'を伝送してもよい。
図11のAは、BL 1112およびEL 1117の二つの層を使う奥行きマップ・データ送達の実施形態を描いている。基本層1112は隣り合わせ式L/Rピクチャー(たとえば112)のルーマおよびクロマ成分を含む。EL 1117層は二つのデータ・セットを含む:(a)テクスチャーRPU 1125を使って基本層隣り合わせ式信号を参照することによって符号化された上下式L'/R'信号(たとえば117)のルーマの符号化された表現(1117-Y)および(b)上下式信号(L'/R')のクロマ成分(1117-UV)のためにリザーブされている空間において担持される奥行きマップ・データ。ZLおよびZL'はいずれももとの左ビュー奥行きマップに対して垂直方向に四分の一解像度、水平方向に四分の一解像度である。組み合わされて、ZLおよびZL'はもとの左ビュー奥行きマップの四分の一解像度、たとえば水平方向および垂直方向の両方で二分の一解像度を表わす。デコーダでは、上下式ピクチャー(1117-Y)に関連付けられたクロマ・データは隣り合わせ式ピクチャーからのクロマ・データ(たとえば1112-UV)を使って補間されてもよい。
図11のBに描かれるように、単一のBLデコーダ1135をもつ受信器は、FC 3D信号をデコードしてもよい。二層デコーダをもつ受信器は、上下式L'/R'信号および奥行きマップ・データをもデコードしてもよく、こうして両方のビューについてFCFR 3D信号および奥行きマップ・データを再構成できる。
図12のAは、単一層を使う奥行きマップ送達フォーマットのための例示的な実施形態を描いている。層1205Aは、いずれもフル解像度の左右のビュー(LおよびR)と、それらの対応するフル解像度奥行きマップ・データ(ZLおよびZR)を含む。何らかの実施形態では、LおよびRビューは、レガシー・ディスプレイを受け容れるためにより低い解像度のサブピクチャーに分割されてもよい。たとえば、4K解像度ピクチャーは四つの2Kのサブピクチャーを含んでいてもよく、あるいは2Kサブピクチャーは四つの四分の一解像度ピクチャーを担持していてもよい。図12のAに描かれるように、クロマ・チャネル1205-UVはクロマ・データおよび追加的な奥行きマップ・データ(たとえばZ'LおよびZ'R)の両方を担持しうる。
図12のAに描かれるように、画像データ(たとえばLまたはR)およびその対応する奥行きデータ(たとえばZLまたはZR)は垂直方向に整列されてもよい。図12のBに描かれるもう一つの実施形態では、画像データおよびその対応する奥行きデータは水平方向も整列されてもよい。
図13のAは、二層奥行きマップ送達フォーマットの例示的な実施形態を描いている。このフォーマットは、図7に描かれているフォーマットと同様だが、二分の一解像度の左右のビューを担持する代わりに、この方法は基本層(1305)および向上層(1325)両方においてフル解像度データを担持する。LおよびRピクチャーはフレーム・レートの二倍で伝送されうる。RPUZ 1330は、基本層から奥行きマップ・データを予測し、それを向上層をエンコードするための代替的な参照フレームとして使うことによって、向上層の符号化効率を改善するために使われる。
いくつかの実施形態はRPUZ 1330をスキップして、奥行きマップ・データ1325をもう一つの基本層としてそれ自身でエンコードしてもよい。
いくつかの実施形態では、RPUZ 1330は、基本層1305からの情報を利用して、推定奥行きデータZELおよびZERを抽出してもよい。その際、向上層1325は、もとのZLおよびZR奥行きデータを含む代わりに、RZL=ZL−ZELおよびRZR=ZR−ZERのような奥行きマップ残差値を含んでいてもよい。
図13のAに描かれた送達フォーマットを与えられて、図13のBは、いくつかの代替的な受信器配位を描いている。単一のBLデコーダ1335をもつ受信器はフル解像度3Dストリームをデコードしうる。追加的なELデコーダ1345をもつ受信器は対応する奥行きデータをもデコードしうる。
図14は、ピクチャー・データおよび奥行きマップ・データの両方を担持するための単一層伝送フォーマットの例示的な実施形態を描いている。ピクチャー・データおよび奥行きデータは、たとえばフレームまたはシーン・レベルでインターリーブされた仕方で伝送される。ピクチャーは、各ビューのフレーム・レートの四倍のスピード・レートで伝送されうる。基本層1305は以下の層成分を含んでいてもよい:フル解像度左ビュー1305-L、フル解像度左奥行きマップ1305-ZL、フル解像度右ビュー1305-Rおよびフル解像度右奥行きマップ1305-ZR。いくつかの実施形態は、この1305層の諸成分を選択的にスキップすることを決めてもよい。たとえば、エンコーダはビデオ・フレームの集合(たとえば映画シーン)についてはすべての左および右ビュー(L+R)を伝送するが、シーンの先頭においては奥行きマップ・データのみを伝送してもよい。あるいはまた、エンコーダは、L+ZLまたはR+ZRデータのみを伝送してもよい。このフォーマットにおける追加的なメタデータが、デコーダに対して、層成分のシーケンスを示してもよい。
〈非対称的な空間的多重化〉
図15のAは、ある実施形態に基づく、奥行きマップを送達するための単一層アプローチの例を描いている。このアプローチは、先に描いた単一層または二層アプローチ(たとえば図5、図9のAおよび図10のA)と同様だが、非対称的な空間的多重化を使う。すなわち、ピクチャー・ビューおよびその関連する奥行きマップの両方を組み合わせる多重化されたピクチャー(たとえば1512)において、ピクチャー・ビュー(たとえば左ビュー(L))とその関連する奥行きマップ(たとえばZL)の解像度が等しくないサイズをもつ。
ピクセル解像度h×w(たとえばh=1080、w=1920)をもつ多重化された入力フレーム(たとえば1512)が与えられて、ある実施形態では、サブサンプリングされた左ビュー(L)はその関連する奥行きマップより多くのピクセルを割り当てられてもよい。よって、1>a≧1/2であるスケールaを与えられて、もとの左ビュー・ピクチャーはサイズh×awにスケーリング(たとえばサブサンプリング)されてもよく、一方、奥行きマップはサイズh×(1−a)wにスケーリングされてもよい。このアプローチは、対称的な左および右ビューのピクチャー(たとえばa=1/2の場合)より鮮鋭な3Dピクチャーにつながることがある。
先に論じたように、任意的に、追加的な奥行きデータ(たとえばZL'およびZL'')が、符号化されたフレームの対応するクロマ成分(たとえば1512-UV)に埋め込まれてもよい。
ある実施形態では、AVC/H.264または来るべきHEVCビデオ符号化規格において定義されるのと同様の、エンコード・ビットストリームにおけるトリミング長方形およびアスペクト比シンタックス・パラメータを使うことによって、ピクチャーの有効な領域(たとえばh×aw)を定義することによって、後方互換性が達成されてもよい。そのような実装のもとでは、レガシー2D受信器は、これらのパラメータによって定義されたピクチャー領域(たとえばL)のみを抽出し、デコードし、表示し、奥行きマップ情報(たとえばZL)を無視してもよい。3D機能のある受信器はピクチャー全体をデコードし、トリミング・パラメータを用いてピクチャー領域および奥行きマップ領域を決定し、次いで複数のビューをレンダリングするために奥行きマップ情報を使うことができる。3D受信器は、受領されたトリミングおよびアスペクト比パラメータを使って、必要に応じて2Dピクチャーおよび奥行きをスケーリングできる。
ピクチャー毎にピクチャー配置についての情報を含む補助データ(またはメタデータ)も伝送されてもよい。
同じ送達フォーマットは、BL 1512において、サブ解像度の左ビュー(L)がサブ解像度の右ビュー(R)または上下式L'/R'信号(147)の上(L')もしくは上下式L'/R'信号(147)の下(R')のスケーリングされたバージョンによって置き換えられてもよく、左ビュー奥行きマップが対応する奥行きマップによって置き換えられる代替的な実施形態において使用されてもよい。いくつかの実施形態(図4のAおよび図15のBに示されるような)では、非対称的な空間的多重化は垂直方向に適用されてもよい。いくつかの実施形態(図示せず)では、非対称的な空間的多重化は水平および垂直方向の両方に適用されてもよい。
ある実施形態において、図15のCはセグメント分割された奥行きマップに基づく代替的な奥行き送達フォーマットの例を描いている。そのような実施形態では、伝送される奥行きマップのアスペクト比が、伝送される画像ビューのアスペクト比によりよくマッチできる。一例として、入力の1080×1920画像および図15のAに描かれるような非対称的な多重化フォーマットを考える。ここで、限定することなく、a=2/3である。その際、ある実施形態では、ルミナンス信号1512-Y(または1512C-Y)が1080×1280解像度でスケーリングされた一つのビュー(たとえば左ビューL)と、1080×640解像度でスケーリングされた対応する奥行きマップ(ZL)を含んでいてもよい。いくつかの実施形態では、もとのアスペクト比によりよくマッチする540×960の奥行きマップを伝送することがより有益であることがある。そのような奥行きマップは、水平方向に二つの連続する部分(たとえばZLAおよびZLB)にセグメント分割されてもよく、これは図15のCに描かれるように、互いに上下に積み重ねることによって多重化されてもよい。よって、ある例示的な実施形態では、ルミナンス信号1512C-YSは二つの多重化された部分を含んでいてもよい:第一の解像度(たとえば1080×1440)でスケーリングされた画像部分(たとえば左ビューL)と、奥行きマップ部分を形成するよう一緒に多重化される二つ以上の奥行きマップ・セグメントである。一例では、540×960の入力奥行きマップの二つの奥行きマップ・セグメント(たとえば540×480ZLAおよび540×480ZLB)が垂直方向に積み重ねられてもよい。
いくつかの実施形態では、奥行きマップは二つより多くのセグメントにセグメント分割されてもよい。いくつかの実施形態では、奥行きマップは垂直方向でセグメント分割されてもよい。いくつかの実施形態では、奥行きマップは垂直および水平方向の両方でセグメント分割されてもよい。いくつかの実施形態では、奥行きマップは不均等なセグメントにセグメント分割されてもよい。いくつかの実施形態では、セグメントは水平方向に、垂直方向にまたは垂直および水平方向の両方に積み重ねられてもよい。
いくつかの実施形態では、セグメント分割された奥行きマップの一つまたは複数は、多重化された画像の一部として記憶される前に水平または垂直方向に反転されてもよい。実験によれば、そのような反転により、符号化された多重化された画像(たとえば1512C-YS)のテクスチャー部分と奥行き部分の間の境界における符号化アーチファクトが軽減されることが示された。さらに、分割した奥行きマップ画像の中心における符号化アーチファクトが少なくなる。
ある例示的な実施形態において、d[i,j]が奥行きマップ(たとえばZLB)のセグメントのピクセル値を表わすとする。Dwがこのセグメントの幅を表わすとする。このセグメントのピクセル値が左垂直軸のまわりに反転されたら、i番目の行について、水平反転された(horizontally flipped)セグメント(d_hf(i,j))のピクセル値は
for (j=0; j<Dw; j++)
d_hf[i,j]=d[i,Dw−j];
として決定されうる。
セグメント分割された奥行きマップ(たとえば1512C-YS)をもつ画像を受領するデコーダは、メタデータを使って、デコードされた奥行きマップ・セグメントすべてを適正に整列させてもとの奥行きマップ(たとえばZL)を再構成し、それにより適正な3D出力画像を再生成してもよい。どの反転された奥行きマップ・セグメントも、最終的な出力をレンダリングするために使われる前にもとの配向に反転し戻される必要がある。
いくつかの実施形態では、非対称的な空間的多重化および奥行きマップ・セグメント分割は、入力画像の両方の画像ビューを含む奥行き送達フォーマット(たとえば図12のAおよびB)にも適用されてもよい。
〈代替的な三層送達フォーマット〉
図16Aは、三層送達フォーマットに基づくある実施形態に従って3Dビデオおよび奥行きデータを伝送するためのもう一つの例を描いている。図16Aは図2Aおよび図2Cに描かれる実施形態の変形と考えられてもよい。図16Aに描かれるように、最初の二つの層BL 212およびEL-1 217は伝統的な3D FCFR層BL 112およびEL 117に対応する。層EL-2 1610はEL-1 217とは独立に、BL 212からの予測データに基づいて、RPUT 225およびRPUZ 230に対応しうるRPUTおよび任意的なRPUZ(1620)を使って符号化される。この例においては、同じL'ビデオ・データ(または代替的にR'データ)がEL-1およびEL-2層の両方において符号化される。図16Bに描かれるように、二つだけのデコーダ(たとえばBLデコーダ250およびELデコーダ1 255)をもつ受信器では、ユーザーは選択的に、BLおよびEL-1ストリームをデコードしてFCFR 3Dストリームを生成するか、あるいはBLおよびEL-2ストリームをデコードして裸眼立体視表示に好適なFRストリームおよび奥行きデータ(たとえばFR L+ZL)を生成することができる。
ある実施形態では、1620のRPUZプロセスはなくすことができる。エンコーダは、単に、EL-2 1610層の符号化プロセスの間、ZL奥行きデータを予測するために一定のフラットなグレー値を使ってもよい(たとえば、予測器のすべてのピクセル値が8ビット・ピクチャーについて128に等しく設定されてもよい)。
図16Cは、ある実施形態に基づく、3Dビデオおよび奥行きデータを送達するためのもう一つの例を描いている。この実施形態は図16Aに描かれたものと同様だが、ELストリームはいずれもクロマ・データを搬送しない。ある実施形態では、EL-1(1630)およびEL-2(1635)におけるすべてのクロマ情報が固定値(たとえば8ビット・ピクチャの場合128)に設定される。実験によれば、これにより、全体的なビットレートを有意に節約できる一方、視覚的品質に対する影響が最小限であることが示される。クロマ・データはこれでも、BLストリームのクロマ・データ(212-UV)に基づいて再構成されることができる。適正なデコードのために、エンコーダRPUは(たとえばRPU信号伝達または他のメタデータを通じて)デコーダに、EL-1またはEL-2ストリーム中のいかなるデコードされたクロマ・データも無視するよう、通知する必要があることがある。
図16Dは、図16Aのもう一つの例示的な変形である。ここではZLおよびZRデータがEL-2信号1640において担持されるが、それぞれ低下した垂直および水平解像度においてである。図16Eに描かれるように、二つのデコーダをもつ受信器は、今や、裸眼立体視3Dアプリケーションのための左右の奥行きデータをもつ、FCFR 3D信号またはFC 3D信号のいずれかをデコードしうる。
〈奥行きマップ・データをもつ代替的な二層FCFR送達フォーマット〉
図17のAは、二層送達フォーマットに基づくある実施形態に従って3Dビデオおよび奥行きデータを伝送するためのもう一つの例を描いている。H.264のような多くの圧縮標準において、ビデオ・シーケンス中のエンコードされたピクチャーのサイズは所定のマクロブロック・サイズ(たとえば16×16)の整数倍である必要がある。そうでない場合には、ピクチャー・サイズをしかるべく修正するために、ピクチャーの下部および/または側部に余剰のピクセルが加えられる。一例として、サイズ1920×1080をもつHD信号の符号化を考える。1920は16の倍数であるが、1080はそうではない。ある例示的な実施形態では、そのようなストリームの各ピクチャーは、追加の8行をパディングされて1920×1088のピクチャーを形成してもよい。図17のAに描かれるように、ある実施形態では、このパディング(たとえば1710および1715)は奥行きデータを伝送するために使用されることができる。
図17のAに描かれるように、ある実施形態では、基本層(BL)は二つの部分を含む:隣り合わせ式(たとえば1920×1080)多重化ピクチャー(112)と、左ビューまたは右ビューいずれかについての奥行きデータのサブサンプリングされたバージョン(たとえば1920×8ZL' 1710)である。奥行きデータはクロマ情報をもたないので、ある実施形態では、BL信号の追加のパディング行についてのクロマ関係のデータ(1735)は単に一定値(たとえば128)に設定されてもよい。
ある実施形態では、信号ZL' 1710は次のように生成されうる。ZLは二分の一高解像度左ビュー奥行きデータ信号(たとえば960×540)を表わすとする。この信号は、水平方向および垂直方向の両方でフィルタリングおよびサブサンプリングされて、パディング・データ(たとえば1920×8)の解像度内に収まるサブサンプリングされたバージョンを生成してもよい。たとえば、960×540信号を与えられて、240×60の信号ZL'を生成してもよい。次いで、240*60=14,400ZL'バイトを、任意の好適なパッキング方式を使って、1920*8=15,360バイトの利用可能な空間中にパッキングすることができる。
図17のAに描かれるように、ある実施形態では、向上層(EL)は上下式データ・ルミナンス・データ(117-Y)、より低解像度の左ビューまたは右ビュー奥行きデータ(たとえばZR' 1715)および高解像度左ビューおよび右ビュー奥行きデータ(1745-Uおよび1745-V)を含む。たとえば、ルミナンス信号において、ZR' 1715はもとのZR奥行きデータの240×60のサブサンプリングされたバージョンが1920×8のパディング領域中にパッキングされたものを含んでいてもよい。クロマ(1745)については、上下式信号(117)のクロマを伝送する代わりに、高解像度ZRおよびZL奥行きデータを伝送してもよい。ある実施形態では、U(またはCb)クロマ・データを伝送する代わりに、ZRおよびZLの偶数(even)列(ZR-e、ZL-e 1745)を伝送し、117のV(またはCr)データを伝送する代わりに、ZRおよびZLの奇数(odd)列(ZR-o、ZL-o 1745)を伝送してもよい。BLの場合と同様に、ZR'データ1715はクロマ情報をもたず、よってその対応するクロマ・データ(1740)は固定値(たとえば128)に設定されてもよい。
層間予測要求およびマクロブロック・データの符号化および復号の逐次的な性質のため、実際上、ある時刻tに符号化されるフレームについて少なくとも奥行きデータZR'(1715)が、実際には、前に、たとえば時刻t−1またはそれ以前に符号化されたフレームについての奥行きデータを表わすことがある。この遅延は、RPUZ 1730が、向上層におけるZLおよびZR(1765)を符号化(または復号)するために必要とされるすべての奥行きデータ(たとえばZR')を完全に再構成できるようにするために必要であることがある。たとえば、エンコードの際、時刻T0においては、EL(T0)フレームはダミーZR'データを含んでいてもよい(たとえばすべての値が128に等しく設定されている)。次いで、EL(T1)フレームがT0フレームの奥行きデータを含んでいてもよく、EL(T2)フレームがT1フレームの奥行きデータを含んでいてもよく、などとなる。デコードの際には、第一のデコードされたフレームのダミー奥行きデータは無視され、奥行きデータは少なくとも一フレーム遅れで復元される。
ELのルミナンスは第二のELエンコーダを使ってそれ自身でエンコードされることができ、あるいは図17のAに描かれるように、基本層を参照してテクスチャーRPUT 1725を使ってエンコードされることができる。奥行きマップRPUZ(1730)が使われてもよく、それによりELの「クロマ」空間における高解像度奥行きデータが、サブサンプリングされたZL'(1710)およびZR'データ(1715)を考慮に入れることによって符号化されうる。たとえば、ある実施形態において、RPUZ(1730)は単純なアップサンプリング器を有していてもよい。
図17のAに描かれたビットストリームを与えられて、単一デコーダがBLビットストリームをデコードし、フレーム互換(FC)3Dストリームおよびビューの一方についてのサブサンプリングされた奥行きデータを抽出できる。二層(たとえばMVC)デコーダは、FCFR 3DストリームおよびZLおよびZR奥行きデータをデコードしうる。
図17のBは、図17のAに描かれた奥行きマップ送達フォーマットの変形を描いている。符号化効率を改善するために、もとの奥行きデータZLおよびZR(1745-Uおよび1745-V)を符号化する代わりに、エンコーダは、奥行きRPUZ 1730を使って、奥行き残差RZL=ZL−ZPLおよびRZR=ZR−ZPRを生成して符号化してもよい。ここで、ZPLおよびZPRは、ZL'(1710)およびZR'(1715)信号に基づく、予測されたZLおよびZRデータを表わす。これらの奥行き残差は次いで、ELストリームにおける「クロマ」情報(1765-Uおよび1765-V)の一部として符号化される。ある実施形態では、符号化および復号プロセスの間、残差奥行きマップ・データRZLおよびRZRデータ(1765)は、以前の符号化された残差奥行きマップ・データまたは固定値、例えば128を参照して符号化(または復号)されうる。よって、符号化されたZR'(1715)およびZL'(1710)に対する依存性はなく、先に論じたように前に符号化されたフレームからのZR'奥行きデータを使う必要はない。
もう一つの実施形態では、図17のAまたはBに描かれるELストリームは、奥行きデータを、EL-U(1745-Uまたは1765-U)またはEL-V(1745-Vまたは1765-V)領域の一部のみに含んでいてもよい。たとえば、ZR-o、ZL-o 1745-VストリームまたはRZR-o、RZL-o 1765-Vストリームは一定の値(たとえば128)によって置き換えられてもよい。このアプローチは、より低い奥行きマップ解像度を代償として、ビットレート要求を減らす。
ビットレート要求を減らすためのもう一つのアプローチは、一つのビューのみについての奥行きマップ・データ(たとえばZR)を伝送することを含む。そのようなシナリオでは、他方のビューの奥行き領域についてのすべてのデータ(たとえばZL)は、一定の値(たとえば128)で埋められてもよい。あるいはまた、単一のビューについての奥行きマップ・データ(たとえばZR)を前の二倍の解像度で伝送してもよい。たとえば、ある実施形態では、ZL-oおよびZL-e奥行きデータが追加的なZRデータによって置き換えられてもよい。
図17のAおよびBはいずれも、基本層が隣り合わせ式ストリームを含み、向上層が上下式ストリームを含む実施形態を描いている。他の実施形態では、同じプロセスは、BLが上下式のストリームを含み、ELが隣り合わせ式ストリームを含むシステムに適用されてもよい。
〈例示的なコンピュータ・システム実装〉
本発明の実施形態は、コンピュータ・システム、電子回路およびコンポーネントにおいて構成されたシステム、マイクロコントローラ、フィールド・プログラム可能なゲート・アレイ(FPGA)または他の構成設定可能もしくはプログラム可能な論理デバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)のような集積回路(IC)装置および/またはそのようなシステム、デバイスまたはコンポーネントの一つまたは複数を含む装置を用いて実装されてもよい。コンピュータおよび/またはICは、本稿に記載したような奥行きマップ送達フォーマットをエンコードおよびデコードすることに関係する命令を実行、制御または執行してもよい。コンピュータおよび/またはICは、本稿に記載したような奥行きマップ送達フォーマットをエンコードおよびデコードすることに関係する多様なパラメータまたは値の任意のものを計算してもよい。画像およびビデオのダイナミックレンジ拡張の実施形態は、ハードウェア、ソフトウェア、ファームウェアおよびそれらのさまざまな組み合わせにおいて実装されうる。
本発明のある種の実装は、プロセッサに本発明の方法を実行させるソフトウェア命令を実行するコンピュータ・プロセッサを有する。たとえば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどにおける一つまたは複数のプロセッサが、該プロセッサにとってアクセス可能なプログラム・メモリ中のソフトウェア命令を実行することによって、上記に記載したような奥行きマップ送達フォーマットをエンコードおよびデコードする方法を実装してもよい。本発明は、プログラム・プロダクトの形で提供されてもよい。プログラム・プロダクトは、データ・プロセッサによって実行されたときに該データ・プロセッサに本発明の方法を実行させる命令を含むコンピュータ可読信号のセットを担持する任意の媒体を含みうる。本発明に基づくプログラム・プロダクトは、幅広い多様な形のいかなるものであってもよい。プログラム・プロダクトは、たとえば、フロッピーディスケット、ハードディスクドライブを含む磁気データ記憶媒体、CD-ROM、DVDを含む光データ記憶媒体、ROM、フラッシュRAMを含む電子データ記憶媒体などのような物理的な媒体であってもよい。プログラム・プロダクト上のコンピュータ可読信号は任意的に圧縮または暗号化されていてもよい。
上記でコンポーネント(たとえば、ソフトウェア・モジュール、プロセッサ、組立体、装置、回路など)が言及されるとき、特に断わりのない限り、そのコンポーネントへの言及(「手段」への言及を含む)は、本発明の例示した実施例における機能を実行する開示される構造と構造的に等価ではないコンポーネントも含め、記載されるコンポーネントの機能を実行する(すなわち機能的に等価な)任意のコンポーネントをそのコンポーネントの等価物として含むと解釈されるべきである。
〈等価物、拡張、代替その他〉
このように、奥行きマップ送達フォーマットをエンコードおよびデコードすることに関係する例示的な実施形態について述べてきた。以上の明細書では、本発明の諸実施形態について、実装によって変わりうる数多くの個別的詳細に言及しつつ述べてきた。このように、何が本発明であるか、何が出願人によって本発明であると意図されているかの唯一にして排他的な指標は、この出願に対して付与される特許の請求項の、その後の訂正があればそれも含めてかかる請求項が特許された特定の形のものである。かかる請求項に含まれる用語について本稿で明示的に記載される定義があったとすればそれは請求項において使用される当該用語の意味を支配する。よって、請求項に明示的に記載されていない限定、要素、属性、特徴、利点もしくは特性は、いかなる仕方であれかかる請求項の範囲を限定すべきではない。よって、明細書および図面は制約する意味ではなく例示的な意味で見なされるべきものである。
いくつかの態様を記載しておく。
〔態様1〕
3D奥行きマップ・データを送達する方法であって:
第一のビューおよび第二のビューを含む入力ピクチャーにアクセスする段階であって、各ビューはある水平方向および垂直方向ピクセル解像度を有する、段階と;
前記入力ピクチャーについての入力奥行きデータにアクセスする段階と;
前記入力ピクチャーに基づいて隣り合わせ式ピクチャーおよび上下式ピクチャーを生成する段階と;
エンコーダを使って前記隣り合わせ式ピクチャーをエンコードして、符号化された基本層ストリーム(212)を生成する段階と;
前記エンコーダおよびテクスチャーRPU(225)を使って前記上下式ピクチャーをエンコードして、符号化された第一の向上層(EL-1、217)を生成する段階であって、前記符号化された第一の向上層は部分的には前記基本層ストリームに基づいて符号化される、段階と;
前記エンコーダおよびZ-RPU(230)を使って前記隣り合わせ式ピクチャーについての奥行きデータをエンコードして、符号化された第二の向上層(EL-2)を生成する段階であって、前記符号化された第二の向上層は部分的には前記基本層ストリームに基づいて符号化され、前記隣り合わせ式ピクチャーについての前記奥行きデータは前記入力ピクチャーの前記入力奥行きデータに基づいて生成される、段階とを含む、
方法。
〔態様2〕
前記符号化された基本層、前記符号化された第一の向上層および前記符号化された第二の向上層を出力符号化ビットストリームに多重化する段階をさらに含む、態様1記載の方法。
〔態様3〕
前記Z-RPUが、第一のビューの奥行きマップの推定および第二のビューの奥行きマップの推定を、前記入力ピクチャーに基づいて生成する、態様1記載の方法。
〔態様4〕
出力ビデオを生成する方法であって:
符号化された基本層(BL)ストリーム(212)を、BLデコーダ(250)を用いてデコードして、フレーム互換な(FC)3Dビデオ・ストリームを生成する段階と;
符号化された第一の向上層(EL)ストリーム(217)を、第一のELデコーダ(255)およびテクスチャーRPUを用いてデコードして、フレーム互換なフル解像度(FCFR)3Dビデオ・ストリームを生成する段階であって、前記第一のELストリームのデコードは部分的には前記基本層ストリームから生成されるデータに基づく、段階と;
符号化された第二の向上層ストリーム(219S)を、第二のELデコーダ(265)およびZ-RPUを用いてデコードして、出力奥行きマップ・データを生成する段階であって、前記符号化された第二の向上層ストリームのデコードは部分的には前記基本層ストリームから生成されるデータに基づく、段階とを含む、
方法。
〔態様5〕
3D奥行きマップ・データを送達する方法であって:
第一のビューおよび第二のビューを含む入力ピクチャーにアクセスする段階であって、各ビューはある水平方向および垂直方向ピクセル解像度を有する、段階と;
前記入力ピクチャーについての入力奥行きデータにアクセスする段階と;
前記入力ピクチャーに基づいて隣り合わせ式ピクチャーおよび上下式ピクチャーを生成する段階と;
エンコーダを使って前記上下式ピクチャーをエンコードして、符号化された基本層ストリーム(217)を生成する段階と;
前記エンコーダおよびテクスチャーRPU(225)を使って前記隣り合わせ式ピクチャーをエンコードして、符号化された第一の向上層(EL-1、212)を生成する段階であって、前記符号化された第一の向上層は部分的には前記基本層ストリームに基づいて符号化される、段階と;
前記エンコーダおよびZ-RPU(230)を使って前記上下式ピクチャーについての奥行きデータをエンコードして、符号化された第二の向上層(EL-2)を生成する段階であって、前記符号化された第二の向上層は部分的には前記基本層に基づいて符号化され、前記上下式ピクチャーについての前記奥行きデータは前記入力ピクチャーの前記入力奥行きデータに基づいて生成される、段階とを含む、
方法。
〔態様6〕
3D奥行きマップ・データを送達する方法であって:
第一のビューおよび第二のビューを含む入力ピクチャーにアクセスする段階であって、各ビューはある水平方向および垂直方向ピクセル解像度を有する、段階と;
前記入力ピクチャーについての入力奥行きデータにアクセスする段階と;
前記入力ピクチャーに基づいて隣り合わせ式ピクチャーおよび上下式ピクチャーを生成する段階と;
エンコーダを使って前記隣り合わせ式ピクチャーをエンコードして、符号化された基本層ストリーム(312)を生成する段階と;
前記エンコーダおよびテクスチャーRPU(325)を使って前記上下式ピクチャーをエンコードして、符号化された第一の向上層(EL-1、317)を生成する段階であって、前記符号化された第一の向上層は部分的には前記基本層ストリームに基づいて符号化される、段階と;
前記エンコーダを使って隣り合わせ式奥行きマップ・データをエンコードして、符号化された第二の向上層(319)を生成する段階であって、前記前記隣り合わせ式奥行きマップ・データは前記入力ピクチャーの前記入力奥行きデータに基づく、段階とを含む、
方法。
〔態様7〕
態様6記載の方法であって、前記隣り合わせ奥行きマップ・データは残差マップ・データを含み、当該方法が前記残差奥行きマップ・データを生成することは:
Z-RPU(330)を用いて前記入力ピクチャーに基づく推定奥行きマップ・データを生成する段階と;
前記入力奥行きマップ・データと前記推定奥行きマップ・データとの間の差に基づいて前記残差奥行きマップ・データを生成する段階とを含む、
方法。
〔態様8〕
3D奥行きマップ・データを送達する方法であって:
第一のビューおよび第二のビューを含む入力ピクチャーにアクセスする段階であって、各ビューはある水平方向および垂直方向ピクセル解像度を有する、段階と;
前記入力ピクチャーについての入力奥行きデータにアクセスする段階と;
前記入力ピクチャーに基づいて隣り合わせ式ピクチャーを生成する段階と;
前記垂直方向ピクセル解像度の半分および前記入力ピクチャーの前記第一のビューと同じ水平方向ピクセル解像度をもつ第一の二分の一ピクチャー(L')を生成する段階と;
前記垂直方向ピクセル解像度の半分および前記入力ピクチャーの前記第二のビューと同じ水平方向ピクセル解像度をもつ第二の二分の一ピクチャー(R')を生成する段階と;
エンコーダを用いて前記隣り合わせ式ピクチャーをエンコードして、符号化された基本層(412)を生成する段階と;
前記エンコーダ、Z-RPU(430)およびテクスチャーRPU(425)を用いて前記第一の二分の一ピクチャーおよび前記第一の二分の一ピクチャーのための奥行きマップ・データをエンコードして、符号化された第一の向上層(417)を生成する段階であって、前記第一の向上層は部分的には前記基本層からのデータに基づく、段階と;
前記エンコーダ、Z-RPU(430)およびテクスチャーRPU(425)を用いて前記第二の二分の一ピクチャーおよび前記第二の二分の一ピクチャーのための奥行きマップ・データをエンコードして、符号化された第二の向上層(419)を生成する段階であって、前記第二の向上層は部分的には前記基本層からのデータに基づく、段階とを含む、
方法。
〔態様9〕
出力ビデオを生成する方法であって:
符号化された基本層(BL)ストリームを、BLデコーダ(450)を用いてデコードして、フレーム互換な(FC)3Dビデオ・ストリームを生成する段階と;
符号化された第一の向上層(EL-1)ストリームを、第一のELデコーダ(455)、テクスチャーRPUおよびZ-RPUを用いてデコードして、第一のビューのフル解像度ビデオ、第二のビューの二分の一解像度ビデオおよび前記第一のビューについての奥行きマップ・データを生成する段階であって、前記第一の向上ストリームのデコードは部分的には前記基本層ストリームからのデータに基づく、段階と;
符号化された第二の向上層ストリーム(419)を、第二のELデコーダ(460)、テクスチャーRPUおよびZ-RPUを用いてデコードして、FCFR 3Dビデオおよび第二のビューについての奥行きマップ・データを生成する段階であって、前記第二の向上ストリームのデコードは部分的には前記基本層ストリームからのデータに基づく、段階とを含む、
方法。
〔態様10〕
3D奥行きマップ・データを送達する方法であって:
第一のビューおよび第二のビューを含む入力ピクチャーにアクセスする段階であって、各ビューはある水平方向および垂直方向ピクセル解像度を有する、段階と;
前記入力ピクチャーについての入力奥行きデータにアクセスする段階と;
前記水平方向ピクセル解像度の半分および前記入力ピクチャーの前記第一のビューと同じ垂直方向ピクセル解像度をもつ第一の二分の一ピクチャーを生成する段階と;
前記水平方向ピクセル解像度の半分および前記入力ピクチャーの前記第二のビューと同じ垂直方向ピクセル解像度をもつ第二の二分の一ピクチャーを生成する段階と;
エンコーダを使って、前記第一の二分の一ピクチャーおよび第三の二分の一ピクチャーを有する多重化されたピクチャーを生成して、符号化された基本層(512)を生成する段階であって、前記第三の二分の一ピクチャーは前記第一の二分の一ピクチャーの奥行きマップ・データ(ZL)または前記第二の二分の一ピクチャーのいずれかを含む、段階とを含む、
方法。
〔態様11〕
3D奥行きマップ・データを送達する方法であって:
第一のビューおよび第二のビューを含む入力ピクチャーにアクセスする段階と;
前記入力ピクチャーについての入力奥行きデータにアクセスする段階と;
エンコーダを使って前記入力ピクチャーの前記第一のビューをエンコードして、第一の符号化された基本層ストリーム(612)を生成する段階と;
前記エンコーダを使って第三のピクチャーをエンコードして、第二の符号化された基本層ストリーム(617)を生成する段階であって、前記第三のピクチャーは前記入力ピクチャーの前記第一のビューの奥行きマップ・データまたは前記第二のビューのいずれかを含む、段階とを含む、
方法。
〔態様12〕
3D奥行きマップ・データを送達する方法であって:
第一のビューおよび第二のビューを含む入力ピクチャーにアクセスする段階であって、各ビューはある水平方向および垂直方向ピクセル解像度を有する、段階と;
前記水平方向ピクセル解像度の半分および前記入力ピクチャーの前記第一のビューと同じ垂直方向ピクセル解像度をもつ第一の二分の一ピクチャーを生成する段階と;
前記水平方向ピクセル解像度の半分および前記入力ピクチャーの前記第二のビューと同じ垂直方向ピクセル解像度をもつ第二の二分の一ピクチャーを生成する段階と;
前記垂直方向ピクセル解像度の半分および前記入力ピクチャーの前記第一のビューと同じ水平方向ピクセル解像度をもつ第三の二分の一ピクチャーを生成する段階と;
前記垂直方向ピクセル解像度の半分および前記入力ピクチャーの前記第二のビューと同じ水平方向ピクセル解像度をもつ第四の二分の一ピクチャーを生成する段階と;
エンコーダを使って前記第一の二分の一ピクチャーおよび前記第一の二分の一ピクチャーの奥行きマップ・データをエンコードして、符号化された基本層ストリーム(912)を生成する段階と;
前記エンコーダおよびテクスチャーRPU(925)を使って前記第三の二分の一ピクチャー(L')および前記第四の二分の一ピクチャー(R')をエンコードして、符号化された第一の向上層ストリーム(EL-1、917)を生成する段階であって、前記符号化された第一のELストリームにおける前記第三の二分の一ピクチャーのエンコードは、部分的には前記第一の二分の一ピクチャーに基づく、段階と;
前記エンコーダ、前記テクスチャーRPU(925)およびZ-RPU(930)を使って前記第二の二分の一ピクチャーおよび前記第二の二分の一ピクチャーのための奥行きマップ・データをエンコードして、符号化された第二の向上層(EL-2、919)を生成する段階であって、前記符号化された前記第二のELにおける前記第二の二分の一ピクチャーのエンコードは、部分的には前記第四の二分の一ピクチャーに基づき、前記第二の二分の一ピクチャーの前記奥行きマップ・データの符号化は、部分的には前記Z-RPUを通じて前記入力ピクチャーから生成されたデータに基づく、段階とを含む、
方法。
〔態様13〕
出力ビデオを生成する方法であって:
符号化された基本層(BL)ストリーム(412)を、BLデコーダ(950)を用いてデコードして、第一のビューの二分の一解像度信号および前記第一のビューの奥行きマップを生成する段階と;
符号化された第一の向上層(EL-1)ストリームを、第一のELデコーダ(955)およびテクスチャーRPUを用いてデコードして、フレーム互換な3Dビデオおよび第二のビューの二分の一解像度信号を生成する段階であって、前記EL-1層のデコードは部分的には前記基本層から抽出されるデータに基づく、段階と;
符号化された第二の向上層ストリーム(EL-2)を、第二のELデコーダ(960)、前記テクスチャーRPUおよびZ-RPUを用いてデコードして、FCFR 3Dビデオおよび前記第二のビューについての奥行きマップ・データを生成する段階であって、前記EL-2層のデコードは部分的には前記基本層ストリームおよび前記第一の向上層から抽出されるデータに基づく、段階とを含む、
方法。
〔態様14〕
3D奥行きマップ・データを送達する方法であって:
第一のビューおよび第二のビューを含む入力ピクチャーにアクセスする段階であって、各ビューはある水平方向および垂直方向ピクセル解像度を有する、段階と;
前記入力ピクチャーについての入力奥行きデータにアクセスする段階と;
前記入力ピクチャーに基づいて隣り合わせ式ピクチャーを生成する段階と;
前記入力ピクチャーに基づいて上下式ピクチャーを生成する段階と;
エンコーダを使って前記隣り合わせ式ピクチャーをエンコードして、符号化された基本層ストリーム(1112)を生成する段階と;
前記エンコーダ、テクスチャーRPU(1125)およびZ-RPUを使って、第一の部分(1117-Y)および第二の部分(1117-UV)を含む符号化された向上層(EL)ストリーム(1117)をエンコードする段階であって、前記第一の部分は前記上下式ピクチャーからのルーマ成分データを含み、前記第二の部分は前記入力ピクチャーの前記入力奥行きデータに基づく奥行きデータを含む、段階とを含む、
方法。
〔態様15〕
出力ビデオを生成する方法であって:
符号化された基本層ストリームを、基本層デコーダ(1135)を用いてデコードして、FC 3Dビデオ出力を生成する段階と;
符号化された向上層ストリームを、向上層デコーダ(1145)、テクスチャーRPUおよびZ-RPUを用いてデコードして、出力ルミナンス・データおよび奥行きマップ・データを生成する段階であって、前記符号化された向上層ストリームのデコードは部分的には前記基本層からのデータに基づく、段階と;
前記FC 3Dストリームおよび前記出力ルミナンス・データに基づいてFCFR 3Dストリームを生成する段階とを含む、
方法。
〔態様16〕
態様16記載の方法であって、さらに:
ルーマ隣り合わせ式データおよびクロマ隣り合わせ式データを含む隣り合わせ式ピクチャーを前記BLデコーダを用いてデコードする段階と;
前記出力ルミナンス・データに基づいて上下式ピクチャーについてのルーマ・データを生成する段階と;
前記隣り合わせ式ピクチャーの前記クロマ隣り合わせ式データに基づいて前記上下式ピクチャーについてのクロマ・データを補間する段階とを含む、
方法。
〔態様17〕
態様1、5、6または15のうちいずれか一項記載の方法であって、さらに:
前記水平方向ピクセル解像度の半分および前記入力ピクチャーの前記第一のビューと同じ垂直方向ピクセル解像度をもつ第一の二分の一ピクチャーを生成する段階と;
前記水平方向ピクセル解像度の半分および前記入力ピクチャーの前記第二のビューと同じ垂直方向ピクセル解像度をもつ第二の二分の一ピクチャーを生成する段階と;
前記第一の二分の一ピクチャーおよび前記第二の二分の一ピクチャーを多重化して前記隣り合わせ式ピクチャーを生成する段階とを含む、
方法。
〔態様18〕
態様1、5、6または15のうちいずれか一項記載の方法であって、さらに:
前記垂直方向ピクセル解像度の半分および前記入力ピクチャーの前記第一のビューと同じ水平方向ピクセル解像度をもつ第三の二分の一ピクチャーを生成する段階と;
前記垂直方向ピクセル解像度の半分および前記入力ピクチャーの前記第二のビューと同じ水平方向ピクセル解像度をもつ第四の二分の一ピクチャーを生成する段階と;
前記第三の二分の一ピクチャーおよび前記第四の二分の一ピクチャーを多重化して前記上下式ピクチャーを生成する段階とを含む、
方法。
〔態様19〕
3D奥行きマップ・データを送達する方法であって:
入力立体視ピクチャーおよび入力奥行きデータにアクセスする段階と;
前記入力立体視ピクチャーに応答して第一の空間的サイズの画像データ・パーティションを生成する段階と;
前記入力奥行きデータに応答して前記第一のサイズとは異なる第二の空間的サイズをもつ奥行きマップ・データ・パーティションを生成する段階と;
前記画像データ・パーティションおよび前記奥行きマップ・データ・パーティションを多重化して多重化出力ピクチャーを形成する段階と;
エンコーダを使って、前記多重化出力ピクチャーをエンコードして、符号化されたビットストリームを生成する段階とを含む、
方法。
〔態様20〕
前記画像データ・パーティションおよび前記奥行きマップ・データ・パーティションが等しい水平方向解像度をもつ、態様19記載の方法。
〔態様21〕
前記画像データ・パーティションが前記奥行きマップ・データ・パーティションより高い水平方向解像度をもつ、態様19記載の方法。
〔態様22〕
前記画像データ・パーティションが前記入力立体視ピクチャーの第一のビューまたは第二のビューに基づき、前記奥行きマップ・データ・パーティションが前記入力立体視ピクチャーの第一のビューまたは第二のビューの前記奥行きデータに基づく、態様19記載の方法。
〔態様23〕
3D奥行きマップ・データを送達する方法であって:
第一のビューおよび第二のビューを含む入力ピクチャーにアクセスする段階であって、各ビューはある水平方向および垂直方向ピクセル解像度を有する、段階と;
前記入力ピクチャーについての入力奥行きデータにアクセスする段階と;
前記入力ピクチャーに基づいて隣り合わせ式ピクチャーおよび上下式ピクチャーを生成する段階と;
エンコーダを使って前記隣り合わせ式ピクチャーをエンコードして、符号化された基本層ストリーム(212)を生成する段階と;
前記エンコーダおよびテクスチャーRPU(225)を使って前記上下式ピクチャーをエンコードして、符号化された第一の向上層(EL-1、217)を生成する段階であって、前記符号化された第一の向上層は部分的には前記基本層ストリームに基づいて符号化される、段階と;
前記エンコーダおよび前記テクスチャーRPUを使って、前記上下式ピクチャーの一部および第二の奥行きデータをエンコードして、符号化された第二の向上層(EL-2)を生成する段階であって、前記符号化された第二の向上層は部分的には前記基本層に基づいて符号化され、前記第二の奥行きデータは前記入力ピクチャーの前記入力奥行きデータに基づいて生成される、段階とを含む、
方法。
〔態様24〕
前記第一の向上層および前記第二の向上層をエンコードする前に、前記上下式ピクチャーにおけるクロマ・ピクセルの値が、固定されたピクセル値に設定される、態様23記載の方法。
〔態様25〕
前記第二の奥行きデータが、前記入力ピクチャーの一つのみのビューからの水平方向にサブサンプリングされた奥行きデータを含む、態様23記載の方法。
〔態様26〕
前記第二の奥行きデータが、前記入力ピクチャーの左ビューおよび右ビュー両方からの水平方向にサブサンプリングされ垂直方向にサブサンプリングされた奥行きデータを含む、態様23記載の方法。
〔態様27〕
3D奥行きマップ・データを送達する方法であって:
第一のビューおよび第二のビューを含む入力ピクチャーにアクセスする段階であって、各ビューは第一の水平方向ピクセル解像度および第一の垂直方向ピクセル解像度を有する、段階と;
前記入力ピクチャーについての第一の入力奥行きデータおよび前にエンコードされたピクチャーからの第二の入力奥行きデータにアクセスする段階と;
前記入力ピクチャーに基づいて隣り合わせ式ピクチャー(112)および上下式ピクチャー(117)を生成する段階と;
前記隣り合わせ式ピクチャーおよび前記上下式ピクチャーを、パディングされたデータ(1710、1715)を用いてパディングして、パディングされた隣り合わせ式ピクチャーおよびパディングされた上下式ピクチャーを生成する段階であって、前記パディングされたデータは、前記第一の入力奥行きデータ、前記第二の入力奥行きデータまたは前記第一および第二の入力奥行きデータの組み合わせのいずれかに基づく第一の符号化された奥行きデータを含む、段階と;
エンコーダを使って前記パディングされた隣り合わせ式ピクチャーをエンコードして、符号化された基本層ストリームを生成する段階と;
前記パディングされた上下式ピクチャーのクロマ・ピクセル値を、前記第二の入力奥行きデータに基づく第二の符号化された奥行きデータで置き換えて、第二のパディングされた上下式ピクチャーを生成する段階と;
前記エンコーダおよびテクスチャーRPU(1725)を使って前記第二のパディングされた上下式ピクチャーをエンコードして、符号化された向上層ストリームを生成する段階であって、前記符号化された向上層ストリームは部分的には前記基本層ストリームに基づいて符号化される、段階とを含む、
方法。
〔態様28〕
前記パディングされた隣り合わせ式ピクチャーおよび前記パディングされた上下式ピクチャーのそれぞれが、あらかじめ定義されたマクロブロック・サイズの整数倍である垂直方向および水平方向の空間ピクセル解像度をもつ、態様27記載の方法。
〔態様29〕
前記第一の水平方向解像度または前記第一の垂直方向解像度の少なくとも一方があらかじめ定義されたマクロブロック・サイズの整数倍ではない、態様27記載の方法。
〔態様30〕
前記第一の符号化された奥行きデータは、前記第一の入力奥行きデータまたは前記第二の入力奥行きデータのいずれかから導出されるサブサンプリングされた奥行きデータを含む、態様27記載の方法。
〔態様31〕
前記第二の符号化された奥行きデータは、前記第一の符号化された奥行きデータより高い空間解像度で前記第二の入力奥行きデータから導出される奥行きデータを含む、態様27記載の方法。
〔態様32〕
前記第二の符号化された奥行きデータは、前記第一の入力奥行きデータと予測された奥行きデータとに基づいて生成された残差奥行きデータを含み、前記予測された奥行きデータは前記第一の符号化された奥行きデータに基づく、態様27記載の方法。
〔態様33〕
Z-RPU(1730)を使って前記ELストリームの前記第二の符号化された奥行きデータを圧縮する段階をさらに含み、前記向上層ストリームにおける圧縮された第二の符号化された奥行きデータは、部分的には前記第一の符号化された奥行きデータを参照して符号化される、態様27記載の方法。
〔態様34〕
3D奥行きマップ・データを送達する方法であって:
入力立体視ピクチャーおよび入力奥行きデータにアクセスする段階と;
前記入力立体視ピクチャーに応答して第一の空間的サイズの画像データ・パーティションを生成する段階と;
前記入力奥行きデータに応答してスケーリングされた奥行きマップを生成する段階と;
前記スケーリングされた奥行きマップを二つ以上の奥行きマップ・セグメントに分割する段階と;
前記奥行きマップ・セグメントの二つ以上を含む奥行きマップ・パーティションを生成する段階であって、前記奥行きマップ・データ・パーティションは、前記第一のサイズとは異なる第二の空間的サイズをもつ、段階と;
前記画像データ・パーティションおよび前記奥行きマップ・データ・パーティションを多重化して、多重化出力ピクチャーを形成する段階であって、前記奥行きマップ・パーティションにおける少なくとも一つの奥行きマップ・セグメントの位置は、前記スケーリングされた奥行きマップにおけるそのもとの位置に対してシフトされる、段階と;
エンコーダを使って、前記多重化出力ピクチャーをエンコードして、符号化されたビットストリームを生成する段階とを含む、
方法。
〔態様35〕
前記スケーリングされた奥行き画像が、水平方向または垂直方向を通じて分割される、態様34記載の方法。
〔態様36〕
前記奥行きマップ・データ・パーティションを生成する段階が、前記奥行きマップ・セグメントの少なくとも二つを垂直方向に位置させることを含み、前記奥行きマップ・セグメントの前記少なくとも二つは前記スケーリングされた奥行きマップにおいては水平方向に位置されていたものである、態様34記載の方法。
〔態様37〕
前記奥行きマップ・データ・パーティションを生成する段階が、前記奥行きマップ・セグメントの少なくとも二つを水平方向に位置させることを含み、前記奥行きマップ・セグメントの前記少なくとも二つは前記スケーリングされた奥行きマップにおいては垂直方向に位置されていたものである、態様34記載の方法。
〔態様38〕
3D奥行きマップ・データをデコードする方法であって:
符号化されたビットストリームをデコードして、画像データ・パーティションおよび奥行きマップ・データ・パーティションを生成する段階であって、前記奥行きマップ・データ・パーティションは、第一の空間的位置に位置されているシフトされた奥行きマップ・セグメントを有している、段階と;
前記シフトされた奥行きマップ・セグメントを、前記第一の空間的位置から第二の空間的位置にシフトして、前記第一の空間的位置とは異なる第二の空間的位置における奥行きマップ・セグメントを生成する段階と;
少なくとも、前記画像データ・パーティションおよび前記第二の空間的位置における前記奥行きマップ・セグメントに応答して、デコードされた出力信号を生成する段階とを含む、
方法。
〔態様39〕
前記エンコードする段階の前に、前記奥行きマップ・パーティションにおける少なくとも一つの奥行きマップ・セグメントを水平方向または垂直方向に反転させる段階をさらに含む、態様34記載の方法。
〔態様40〕
前記デコードされた出力信号を生成する前に、前記シフトされた奥行きマップ・セグメントを水平方向または垂直方向に反転させる段階をさらに含む、態様38記載の方法。
〔態様41〕
プロセッサを有し、態様1ないし4のうちいずれか一項記載の方法を実行するよう構成されている装置。
〔態様42〕
態様1ないし4のうちいずれか一項記載の方法を実行するためのコンピュータ実行可能命令を記憶している非一時的なコンピュータ可読記憶媒体。

Claims (9)

  1. 3D奥行きマップ・データを送達する方法であって:
    入力立体視ピクチャーおよび入力奥行きデータにアクセスする段階と;
    前記入力立体視ピクチャーに応答して第一の空間的サイズの画像データ・パーティションを生成する段階と;
    前記入力奥行きデータに応答してスケーリングされた奥行きマップを生成する段階と;
    前記スケーリングされた奥行きマップを二つ以上の奥行きマップ・セグメントに分割する段階と;
    前記奥行きマップ・セグメントの二つ以上を含む奥行きマップ・パーティションを生成する段階であって、前記奥行きマップ・データ・パーティションは、前記第一のサイズとは異なる第二の空間的サイズをもつ、段階と;
    前記画像データ・パーティションおよび前記奥行きマップ・データ・パーティションを多重化して、多重化出力ピクチャーを形成する段階であって、前記奥行きマップ・パーティションにおける少なくとも一つの奥行きマップ・セグメントの位置は、前記スケーリングされた奥行きマップにおけるそのもとの位置に対してシフトされる、段階と;
    エンコーダを使って、前記多重化出力ピクチャーをエンコードして、符号化されたビットストリームを生成する段階とを含む、
    方法。
  2. 前記スケーリングされた奥行き画像が、水平方向または垂直方向を通じて分割される、請求項1記載の方法。
  3. 前記奥行きマップ・データ・パーティションを生成する段階が、前記奥行きマップ・セグメントの少なくとも二つを垂直方向に位置させることを含み、前記奥行きマップ・セグメントの前記少なくとも二つは前記スケーリングされた奥行きマップにおいては水平方向に位置されていたものである、請求項1または2記載の方法。
  4. 前記奥行きマップ・データ・パーティションを生成する段階が、前記奥行きマップ・セグメントの少なくとも二つを水平方向に位置させることを含み、前記奥行きマップ・セグメントの前記少なくとも二つは前記スケーリングされた奥行きマップにおいては垂直方向に位置されていたものである、請求項1記載の方法。
  5. 3D奥行きマップ・データをデコードする方法であって:
    符号化されたビットストリームをデコードして、画像データ・パーティションおよび奥行きマップ・データ・パーティションを生成する段階であって、前記奥行きマップ・データ・パーティションは、第一の空間的位置に位置されているシフトされた奥行きマップ・セグメントを有している、段階と;
    前記シフトされた奥行きマップ・セグメントを、前記第一の空間的位置から第二の空間的位置にシフトして、前記第一の空間的位置とは異なる第二の空間的位置における奥行きマップ・セグメントを生成する段階と;
    少なくとも、前記画像データ・パーティションおよび前記第二の空間的位置における前記奥行きマップ・セグメントに応答して、デコードされた出力信号を生成する段階とを含む、
    方法。
  6. 前記エンコードする段階の前に、前記奥行きマップ・パーティションにおける少なくとも一つの奥行きマップ・セグメントを水平方向または垂直方向に反転させる段階をさらに含む、請求項5記載の方法。
  7. 前記デコードされた出力信号を生成する前に、前記シフトされた奥行きマップ・セグメントを水平方向または垂直方向に反転させる段階をさらに含む、請求項6記載の方法。
  8. プロセッサを有し、請求項1ないし7のうちいずれか一項記載の方法を実行するよう構成されている装置。
  9. 請求項1ないし7のうちいずれか一項記載の方法を実行するためのコンピュータ実行可能命令を記憶している非一時的なコンピュータ可読記憶媒体。
JP2016075000A 2012-06-14 2016-04-04 立体視および裸眼立体視ディスプレイのための奥行きマップ送達フォーマット Active JP6309993B2 (ja)

Applications Claiming Priority (14)

Application Number Priority Date Filing Date Title
US201261659588P 2012-06-14 2012-06-14
US61/659,588 2012-06-14
US201261712131P 2012-10-10 2012-10-10
US61/712,131 2012-10-10
US201261739886P 2012-12-20 2012-12-20
US61/739,886 2012-12-20
US201361767416P 2013-02-21 2013-02-21
US61/767,416 2013-02-21
US201361807013P 2013-04-01 2013-04-01
US61/807,013 2013-04-01
US201361807668P 2013-04-02 2013-04-02
US61/807,668 2013-04-02
US201361822060P 2013-05-10 2013-05-10
US61/822,060 2013-05-10

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015516284A Division JP5973067B2 (ja) 2012-06-14 2013-06-12 立体視および裸眼立体視ディスプレイのための奥行きマップ送達フォーマット

Publications (2)

Publication Number Publication Date
JP2016167823A true JP2016167823A (ja) 2016-09-15
JP6309993B2 JP6309993B2 (ja) 2018-04-11

Family

ID=48699960

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015516284A Active JP5973067B2 (ja) 2012-06-14 2013-06-12 立体視および裸眼立体視ディスプレイのための奥行きマップ送達フォーマット
JP2016075001A Active JP6248133B2 (ja) 2012-06-14 2016-04-04 立体視および裸眼立体視ディスプレイのための奥行きマップ送達フォーマット
JP2016075000A Active JP6309993B2 (ja) 2012-06-14 2016-04-04 立体視および裸眼立体視ディスプレイのための奥行きマップ送達フォーマット

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2015516284A Active JP5973067B2 (ja) 2012-06-14 2013-06-12 立体視および裸眼立体視ディスプレイのための奥行きマップ送達フォーマット
JP2016075001A Active JP6248133B2 (ja) 2012-06-14 2016-04-04 立体視および裸眼立体視ディスプレイのための奥行きマップ送達フォーマット

Country Status (9)

Country Link
US (1) US10165251B2 (ja)
EP (2) EP2862357B1 (ja)
JP (3) JP5973067B2 (ja)
KR (3) KR101939969B1 (ja)
CN (1) CN104380743B (ja)
HK (1) HK1206182A1 (ja)
PL (1) PL2862357T3 (ja)
TW (3) TWI630815B (ja)
WO (1) WO2013188552A2 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8560719B2 (en) * 2011-09-14 2013-10-15 Mobitv, Inc. Fragment server directed device fragment caching
TWI630815B (zh) * 2012-06-14 2018-07-21 杜比實驗室特許公司 用於立體及自動立體顯示器之深度圖傳遞格式
US10791315B2 (en) * 2013-01-04 2020-09-29 Qualcomm Incorporated Signaling of spatial resolution of depth views in multiview coding file format
KR20150126037A (ko) * 2013-03-13 2015-11-10 후아웨이 테크놀러지 컴퍼니 리미티드 깊이 룩업 테이블을 코딩하는 방법
RU2667605C2 (ru) * 2013-05-10 2018-09-21 Конинклейке Филипс Н.В. Способ кодирования сигнала видеоданных для использования с многовидовым устройством визуализации
ITTO20130503A1 (it) * 2013-06-18 2014-12-19 Sisvel Technology Srl Metodo e dispositivo per la generazione, memorizzazione, trasmissione, ricezione e riproduzione di mappe di profondita¿ sfruttando le componenti di colore di un¿immagine facente parte di un flusso video tridimensionale
CA2820305A1 (en) 2013-07-04 2015-01-04 University Of New Brunswick Systems and methods for generating and displaying stereoscopic image pairs of geographical areas
JP6127964B2 (ja) * 2013-12-26 2017-05-17 ソニー株式会社 信号切換装置および信号切換装置の動作制御方法
TWI558167B (zh) 2014-12-30 2016-11-11 友達光電股份有限公司 立體影像顯示系統與顯示方法
WO2016204481A1 (ko) * 2015-06-16 2016-12-22 엘지전자 주식회사 미디어 데이터 전송 장치, 미디어 데이터 수신 장치, 미디어 데이터 전송 방법, 및 미디어 데이터 수신 방법
CA2992304A1 (en) 2015-07-15 2017-01-19 Blinxel Pty Ltd System and method for image processing
KR20170075349A (ko) * 2015-12-23 2017-07-03 한국전자통신연구원 멀티 뷰를 가진 다중영상 송수신 장치 및 다중영상 다중화 방법
EP3252713A1 (en) * 2016-06-01 2017-12-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for performing 3d estimation based on locally determined 3d information hypotheses
US10482379B2 (en) * 2016-07-29 2019-11-19 Google Llc Systems and methods to perform machine learning with feedback consistency
TW201834455A (zh) * 2016-12-05 2018-09-16 晨星半導體股份有限公司 立體影像串流處理裝置與立體影像串流處理處理方法
EP3435670A1 (en) * 2017-07-25 2019-01-30 Koninklijke Philips N.V. Apparatus and method for generating a tiled three-dimensional image representation of a scene
CN110009595B (zh) * 2019-04-12 2022-07-26 深圳市道通智能航空技术股份有限公司 一种图像数据处理方法、装置、图像处理芯片及飞行器
DE102020100695A1 (de) * 2020-01-14 2021-07-15 Bayerische Motoren Werke Aktiengesellschaft Verfahren und Vorrichtung zur Übertragung von Multi-View-Videodaten

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030198290A1 (en) * 2002-04-19 2003-10-23 Dynamic Digital Depth Pty.Ltd. Image encoding system
WO2012014171A1 (en) * 2010-07-28 2012-02-02 Sisvel Technology S.R.L. Method for combining images relating to a three-dimensional content
WO2012067399A2 (ko) * 2010-11-15 2012-05-24 엘지전자 주식회사 프레임 포맷 전환 방법 및 이러한 방법을 사용하는 장치
WO2012070500A1 (ja) * 2010-11-22 2012-05-31 ソニー株式会社 符号化装置および符号化方法、並びに、復号装置および復号方法

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998039927A1 (en) * 1997-03-07 1998-09-11 Sanyo Electric Co., Ltd. Digital broadcast receiver and display
WO2003017680A1 (en) * 2001-08-15 2003-02-27 Koninklijke Philips Electronics N.V. 3d video conferencing system
US9131247B2 (en) 2005-10-19 2015-09-08 Thomson Licensing Multi-view video coding using scalable video coding
KR102044130B1 (ko) 2007-04-12 2019-11-12 돌비 인터네셔널 에이비 비디오 인코딩 및 디코딩의 타일링
WO2009011492A1 (en) * 2007-07-13 2009-01-22 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding stereoscopic image format including both information of base view image and information of additional view image
RU2516499C2 (ru) * 2007-12-18 2014-05-20 Конинклейке Филипс Электроникс Н.В. Передача данных стереоскопического изображения через интерфейс устройства отображения
EP2235957A1 (en) * 2007-12-20 2010-10-06 Koninklijke Philips Electronics N.V. Image encoding method for stereoscopic rendering
CN106507117B (zh) 2008-07-20 2020-01-21 杜比实验室特许公司 立体视频传送系统的编码器优化的方法和设备
AU2009273297B8 (en) * 2008-07-21 2013-03-07 Interdigital Madison Patent Holdings Coding device for 3D video signals
WO2010010521A2 (en) * 2008-07-24 2010-01-28 Koninklijke Philips Electronics N.V. Versatile 3-d picture format
JP5243612B2 (ja) * 2008-10-02 2013-07-24 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 中間画像合成およびマルチビューデータ信号抽出
WO2010048632A1 (en) 2008-10-24 2010-04-29 Real D Stereoscopic image format with depth information
CN102450010A (zh) 2009-04-20 2012-05-09 杜比实验室特许公司 定向内插和数据后处理
US9774882B2 (en) 2009-07-04 2017-09-26 Dolby Laboratories Licensing Corporation Encoding and decoding architectures for format compatible 3D video delivery
EP3258688A2 (en) * 2010-02-09 2017-12-20 Koninklijke Philips N.V. 3d video format detection
US20110280311A1 (en) * 2010-05-13 2011-11-17 Qualcomm Incorporated One-stream coding for asymmetric stereo video
KR101291071B1 (ko) * 2010-06-08 2013-08-01 주식회사 에스칩스 입체 영상 오류 개선 방법 및 장치
WO2012007867A1 (en) 2010-07-12 2012-01-19 Koninklijke Philips Electronics N.V. Signaling for multiview 3d video
CN105847780B (zh) 2010-07-21 2018-01-09 杜比实验室特许公司 用于多层帧兼容视频传输的解码方法
US9571811B2 (en) * 2010-07-28 2017-02-14 S.I.Sv.El. Societa' Italiana Per Lo Sviluppo Dell'elettronica S.P.A. Method and device for multiplexing and demultiplexing composite images relating to a three-dimensional content
WO2012020358A1 (en) 2010-08-09 2012-02-16 Koninklijke Philips Electronics N.V. Encoder, decoder, bit-stream, method of encoding, method of decoding an image pair corresponding with two views of a multi-view signal
KR20120018269A (ko) * 2010-08-20 2012-03-02 한국전자통신연구원 스테레오스코프 3차원 비디오 데이터의 다차원 계층 송수신 장치 및 방법
JP5813236B2 (ja) 2011-09-16 2015-11-17 ドルビー ラボラトリーズ ライセンシング コーポレイション フレーム互換なフル解像度立体視3d圧縮および復元
EP2761877B8 (en) 2011-09-29 2016-07-13 Dolby Laboratories Licensing Corporation Dual-layer frame-compatible full-resolution stereoscopic 3d video delivery
WO2013103490A1 (en) 2012-01-04 2013-07-11 Dolby Laboratories Licensing Corporation Dual-layer backwards-compatible progressive video delivery
EP2618586B1 (en) * 2012-01-18 2016-11-30 Nxp B.V. 2D to 3D image conversion
TWI630815B (zh) * 2012-06-14 2018-07-21 杜比實驗室特許公司 用於立體及自動立體顯示器之深度圖傳遞格式
TW201432622A (zh) * 2012-11-07 2014-08-16 Koninkl Philips Nv 產生一關於一影像之深度圖
TWI558166B (zh) * 2013-04-04 2016-11-11 杜比國際公司 用於多視點裸視立體顯示器的深度地圖遞送格式
ITTO20130503A1 (it) * 2013-06-18 2014-12-19 Sisvel Technology Srl Metodo e dispositivo per la generazione, memorizzazione, trasmissione, ricezione e riproduzione di mappe di profondita¿ sfruttando le componenti di colore di un¿immagine facente parte di un flusso video tridimensionale

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030198290A1 (en) * 2002-04-19 2003-10-23 Dynamic Digital Depth Pty.Ltd. Image encoding system
WO2012014171A1 (en) * 2010-07-28 2012-02-02 Sisvel Technology S.R.L. Method for combining images relating to a three-dimensional content
WO2012067399A2 (ko) * 2010-11-15 2012-05-24 엘지전자 주식회사 프레임 포맷 전환 방법 및 이러한 방법을 사용하는 장치
WO2012070500A1 (ja) * 2010-11-22 2012-05-31 ソニー株式会社 符号化装置および符号化方法、並びに、復号装置および復号方法

Also Published As

Publication number Publication date
US10165251B2 (en) 2018-12-25
JP2016174364A (ja) 2016-09-29
EP2862357B1 (en) 2018-03-28
KR20150017354A (ko) 2015-02-16
TW201731289A (zh) 2017-09-01
KR20160087931A (ko) 2016-07-22
WO2013188552A3 (en) 2014-03-20
TW201613348A (en) 2016-04-01
JP2015525028A (ja) 2015-08-27
CN104380743B (zh) 2018-04-24
EP3399755A1 (en) 2018-11-07
TWI630815B (zh) 2018-07-21
JP5973067B2 (ja) 2016-08-23
KR101939971B1 (ko) 2019-01-18
KR101675780B1 (ko) 2016-11-14
JP6309993B2 (ja) 2018-04-11
JP6248133B2 (ja) 2017-12-13
TW201412093A (zh) 2014-03-16
TWI521940B (zh) 2016-02-11
KR101939969B1 (ko) 2019-01-18
KR20160087932A (ko) 2016-07-22
EP3399755B1 (en) 2019-09-04
EP2862357A2 (en) 2015-04-22
TWI594616B (zh) 2017-08-01
WO2013188552A2 (en) 2013-12-19
US20150201178A1 (en) 2015-07-16
PL2862357T3 (pl) 2018-08-31
HK1206182A1 (en) 2015-12-31
CN104380743A (zh) 2015-02-25

Similar Documents

Publication Publication Date Title
JP6248133B2 (ja) 立体視および裸眼立体視ディスプレイのための奥行きマップ送達フォーマット
JP7357125B2 (ja) ビデオ符号化及び復号化におけるタイリング
EP2591609B1 (en) Method and apparatus for multi-layered image and video coding using reference processing signals
KR102588146B1 (ko) 멀티-뷰 신호 코덱
KR101676059B1 (ko) 비디오 코딩을 위한 프레임 패킹
JP5905610B2 (ja) 3d視覚的ダイナミックレンジ符号化
US20130222539A1 (en) Scalable frame compatible multiview encoding and decoding methods
EP2995081B1 (en) Depth map delivery formats for multi-view auto-stereoscopic displays

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170817

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171024

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180315

R150 Certificate of patent or registration of utility model

Ref document number: 6309993

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250