JP6159849B2 - 3d映像フォーマット - Google Patents

3d映像フォーマット Download PDF

Info

Publication number
JP6159849B2
JP6159849B2 JP2016100839A JP2016100839A JP6159849B2 JP 6159849 B2 JP6159849 B2 JP 6159849B2 JP 2016100839 A JP2016100839 A JP 2016100839A JP 2016100839 A JP2016100839 A JP 2016100839A JP 6159849 B2 JP6159849 B2 JP 6159849B2
Authority
JP
Japan
Prior art keywords
video
images
image
format
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016100839A
Other languages
English (en)
Other versions
JP2016213842A (ja
Inventor
ドン ティエン
ドン ティエン
ライ ポーリン
ライ ポーリン
ジエンコン ルオ
ジエンコン ルオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=42269685&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP6159849(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2016213842A publication Critical patent/JP2016213842A/ja
Application granted granted Critical
Publication of JP6159849B2 publication Critical patent/JP6159849B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/139Format conversion, e.g. of frame-rate or size
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/172Processing image signals image signals comprising non-image signal components, e.g. headers or format information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/194Transmission of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2213/00Details of stereoscopic systems
    • H04N2213/003Aspects relating to the "2D+depth" image format

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

符号化システムに関する実装が説明される。様々な特定の実装は、3D(3次元)映像フォーマットに関する。
3DTV(3次元テレビ(three−dimensional television))およびFVV(自由視点映像(free−viewpoint video))などの新しい映像アプリケーションを容易にするため、追加の映像ビューをユーザ側でレンダリングできるような、従来の2D(2次元)映像と、奥行きをともに含む、3DV(3D映像(3D Video))データフォーマットを利用することができる。そのような3DVフォーマットの例は、(2D映像と、対応する奥行きマップ(depth map)を含む)2D+Z(2Dプラス奥行き(2D plus depth))、ならびに(2D+Zのデータと、1つの隠れ映像(occlusion video)および1つの隠れ奥行き(occlusion depth)を含む)LDV(階層化奥行き映像(layered depth video))を含む。MVD(多視点プラス奥行き(multi−view plus depth))は、2D+Zを拡張したものであり、異なる視点からの複数の2D+Zからなる。DES(視差増強ステレオ(disparity enhanced stereo))は、2つの異なる視点からの2つのLDVと等価の別のフォーマットである。ユーザ側で異なる成分を一緒に使用しなければならないので、これらのデータフォーマットをいかに伝達(符号化および送信)するかは、重要な課題である。
関連出願の相互参照
本出願は、あらゆる目的でその内容が全体として参照により本明細書に組み込まれる、2009年2月19日に出願された「3D Video Formats」と題する米国特許仮出願第61/208,013号の出願日の利益を主張する。
一般的な態様によれば、1組のイメージが符号化される。1組のイメージは、映像イメージと、映像イメージに対応する奥行きイメージとを含む。1組のイメージにおけるイメージは、特定の3D映像フォーマットに従って関連付けられる。1組のイメージは、1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化される。符号化されたイメージは、イメージに関連する特定の3D映像フォーマットに基づいて、特定の順序でビットストリーム内に並べられる。特定の順序は、シグナリング情報を使用してビットストリーム内で指示される。
別の一般的な態様によれば、符号化された1組のイメージを含むビットストリームがアクセスされ、1組のイメージは、映像イメージと、映像イメージに対応する奥行きイメージとを含む。1組のイメージは、特定の3D映像フォーマットに従って関連付けられる。1組のイメージは、1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化されている。符号化された1組のイメージをビットストリーム内に並べる特定の順序を指示するシグナリング情報がアクセスされる。特定の順序は、1組のイメージに関連する特定の3D映像フォーマットに基づく。1組のイメージは、シグナリング情報を使用して復号される。
別の一般的な態様によれば、情報を含むように映像信号がフォーマットされる。映像信号は、シグナリング情報を含むシグナリングセクションを含む。シグナリング情報は、符号化された1組のイメージをビットストリーム内に並べる特定の順序を指示する。特定の順序は、1組のイメージに関連する特定の3D映像フォーマットに基づく。
1またはそれより多くの実装の詳細が、添付の図面および以下の説明において示される。1つの特定の方法で説明されるとしても、実装が様々な方法で構成または具現できることは明らかであろう。例えば、実装は、方法として実行することができ、または例えば、1組の動作を実行するように構成された装置、もしくは1組の動作を実行するための命令を格納する装置などの、装置として具現することができ、または信号で具現することができる。他の態様および特徴は、添付の図面および特許請求の範囲と併せて、以下の詳細な説明を検討することで明らかとなろう。
奥行きマップの一例を示す図である。 LDVフォーマットの4つの成分を示す一例を示す図である。 3DVエンコーダの実装を示す図である。 3DVデコーダの実装を示す図である。 映像送信システムの実装を示す図である。 映像受信システムの実装を示す図である。 映像処理デバイスの実装を示す図である。 MVC構造においてMVDフォーマットを符号化する一例を示す図である。 MVC構造においてLDVフォーマットを符号化する一例を示す図である。 MVC構造においてDESフォーマットを符号化する一例を示す図である。 第1の符号化プロセスの実装を示す図である。 第1の復号プロセスの実装を示す図である。 MVC構造においてMVDフォーマットを符号化する別の一例を示す図である。 MVC構造においてLDVフォーマットを符号化する別の一例を示す図である。 MVC構造においてDESフォーマットを符号化する別の一例を示す図である。 第2の符号化プロセスの実装を示す図である。 第2の復号プロセスの実装を示す図である。 SVC構造においてLDVフォーマットを符号化する一例を示す図である。 第3の符号化プロセスの実装を示す図である。 第3の復号プロセスの実装を示す図である。 第4の符号化プロセスの実装を示す図である。 第4の復号プロセスの実装を示す図である。
例えば、追加の映像ビューをユーザ側でレンダリングできるような、従来の2D映像と、奥行きをともに含むフォーマットなどの、3DVデータフォーマットを利用することができる。しかし、発明者らは、SVC(スケーラブル映像符号化(scalable video coding))およびMVC(多視点映像符号化(multi−view video coding))などの現行の規格では3DVフォーマットが現在サポートされていないという点で難点があると判断した。多視点映像シーケンスは、異なる視点から同じシーンをキャプチャした2又はそれより多くの映像シーケンスからなる組である。
したがって、少なくとも1つの実装では、発明者らは、AVC(高度映像符号化(advanced video coding))への既存のMVCまたはSVC拡張を再利用して、3DVコンテンツを送信し、その際、シグナリングの助けを借りて、3DVコンテンツの正しい抽出方法を伝達することを提案する。シグナリングは、限定することなく、例えば、SPS(シーケンスパラメータセット(sequence parameter set))、PPS(ピクチャパラメータセット(picture parameter set))、スライスヘッダ、およびSEI(補足的拡張情報(supplemental enhancement information))メッセージなどを含む、任意の高レベルシンタックスで行うことができる。他のシグナリング方式も可能であり、本出願において企図されている。
少なくとも1つの実装では、発明者らは、SVCまたはMVCのフレームワークを使用して、システムレベルでの同期を必要とせずに、3DV成分を符号化することを提案する。SVCまたはMVCにおける技法を使用して、本発明の原理は、成分間冗長性(cross−component redundancy)をより効率的に利用することができる。さらに、ビットストリーム全体の部分のみ(例えば、SVCの場合のベースレイヤ、またはMVCにおけるベースビュー)を用いて、従来の2D映像を送信/復号することができるので、後方互換性(backward compatibility)はより柔軟である。
少なくとも1つの実装では、発明者らは、3Dディスプレイが情報を正しく使用できるように、高レベルシンタックスを使用して、3DVのコンテキストにおいて(MVCにおける)ビューまたは(SVCにおける)レイヤをどのように理解するかを伝達することをさらに提案する。
少なくとも1つの実装では、発明者らは、様々な3DVフォーマットを信号伝達するための、MVCおよびSVCのフレームワーク内の「3DVフォーマットSEIメッセージ」を提案する。そのような実装は、以下の利点の1またはそれより多くの、おそらくはすべてを有することができる。
・異なる成分を階層化方式で(SVC)または同時ビューで(MVC)関連付けられるので、異なる成分をシステムレベルで同期させる必要性が回避される。
・成分間冗長性のより有益な活用:インタリーブ方法を用いるAVCと比べて、より高い符号化効率を潜在的に提供できるSVC/MVCによって、成分間予測が可能になる。
・より優れた柔軟性を有する後方互換性:ユーザ側における従来の2D映像アプリケーションのためには、部分的なデータのみ必要とする。
少なくとも1つの実装は、SEIメッセージを含むが、上述された本発明の原理は、SEIメッセージの使用に限定されないことを理解されたい。したがって、例えば、他の高レベルシンタックスは、限定することなく、SPS、PPS、およびスライスヘッダなどを含む。
2D+Z(MVD)およびLDV(DES)などの3DV(3D映像)表現フォーマットは、映像成分と、奥行き成分を含み、3DVアプリケーションがより多くの市場の関心を引き付けているので、ますます重要になっている。図1は、「Leaving_Laptop」として知られるMPEGテストシーケンスに対応する例示的な奥行きマップ100を示しており、それに対して、本発明の原理の一実施形態に従って、本発明の原理を適用することができる。図2は、LDVフォーマットにおける4つの成分を示しており、それに対して、本発明の原理の一実施形態に従って、本発明の原理を適用することができる。特に、左上部分201は、2D映像ビューを示しており、右上部分202は、奥行きを示しており、左下部分203は、隠れ映像レイヤを示しており、右下部分204は、隠れ奥行きレイヤを示している。上のデータフォーマットの符号化および送信は、様々なアプリケーションにとって必須であると同時に課題でもある。符号化効率に加えて、レガシデコーダがビットストリームから何かを示すことができるように、(従来のモノスコープ2D映像(monoscopic 2D video)のための)同期および後方互換性などの機能が、検討されるべきである。
比較的簡単なソリューションは、サイマルキャスト(simulcast)であり、各成分は、独立して符号化され、送信される。この手法の典型的な実装は、複数のエンコーダ/デコーダ、およびシステムレベルまたはアプリケーションレベルでの同期を必要とする。言い換えると、サイマルキャストのコストは、単純に3DV成分の個数倍になり得る。さらに、異なる成分は別々に符号化されるので、成分間のどのような冗長性も利用されない。
MPEG−Cパート3(ISO/IEC 23002−3)は、2D+Zに対するシステムフレームワークを規定している。MPEG−Cパート3も、映像と奥行きの間でシステムレベルでの同期を必要とする。映像および奥行きは、任意の既存の映像符号化規格を使用して符号化することができるが、映像および奥行きの符号化は切り離され、2つの成分の間で符号化利得は得られない。LDV(DES)フォーマットは、MPEG−Cパート3では規定されていない。2D+Z(MVD)およびLDV(DES)に対する符号化ソリューションは、例えば、MPEGの3DVグループ内で、まだ探求中である。
2D+Z(MVD)およびLDV(DES)フォーマットを、SVCおよびMVCなどの既存の符号化方式内に取り込むため、少なくとも1つの実装では、発明者らは、いくつかの高レベルシンタックスを利用して、3DV成分をSVCビットストリームまたはMVCビットストリームからどのように抽出できるかを信号伝達することを提案する。この手法は、(SVCにおけるベースレイヤ/エンハンスメントレイヤ、またはMVCにおける異なるビューなどの)異なる3DV成分を符号化ビットストリーム内で結び付けられるので、システムレベルでの異なる3DV成分間の同期が必要でなくなるという利点を有する。別の潜在的な利点は、この方法で符号化が実行される場合、成分間冗長性を取り除くことができることである。
用語
本明細書では、「3DVビュー」は、1つの視点位置からのデータセットとして定義され、MVCで使用される「ビュー」とは異なる。2D+Zフォーマットの場合、3DVビューは、2つの成分シーケンスを、すなわち、2Dビューおよびその奥行きマップを含む。LDVフォーマットの場合、3DVビューは、4つの成分シーケンスを、すなわち、2Dビュー、奥行きマップ、隠れビュー、および隠れ奥行きマップを含む。
MVC(SVC)デコーダは、提案されるSEIメッセージを含むビットストリームを受け取った場合、3Dディスプレイが適切なイメージを出力できる方法で、3DVデータを構成することができる。
図3は、本発明の原理の一実施形態による、本発明の原理を適用できる3DVエンコーダ300の実装の図である。エンコーダ300は、MVC/SVCエンコーダ305の入力と信号通信する第1の出力を有する、3Dビュー成分構成器355を含む。MVC/SVCエンコーダ305の出力は、ビットストリームマルチプレクサ360の第1の入力と信号通信で接続される。3Dビュー成分構成器355の第2の出力は、SEIメッセージ構成器365の第1の入力と信号通信で接続される。SEIメッセージ構成器365の出力は、ビットストリームマルチプレクサ360の第2の入力と信号通信で接続される。3Dビュー成分構成器355の入力は、3DVコンテンツ(例えば、2Dビュー、奥行き、隠れビュー、隠れ奥行き、透明マップ(transparency map)など)を受け取るための、エンコーダ300の入力として利用可能である。ビットストリームマルチプレクサ360の出力は、3DVビットストリームを出力するための、エンコーダ300の出力として利用可能である。
この実装を用いた場合、MVC/SVCエンコーダ305内の各3DV成分エンコーダ(図示されず)は、MVCエンコーダまたはSVCエンコーダである。MVCエンコーダが使用される場合、各3DV成分エンコーダは、1つのMVCビューのためのMVCエンコーダである。SVCエンコーダが使用される場合、各3DV成分エンコーダは、1つのSVCレイヤのためのSVCデコーダである。3Dビュー成分構成器355は、3DV成分をMVCビューまたはSVCレイヤに送るための、またそのような制御情報をSEIメッセージ構成器365に送るためのディスパッチャである。SEIメッセージ構成器365は、ビットストリームに収めて信号伝達するSEIメッセージを構成する。ビットストリームマルチプレクサ360は、ビットストリームを多重化する。
図4は、本発明の原理の一実施形態による、本発明の原理を適用できる3DVデコーダ400の実装の図である。デコーダ400は、SEIメッセージ解析器465の入力およびMVC/SVCデコーダ405の入力と信号通信で接続される出力を有する、ビットストリームデマルチプレクサ460を含む。SEIメッセージ解析器465の出力は、3Dビュー成分分解器455の第1の入力と信号通信で接続される。MVC/SVCデコーダ405の出力は、3Dビュー成分分解器455の第2の入力と信号通信で接続される。ビットストリームデマルチプレクサ460の入力は、3DVビットストリームを受け取るための、デコーダ400の入力として利用可能である。3Dビュー成分分解器455の出力は、フォーマットされた3DVコンテンツ(例えば、2Dビュー、奥行き、隠れビュー、隠れ奥行き、透明マップなど)を出力するための、デコーダ400の出力として利用可能である。
図3および図4は、特定の実装を示しているが、他の実装も企図されている。例えば、別の実装は、図3(または図4)のブロックの1またはそれより多くのブロックにおいて、別々の入力を有さない。代わりに、複数の信号を受け取るのに単一の入力が使用される。具体例として、ビットストリームマルチプレクサ360は、単一の入力のみを有することができる。単一の入力が、MVC/SVCエンコーダ305からの出力に加えて、SEIメッセージ構成器365からの出力も受け取る。さらに、3Dビュー成分構成器355の別の実装は、信号をSEIメッセージ構成器365に提供するとともに、信号をMVC/SVCエンコーダ305にも提供する単一の出力のみを有する。同様の適合が、図4の実装、ならびに本出願において説明される他の図および実装についても企図される。
図5は、本発明の原理の一実装による、本発明の原理を適用できる例示的な映像送信システム700を示している。映像送信システム700は、例えば、衛星、ケーブル、電話回線、または地上放送など、様々な媒体のいずれかを使用して信号を送信するための、例えば、ヘッドエンドまたは送信システムとすることができる。送信は、インターネットまたは他の何らかのネットワークを介して提供することができる。
映像送信システム700は、例えば、映像コンテンツおよび奥行きを生成し、配信することが可能である。これは、奥行き情報、または例えばデコーダを有することができる受信機側で奥行き情報を合成するために使用することが可能な情報を含む、符号化された信号を生成することによって達成される。
映像送信システム700は、エンコーダ710と、符号化された信号を送信することが可能な送信機720とを含む。エンコーダ710は、映像情報を受け取り、映像情報および/または奥行き情報に基づいて、符号化された信号を生成する。エンコーダ710は、例えば、上で詳細に説明されたエンコーダ300とすることができる。エンコーダ710は、例えば、情報の様々な断片を受け取り、格納用または送信用の構造化フォーマットに組み立てるためのアセンブリユニットを含む、サブモジュールを含むことができる。情報の様々な断片は、例えば、符号化されたまたは符号化されない映像、符号化されたまたは符号化されない奥行き情報、ならびに例えば、動きベクトル、符号化モードインジケータ、およびシンタックス要素などの符号化されたまたは符号化されない要素を含むことができる。
送信機720は、例えば、符号化されたピクチャおよび/またはそれに関連する情報を表す1またはそれより多くのビットストリームを有する番組信号を送信するように適合することができる。典型的な送信機は、例えば、誤り訂正符号化を提供すること、信号内でデータをインタリーブすること、信号内でエネルギーをランダム化すること、および信号を1又はそれより多くの搬送波上に変調することのうちの1またはそれより多くのこと等の、機能を実行する。送信機は、アンテナ(図示されず)を含むことができ、またはアンテナとインタフェースを取ることができる。したがって、送信機720の実装は、変調器を含むが、これに限定されない。
図6は、本発明の原理の一実施形態による、本発明の原理を適用できる例示的な映像受信システム800を示している。映像受信システム800は、例えば、衛星、ケーブル、電話回線、または地上放送など、様々な媒体を介して信号を受信するように構成することができる。信号を、インターネットまたは他の何らかのネットワークを介して受信することができる。
映像受信システム800は、例えば、セルフォン、コンピュータ、セットトップボックス、テレビ、または符号化された映像を受信し、例えば、ユーザへの表示用または格納用に復号された映像を提供する他のデバイスとすることができる。したがって、映像受信システム800は、その出力を、例えば、テレビ画面、コンピュータモニタ、(格納、処理、もしくは表示用の)コンピュータ、または他の何らかの格納、処理、もしくは表示デバイスに提供することができる。
映像受信システム800は、映像情報を含む映像コンテンツを受信し、処理することが可能である。映像受信システム800は、例えば、本出願の実装で説明される信号など、符号化された信号を受信することが可能な受信機810と、受信信号を復号することが可能なデコーダ820とを含む。
受信機810は、例えば、符号化されたピクチャを表す複数のビットストリームを有する番組信号を受信するように適合することができる。典型的な受信機は、例えば、変調された符号化データ信号を受信すること、1又はそれより多くの搬送波からデータ信号を復調すること、信号内でエネルギーを逆ランダム化すること、信号内でデータをデインタリーブすること、および信号を誤り訂正復号することのうちの1またはそれより多くのこと等の、機能を実行する。受信機810は、アンテナ(図示されず)を含むことができ、またはアンテナとインタフェースを取ることができる。受信機810の実装は、復調器を含むことができるが、これに限定されない。
デコーダ820は、映像情報および奥行き情報を含む映像信号を出力する。デコーダ820は、例えば、上で詳細に説明されたデコーダ400とすることができる。
図7は、本発明の原理の一実施形態による、本発明の原理が適用できる例示的な映像処理デバイス900を示している。映像処理デバイス900は、例えば、セットトップボックス、または符号化された映像を受け取り、例えば、ユーザへの表示用もしくは格納用の復号された映像を提供する他のデバイスとすることができる。したがって、映像処理デバイス900は、その出力を、テレビ、コンピュータモニタ、またはコンピュータもしくは他の処理デバイスに提供することができる。
映像処理デバイス900は、FE(フロントエンド)デバイス905と、デコーダ910とを含む。フロントエンドデバイス905は、例えば、符号化されたピクチャを表す複数のビットストリームを有する番組信号を受信し、復号する1またはそれより多くのビットストリームを複数のビットストリームから選択するように適合された受信機とすることができる。典型的な受信機は、例えば、変調された符号化データ信号を受信すること、データ信号を復調すること、データ信号の1またはそれより多くの符号化(例えば、チャネル符号化および/もしくは情報源符号化)を復号すること、および/またはデータ信号を誤り訂正することのうちの1又はそれより多くのことなどの、機能を実行する。フロントエンドデバイス905は、例えば、アンテナ(図示されず)から番組信号を受け取る。フロントエンドデバイス905は、受け取ったデータ信号をデコーダ910に提供する。
デコーダ910は、データ信号920を受け取る。データ信号920は、例えば、1つまたは複数のAVC(高度映像符号化)、SVC(スケーラブル映像符号化)、またはMVC(多視点映像符号化)互換ストリームを含むことができる。
AVCとは、より正確に言えば、既存のISO/IEC(国際標準化機構/国際電気標準会議)MPEG−4(ムービングピクチャエクスパートグループ−4)パート10 AVC(高度映像符号化)規格/ITU−T(国際電気通信連合電気通信標準化部門)H.264勧告のことである(これ以降、「H.264/MPEG−4 AVC規格」、またはそれを略して「AVC規格」もしくは単に「AVC」などと呼ぶ)。
MVCとは、より正確に言えば、AVC規格のMVC(「多視点映像符号化」)拡張(付属書H)のことであり、H.264/MPEG−4 AVC、MVC拡張(「MVC拡張」または単に「MVC」)と呼ばれる。
SVCとは、より正確に言えば、AVC規格のSVC(「スケーラブル映像符号化」)拡張(付属書G)のことであり、H.264/MPEG−4 AVC、SVC拡張(「SVC拡張」または単に「SVC」)と呼ばれる。
デコーダ910は、受信信号920のすべてまたは部分を復号し、出力として復号された映像信号930を提供する。復号された映像930は、選択器950に提供される。デバイス900は、ユーザ入力970を受け取るユーザインタフェース960も含む。ユーザインタフェース960は、ユーザ入力970に基づいて、ピクチャ選択信号980を選択器950に提供する。ピクチャ選択信号980およびユーザ入力970は、複数のピクチャ、シーケンス、スケーラブルバージョン、ビュー、または利用可能な復号データの他の選択項目のうちのどれを表示することをユーザが望んでいるかを指示する。選択器950は、選択されたピクチャを出力として提供する。選択器950は、ピクチャ選択情報980を使用して、復号された映像930内のどのピクチャを出力990として提供するかを選択する。
様々な実装では、選択器950は、ユーザインタフェース960を含むが、他の実装では、別個のインタフェース機能を実行せずに、選択器950がユーザ入力970を直接的に受け取るので、ユーザインタフェース960は必要とされない。選択器950は、例えば、ソフトウェアで、または集積回路として実装することができる。一実装では、選択器950は、デコーダ910と組み込まれ、別の実装では、デコーダ910、選択器950、およびユーザインタフェース960のすべてが統合される。
1つの応用では、フロントエンドデバイス905は、様々なテレビ番組の放送を受信し、処理する1つを選択する。1つの番組の選択は、視聴したい所望のチャンネルについてのユーザ入力に基づく。フロントエンドデバイス905へのユーザ入力は、図7には示されていないが、フロントエンドデバイス905は、ユーザ入力970を受け取る。フロントエンドデバイス905は、放送を受信してから、放送スペクトルの関連部分を復調し、復調された番組のアウター符号化(outer encoding)を復号することによって、所望の番組を処理する。フロントエンドデバイス905は、復号された番組をデコーダ910に提供する。デコーダ910は、デバイス960および950を含む統合ユニットである。したがって、デコーダ910は、ユーザ入力を受け取るが、それは、番組中の視聴したい所望のビューについてのユーザ提供の指示である。デコーダ910は、選択されたビューに加えて、他のビューからの必要な参照ピクチャも復号し、復号されたビュー990をテレビ(図示されず)への表示用に提供する。
上の応用を続けると、ユーザは、表示されるビューを切り換えることを望むことができ、その場合、新しい入力をデコーダ910に提供することができる。ユーザから「ビュー変更」を受け取った後、デコーダ910は、旧いビューおよび新しいビューの両方に加えて、旧いビューと新しいビューの間にあるビューも復号する。すなわち、デコーダ910は、旧いビューを撮影したカメラと新しいビューを撮影したカメラの間に物理的に配置されたカメラから取得したビューを復号する。フロントエンドデバイス905は、旧いビュー、新しいビュー、およびその間のビューを識別する情報も受け取る。そのような情報を、例えば、ビューのロケーションについての情報を有するコントローラ(図7には図示されず)、またはデコーダ910によって提供することができる。他の実装は、フロントエンドデバイスと統合されたコントローラを有するフロントエンドデバイスを使用することができる。
デコーダ910を、これら復号されたビューのすべてを出力990として提供する。旧いビューから新しいビューへの滑らかな推移を提供するために、ポストプロセッサ(図7には図示されず)が、ビューの間を補間し、この推移をユーザに表示する。新しいビューに推移した後、ポストプロセッサは、(図示されていない1またはそれより多くの通信リンクを介して)デコーダ910およびフロントエンドデバイス905に、新しいビューのみが必要であることを通知する。その後、デコーダ910は、出力990として新しいビューのみを提供する。
システム900を、イメージシーケンスの複数のビューを受け取るために、単一のビューを表示用に提示するために、および様々なビューの間で滑らかな方法で切り換えを行うために使用することができる。滑らかな方法は、ビューの間を補間して別のビューに移ることを含むことができる。加えて、システム900は、ユーザが、物体もしくはシーンを回転できるように、または別の方法で物体もしくはシーンの3次元表現を見られるようにすることができる。物体の回転は、例えば、ビューからビューに移動することに、およびビューの間を補間して、ビューの間の滑らかな推移を獲得すること、または3次元表現を単に獲得することに対応することができる。すなわち、ユーザは、補間ビューを、表示すべき「ビュー」として「選択」することができる。
映像送信システム700、映像受信システム800、および映像処理デバイス900をすべて、本出願で説明される様々な実装とともに使用するために適合できること明らかであろう。例えば、システム700、800、900を、説明される3DVフォーマットの1つにおけるデータを用いて、および関連するシグナリング情報を用いて動作するように適合することができる。
実施形態1:MVC用の3DVフォーマットSEIメッセージ
MVCのフレームワークでは、3DV成分シーケンスは、異なる「ビュー」として符号化される。したがって、成分間冗長性は、MVCの機能であるビュー間予測(inter−view prediction)によって取り除くことができる。例えば、2Dビューと隠れビューの間の冗長性を、効率的に取り除くことができる。表1は、実施形態1に関連するMVC用の3DVフォーマットSEIメッセージについてのシンタックス案を示している。この実施形態では、MVCビットストリームは、3DV成分シーケンスとは別のより多くのビューを含み得ることに留意されたい。
Figure 0006159849
表1のシンタックス要素の意味は以下の通りである。
three_dv_format_idは、3DVフォーマットSEIメッセージの用途を識別するのに使用できる識別番号を含む。値は、0以上232−2以下の範囲にあるものとする。0から255までの値および512から231−1までの値を、アプリケーションによって決定されたように使用できることに留意されたい。256から511までの値および231から232−2までの値は、将来の使用のために予約されている。デコーダは、256から511までの範囲内または231から232−2までの範囲内にあるthree_dv_format_idの値を含む、すべての3DVフォーマットSEIメッセージを無視し(ビットストリームから取り除いて、廃棄し)、ビットストリームは、そのような値を含んではならない。
three_dv_format_cancel_flagは、1に等しい場合、その3DVフォーマットSEIメッセージが、出力順序における先行する3DVフォーマットSEIメッセージの持続性を打ち切ることを示す。three_dv_format_cancel_flagは、0に等しい場合、3DVフォーマット情報が後続することを示す。
num_three_dv_view_minus1は、これに1を加算した値が、3DVデータを有するビューの数を表す。各ビューは、0以上num_three_dv_view_minus1以下の範囲の、3DVフォーマットのコンテキスト内において一意的なID番号である3dv_view_idを有する。3dv_view_idは、MVCのコンテキスト内のview_idとは異なることに留意されたい。2Dビューなどの1つのビューからの3DVデータの場合、その奥行きマップなどは、MVCでは異なるビューとして扱われ、異なるview_idを有するが、同じ視点位置の異なる成分シーケンスに対応するので、同じ3dv_view_idを共有する。
basic_three_dv_format_type_idは、MVCビットストリーム内に含まれる基本3DVフォーマットタイプを示す。3DVフォーマットは、2つのタイプのいずれか、すなわち、2D+ZまたはLDVとすることができる。2D+Zフォーマットは、1つの視点位置からの、2Dビューおよびその奥行きマップを含む。LDVフォーマットは、1つの視点位置からの、2Dビュー、その奥行きマップ、隠れビュー、および隠れ奥行きマップを含む。
basic_three_dv_format_type_idは、0に等しい場合、MVCビットストリームが、(num_three_dv_view_minus1+1)組の2D+Zデータを含むことを示す。データの各組は、1つの視点位置に対応する。num_three_dv_view_minus1は、0に等しい場合、2D+Zフォーマットを表す。num_three_dv_view_minus1は、1に等しい又は1より多い場合、MVDフォーマットを表す。
basic_three_dv_format_type_idは、1に等しい場合、MVCビットストリームが、(num_three_dv_view_minus1+1)組のLDVデータを含むことを示す。データの各組は、1つの視点位置に対応する。num_three_dv_view_minus1は、0に等しい場合、LDVフォーマットを表す。num_three_dv_view_minus1は、1に等しい場合、DESフォーマットを表す。1より大きな値は許されていないことに留意されたい。
video_present_flag[3dv_view_id]は、現在の3Dビューに対して2D映像成分が存在するかどうかを示す。1の値は、2Dビュー成分が存在することを示す。0の値は、2Dビュー成分が存在しないことを示す。
video_id[3dv_view_id]は、3dv_view_idを有する3DVビューに対応する、MVCビットストリームにおけるview_idを示す。−1の値は、3DVビューのための2Dビュー成分がビットストリームにおいて利用可能でないことを示す。
depth_present_flag[3dv_view_id]は、現在の3Dビューに対して奥行きマップ成分が存在するかどうかを示す。1の値は、奥行きマップ成分が存在することを示す。0の値は、奥行きマップ成分が存在しないことを示す。
depth_id[3dv_view_id]は、3dv_view_idを有する3DV奥行き成分に対応する、MVCビットストリームにおけるview_idを示す。−1の値は、3DVビューのための奥行き成分がビットストリームにおいて利用可能でないことを示す。
occlusion_video_present_flag[3dv_view_id]は、現在の3Dビューに対して隠れ映像成分が存在するかどうかを示す。1の値は、隠れ映像成分が存在することを示す。0の値は、隠れ映像成分が存在しないことを示す。
occlusion_video_id[3dv_view_id]は、3dv_view_idを有する隠れ映像成分に対応する、MVCビットストリームにおけるview_idを示す。−1の値は、3DVビューのための隠れ映像成分がビットストリームにおいて利用可能でないことを示す。
occlusion_depth_present_flag[3dv_view_id]は、現在の3Dビューに対して隠れ奥行き成分が存在するかどうかを示す。1の値は、隠れ奥行き成分が存在することを示す。0の値は、隠れ奥行き成分が存在しないことを示す。
occlusion_depth_id[3dv_view_id]は、3dv_view_idを有する隠れ奥行き成分に対応する、MVCビットストリームにおけるview_idを示す。−1の値は、3DVビューのための隠れ奥行き成分がビットストリームにおいて利用可能でないことを示す。
three_dv_format_repetition_periodは、3DVフォーマットSEIメッセージの持続性を指定し、別の3DVフォーマットSEIが同じ値のthree_dv_format_idを有する間隔である、ピクチャ順序カウント間隔(picture order count interval)を指定することができ、または符号化された映像シーケンスの終了がビットストリーム内に存在することを指定することができる。したがって、このシンタックスは、SEIが有効な時間範囲を指定する。1つの例示的な実装は、POC(ピクチャ順序カウント)間隔の使用を含む。POCを、符号化されるフレームのインデックスと理解することができ、表示時刻が増加するとともに、値が大きくなる。three_dv_format_repetition_periodの値は、0以上16384以下の範囲内になければならない。three_dv_format_repetition_periodは、0に等しい場合、3DVフォーマットSEIメッセージが現在の復号ピクチャのみに適用されることを指定する。three_dv_format_repetition_periodは、1に等しい場合、以下の条件のいずれかが真になるまで、3DVフォーマットSEIメッセージが出力順序における持続性を維持することを指定する。
−新しい符号化映像シーケンスが開始する。
−同じ値のthree_dv_format_idを有する3DVフォーマットSEIメッセージを含むアクセスユニット内のピクチャは、PicOrderCnt(CurrPic)よりも大きなPicOrderCnt()を有する出力である。
three_dv_format_repetition_periodは、0または1に等しい場合、同じ値のthree_dv_format_idを有する別の3DVフォーマットSEIメッセージが存在することもあり、または存在しないこともある。three_dv_format_repetition_periodは、1よりも大きい場合、以下の条件のいずれかが真になるまで、3DVフォーマットSEIメッセージが持続性を維持することを指定する。
−新しい符号化映像シーケンスが開始する。
−同じ値のthree_dv_format_idを有する3DVフォーマットSEIメッセージを含むアクセスユニット内のピクチャが、PicOrderCnt(CurrPic)よりも大きく、PicOrderCnt(CurrPic)+three_dv_format_repetition_periodよりも小さいPicOrderCnt()を有する出力である。
three_dv_format_repetition_periodは、1よりも大きい場合、同じ値のthree_dv_format_idを有する別の3DVフォーマットSEIメッセージが、PicOrderCnt(CurrPic)よりも大きく、PicOrderCnt(CurrPic)+three_dv_format_repetition_periodと同じかそれより小さいPicOrderCnt()を有する出力である、アクセスユニット内のピクチャのために存在しなければならないことを示すが、ビットストリームが終了する場合、またはそのようなピクチャの出力を伴わずに、新しい符号化映像シーケンスが開始する場合は、この限りではない。
additional_extension_flagは、0に等しい場合、3DVフォーマットSEIメッセージ内において、さらなるデータが後続しないことを示す。additional_extension_flagの値は、0に等しくなければならない。additional_extension_flagに対する1の値は、ITU−TおよびISO/IECによって、将来の使用のために予約されている。H.264規格に準拠するデコーダは、ピクチャが空間的にインタリーブされるSEIメッセージ(spatially interleaved pictures SEI message)において、1の値のadditional_extension_flagに対する1の値に後続するすべてのデータを無視しなければならない。
以下に3つの例が与えられる。
例1:図8は、MVC構造においてMVDフォーマットを符号化する例1000を示す図である。この例では、2つの3DVビューが存在する。左ビューの3dv_view_idは0であり、右ビューの3dv_view_idは1である。左ビューは、ベースビューとして扱われ、AVC互換デコーダによって復号することができる。左ビュー1010のview_idは1である。左奥行き1005、右ビュー1015、および右奥行き1020のview_idは、それぞれ0、2、および3である。表2は、実施形態1の例1に対応するMVC用の3DV SEIメッセージのMVD例を示している。
Figure 0006159849
図8に示されるようなビュー依存性情報は、H.264付属書HのSPS拡張(H.264のMVC拡張、または単にMVC拡張としても知られる)によって信号伝達されることに留意されたい。
例2:図9は、MVC構造においてLDVフォーマットを符号化する例1100を示す図である。この例では、ただ1つの3DVビューが存在する。2Dビューは、ベースビューとして扱われ、AVC互換デコーダによって復号することができる。2Dビュー1110のview_idは1である。奥行きマップ1105、隠れ映像1115、および隠れ奥行きマップ1120のview_idは、それぞれ0、2、および3である。表3は、実施形態1の例2に対応するMVC用の3DV SEIメッセージのLDV例を示している。
Figure 0006159849
例3:図10は、MVC構造においてDESフォーマットを符号化する例1200を示す図である。この例では、2つの3DVビューが存在する。左側からの2Dビューは、ベースビューとして扱われ、AVC互換デコーダによって復号することができる。左側からの2Dビュー1220のview_idは3である。左側からの奥行きマップ1215、隠れ映像1210、および隠れ奥行きマップ1205のview_idは、それぞれ2、1、および0である。右側からの2Dビュー1225、奥行きマップ1230、隠れ映像1235、および隠れ奥行き1240のview_idは、それぞれ4、5、6、および7である。表4は、実施形態1の例3に対応するMVC用の3DV SEIメッセージのDES例を示している。
Figure 0006159849
上の3つの例では、3DVビューに加えて、2D映像データのみを有する他のいくつかのビューも同じビットストリーム内にインタリーブできることに留意されたい。デコーダは、依然として、ビットストリームから正しい3DVビューを正しく抽出することができる。追加のビューは、例えば、受信機側でレンダリング品質を高めるために使用することができる。
図11は、本発明の原理の一実施形態による、3DVフォーマットを符号化するための例示的な方法1300を示すフロー図である。図11は、実施形態1に関し、実施形態1に対応する例1から例3をまとめて包含する。ステップ1305において、シンタックス要素three_dv_format_idが符号化される。ステップ1310において、シンタックス要素three_dv_format_cancel_flagが符号化される。ステップ1315において、three_dv_format_cancel_flag=0であるかどうかが判定される。0である場合、制御はステップ1385に渡される。0でない場合、制御はステップ1320に渡される。ステップ1320において、シンタックス要素num_three_dv_view_minus1が符号化される。ステップ1325において、シンタックス要素basic_three_dv_format_type_idが符号化される。ステップ1330において、for(3dv_view_id=0; 3dv_view_id<=num_three_dv_view_minus1; 3dv_view_id++)をループ条件とするループを開始する。ステップ1335において、3dv_view_idが0でない場合、シンタックス要素video_present_flag[3dv_view_id]が符号化され、0である場合、シンタックス要素3dv_view_idは1に等しいと仮定される。ステップ1340において、video_present_flag[3dv_view_id]が1である場合、シンタックス要素video_id[3dv_view_id]が符号化される。ステップ1345において、シンタックス要素depth_present_flag[3dv_view_id]が符号化される。ステップ1350において、depth_present_flag[3dv_view_id]が1である場合、シンタックス要素depth_id[3dv_view_id]が符号化される。ステップ1355において、basic_three_dv_format_type_idが1である場合、シンタックス要素occlusion_video_present_flag[3dv_view_id]が符号化され、1でない場合、シンタックス要素basic_three_dv_format_type_idは0に等しいと仮定される。ステップ1360において、occlusion_video_present_flag[3dv_view_id]が0でない場合、シンタックス要素occlusion_video_id[3dv_view_id]が符号化される。ステップ1365において、basic_three_dv_formatが1である場合、シンタックス要素occlusion_depth_present_flag[3dv_view_id]が符号化され、1でない場合、シンタックス要素basic_three_dv_formatは0に等しいと仮定される。ステップ1370において、occlusion_depth_present_flag[3dv_view_id]が0でない場合、シンタックス要素occlusion_depth_id[3dv_view_id]が符号化される。ステップ1375において、for(3dv_view_id=0; 3dv_view_id<=num_three_dv_view_minus1; 3dv_view_id++)をループ条件とするループを終了する。ステップ1380において、シンタックス要素three_dv_format_repetition_periodが符号化される。ステップ1385において、シンタックス要素additional_extension_flagが符号化される。
図12は、本発明の原理の一実施形態による、3DVフォーマットを復号するための例示的な方法1400を示すフロー図である。図12は、実施形態1に関し、実施形態1に対応する例1から例3をまとめて包含する。ステップ1405において、シンタックス要素three_dv_format_idが復号される。ステップ1410において、シンタックス要素three_dv_format_cancel_flagが復号される。ステップ1415において、three_dv_format_cancel_flag=0であるかどうかが判定される。0である場合、制御はステップ1485に渡される。0でない場合、制御はステップ1420に渡される。ステップ1420において、シンタックス要素num_three_dv_view_minus1が復号される。ステップ1425において、シンタックス要素basic_three_dv_format_type_idが復号される。ステップ1430において、for(3dv_view_id=0; 3dv_view_id<=num_three_dv_view_minus1; 3dv_view_id++)をループ条件とするループを開始する。ステップ1435において、3dv_view_idが0でない場合、シンタックス要素video_present_flag[3dv_view_id]が復号され、0である場合、シンタックス要素3dv_view_idは1に等しいと仮定される。ステップ1440において、video_present_flag[3dv_view_id]が1である場合、シンタックス要素video_id[3dv_view_id]が復号される。ステップ1445において、シンタックス要素depth_present_flag[3dv_view_id]が復号される。ステップ1450において、depth_present_flag[3dv_view_id]が1である場合、シンタックス要素depth_id[3dv_view_id]が復号される。ステップ1455において、basic_three_dv_format_type_idが1である場合、シンタックス要素occlusion_video_present_flag[3dv_view_id]が復号され、1でない場合、シンタックス要素basic_three_dv_format_type_idは0に等しいと仮定される。ステップ1460において、occlusion_video_present_flag[3dv_view_id]が0でない場合、シンタックス要素occlusion_video_id[3dv_view_id]が復号される。ステップ1465において、basic_three_dv_format_type_idが1である場合、シンタックス要素occlusion_depth_present_flag[3dv_view_id]が復号され、1でない場合、シンタックス要素basic_three_dv_format_type_idは0に等しいと仮定される。ステップ1470において、occlusion_depth_present_flag[3dv_view_id]が0でない場合、シンタックス要素occlusion_depth_id[3dv_view_id]が復号される。ステップ1475において、for(3dv_view_id=0; 3dv_view_id<=num_three_dv_view_minus1; 3dv_view_id++)をループ条件とするループを終了する。ステップ1480において、シンタックス要素three_dv_format_repetition_periodが復号される。ステップ1485において、シンタックス要素additional_extension_flagが復号される。
実施形態2:MVC用の簡略化3DVフォーマットSEIメッセージ
別の実施形態では、暗黙的な方法でview_idを3dv_view_idにマッピングするのが望ましいことがあり、シンタックスは実施形態1よりも簡略化できることに留意されたい。表5は、MVC用の簡略化3DVフォーマットSEIメッセージを示している。
Figure 0006159849
簡略化SEIメッセージを用いた場合、view_idは、以下の暗黙的な方法で、3dv_view_idにマッピングされる。basic_3dv_format_type_idが0である場合、昇順のview_idが、表6に示されるように、3dv_view_idにマッピングされる。basic_3dv_format_type_idが1である場合、昇順のview_idが、表7に示されるように、3dv_view_idにマッピングされる。
Figure 0006159849
Figure 0006159849
例1
図13は、表6のview_idから3dv_view_idへのマッピングが使用される、MVC構造においてMVDフォーマットを符号化する別の例1500を示す図である。ボックス1505、1510、1515、および1520内にそれぞれ示された数詞V0、V1、V2、およびV3は、そのボックスに対応するview_idを表す。各ボックスに対応する3dv_view_idは、各ボックスの下にそれぞれ示されている。矢印は、参照ビューから出て、予測されるビューを指している。ボックス1505は、左ビューの2D映像を示す。ボックス1510は、左ビューの奥行きを示す。ボックス1515は、右ビューの2D映像を示す。ボックス1520は、右ビューの奥行きを示す。
例2
図14は、表7のview_idから3dv_view_idへのマッピングが使用される、MVC構造においてLDVフォーマットを符号化する別の例1600を示す図である。ボックス1605、1610、1615、および1620内にそれぞれ示された数詞V0、V1、V2、およびV3は、そのボックスに対応するview_idを表す。各ボックスの下に、3DVのコンテキストにおけるそのボックスの役割が示されている。矢印は、参照ビューから出て、予測されるビューを指している。ボックス1605は、2D映像を示す。ボックス1610は、対応する奥行きを示す。ボックス1615は、対応する隠れ映像を示す。ボックス1620は、対応する隠れ奥行きを示す。
例3
図15は、表7のview_idから3dv_view_idへのマッピングが使用される、MVC構造においてDESフォーマットを符号化する別の例1700を示す図である。ボックス1705、1710、1715、1720、1725、1730、1735、および1740内にそれぞれ示された数詞V0、V1、V2、V3、V4、V5、V6、およびV7は、そのボックスに対応するview_idを表す。各ボックスの下に、3DVのコンテキストにおけるそのボックスの役割が示されている。矢印は、参照ビューから出て、予測されるビューを指している。ボックス1705は、左ビューの2D映像を示す。ボックス1710は、左ビューの対応する奥行きを示す。ボックス1715は、左ビューの対応する隠れ映像を示す。ボックス1720は、左ビューの対応する隠れ奥行きを示す。ボックス1725は、右ビューの2D映像を示す。ボックス1730は、右ビューの対応する奥行きを示す。ボックス1735は、右ビューの対応する隠れ映像を示す。ボックス1740は、右ビューの対応する隠れ奥行きを示す。
図16は、本発明の原理の一実施形態による、3DVフォーマットを符号化するための例示的な方法1800を示すフロー図である。図16は、実施形態2に関し、実施形態2に対応する例1から例3をまとめて包含する。ステップ1805において、シンタックス要素three_dv_format_idが符号化される。ステップ1810において、シンタックス要素three_dv_format_cancel_flagが符号化される。ステップ1815において、three_dv_format_cancel_flag=0であるかどうかが判定される。0である場合、制御はステップ1835に渡される。0でない場合、制御はステップ1820に渡される。ステップ1820において、シンタックス要素num_three_dv_view_minus1が符号化される。ステップ1825において、シンタックス要素basic_three_dv_format_type_idが符号化される。ステップ1830において、シンタックス要素three_dv_format_repetition_periodが符号化される。ステップ1835において、シンタックス要素additional_extension_flagが符号化される。
図17は、本発明の原理の一実施形態による、3DVフォーマットを復号するための例示的な方法1900を示すフロー図である。図17は、実施形態2に関し、実施形態2に対応する例1から例3をまとめて包含する。ステップ1905において、シンタックス要素three_dv_format_idが復号される。ステップ1910において、シンタックス要素three_dv_format_cancel_flagが復号される。ステップ1915において、three_dv_format_cancel_flag=0であるかどうかが判定される。0である場合、制御はステップ1935に渡される。0でない場合、制御はステップ1920に渡される。ステップ1920において、シンタックス要素num_three_dv_view_minus1が復号される。ステップ1925において、シンタックス要素basic_three_dv_format_type_idが復号される。ステップ1930において、シンタックス要素three_dv_format_repetition_periodが復号される。ステップ1935において、シンタックス要素additional_extension_flagが復号される。
実施形態3:SVC用の3DVフォーマットSEI
AVCへの別の拡張として、SVCは、時間領域、空間領域、または品質領域においてスケーラビリティを提供するために、階層化符号化構造をサポートする。この実施形態では、発明者らは、表8に示されるような、3DVフォーマットを信号伝達するためのSVC用の3DVフォーマットSEIメッセージを提案する。SVCを使用する利点の1つは、レイヤ間予測を利用して、例えば、映像内の動きと奥行きマップ内の動きの間の冗長性など、成分間冗長性を取り除くことができることである。
Figure 0006159849
video_present_flag[3dv_view_id]は、現在の3Dビューに対して2D映像成分が存在するかどうかを示す。1の値は、2Dビュー成分が存在することを示す。0の値は、2Dビュー成分が存在しないことを示す。
video_dependency_id[3dv_view_id]、video_quality_id[3dv_view_id]、およびvideo_temporal_id[3dv_view_id]は、指定された3dv_view_idを有する3DVビューからの2Dビュー成分シーケンスのdependency_id、quality_id、およびtemporal_idをそれぞれ示す。dependency_id、quality_id、およびtemporal_idのそれぞれの定義は、H.264付属書Gに規定されている。
depth_present_flag[3dv_view_id]は、現在の3Dビューに対して奥行きマップ成分が存在するかどうかを示す。1の値は、奥行きマップ成分が存在することを示す。0の値は、奥行きマップ成分が存在しないことを示す。
depth_dependency_id[3dv_view_id]、depth_quality_id[3dv_view_id]、およびdepth_temporal_id[3dv_view_id]は、指定された3dv_view_idを有する3DVビューからの奥行きマップ成分シーケンスのdependency_id、quality_id、およびtemporal_idをそれぞれ示す。dependency_id、quality_id、およびtemporal_idのそれぞれの定義は、H.264付属書Gに規定されている。
occlusion_video_present_flag[3dv_view_id]は、現在の3Dビューに対して隠れ映像成分が存在するかどうかを示す。1の値は、隠れ映像成分が存在することを示す。0の値は、隠れ映像成分が存在しないことを示す。
occlusion_video_dependency_id[3dv_view id]、occlusion_video_quality_id[3dv_view_id]、およびocclusion_video_temporal_id[3dv_view_id]は、指定された3dv_view_idを有する3DVビューからの隠れビュー成分シーケンスのdependency_id、quality_id、およびtemporal_idをそれぞれ示す。dependency_id、quality_id、およびtemporal_idのそれぞれの定義は、H.264付属書Gに規定されている。
occlusion_depth_present_flag[3dv_view_id]は、現在の3Dビューに対して隠れ奥行き成分が存在するかどうかを示す。1の値は、隠れ奥行き成分が存在することを示す。0の値は、隠れ奥行き成分が存在しないことを示す。
occlusion_depth_dependency_id[3dv_view_id]、occlusion_depth_quality_id[3dv_view_id]、およびocclusion_depth_temporal_id[3dv_view id]は、指定された3dv_view_idを有する3DVビューからの隠れ奥行きマップ成分シーケンスのdependency_id、quality_id、およびtemporal_idをそれぞれ示す。dependency_id、quality_id、およびtemporal_idのそれぞれの定義は、H.264付属書Gに規定されている。
実施形態1で列挙された(図8から図10に関する)3つの例をすべて、SVCフレームワークにマッピングできることを理解されたい。例えば、LDVフォーマットは、図18にあるようにSVCにおいて実装することができ、図18は、実施形態1の図9に対応する。ボックス2005、2010、2015、および2020内にそれぞれ示された数詞L3、L2、L1、およびL0は、そのボックスに対するdependency_idを表す。ボックスの左に、3DVのコンテキストにおける役割が示されている。矢印は、参照ビューから出て、予測されるビューを指している。ボックス2020は、2D映像を示す。ボックス2015は、対応する奥行きを示す。ボックス2010は、対応する隠れ映像を示す。ボックス2005は、対応する隠れ奥行きを示す。
表9は、本発明の原理の一実施形態による、SVC用の3DVフォーマットSEIメッセージの一例を示している。
Figure 0006159849
図19は、本発明の原理の一実施形態による、3DVフォーマットを符号化するための例示的な方法2100を示すフロー図である。図19は、実施形態3に関する。ステップ2105において、シンタックス要素three_dv_format_idが符号化される。ステップ2110において、シンタックス要素three_dv_format_cancel_flagが符号化される。ステップ2115において、three_dv_format_cancel_flag=0であるかどうかが判定される。0である場合、制御はステップ2185に渡される。0でない場合、制御はステップ2120に渡される。ステップ2120において、シンタックス要素num_three_dv_view_minus1が符号化される。ステップ2125において、シンタックス要素basic_three_dv_format_type_idが符号化される。ステップ2130において、for(3dv_view_id=0; 3DV_view_id<=num_three_dv_view_minus1; 3dv_view_id++)をループ条件とするループを開始する。ステップ2135において、3dv_view_idが0でない場合、シンタックス要素video_present_flag[3dv_view_id]が符号化され、0である場合、シンタックス要素3dv_view_idは1に等しいと仮定される。ステップ2140において、video_present_flag[3dv_view_id]が1である場合、シンタックス要素video_dependency_id[3dv_view_id]、video_quality_id[3dv_view_id]、およびvideo_temporal_id[3dv_view_id]が符号化される。ステップ2145において、シンタックス要素depth_present_flag[3dv_view_id]が符号化される。ステップ2150において、depth_present_flag[3dv_view_id]が1である場合、シンタックス要素depth_dependency_id[3dv_view_id]、depth_quality_id[3dv_view_id]、およびdepth_temporal_id[3dv_view_id]が符号化される。ステップ2155において、basic_three_dv_format_type_idが1である場合、シンタックス要素occlusion_video_present_flag[3dv_view_id]が符号化され、1でない場合、シンタックス要素basic_three_dv_format_type_idは0に等しいと仮定される。ステップ2160において、occlusion_video_present_flag[3dv_view_id]が1である場合、シンタックス要素occlusion_video_dependency_id[3dv_view_id]、occlusion_video_quality_id[3dv_view_id]、およびocclusion_video_temporal_id[3dv_view_id]が符号化される。ステップ2165において、basic_three_dv_format_type_idが1である場合、シンタックス要素occlusion_depth_present_flag[3dv_view_id]が符号化され、1でない場合、シンタックス要素occlusion_depth_present_flag[3dv_view_id]は0に等しいと仮定される。ステップ2170において、occlusion_depth_present_flag[3dv_view_id]が1である場合、シンタックス要素occlusion_depth_dependency_id[3dv_view_id]、occlusion_depth_quality_id[3dv_view_id]、およびocclusion_depth_temporal_id[3dv_view_id]が符号化される。ステップ2175において、for(3dv_view_id=0; 3dv_view_id<=num_three_dv_view_minus1; 3dv_view_id++)をループ条件とするループを終了する。ステップ2180において、シンタックス要素three_dv_format_repetition_periodが符号化される。ステップ2185において、シンタックス要素additional_extension_flagが符号化される。
図20は、本発明の原理の一実施形態による、3DVフォーマットを復号するための例示的な方法2200を示すフロー図である。図20は、実施形態3に関する。ステップ2205において、シンタックス要素three_dv_format_idが復号される。ステップ2210において、シンタックス要素three_dv_format_cancel_flagが復号される。ステップ2215において、three_dv_format_cancel_flag=0であるかどうかが判定される。0である場合、制御はステップ2285に渡される。0でない場合、制御はステップ2220に渡される。ステップ2220において、シンタックス要素num_three_dv_view_minus1が復号される。ステップ2225において、シンタックス要素basic_three_dv_format_type_idが復号される。ステップ2230において、for(3dv_view_id=0; 3DV_view_id<=num_three_dv_view_minus1; 3dv_view_id++)をループ条件とするループを開始する。ステップ2235において、3dv_view_idが0でない場合、シンタックス要素video_present_flag[3dv_view_id]が復号され、0である場合、シンタックス要素3dv_view_idは1に等しいと仮定される。ステップ2240において、video_present_flag[3dv_view_id]が1である場合シンタックス要素video_dependency_id[3dv_view_id]、video_quality_id[3dv_view_id]、およびvideo_temporal_id[3dv_view_id]が復号される。ステップ2245において、シンタックス要素depth_present_flag[3dv_view_id]が復号される。ステップ2250において、depth_present_flag[3dv_view_id]が1である場合、シンタックス要素depth_dependency_id[3dv_view_id]、depth_quality_id[3dv_view_id]、およびdepth_temporal_id[3dv_view_id]が復号される。ステップ2255において、basic_three_dv_format_type_idが1である場合、シンタックス要素occlusion_video_present_flag[3dv_view_id]が復号され、1でない場合、シンタックス要素basic_three_dv_format_type_idは0に等しいと仮定される。ステップ2260において、occlusion_video_present_flag[3dv_view_id]が1である場合、シンタックス要素occlusion_video_dependency_id[3dv_view_id]、occlusion_video_quality_id[3dv_view_id]、およびocclusion_video_temporal_id[3dv_view_id]が復号される。ステップ2265において、basic_three_dv_format_type_idが1である場合、シンタックス要素occlusion_depth_present_flag[3dv_view_id]が復号され、1でない場合、シンタックス要素occlusion_depth_present_flag[3dv_view_id]は0に等しいと仮定される。ステップ2270において、occlusion_depth_present_flag[3dv_view_id]が1である場合、シンタックス要素occlusion_depth_dependency_id[3dv_view_id]、occlusion_depth_quality_id[3dv_view_id]、およびocclusion_depth_temporal_id[3dv_view_id]が復号される。ステップ2275において、for(3dv_view_id=0; 3dv_view_id<=num_three_dv_view_minus1; 3dv_view_id++)をループ条件とするループを終了する。ステップ2280において、シンタックス要素three_dv_format_repetition_periodが復号される。ステップ2285において、シンタックス要素additional_extension_flagが復号される。
実施形態4:SVC/MVC用の3DVフォーマットSEI
先の3つの実施形態では、各3DV成分は、MVCにおけるビューとしても、またはSVCにおけるレイヤとしても、別々に扱われる。この実施形態では、最初にいくつかの3DV成分に対して空間インタリーブを行い、次に空間インタリーブされた成分をMVCにおけるビューまたはSVCにおけるレイヤとして扱うことが提案される。
実装には多くの異なる組み合わせが存在し得る。MVD表現フォーマットの場合、1つの例は、2Dとその奥行きとを隣合せて配置し、その後、各2D+ZイメージシーケンスをMVCにおける1つのビュー(またはSVCにおける1つのレイヤ)として扱うというものである。別の例では、2つの2Dイメージが最初に隣合せて配置され、2つの奥行きマップも隣合せて配置される。その後、組み合わされた2Dイメージシーケンスを1つのビュー(または1つのレイヤ)として扱い、組み合わされた奥行きマップを別のビュー(または別のレイヤ)として扱う。
本明細書で提供された本発明の原理の教示が与えられれば、当技術分野および関連技術分野の当業者が、様々な対応する実装を有するLDVのケースに本発明の原理を容易に拡張できることを理解されたい。
空間インタリーブは、隣合せ、上下、市松模様、行インタリーブ、および列インタリーブなどとすることができる。
先の実施形態のシグナリング方法は、これらの実施形態にも適用することができ、または適合させることができる。
図21は、本発明の原理の一実施形態による、3DVフォーマットを符号化するための例示的な方法2300を示すフロー図である。図21は、実施形態4に関する。ステップ2305において、いくつかの3DV成分に対して空間インタリーブが実行され、空間インタリーブは、例えば、隣合せ、上下、市松模様、行インタリーブ、または列インタリーブのいずれかである。ステップ2310において、空間インタリーブされた3DV成分がMVC下のビューとして扱われるかどうかが判定される。そのように扱われる場合、制御はステップ2315に渡される。扱われない場合、制御はステップ2320に渡される。ステップ2315において、インタリーブされた「ビュー」が、MVCエンコーダを用いて符号化される。ステップ2320において、空間インタリーブされた3DV成分がSVC下のビューとして扱われるかどうかが判定される。そのように扱われる場合、制御はステップ2325に渡される。扱われない場合、制御はステップ2330に渡される。ステップ2325において、インタリーブされた「レイヤ」は、SVCエンコーダを用いて符号化される。ステップ2330において、プロセスは、他のエンコーダのために予約されている。
図22は、本発明の原理の一実施形態による、3DVフォーマットを復号するための例示的な方法2400を示すフロー図である。図22は、実施形態4に関する。ステップ2405において、空間インタリーブされた3DV成分がMVC下のビューとして扱われるかどうかが判定される。そのように扱われる場合、制御はステップ2410に渡される。扱われない場合、制御はステップ2415に渡される。ステップ2410において、インタリーブされた「ビュー」が、MVCデコーダを用いて復号される。ステップ2415において、空間インタリーブされた3DV成分がSVC下のビューとして扱われるかどうかが判定される。そのように扱われる場合、制御はステップ2420に渡される。扱われない場合、制御はステップ2425に渡される。ステップ2420において、インタリーブされた「レイヤ」は、SVCデコーダを用いて復号される。ステップ2425において、プロセスは、他のデコーダのために予約されている。ステップ2430において、いくつかの3DV成分に対して空間デインタリーブが実行される。空間デインタリーブは、例えば、隣合せ、上下、市松模様、行インタリーブ、または列インタリーブのいずれかである。
したがって、発明者らは、特定の特徴および態様を有する1またはそれより多くの実装を提供する。しかし、説明された実装の特徴および態様を、他の実装のために適合することもできる。
加えて、説明された実装を、様々な方法で適合することができる。例えば、実装は、様々な説明された実装のシンタックスおよびセマンティクスにおいて提供される、3DVビューの数および/または3DVフォーマットタイプの数を拡張することができる。加えて、実装は、時間的に予測を実行することができる。例えば、3DV成分を、(例えば、図8におけるように)同じ3DV成分、異なる3DV成分(例えば、図10の右3DVビューのV4は左3DVビューのV3から予測される)、および/または異なる時点に生じる異なる3DV成分を参照として予測することができる。例えば、図8の左奥行きイメージ1005を、先に生じた3DVビューからの左奥行きイメージを参照として予測することができる。
本出願で説明される実装および特徴のいくつかを、H.264/MPEG−4 AVC(AVC)規格、またはMVC拡張を有するAVC規格、もしくはSVC拡張を有するAVC規格に関連して使用することができる。しかし、これらの実装および特徴を、(既存もしくは将来の)別の規格に関連して、または規格を伴わない状況において使用することができる。したがって、発明者らは、特定の特徴および態様を有する1またはそれより多くの実装を提供する。しかし、説明された実装の特徴および態様を、他の実装のために適合させることもできる。
実装は、限定することなく、SEIメッセージ、スライスヘッダ、他の高レベルシンタックス、非高レベルシンタックス、帯域外情報、データストリームデータ、および暗黙的シグナリングを含む、様々な技法を使用して情報を信号伝達することができる。したがって、本明細書で説明された実装は、特定の状況において説明することができるが、そのような説明は、特徴および概念をそのような実装または状況に限定するものと決して解釈されるべきではない。
加えて、多くの実装は、エンコーダ、デコーダ、デコーダからの出力を処理するポストプロセッサ、またはエンコーダに入力を提供するプリプロセッサのうちの1またはそれより多くのもので実装することができる。さらに、本開示によって他の実装も企図されている。
本明細書において、本発明の原理の「一実施形態(one embodiment)」もしくは「一実施形態(an embodiment)」、または「一実装(one implementation)」もしくは「一実装(an implementation)」、およびそれらの他の変形について言及がなされる場合、それは、その実施形態に関連して説明された特定の特徴、構造、および特性などが、本発明の原理の少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書の様々な場所に出現する「一実施形態(one embodiment)では」もしくは「一実施形態(an embodiment)では」、または「一実装(one implementation)では」もしくは「一実装(an implementation)では」という語句、および他の任意の変形の出現は、必ずしもすべてが、同じ実施形態について言及しているわけではない。
例えば、「A/B」、「Aおよび/またはB」、および「AおよびBの少なくとも一方」などのケースの、次の「/」、「および/または」、および「の少なくとも一方」のいずれかの使用は、第1の列挙選択肢(A)のみの選択、第2の列挙選択肢(B)のみの選択、または両方の選択肢(AおよびB)の選択を包含することが意図されていることを理解されたい。さらなる例として、「A、B、および/またはC」、ならびに「A、B、およびCの少なくとも1つ」、および「A、B、またはCの少なくとも1つ」などのケースでは、それらの語句は、第1の列挙選択肢(A)のみの選択、もしくは第2の列挙選択肢(B)のみの選択、もしくは第3の列挙選択肢(C)のみの選択、または第1および第2の列挙選択肢(AとB)のみの選択、もしくは第1および第3の列挙選択肢(AとC)のみの選択、もしくは第2および第3の列挙選択肢(BとC)のみの選択、または3つの選択肢すべての選択(AとBとC)を包含することを意図している。当技術分野および関連技術分野の当業者には容易に明らかなように、列挙項目がいくつに増えても、こうした拡張が可能である。
また、本明細書で使用される「ピクチャ」および「イメージ」という語は、交換可能に使用され、例えば、静止画の全体もしくは部分(一部)、または映像シーケンスからのピクチャの全体もしくは部分(一部)を指す。より一般的には、ピクチャは、例えば、イメージまたは映像データの任意の組を指す。ピクチャは、例えば、ピクセル、マクロブロック、スライス、フレーム、フィールド、全ピクチャ、ピクチャ内のオブジェクトと境界を示す領域、ピクチャの前景、ピクチャの背景、またはピクチャ内の(x,y)座標の特定の組とすることができる。同様に、ピクチャの「一部」は、例えば、ピクセル、マクロブロック、スライス、フレーム、フィールド、ピクチャ内のオブジェクトと境界を示す領域、ピクチャの前景、ピクチャの背景、またはピクチャ内の(x,y)座標の特定の組とすることができる。別の例として、奥行きピクチャ(奥行きイメージ)は、例えば、完全な奥行きマップ、または例えば、対応する映像フレームの単一のマクロブロックについての奥行き情報のみを含む、部分奥行きマップとすることができる。
加えて、本出願または特許請求の範囲は、情報の様々な一部を「決定する」ことに言及することがある。情報の決定は、例えば、情報の推定、情報の計算、情報の予測、またはメモリからの情報の取り出しのうちの1またはそれより多くのものを含むことができる。
同様に、「アクセスする」は、広範な用語であることが意図されている。情報の一部へのアクセスは、例えば、情報を使用し、格納し、送り、送信し、受信し、取り出し、変更し、または提供する任意のオペレーションを含むことができる。
本明細書で説明された実装は、例えば、方法もしくはプロセス、装置、ソフトウェアプログラム、データストリーム、または信号で実装することができる。(例えば方法としてのみ説明されるなど)単一の形態の実装に関連して説明されただけであるとしても、説明された特徴の実装は、他の形態(例えば、装置またはプログラム)でも実装することができる。装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアで実装することができる。方法は、例えば、プロセッサなどの、例えば、装置で実装することができ、プロセッサは、一般に処理デバイスを指し、例えば、コンピュータ、マイクロプロセッサ、集積回路、またはプログラム可能論理回路を含む。プロセッサは、例えば、コンピュータ、セルフォン、PDA(個人向け/携帯情報端末)、およびエンドユーザ間での情報の伝達を容易にする他のデバイスなどの、通信デバイスも含む。
本明細書で説明された様々なプロセスおよび特徴の実装は、様々な異なる機器またはアプリケーションで、特に、例えば、データ符号化および復号に関連する機器またはアプリケーションで具現することができる。そのような機器の例は、エンコーダ、デコーダ、デコーダからの出力を処理するポストプロセッサ、エンコーダに入力を提供するプリプロセッサ、映像コーダ、映像デコーダ、映像コーデック、ウェブサーバ、セットトップボックス、ラップトップ、パーソナルコンピュータ、セルフォン、PDA、および他の通信デバイスを含む。明らかなように、機器は移動可能とすることができ、移動車両に設置することさえできる。
加えて、方法は、プロセッサによって実行される命令によって実装することができ、そのような命令(および/または実装によって生成されたデータ値)を、例えば、集積回路、ソフトウェア搬送物、または例えば、ハードディスク、コンパクトディスケット、RAM(「ランダムアクセスメモリ」)、もしくはROM(「リードオンリメモリ」)などの他の記憶デバイスなどの、プロセッサ可読媒体に格納することができる。命令は、プロセッサ可読媒体上で有形に具現されるアプリケーションプログラムを形成することができる。命令は、例えば、ハードウェア、ファームウェア、ソフトウェア、またはそれらの組み合わせの中に存在することができる。命令は、例えば、オペレーティングシステム、別個のアプリケーション、または両方の組み合わせの中に見出すことができる。したがって、プロセッサは、例えば、プロセスを実施するように構成されたデバイスと、プロセスを実施するための命令を有する(記憶デバイスなどの)プロセッサ可読媒体を含むデバイスの両方として特徴付けることができる。さらに、プロセッサ可読媒体は、命令に加えて、または命令の代わりに、実装によって生成されたデータ値も格納することができる。
当業者に明らかなように、実装は、例えば、格納または送信できる情報を搬送するようにフォーマットされた様々な信号を生成することができる。情報は、例えば、方法を実行するための命令、または説明された実装の1つによって生成されたデータを含むことができる。例えば、信号を、説明された実施形態のシンタックスを書き込み、もしくは読み取るためのルールをデータとして搬送するように、または説明された実施形態によって書き込まれた実際のシンタックス値をデータとして搬送するようにフォーマットすることができる。そのような信号を、例えば、(例えば、スペクトルの無線周波数部分を使用する)電磁波として、またはベースバンド信号としてフォーマットすることができる。フォーマットは、例えば、データストリームの符号化、および符号化されたデータストリームを用いた搬送波の変調を含むことができる。信号が搬送する情報は、例えば、アナログ情報またはデジタル情報とすることができる。信号を、知られているように、様々な異なる有線リンクまたは無線リンクを介して送信することができる。信号を、プロセッサ可読媒体に格納することができる。
多くの実装が説明された。それにも係わらず、様々な変更を施し得ることが理解されよう。例えば、異なる実装の要素は、組み合わせ、補足し、変更し、または取り除いて、他の実装を生成することができる。さらに、オペレーションを機能ブロック間で交換することもできる。加えて、当業者は、開示された構造およびプロセスを他の構造およびプロセスで置き換えることができ、その結果の実装が、開示された実装と、少なくとも実質的に同じ方法で、少なくとも実質的に同じ機能を実行して、少なくとも実質的に同じ結果を達成することを理解するであろう。したがって、上記および他の実装が、本出願によって企図されており、以下の特許請求の範囲内にある。
同様に、実装についての上の説明では、開示を簡素化し、様々な態様の1またはそれより多くの態様の理解を助ける目的で、様々な特徴が、単一の実装、図、または説明に一緒にグループ化されることもあることを理解されたい。しかし、開示のこの方法は、特許請求される発明が各請求項で明示的に列挙されるよりも多くの特徴を必要とするという意図を反映したものと解釈されるべきではない。むしろ、以下の特許請求の範囲が反映しているように、本発明の態様は、単一の上で開示された実施形態のすべての特徴よりも僅かな特徴に存し得る。したがって、請求項の各々は別個の実装も提供することが理解される。
(付記1)
映像イメージと前記映像イメージに対応する奥行きイメージとを含む、1組のイメージを符号化することであって、前記映像イメージと前記映像イメージに対応する前記奥行きイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化されることと、
前記符号化されたイメージを、前記イメージに関連する前記特定の3D映像フォーマットに基づいて、特定の順序でビットストリーム内に並べることと、
シグナリング情報を使用して、前記特定の順序を指示することと
を含む、方法。
(付記2)
前記シグナリング情報は、SEIメッセージまたは他の高レベルシンタックス内に含まれる、付記1に記載の方法。
(付記3)
前記ビットストリームは、国際標準化機構/国際電気標準会議ムービングピクチャエクスパーツグループ−4パート10高度映像符号化規格/国際電気通信連合電気通信標準化部門H.264勧告の、多視点映像符号化拡張またはスケーラブル映像符号化拡張の一方またはそれより多くに準拠する、付記1に記載の方法。
(付記4)
前記特定の3D映像フォーマットの特定の成分は、1またはそれより多くの特定のビューまたは特定のレイヤに割り当てられ、前記特定のビューまたは前記特定のレイヤの1またはそれより多くを、別のビューまたは別のレイヤのための参照として使用して、それらの間の冗長性を利用することが可能である、付記1に記載の方法。
(付記5)
前記特定の3D映像フォーマットは、前記符号化されたイメージをそれに従って並べることができる、複数の異なる3D映像フォーマットのうちの1つであり、前記シグナリング情報は、前記複数の異なる3D映像フォーマットのうちから前記特定の3D映像フォーマットを指示する、付記1に記載の方法。
(付記6)
前記1組のイメージは、2次元映像イメージと、対応する奥行きイメージとを含む、付記1に記載の方法。
(付記7)
前記2次元映像イメージおよび前記対応する奥行きイメージは、第1の視点からのものであり、前記1組のイメージは、第2の視点からの、別の2次元映像イメージと、別の奥行きイメージとをさらに含み、前記別の奥行きイメージは、前記別の2次元映像イメージに対応する、付記6に記載の方法。
(付記8)
前記1組のイメージは、隠れ映像イメージと、隠れ奥行きイメージとをさらに含む、付記6に記載の方法。
(付記9)
前記隠れ映像イメージおよび前記隠れ奥行きイメージは、第1の視点からのものであり、前記1組のイメージは、第2の視点からの、別の隠れ映像イメージと、別の隠れ奥行きイメージとをさらに含み、前記別の隠れ奥行きイメージは、前記別の隠れ映像イメージに対応する、付記8に記載の方法。
(付記10)
映像イメージと前記映像イメージに対応する奥行きイメージとを含む、1組のイメージを符号化するための手段であって、前記映像イメージと前記映像イメージに対応する前記奥行きイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化される、手段と、
前記符号化されたイメージを、前記イメージに関連する前記特定の3D映像フォーマットに基づいて、特定の順序でビットストリーム内に並べるための手段と、
シグナリング情報を使用して、前記特定の順序を指示するための手段と
を備える、装置。
(付記11)
プロセッサに、少なくとも、
映像イメージと前記映像イメージに対応する奥行きイメージとを含む、1組のイメージを符号化することであって、前記映像イメージと前記映像イメージに対応する前記奥行きイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化されることと、
前記符号化されたイメージを、前記イメージに関連する前記特定の3D映像フォーマットに基づいて、特定の順序でビットストリーム内に並べることと、
シグナリング情報を使用して、前記特定の順序を指示することと
を実行させるための命令を格納する、プロセッサ可読媒体。
(付記12)
少なくとも、
映像イメージと前記映像イメージに対応する奥行きイメージとを含む、1組のイメージを符号化することであって、前記映像イメージと前記映像イメージに対応する前記奥行きイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化されることと、
前記符号化されたイメージを、前記イメージに関連する前記特定の3D映像フォーマットに基づいて、特定の順序でビットストリーム内に並べることと、
シグナリング情報を使用して、前記特定の順序を指示することと
を実行するように構成されたプロセッサを備える、装置。
(付記13)
映像イメージと前記映像イメージに対応する奥行きイメージとを含む、1組のイメージを符号化するためのエンコーダ(305)であって、前記映像イメージと前記映像イメージに対応する前記奥行きイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化される、エンコーダ(305)と、
前記符号化されたイメージを、前記イメージに関連する前記特定の3D映像フォーマットに基づいて、特定の順序でビットストリーム内に並べるビットストリームマルチプレクサ(360)と、
シグナリング情報を使用して、前記特定の順序を指示するメッセージ構成器(365)と
を備える、装置。
(付記14)
映像イメージと前記映像イメージに対応する奥行きイメージとを含む、1組のイメージを符号化するためのエンコーダ(305)であって、前記映像イメージと前記映像イメージに対応する前記奥行きイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化される、エンコーダ(305)と、
前記符号化されたイメージを、前記イメージに関連する前記特定の3D映像フォーマットに基づいて、特定の順序でビットストリーム内に並べるビットストリームマルチプレクサ(360)と、
シグナリング情報を使用して、前記特定の順序を前記ビットストリーム内で指示するメッセージ構成器(365)と、
前記符号化されたイメージと前記シグナリング情報とを含む信号を変調するための変調器(720)と
を備える、装置。
(付記15)
符号化された1組のイメージを含むビットストリームにアクセスすることであって、前記1組のイメージは、映像イメージと前記映像イメージに対応する奥行きイメージとを含み、前記1組のイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化されることと、
前記符号化された1組のイメージを前記ビットストリーム内に並べる特定の順序を指示するシグナリング情報にアクセスすることであって、前記特定の順序は、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づくことと、
前記シグナリング情報を使用して、前記1組のイメージを復号することと
を含む、方法。
(付記16)
符号化された1組のイメージを含むビットストリームにアクセスするための手段であって、前記1組のイメージは、映像イメージと前記映像イメージに対応する奥行きイメージとを含み、前記1組のイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化される、手段と、
前記符号化された1組のイメージを前記ビットストリーム内に並べる特定の順序を指示するシグナリング情報にアクセスするための手段であって、前記特定の順序は、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づく、手段と
前記シグナリング情報を使用して、前記1組のイメージを復号するための手段と
を備える、装置。
(付記17)
プロセッサに、少なくとも、
符号化された1組のイメージを含むビットストリームにアクセスすることであって、前記1組のイメージは、映像イメージと前記映像イメージに対応する奥行きイメージとを含み、前記1組のイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化されることと、
前記符号化された1組のイメージを前記ビットストリーム内に並べる特定の順序を指示するシグナリング情報にアクセスすることであって、前記特定の順序は、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づくことと
前記シグナリング情報を使用して、前記1組のイメージを復号することと
を実行させるための命令を格納する、プロセッサ可読媒体。
(付記18)
少なくとも、
符号化された1組のイメージを含むビットストリームにアクセスすることであって、前記1組のイメージは、映像イメージと前記映像イメージに対応する奥行きイメージとを含み、前記1組のイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化されることと、
前記符号化された1組のイメージを前記ビットストリーム内に並べる特定の順序を指示するシグナリング情報にアクセスすることであって、前記特定の順序は、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づくことと
前記シグナリング情報を使用して、前記1組のイメージを復号することと
を実行するように構成されたプロセッサを備える、装置。
(付記19)
符号化された1組のイメージを含むビットストリームにアクセスするためのビットストリームデマルチプレクサ(460)であって、前記1組のイメージは、映像イメージと前記映像イメージに対応する奥行きイメージとを含み、前記1組のイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化される、ビットストリームデマルチプレクサ(460)と、
前記符号化された1組のイメージを前記ビットストリーム内に並べる特定の順序を指示するシグナリング情報にアクセスするためのメッセージ解析器(465)であって、前記特定の順序は、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づく、メッセージ解析器(465)と、
前記シグナリング情報を使用して、前記1組のイメージを復号するためのデコーダ(405)と
を備える、装置。
(付記20)
前記装置は、映像エンコーダまたは映像デコーダの少なくとも一方で実装される、付記19に記載の装置。
(付記21)
ビットストリームを含む信号を復調するための復調器(810)であって、前記ビットストリームは、符号化された1組のイメージを含み、前記1組のイメージは、映像イメージと前記映像イメージに対応する奥行きイメージとを含み、前記1組のイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化される、復調器(810)と、
前記ビットストリームにアクセスするためのビットストリームデマルチプレクサ(460)と、
前記符号化された1組のイメージを前記ビットストリーム内に並べる特定の順序を指示するシグナリング情報にアクセスするためのメッセージ解析器(465)であって、前記特定の順序は、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づく、メッセージ解析器(465)と、
前記シグナリング情報を使用して、前記1組のイメージを復号するためのデコーダ(405)と
を備える、装置。
(付記22)
情報を含むようにフォーマットされた映像信号であって、前記映像信号は、符号化された1組のイメージをビットストリーム内に並べる特定の順序を指示するシグナリング情報を含むシグナリングセクションを含み、前記特定の順序は、前記1組のイメージに関連する特定の3D映像フォーマットに基づく、映像信号。
(付記23)
前記符号化された1組のイメージを含む符号化ピクチャセクションであって、前記1組のイメージは、映像イメージと前記映像イメージに対応する奥行きイメージとを含み、前記1組のイメージは、前記特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化される、符号化ピクチャセクション
をさらに含む付記22に記載の映像信号。
(付記24)
符号化された1組のイメージをビットストリーム内に並べる特定の順序を指示するシグナリング情報を含むシグナリングセクションを含む映像信号構造であって、前記特定の順序は、前記1組のイメージに関連する特定の3D映像フォーマットに基づく、映像信号構造。
(付記25)
映像信号構造を格納するプロセッサ可読媒体であって、前記映像信号構造は、符号化された1組のイメージをビットストリーム内に並べる特定の順序を指示するシグナリング情報を含むシグナリングセクションを含み、前記特定の順序は、前記1組のイメージに関連する特定の3D映像フォーマットに基づく、プロセッサ可読媒体。

Claims (15)

  1. 映像符号化のための方法であって、
    2D(2次元)映像イメージと前記2D映像イメージに対応する奥行きイメージとを含む、1組のイメージを符号化することであって、前記2D映像イメージと前記2D映像イメージに対応する前記奥行きイメージとは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、映像符号化標準のマルチレイヤ映像符号化拡張を使用して前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化され、前記2D映像イメージは、前記マルチレイヤ映像符号化拡張に従って第1のレイヤとして符号化され、前記奥行きイメージは、前記マルチレイヤ映像符号化拡張に従って第2のレイヤとして符号化される、前記1組のイメージを符号化することと、
    前記符号化されたイメージを、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づいて、特定の順序でビットストリーム内に並べることと、
    シグナリング情報を使用して、前記特定の順序を指示することであって、前記特定の3D映像フォーマットは、複数の異なる3D映像フォーマットのうちの1つであり、前記符号化されたイメージは前記複数の異なる3D映像フォーマットのうちの1つに従って並べることができ、前記シグナリング情報は、前記複数の異なる3D映像フォーマットのうちから前記特定の3D映像フォーマットを指示する、前記特定の順序を指示することと、
    を含む、前記方法。
  2. 前記シグナリング情報は、SEIメッセージまたは他の高レベルシンタックスに含まれる、請求項1に記載の方法。
  3. 前記複数の異なる3D映像フォーマットは、2Dプラス奥行き、階層化奥行き映像、多視点プラス奥行き及び視差増強ステレオを含む、請求項1に記載の方法。
  4. 前記2D映像イメージおよび前記2D映像イメージに対応する奥行きイメージは、第1の視点からのものであり、前記1組のイメージは、第2の視点からの、別の2D映像イメージと、別の奥行きイメージとをさらに含み、前記別の奥行きイメージは、前記別の2D映像イメージに対応する、請求項1に記載の方法。
  5. 前記1組のイメージは、隠れ映像イメージと、隠れ奥行きイメージとをさらに含む、請求項1に記載の方法。
  6. 前記隠れ映像イメージおよび前記隠れ奥行きイメージは、第1の視点からのものであり、前記1組のイメージは、第2の視点からの、別の隠れ映像イメージと、別の隠れ奥行きイメージとをさらに含み、前記別の隠れ奥行きイメージは、前記別の隠れ映像イメージに対応する、請求項に記載の方法。
  7. 映像符号化のための装置であって、
    2D(2次元)映像イメージと前記2D映像イメージに対応する奥行きイメージとを含む、1組のイメージを符号化するための手段であって、前記2D映像イメージと前記2D映像イメージに対応する前記奥行きイメージとは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、映像符号化標準のマルチレイヤ映像符号化拡張を使用して前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化され、前記2D映像イメージは、前記マルチレイヤ映像符号化拡張に従って第1のレイヤとして符号化され、前記奥行きイメージは、前記マルチレイヤ映像符号化拡張に従って第2のレイヤとして符号化される、前記1組のイメージを符号化するための手段と、
    前記符号化されたイメージを、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づいて、特定の順序でビットストリーム内に並べるための手段と、
    シグナリング情報を使用して、前記特定の順序を指示するための手段であって、前記特定の3D映像フォーマットは、複数の異なる3D映像フォーマットのうちの1つであり、前記符号化されたイメージは前記複数の異なる3D映像フォーマットのうちの1つに従って並べることができ、前記シグナリング情報は、前記複数の異なる3D映像フォーマットのうちから前記特定の3D映像フォーマットを指示する、前記特定の順序を指示するための手段と、
    を備える、前記装置。
  8. 映像符号化のための装置であって、
    少なくとも、
    2D(2次元)映像イメージと前記2D映像イメージに対応する奥行きイメージとを含む、1組のイメージを符号化することであって、前記2D映像イメージと前記2D映像イメージに対応する前記奥行きイメージとは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、映像符号化標準のマルチレイヤ映像符号化拡張を使用して前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化され、前記2D映像イメージは、前記マルチレイヤ映像符号化拡張に従って第1のレイヤとして符号化され、前記奥行きイメージは、前記マルチレイヤ映像符号化拡張に従って第2のレイヤとして符号化される、前記1組のイメージを符号化することと、
    前記符号化されたイメージを、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づいて、特定の順序でビットストリーム内に並べることと、
    シグナリング情報を使用して、前記特定の順序を指示することであって、前記特定の3D映像フォーマットは、複数の異なる3D映像フォーマットのうちの1つであり、前記符号化されたイメージは前記複数の異なる3D映像フォーマットのうちの1つに従って並べることができ、前記シグナリング情報は、前記複数の異なる3D映像フォーマットのうちから前記特定の3D映像フォーマットを指示する、前記特定の順序を指示することと、
    を実行するように構成されたプロセッサを備える、前記装置。
  9. 映像符号化のための装置であって、
    2D(2次元)映像イメージと前記2D映像イメージに対応する奥行きイメージとを含む、1組のイメージを符号化するためのエンコーダであって、前記2D映像イメージと前記2D映像イメージに対応する前記奥行きイメージとは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、映像符号化標準のマルチレイヤ映像符号化拡張を使用して前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化され、前記2D映像イメージは、前記マルチレイヤ映像符号化拡張に従って第1のレイヤとして符号化され、前記奥行きイメージは、前記マルチレイヤ映像符号化拡張に従って第2のレイヤとして符号化される、前記エンコーダと、
    前記符号化されたイメージを、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づいて、特定の順序でビットストリーム内に並べるためのビットストリームマルチプレクサと、
    シグナリング情報を使用して、前記特定の順序を指示するためのメッセージ構成器であって、前記特定の3D映像フォーマットは、複数の異なる3D映像フォーマットのうちの1つであり、前記符号化されたイメージは前記複数の異なる3D映像フォーマットのうちの1つに従って並べることができ、前記シグナリング情報は、前記複数の異なる3D映像フォーマットのうちから前記特定の3D映像フォーマットを指示する、前記メッセージ構成器と、
    を備える、前記装置。
  10. 映像符号化のための装置であって、
    2D(2次元)映像イメージと前記2D映像イメージに対応する奥行きイメージとを含む、1組のイメージを符号化するためのエンコーダであって、前記2D映像イメージと前記2D映像イメージに対応する前記奥行きイメージとは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、映像符号化標準のマルチレイヤ映像符号化拡張を使用して前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化され、前記2D映像イメージは、前記マルチレイヤ映像符号化拡張に従って第1のレイヤとして符号化され、前記奥行きイメージは、前記マルチレイヤ映像符号化拡張に従って第2のレイヤとして符号化される、前記エンコーダと、
    前記符号化されたイメージを、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づいて、特定の順序でビットストリーム内に並べるためのビットストリームマルチプレクサと、
    シグナリング情報を使用して、前記特定の順序を前記ビットストリーム内で指示するためのメッセージ構成器と、
    前記符号化されたイメージと前記シグナリング情報とを含む信号を変調するための変調器であって、前記特定の3D映像フォーマットは、複数の異なる3D映像フォーマットのうちの1つであり、前記符号化されたイメージは前記複数の異なる3D映像フォーマットのうちの1つに従って並べることができ、前記シグナリング情報は、前記複数の異なる3D映像フォーマットのうちから前記特定の3D映像フォーマットを指示する、前記変調器と、
    を備える、前記装置。
  11. 映像復号するための方法であって、
    符号化された1組のイメージを含むビットストリームにアクセスすることであって、前記1組のイメージは、2D(2次元)映像イメージと前記2D映像イメージに対応する奥行きイメージとを含み、前記1組のイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、映像符号化標準のマルチレイヤ映像符号化拡張を使用して前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化され、前記2D映像イメージは、前記マルチレイヤ映像符号化拡張に従って第1のレイヤとして符号化され、前記奥行きイメージは、前記マルチレイヤ映像符号化拡張に従って第2のレイヤとして符号化され、前記ビットストリームにアクセスすることと、
    前記符号化された1組のイメージを前記ビットストリーム内に並べる特定の順序を指示するシグナリング情報にアクセスすることであって、前記特定の順序は、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づく、前記シグナリング情報にアクセスすることと、
    前記シグナリング情報を使用して、前記1組のイメージを復号することであって、前記特定の3D映像フォーマットは、複数の異なる3D映像フォーマットのうちの1つであり、前記符号化されたイメージは前記複数の異なる3D映像フォーマットのうちの1つに従って並べることができ、前記シグナリング情報は、前記複数の異なる3D映像フォーマットのうちから前記特定の3D映像フォーマットを指示する、前記1組のイメージを復号することと、
    を含む、前記方法。
  12. 映像復号するための装置であって、
    符号化された1組のイメージを含むビットストリームにアクセスするための手段であって、前記1組のイメージは、2D(2次元)映像イメージと前記2D映像イメージに対応する奥行きイメージとを含み、前記1組のイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、映像符号化標準のマルチレイヤ映像符号化拡張を使用して前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化され、前記2D映像イメージは、前記マルチレイヤ映像符号化拡張に従って第1のレイヤとして符号化され、前記奥行きイメージは、前記マルチレイヤ映像符号化拡張に従って第2のレイヤとして符号化され、前記ビットストリームにアクセスするための手段と、
    前記符号化された1組のイメージを前記ビットストリーム内に並べる特定の順序を指示するシグナリング情報にアクセスするための手段であって、前記特定の順序は、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づく、前記シグナリング情報にアクセスするための手段と
    前記シグナリング情報を使用して、前記1組のイメージを復号するための手段であって、前記特定の3D映像フォーマットは、複数の異なる3D映像フォーマットのうちの1つであり、前記符号化されたイメージは前記複数の異なる3D映像フォーマットのうちの1つに従って並べることができ、前記シグナリング情報は、前記複数の異なる3D映像フォーマットのうちから前記特定の3D映像フォーマットを指示する、前記1組のイメージを復号するための手段と、
    を備える、前記装置。
  13. 映像復号するための装置であって、
    少なくとも、
    符号化された1組のイメージを含むビットストリームにアクセスすることであって、前記1組のイメージは、2D(2次元)映像イメージと前記2D映像イメージに対応する奥行きイメージとを含み、前記1組のイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、映像符号化標準のマルチレイヤ映像符号化拡張を使用して前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化され、前記2D映像イメージは、前記マルチレイヤ映像符号化拡張に従って第1のレイヤとして符号化され、前記奥行きイメージは、前記マルチレイヤ映像符号化拡張に従って第2のレイヤとして符号化され、前記ビットストリームにアクセスすることと、
    前記符号化された1組のイメージを前記ビットストリーム内に並べる特定の順序を指示するシグナリング情報にアクセスすることであって、前記特定の順序は、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づく、前記シグナリング情報にアクセスすることと、
    前記シグナリング情報を使用して、前記1組のイメージを復号することであって、前記特定の3D映像フォーマットは、複数の異なる3D映像フォーマットのうちの1つであり、前記符号化されたイメージは前記複数の異なる3D映像フォーマットのうちの1つに従って並べることができ、前記シグナリング情報は、前記複数の異なる3D映像フォーマットのうちから前記特定の3D映像フォーマットを指示する、前記1組のイメージを復号することと、
    を実行するように構成されたプロセッサを備える、前記装置。
  14. 映像復号するための装置であって、
    符号化された1組のイメージを含むビットストリームにアクセスするためのビットストリームデマルチプレクサであって、前記1組のイメージは、2D(2次元)映像イメージと前記2D映像イメージに対応する奥行きイメージとを含み、前記1組のイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、映像符号化標準のマルチレイヤ映像符号化拡張を使用して前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化され、前記2D映像イメージは、前記マルチレイヤ映像符号化拡張に従って第1のレイヤとして符号化され、前記奥行きイメージは、前記マルチレイヤ映像符号化拡張に従って第2のレイヤとして符号化され、前記ビットストリームデマルチプレクサと、
    前記符号化された1組のイメージを前記ビットストリーム内に並べる特定の順序を指示するシグナリング情報にアクセスするためのメッセージ解析器であって、前記特定の順序は、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づく、前記メッセージ解析器と、
    前記シグナリング情報を使用して、前記1組のイメージを復号するためのデコーダであって、前記特定の3D映像フォーマットは、複数の異なる3D映像フォーマットのうちの1つであり、前記符号化されたイメージは前記複数の異なる3D映像フォーマットのうちの1つに従って並べることができ、前記シグナリング情報は、前記複数の異なる3D映像フォーマットのうちから前記特定の3D映像フォーマットを指示する、前記デコーダと、
    を備える、前記装置。
  15. 映像復号するための装置であって、
    ビットストリームを含む信号を復調するための復調器であって、前記ビットストリームは、符号化された1組のイメージを含み、前記1組のイメージは、2D(2次元)映像イメージと前記2D映像イメージに対応する奥行きイメージとを含み、前記1組のイメージは、特定の3D映像フォーマットに従って関連付けられ、前記1組のイメージは、映像符号化標準のマルチレイヤ映像符号化拡張を使用して前記1組のイメージのうちのイメージの間の冗長性を利用する方法で符号化され、前記2D映像イメージは、前記マルチレイヤ映像符号化拡張に従って第1のレイヤとして符号化され、前記奥行きイメージは、前記マルチレイヤ映像符号化拡張に従って第2のレイヤとして符号化され、前記復調器と、
    前記ビットストリームにアクセスするためのビットストリームデマルチプレクサと、
    前記符号化された1組のイメージを前記ビットストリーム内に並べる特定の順序を指示するシグナリング情報にアクセスするためのメッセージ解析器であって、前記特定の順序は、前記1組のイメージに関連する前記特定の3D映像フォーマットに基づく、前記メッセージ解析器と、
    前記シグナリング情報を使用して、前記1組のイメージを復号するためのデコーダであって、前記特定の3D映像フォーマットは、複数の異なる3D映像フォーマットのうちの1つであり、前記符号化されたイメージは前記複数の異なる3D映像フォーマットのうちの1つに従って並べることができ、前記シグナリング情報は、前記複数の異なる3D映像フォーマットのうちから前記特定の3D映像フォーマットを指示する、前記デコーダと、
    を備える、前記装置。
JP2016100839A 2009-02-19 2016-05-19 3d映像フォーマット Active JP6159849B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US20801309P 2009-02-19 2009-02-19
US61/208,013 2009-02-19

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2011551070A Division JP6159507B2 (ja) 2009-02-19 2010-02-19 3d映像フォーマット

Publications (2)

Publication Number Publication Date
JP2016213842A JP2016213842A (ja) 2016-12-15
JP6159849B2 true JP6159849B2 (ja) 2017-07-05

Family

ID=42269685

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011551070A Active JP6159507B2 (ja) 2009-02-19 2010-02-19 3d映像フォーマット
JP2016100839A Active JP6159849B2 (ja) 2009-02-19 2016-05-19 3d映像フォーマット

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2011551070A Active JP6159507B2 (ja) 2009-02-19 2010-02-19 3d映像フォーマット

Country Status (8)

Country Link
US (1) US20110298895A1 (ja)
EP (1) EP2399394B1 (ja)
JP (2) JP6159507B2 (ja)
KR (2) KR101940023B1 (ja)
CN (3) CN105657405B (ja)
BR (1) BRPI1013339B1 (ja)
HK (1) HK1224496A1 (ja)
WO (1) WO2010096189A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120050475A1 (en) 2009-05-01 2012-03-01 Dong Tian Reference picture lists for 3dv
CN105979240B (zh) * 2010-09-03 2018-06-05 索尼公司 编码装置和编码方法以及解码装置和解码方法
US20130162774A1 (en) 2010-09-14 2013-06-27 Dong Tian Compression methods and apparatus for occlusion data
WO2012036532A2 (en) * 2010-09-19 2012-03-22 Lg Electronics Inc. Method and apparatus for processing a broadcast signal for 3d (3-dimensional) broadcast service
US10776635B2 (en) * 2010-09-21 2020-09-15 Mobileye Vision Technologies Ltd. Monocular cued detection of three-dimensional structures from depth images
JP5837606B2 (ja) * 2010-11-15 2015-12-24 エルジー エレクトロニクス インコーポレイティド フレームフォーマット変換方法及びその方法を使用する装置
BR112013023302A2 (pt) * 2011-03-18 2016-12-20 Sony Corp aparelho e método de processamento de imagem
US9351028B2 (en) * 2011-07-14 2016-05-24 Qualcomm Incorporated Wireless 3D streaming server
US11496760B2 (en) 2011-07-22 2022-11-08 Qualcomm Incorporated Slice header prediction for depth maps in three-dimensional video codecs
US9521418B2 (en) 2011-07-22 2016-12-13 Qualcomm Incorporated Slice header three-dimensional video extension for slice header prediction
US9681115B2 (en) * 2011-07-25 2017-06-13 Sony Corporation In-painting method for 3D stereoscopic views generation using left and right images and a depth map
US9635355B2 (en) 2011-07-28 2017-04-25 Qualcomm Incorporated Multiview video coding
US9674525B2 (en) 2011-07-28 2017-06-06 Qualcomm Incorporated Multiview video coding
US9288505B2 (en) 2011-08-11 2016-03-15 Qualcomm Incorporated Three-dimensional video with asymmetric spatial resolution
CN107659820B (zh) * 2011-09-22 2020-03-10 Lg 电子株式会社 用信号发送图像信息的方法和装置,以及使用其的解码方法和装置
KR20130046534A (ko) * 2011-10-28 2013-05-08 삼성전자주식회사 영상 부호화 방법 및 장치 그리고 영상 복호화 방법 및 장치
US9485503B2 (en) 2011-11-18 2016-11-01 Qualcomm Incorporated Inside view motion prediction among texture and depth view components
KR102003925B1 (ko) * 2011-11-23 2019-10-02 한국전자통신연구원 스케일러빌리티 및 뷰 정보를 제공하는 스트리밍 서비스를 위한 방법 및 장치
US9898834B2 (en) 2011-11-25 2018-02-20 Thomson Licensing Method and apparatus for generating a bitstream of repetitive structure discovery based 3D model compression
US10200708B2 (en) 2011-11-30 2019-02-05 Qualcomm Incorporated Sequence level information for multiview video coding (MVC) compatible three-dimensional video coding (3DVC)
US9258559B2 (en) 2011-12-20 2016-02-09 Qualcomm Incorporated Reference picture list construction for multi-view and three-dimensional video coding
US10447990B2 (en) 2012-02-28 2019-10-15 Qualcomm Incorporated Network abstraction layer (NAL) unit header design for three-dimensional video coding
US20130287093A1 (en) * 2012-04-25 2013-10-31 Nokia Corporation Method and apparatus for video coding
US9872041B2 (en) 2012-08-10 2018-01-16 Lg Electronics Inc. Method and apparatus for transceiving image component for 3D image
US9554146B2 (en) 2012-09-21 2017-01-24 Qualcomm Incorporated Indication and activation of parameter sets for video coding
JP6787667B2 (ja) * 2012-09-21 2020-11-18 ノキア テクノロジーズ オサケユイチア ビデオコーディングのための方法と装置
US9479779B2 (en) * 2012-10-01 2016-10-25 Qualcomm Incorporated Sub-bitstream extraction for multiview, three-dimensional (3D) and scalable media bitstreams
US9584792B2 (en) * 2013-01-04 2017-02-28 Qualcomm Incorporated Indication of current view dependency on reference view in multiview coding file format
WO2014196374A1 (ja) * 2013-06-05 2014-12-11 ソニー株式会社 画像処理装置および画像処理方法
WO2016153273A1 (ko) * 2015-03-23 2016-09-29 엘지전자 주식회사 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법
BR112018009070A8 (pt) * 2015-11-11 2019-02-26 Sony Corp aparelhos de codificação e de decodificação, e, métodos para codificação por um aparelho de codificação e para decodificação por um aparelho de decodificação.
US11212507B2 (en) 2017-11-16 2021-12-28 Samsung Electronics Co., Ltd. Method and apparatus for processing three-dimensional images
EP3547704A1 (en) * 2018-03-30 2019-10-02 Thomson Licensing Method, apparatus and stream for volumetric video format
US11394946B2 (en) 2018-10-30 2022-07-19 Lg Electronics Inc. Video transmitting method, video transmitting apparatus, video receiving method, and video receiving apparatus

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6157396A (en) * 1999-02-16 2000-12-05 Pixonics Llc System and method for using bitstream information to process images for use in digital display systems
KR100397511B1 (ko) * 2001-11-21 2003-09-13 한국전자통신연구원 양안식/다시점 3차원 동영상 처리 시스템 및 그 방법
US7724818B2 (en) * 2003-04-30 2010-05-25 Nokia Corporation Method for coding sequences of pictures
US7496234B2 (en) * 2003-06-20 2009-02-24 Microsoft Corporation System and method for seamless multiplexing of embedded bitstreams
US9131247B2 (en) * 2005-10-19 2015-09-08 Thomson Licensing Multi-view video coding using scalable video coding
EP1967008A2 (en) * 2005-12-21 2008-09-10 Koninklijke Philips Electronics N.V. Video encoding and decoding
US8253740B2 (en) * 2006-02-27 2012-08-28 Koninklijke Philips Electronics N.V. Method of rendering an output image on basis of an input image and a corresponding depth map
JP5108896B2 (ja) * 2006-12-21 2012-12-26 トムソン ライセンシング 多視点映像符号化及び復号化用の、ハイレベルシンタックスを使用した改善されたシグナリングのための方法及び装置
AU2008239653C1 (en) * 2007-04-12 2015-05-07 Dolby International Ab Tiling in video encoding and decoding
KR100918862B1 (ko) * 2007-10-19 2009-09-28 광주과학기술원 참조영상을 이용한 깊이영상 생성방법 및 그 장치, 생성된깊이영상을 부호화/복호화하는 방법 및 이를 위한인코더/디코더, 그리고 상기 방법에 따라 생성되는 영상을기록하는 기록매체
EP3007440A1 (en) * 2007-12-20 2016-04-13 Koninklijke Philips N.V. Image encoding method for stereoscopic rendering
US8878836B2 (en) * 2008-02-29 2014-11-04 Samsung Electronics Co., Ltd. Method and apparatus for encoding datastream including additional information on multiview image and method and apparatus for decoding datastream by using the same
WO2009131287A1 (en) * 2008-04-23 2009-10-29 Lg Electronics Inc. Method for encoding and decoding image of ftv
WO2010010077A2 (en) * 2008-07-21 2010-01-28 Thomson Licensing Coding device for 3d video signals
US8106924B2 (en) * 2008-07-31 2012-01-31 Stmicroelectronics S.R.L. Method and system for video rendering, computer program product therefor
JP5583127B2 (ja) * 2008-09-25 2014-09-03 コーニンクレッカ フィリップス エヌ ヴェ 三次元画像データ処理
EP2197217A1 (en) * 2008-12-15 2010-06-16 Koninklijke Philips Electronics N.V. Image based 3D video format
ES2563728T3 (es) * 2009-01-20 2016-03-16 Koninklijke Philips N.V. Transferencia de datos de imágenes 3D
WO2010084437A2 (en) * 2009-01-20 2010-07-29 Koninklijke Philips Electronics N.V. Transferring of 3d image data
RU2689191C2 (ru) * 2009-01-26 2019-05-24 Томсон Лайсенсинг Упаковка кадров для кодирования видео
WO2010108024A1 (en) * 2009-03-20 2010-09-23 Digimarc Coporation Improvements to 3d data representation, conveyance, and use
US9473788B2 (en) * 2011-09-16 2016-10-18 Dolby Laboratories Licensing Corporation Frame-compatible full resolution stereoscopic 3D compression and decompression

Also Published As

Publication number Publication date
KR20160107357A (ko) 2016-09-13
KR101972962B1 (ko) 2019-04-26
KR20110116239A (ko) 2011-10-25
CN105657404A (zh) 2016-06-08
JP2016213842A (ja) 2016-12-15
CN105657405B (zh) 2018-06-26
CN105657404B (zh) 2018-06-08
KR101940023B1 (ko) 2019-01-21
CN105657405A (zh) 2016-06-08
EP2399394A1 (en) 2011-12-28
EP2399394B1 (en) 2020-09-30
JP2012518367A (ja) 2012-08-09
CN105744284B (zh) 2019-04-19
BRPI1013339B1 (pt) 2021-09-21
WO2010096189A1 (en) 2010-08-26
CN105744284A (zh) 2016-07-06
HK1224496A1 (zh) 2017-08-18
CN102326390A (zh) 2012-01-18
CN102326390B (zh) 2016-03-09
JP6159507B2 (ja) 2017-07-05
US20110298895A1 (en) 2011-12-08
BRPI1013339A2 (pt) 2016-03-29

Similar Documents

Publication Publication Date Title
JP6159849B2 (ja) 3d映像フォーマット
JP6825155B2 (ja) ビデオ符号化及び復号化におけるタイリング
JP6176871B2 (ja) ビデオ符号化のためのフレーム・パッキング
EP2329653B1 (en) Refined depth map
EP2250812A1 (en) Virtual reference view
EP2425625A2 (en) Reference picture lists for 3dv
KR20110115087A (ko) 3차원 영상 데이터를 부호화하는 방법 및 장치와 복호화 방법 및 장치

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20161125

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20161128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170525

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170612

R150 Certificate of patent or registration of utility model

Ref document number: 6159849

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250