JP7009606B2 - パノラマビデオのための提案されるビューポート指示 - Google Patents

パノラマビデオのための提案されるビューポート指示 Download PDF

Info

Publication number
JP7009606B2
JP7009606B2 JP2020216071A JP2020216071A JP7009606B2 JP 7009606 B2 JP7009606 B2 JP 7009606B2 JP 2020216071 A JP2020216071 A JP 2020216071A JP 2020216071 A JP2020216071 A JP 2020216071A JP 7009606 B2 JP7009606 B2 JP 7009606B2
Authority
JP
Japan
Prior art keywords
viewport
omni
information message
omnidirectional
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020216071A
Other languages
English (en)
Other versions
JP2021048650A (ja
Inventor
エム. ボイス,ジル
Original Assignee
インテル コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インテル コーポレイション filed Critical インテル コーポレイション
Publication of JP2021048650A publication Critical patent/JP2021048650A/ja
Application granted granted Critical
Publication of JP7009606B2 publication Critical patent/JP7009606B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • H04N13/117Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation the virtual viewpoint locations being selected by the viewers or determined by viewer tracking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/012Head tracking input arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/014Hand-worn input/output arrangements, e.g. data gloves
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/172Processing image signals image signals comprising non-image signal components, e.g. headers or format information
    • H04N13/178Metadata, e.g. disparity information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/194Transmission of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/243Image signal generators using stereoscopic image cameras using three or more 2D image sensors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
    • H04N13/344Displays for viewing with the aid of special glasses or head-mounted displays [HMD] with head-mounted left-right displays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4728End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本明細書は、符号化されたビデオの通信に関係があり、特に、提案されるビューポートをビデオとともに送ることに関係がある。
安価な高精細ビデオカメラ及び高速インターネット接続の出現とともに、ビデオインターネットトラフィックは急速に成長している。360度ビデオは、特に、仮想現実、ビデオ会議、自動車、及び監視用途における最新動向であり、180及び360度視野カメラを含む広視野カメラによってサポートされている。専用のウェブサイト及びチャネルも、仮想現実コンテンツを含む360度ビデオを投稿及び鑑賞するために利用可能である。ユーザのグループ間の協力のために、360度ビデオは、より高い柔軟性を提供する。複数台のカメラを切り替えることに代えて、遠隔の視聴者は、360度ビューを用いて部屋を横断し、カメラのビュー内の関心のある人々又は対象にズームインすることができる。
仮想現実(VR)ヘッドマウント型ディスプレイを使用するパノラマビデオ再生システムは、コンシューマユースのために新たに興っている。パノラマ及び360度ビデオコンテンツは、通常、複数台のカメラによって撮影された2Dビデオを球表現に縫合することによって生成される。いくつかの場合に、複数のビューがソフトウェアにおいてレンダリングされる。球面ビデオは、その場合に、正距円筒図法フォーマット又はキューブマップ投影フォーマットのような、ビデオ符号化に適したフォーマットに投影される。
クライアントにおいて、完全パノラマの圧縮ビデオフレームを含むビットストリームが受け取られ復号されて、全パノラマ視野の表示が生成される。より小さいビューポートが表示のために選択される。ビューポートによって表示される復号されたビデオの部分は、ヘッドマウント型ディスプレイのヘッド位置によって、又は通常の2D表示で見る場合に位置選択ユーザインターフェイスを通じて、決定される。
本明細書で記載される題材は、限定ではなく、例として、添付の図面において説明される。説明の簡単及び明りょうさのために、図示される要素は、必ずしも実寸通りではない。例えば、いくつかの要素の大きさは、明りょうさのために互いに対して誇張されることがある。
実施形態に従うパノラマビデオ符号化システムのブロック図である。 実施形態に従う代替のパノラマビデオ符号化システムのブロック図である。 ピッチ、ヨー、及びロールのための回転方向を示す3軸直交座標系の図である。 球から平面への正距円筒図法フォーマット投影の図である。 0から5のラベルを付された6つの平面上に球が投影されるキューブマップ投影の図である。 キューブマップ投影の6つの面を含む4×3平面グリッドの図である。 簡潔さのために配列し直されたキューブマップ投影の6つの面を含む2×3平面グリッドの図である。 球から平面への正20面体フォーマット投影の図である。 実施形態に従って、回転なしでの球から平面への2つのオブジェクトの正距円筒図法フォーマット投影の図である。 実施形態に従って、回転ありでの球から平面への2つのオブジェクトの正距円筒図法フォーマット投影の図である。 実施形態に従って、符号化及び鑑賞のために広視野ビデオのためのビューポート指示を提案するプロセスフロー図である。 実施形態に適した計算資源を接続されているヘッドマウント型ディスプレイのブロック図である。 実施形態に従って、ビデオの捕捉、符号化、復号化及び表示に適したコンピュータデバイスのブロック図である。
パノラマビデオ再生システムの視聴者は、パノラマビデオの全体の一部分、例えば、所与の時点での利用可能なエリアの12分の1しか見ていないので、ビデオの最も関心がある領域は見られていない可能性がある。長方形の関心領域を信号伝達する既存の方法は、球面パノラマビデオ又は何らかの他の球形若しくは曲線フォーマットビデオからのビューポートの生成に直接には適用されない。
付加拡張情報(SEI)メッセージが使用されてよく、これは、視聴者のために表示されるべき提案される最も関心があるビューポートを信号伝達することをパノラマビデオコンテンツクリエータに可能にするメタデータを含む。提案される最も関心があるビューポートは、パノラマビデオのビューポートを生成するために必要とされる情報を信号伝達するメタデータを通じて、パノラマビデオの球表現のために示されてよい。球表現を使用することは、この信号伝達が、例えば、正距円筒図法、キューブマップ、8面体、四角すい台、などを含む多種多様な平面投影フォーマットのいずれかのために使用されることを可能にする。それはまた、信号伝達があらゆるタイプのエンコーダ及びデコーダのために使用されることも可能にする。
クライアントにおいて、ビューポート生成部は、視聴者のために表示すべく、提案される最も関心がある直線的ビューポートを生成するために、受け取られたメタデータを使用することができる。このビューポートは、さもなければ視聴者のヘッド位置に基づき選択されるか又は他の位置指示ユーザインターフェイスに基づき選択されることになるものに代わるものを提供する。
長方形の関心領域がいくつかのシステムで容易に信号伝達され得るが、長方形領域アプローチは、投影フォーマットにおいて符号化された球面ビデオにとって有効でない。平面投影フォーマットにおいて符号化されたフレームの長方形関心領域は、ビューポートの生成のために使用されたビデオフレームの部分に対応していない。ビューポートを生成することにおいて使用された対応する位置は、投影フォーマットの符号化されたビデオフレームにおける、場合により不連続の、1つ以上の非長方形領域に対応する。
図1は、パノラマビデオ符号化システムのブロック図である。ビデオは、サーバ、プロダクションシステム、又は別のシステム102の組み合わせで生成される、サーバにおいて、複数台のカメラ106が2Dビデオを捕捉する。6台のカメラが示されているが、使用されるカメラは、より多くても又はより少なくてもよい。カメラは第1モジュール108へ接続されている。第1モジュールにおいて、複数台のビデオは縫合され、投影フォーマットにマッピングされる。投影フォーマットにおける縫合されたビデオは、HEVC又はAVCのようなビデオエンコーダ110へ入力される。エンコーダは、ビデオを符号化し、それを、ビットストリームとしての後の伝送のために、送出又はバッファリングする。エンコーダは、内部バッファ又は大容量記憶装置を備えてよく、あるいは、適切なバッファ又はデータストアが、エンコーダの外部に設けられてもよい。
符号化されたビデオは、ネットワーク、インターネット、ブロードキャスト、又はポイント・ツー・ポイント接続112を通じて、サーバ又はヘッドエンドから1つ以上のクライアント104へビットストリームとして送られる。クライアントにおいて、ビデオデコーダ114は、サーバからのビデオを受け取り、圧縮されたビットストリームを復号する。復号されたビデオの一部分のみが見られる場合に、ビューポートは、その選択された領域のためにビューポートモジュール116において生成される。見るべき符号化されたビデオの部分は、ポジションセレクタ120によって、例えば、ヘッドマウント型ディスプレイのヘッド位置又は位置選択ユーザインターフェイスを用いて、決定される。位置は、復号されたビデオを受け取り、適切なビデオストリームをディスプレイ118へ供給するビューポート生成部へ送られる。ディスプレイは、ビューポートが通常の2D表示で見られることを可能にする。表示の前にビデオをセーブするための、ビューポート生成部に関連した又はそれに組み込まれているバッファが存在してよい。
図2は、代替のパノラマビデオ符号化システムのブロック図である。ビデオは、サーバ202、プロダクションシステム、又は別のシステムの組み合わせである。複数台のカメラ206が2Dビデオを捕捉し、それを第1の縫合及び投影モジュール208へ供給する。複数のビデオが、モジュール内のバッファにバッファリングされる。ビデオは、このモジュールで縫合され、投影フォーマットにマッピングされる。投影フォーマットにおける縫合されたビデオは、モジュールの他のバッファに記憶され、次いで、HEVC又はAVCのようなビデオエンコーダ210へ入力される。
コンテンツクリエータ、コメンテータ、エディタ、又はあらゆる他の主体が、最も関心のあるビューポート領域を選択してよい。代替的に、自動システムが、ビューポート領域を、例えば、高い運動速度又は高いテクスチャ特徴を持ったエリアとして選択してよい。選択は、ビデオエンコーダ210へ結合されている関心領域(ROI)選択部212へ適用される。ビデオエンコーダは、ビデオ縫合及びマッピング投影208から受け取られたビデオを符号化する。選択されたROIは、メタデータ216のような情報としてビデオエンコーダへ供給され、エンコーダによってビデオビットストリーム218に含められる。情報は、多種多様な方法のいずれかにおいて符号化され得る。ROIは、エンコーダから出力されるビデオビットストリームに加えられるメタデータの形で供給され得る。それは、SEIメッセージの形で又は他の形で加えられ得る。ROIメタデータは、フレーム又はフレームのグループに関連することができ、従って、フレームごとに1回更新され得る。
情報を符号化するための1つのそのような方法は、付加拡張情報(SEI)メッセージの構造内のメタデータとしてであるが、様々な他のメッセージ構造のいずれが使用されてもよい。異なるエディタ又はコメンテータから複数のSEIメッセージとして供給される複数のROI選択が存在してよい。また、1よりも多いROIを示すよう1人のエディタからの複数のROI選択が存在してもよい。ユーザは、次いで、同時に表示不可能であるいずれかの中から選択してよい。メッセージは、衝突し合うか又は互いを補完し得る。SEIメッセージは特定のフレームと関連するので、ビューポート又はROI選択又は提案は、いずれかのフレームで変更され得る。
ビデオエンコーダはビデオを符号化し、それをSEIメッセージ及び何らかの他のメタデータと結合し、それをビットストリームとしての後の伝送のために送出又はバッファリングする。エンコーダは、適切なバッファを含んでよく、あるいは、他の記憶デバイスがエンコーダ又はサーバの他の部分に組み込まれてもよい。
符号化されたビデオは、ネットワーク、インターネット、ブロードキャスト、又はポイント・ツー・ポイント・リンクのようなデータ・リンク218を通じて、サーバ202又はヘッドエンドから1つ以上のクライアント204へビットストリームとして送られる。クライアントにおいて、ビデオデコーダ224は、サーバからのビデオ218を受け取り、圧縮されたビットストリーム218を復号し、あらゆるSEIメッセージを取り出す。ビューポート生成モジュール226は、ビデオについての選択されたROIを含むSEIメッセージ、更にはユーザ位置選択部230からの位置を受け取る。ビューポート生成部は、復号されたビデオを受け取り、適切なビデオストリームをディスプレイ228へ供給する。このビデオストリームは、直ちに表示されるか、あるいは、ビューポート生成部内にあるか又はビューポート生成部へ接続されているバッファ又は他のストレージに記憶されてよい。クライアントエンドにおいて、視聴者は、SEIメッセージの提案されるビューポートを見るためにコンテンツ提供者の提言に従うことを選択することでき、あるいは、クライアントが、位置選択230又は他のセンサを用いてビューポートを選択することができる。このようにして、選択又は推奨されたROIは視聴者によって優先され得る。
提案されるビューポートメタデータはフレームに関連し、従って、フレームごとに1回更新される。1よりも多い提案されるビューポートは、コンテンツクリエータが、例えば、複数の動作物体を別々に追跡するために、1よりも多く示したい場合に、示され得る。これは、視聴者が、例えば、パノラマビュー内の特定の人又は事象を見ることを選択することを可能にする。
ビューポート位置又は球面回転方向を表すメタデータは、緯度、経度及び視野、ピッチ、ヨー及びロール、又は方位角、仰角及び傾きのような、3つ以上のパラメータを含んでよい。図3は、ピッチ254、ヨー256、及びロール252の回転方向を示す3軸直交座標系の図である。3軸はx軸242、y軸244、及びz軸246である。回転方向は、参照系(frame of reference)の原点から見られる各軸周りの時計回りの回転である。ロールはx軸周りである。ピッチはy軸周りであり、ヨーはz軸周りである。軸は、水平、垂直、若しくは深さ、又は何らかの他の適切な名称のような、別の名称を有してもよい。方位角、仰角及び傾きは、原点と、原点からその原点の周りの球面上の位置への放射線との間の角度に対応する。一方、本実施形態は、参照直交座標系の軸周りの回転の形をとる。球面投影の回転は、他のタイプの座標系及び投影を用いて如何なる他の所望の方法でも表されてよい。
メタデータは、HEVC及びAVC標準で使用されるような付加拡張情報(SEI)メッセージに含まれてよい。SEIメッセージを使用することは、規範的な符号化及び復号化プロセスが不変であるということで、レガシー・エンコーダ及びデコーダが使用されることを可能にする。回転は、特定の実施に応じて、送信側202での予備処理214として及び受信側204での後処理222として、又はプロセス中の他の位置で適用されてよい。後処理球面回転は、デコーダの出力ピクチャに適用される。
SEI及びメタデータに代わるものとして、回転方向メタデータが、ビデオコーデックにおけるパラメータセットに、又はスライスヘッダに含まれてもよい。この場合に、適合した出力ピクチャの定義は、ピクチャが出力される前に既に逆球面回転が適用されているように、変更され得る。
表1は、ROI提案又は選択シンタックスについてのメタデータパラメータを含むSEIメッセージのためのシンタックスの例である。このシンタックスは、それがコアな符号化又は復号化プロセスを変えないので、HEVC及びAVCのような既存のビデオコーデック標準とともに使用され得る。メタデータは、ビューポートが前のビューポートに取って代わるかどうかを示すフラグを有する。それはまた、画像の球面上の位置並びに水平及び垂直視野を提供する。
メタデータは、ID及びキャンセルフラグによって識別される、ビューポートを生成するのに必要な情報を含む。情報は、角度において、緯度及び経度、並びに水平及び垂直視野サイズによって表されるような、球表現におけるビューポートの中心の位置を含む。角度は、度、ラジアン、又は直線距離において示され得る。なお、他のタイプの表現がROIの位置及びサイズを示すために使用されてもよい。球表現を基準として使用することは、同じシンタックスが、正距円筒図法、キューブマップ投影、8面体投影、正20面体投影、四角すい台投影、などのような、如何なる投影フォーマット又はレイアウトのためにも使用されることを可能にする。
Figure 0007009606000001
ROI位置は、符号化されたビデオシーケンスの全体について、及び/又はフレームごとに、メタデータにおいて送出され得る。信号伝達される値、すなわち、メタデータ内の緯度、経度、及び視野パラメータは、デコーダの後に出力画像に適用されるビューポートを示す。
表2は、代替の全方向性のビューポートSEIメッセージシンタックスを与える。
Figure 0007009606000002
いくつかの実施形態において、全方向性のビューポートSEIメッセージは、ユーザが見る方向の制御を有してないか又は見る方向の制御をビューポート提言に解放している場合に表示のために推奨されるビューポートに対応する、4つの大円によって境界された球面座標ジオメトリの1つ以上の領域の座標を指定する。
omni_viewport_idは、1つ以上の推奨されるビューポート領域を特定するために使用され得る識別番号を含む。
1に等しいomni_viewport_cancel_flagは、SEIメッセージが出力順序におけるいずれかの前の全方向性ビューポートSEIメッセージの持続をキャンセルすることを示す。0に等しいomni_viewport_cancel_flagは、全方向性ビューポート情報が続くことを示す。これは、ビューポートSEIがビューポートに変化があるときにのみ使用されるように、使用され得る。
omni_viewport_persitence_flagは、現在のレイヤについての全方向性ビューポートSEIメッセージの持続を指定する。0に等しいomni_viewport_persitence_flagは、全方向性ビューポートSEIメッセージが現在の復号されたピクチャのみに適用されることを指定する。1に等しいomni_viewport_persitence_flagは、次の条件のうちの1つ以上が真であるまで全方向性ビューポートSEIメッセージが出力順序において現在のレイヤのために持続することを指定する。picAを現在のピクチャであるとする:
現在のレイヤの新しいCLVSが開始する。
ビットストリームが終了する。
現在のレイヤに適用可能である全方向性ビューポートSEIメッセージを含むアクセスユニットにおける現在のレイヤ内のピクチャpicBは、picBのピクチャ順カウントについての復号化プロセスの起動の後直ちに、PicOrderCnt(picB)及びPicOrderCnt(picA)がpicB及びpicAのPicOrderCntVal値であるとして、PicOrderCnt(picB)がPicOrderCnt(pica)よりも大きい場合に、出力される。
0に等しいerp_cancel_flagを含む正距円筒図法SEIメッセージ又は0に等しいcmp_cancel_flagを含むキューブマップ投影SEIメッセージが、現在のピクチャに適用されるCLVSに存在せず、復号化順序において全方向性ビューポートSEIメッセージに先行する場合に、0に等しいomni_viewport_cancel_flagを含む全方向性ビューポートSEIメッセージは、現在のピクチャに適用されるCLVSにおいて存在してはならない。デコーダは、現在のピクチャに適用されるCLVSにおいて、復号化順序において0に等しいerp_cancel_flagを含む全方向性ビューポートSEIメッセージ又は0に等しいcmp_cancel_flagを含むキューブマップ投影SEIメッセージに続かない、0に等しいomni_viewport_cancel_flagを含む全方向性ビューポートSEIメッセージを無視すべきである。
omni_viewport_cnt_minus1 plus1は、SEIメッセージによって示されている推奨されるビューポート領域の数を特定する。omni_viewport_cnt_minus1が0よりも大きく、且つ、推奨されるビューポートが表示されるよう提案される情報がない場合に、以下が適用される:
omni_viewport_idが0又は1に等しい場合に、0番目の推奨されるビューポートは、ユーザが見る方向の制御を有してないか又は見る方向の制御を解放している場合に、表示されるよう提案される。
omni_viewport_azimuth_centre[i]及びomni_viewport_elevation_centre[i]は、2-16度やラジアンの単位、又はグローバル座標軸に対する何らかの他の所望の単位で、i番目の推奨されるビューポート領域の中心を示す。
omni_viewport_tilt_centre[i]は、2-16度の単位で、i番目の推奨されるビューポート領域の傾斜角を示す。omni_viewport_hor_range[i]は、i番目の推奨されるビューポート領域の方位角範囲を示す。omni_viewport_ver_range[i]は、i番目の推奨されるビューポート領域の仰角範囲を示す。
それらのパラメータ、単位、及び値の範囲の夫々の具体的な定義は、如何なる他の特定の実施にも適するよう変更されてよい。同様に、パラメータのうちのいずれか1つ以上は、他の実施に適するよう削除されても又は別のパラメータに置換されてもよい。更なるパラメータが加えられてもよく、パラメータの順序は、種々の実施に適するよう変更されてよい。
図4は、正距円筒図法フォーマット投影の図である。オリジナルの球面ビュー266が左に示されており、包まれていない平面グリッド260上への球の投影が右に示されている。不連続性が右側の長方形平面フレーム260の左端262及び右端264で導入されている。左側の現実世界の球表現では、左右の端はつながっている。その上、有意なワーピングが、右側のフレームの上及び下に沿ったピクセルを変形させる。これは、左側の北極及び南極領域に対応する。特定の提案されるビューポートは、正距円筒図法フォーマットの左右の端を横断し得るので、符号化された投影フォーマットフレームにおける2つの異なった領域に対応することになる。同様に、特定の提案されるビューポートは、変形されている上端の異なる部分にわたってもよい。
空間方向イントラ予測及びブロック並進運動補償を使用する現在のビデオ符号化標準は、極の近くで又は左右の端に沿ってよりも、正距円筒図法の予測の中心の近くでより良く機能する。左/右端の不連続性を横切って広がるオブジェクトは、空間イントラダイレクション(intra-direction)位置を用いて又は動き補償により満足に予測され得ない。
キューブマップ投影では、6つの立方体面が長方形フレームに配置される。図5は、球が0から5のラベルを付された6つの平面上に投影されるキューブマップ投影の図である。6つの面の夫々は、球の一部の上に投影される。面は、次いで、平面グリッドにおいて表示され得る。図6は、投影の隣接エリアが互いに隣に置かれている6つの面の4×3平面レイアウトを表す。図示されるように、面1と2、1と3、1と4、4と0、及び0と5の間の境界は隣接したまま保たれる。しかし、他の境界は、それらが図6においてあるように、互いに隣接して置かれていない。2及び3の面は、面4、5、又は0のいずれかの辺上にあるよう動かされて、代わりにそれらの境界を保持してもよい。平面グリッド表現は、多くのコーデック並びに他のデジタル処理及び圧縮システムに大変都合良くできているが、一方で、立方体を表すピクセルを含まない図6の平面フレームのいくつかのエリアが存在する。面4、5及び0の上及び下にはエリアが存在する。それらの面は、背景色に設定されるが、符号化するためにいくらかのデータを必要とする。図7は、3×2平面レイアウトを表し、立方体面が、よりコンパクトなレイアウトに適合するよう並べ直されている。図7の表現は、エッジを処理することにおいていくらかの追加の複雑性を必要とし得るが、ピクセル数は、4×3から3×2まで半分に減らされる。
キューブマップ投影フォーマットの符号化のための回転方向の選択は、投影フォーマットが不連続性の数及び位置で異なるということで、選択された特定のレイアウトに依存する。夫々の立方体面のエッジ領域は、立方体面の中心領域よりもひずみが大きい。回転方向の選択は、特に、立方体面エッジにおける不連続性にまたがるオブジェクトを最小限にしようと試みる。エッジとともに面を含む他の投影フォーマットも、同様の不連続性及びひずみを導入する。
図8は、正20面体投影の図である。これは、球表現から20面体を使用する平面表現への他のタイプの投影である。この例では、左側は、図5のキューブマップの6つのみの小面よりもむしろ、周囲の20面体の20個の小面上に投影された球280を示す。20個の小面は、次いで、右側で2次元空間282に配置されるよう示されている。他の投影と同様に、小面の夫々の端にはひずみ及び不一致が存在する。より多くの小面を使用することは、ひずみの量を減らすが、継ぎ目の数及び位置を増やす。
様々な他の投影のいずれもが、8面体、四角すい台、及び様々な他のタイプの多角形投影のいずれかを含め、上述されたように使用されてよい。より多くの小面によれば、夫々の小面のひずみは低減されるが、複雑性は増大されることになり、エッジを回避することがより困難になる。
いくつかの実施形態において、推奨されるビューポートは、符号化プロセスの部分として選択され得る。いくつかの実施形態において、推奨されるビューポートは、動き又は他の特性についてシーンを解析し、シーンのどの部分が最も関心がある特徴を含むかを決定することによって、“帰納的”(posteriori)プロセスを通じて選択され得る。いくつかの実施形態において、階層化法が、そのアプローチとともに使用可能であり、それにより、フレームのダウンサンプリングされたバージョンが、フル解像度フレームよりもむしろ符号化される。
代替のアプローチは、パノラマフレームにおいて高速な動作及び高いテクスチャのエリアを検出し、それらのエリアを、使用される投影フォーマットに応じて、正距円筒図法フレームにおいて、又は立方体面において中心に置くことを目指すことである。
上記のSEIメッセージは、球状の選択されたビューポートSEIメッセージと組み合わせて使用されてよい。2つのSEIメッセージが一緒に使用される場合に、球回転情報方向SEIメッセージによって提案される回転が最初に適用されてよく、次いで、提案されるビューポートSEIメッセージからの提案されるビューポート位置が、回転される球表現に対して決定される。
フレームパック形式のステレオビデオがビデオフレーム内に含まれる場合には、方向値が夫々のビューについて別々に送出されてよく、あるいは、第2ビューのための値は、場合により、第1ビューに対する台にビューの相対位置に関する如何なる情報も考慮して、第1ビューの値に基づき導出されてよい。
図9は、パノラマ多重カメラビューを有する球302、及び平面304への球の正距円筒図法の図である。この例では、ビデオコンテンツは、球面における楕円314、316及び三角形312として表現される。楕円の2つの部分314、316は、パノラマビューの2つの側で見られる同じ楕円を表す。それらのオブジェクトは、正距円筒図法マッピング304に投影され、同じ楕円の2つの部分324、326及び三角形322となって現れる。正距円筒図法マッピングにおいて、楕円は、左右の端にまたがる不連続性を有している。それはまた、それが北極に近いということで、水平方向に伸ばされている。
図10は、球面回転が球に適用された後の同じコンテンツの球334及び長方形マッピング336の図である。回転された球の楕円332は、このとき、フレームの中心により近い。三角形330は、楕円と同じくらい中心に近く、それにより、2つのアイテムのひずみはおおよそ同じになる。正距円筒図法では、あらゆる2次元オブジェクトがひずんでいる。ひずみの量は、中心からの距離とともに増大する。回転なしの同じ球302と比較して、回転された球334により示されるように、楕円の不連続性はもはやない。楕円はフレームの中心により近いので、ひずみも小さくなる。三角形も改善されるがそれほど重要でない。投影の平面グリッド336は、投影された楕円340及び投影された三角形338がグリッドの真ん中に近いことをより明らかにする。グリッドの真ん中ではひずみがより小さく、楕円は回転前の投影304のように2つではなく1つの部分にある。回転されたフレームに基づき符号化されるビデオは、回転されないフレームを使用するビデオよりもレガシー・ビデオエンコーダによって効率的に符号化するはずである。
様々な他の投影のいずれもが、8面体、四角すい台、及び様々な他のタイプの多角形投影のいずれかを含め、上述されたように使用されてよい。より多くの小面によれば、夫々の小面のひずみは低減されるが、複雑性は増大されることになり、エッジを回避することがより困難になる。選択されたビューポートは、それでもなお、緯度、経度、又は他の座標を用いて示され得る。
図2に戻ると、特異な構造及び構成は、投影を使用するパノラマビデオ、360度ビデオ、VRビデオシステム及び何らかの他の広視野システムについてのユーザの経験を改善する。その構造の動作は、上記の球から長方形へのマッピングの記載に照らして、より良く理解され得る。
図11は、上述されたように、好ましいビューポートを使用し、ビューポート指示を送出するプロセスフロー図である。サーバ又はサーバ側202では、投影マッピングが、404で広視野ビデオを受け取る。図中、ビデオは複数台のカメラから受け取られ、そうして、マッピングモジュール又は他のビデオ縫合部は、402で、複数台のカメラからのビデオをまとめて、単一の広視野ビデオを生成する。他の場合に、ビデオは、前もって記憶され、次いで、符号化のために取り出されてもよく、あるいは、ビデオの一部又は全ては、ソフトウェア及びユーザ入力に基づきグラフィクスシステムによって生成されてもよい。ビデオ入力は、シミュレーションされた又は仮想の世界を含んでもよく、あるいは、仮想部分及び現実部分が組み合わされて存在してもよい。ビデオは、180度、360度、パノラマ、又は何らかの他の広視野であってよい。ビデオは、垂直視野よりも広い水平視野を有してもよい。
どんなふうにでも生成又は受け取られた、完全な縫合された広視野ビデオは、次いで、406で平面投影にマッピングされる。多種多様な投影のいずれかが使用されてよい。正距円筒図法、球面キューブ投影、及び8面体投影が図示及び記載されているが、他の投影も存在してよい。
本明細書で示される例では、ビデオは球状であるが、完全な球は必要とされない。ビデオは、球の一部分のみを含んでよい。上記の180度視野は球の半分のみである。視野は、球の一部分のみを示すよう水平方向及び垂直方向の両方で小さくされ得る。他方で、視野は、球の一部のように湾曲している。これは、画像が全ての方向で視聴者から同じ距離であることを可能にする。
この湾曲した画像は、次いで、上記の例を含むあらゆる望ましいタイプのジオメトリも用いて平面上に投影される。球の一部の全て及び部分である湾曲した視野は固有ひずみを有さない一方、そのような湾曲面の平面投影はひずみを有する。平面投影は、しかしながら、符号化、圧縮、及び他の画像処理に適している。
ビデオがマッピングされる前又は後で、適切なビューポート選択が408でシーンについて受け取られる。選択は、いくつかの実施形態では、重要なエリア又は関心領域がビューポート内にあるように行われる。いくつかの実施形態において、シーンは、ビューポートを選択するために解析される。代替的に、ビューポート選択は製作者又はクリエータからであり、あるいは、視聴者統計値に基づく。いくつかの実施形態において、仮想現実の場合のように、ビューポートはまた、ユーザからも受け取られる。これは、サーバエンドで選択されたビューポートを使用したくないユーザのための選択肢を提供し得る。ビューポートは、広視野ビデオのどの部分がユーザの視野内、従って、ユーザの視野の真ん中になるかを示す。このエリア又は領域は、それを他のエリアを重要ならしめる話者、キャラクタ、新たに現れるオブジェクト又はその他特徴を有し得る。このエリア又は領域は、次いで、推奨又は選択されるビューポートに対応する最重要として選択されてよい。
受け取られた又は生成されたビューポートは、次いで、410で、ビデオ内のその位置を決定するようビデオと比較される。位置は、球面投影における緯度及び経度として、又は平面投影における位置として特定され得る。平面投影位置は、直交座標として又は何らかの他の方法で示されてよい。その上、ビューポートのサイズが示されてもよい。表1及び2の例では、サイズは、水平及び垂直視野として示されるが、ピクセルの数又は水平及び垂直方向における角度若しくは直線距離を含む他の単位が使用されてもよい。
ビューポートのサイズは、ユーザのビューがビューポートの大きさに応じてより大きく又はより狭くされるズーム効果を作り出すために使用されてよい。他の実施形態では、ビューポートのためのより大きい視野がユーザの視野全体を満たし得るように、ユーザのビューは同じサイズのままである。ビューポートのためのより小さい視野は、ユーザの視野の一部分しか満たさない。より小さい視野は、ユーザが、推奨されるビューポートの傍らの要素を見るためにビューポートを別の位置へ動かすことを可能にし得る。
球面ビデオにおける位置は、多種多様な方法で表現され得る。球面座標では、ロール、ピッチ、及びヨーが、代替的に、球面上の位置を表現するために使用され得る。それらのうちの1つ以上が使用されてよく、あるいは、直交座標、例えば、垂直及び水平が投影を参照して使用されてもよい。ロール、ピッチ、及びヨーについて、3つ全てが使用される必要はない。関心領域を極から離すために1つしか必要とされないことがある。ロール、ピッチ、及びヨーについての回転情報は角度として表現され得る。回転の角度は、ビデオの元の座標に対する。その上、ビデオの絶対的な向き(absolute orientation)がメタデータに含まれてもよい。絶対的な向きは、カメラの、又はカメラ配列が存在する場合には、複数台のカメラのうちの1台以上の、向きを反映する。
ビューポートが決定された後、次いで、関心領域選択部212が、412で、選択されたビューポートを記述するビューポートメタデータを生成する。これはビデオエンコーダへ供給され、それにより、ビデオエンコーダが414で球面ビデオの平面投影を符号化する場合に、ビューポートメタデータが、416で、符号化されたビデオに含まれるようにする。回転方向メタデータも417で含まれてもよい。メタデータを伴った符号化されたビデオは、次いで送信、バッファリング、又は記憶され、それにより、それは、即時又は後の伝送及び表示のために、符号化されたビデオとして供給され得る。HEVC及びAVCのような多くのタイプの符号化の場合に、SEIメッセージが使用されてよい。なお、本発明はそのように制限されない。
ビューポートの選択は、ビデオの各フレームについて、又は関心領域が動く各フレームについて行われてよい。SEIメッセージは特定のフレームに関係しており、それにより、関心領域が動いたフレームは、それ自体のビューポートメッセージを有し得る。いくつかの場合に、メッセージは、新しいビューポートメッセージが受け取られるまで次の組のフレームについてのビューポート選択をキャンセルすることであってよい。これは、表1及び2において先に図示及び記載されたフラグを用いて行われ得る。これは、夫々のシーン及び関心領域の変化が、対応するフレームについてのビューポートを変更するよう、異なるSEIメッセージによりフラグを立てられることを可能にする。
受信器又はクライアント側204では、SEIメッセージのようなメタデータを含む符号化されたビデオが、422で、サーバ及び放送局から受け取られる。クライアントは、424でビデオを復号し、426でビューポートメタデータを取り出すデコーダを備える。ビューポートが、次いで、ビューポートメタデータに基づき、復号されたビデオについて生成され得る。回転方向メタデータもメタデータに含まれる場合には、次いで、回転が427で実行されてよい。回転は、ピッチ、ロール、及びヨー角によって、又はメッセージにおいて示される何らかの他の方法で決定される。これは、カメラ又はエンコーダで適用された回転を逆にする球面ビデオの回転である。ビデオのこのビューポートは次いで、ユーザによる鑑賞のためのヘッドセット、3Dモニタ、又は2D表示画面のようなディスプレイへ供給される。
多くの用途について、ユーザインターフェイスの位置選択部230を通じてユーザによって選択されたビューポートが存在する。これは、従来のユーザ入力デバイスを通じて、又は何らかの他のセンサを通じて行われてよい。VRヘッドセットの場合に、ヘッドセット又はユーザの目の動きが検出され、ビューポートは、ユーザがどこを見ているかに基づき決定され得る。ビューポート生成部226は次いで、メタデータからの推奨されるビューポート、ユーザが選択したビューポート、又はそれら2つの組み合わせのいずれか1つを用いて、復号されたビデオのビューを生成してよい。
428で、位置選択部から受け取られたもののような、ユーザ選択のビューポートを使用すべきかどうかが決定される。決定は、ユーザ入力又はユーザ入力の欠如に基づいてよい。ユーザが選択を行った場合且つユーザ選択が如何なる他のビューポートにも優先することをユーザが示している場合にのみ、ユーザ選択入力を使用するデフォルトが存在してよい。ユーザ選択のビューポートが使用されるべきでない場合には、次いで432で、ビューポートは、取り出されたメタデータを用いて生成される。述べられているように、いくつかの場合に、メタデータにおいて受け取られる1よりも多いビューポート選択が存在してよい。そのような場合に、ディレクターズ・カットのようなデフォルトが存在し、ユーザは、メタデータに含まれる他のビューポートの中から異なるビューポートを選択することを可能にされ得る。
ユーザの選択が使用されるべきである場合には、次いで430で、ビューポート生成部は、ユーザ選択を用いてビューポートを生成する。いずれの場合にも、生成されたビューポートは、434で表示のためにビデオとして供給される。
上述されたように、受け取られた符号化されたビデオは、複数台のカメラから受け取られるか又はグラフィクスシステムによって生成された広視野の投影である。投影は、正距円筒図法又はあらゆる他の適切な平面投影であってよい。多くのビデオ符号化システムは、SEIメッセージのようなメタデータが、符号化されたビデオの特定のフレームに関連することを可能にする。結果として、デコーダが新しいSEIビューポートメッセージを見つける場合に、ビューポート生成部は、新しいメッセージを用いて対応するフレームについてのビューポートを変更するよう命令され得る。ビューポートは次いで、次のメッセージが来るまで保持され得る。結果として、更なるメタデータが、符号化されたビデオの更なるフレームのために受け取られ得る。
図12は、複数の遠隔情報源を伴った高性能HMD(Head Mounted Display)の図である。HMD502は、本体504及び取り付けストラップ506を備える。本体は、仮想世界を装着者に描画するためのユーザディスプレイ及びスピーカを備えている。本体はまた、慣性センサ、マイクロホン及び他のユーザ入力デバイスを備える。処理、通信、及び電力又はバッテリ・スイートは、HMDがビデオ及び音響をレンダリングすること並びにテザリングされたコンピュータ510と無線508で通信することを可能にする。
ユーザは、頭部及び身体の動きを通じて仮想世界と相互作用し、更には、音声コマンド、手のジェスチャ及び他のユーザ入力デバイスを用いて相互作用してもよい。ゲームコントローラ520は、更なる制御を供給するよう、テザリングされたコンピュータへ無線508又は他の無線インターフェイス522を通じて結合されてよい。HMDは、レンダリング又は圧縮されたビデオフレーム及びオーディオをユーザへの表示のためにコンピュータから受け取るために、WiFi、WiDi、又は他の高速デジタル無線接続を通じてコンピュータへ結合されてよい。更なる記述、データ、パラメータ、及びコマンドも、コンピュータから受け取られてよい。HMDはまた、コマンド、制御、及び仮想インタラクションデータをコンピュータへ同じ又は他の無線リンクを通じて送出してもよい。コントローラは、例えば、Bluetooth(登録商標)又は免許不要周波数帯(unlicensed bands)を通じて通信してよい。複数の無線インターフェイスが、完全なユーザ経験を提供するよう組み合わされてよい。
いくつかの場合に、コンピュータは持ち運び可能であり、ユーザによって携行される。これは、望まれる場合に、有線接続を可能にする。携行されるコンピュータは、ノートブック、タブレット、スマートフォン、又はあらゆる他の望ましい物理構成を有してもよい。他の場合に、コンピュータは固定であり、有線接続によりHMDに取り付けられている。
コンピュータは更に、インターネット、LAN(Local Area Network)又は他の有線若しくは無線接続を通じて遠隔サーバ516へ接続されてよい。遠隔サーバは、符号化されたビデオを供給し、そして、仮想世界に関する追加情報を供給し得る。遠隔サーバはまた、同じ又は関連する仮想世界を経験している他のユーザとのやり取りも提供し得る。代替的に、HMDは、コンピュータ510を経由することなしにサーバと直接に通信してもよい。他の実施形態では、遠隔サーバは使用されず、テザリングされたコンピュータが独立して動作する。
本明細書中の例では、ワイヤレスHMDは、受け取られた符号化されたビデオを記憶及びレンダリングすることをHMDに可能にするようGPU(Graphics Processing Unit)、グラフィクスプロセッサ、メモリ及び他の資源へ結合され得るスCPU(Central Processing Unit)のようなローカル計算資源又はクライアントデバイスを備える。ローカルレンダリングは、数あるタスクの中でも特に、記載された回転及びビューポート生成を含み得る。
図13は、1つの実施に従うコンピュータデバイス100を表す。コンピュータデバイス100はシステムボード42を内蔵する。ボード42は、制限なしに、プロセッサ44及び少なくとも1つの通信パッケージ46を含む多数のコンポーネントを含んでよい。通信パッケージは、1つ以上のアンテナ16へ結合されている。プロセッサ44は、物理的及び電気的にボード42へ結合されている。
その用途に応じて、コンピュータデバイス100は、ボードへ物理的及び電気的に結合されても又はされなくてもよい他のコンポーネントを含んでもよい。それらの他のコンポーネントは、制限なしに、揮発性メモリ(例えば、DRAM)48、不揮発性メモリ(例えば、ROM)49、フラッシュメモリ(図示せず。)、グラフィクスプロセッサ12、デジタル信号プロセッサ(図示せず。)、暗号化プロセッサ(図示せず。)、チップセット14、アンテナ16、タッチスクリーンディスプレイのようなディスプレイ18、タッチスクリーンコントローラ20、バッテリ22、オーディオコーデック(図示せず。)、ビデオコーデック(図示せず。)、電力増幅器24、グローバルポジショニングシステム(GPS)デバイス26、コンパス28、加速度計(図示せず。)、ジャイロスコープ(図示せず。)、スピーカ30、カメラアレイ32、マイクロホンアレイ34、及び大容量記憶デバイス(例えば、ハードディスクドライブ)10、コンパクトディスク(CD)(図示せず。)、デジタルバーサタイルディスク(DVD)(図示せず。)、などを含む。それらのコンポーネントは、システムボード42へ接続されるか、システムボードに実装されるか、又は他のコンポーネントのいずれかと組み合わされてよい。
カメラアレイは、イメージチップ36へ、且つ、直接に又はイメージチップを通じて、プロセッサ44へ結合されてよい。イメージチップは、グラフィクス・コプロセッサ、デジタル信号プロセッサ(DSP)、イメージ信号プロセッサ(ISP)、又はあらゆる他のタイプの別個の専用のイメージング管理モジュールのような、多種多様な形態をとり得る。そのようなデバイス又はモジュールは、1つ以上の画像を捕捉、処理、編集、圧縮、記憶、印刷、及び/又は表示するよう動作可能なロジック、アルゴリズム、及び/又は命令を有してよい。いくつかの実施形態において、イメージング管理モジュールは、イメージングアプリケーション又はオペレーティングシステム内にソフトウェアとして実装されるプログラミングルーチン、関数、及び/又はプロセスを有してよい。様々な他の実施形態では、画像処理は、スタンドアローンのチップ若しくは集積回路として、あるいは、プロセッサ内、グラフィクスチップ又は他の集積回路若しくはチップ内、又はカメラモジュール内に含まれる回路構成として実装されてよい。上記の技術は、プロセッサのイメージチップにおいて実装されてよく、あるいは、機能は、カメラ、イメージチップ、プロセッサ、及び他のコンポーネントを含み得る異なるコンポーネント間で分配されてもよい。
通信パッケージ46は、コンピュータデバイス100への及びそれからのデータの転送のための無線及び/又は有線通信を可能にする。語「無線」及びその派生語は、非固体媒体を経る変調された電磁放射の使用によりデータを通信し得る回路、デバイス、システム、方法、技術、通信チャネルなどを記載するために使用され得る。その語は、関連するデバイスが如何なる配線も含まないことを暗示するものではないが、いくつかの実施形態ではそうでないことがある。通信パッケージ46は、制限なしに、Wi-Fi(IEEE802.11ファミリー)、WiMAX(IEEE802.16ファミリー)、IEEE802.20、ロングタームエボリューション(LTE)、Ev-DO、HSPA+、HSDPA+、HSUPA+、EDGE、GSM(登録商標)、GPRS、CDMA、TDMA、DECT、Bluetooth(登録商標)、そのEthernet(登録商標)派生物、並びに3G、4G、5G以上と表されるあらゆる他の無線及び有線プロトコルを含む多数の無線又は無線標準又はプロトコルのいずれかを実装してよい。コンピュータデバイス100は、複数の通信パッケージ46を含んでもよい。例えば、第1通信パッケージ46は、Wi-Fi及びBluetooth(登録商標)のような短距離無線通信に専用であってよく、第2通信パッケージ46は、GPS、EDGE、GPRS、CDMA、WiMAX、LTE、Ev-DO、及び他のような長距離無線通信に専用であってよい。
様々な実施において、コンピュータデバイス100は、ラップトップ、ネットブック、ノートブック、ウルトラブック、スマートフォン、ウェアラブルデバイス、タブレット、パーソナルデジタルアシスタント(PDA)、ウルトラモバイルPC、携帯電話機、デスクトップコンピュータ、サーバ、プリンタ、スキャナ、モニタ、セットトップボックス、エンターテイメント制御ユニット、デジタルカメラ、携帯型音楽プレーヤ、又はデジタルビデオレコーダであってよい。コンピュータデバイスは、固定、ポータブル、又はウェラブルであってよい。更なる実施では、コンピュータデバイス100は、データを処理する如何なる他の電子デバイスであってもよい。
カメラアレイ32は、図1及び2を参照して記載されるタイプ又は他の適切な構成のものであってよい。カメラアレイは、コンピュータデバイス100の残りと同じ筐体に組み込まれてよく、あるいは、それは、適切な有線又は無線コネクタを通じて取り付けられた別個の周辺機器であってもよい。コンピュータデバイスは、固定又はポータブル構成においてサーバデバイス、編集デバイス、又はクライアントデバイスとして使用されてもよい。
実施形態は、1つ以上のメモリチップ、コントローラ、CPU(Central Processing Unit)、マザーボードを用いて相互に接続されたマイクロチップ若しくは集積回路、特定用途向け集積回路(ASIC)、及び/又はフィールドプログラマブルゲートアレイ(FPGA)の一部として実装されてよい。
「1つの実施形態」、「実施形態」、「例となる実施形態」、「様々な実施形態」等への言及は、そのように記載される実施形態が特定の特徴、構造、又は特性を含み得るが、あらゆる実施形態が必ずしも特定の特徴、構造、又は特性を含むわけではないことを示す。更に、いくつかの実施形態は、他の実施形態について記載されている特徴の一部又は全てを有してよく、あるいは、全く有さなくてもよい。
以下の記載及び特許請求の範囲で、語「結合される」はその派生語とともに、使用されることがある。「結合される」は、2つ以上の要素が互いと協働又は相互作用することを示すために使用されるが、それらは、それらの間に介在する物理的又は電気的なコンポーネントを有しても又は有さなくてもよい。
特許請求の範囲で使用されるように、特段示されない限りは、共通の要素について説明するための序数形容詞「第1」、「第2」、「第3」などの使用は、同じ要素の異なるインスタンスが参照されていることを示すにすぎず、そのように記載される要素が時間的に、空間的に、順位付けにおいて、又はあらゆる他の方法において所与の順序でなければならいことを示す意図はない。
図面及び前述の記載は、実施形態の例を与える。当業者に明らかなように、記載される要素のうちの1つ以上は単一の機能要素にまとめられる。代替的に、特定の要素は複数の機能要素に分けられてもよい。1つの実施形態からの要素は、他の実施形態に加えられてもよい。例えば、本明細書で記載されるプロセスの順序は変更されてよく、本明細書で記載される様態に制限されない。更に、如何なるフロー図の動作も、示されている順序で実装される必要はなく、全ての動作が必ずしも実行される必要もない。また、他の動作に依存しないそれらの動作は、他の動作と並行して実行されてもよい。実施形態の適用範囲は、それらの具体的な例によって決して制限されない。構造、大きさ、及び材料の使用の違いといった多数の変形例は、明細書中で明示的に与えられていようとなかろうと、可能である。実施形態の適用範囲は、少なくとも、続く特許請求の範囲によって与えられているのと同じ広さである。種々の実施形態の様々な特徴は、多種多様な用途に適するよういくつかの特徴が含まれて他が除外された状態で様々に組み合わされてよい。
いくつかの実施形態は、ビューポートメタデータを含む符号化されたビデオを受け取ることと、前記ビデオを復号することと、前記ビューポートメタデータを取り出すことと、前記ビューポートメタデータに基づき前記復号されたビデオのビューポートを生成することと、表示のために前記生成されたビューポートをバッファリングすることとを含む方法に関連する。
更なる実施形態では、前記ビューポートメタデータは、関心領域の中心を含む。
更なる実施形態では、前記中心は、ビューポート表示の緯度及び経度として示される。
更なる実施形態では、前記ビューポートメタデータは、前記中心からの距離に基づく前記関心領域の視野を含む。
更なる実施形態では、前記視野は、水平角及び鉛直角として示される。
更なる実施形態では、前記ビューポートメタデータは、付加拡張情報メッセージとして符号化される。
更なる実施形態では、前記受け取られた符号化されたビデオは、広視野の平面投影である。
更なる実施形態では、前記平面投影は正距円筒図法であり、前記広視野はパノラマである。
更なる実施形態では、前記ビューポートメタデータは、前記受け取られた符号化されたビデオのフレームに関連し、当該方法は、前記符号化されたビデオの追加フレームのための追加のビューポートメタデータを受け取ることを有する。
更なる実施形態は、ユーザ選択のビューポートを使用することをユーザが指示しているかどうかを判定し、そうである場合には、次いで、前記ビューポートメタデータを用いてビューポートを生成することの代わりに、前記ユーザ選択のビューポートを用いてビューポートを生成することを含む。
更なる実施形態では、前記ビューポートメタデータは、複数のビューポートを含み、当該方法は、前記複数のビューポートから1つを選択することを更に有し、ビューポートを生成することは、前記複数のビューポートの中の前記選択された1つを用いてビューポートを生成することを有する。
更なる実施形態では、前記複数のビューポートから1つを選択することは、前記複数のビューポートの中の1つのユーザ選択を受け取ることを有する。
更なる実施形態では、前記複数のビューポートのサイズは、ズーム効果をもたらすために使用される。
更なる実施形態では、前記ビューポートメタデータは、前記受け取られた符号化されたビデオのフレームに関連し、当該方法は、前記符号化されたビデオの追加フレームのための追加のビューポートメタデータを受け取ることを有する。
更なる実施形態では、前記符号化されたビデオは、回転方向メタデータを更に含み、当該方法は、前記回転方向メタデータを取り出すことと、前記回転方向メタデータに基づき前記復号されたビデオを回転させることとを含み、前記ビューポートを生成することは、前記回転された復号されたビデオを用いてビューポートを生成することを有する。
更なる実施形態は、マシン読出可能な媒体であって、実行される場合に、前記マシンに、ビューポートメタデータを含む符号化されたビデオを受け取ることと、前記ビデオを復号することと、前記ビューポートメタデータを取り出すことと、前記ビューポートメタデータに基づき前記復号されたビデオのビューポートを生成することと、表示のために前記生成されたビューポートをバッファリングすることとを有する動作を実行させる命令を記憶している媒体に関連する。
更なる実施形態は、ビューポートメタデータを含む広視野ビデオを受け取り、前記ビューポートメタデータを取り出すビデオ復号部と、復号されたビデオのビューポートを前記ビューポートメタデータに基づき生成し、該生成されたビューポートを表示のためにバッファリングするビューポート生成部とを含む装置に関連する。
更なる実施形態は、広視野ビデオを受け取ることと、前記ビデオを平面投影にマッピングすることと、前記ビデオに含まれる選択された関心領域を受け取ることと、前記選択された関心領域を記述するビューポートメタデータを生成することと、前記ビューポートメタデータを含む符号化されたビデオとして前記平面投影を符号化することと、前記符号化されたビデオを記憶することとを含む方法に関連する。
更なる実施形態では、前記ビューポートメタデータは、前記関心領域の中心を含む。
更なる実施形態では、前記中心は、ビューポート表示の緯度及び経度として示される。
更なる実施形態では、前記ビューポートメタデータは、前記中心からの距離に基づく前記関心領域の視野を含む。
更なる実施形態では、前記視野は、水平角及び鉛直角として示される。
更なる実施形態では、前記ビューポートメタデータは、付加拡張情報メッセージとして符号化される。
更なる実施形態では、前記受け取られた広視野ビデオは、複数台のカメラから受け取られ、当該方法は、前記複数台のカメラからのビデオを縫合して単一の広視野ビデオを生成することを更に有する。
更なる実施形態では、前記ビデオをマッピングすることは、前記ビデオを正距円筒図法にマッピングすることを有し、前記広視野はパノラマである。
更なる実施形態は、前記投影の回転を選択することと、該選択された回転を記述する回転方向メタデータを生成することと、前記選択された回転に基づき前記投影を回転させることとを含み、前記平面投影を符号化することは、前記投影を回転させた後に符号化し、前記回転方向メタデータを前記符号化されたビデオに含めることを有する。
いくつかの実施形態は、マシン読出可能な媒体であって、実行される場合に、前記マシンに、広視野ビデオを受け取ることと、前記ビデオを平面投影にマッピングすることと、前記ビデオに含まれる選択された関心領域を受け取ることと、前記選択された関心領域を記述するビューポートメタデータを生成することと、前記ビューポートメタデータを含む符号化されたビデオとして前記平面投影を符号化することと、前記符号化されたビデオを記憶することとを有する動作を実行させる命令を記憶している媒体に関連する。
更なる実施形態は、動きについて前記ビデオのシーンを解析し、該シーンのどの部分が最も速い動きを含むかを決定することによって、前記選択された関心領域を選択することを含む。
いくつかの実施形態は、広視野ビデオを受け取るバッファと、前記ビデオを平面投影にマッピングする投影マッピングモジュールと、前記ビデオに含まれる選択された関心領域を受け取り、前記選択された関心領域を記述するビューポートメタデータを生成する関心領域選択部と、前記ビューポートメタデータを含む符号化されたビデオとして前記平面投影を符号化し、該符号化されたビデオを記憶する符号化部とを含む装置に関連する。
更なる実施形態では、前記関心領域選択部は、最も高い複雑性を持った特徴を有するとして前記選択された関心領域を選択するよう前記ビデオを更に解析する。
[関連出願の相互参照]
本願は、“SUGGESTED VIEWPORT INDICATION FOR PANORAMIC VIDEO”と題されて2016年11月17日に出願された米国特許仮出願第62/423343号に基づく優先権を主張する。優先権の基礎をなすこの特許出願の開示は、これをもって、参照により本願に援用される。

Claims (16)

  1. 付加拡張情報メッセージに基づいてビデオビットストリームを復号する第1回路と、
    前記復号されたビデオビットストリームを出力する第2回路と
    を有し、
    前記付加拡張情報メッセージは、ビデオに関連した全方向性ビューポート付加拡張情報メッセージを含み、該全方向性ビューポート付加拡張情報メッセージは、4つの大円によって境界された球面座標ジオメトリの1つ以上の領域の座標を指定し、該領域は、ユーザが見る方向の制御を有していないか又は前記見る方向の制御を解放している場合に表示のために推奨されるビューポートに対応し、前記全方向性ビューポート付加拡張情報メッセージは、
    1つ以上の推奨ビューポート領域を識別するために使用され得る識別番号を含むomni_viewport_idと、
    omni_viewport_cancel_flagであり、1に等しい前記omni_viewport_cancel_flagは、前記全方向性ビューポート付加拡張情報メッセージが出力順序における如何なる前の全方向性ビューポート付加拡張情報メッセージの持続もキャンセルすることを示す、前記omni_viewport_cancel_flagと、
    現在のレイヤについての前記全方向性ビューポート付加拡張情報メッセージの持続を指定するomni_viewport_persitence_flagであり、0に等しい前記omni_viewport_persitence_flagは、全方向性ビューポート付加拡張情報メッセージが現在の復号されたピクチャのみに適用されることを指定し、1に等しい前記omni_viewport_persitence_flagは、1つ以上の条件が満足されるまで前記全方向性ビューポート付加拡張情報メッセージが出力順序において前記現在のレイヤのために持続することを指定する、前記omni_viewport_persitence_flagと、
    omni_viewport_cnt_minus1であり、1をプラスする前記omni_viewport_cnt_minus1は、前記全方向性ビューポート付加拡張情報メッセージによって示されている推奨ビューポート領域の数を特定する、前記omni_viewport_cnt_minus1と、
    グローバル座標軸に対して2-16度の単位でi番目の推奨ビューポート領域の中心を示すomni_viewport_azimuth_centre[i]及びomni_viewport_elevation_centre[i]と、
    -16度の単位で前記i番目の推奨ビューポート領域の傾斜角を示すomni_viewport_tilt_centre[i]と、
    前記i番目の推奨ビューポート領域の方位角範囲を示すomni_viewport_hor_range[i]と、
    前記i番目の推奨ビューポート領域の仰角範囲を示すomni_viewport_ver_range[i]と
    を含む、
    デコーダ。
  2. 0に等しい前記omni_viewport_cancel_flagは、全方向性ビューポート情報が続くことを示す、
    請求項1に記載のデコーダ。
  3. 前記1つ以上の条件は、
    前記現在のレイヤの新しい符号化レイヤビデオシーケンス(CLVS)が開始すること、
    ビットストリームが終了すること、又は
    前記全方向性ビューポート付加拡張情報メッセージに関連したアクセスユニットにおける前記現在のレイヤ内のピクチャが、出力順序において前記現在のピクチャに続く出力であること
    を含む、
    請求項1又は2に記載のデコーダ。
  4. 前記omni_viewport_cnt_minus1が0よりも大きく、ビューポートが表示されるよう提案される他の情報がなく、omni_viewport_idが0又は1に等しい場合に、0番目の前記ビューポートは、前記ユーザが前記見る方向の制御を有していないか又は前記見る方向の制御を解放しているときに、表示されるよう提案される、
    請求項1乃至3のうちいずれか一項に記載のデコーダ。
  5. 前記全方向性ビューポート付加拡張情報メッセージは、ビットストリームタイプを示すようsphere_rotation_reserved_zero_6bitsを含む、
    請求項1乃至4のうちいずれか一項に記載のデコーダ。
  6. 前記第2回路は、前記復号されたビデオビットストリームを表示のために出力する、
    請求項1乃至5のうちいずれか一項に記載のデコーダ。
  7. 前記第2回路は、前記復号されたビデオビットストリームを記憶する、
    請求項1乃至6のうちいずれか一項に記載のデコーダ。
  8. 付加拡張情報メッセージに基づいてビデオビットストリームを復号することと、
    前記復号されたビデオビットストリームを出力することと
    を有し、
    前記付加拡張情報メッセージは、ビデオに関連した全方向性ビューポート付加拡張情報メッセージを含み、該全方向性ビューポート付加拡張情報メッセージは、4つの大円によって境界された球面座標ジオメトリの1つ以上の領域の座標を指定し、該領域は、ユーザが見る方向の制御を有していないか又は前記見る方向の制御を解放している場合に表示のために推奨されるビューポートに対応し、前記全方向性ビューポート付加拡張情報メッセージは、
    1つ以上の推奨ビューポート領域を識別するために使用され得る識別番号を含むomni_viewport_idと、
    omni_viewport_cancel_flagであり、1に等しい前記omni_viewport_cancel_flagは、前記全方向性ビューポート付加拡張情報メッセージが出力順序における如何なる前の全方向性ビューポート付加拡張情報メッセージの持続もキャンセルすることを示す、前記omni_viewport_cancel_flagと、
    現在のレイヤについての全方向性ビューポート付加拡張情報メッセージの持続を指定するomni_viewport_persitence_flagであり、0に等しい前記omni_viewport_persitence_flagは、全方向性ビューポート付加拡張情報メッセージが現在の復号されたピクチャのみに適用されることを指定し、1に等しい前記omni_viewport_persitence_flagは、1つ以上の条件が満足されるまで前記全方向性ビューポート付加拡張情報メッセージが出力順序において前記現在のレイヤのために持続することを指定する、前記omni_viewport_persitence_flagと、
    omni_viewport_cnt_minus1であり、1をプラスする前記omni_viewport_cnt_minus1は、前記全方向性ビューポート付加拡張情報メッセージによって示されている推奨ビューポート領域の数を特定する、前記omni_viewport_cnt_minus1と、
    グローバル座標軸に対して2-16度の単位でi番目の推奨ビューポート領域の中心を示すomni_viewport_azimuth_centre[i]及びomni_viewport_elevation_centre[i]と、
    -16度の単位で前記i番目の推奨ビューポート領域の傾斜角を示すomni_viewport_tilt_centre[i]と、
    前記i番目の推奨ビューポート領域の方位角範囲を示すomni_viewport_hor_range[i]と、
    前記i番目の推奨ビューポート領域の仰角範囲を示すomni_viewport_ver_range[i]と
    を含む、
    方法。
  9. 0に等しい前記omni_viewport_cancel_flagは、全方向性ビューポート情報が続くことを示す、
    請求項8に記載の方法。
  10. 前記1つ以上の条件は、
    前記現在のレイヤの新しい符号化レイヤビデオシーケンス(CLVS)が開始すること、
    ビットストリームが終了すること、又は
    前記全方向性ビューポート付加拡張情報メッセージに関連したアクセスユニットにおける前記現在のレイヤ内のピクチャが、出力順序において前記現在のピクチャに続く出力であること
    を含む、
    請求項8又は9に記載の方法。
  11. 前記omni_viewport_cnt_minus1が0よりも大きく、ビューポートが表示されるよう提案される他の情報がなく、omni_viewport_idが0又は1に等しい場合に、0番目の前記ビューポートは、前記ユーザが前記見る方向の制御を有していないか又は前記見る方向の制御を解放しているときに、表示されるよう提案される、
    請求項8乃至10のうちいずれか一項に記載の方法。
  12. 前記全方向性ビューポート付加拡張情報メッセージは、ビットストリームタイプを示すようsphere_rotation_reserved_zero_6bitsを含む、
    請求項8乃至11のうちいずれか一項に記載の方法。
  13. 前記復号されたビデオビットストリームを出力することは、前記復号されたビデオビットストリームを送信することを含む、
    請求項8乃至12のうちいずれか一項に記載の方法。
  14. 前記復号されたビデオビットストリームを出力することは、前記復号されたビデオビットストリームを記憶することを含む、
    請求項8乃至13のうちいずれか一項に記載の方法。
  15. メモリと、
    少なくとも1つのセンサと、
    ディスプレイと、
    記憶デバイスと、
    通信回路と、
    請求項8乃至14のうちいずれか一項に記載の方法を実行する少なくとも1つのプロセッサと
    を有するシステム。
  16. 請求項8乃至14のうちいずれか一項に記載の方法を実行する手段を有する装置。
JP2020216071A 2016-11-17 2020-12-25 パノラマビデオのための提案されるビューポート指示 Active JP7009606B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201662423343P 2016-11-17 2016-11-17
US62/423,343 2016-11-17

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2019517788A Division JP7146747B2 (ja) 2016-11-17 2017-11-15 パノラマビデオのための提案されるビューポート指示

Publications (2)

Publication Number Publication Date
JP2021048650A JP2021048650A (ja) 2021-03-25
JP7009606B2 true JP7009606B2 (ja) 2022-01-25

Family

ID=62146824

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2019517788A Active JP7146747B2 (ja) 2016-11-17 2017-11-15 パノラマビデオのための提案されるビューポート指示
JP2020216071A Active JP7009606B2 (ja) 2016-11-17 2020-12-25 パノラマビデオのための提案されるビューポート指示
JP2020216066A Active JP7009605B2 (ja) 2016-11-17 2020-12-25 パノラマビデオのための提案されるビューポート指示

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2019517788A Active JP7146747B2 (ja) 2016-11-17 2017-11-15 パノラマビデオのための提案されるビューポート指示

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2020216066A Active JP7009605B2 (ja) 2016-11-17 2020-12-25 パノラマビデオのための提案されるビューポート指示

Country Status (6)

Country Link
US (4) US10887572B2 (ja)
EP (3) EP3823275A1 (ja)
JP (3) JP7146747B2 (ja)
CN (3) CN110073662B (ja)
BR (1) BR112019007279A2 (ja)
WO (1) WO2018093851A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110073662B (zh) 2016-11-17 2023-07-18 英特尔公司 全景视频的建议视口指示方法及装置
US10560660B2 (en) 2017-01-04 2020-02-11 Intel Corporation Rectilinear viewport extraction from a region of a wide field of view using messaging in video transmission
WO2018131813A1 (en) * 2017-01-10 2018-07-19 Samsung Electronics Co., Ltd. Method and apparatus for generating metadata for 3d images
US11532128B2 (en) * 2017-03-23 2022-12-20 Qualcomm Incorporated Advanced signaling of regions of interest in omnidirectional visual media
CA3056739A1 (en) * 2017-03-24 2018-09-27 Sony Corporation Information processing apparatus and information processing method, and program
US11386607B1 (en) * 2017-04-16 2022-07-12 Meta Platforms, Inc. Systems and methods for capturing content
KR102208129B1 (ko) * 2017-09-26 2021-01-27 엘지전자 주식회사 360 비디오 시스템에서 오버레이 처리 방법 및 그 장치
US11115451B2 (en) * 2018-03-26 2021-09-07 Mediatek Singapore Pte. Ltd. Methods and apparatus for signaling viewports and regions of interest
KR102344073B1 (ko) * 2018-04-05 2021-12-28 엘지전자 주식회사 360도 비디오를 전송하는 방법, 360도 비디오를 수신하는 방법, 360도 비디오를 전송하는 장치 및 360도 비디오를 수신하는 장치
WO2020012071A1 (en) * 2018-07-10 2020-01-16 Nokia Technologies Oy A method, an apparatus and a computer program product for volumetric video coding
CN111093068A (zh) * 2018-10-23 2020-05-01 中国电信股份有限公司 全景视频提供方法、虚拟现实终端、平台和系统
KR102287133B1 (ko) * 2018-11-30 2021-08-09 한국전자기술연구원 자유 시점 영상 제공 방법 및 장치
KR20210094646A (ko) * 2018-12-14 2021-07-29 지티이 코포레이션 몰입형 비디오 비트 스트림 처리
EP3709659A1 (en) * 2019-03-11 2020-09-16 InterDigital VC Holdings, Inc. A method and apparatus for encoding and decoding volumetric video
EP3973684A1 (en) * 2019-05-20 2022-03-30 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Immersive media content presentation and interactive 360° video communication
US11190768B2 (en) * 2019-07-02 2021-11-30 Mediatek Inc. Video encoding method with syntax element signaling of packing of projection faces derived from cube-based projection and associated video decoding method and apparatus
US11190801B2 (en) 2019-07-02 2021-11-30 Mediatek Inc. Video encoding method with syntax element signaling of mapping function employed by cube-based projection and associated video decoding method
US11659206B2 (en) 2019-07-02 2023-05-23 Mediatek Inc. Video encoding method with syntax element signaling of guard band configuration of projection-based frame and associated video decoding method and apparatus
CN112423108B (zh) * 2019-08-20 2023-06-30 中兴通讯股份有限公司 码流的处理方法、装置、第一终端、第二终端及存储介质
WO2021045536A1 (en) * 2019-09-04 2021-03-11 Wilus Institute Of Standards And Technology Inc. Video encoding and decoding acceleration utilizing imu sensor data for cloud virtual reality
WO2021122983A1 (en) * 2019-12-20 2021-06-24 Interdigital Vc Holdings France A method and apparatus for coding and decoding volumetric video with view-driven specularity
US11539935B2 (en) * 2020-12-02 2022-12-27 Meta Platforms Technologies, Llc Videotelephony with parallax effect

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015126144A1 (ko) 2014-02-18 2015-08-27 엘지전자 주식회사 파노라마 서비스를 위한 방송 신호 송수신 방법 및 장치

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003141562A (ja) 2001-10-29 2003-05-16 Sony Corp 非平面画像の画像処理装置及び画像処理方法、記憶媒体、並びにコンピュータ・プログラム
JP4359120B2 (ja) 2003-10-31 2009-11-04 財団法人エヌエイチケイエンジニアリングサービス コンテンツ品質評価装置及びそのプログラム
US8184153B2 (en) 2005-09-26 2012-05-22 Electronics And Telecommunications Research Institute Method and apparatus for defining and reconstructing ROIs in scalable video coding
CN101356800B (zh) 2006-03-23 2011-07-27 松下电器产业株式会社 内容拍摄装置
CN100587793C (zh) * 2006-05-22 2010-02-03 美国博通公司 视频处理方法、电路和系统
US20070268406A1 (en) 2006-05-22 2007-11-22 Broadcom Corporation, A California Corporation Video processing system that generates sub-frame metadata
JP4945578B2 (ja) * 2007-01-04 2012-06-06 肇 鳴川 情報処理方法
US7769240B2 (en) 2007-02-07 2010-08-03 At&T Intellectual Property, I, L.P. Methods and systems for image processing
EP2174500A2 (en) * 2007-06-29 2010-04-14 Thomson Licensing Video indexing method, and video indexing device
US8094892B2 (en) 2007-11-19 2012-01-10 Arcsoft, Inc. Automatic photo orientation detection
CN102396236B (zh) * 2009-01-28 2015-03-25 Lg电子株式会社 广播接收机及其视频数据处理方法
CN101877767A (zh) * 2009-04-30 2010-11-03 爱国者全景(北京)网络科技发展有限公司 一种六通道视频源生成三维全景连续视频的方法和系统
CA2709552C (en) * 2009-07-21 2016-05-31 Ben Kutner Simulation attendance at a live event
CN101626513A (zh) * 2009-07-23 2010-01-13 深圳大学 全景视频生成方法及系统
MX2012014258A (es) * 2010-06-30 2013-01-18 Koninkl Philips Electronics Nv Acercar una imagen presentada.
US8743219B1 (en) 2010-07-13 2014-06-03 Marvell International Ltd. Image rotation correction and restoration using gyroscope and accelerometer
US20120092348A1 (en) * 2010-10-14 2012-04-19 Immersive Media Company Semi-automatic navigation with an immersive image
CN102044171B (zh) * 2010-11-16 2012-08-29 四川九洲空管科技有限责任公司 一种飞行信息屏幕跟踪显示装置及方法
TWI542354B (zh) 2010-11-17 2016-07-21 遠東生物科技股份有限公司 可抑制流感病毒血球凝集素(Hemagglutinin)的醫藥組合物及其製備方法
US9407904B2 (en) 2013-05-01 2016-08-02 Legend3D, Inc. Method for creating 3D virtual reality from 2D images
ES2675802T3 (es) 2011-02-18 2018-07-12 Alcatel Lucent Procedimiento y aparato para transmitir y recibir un flujo de video panorámico
JP6026443B2 (ja) 2011-03-10 2016-11-16 ヴィディオ・インコーポレーテッド ビデオ・ビットストリーム中の描画方向情報
US20120230594A1 (en) * 2011-03-10 2012-09-13 Jill Boyce Adaptive picture rotation
WO2012132237A1 (ja) 2011-03-31 2012-10-04 パナソニック株式会社 立体視画像の描画を行う画像描画装置、画像描画方法、画像描画プログラム
US8767040B2 (en) 2012-01-11 2014-07-01 Google Inc. Method and system for displaying panoramic imagery
US9438818B2 (en) 2012-06-20 2016-09-06 Qualcomm Incorporated Device and method for multimedia communications with picture orientation information
US20140078249A1 (en) * 2012-09-20 2014-03-20 Qualcomm Incorporated Indication of frame-packed stereoscopic 3d video data for video coding
US9497457B1 (en) 2012-10-18 2016-11-15 Altia Systems Inc Repacking of panoramic video based on standard image formats
KR20200045013A (ko) * 2013-07-15 2020-04-29 소니 주식회사 상호작용성을 위한 모션-구속된 타일 세트들 sei 메시지의 확장들
WO2015014773A1 (en) * 2013-07-29 2015-02-05 Koninklijke Kpn N.V. Providing tile video streams to a client
US9451162B2 (en) 2013-08-21 2016-09-20 Jaunt Inc. Camera array including camera modules
US20150237351A1 (en) * 2014-02-18 2015-08-20 Penne Lee Techniques for inclusion of region of interest indications in compressed video data
US10204658B2 (en) 2014-07-14 2019-02-12 Sony Interactive Entertainment Inc. System and method for use in playing back panorama video content
US10547825B2 (en) 2014-09-22 2020-01-28 Samsung Electronics Company, Ltd. Transmission of three-dimensional video
US11205305B2 (en) * 2014-09-22 2021-12-21 Samsung Electronics Company, Ltd. Presentation of three-dimensional video
CN204090039U (zh) * 2014-10-16 2015-01-07 北京十方慧通科技有限公司 一体化大场景全景视频监控装置
CN104301677B (zh) * 2014-10-16 2018-06-15 北京十方慧通科技有限公司 面向大场景的全景视频监控的方法及装置
CN104980697A (zh) * 2015-04-28 2015-10-14 杭州普维光电技术有限公司 一种网络摄像机视频传输方法
KR20170009194A (ko) 2015-07-16 2017-01-25 재단법인대구경북과학기술원 절제 수술 가이드 장치 및 방법
US9277122B1 (en) 2015-08-13 2016-03-01 Legend3D, Inc. System and method for removing camera rotation from a panoramic video
US20170026659A1 (en) 2015-10-13 2017-01-26 Mediatek Inc. Partial Decoding For Arbitrary View Angle And Line Buffer Reduction For Virtual Reality Video
US9473758B1 (en) * 2015-12-06 2016-10-18 Sliver VR Technologies, Inc. Methods and systems for game video recording and virtual reality replay
US10977764B2 (en) * 2015-12-29 2021-04-13 Dolby Laboratories Licensing Corporation Viewport independent image coding and rendering
CN108702528B (zh) * 2016-02-17 2021-06-01 Lg电子株式会社 发送360视频的方法、接收360视频的方法、发送360视频的设备和接收360视频的设备
EP3255611A1 (en) 2016-06-08 2017-12-13 Technische Universität München Method and system for generating a mesh
CN106060515B (zh) 2016-07-14 2018-11-06 腾讯科技(深圳)有限公司 全景媒体文件推送方法及装置
BR112019003605A2 (pt) 2016-08-25 2019-05-21 Lg Electronics Inc. método para transmitir vídeo omnidirecional, método para receber vídeo omnidirecional, aparelho para transmitir vídeo omnidirecional, e aparelho para receber vídeo omnidirecional
US10560678B2 (en) 2016-11-09 2020-02-11 Mediatek Inc. Method and apparatus having video encoding function with syntax element signaling of rotation information of content-oriented rotation applied to 360-degree image content or 360-degree video content represented in projection format and associated method and apparatus having video decoding function
CN110073662B (zh) * 2016-11-17 2023-07-18 英特尔公司 全景视频的建议视口指示方法及装置
US10560660B2 (en) * 2017-01-04 2020-02-11 Intel Corporation Rectilinear viewport extraction from a region of a wide field of view using messaging in video transmission
US10375375B2 (en) * 2017-05-15 2019-08-06 Lg Electronics Inc. Method of providing fixed region information or offset region information for subtitle in virtual reality system and device for controlling the same
US10679415B2 (en) * 2017-07-05 2020-06-09 Qualcomm Incorporated Enhanced signaling of regions of interest in container files and video bitstreams
WO2020009341A1 (ko) * 2018-07-06 2020-01-09 엘지전자 주식회사 동적 뷰포인트의 좌표계에 대한 메타데이터를 송수신하는 방법 및 장치
KR102188270B1 (ko) * 2018-07-06 2020-12-09 엘지전자 주식회사 360 비디오 데이터의 서브픽처 기반 처리 방법 및 그 장치
WO2020013484A1 (ko) * 2018-07-11 2020-01-16 엘지전자 주식회사 360 비디오 시스템에서 오버레이 처리 방법 및 그 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015126144A1 (ko) 2014-02-18 2015-08-27 엘지전자 주식회사 파노라마 서비스를 위한 방송 신호 송수신 방법 및 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Jill Boyce, et al.,HEVC Additional Supplemental Enhancement Information (Draft 2) [online],JCTVC-AA1005,pp. 1-27,ITU-T インターネット<URL:http://phenix.it-sudparis.eu/jct/doc_end_user/documents/27_Hobart/wg11/JCTVC-AA1005-v1.zip>,2017年

Also Published As

Publication number Publication date
JP2020501389A (ja) 2020-01-16
BR112019007279A2 (pt) 2019-07-09
EP3823276A1 (en) 2021-05-19
CN110073662B (zh) 2023-07-18
CN112738531B (zh) 2024-02-23
EP3823275A1 (en) 2021-05-19
US20230044339A1 (en) 2023-02-09
JP2021048649A (ja) 2021-03-25
US20200045286A1 (en) 2020-02-06
US11388382B2 (en) 2022-07-12
EP3542530A1 (en) 2019-09-25
CN112738530B (zh) 2024-02-23
EP3542530A4 (en) 2020-06-03
US11792378B2 (en) 2023-10-17
US10887572B2 (en) 2021-01-05
EP3542530B1 (en) 2023-04-05
US11388381B2 (en) 2022-07-12
WO2018093851A1 (en) 2018-05-24
CN112738531A (zh) 2021-04-30
JP2021048650A (ja) 2021-03-25
CN110073662A (zh) 2019-07-30
JP7146747B2 (ja) 2022-10-04
US20210120219A1 (en) 2021-04-22
US20210014467A1 (en) 2021-01-14
CN112738530A (zh) 2021-04-30
JP7009605B2 (ja) 2022-01-25

Similar Documents

Publication Publication Date Title
JP7009606B2 (ja) パノラマビデオのための提案されるビューポート指示
US20210329196A1 (en) Rectilinear viewport extraction from a region of a wide field of view using messaging in video transmission
US11699211B2 (en) Spherical rotation for encoding wide view video

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220112

R150 Certificate of patent or registration of utility model

Ref document number: 7009606

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150