JP2019526178A - 空間的にタイリングされた全方位ビデオのストリーミング - Google Patents

空間的にタイリングされた全方位ビデオのストリーミング Download PDF

Info

Publication number
JP2019526178A
JP2019526178A JP2018562052A JP2018562052A JP2019526178A JP 2019526178 A JP2019526178 A JP 2019526178A JP 2018562052 A JP2018562052 A JP 2018562052A JP 2018562052 A JP2018562052 A JP 2018562052A JP 2019526178 A JP2019526178 A JP 2019526178A
Authority
JP
Japan
Prior art keywords
tile
video
client device
projection
stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018562052A
Other languages
English (en)
Other versions
JP7022077B2 (ja
Inventor
ダクント,ルシア
トーマス,エマニュエル
ヴァン・デーフェンテル,マティス・オスカー
ヴァン・ブランデンブルク,レイ
フェーンハウゼン,アリエン
Original Assignee
コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ filed Critical コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ
Publication of JP2019526178A publication Critical patent/JP2019526178A/ja
Application granted granted Critical
Publication of JP7022077B2 publication Critical patent/JP7022077B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/21805Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/23439Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26258Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for generating a list of items to be played back in a given order, e.g. playlist, or scheduling item distribution according to such list
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • H04N21/43072Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of multiple content streams on the same device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Information Transfer Between Computers (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Abstract

クライアント・デバイスによって全方位ビデオを処理するための方法について記載する。前記全方位ビデオは、湾曲面、好ましくは、球面上において当該全方位ビデオのビデオ・データの空間位置を判定するための3D座標系に関連付けられている。前記方法は、マニフェスト・ファイルを受信するステップであって、マニフェスト・ファイルが、複数のタイル・ストリームを識別するための複数のタイル・ストリーム識別子を含み、タイル・ストリームが、画像表示枠を有するビデオ・フレームを構成し(comprise)、これによって、異なるタイル・ストリームのビデオ・フレームの画像表示枠が、全方位ビデオの2D投影の異なる領域を覆い、1つの領域が1つのタイルを定める、ステップと、マニフェスト・ファイルにおける空間関係情報に基づいて,更にクライアント・デバイスのユーザの視点に基づいて、第1解像度および第1タイル位置に関連付けられた第1タイル・ストリームと、第2解像度および第2タイル位置に関連付けられた第2タイル・ストリームとを選択するステップであって、第2解像度が第1解像度よりも低く、空間関係情報が、タイル毎に、タイル位置を定め、視点がユーザの目視方向を定め、タイル位置および視点が、3D座標系の座標に基づいて定められる、ステップとを含む。【選択図】 図1

Description

本発明は、空間的にタイリングされた全方位ビデオのストリーミング(spatially tiled omnidirectional video streaming)に関し、特に、空間タイリング全方位ビデオをストリーミングするための方法およびシステム、空間タイリング全方位ビデオを処理するように構成されたクライアント・デバイス、空間タイリング全方位ビデオのクライアント・デバイスへのストリーミングを可能にするためのデータ構造、ならびにこのような方法を実行するためのコンピュータ・プログラム製品に関するが、これらに限定されるのではない。
従来技術
カメラおよび画像処理技術の進歩は、増々高い解像度で記録することを可能にするだけでなく、複数のカメラの出力を互いにスティッチすることも可能にする。このようにすると、1組のカメラを併せて、8K×4Kよりも高い解像度で、360度全体を記録することができる。このようなビデオを全方位ビデオと呼ぶこともできる。
全方位ビデオは、産業界で現在躍進を遂げつつある仮想現実(VR)および拡張現実(AR)のような、新たなユーザ体験を提供する。しかしながら、高品質のVRコンテンツをストリーミングする場合、高品質の全方位ビデオをストリーミングし球面コンテンツをビット・ストリームで表すために必要とされる高帯域幅要件を含む課題が今なお提起されている。
実際、利用可能な帯域幅は、効率とユーザ体験との間の折衷案となる。一方で、ユーザに興味がある視点(viewpoint)を高品質で、そして同時に最小限のレイテンシでユーザに提供する必要性がある。これは、達成することが極度に難しい目標である。何故なら、視点は空間的に制限されるが、ユーザは360度のストリーム内で彼らの視点を連続的に変化させることができ、1つの視点から他の視点への変遷は滑らかでなければならないからである。
全方位ビデオは、性質上球面であり、近年のビデオ・コード化規格とインターフェースするために、エンコーディングの前に、1つ以上の平面にマッピングされる。現在、球面ビデオをビット・ストリームで表すための標準的な方法は存在せず、異なる球面−平面マッピング(sphere-to-plane mapping)が可能であるため、相互運用性が問題となる。
最近になって、Facebook社が、全方位ビデオ・コンテンツに関する帯域幅問題の低減を可能にする企業固有のエンコーディング技法を提案した。この技法では、全方位ビデオを角錐にマッピングする。角錐の基底(basis)が、見る人の中央FOVに関係付けられた高解像度ビデオを表し、角錐の側面は、見る人の側方および背後におけるビデオ情報に使用される。角錐の側面におけるビデオ情報は、中央FOVのエッジから見る人の背後に向かって解像度が徐々に低下するように構成されている。このエンコーディング技法は、ファイル・サイズの大幅な縮小を可能にし、したがって全方位ビデオをストリーミングする際の帯域幅問題を改善する。
しかしながら、Facebook社の技法は、企業固有の解決手段であり、コード化レベルで実装され、つまり、相互運用性に関してはさほど柔軟でない。この解決手段は、ハード・コード化された角錐マッピング技法に基づくので、他の(別の)マッピング技法の中に更に一層の改善が得られるもの、または特殊用途に使用することができるものがあっても、これらを受け入れる予地がない。加えて、Facebook社が提案する特殊エンコーディング技法は、HEVCおよびVP9のような、従来の技術的現状のコード化技法と互換性がない。
したがって、以上のことから、従来のタイリングに基づくストリーミング方式は、全方位ビデオ・データをストリーミングするための効率的で柔軟なフレームワークを提供するには相応しくないという結果になる。
当業者には認められようが、本発明の態様は、システム、方法、またはコンピュータ・プログラム製品として具体化することができる。したがって、本発明の態様は、完全にハードウェアの実施形態、完全にソフトウェアの実施形態(ファームウェア、常駐ソフトウェア、マイクロコード等を含む)、またはソフトウェアおよびハードウェアの態様を組み合わせた実施形態という形態をなすことができ、これらは全て本明細書では一般に「回路」、「モジュール」、または「システム」と呼ぶこともできる。本開示において説明する機能は、コンピュータのマイクロプロセッサによって実行されるアルゴリズムとして実現することができる。更に、本発明の態様は、コンピュータ読み取り可能プログラム・コードが具体化されている、例えば、格納されている1つ以上のコンピュータ読み取り可能媒体(1つまたは複数)に具体化されたコンピュータ・プログラム製品の形態をなすこともできる。
1つ以上のコンピュータ読み取り可能媒体(1つまたは複数)の任意の組み合わせも利用することができる。コンピュータ読み取り可能媒体は、コンピュータ読み取り可能信号媒体またはコンピュータ読み取り可能記憶媒体であってもよい。コンピュータ読み取り可能記憶媒体は、例えば、電子、磁気、光、電磁、赤外線、または半導体システム、装置、あるいはデバイス、更には以上のもののあらゆる適した組み合わせであってもよいが、これらに限定されるのではない。コンピュータ読み取り可能記憶媒体の更に具体的な例(非網羅的な羅列)を挙げるとすれば、以下を含むであろう。1本以上のワイヤを有する電気接続、可搬型コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、リード・オンリ・メモリ(ROM)、消去可能プログラマブル・リード・オンリ・メモリ(EPROMまたはフラッシュ・メモリ)、光ファイバ、可搬型コンパクト・ディスク・リード・オンリ・メモリ(CD−ROM)、光記憶デバイス、磁気記憶デバイス、あるいは以上のもののあらゆる適した組み合わせ。本文書のコンテキストでは、コンピュータ読み取り可能記憶媒体は、命令実行システム、装置、またはデバイスによる使用のため、またはそれと関連した使用のためのプログラムを収容または格納することができる、任意の有形媒体とすればよい。
コンピュータ読み取り可能信号媒体は、例えば、ベースバンドにまたは搬送波の一部としてコンピュータ読み取り可能プログラム・コードが内部に具体化された伝搬データ信号を含むことができる。このような伝搬信号は、電磁、光、またはこれらのあらゆる適した組み合わせを含むがこれらに限定されない種々の形態の内任意の形態をなすことができる。コンピュータ読み取り可能信号媒体は、コンピュータ読み取り可能記憶媒体ではなく、命令実行システム、装置、またはデバイスによる使用、またはそれと関連した使用のためにプログラムを伝達、伝搬、または移送することができる任意のコンピュータ読み取り可能媒体とすることができる。
コンピュータ読み取り可能媒体上に具体化されたプログラム・コードは、任意の適した媒体を使用して送信することができる。任意の適した媒体には、ワイヤレス、ワイヤライン、光ファイバ、ケーブル、RF等、または以上のもののあらゆる適した組み合わせを含むが、これらに限定されるのではない。本発明の態様のために動作を実行するコンピュータ・プログラム・コードは、1つ以上のプログラミング言語の任意の組み合わせで書くことができる。プログラミング言語には、Java(商標)、Smalltalk、C++等のようなオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語のような従来の手続き型プログラミング言語が含まれる。プログラム・コードは、完全にユーザのコンピュータにおいて、部分的にユーザのコンピュータにおいて、単独のソフトウェア・パッケージとして、部分的にユーザのコンピュータにおいてそして部分的にリモート・コンピュータにおいて、あるいは完全にリモート・コンピュータまたはサーバにおいて実行することができる。後者のシナリオでは、リモート・コンピュータをユーザのコンピュータに任意の型式のネットワークを通じて接続することができる。ネットワークには、ローカル・エリア・ネットワーク(LAN)またはワイド・エリア・ネットワーク(WAN)が含まれ、または接続が外部コンピュータに対して行われてもよい(例えば、インターネット・サービス・プロバイダを使用してインターネットを通じて)。
本発明の態様について、本発明の実施形態による方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図および/またはブロック図を参照して以下に説明する。尚、フローチャート図および/またはブロック図の各ブロック、そしてフローチャート図および/またはブロック図におけるブロックの組み合わせをコンピュータ・プログラム命令によって実現できることは理解されよう。これらのコンピュータ・プログラム命令は、汎用コンピュータ、特殊目的コンピュータ、または他のプログラマブル・データ処理装置のプロセッサ、具体的には、マイクロプロセッサまたは中央処理ユニット(CPU)に供給され、コンピュータ、他のプログラマブル・データ処理装置、または他のデバイスのプロセッサによって命令が実行されて、フローチャートおよび/またはブロック図の1つまたは複数のブロックにおいて指定された機能/アクトを実現する手段を形成する(create)ように、機械を生成することができる。
これらのコンピュータ・プログラム命令は、コンピュータ読み取り可能媒体に格納することもでき、コンピュータ読み取り可能媒体に格納された命令が、フローチャートおよび/またはブロック図の1つまたは複数のブロックにおいて指定された機能/アクトを実現する命令を含む製品を生成するように、コンピュータ、他のプログラマブル・データ処理装置、または他のデバイスに特定の様式で機能するように指令することができる。
また、コンピュータ・プログラム命令は、コンピュータ、他のプログラマブル・データ処理装置、または他のデバイス上にロードして、一連の動作ステップをコンピュータ、他のプログラマブル装置、またはデバイス上で実行させ、コンピュータまたは他のプログラマブル装置上で実行する命令が、フローチャートおよび/またはブロック図の1つまたは複数のブロックにおいて指定された機能/アクトを実現するためのプロセスを設けるように、コンピュータ実装プロセスを生成することもできる。
図におけるフローチャートおよびブロック図は、本発明の種々の実施形態によるシステム、方法、およびコンピュータ・プログラム製品の可能な実施態様のアーキテクチャ、機能、および動作を例示する。これに関して、フローチャートまたはブロック図における各ブロックは、指定された論理機能(1つまたは複数)を実現するための1つ以上の実行可能命令を含む、モジュール、セグメント、またはコードの一部を表すことができる。また、ある代替実施態様では、ブロック内に記された機能が、図に記された順序以外で行われてもよいことも注記してしかるべきである。例えば、連続して示される2つのブロックが、実際には、実質的に同時に実行されてもよく、またはこれらのブロックが、関与する機能に応じて、逆の順序で実行されてもよいときもある。また、ブロック図および/またはフローチャート図の各ブロック、ならびにブロック図および/またはフローチャート図におけるブロックの組み合わせは、指定された機能またはアクトを実行する特殊目的ハードウェア・ベース・システム、あるいは特殊目的ハードウェアおよびコンピュータ命令の組み合わせによっても実現できることも注記しておく。
本発明の目的は、先行技術において知られている欠点の内少なくとも1つを低減または解消することである。第1の態様において、本発明は,クライアント・デバイスによって全方位ビデオを処理する方法に関することができる。全方位ビデオは、球面のような湾曲面上に全方位ビデオのビデオ・データの空間位置を決定するための3D座標系に関連付けられてもよい。
実施形態では、この方法は、好ましくはクライアント・デバイスによってマニフェスト・ファイルを受信するステップであって、マニフェスト・ファイルが、複数のタイル・ストリームを識別するための複数のタイル・ストリーム識別子を含み、タイル・ストリームが、画像表示枠(image view)を有するビデオ・フレームを構成し(comprise)、これによって、異なるタイル・ストリームのビデオ・フレームの画像表示枠が、全方位ビデオの2D投影の異なる領域を覆い、1つの領域が1つのタイルを定める、ステップと、好ましくはクライアント・デバイスによって、マニフェスト・ファイルにおける空間関係情報に基づいて,更にクライアント・デバイスのユーザの視点に基づいて、第1解像度および第1タイル位置に関連付けられた第1タイル・ストリームと、第2解像度および第2タイル位置に関連付けられた第2タイル・ストリームとを選択するステップであって、第2解像度が第1解像度よりも低く、空間関係情報が、タイル毎に、タイル位置を定め、視点がユーザの目視方向を定め、タイル位置および視点が、3D座標系の座標に基づいて定められる、ステップとを含む。
したがって、本発明は、クライアント・デバイスが、特定の視点、即ち、クライアント・デバイスのユーザが見ている方向を表す湾曲面上の点に対応する視点に対応する全方位ビデオの一部を、全方位ビデオ・データに適用される2D投影方式には依存しない方法で選択することを可能にする。マニフェスト・ファイルは、視点を定めるためにも使用される3D座標系に基づいて、タイルの空間位置およびタイルのサイズを記述するので、FOVに対して速いタイルの選択を達成することができる。このように、本発明は、ストリーミングされるコンテンツと仮想現実レンダリング・システムとの間のインターフェースを改良して提供することができる。クライアント・デバイスは、ストリーミングされるコンテンツの内ユーザの視点に対応するものを効率的に選択することができ、これは視点に基づく全方位ビデオのレンダリングには有利である。本発明は、クライアント・デバイスにストリーミングする必要があるタイルの速いタイル・ストリーム選択を可能にするが、これは高い品質の体験を提供するには必須である。
加えて、先行技術において知られている特殊なコード化方式とは対照的に、本発明は、低解像度ビデオ・タイルおよび高解像度ビデオ・タイルの独立した選択を可能にする。このように、異なる解像度および異なるサイズのタイルに基づいて、視野の中央部に高解像度ビデオ・データを含み、視野の周辺部および/または視野の外側に低解像度ビデオを含む視野を構築することができる。このようにして、レンダリングの間にクライアント・デバイスにストリーミングする必要があるデータの量は、特殊なコード化方式を使用する必要なく、劇的に削減することができる。実際、本発明は、AVC、SVC、およびHEVCのような、技術的現状のコード化方式の使用を可能にする。
実施形態では、前述の方法は、更に、
好ましくはクライアント・デバイスによって、1つ以上のタイル・ストリーム記憶デバイス、好ましくは1つ以上のネットワーク・ノードに、選択した1つ以上のタイル・ストリームを要求するステップと、1つ以上の選択したタイル・ストリームのビデオ・データを受信し、更にマッピング情報を受信するステップであって、好ましくは、マッピング情報の少なくとも一部が、マニフェスト・ファイルにおいてクライアント・デバイスに通知され、マッピング情報が、クライアント・デバイスがタイル・ストリームの2D投影ビデオ・データを、全方位ビデオ・データとして、湾曲面上にマッピングすることを可能にするための情報を、クライアント・デバイスに提供する、ステップと、空間関係情報およびマッピング情報に基づいて、前記受信したタイル・ストリームのビデオ・データを処理するステップとを含んでもよい。
実施形態では、マッピング情報が、全方位ビデオ・データを平坦面上に投影するために使用される2D投影の型式の指示を含んでもよく、更に、随意に、2D投影ビデオ・データを湾曲面上にマッピングするために必要とされる1つ以上のパラメータを含んでもよい。
したがって、マッピング情報は、異なる投影型式に基づく異なる種類の全方位ビデオの柔軟な使用を可能にする。マッピング情報は、全方位ビデオが生成されたときに使用された2D投影の型式について、レンダリング・エンジンに知らせることができる。加えて、マッピング情報は、特定の2D投影に関連付けられたマッピング・パラメータをレンダリング・エンジンに供給することもできるので、レンダリング・エンジンは、逆に、2D投影されたビデオ・データを、使用された投影に従う湾曲面上に正しくマッピングすることができる。
実施形態では、視点がユーザの視野に関連付けられてもよく、好ましくは、視点がユーザの視野の中心点を定める。実施形態では、選択するステップが、視野の中央部の少なくとも一部に位置するタイル位置に対して、高解像度のタイル・ストリームを選択するステップと、視野の周辺部の少なくとも一部に位置するタイル位置に対して、高解像度よりも低い解像度のタイル・ストリームを選択するステップとを含んでもよい。
したがって、FOVの中央部だけが最高品質を必要であってもよく、一方FOVの周辺部はそれよりも低い品質のストリームで対処することもできる。全方位コンテンツに異なる品質レイヤを生成することにより、そして各品質レイヤを空間サブパート(タイル)に分割することにより、ストリーミング・クライアントは、異なる空間サブパートを異なる品質でダウンロードし、帯域幅の使用を最小限に抑えつつ、高品質の体験をユーザに提供する柔軟性を得る。
中央部および周辺部の寸法は、人のFOVおよび帯域幅の考慮に基づいて決定または選択されてもよい。タイル状ビデオ・コンテンツは、中央および周辺FOVの異なる要件(タイル・サイズおよびビデオ品質に関する)を考慮に入れて生成することができ、この情報の少なくとも一部は、マニフェスト・ファイルを介して、クライアント・デバイスに通知することができる。その後、ビデオ処理デバイスにおけるクライアント・デバイスは、このマニフェスト・ファイルを使用して、中央および周辺FOVに基づいて異なるビデオ・タイルを選択することができる。
実施形態では、前記ビデオ・データを処理するステップが、更に、前記受信したタイル・ストリームのビデオ・データを、タイルを表すビデオ・フレームにデコードするステップと、1つの時間インスタンスに関連付けられたタイルのビデオ・フレームを空間的に配置し、ビデオ・フレームをスティッチして1つのビデオ・フレームにするステップと、マッピング情報に基づいて、ビデオ・フレームの2D投影ビデオ・データを、全方位ビデオ・データとして、湾曲面上にマッピングするステップとを含んでもよい。
実施形態では、前記選択した1つ以上のタイル・ストリームの要求および受信が、HTTP適応ストリーミング・プロトコル、好ましくは、MPEG DASHストリーミング・プロトコルまたはその派生物に基づいてもよい。
実施形態では、マニフェスト・ファイルが、更に、タイル・ストリームの1つ以上の表現を含み、好ましくは、前記1つ以上の表現が、1つ以上の解像度表現および/または1つ以上のタイリング表現を含んでもよい。
実施形態では、マニフェスト・ファイルが、1つ以上の空間関係記述子(SRD)を含み、空間関係記述子が、3D座標系の座標に基づいてタイルのタイル位置および寸法を定めるための1つ以上のSRDパラメータを含んでもよい。
実施形態では、1つ以上の空間関係記述子(SRD)が、更に、全方位ビデオ・データを平坦面上に投影するために使用される2D投影の型式を通知するための1つ以上のSRDパラメータを含み、好ましくは、2D投影の型式が、正距円筒投影 (equirectangular projection)、立方投影、円筒投影、あるいはこれらの組み合わせを含んでもよい。
拡張SRDは、相互運用性に関する利点を提供する。実際、同時に異なる2Dマッピングを使用して全方位ストリームを提供することもでき、SRDのsource_idパラメータは、これらのストリーム全てが同じコンテンツに関係することをクライアントに示すことができる。したがって、クライアントは、このクライアントにおいて最良にレンダリングすることができるフォーマットを選択することができる。また、全方位コンテンツをサポートしないクライアントには、同じコンテンツの非全方位バージョンを提供し、source_idの同じ値を使用することによって、それを全方位コンテンツに関係付けることも可能である。
本発明による拡張SRDは、VRレンダリング・システムとのインターフェース改良に対処し、これにより、クライアント・デバイスがユーザの視点を効率的に処理することを可能にする。これは、全方位ビデオの視点に基づくレンダリングにとって重要である。したがって、これに基づくタイル・ストリーム選択方法は、クライアント・デバイスにストリーミングする必要があるサブパート(タイル)の選択迅速化を可能にする。これは、レイテンシを短縮し結果的に高い品質の体験を提供するためには必須である。
ある実施形態では、2D投影のビデオ・フレームは、空間タイリングをサポートするコデックに基づいてエンコードされてもよい。例えば、HEVC規格は、HEVCタイルをサポートし、ビデオ・フレームは格子状のタイルに空間的に分割される。これらのHEVCタイルは、タイルの各々をマイクロプロセッサの異なるコアによって処理できるようにエンコードされる。HEVCタイルに関連付けられたメディア・データは、これらが同じビデオ・フレームの他のタイルのメディア・データに対する空間デコーディング依存性を全く有さないようにエンコードすることができる。更に、タイルに関連付けられたメディア・データは、これらが以前のまたは今後のビデオ・フレームの他のタイルのメディア・データに対して時間デコーディング依存性を全く有さないようにエンコードされる。その場合、各HEVCタイルのビデオ・データはメディア・ソース上にHEVCタイル・トラック、即ち、HEVCタイル・ファイルとして格納することができる。これらのタイル・トラックは、ISO/IEC14496−12、ISOベース・メディア・ファイル・フォーマット(ISOBMFF:ISO Base Media File Format)またはISO/IEC14496−15、ISOベース・メディア・ファイル・フォーマットのNALユニット構造化ビデオの搬送(ISO/IEC 14496-15 Carriage of NAL unit structured video)に基づくデータ・コンテナ・フォーマットを有してもよい。その場合、コンテンツ処理デバイスは、タイルをサポートするHEVCクライアントを当然備えており、要求されたHEVCタイル・ストリームを1つのビデオ・フレームにデコードすることができる。
他の態様において、本発明は、全方位ビデオを処理するためのクライアント・デバイスに関し、前記全方位ビデオが、湾曲面上に前記全方位ビデオのビデオ・データの空間位置を決定するための3D座標系に関連付けられる。このクライアント・デバイスは、プログラムの少なくとも一部が具体化されているコンピュータ読み取り可能記憶媒体であって、マニフェスト・ファイルを含む、コンピュータ読み取り可能記憶媒体と、コンピュータ読み取り可能プログラム・コードが具体化されているコンピュータ読み取り可能記憶媒体と、コンピュータ読み取り可能記憶媒体に結合されたプロセッサ、好ましくは、マイクロプロセッサとを含む。コンピュータ読み取り可能プログラム・コードの実行に応答して、プロセッサは、マニフェスト・ファイルを受信する動作であって、マニフェスト・ファイルが、複数のタイル・ストリームを識別するための複数のタイル・ストリーム識別子を含み、タイル・ストリームが、画像表示枠を有するビデオ・フレームを構成し(comprise)、これによって、異なるタイル・ストリームのビデオ・フレームの画像表示枠が、全方位ビデオの2D投影の異なる領域を覆い、1つの領域が1つのタイルを定める、動作と、マニフェスト・ファイルにおける空間関係情報に基づいて,更にクライアント・デバイスのユーザの視点に基づいて、第1解像度および第1タイル位置に関連付けられた第1タイル・ストリームと、第2解像度および第2タイル位置に関連付けられた第2タイル・ストリームとを選択する動作であって、第2解像度が第1解像度よりも低く、空間関係情報が、タイル毎に、タイル位置を定め、視点がユーザの目視方向を定め、タイル位置および視点が、3D座標系の座標に基づいて定められる、動作とを含む、実行可能動作を実行するように構成される。
実施形態では、 実行可能動作が、更に、1つ以上のタイル・ストリーム記憶デバイス、好ましくは1つ以上のネットワーク・ノードに、選択した1つ以上のタイル・ストリームを要求する動作と、1つ以上の選択したタイル・ストリームのビデオ・データを受信し、更にマッピング情報を受信する動作であって、好ましくは、マッピング情報の少なくとも一部が、マニフェスト・ファイルにおいてクライアント・デバイスに通知され、マッピング情報が、クライアント・デバイスがタイル・ストリームの2D投影ビデオ・データを、全方位ビデオ・データとして、湾曲面上にマッピングすることを可能にするための情報を、クライアント・デバイスに提供する、動作と、空間関係情報およびマッピング情報に基づいて、前記受信したタイル・ストリームのビデオ・データを処理する動作とを含んでもよい。
実施形態では、マニフェスト・ファイルが、1つ以上の空間関係記述子(SRD)を含み、空間関係記述子が、3D座標系の座標に基づいてタイルのタイル位置および寸法を定めるための1つ以上のSRDパラメータを含んでもよい。
実施形態では、マニフェスト・ファイルが、全方位ビデオ・データを平坦面上に投影するために使用される2D投影の型式を通知するための1つ以上のSRDパラメータを含む、1つ以上の空間関係記述子を含んでもよい。
実施形態では、2D投影の型式が、正距円筒投影、立体投影、円筒投影、若しくは派生物、および/またはこれらの組み合わせを含む。
他の態様において、本発明は、クライアント・デバイスによって全方位ビデオを処理する方法に関することができる。前記全方位ビデオは、湾曲面、好ましくは、球体上に前記全方位ビデオのビデオ・データの空間位置を決定するための3D座標系に関連付けられる。前記方法は、好ましくはクライアント・デバイスによってマニフェスト・ファイルを受信するステップであって、マニフェスト・ファイルが、複数のタイル・ストリームを識別するための複数のタイル・ストリーム識別子を含み、タイル・ストリームが、画像表示枠を有するビデオ・フレームを含み、これによって、異なるタイル・ストリームのビデオ・フレームの画像表示枠が、全方位ビデオの2D投影の異なる領域を覆い、1つの領域が1つのタイルを定める、ステップと、
好ましくはクライアント・デバイスによって、マニフェスト・ファイルにおける空間関係情報に基づいて,更にクライアント・デバイスのユーザの視点に基づいて、第1解像度を有する1つ以上のタイル・ストリームと、第2解像度に関連付けられた第2ストリームとを選択するステップであって、第2解像度が第1解像度よりも低く(例えば、低解像度のベース・レイヤ)、空間関係情報が、タイル毎に、タイル位置を定め、視点がユーザの目視方向を定め、タイル位置および視点が、3D座標系の座標に基づいて定められる、ステップとを含む。
したがって、この実施形態では、ユーザのFOVの中央部にビデオ・データをレンダリングするために、タイル・ストリーミングに基づいて高解像度ビデオ・データを要求することができ、一方ユーザのFOVの周辺部および/または外側のエリアには、非タイル状の低解像度のベース・レイヤを要求してもよい。
実施形態では、H.264/MPEG−4 AVCビデオ圧縮規格のAnnex G extensionから知られているスケーラブル・ビデオ・コード化(SVC:scalable video coded)に基づいて、非タイル状およびタイル状ビデオ表現をコード化してもよい。したがって、この場合、非タイル状低解像度レイヤは、SVCベース・レイヤとしてフォーマットされてもよく、一方タイル状中および高解像度表現は、SVCエンハンスメント・レイヤ(enhancement layer)としてフォーマットされてもよい。
1つの態様において、本発明は、クライアント・デバイスのためにマニフェスト・ファイルを格納するための非一時的コンピュータ読み取り可能記憶媒体に関し、前記クライアント・デバイスが、前記マニフェスト・ファイルに基づいて全方位ビデオを処理するように構成されており、前記全方位ビデオが、湾曲面、好ましくは球上に前記全方位ビデオのビデオ・データの空間位置を決定するための3D座標系に関連付けられており、前記マニフェスト・ファイルがコンピュータ読み取り可能データを含む。前記データは、複数のタイル・ストリームを識別するための複数のタイル・ストリーム識別子であって、タイル・ストリームが、画像表示枠を有するビデオ・フレームを含み、これによって、異なるタイル・ストリームのビデオ・フレームの画像表示枠が、全方位ビデオの2D投影の異なる領域を覆い、1つの領域が1つのタイルを定める、複数のタイル・ストリーム識別子と、空間関係情報であって、この空間関係情報がタイル毎にタイル位置を定め、タイル位置および視点が、3D座標系の座標に基づいて定められる、空間関係情報と、クライアント・デバイスが、マニフェスト・ファイルにおいて識別されたタイル・ストリームの2D投影ビデオ・データを、全方位ビデオ・データとして、湾曲面上にマッピングすることを可能にするための情報を、クライアント・デバイスに提供するためのマッピング情報とを含む。
実施形態では、マニフェスト・ファイルのコンピュータ読み取り可能データが、更に、1つ以上の空間関係記述子(SRD)であって、空間関係記述子が、3D座標系の座標に基づいてタイルのタイル位置および寸法を定めるための1つ以上のSRDパラメータを含む、1つ以上の空間関係記述子(SRD)、および/または、全方位ビデオ・データを平坦面上に投影するために使用される2D投影の型式を通知するための1つ以上のSRDパラメータであって、好ましくは、2D投影の型式が、正距円筒投影、立体投影、円筒投影、若しくは派生物、および/またはこれらの組み合わせを含む、1つ以上のSRDパラメータを含む。
また、本発明は、ソフトウェア・コード部分を含むプログラム製品に関することができ、ソフトウェア・コード部分が、コンピュータのメモリ内で実行されると、前述の方法ステップの内任意のものを実行するように構成される。
添付図面を参照しながら、本発明について更に説明する。添付図面は、本発明による実施形態を模式的に示す。尚、本発明はこれらの具体的な実施形態に限定されることは全くないことは理解されよう。
図1は、本発明の実施形態による全方位ビデオ用ビデオ・ストリーミング・システムの模式図を表す。 図2A〜2Cは、本発明の実施形態による全方位ビデオ用クライアント・デバイスの3D座標系における視点を示す。 図3Aは、本発明の種々の実施形態によるタイル状全方位ビデオ(tiled omnidirectional video)の生成および再生(playout)のフローを示す。 図3Bは、本発明の種々の実施形態によるタイル状全方位ビデオ(tiled omnidirectional video)の生成および再生(playout)のフローを示す。 図4は、本発明の実施形態によるタイル状全方位ビデオ用クライアント・デバイスの視野を示す。 図5A〜図5Dは、本発明の実施形態による全方位ビデオ用クライアント・デバイスで使用するための異なるビデオ品質の異なるタイリング表現を示す。 図6は、本発明の実施形態によるタイリング・ビデオ全方位ビデオを構成する(comprise)ビデオ・フレームを表す。 図7は、全方位ビデオの2D平面への投影の他の例を示す。 図8は、本発明の実施形態による全方位ビデオ用クライアント・デバイスの視野を示す。 図9A〜図9Dは、本発明の実施形態による全方位ビデオ用クライアント・デバイスで使用するための異なるビデオ品質の異なるタイリング表現を示す。 図10は、本発明の実施形態によるタイリング・ビデオ全方位ビデオを構成するビデオ・フレームを表す。 図11は、本発明の実施形態にしたがって、空間タイリング全方位ビデオを処理するように構成された(adapted)クライアント・デバイスを表す。 図12は、本開示において説明する実施形態と共に使用することができる例証的なデータ処理システムを示すブロック図を表す。
図1は、本発明の実施形態による全方位ビデオ用ビデオ・ストリーミング・システムの模式図を示す。具体的には、図1は、1つ以上のメディア・ソース104、例えば、1つ以上のビデオ・サーバを含むビデオ・ストリーミング・システム100を表す。メディア・ソース104は、所定のデータ・フォーマットに基づいてタイル状全方位ビデオ・データ(tiled omnidirectional video data)102を格納するように構成されている。
タイル状全方位コンテンツは、個々のタイル・ストリーム・ファイル103〜103として格納することができ、タイル・ストリームのビデオ・フレームは、全方位ビデオ・コンテンツの矩形平面への二次元投影を表すビデオ・フレームの小区域(タイル)を表す。タイル・ストリーム識別子(例えば、URL)、および異なるタイル・ストリームの異なる小区域(タイル)間の空間関係は、いわゆる空間マニフェスト・ファイル106に格納される。タイル状コンテンツの概念については、以下で更に詳しく説明する。
1つ以上のメディア・ソースは、ストリーミング・プロトコルに基づいて、ビデオ・データを全方位ビデオ処理デバイス(omnidirectional video processing devices)118〜118(以後省略してビデオ処理デバイスと呼ぶ)にストリーミングするように構成されている(adapted)。メディア・ソースは、多数のビデオ処理デバイスへのメディア・データの効率的な配信のために構成されたコンテンツ配信ネットワーク(CDN: content delivery network)の一部であってもよい。
ビデオ処理デバイスは、全方位ビデオ・データを処理し、表示のために全方位ビデオ・データをレンダリングするように構成されている。このようなビデオ処理デバイスの非限定的な例には、仮想現実および拡張現実の用途に使用される、頭部装着型ディスプレイ(HMD:head-mounted display)がある。HMDは、視点(viewpoint)、すなわち、HMDのユーザが見ている3D空間における方向を判定するために、頭部、目、および/または身体の動きを追跡する1つ以上のセンサを含む。視点は、3D空間において方向を定めるのに適した、球面座標系のような、座標系に基づいて表現されてもよい。HMDは、更に、視野(FOV:field of view)、即ち、特定の視点および所与の時点に対してHMDが表示することができる全方位ビデオのエリアによって特徴付けられる。HMDのFOVは、球面座標系に基づいて表現されてもよい。
ビデオ処理デバイスの各々は、クライアント・デバイス120〜120を含むことができる。クライアント・デバイス120〜120は、ネットワークから、具体的には、ビデオ・サーバ104および/またはビデオ・キャッシュ116のようなネットワーク・ノードに全方位メディア・データを要求するように構成されている。ビデオ処理デバイスは、更に、要求したビデオ・データを受信し、メディア・エンジン122〜122への入力のためにメディア・データをバッファするように構成されている。メディア・ビデオは、メディア・データをビデオ・フレームにデコードするために1つ以上のデコーディング・インスタンスを実行することができる、1つ以上のプロセッサ、例えば、グラフィカル処理ユニット(GPU)を含んでもよい。
コンテンツ生成においては、所定のマッピング、例えば、正距円筒投影に基づいて方位ビデオ・データを生成することができる。したがって、マッピングされた全方位ビデオのビデオ・フレームは、全方位ビデオ・データの正距円筒投影を表すことができる画素を含む。これらのビデオ・フレームは、タイリング・プロセスを受けることができ、ビデオ・フレームはいわゆるビデオ・タイル(または省略して、タイル)に空間的に分割される。タイリング・プロセスは、ビデオ・データ(画素)の内ビデオ・フレームからのタイルに対応するエリアを切り抜き(crop)、この切り抜いたビデオ・データをエンコードし、エンコードしたビデオ・データをビデオ・ファイルとして格納する処理を含むことができる。このプロセスを異なるタイルに繰り返すことによって、別個にアクセスしクライアント・デバイスにストリーミングすることができる1組のビデオ・ファイルが得られる。コンテンツ処理デバイスは、1つ以上のタイル・ストリームを要求するクライアント、異なるタイル・ストリームのビデオ・データをデコードする1つ以上のデコーダ、およびビデオ・フレームを一緒にスティッチして1つのビデオ・フレームにするレンダリング・エンジンを当然含む。
あるいは、ある実施形態では、空間タイリングをサポートするコデックに基づいて、 2D投影のビデオ・フレームをエンコードしてもよい。例えば、HEVC規格は、HEVCタイルをサポートし、ビデオ・フレームは格子状のタイルに空間的に分割される。これらのHEVCタイルは、タイルの各々をマイクロプロセッサの異なるコアによって処理できるようにエンコードされる。HEVCタイルに関連付けられたメディア・データは、これらが同じビデオ・フレームの他のタイルのメディア・データに対する空間デコーディング依存性を全く有さないようにエンコードすることができる。更に、タイルに関連付けられたメディア・データは、これらが以前のまたは今後のビデオ・フレームの他のタイルのメディア・データに対して時間デコーディング依存性を全く有さないようにエンコードされる。その場合、各HEVCタイルのビデオ・データはメディア・ソース104上にタイル・トラックとして格納することができる。これらのタイル・トラックは、ISO/IEC14496−12、ISOベース・メディア・ファイル・フォーマット(ISOBMFF:ISO Base Media File Format)またはISO/IEC14496−15、ISOベース・メディア・ファイル・フォーマットのNALユニット構造化ビデオの搬送(ISO/IEC 14496-15 Carriage of NAL unit structured video)に基づくデータ・コンテナ・フォーマットを有してもよい。その場合、コンテンツ処理デバイスは、タイルをサポートするHEVCクライアントを当然備えており、要求されたタイル・ストリームを1つのビデオ・フレームにデコードすることができる。
エンコードされたビット・ストリームをクライアント・デバイスに送信するために、異なるトランスポート・プロトコルを使用することができる。例えば、実施形態では、タイル・ストリームをクライアント・デバイスに配信するために、HTTP適応ストリーミング(HAS:HTTP adaptive streaming)プロトコルを使用することができる。その場合、タイル・ストリームにおけるビデオ・フレームのシーケンスは、通例2〜10秒のメディア・データを含む時間セグメントに一時的に分割することができる。このような時間セグメントは、記憶媒体上にメディア・ファイルとして格納することができる。実施形態では、デコーダが直接HASセグメントにおけるメディア・データをデコードし始めることができるように、時間セグメントは、その時間セグメントまたは他の時間セグメントにおける他のフレーム、例えば、Iフレームまたはその同等物に対して時間コード化依存性を有さないメディア・データから開始するのでもよい。随意に、メディア・ストリームに関するパラメータ、例えば、空間解像度、フレーム・レート、コデック・プロファイルおよびレベル等によってデコーダを初期化することを唯一の目的として、メディア・セグメントと共に初期化セグメントを設けてもよい。
クライアント・デバイスは、ビデオ処理デバイスの視点に関連する1組のタイルを選択するように構成することができる。実施形態では、クライアント・デバイスは、いわゆるマニフェスト・ファイル106における情報、即ち、クライアント・デバイスのためのメタデータを含む1つ以上のデータ構造に基づいて、タイル・ストリームを選択しネットワークに要求するために、この選択を実行することができる。
マニフェスト・ファイルは、ストリーム識別子、例えば、URL、またはこのようなストリーム識別子を判定するための情報を含む(comprise)ことができる。ストリーム識別子は、1つ以上のタイル・ストリーム識別子を含む(include)ことができる。更に、マニフェスト・ファイルは、タイル間に存在する空間関係についてクライアント・デバイスに通知するために空間関係情報を含むこともできる。実施形態では、タイル・ストリーム識別子をタイル位置情報、即ち、タイル・ストリームのタイル状ビデオ・フレームにおけるタイルの位置についてクライアント・デバイスに通知するための情報と関連付けることができる。速いタイル選択を可能にするために、タイル位置情報を球面座標で表してもよい。
更に、マニフェスト・ファイルは、1つ以上のネットワーク・ノードに関する位置情報、例えば、ネットワーク・ノードの1つ以上のURLおよび/またはネットワーク・アドレスも含むことができる。これらのネットワーク・ノードは、要求されたメディア・データをクライアント・デバイスに送信するように構成されたメディア・ソース104および/またはメディア・キャッシュ116に関係付けることができる。クライアント・デバイスは、マニフェスト・ファイルを使用して、ビデオ処理デバイスによってクライアント・デバイスに供給される視点に基づいて、1つ以上のタイル・ストリームを選択することができる。
メディア・デバイス118〜118におけるクライアント・デバイス120〜120は、タイルのメディア・データを受信およびバッファし、メディア・エンジン122〜122への入力のために、メディア・データを1つ以上のビット・ストリームとして準備することができる。メディア・エンジンは、タイルのメディア・データをビデオ・フレームにデコードするための1つ以上のデコーダを含むことができる。次いで、生成したビデオ・フレームを、メディア・エンジンに結合されているレンダリング・エンジン124〜124に転送する。レンダリング・エンジンは、ビデオ・フレームをバッファするためのフレーム・バッファと、異なるタイル・ストリームのビデオ・フレームを融合して(fusing)、視野(FOV)の正距円筒バージョンを表す1つのビデオ・フレーム126にするためにフュージョン・プロセッサ(図示せず)とを含むことができる。ビデオ・フレーム126は、レンダリングのために球面表現に変換する必要がある。
図2A〜図2Cは、本発明の実施形態による全方位ビデオ用クライアント・デバイスの3D座標系における視点を示す。図2Aは、全方位での使用に相応しい3D座標系の例を示す。具体的には、図2Aは、球面上の視点202を定める3D球面座標系を示し、原点から視点に延びるベクトルの方向が、3D空間における全方位ビデオ処理デバイスのユーザの目視方向を定める。この方向は、極角θ(天頂角またはヨー角とも呼ぶ)および方位角φ(ピッチ角と呼ばれることもある)によって定めることができる。これらのパラメータは、球面物体上の位置が緯度および経度によって定められる地理的座標系に関係がある。
図2Bは、原点において視点の方向を見ている観察者の視野(FOV)を定める。視野は、観察者によって任意の所与の時点に見られる観察可能な世界の範囲(extent)と定義してもよい。この特定的な場合では、観察者、即ち、全方位ビデオ処理デバイスのユーザにとって、観察可能な世界は、球面上に投影された全方位コンテンツと見なすことができ、視野は、全方位コンテンツの内、全方位ビデオ処理デバイスによって所与の時点にユーザに提示することができる部分を定める。
全方位ビデオについて図2Bに示すように、原点における観察者のFOVは、観察者の目視方向における球の表面上のエリアと定義することができる。FOVは、観察者に提示することができる全方位ビデオの量を制限し、FOVの範囲(寸法)は、球面座標、例えば、天頂角および方位角に関して定義することができる。実施形態では、FOVは、FOVの中心としての視点θ、Φによって定めることができ、θ±ΔΘ、φ±ΔφがFOVの「幅」および「高さ」を定める。
従来のコード化方式に基づいて全方位ビデオをコード化することを可能にするために、全方位ビデオを最初に処理して、従来のエンコーダに入力できるフォーマットにする。従来のコデックは平面矩形ビデオ・フレームしか扱うことができないので、通例、ビデオ・データを従来の矩形ビデオ・フレーム・フォーマットの形状にマッピングする。異なるマッピングを使用することもできる。例えば、図2Cは全方位コンテンツの矩形平面上への正距円筒投影を表す。格子線によって示すように、このようなマッピングによって、球の前方、左側、右側、および後ろ側を含むビデオ・ピクチャ218が得られ、投影のために、物体は北極および南極に向かってピクチャ内で歪む。デコーダ・サイドでは、正距円筒投影は、湾曲面、例えば、球面に投影されるコンテンツに逆変換される必要がある。
全方位ビデオが生成される方法に応じて、そしてVR用途の種類に応じて、その他の異なる型式の投影を使用することもできる。マッピングの型式、およびマッピングに必要とされるパラメータをマッピング情報と呼ぶ。
図2A〜図2Cにおいて視点およびFOVを記述するための3D座標系は球面座標系を表すが、他の湾曲線形座標系も、3Dにおいて湾曲面を記述するのに相応しければ、使用することができる。
視野208に対応するビデオ・データの部分のみをレンダリングする間に、FOVを再生する。このために、ビデオ・フレームを空間的にタイル状に分割し、個々のタイルのビデオ・データを処理し、クライアントがこれらに個々にアクセスし要求できるように、別個のファイルに格納する。タイル状全方位コンテンツの作成および再生に関する実施形態については、以下で更に詳しく説明する。
図3A〜図3Bは、本発明の種々の実施形態によるタイル状全方位ビデオの生成および再生のフローを示す。図3Aは、タイル状全方位ビデオの生成を表す。第1ステップ302において、全方位ビデオ・データを取り込むことができ、取り込まれるビデオ・データは、3D空間における目視方位(viewing orientation)の関数である。その後、画像を処理して2D矩形ビデオ・フレームとし(ステップ304)、ここで画素は立体マップにおける画素の正距円筒投影を表す。このようなビデオ・フレームを正距円筒ビデオ・フレームと呼ぶこともできる。ある実施形態では、全方位ビデオを異なる品質、例えば、SD、HD、UHD、およびそれ以上で取り込むこともできる。
正距円筒ビデオ・フレームは、各タイルが、全方位ビデオ・データを表示するためにビデオ処理デバイスによって使用される湾曲(例えば、球)面のエリアを表すように、空間的にタイルに分割する(ステップ306)ことができる。各タイルを湾曲面上のタイル位置に関連付けることができ、3D座標系、例えば、球面座標系に関して表現することができる。ビデオ・フレームにおけるタイルと球面上におけるエリアとの間の関係は、使用されるマッピングにしたがって決定される(図2Cを参照して説明したとおり)。
タイリング・プロセスは、正距円筒ビデオ・フレームからあるエリアのビデオ・データ(画素)を切り抜く処理を含んでもよい。このようなエリアをビデオ・タイルまたは省略してタイルと呼ぶこともできる。正距円筒ビデオ・フレームのシーケンスにおいて同じエリアに対してクロッピング・プロセスを繰り返すと、タイルのシーケンスが得られる。これらのタイルのビデオ・データは、任意の既知のコデック、例えば、AVC、SVC、HEVC、VP9等を使用してエンコードし、ビデオ・タイル・ファイルに格納することができる。ビデオ・フレームからの正距円筒ビデオ・フレームにおける異なるエリアに対してこのプロセスを適用すると、別個にアクセスし1つ以上のタイル・ストリームとしてクライアント・デバイスにストリーミングすることができる1組のビデオ・タイル・ファイルが得られる(ステップ308)。したがって、タイル・ストリームは画像表示枠(ビデオ・タイルまたは省略してタイル)を有するビデオ・フレームを構成し(comprise)、これによって、異なるタイル・ストリームのビデオ・フレームの画像表示枠が、全方位ビデオの2D投影の異なる領域を覆うことになる。
その上、このコンテンツ生成プロセスは、異なるタイル毎および異なるビデオ品質毎にビデオ・タイル・ファイルが生成されるように、同じ全方位ビデオの異なる品質毎に繰り返してもよい。同様に、このコンテンツ生成プロセス(ステップ304および306)は、立体または円筒2D投影のような、異なる2D投影を生成するために繰り返してもよい。
更に他の実施形態では、異なるタイリング格子を使用することもできる。例えば、低品質のビデオをストリーミングするためには大きなタイルを使用すればよく、一方高品質のビデオをストリーミングするためには小さなタイル(粒度が小さいタイル格子)を使用すればよい。同様に、用途に応じて、タイル格子におけるタイルのサイズも異なってもよい。代わりに、および/または、加えて、同じコンテンツに基づいて異なるタイリング格子を生成することもできる。
実施形態では、MPEG DASHのようなHTTPベースのストリーミング・プロトコルを使用することもできる。その場合、所定期間(通例、2〜10秒)の短いセグメント・ファイルにビデオ・タイル・ファイルを時間的にセグメント化することができる。
ビデオ・タイル・ファイルの生成の間に、いわゆる空間マニフェスト・ファイルが生成される。このマニフェスト・ファイルは、ビデオ処理デバイスにおけるクライアント・デバイスのためのメタデータを含むことができる。このメタデータは、ビデオ処理デバイスがタイル・ストリームを要求しタイル・ストリームにおけるビデオ・データを処理することを可能にする。このために、マニフェスト・ファイルは、タイル・ストリームを要求するためのネットワーク・アドレスを識別するために、タイル識別子、例えば、URLを含むことができる。ある実施形態では、タイル識別子は、クライアント・デバイスが異なるビデオ品質から選択できるように、品質情報に関連付けられる。
更に、マニフェスト・ファイルは、タイル間に存在する空間関係についてクライアント・デバイスに通知するために、空間関係情報も含むことができる。このために、タイル識別子を、湾曲(例えば、球)面のエリアを定める座標に関連付けてもよく、ビデオ処理デバイスによって全方位ビデオを表示するために使用される。更に、マニフェスト・ファイルは、マッピング情報、即ち、選択されたビデオ・タイルのビデオ・データを表示するためにクライアント・デバイスが必要とする情報も含むことができる。マッピング情報は、例えば、タイル状全方位ビデオ・コンテンツを生成するために使用されるマッピングの型式の識別子を含むことができる。
MPEG DASHの場合、マニフェスト・ファイル(DASHではメディア・プレゼンテーション記述(MPD)と呼ぶ)は空間関係記述子(SDR)を含むことができる。実施形態では、SDRは、3D座標系に基づいてタイルの位置を記述する空間関係情報についてDASHクライアントに通知するために拡張することができ、全方位ビデオを表示するために使用される湾曲面を記述(モデル化)するために使用される。他の実施形態では、タイル状全方位ビデオ・コンテンツを生成するために使用されるマッピングの型式についてDASHクライアントに通知するように、SDRを構成することもできる。このようなSRDの例について、以下で更に詳しく説明する。
マニフェスト・ファイルにおいて識別されたタイル状全方位ビデオは、タイル状でない全方位ビデオと組み合わせて使用することもできる。例えば、実施形態では、マニフェスト・ファイルにおいて識別されたタイル・ストリームが、全方位ビデオの中および高品質表現に関係があり、一方全方位ビデオのタイル状でないバージョンが、低解像度バージョンに関係があるとしてもよい。このように、該当する高解像度タイル・ストリームのみ、即ち、FOVの中央部のビデオ・データを搬送する分のみ、タイル・ストリームがクライアント・デバイスに送信される。
図3Bは、クライアント・デバイスによるタイル状全方ビデオ処理の流れ図を表す。このプロセスは、開始すると、クライアント・デバイスが、タイル・ストリームが識別されるマニフェスト・ファイルを受信することができ、タイルは、全方位ビデオを表示するために使用される表面を記述するために使用される3D座標系に基づいて定めることができる空間関係を有する。マニフェスト・ファイルは、更に、全方位ビデオ・データを生成するために使用されるマッピングの型式についてクライアント・デバイスに通知するために、マッピング情報も含むことができる(ステップ320)。
クライアント・デバイスは、ビデオ処理デバイスからの視点を含むことができる。視点は、全方位ビデオを表示するために使用される表面を記述するために使用される3D座標系における目視方向に関して定められてもよい。受信した視点に基づいて、クライアント・デバイスは現在のFOVを判定することができる。その後、マニフェスト・ファイルにおける情報を使用して、現在のFOVを定める湾曲面上のエリアを少なくとも部分的に覆う1つ以上の近隣タイルを選択することができる(ステップ322)。
その後、クライアント・デバイスは、要求されたタイル・ストリームをクライアント・デバイスに配信(送信)するように構成された1つ以上のネットワーク・ノードに、1つ以上のHTTPメッセージを送ることによって、タイル識別子、例えば、URLに基づいて、選択したタイルを要求することができる。
実施形態では、クライアント・デバイスは、FOVにおけるタイルの位置に基づいて、タイルのビデオ品質を選択してもよい。例えば、タイルの大部分がFOVの中央部に位置する、即ち、視点から一定の距離以内に位置するとき、クライアント・デバイスは高品質タイルを選択するのでもよい。タイルの大部分がFOVの周辺部(FOVの中央部の外側)に位置するとき、クライアント・デバイスは、FOVの中央部に選択したタイルのビデオ品質よりも低い品質(例えば、中または低品質)を有するタイルを選択するのでもよい。
一旦ビデオ・ストリームが受信されたなら、タイルのビデオ・データをビデオ・フレームにデコードすることができる。更に、クライアント・デバイスは、全方位ビデオ・レンダリング・エンジンに、全方位ビデオを生成するために使用されるマッピングの型式を通知することができる。この情報に基づいて、レンダリング・エンジンは、ビデオを湾曲面にレンダリングすることができるように、それ自体を構成することができる(ステップ324)。ある実施形態では、クライアント・デバイスはマッピング情報内にあるマッピング・パラメータを使用してもよい。
クライアント・デバイスによって選択されたタイルを表すビデオ・フレームは、マニフェスト・ファイルにおける空間関係情報を使用して、一緒にスティッチされて、1つのビデオ・フレームにすることができる(ステップ326)。次いで、スティッチされたビデオ・フレームは、全方位ビデオを表示するために使用される湾曲面上にビデオ・データを投影するために、レンダリング・エンジンに供給することができる(ステップ328)。投影ステップは、2D投影ビデオ・データを逆に湾曲面にマッピングする処理を含むことができる。これは、ビデオ・データに1つ以上の数学的画像処理動作を受けさせることを含んでもよい。
したがって、本開示において説明したタイル状全方位ビデオは、観察者のFOVを表す1つ以上のビデオ・タイルの速い選択を可能にする。この速い選択は、タイルが空間関係情報に関連付けられており、空間関係情報が、全方位ビデオを表示するために使用される表面を記述するために使用される3D座標系に基づくという事実に基づく。このように、3D空間における観察者のFOVを、FOVを構築するタイルに直接連携させる(link)ことができる。
その上、マッピング情報は、異なる種類の全方位ビデオの柔軟な使用を可能にする。これは、マッピング情報が、全方位ビデオが生成されたときに使用されたマッピングの型式についてレンダリング・エンジンに知らせるからであり、更に、マッピング情報が、使用されたマッピングに従う湾曲面上に、レンダリング・エンジンがコンテンツを正しく投影できるように、マッピング・パラメータをレンダリング・エンジンに供給するからである。
MPEG DASHでは、タイルとマッピング情報との間の空間関係を通知するために、SRDを使用することができる。SRDは、ストリームを異なる空間サブパート(タイル)に分割することを可能にし、つまり、ユーザが関心を寄せるサブパートだけをストリーミングする可能性をクライアントに与える。VRでは、ユーザは、いずれの時点においても、360度のストリームの内、使用中のVRヘッドセットのFOV(現在では約100度)、そして最終的には人間の視覚(eye vision)(270度まで)によって制限される小さな一部分(subset)のみに関心を寄せる。
更に、このFOVの内、焦点が合っている中央部分だけが最高の品質を必要とするのかしれず、一方FOVの周辺部は、それよりも低い品質のストリームで対処できるかもしれない。したがって、全方位コンテンツに複数の異なる品質レイヤを生成することにより、そして各品質レイヤを空間サブパート(タイル)に分割することにより、ストリーミング・クライアントは、異なる品質で異なる空間サブパートをダウンロードし、帯域幅使用を最小限に抑えつつ高品質の体験をユーザに提供する柔軟性を得る。
たとえば、全方位コンテンツが3つの品質レイヤで提供される(offer)場合、クライアントはユーザのFOVの中央部を最高品質でストリーミングし、視野の周辺部を中間レベルの品質でストリーミングし、360度ビデオ全体を最低品質でストリーミングすることもできる。ユーザが彼女の視点を変更するときは、未だ彼女に示すべきコンテンツがあるので、最低品質での360度全域のストリーミングは、「ブラック・スクリーン」効果(black screen effect)を回避するために役に立つことができる。
拡張SRDは、相互運用性に関する利点を提供する。実際に、全方位ストリームは、同時に複数の異なる2Dマッピングを使用して提供することもでき、SDRのsource_idパラメータは、全てのそれらのストリームが同じコンテンツに関係することをクライアントに示すことができる。したがって、クライアントは、このクライアントにおいて最良にレンダリングすることができるフォーマットを選択することができる。また、全方位コンテンツをサポートしないクライアントのために、同じコンテンツの非全方位バージョンを提供し、source_idの同じ値を使用することによって、それを全方位コンテンツに関係付けることもできる。
SRDは、MPEG DASH規格から知られており、2Dコンテンツに相応しいSRDのみを記述する。異なる空間サブパートは、これらが2次元空間上で占有する位置およびサイズによって識別される。この手法は、2次元ビデオ・コンテンツを対象とする。しかしながら、既に以上で詳しく説明したように、全方位ビデオでは、使用に応じて、このような360度ビデオ(の空間サブパート)をビット・ストリームで表すために、異なる方法が存在する。例えば、正距円筒、縞状球面方式(striped spherical scheme)、円筒方式、または凸多面体/固体(convex polyhedron/solid)(立体または錐体等)を表す方式が知られている。
仮想現実ビデオ処理デバイスは、全方位ビデオの内、特定の視点、即ち、見る人(viewer)が見ている方向を表す湾曲面エリア上の点に対応する視点に対応する一部をレンダリングするように構成される。したがって、特定のサブパート(タイル)の空間位置およびサイズが、全方位ビデオのFOVの部分をユーザに表示するために使用される湾曲面(例えば、球面)上におけるその真の表現に関係付けて記述されるのは有利である。
したがって、実施形態では、"space"と呼ばれる新たなSRDパラメータを導入する。これは、全方位ビデオ表現をクライアントに通知するように構成されている。また、このパラメータは、特定の全方位ビデオ表現を更に特徴付ける1つ以上のパラメータも伴う(imply)または関連付けられてもよい。例えば、実施形態では、円筒状空間は、SRDにおいて、space="cylindrical"、およびこの円筒形を特徴付ける追加のSRDパラメータによって通知することができ、追加のSRDパラメータは、一定の、例えば、高さ=150を有するのでもよい)。
他の実施形態では、SRDにおけるパラメータobject_xおよびobject_yが空間サブパートの中心位置を定める(従来のSRDでは、これらが前記サブパートの左上角の位置を表すのとは異なる)。更に、object_xおよびobject_yは、それぞれ、ヨー角およびピッチ角を識別することもできる。ヨー角は、0から360までの範囲を取ることができ、ここで、0=北、90=東、180=南、そして270=西であり、ピッチ角は−90°(天底)から+90°(天頂)までの範囲を取ることができる。
本発明による拡張SRDは、VRレンダリング・システムとのインターフェース改良をもたらし、これによって、クライアント・デバイスが、ユーザの視点を効率的に処理することを可能にする。これは、全方位ビデオの視点に基づくレンダリングには重要である。したがって、これに基づくタイル・ストリーム選択方法は、クライアント・デバイスにストリーミングする必要があるサブパート(タイル)の選択を高速化することができる。これは、レイテンシを短縮し結果的に高い品質の体験を提供するためには必須である。
SRDパラメータobject_widthおよびobject_heightは、360度面上における物体の角距離(angular length)に関して、タイルの幅および高さを表すことができる。具体的には、物体の幅は、物体の中心を通る平行線上で測定したその幅の弧度によって表され、高さは、例えば、図2Bに示すように、物体の中心を通る中線上で測定したその高さの弧度によって表される。
更に、VRの用途では、ビデオ・コンテンツが常にユーザの目の前に表示される。しかしながら、人間の周辺視野は高周波(細かい詳細)には敏感でないことは周知である。したがって、更に他の実施形態では、本開示におけるタイリング方式を、人間の目のFOVを考慮して最適化することができる。したがって、ユーザのFOVの中央部を構成する領域を、高品質ビデオに基づいて表示することができ、一方周辺視野に対応する領域は、標準的な品質で提供することができ、こうして帯域幅を節約する。
図4は、本発明の実施形態によるタイル状全方位ビデオに対するクライアント・デバイスの視野を示す。図4は、正距円筒マッピングに基づく全方位コンテンツを表示するために使用される湾曲面402の方向を見ているユーザの視点を表す。ここでは、FOV404は、表示枠(view)に示されるコンテンツの部分、および表示枠に示されないコンテンツ406の部分を定める。更に、FOVは中央FOV408および周辺FOV410に分割されている。FOVの中央部では、高品質コンテンツを表示することができ、周辺では、それよりも低い品質を選択することができる。
中央および周辺の寸法は、人のFOVおよび帯域幅の考慮に基づいて決定または選択することができる。タイル状ビデオ・コンテンツは、中央および周辺FOVの異なる要件(タイル・サイズおよびビデオ品質に関して)を考慮に入れて生成することができ、この情報の少なくとも一部を、マニフェスト・ファイルを介してクライアント・デバイスに通知することもできる。続いて、ビデオ処理デバイスにおけるクライアント・デバイスは、マニフェスト・ファイルを使用して、中央および周辺FOVに基づいて異なるビデオ・タイルを選択することができる。
以下に、異なるマッピング(異なる2D投影によって表される)に基づいて生成された全方位ビデオ・データの異なる例について説明する。
正距円筒2D投影の例を、図5A〜図5Dおよび図6において以下で示す。正距円筒2D投影では、全方位コンテンツは矩形としてビット・ストリームで表される。経度は水平座標にマッピングされ、緯度は垂直座標にマッピングされる。正距円筒2D投影は、魚眼レンズを装備した回転(走査)パノラマ・カメラのデフォルト出力フォーマットであり、現在全方位ビデオに使用されている最も普及したフォーマットの1つである。
図5A〜図5Dは、クライアント・デバイスによって要求することができる、異なるタイリング配置を示す。このようなタイリング配置を全方位ビデオのタイリング表現と呼ぶこともできる。異なるタイリング表現を異なるビデオ品質に関係付けてもよい。タイリング表現は、図5Aに表すような非タイル状低解像度ビデオ表現、および図5Bに表すようなタイル状高解像度表現を含んでもよい。高解像度表現は、FOVの中央部のコンテンツを表示するために使用されてもよい。全方位コンテンツをユーザに提供する(serve)ために、クライアントは、パノラマ・ビュー全体を覆うための非タイル状最低解像度レイヤ、ならびに最高解像度レイヤ(FOVの中央部を表す)のタイル9および10を要求することもできる。加えて、クライアント・デバイスは、周辺FOVにために中解像度レイヤの4つのタイル、即ち、図5Dに示すような水平タイル状中解像度レイヤのタイル5および14、ならびに図5Cに示すような垂直タイル状中解像度レイヤのタイル12および16を選択してもよい。
結果的に得られたFOVを図6に示す。図6は、本発明の実施形態によるタイル状ビデオ全方位ビデオを構成する(comprise)ビデオ・フレームを表す。
図6に示すように、FOVの中央部は超高品質で配信され、品質はFOVのエッジに向かって低下する(diminish)。境界においてタイルの解像度が急激に変化することが知覚される影響を最小限に抑えるために、重複タイルを使用することができる。その場合、FOVの中央部における高解像度タイルは、周辺に向かう中解像度タイルと重複する。クライアント・デバイスがフィルタを使用してもよく、中解像度タイルと融合するために境界において高解像度タイルを徐々に調整し(scale)、該当する場合には、低解像度の背景と融合するために境界において中解像度タイルを徐々に調整することができる。
更に他の実施形態では、H.264/MPEG−4 AVCビデオ圧縮規格のAnnex G extensionから知られているスケーラブル・ビデオ・コード化(SVC:scalable video coded)に基づいて、非タイル状およびタイル状ビデオ表現をコード化してもよい。したがって、この場合、非タイル状低解像度レイヤをSVCベース・レイヤとしてフォーマットしてもよく、一方タイル状中および高解像度表現をSVCエンハンスメント・レイヤ(enhancement layer)としてフォーマットしてもよい。
図6に示すタイルを選択および要求するためにクライアントによって使用することができるDASH MPDをテーブル1に示す。




以上のMPDは、空間タイル状全方位ビデオを記述するのに適している拡張SRDをネットワークがサポートすることをクライアント・デバイスに通知するために、新たなschemeIdUri "urn:mpeg:dash:srd:vr:2016"を含む。更に、MPDは、EssentialPropertyおよびSupplementalPropertyの値フィールドの第2位置(source_idパラメータの後)に、追加のSRDパラメータ"space"も含む。このパラメータは、マッピング情報の一部であり、マニフェスト・ファイルにおいて識別される全方位ビデオ・データに使用される2D投影の型式について、クライアント・デバイスに通知することができる。例えば、spaceパラメータは、全方位ビデオが正距円筒2D投影によって表されることをクライアント・デバイスに通知するためには、値「0」を有するとしてもよい。正距円筒2D投影は、それを特徴化するために追加のパラメータを必要としないので、値フィールドにおける後続のSRDパラメータは、object_x、object_y、object_width、object_height、total_width、total_height、Spatial_set_idである(これらは、以上で説明したような新たな関数記述に基づいて再使用することができる標準的なSRDパラメータである)。
円筒状2D投影の一例について、図7〜図11を参照しながら以下に説明する。図7は、円筒状表現空間を示し、ピッチ角702−θおよび+θ角間に含まれる球面704の部分が、正距円筒投影706によって表され、一方北極708および南極710は円形投影712、714として表される。
図8は、本発明の他の実施形態によるタイル状全方位ビデオに対するクライアント・デバイスの視野を示す。具体的には、図8は、円筒状マッピングに基づく全方位コンテンツを表示するために使用される湾曲面の方向を見ているユーザの視点およびFOVを表す。ここで、FOV802は、表示枠に示されるコンテンツの部分を定め、806〜806は、表示枠に示されないコンテンツの部分を定める。更に、FOVは、中央FOV808および周辺FOV810に分割されている。FOVの中央部では、高品質コンテンツを表示するとしてもよく、一方周辺では、それよりも低い品質、例えば、標準的な品質が選択されてもよい。
円筒状2D投影の一例を以下の図9A〜図9Dおよび図10に示す。円筒状2D投影では、全方位コンテンツは、正距円筒投影および円形投影の組み合わせとして、ビット・ストリームで表される。
図9A〜図9Dにおける異なるタイリング表現は、異なるビデオ品質に関係付けてもよい。タイリング表現は、図9Aに表すような非タイル状低解像度ビデオ表現、および図9Bに表すようなタイル状高解像度表現を含んでもよい。高解像度表現は、FOVの中央部にコンテンツを表示するために使用されるとしてもよい。全方位コンテンツをユーザに供給する(serve)ために、クライアント・デバイスは、パノラマ・ビュー全体を覆うために最低解像度レイヤの単一タイルを要求し、更にFOVの中央部に対して最高解像度レイヤのタイル3を要求することができる。更に、周辺FOVに対して、多数の中解像度型タイルを使用してもよい。例えば、水平タイル状中解像度レイヤ(図9C)のタイル5および13、ならびに垂直タイル状中解像度レイヤ(図9D)のタイル4、7、および17である。
結果的に得られたFOVを図10に示す。図10は、本発明の実施形態によるタイル状全方位ビデオを構成する(comprise)ビデオ・フレームを表す。図6を参照して説明した正距円筒投影と同様、FOVの中央部は、高品質コンテンツに基づいて実現され、品質はFOVの境界の方向に低下する。また、この場合、境界においてタイルの解像度が急激に変化することが知覚される影響を最小限に抑えるために、高い方の解像度のタイルと低い方の解像度のタイルとの間の境界において、スムージングを実行することができる。
図10に示すタイルを選択および要求するためにクライアントによって使用することができるDASH MPDをテーブル2に示す。







このMPDでは、EssentialPropertyおよびSupplementalPropertyの値フィールドの2番目の場所において(source_idパラメータの後)、2つの追加のSRDパラメータが設けられる。第1のパラメータは、2D投影をクライアント・デバイスに通知するための"space"パラメータである。第2のパラメータは、特定の2D投影、この特定例では、円筒状2D投影に関連付けられ、円筒形の高さを特徴付ける。
例えば、spaceパラメータは、全方位ビデオが円筒状2D投影に基づくことをクライアント・デバイスに通知するためには値「1」を有するとしてもよい。値フィールドにおける後続のパラメータは、object_x、object_y、object_width、object_height、total_width、total_height、Spatial_set_idとすればよい(これらは、以上で説明したような新たな関数記述に基づいて再使用することができる標準的なSRDパラメータである)。
円筒形の高さを通知する必要はない。MPDにおいて円筒形の極および矩形部を示す方法から、余分な高さパラメータを必要とせずに、それらの形態(form)およびサイズを推論することが可能である。しかしながら、他の実施形態では、クライアント・デバイスに対して明示するために、円筒形の高さを通知してもよい。
以上の例では、SRDパラメータは、SupplementalPropertyまたはEssentialPropertyの値フィールドにおいて報告される。しかしながら、他の実施形態では、supplementalPropertyまたはEssentialPropertyあるいはそのサブエレメントにおいてであっても、これらのパラメータを別個のフィールドとして列挙してもよい。
更に他の実施形態では、矩形タイルの代わりに、他の形状、例えば、球形タイルを使用してもよい。球形タイルは、タイルのサイズを示すために1つのパラメータ、即ち、その半径だけを必要とする。
仮想現実にとって、レイテンシの短縮は非常に重要である。したがって、ある実施形態では、クライアント・デバイスの側におけるデータ処理、具体的には、クライアント・デバイスがFOVに合致する(match)タイルを選択しなければならないプロセスを削減することが望ましい場合がある。
したがって、代替手法は、更に一層レイテンシを削減する(save)ために、相応しいプロトコル、例えば、迅速UDPインターネット接続(QUIC:Quick UDP Internet Connections)プロトコルを使用して、サーバに、ユーザの視点およびFOVの詳細(視点のピッチおよびヨーならびにFOVのサイズ)だけをクライアントに送らせる手法である。サーバは、全方位コンテンツをタイル・ストリームに分割するために、タイリング方式、例えば、HEVCタイリング方式を使用してもよい。次いで、クライアントの要求時に、サーバは最も該当するタイルをクライアント・デバイスに送ることができる。
図11は、本発明の実施形態にしたがって空間タイル状全方位ビデオを処理するように構成された(adapt)ビデオ処理デバイスを表す。具体的には、図11は、タイル状および非タイル状全方位ビデオ・データを含むコンテンツを選択し検索するクライアント・デバイス1102、基準および改良(enhancement)タイル・ストリームのメディアをデコードする1つ以上のデコーダ1122、1124を含むメディア・エンジン1104、ならびにレンダリング・エンジン1106を含むビデオ処理デバイス1100を表す。レンダリング・エンジン1106は、このレンダリング・エンジンから発生するビデオ・フレームをバッファする1つ以上のビデオ・フレーム・バッファ、タイルのビデオ・フレームを空間的に配置し、ビデオ・フレームをスティッチして1つのビデオ・フレームにする画像プロセッサ1132、およびビデオ・フレームのビデオ・データを、コンテンツをユーザに表示するために使用される湾曲(例えば、球)面上に投影するように構成された3D投影モジュールを含む。3D投影モジュールは、マッピング情報に基づいて、ビデオ・フレームのビデオ・データを湾曲(例えば、球)面上に投影するように構成されてもよい。
図11に示すように、クライアント・デバイスは、1つ以上のマニフェスト・ファイル1108を受信し、このマニフェスト・ファイルをメモリに格納するように構成することができる。マニフェスト・ファイル・パーザ1110は、マニフェスト・ファイルを解析および分析し、タイル状全方位ビデオ、即ち、タイル・ストリームについての情報を、コンテンツ選択モジュール1118に提供することができる。コンテンツ選択モジュールは、ビデオ処理デバイスのユーザの視点についての情報を受け取るように構成することができる。視点は、視点エンジン1136によって継続的に更新され、クライアント・デバイスに供給することができる。
コンテンツ選択モジュールは、1つ以上のタイル・ストリームを選択するために、視点についての情報、即ち、視点の座標、および空間関係情報(例えば、マニフェスト・ファイルにおける空間関係記述子(SRD)に基づいて指定されるような)を使用することができる。
コンテンツ選択モジュールは、選択したタイル・ストリームについての情報、具体的には、選択したタイル・ストリームのURLを、コンテンツ検索モジュールに転送することができる。コンテンツ検索モジュールは、要求メッセージを1つ以上のネットワーク・ノードに送信し、要求したタイル・ストリームの一部を含む応答メッセージを受信するように構成することができる。実施形態では、クライアント・デバイスは、HTTP要求メッセージをHTTPメディア・サーバに送信するため、そして要求したメディア・ストリームのメディア・データを含むHTTP応答メッセージを受信するために、HTTPクライアントを含んでもよい。
更に、コンテンツ検索モジュールは、要求したメディア・データを受け取り、メディア・エンジン1104への入力のためのメディア・データを準備するために、1つ以上のバッファも含んでもよい。
図12は、本開示において説明したように使用することができる例証的なデータ処理システムを示すブロック図である。データ処理システム1200は、システム・バス1206を通じてメモリ・エレメント1204に結合された少なくとも1つのプロセッサ1202を含むことができる。したがって、データ処理システムはメモリ・エレメント1204内にプログラム・コードを格納することができる。更に、プロセッサ1202は、システム・バス1206を通じてメモリ・エレメント1204からアクセスされたプログラム・コードを実行することができる。一態様では、データ処理システムは、プログラム・コードを格納および/または実行するのに適したコンピュータとして実現することができる。しかしながら、データ処理システム1300は、プロセッサおよびメモリを含み、本明細書内において説明した機能を実行することができる任意のシステムの形態で実装すればよいことは認められてしかるべきである。
メモリ・エレメント1204は、例えば、ローカル・メモリ1208のような1つ以上の物理メモリ・デバイスと、1つ以上の大容量記憶デバイス1210とを含むことができる。ローカル・メモリとは、プログラム・コードの実際の実行中に通常使用されるランダム・アクセス・メモリまたは他の非永続的メモリ・デバイス(1つまたは複数)を指すことができる。大容量記憶デバイスは、ハード・ドライブまたは他の永続的データ記憶デバイスとして実装されればよい。また、処理システム1200は1つ以上のキャッシュ・メモリ(図示せず)も含むことができる。キャッシュ・メモリは、実行中にプログラム・コードを大容量記憶デバイス1210から検索しなければならない回数を減らすために、少なくとも一部のプログラム・コードの一時的格納に備える。
入力デバイス1212および出力デバイス1214として図示されている入力/出力(I/O)デバイスは、任意に、データ処理システムに結合することができる。入力デバイスの例には、例えば、ポジション・トラッカ(position tracker)、キーボード、マウスのようなポインティング・デバイス、タッチ・スクリーン等を含むことができるが、これらに限定されるのではない。出力デバイスの例には、例えば、モニタまたは(頭部装着式)ディスプレイ、スピーカ等を含むことができるが、これらに限定されるのではない。入力デバイスおよび/または出力デバイスは、直接または仲介するI/Oコントローラを介してデータ処理システムに結合することができる。また、ネットワーク・アダプタ1216をデータ処理システムに結合してもよく、他のシステム、コンピュータ・システム、リモート・ネットワーク・デバイス、および/またはリモート記憶デバイスに、仲介するプライベートまたはパブリック・ネットワークを通じてデータ処理システムを結合することが可能になる。ネットワーク・アダプタは、前記システム、デバイス、および/またはネットワークによって送信されるデータを受信するデータ受信機、およびデータを前記システム、デバイス、および/またはネットワークに送信するデータ送信機を含むことができる。モデム、ケーブル・モデム、およびイーサネット・カードは、データ処理システム1250と共に使用することができる異なる型式のネットワーク・アダプタの例である。
図12に図示するように、メモリ・エレメント1204はアプリケーション1218を格納することができる。尚、データ処理システム1200は、更に、アプリケーションの実行を容易にすることができるオペレーティング・システム(図示せず)を実行することもできることは認められてしかるべきである。実行可能プログラム・コードの形態で実現されるアプリケーションは、データ処理システム1200によって、例えば、プロセッサ1202によって実行することができる。アプリケーションを実行したことに応答して、データ処理システムは、本明細書において更に詳しく説明する1つ以上の動作を実行するように構成することができる。
一態様では、例えば、データ処理システム1200がクライアント・データ処理システムを表すこともできる。その場合、アプリケーション1218はクライアント・アプリケーションを表すことができ、クライアント・アプリケーションは、実行されると、「クライアント」を参照して本明細書において説明した種々の機能を実行するように、データ処理システム1300を構成する。クライアントの例には、パーソナル・コンピュータ、携帯用コンピュータ、移動体電話機等を含むことができるが、これらに限定されるのではない。
他の態様では、データ処理システムがサーバを表すこともできる。例えば、データ処理システムが(HTTP)サーバを表すのでもよく、その場合、アプリケーション1218は、実行されると、(HTTP)サーバ動作を実行するように、データ処理システムを構成することができる。他の態様では、データ処理システムが本明細書において言及したような、モジュール、ユニット、または機能を表すこともできる。
本明細書において使用した用語は、特定の実施形態を説明するために限られており、本発明の限定であることを意図するのではない。本明細書において使用する場合、単数形「a」、「an」、および「the」は、文脈が明らかにそうでないことを示すのでなければ、複数形も含むことを意図している。更に、「含む」(comprises)および/または「含んでいる」(comprising)という用語は、本明細書において使用する場合、述べられる特徴、整数、ステップ、動作、エレメント、および/またはコンポーネントの存在を指定するが、1つ以上の他の特徴、整数、ステップ、動作、エレメント、コンポーネント、および/またはそのグループの存在や追加を除外するのではないことも理解されよう。
以下の特許請求の範囲における全ての手段またはステップ+機能エレメントの対応する構造、材料、アクト、および均等物は、特定的に特許請求される他の特許請求対象エレメントと組み合わせて当該機能を実行する任意の構造、材料、またはアクトを含むことを意図している。本発明の説明は、例示および説明の目的に限って提示されたのであって、網羅的であること、または開示した形態に本発明を限定することを意図するのではない。本発明の範囲および主旨から逸脱することなく、当業者には多くの変更および変種が明白であろう。以上の実施形態が選択され説明されたのは、本発明の原理および実用的用途を最良に説明するためであり、更に他の当業者が、本発明を理解して、想定される特定の使用に適する種々の変更を行って種々の実施形態を得ることを可能にするためである。

Claims (15)

  1. クライアント・デバイスによって全方位ビデオを処理する方法であって、前記全方位ビデオが、湾曲面、好ましくは、球体上において該全方位ビデオのビデオ・データの空間位置を判定するための3D座標系に関連付けられており、当該方法が、
    好ましくは前記クライアント・デバイスによってマニフェスト・ファイルを受信するステップであって、前記マニフェスト・ファイルが、複数のタイル・ストリームを識別するための複数のタイル・ストリーム識別子を含み、前記タイル・ストリームが、2D投影ビデオ・データを有するビデオ・フレームを含み、前記ビデオ・フレームが画像表示枠を有し、これによって、異なるタイル・ストリームにおける前記ビデオ・フレームの画像表示枠が、前記全方位ビデオの2D投影の異なる領域を覆い、1つの領域が1つのタイルを定める、ステップと、
    好ましくは前記クライアント・デバイスによって、前記マニフェスト・ファイルにおける空間関係情報に基づいて、また、前記クライアント・デバイスのユーザの視点に基づいて、第1解像度および第1タイル位置に関連付けられた第1タイル・ストリームと、第2解像度および第2タイル位置に関連付けられた第2タイル・ストリームとを選択するステップであって、前記第2解像度が前記第1解像度よりも低く、前記空間関係情報が、タイル毎に、タイル位置を定め、前記視点が前記ユーザの目視方向を定め、前記タイル位置および前記視点が、前記3D座標系の座標に基づいて定められる、ステップと、
    を含む、方法。
  2. 請求項1記載の方法であって、更に、
    好ましくは前記クライアント・デバイスによって、1つ以上のタイル・ストリーム記憶デバイス、好ましくは1つ以上のネットワーク・ノードに、前記選択した1つ以上のタイル・ストリームを要求するステップと、
    前記1つ以上の選択したタイル・ストリームのビデオ・データを受信すると共にマッピング情報を受信するステップであって、好ましくは、前記マッピング情報の少なくとも一部が、前記マニフェスト・ファイルにおいて前記クライアント・デバイスに通知され、前記マッピング情報が、前記クライアント・デバイスが前記タイル・ストリームの2D投影ビデオ・データを、全方位ビデオ・データとして、前記湾曲面上にマッピングすることを可能にするための情報を、前記クライアント・デバイスに提供する、ステップと、
    前記空間関係情報および前記マッピング情報に基づいて、前記受信したタイル・ストリームのビデオ・データを処理するステップと、
    を含む、方法。
  3. 請求項2記載の方法において、前記マッピング情報が、前記全方位ビデオ・データを平坦面上に投影するために使用される2D投影の型式の指示を含み、更に、任意に、前記2D投影ビデオ・データを前記湾曲面上にマッピングするために必要とされる1つ以上のパラメータを含む、方法。
  4. 請求項1〜3のいずれか1項記載の方法において、前記視点が前記ユーザの視野に関連付けられ、好ましくは、前記視点が前記ユーザの視野の中心点を定め、前記選択するステップが、
    前記視野の中央部の少なくとも一部に位置するタイル位置に対して、高解像度のタイル・ストリームを選択するステップと、
    前記視野の周辺部の少なくとも一部に位置するタイル位置に対して、前記高解像度よりも低い解像度のタイル・ストリームを選択するステップと、
    を含む、方法。
  5. 請求項2〜4のいずれか1項記載の方法において、前記ビデオ・データを処理するステップが、更に、
    前記受信したタイル・ストリームのビデオ・データを、タイルを表すビデオ・フレームにデコードするステップと、
    1つの時間インスタンスに関連付けられた前記タイルのビデオ・フレームを空間的に配置し、前記ビデオ・フレームをスティッチして1つのビデオ・フレームにするステップと、
    前記マッピング情報に基づいて、前記ビデオ・フレームの2D投影ビデオ・データを、全方位ビデオ・データとして、前記湾曲面上にマッピングするステップと、
    を含む、方法。
  6. 請求項2〜5のいずれか1項記載の方法において、前記選択した1つ以上のタイル・ストリームの前記要求および受信が、HTTP適応ストリーミング・プロトコル、好ましくは、MPEG DASHストリーミング・プロトコルまたはその派生物に基づく、方法。
  7. 請求項1〜6のいずれか1項記載の方法において、前記マニフェスト・ファイルが、更に、タイル・ストリームの1つ以上の表現を定め、好ましくは、前記1つ以上の表現が、1つ以上の解像度表現および/または1つ以上のタイリング表現を含む、方法。
  8. 請求項1〜7のいずれか1項記載の方法において、前記マニフェスト・ファイルが、1つ以上の空間関係記述子(SRD)を含み、空間関係記述子が、前記3D座標系の座標に基づいて前記タイルのタイル位置および寸法を定めるための1つ以上のSRDパラメータを含む、方法。
  9. 請求項8記載の方法において、前記1つ以上の空間関係記述子(SRD)が、更に、前記全方位ビデオ・データを平坦面上に投影するために使用される2D投影の型式を通知するための1つ以上のSRDパラメータを含み、好ましくは、前記2D投影の型式が、正距円筒投影、立体投影、円筒投影、若しくは派生物、および/またはこれらの組み合わせの内の1つを含む、方法。
  10. 全方位ビデオを処理するためのクライアント・デバイスであって、前記全方位ビデオが、湾曲面上に前記全方位ビデオのビデオ・データの空間位置を決定するための3D座標系に関連付けられており、前記クライアント・デバイスが、
    プログラムの少なくとも一部が組み込まれたコンピュータ読み取り可能記憶媒体であって、マニフェスト・ファイルを含む、コンピュータ読み取り可能記憶媒体と、
    コンピュータ読み取り可能プログラム・コードが組み込まれたコンピュータ読み取り可能記憶媒体と、
    前記コンピュータ読み取り可能記憶媒体に結合されたプロセッサ、好ましくは、マイクロプロセッサと、
    を含み、前記コンピュータ読み取り可能プログラム・コードの実行に応答して、前記プロセッサが、
    マニフェスト・ファイルを受信する動作であって、前記マニフェスト・ファイルが、複数のタイル・ストリームを識別するための複数のタイル・ストリーム識別子を含み、前記タイル・ストリームが、2D投影ビデオ・データを有するビデオ・フレームを含み、前記ビデオ・フレームが画像表示枠を有し、これによって、異なるタイル・ストリームにおける前記ビデオ・フレームの画像表示枠が、前記全方位ビデオの2D投影の異なる領域を覆い、1つの領域が1つのタイルを定める、動作と、
    前記マニフェスト・ファイルにおける空間関係情報に基づいて、また、前記クライアント・デバイスのユーザの視点に基づいて、第1解像度および第1タイル位置に関連付けられた第1タイル・ストリームと、第2解像度および第2タイル位置に関連付けられた第2タイル・ストリームとを選択する動作であって、前記第2解像度が前記第1解像度よりも低く、前記空間関係情報がタイル毎にタイル位置を定め、前記視点が前記ユーザの目視方向を定め、前記タイル位置および前記視点が、前記3D座標系の座標に基づいて定められる、動作と、
    を含む実行可能動作を実行するように構成される、クライアント・デバイス。
  11. 請求項10記載のクライアント・デバイスにおいて、前記実行可能動作が、更に、
    1つ以上のタイル・ストリーム記憶デバイス、好ましくは1つ以上のネットワーク・ノードに、前記選択した1つ以上のタイル・ストリームを要求する動作と、
    前記1つ以上の選択したタイル・ストリームのビデオ・データを受信すると共に、マッピング情報を受信する動作であって、好ましくは、前記マッピング情報の少なくとも一部が、前記マニフェスト・ファイルにおいて前記クライアント・デバイスに通知され、前記マッピング情報が、前記クライアント・デバイスが前記タイル・ストリームの2D投影ビデオ・データを、全方位ビデオ・データとして、前記湾曲面上にマッピングすることを可能にするための情報を、前記クライアント・デバイスに提供する、動作と、
    前記空間関係情報および前記マッピング情報に基づいて、前記受信したタイル・ストリームのビデオ・データを処理する動作と、
    を含む、クライアント・デバイス。
  12. 請求項10または11記載のクライアント・デバイスにおいて、前記マニフェスト・ファイルが、1つ以上の空間関係記述子(SRD)を含み、空間関係記述子が、前記3D座標系の座標に基づいて前記タイルのタイル位置および寸法を定めるための1つ以上のSRDパラメータを含み、任意に、前記1つ以上の空間関係記述子が、更に、前記全方位ビデオ・データを平坦面上に投影するために使用される2D投影の型式を通知するための1つ以上のSRDパラメータを含み、好ましくは、前記2D投影の型式が、正距円筒投影、立体投影、円筒投影、若しくは派生物、および/またはこれらの組み合わせの内の1つを含む、クライアント・デバイス。
  13. クライアント・デバイスのためにマニフェスト・ファイルを格納するための非一時的コンピュータ読み取り可能記憶媒体であって、前記クライアント・デバイスが、前記マニフェスト・ファイルに基づいて全方位ビデオを処理するように構成され、前記全方位ビデオが、湾曲面、好ましくは球面上に前記全方位ビデオのビデオ・データの空間位置を決定するための3D座標系に関連付けられており、前記マニフェスト・ファイルがコンピュータ読み取り可能データを含み、前記データが、
    複数のタイル・ストリームを識別するための複数のタイル・ストリーム識別子であって、前記タイル・ストリームが、2D投影ビデオ・データを有するビデオ・フレームを含み、前記ビデオ・フレームが画像表示枠を有し、これによって、異なるタイル・ストリームにおける前記ビデオ・フレームの画像表示枠が、前記全方位ビデオの2D投影の異なる領域を覆い、1つの領域が1つのタイルを定める、複数のタイル・ストリーム識別子と、
    空間関係情報であって、タイル毎にタイル位置を定め、前記タイル位置および前記視点が、前記3D座標系の座標に基づいて定められる、空間関係情報と、
    前記クライアント・デバイスが、前記マニフェスト・ファイルにおいて全方位ビデオ・データとして識別された前記タイル・ストリームの2D投影ビデオ・データを、前記湾曲面上にマッピングすることを可能にするための情報を、前記クライアント・デバイスに提供するためのマッピング情報と、
    を含む、非一時的コンピュータ読み取り可能記憶媒体。
  14. 請求項13記載の非一時的コンピュータ読み取り可能記憶媒体において、前記コンピュータ読み取り可能データが、更に、
    1つ以上の空間関係記述子(SRD)であって、空間関係記述子が、前記3D座標系の座標に基づいて前記タイルのタイル位置および寸法を定めるための1つ以上のSRDパラメータを含む、1つ以上の空間関係記述子(SRD)、および/または
    前記全方位ビデオ・データを平坦面上に投影するために使用される2D投影の型式を通知するための1つ以上のSRDパラメータであって、好ましくは、前記2D投影の型式が、正距円筒投影、立体投影、円筒投影またはこれらの組み合わせの内の1つを含む、1つ以上のSRDパラメータ、
    を含む、非一時的コンピュータ読み取り可能記憶媒体。
  15. ソフトウェア・コード部分を含むコンピュータ・プログラム製品であって、前記ソフトウェア・コード部分が、コンピュータのメモリ内で実行されると、請求項1〜9のいずれか1項記載の方法ステップを実行するように構成される、コンピュータ・プログラム製品。
JP2018562052A 2016-05-25 2017-05-24 空間的にタイリングされた全方位ビデオのストリーミング Active JP7022077B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP16001189.6 2016-05-25
EP16001189 2016-05-25
EP16172029 2016-05-30
EP16172029.7 2016-05-30
PCT/EP2017/062517 WO2017202899A1 (en) 2016-05-25 2017-05-24 Spatially tiled omnidirectional video streaming

Publications (2)

Publication Number Publication Date
JP2019526178A true JP2019526178A (ja) 2019-09-12
JP7022077B2 JP7022077B2 (ja) 2022-02-17

Family

ID=58994908

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018562052A Active JP7022077B2 (ja) 2016-05-25 2017-05-24 空間的にタイリングされた全方位ビデオのストリーミング

Country Status (5)

Country Link
US (1) US11284124B2 (ja)
EP (1) EP3466083B1 (ja)
JP (1) JP7022077B2 (ja)
CN (1) CN109565610B (ja)
WO (1) WO2017202899A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024024472A1 (ja) * 2022-07-28 2024-02-01 ソニーグループ株式会社 情報処理装置および方法

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109792563B (zh) 2016-10-12 2022-01-25 皇家Kpn公司 基于感兴趣区域处理球面视频数据
US11290699B2 (en) * 2016-12-19 2022-03-29 Dolby Laboratories Licensing Corporation View direction based multilevel low bandwidth techniques to support individual user experiences of omnidirectional video
US10742999B2 (en) * 2017-01-06 2020-08-11 Mediatek Inc. Methods and apparatus for signaling viewports and regions of interest
CN108632674B (zh) * 2017-03-23 2021-09-21 华为技术有限公司 一种全景视频的播放方法和客户端
US20180310040A1 (en) * 2017-04-21 2018-10-25 Nokia Technologies Oy Method and apparatus for view dependent delivery of tile-based video content
GB2563387B (en) * 2017-06-09 2020-04-15 Sony Interactive Entertainment Inc Image processing device and system
US10818087B2 (en) * 2017-10-02 2020-10-27 At&T Intellectual Property I, L.P. Selective streaming of immersive video based on field-of-view prediction
US11025919B2 (en) 2017-10-03 2021-06-01 Koninklijke Kpn N.V. Client-based adaptive streaming of nonlinear media
EP3721636A1 (en) * 2017-12-07 2020-10-14 Koninklijke KPN N.V. Method for adaptive streaming of media
JPWO2019139099A1 (ja) * 2018-01-12 2020-12-24 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
GB2570298A (en) * 2018-01-17 2019-07-24 Nokia Technologies Oy Providing virtual content based on user context
JP7059662B2 (ja) * 2018-02-02 2022-04-26 トヨタ自動車株式会社 遠隔操作システム、及びその通信方法
JP7073128B2 (ja) * 2018-02-08 2022-05-23 キヤノン株式会社 通信装置、通信方法、及びプログラム
EP3531703A1 (en) 2018-02-26 2019-08-28 Thomson Licensing Method and network equipment for encoding an immersive video spatially tiled with a set of tiles
CN108520492B (zh) * 2018-03-16 2022-04-26 中国传媒大学 全景视频映射方法及系统
JP6859286B2 (ja) * 2018-03-26 2021-04-14 Kddi株式会社 Vr映像配信装置および方法、vr映像再生装置および方法ならびにvr映像システム
CN110519652B (zh) 2018-05-22 2021-05-18 华为软件技术有限公司 Vr视频播放方法、终端及服务器
US10764494B2 (en) 2018-05-25 2020-09-01 Microsoft Technology Licensing, Llc Adaptive panoramic video streaming using composite pictures
US10666863B2 (en) * 2018-05-25 2020-05-26 Microsoft Technology Licensing, Llc Adaptive panoramic video streaming using overlapping partitioned sections
US10623736B2 (en) * 2018-06-14 2020-04-14 Telefonaktiebolaget Lm Ericsson (Publ) Tile selection and bandwidth optimization for providing 360° immersive video
JP2020005038A (ja) * 2018-06-25 2020-01-09 キヤノン株式会社 送信装置、送信方法、受信装置、受信方法、及び、プログラム
EP3588965A1 (en) * 2018-06-28 2020-01-01 InterDigital CE Patent Holdings Method configured to be implemented at a terminal adapted to receive an immersive video spatially tiled with a set of tiles, and corresponding terminal
US11558708B2 (en) * 2018-07-13 2023-01-17 Nokia Technologies Oy Multi-viewpoint multi-user audio user experience
US11962819B2 (en) * 2018-07-17 2024-04-16 Dolby Laboratories Licensing Corporation Foviation and HDR
WO2020033455A1 (en) * 2018-08-07 2020-02-13 Core Omnidirectional video streaming
JP2020042064A (ja) * 2018-09-06 2020-03-19 キヤノン株式会社 表示制御装置、撮像装置、制御方法、プログラム、及び、記憶媒体
US11323754B2 (en) * 2018-11-20 2022-05-03 At&T Intellectual Property I, L.P. Methods, devices, and systems for updating streaming panoramic video content due to a change in user viewpoint
US11438731B2 (en) 2019-03-19 2022-09-06 Nokia Technologies Oy Method and apparatus for incorporating location awareness in media content
EP3949422A1 (en) 2019-03-26 2022-02-09 PCMS Holdings, Inc. System and method for multiplexed rendering of light fields
EP3761647A1 (en) * 2019-07-05 2021-01-06 Tiledmedia B.V. Methods and devices for rendering a video on a display
US20220264080A1 (en) * 2019-07-23 2022-08-18 Pcms Holdings, Inc. System and method for adaptive lenslet light field transmission and rendering
US11481026B2 (en) 2019-08-22 2022-10-25 Samsung Electronics Co., Ltd. Immersive device and method for streaming of immersive media
CN110544316B (zh) * 2019-09-06 2023-12-01 北京奇艺世纪科技有限公司 一种虚拟现实回放方法、系统、设备及存储介质
CN110636294B (zh) * 2019-09-27 2024-04-09 腾讯科技(深圳)有限公司 视频解码方法及装置,视频编码方法及装置
CN111083523A (zh) * 2019-12-04 2020-04-28 聚好看科技股份有限公司 一种全景视频播放的方法及终端
US20210383590A1 (en) * 2020-05-27 2021-12-09 Nokia Technologies Oy Offset Texture Layers for Encoding and Signaling Reflection and Refraction for Immersive Video and Related Methods for Multi-Layer Volumetric Video
CN113766271B (zh) * 2020-06-04 2022-07-12 腾讯科技(深圳)有限公司 一种沉浸媒体的数据处理方法、装置及设备
CN112163990B (zh) * 2020-09-08 2022-10-25 上海交通大学 360度图像的显著性预测方法及系统
CN112788317A (zh) * 2020-12-30 2021-05-11 惠州Tcl移动通信有限公司 一种播放全景视频的方法、系统、存储介质及播放设备
US11568574B1 (en) 2021-08-18 2023-01-31 Varjo Technologies Oy Foveation-based image encoding and decoding
CN117255233A (zh) * 2022-06-10 2023-12-19 中兴通讯股份有限公司 媒体信息处理方法、媒体信息播放方法、装置及存储介质
EP4391550A1 (en) * 2022-12-23 2024-06-26 Koninklijke KPN N.V. Processing content for extended reality applications
CN116431875B (zh) * 2023-06-12 2023-09-08 厦门精图信息技术有限公司 一种大数据可视化分析展示系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015008774A1 (ja) * 2013-07-19 2015-01-22 ソニー株式会社 情報処理装置および方法
WO2015060165A1 (ja) * 2013-10-22 2015-04-30 シャープ株式会社 表示処理装置、配信装置、および、メタデータ
WO2015197815A1 (en) * 2014-06-27 2015-12-30 Koninklijke Kpn N.V. Determining a region of interest on the basis of a hevc-tiled video stream

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100390666C (zh) 2004-12-17 2008-05-28 上海杰图软件技术有限公司 基于圆鱼眼或鼓形图像快速生成高清晰度全景的智能化方法
CN101146231A (zh) * 2007-07-03 2008-03-19 浙江大学 根据多视角视频流生成全景视频的方法
US9232257B2 (en) * 2010-09-22 2016-01-05 Thomson Licensing Method for navigation in a panoramic scene
JP2013101525A (ja) 2011-11-09 2013-05-23 Sony Corp 画像処理装置および方法、並びにプログラム
FR2988964A1 (fr) * 2012-03-30 2013-10-04 France Telecom Technique de distribution d'un contenu video de type immersif
KR101888081B1 (ko) * 2012-05-24 2018-08-13 엘지전자 주식회사 영상 투사 모듈, 이를 구비하는 이동 단말기, 및 그 동작방법
CN103945103B (zh) * 2013-01-17 2017-05-24 成都国翼电子技术有限公司 基于柱面的多平面二次投影消除全景摄像机图像畸变的方法
CN103973944A (zh) * 2013-02-06 2014-08-06 深圳市振华微电子有限公司 半球型全景成像装置及方法
JP2016521485A (ja) * 2013-04-08 2016-07-21 トムソン ライセンシングThomson Licensing 少なくとも1つのサーバによって送信されたマニフェストを適応化するための装置および方法
US10229477B2 (en) * 2013-04-30 2019-03-12 Sony Corporation Image processing device, image processing method, and program
CN103295231A (zh) 2013-05-14 2013-09-11 杭州海康希牧智能科技有限公司 一种鱼眼图像拼接中鱼眼镜头垂直映射图像几何校正方法
EP3562170A1 (en) 2013-07-29 2019-10-30 Koninklijke KPN N.V. Providing tile video streams to a client
CN103543831A (zh) 2013-10-25 2014-01-29 梁权富 头戴式全景播放装置
US10694192B2 (en) * 2014-06-27 2020-06-23 Koninklijke Kpn N.V. HEVC-tiled video streaming
US10204658B2 (en) * 2014-07-14 2019-02-12 Sony Interactive Entertainment Inc. System and method for use in playing back panorama video content
US20160277772A1 (en) * 2014-09-30 2016-09-22 Telefonaktiebolaget L M Ericsson (Publ) Reduced bit rate immersive video
GB2531993B (en) * 2014-10-14 2018-04-25 Canon Kk Description of image composition with HEVC still image file format
US20160353146A1 (en) 2015-05-27 2016-12-01 Google Inc. Method and apparatus to reduce spherical video bandwidth to user headset
CN105100759B (zh) 2015-08-11 2017-07-07 润佳华晟投资集团有限公司 一种屏幕投影系统、方法及装置
US10360721B2 (en) 2016-05-26 2019-07-23 Mediatek Inc. Method and apparatus for signaling region of interests
CN109792563B (zh) 2016-10-12 2022-01-25 皇家Kpn公司 基于感兴趣区域处理球面视频数据

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015008774A1 (ja) * 2013-07-19 2015-01-22 ソニー株式会社 情報処理装置および方法
WO2015060165A1 (ja) * 2013-10-22 2015-04-30 シャープ株式会社 表示処理装置、配信装置、および、メタデータ
WO2015197815A1 (en) * 2014-06-27 2015-12-30 Koninklijke Kpn N.V. Determining a region of interest on the basis of a hevc-tiled video stream

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024024472A1 (ja) * 2022-07-28 2024-02-01 ソニーグループ株式会社 情報処理装置および方法

Also Published As

Publication number Publication date
EP3466083A1 (en) 2019-04-10
CN109565610B (zh) 2021-03-30
WO2017202899A1 (en) 2017-11-30
EP3466083B1 (en) 2020-09-16
JP7022077B2 (ja) 2022-02-17
US11284124B2 (en) 2022-03-22
US20190174150A1 (en) 2019-06-06
CN109565610A (zh) 2019-04-02

Similar Documents

Publication Publication Date Title
JP7022077B2 (ja) 空間的にタイリングされた全方位ビデオのストリーミング
US10805614B2 (en) Processing spherical video data on the basis of a region of interest
US11200700B2 (en) Methods and apparatus for signaling viewports and regions of interest for point cloud multimedia data
US10742999B2 (en) Methods and apparatus for signaling viewports and regions of interest
JP6979035B2 (ja) 仮想現実メディアコンテンツのストリーミングを向上させる方法、デバイス及びコンピュータプログラム
JP6501904B2 (ja) 球面ビデオのストリーミング
CN112204993B (zh) 使用重叠的被分区的分段的自适应全景视频流式传输
KR102371099B1 (ko) 광시야 비디오를 인코딩하기 위한 구면 회전 기법
JP7058273B2 (ja) 情報処理方法および装置
JP2021048649A (ja) パノラマビデオのための提案されるビューポート指示
US20190387212A1 (en) 360 video processing method and apparatus therefor
WO2019202207A1 (en) Processing video patches for three-dimensional content
KR20190140903A (ko) 퀄리티 기반 360도 비디오를 송수신하는 방법 및 그 장치
JP2020529149A (ja) イメージ処理方法、端末およびサーバ
US11115451B2 (en) Methods and apparatus for signaling viewports and regions of interest
US11270413B2 (en) Playback apparatus and method, and generation apparatus and method
CN114095737B (zh) 媒体文件封装及解封装方法、装置、设备及存储介质
US20240015197A1 (en) Method, apparatus and device for encapsulating media file, and storage medium
US20200382758A1 (en) Method for transmitting region-based 360-degree video, method for receiving region-based 360-degree video, region-based 360-degree video transmission device, and region-based 360-degree video reception device
JP2022541908A (ja) ボリュメトリックビデオコンテンツを配信するための方法および装置
CN116848840A (zh) 多视图视频流式传输

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190123

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210915

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220204

R150 Certificate of patent or registration of utility model

Ref document number: 7022077

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150