JP2023504797A - 映像符号化および映像復号のための方法、装置およびコンピュータプログラム - Google Patents

映像符号化および映像復号のための方法、装置およびコンピュータプログラム Download PDF

Info

Publication number
JP2023504797A
JP2023504797A JP2022531438A JP2022531438A JP2023504797A JP 2023504797 A JP2023504797 A JP 2023504797A JP 2022531438 A JP2022531438 A JP 2022531438A JP 2022531438 A JP2022531438 A JP 2022531438A JP 2023504797 A JP2023504797 A JP 2023504797A
Authority
JP
Japan
Prior art keywords
viewport
presentation
controllable
options
receiving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022531438A
Other languages
English (en)
Other versions
JP7397985B2 (ja
Inventor
サバ アーサン
イゴール クルチオ
Original Assignee
ノキア テクノロジーズ オサケユイチア
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ノキア テクノロジーズ オサケユイチア filed Critical ノキア テクノロジーズ オサケユイチア
Publication of JP2023504797A publication Critical patent/JP2023504797A/ja
Application granted granted Critical
Publication of JP7397985B2 publication Critical patent/JP7397985B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/21805Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440245Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4728End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/698Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

実施形態は、方法であって、全方位ビジュアルメディアコンテンツを含むプレゼンテーションを定義するビットストリームを生成すること(710)、プレゼンテーションを見るためのビューポート制御オプションであり、受信デバイスによって制御可能なオプションと受信デバイスによって制御不能なオプションとを含む、ビューポート制御オプションを指示するパラメータをビットストリームに符号化し、ビットストリームをレシーバデバイスに送信すること(720)、指示されたビューポート制御オプションのうちの1つをレシーバデバイスから応答として受信すること(730)、プレゼンテーションをレシーバデバイスにストリーミングすること(740)を含み、応答が、受信デバイスによって制御可能なビューポート制御に関する指示を含んでいたときに、この方法は、プレゼンテーションのストリーミング中に、ビューポート定義に関する情報をレシーバデバイスから受信し、それに従ってプレゼンテーションを適合させること(750)も含み、応答が、受信デバイスによって制御不能なビューポート制御に関する指示を含んでいたときに、プレゼンテーションは、応答の中に指定されたビューポート制御に従ってレシーバデバイスにストリーミングされる(750)、方法に関する。

Description

本解決策は一般に、映像符号化および/または送信ならびに映像復号および/または受信に関する。
画像および映像(video)を取り込むことができるデバイスは、限られた視野角(angular field of view)を取り込むデバイスから、360度コンテンツ(content)を取り込むデバイスへと進化した。これらのデバイスは、デバイスの周囲全体のビジュアルおよび音声コンテンツを取り込むことができる。すなわち、これらのデバイスは全視野角を取り込むことができる。全視野角は360度視野と呼ばれることがある。より正確には、これらのデバイスは球形視野(すなわち全ての空間方向に360度の視野)を取り込むことができる。新しいタイプの画像/映像取込みデバイスに加えて、ヘッドマウントディスプレイ(head-mounted display)などの新しいタイプの出力技術も発明され生産されている。これらのデバイスは、人が、自身の周囲全体のビジュアルコンテンツを見ることを可能にし、360度カメラによって取り込まれたシーンの中に「没入した」感覚を与える。視野が球形である新しい取込みおよび表示パラダイムは一般的に仮想現実(VR)と呼ばれ、将来的に人々がメディアコンテンツを体験する一般的な手法であると信じられている。
本発明のさまざまな実施形態に対して追求される保護の範囲は、独立請求項によって示されている。本明細書に記載されているが、独立請求項の範囲には含まれていない実施形態および特徴がある場合、それらは、本発明のさまざまな実施形態を理解するのに役立つ例であると解釈すべきである。
さまざまな態様は、独立請求項に記載されている内容を特徴とする方法、装置、およびその中に記憶されたコンピュータプログラムを含むコンピュータ可読メディアを含む。従属請求項にはさまざまな実施形態が開示されている。
第1の態様によれば、方法であって、全方位ビジュアルメディアコンテンツを含むプレゼンテーションを定義するビットストリームを生成すること、プレゼンテーションを見るためのビューポート(viewport)制御オプションであり、受信デバイスによって制御可能なオプションと受信デバイスによって制御不能なオプションとを含む、ビューポート制御オプションを指示するパラメータをビットストリームに符号化し、ビットストリームをレシーバ(receiver)デバイスに送信すること、指示されたビューポート制御オプションのうちの1つをレシーバデバイスから応答として受信すること、プレゼンテーションをレシーバデバイスにストリーミングすることを含む、方法を提供し、応答が、受信デバイスによって制御可能なビューポート制御に関する指示を含んでいたときに、この方法は、プレゼンテーションのストリーミング中に、ビューポート定義に関する情報をレシーバデバイスから受信し、それに従ってプレゼンテーションを適合させることも含み、応答が、受信デバイスによって制御不能なビューポート制御に関する指示を含んでいたときに、プレゼンテーションは、応答の中に指定されたビューポート制御に従ってレシーバデバイスにストリーミングされる。
第2の態様によれば、装置であって、全方位ビジュアルメディアコンテンツを含むプレゼンテーションを定義するビットストリームを生成する手段と、プレゼンテーションを見るためのビューポート制御オプションであり、受信デバイスによって制御可能なオプションと受信デバイスによって制御不能なオプションとを含む、ビューポート制御オプションを指示するパラメータをビットストリームに符号化する手段、およびビットストリームをレシーバデバイスに送信する手段と、指示されたビューポート制御オプションのうちの1つをレシーバデバイスから応答として受信する手段と、プレゼンテーションをレシーバデバイスにストリーミングする手段とを備える、装置が提供され、応答が、レシーバデバイスによって制御可能なビューポート制御に関する指示を含んでいたときに、この装置はさらに、プレゼンテーションのストリーミング中に、ビューポート定義に関する情報をレシーバデバイスから受信する手段、およびそれに従ってプレゼンテーションを適合させる手段も備え、応答が、受信デバイスによって制御不能なビューポート制御に関する指示を含んでいたときに、この装置は、プレゼンテーションを、応答の中に指定されたビューポート制御に従ってレシーバデバイスにストリーミングする手段を備える。
第3の態様によれば、装置であって、少なくとも1つのプロセッサと、コンピュータプログラムコードを含むメモリとを備える、装置が提供され、メモリおよびコンピュータプログラムコードは、この少なくとも1つのプロセッサを用いて、少なくとも、
- 全方位ビジュアルメディアコンテンツを含むプレゼンテーションを定義するビットストリームを生成すること、
- プレゼンテーションを見るためのビューポート制御オプションであり、受信デバイスによって制御可能なオプションと受信デバイスによって制御不能なオプションとを含む、ビューポート制御オプションを指示するパラメータをビットストリームに符号化し、ビットストリームをレシーバデバイスに送信すること、
- 指示されたビューポート制御オプションのうちの1つをレシーバデバイスから応答として受信すること、
- プレゼンテーションをレシーバデバイスにストリーミングすること
を装置に実行させるように構成されており、
- 応答が、受信デバイスによって制御可能なビューポート制御に関する指示を含んでいたときに、コンピュータプログラム製品は、装置またはシステムに、プレゼンテーションのストリーミング中に、ビューポート定義に関する情報をレシーバデバイスから受信し、それに従ってプレゼンテーションを適合させるためのコンピュータプログラムコードを含み、
- 応答が、受信デバイスによって制御不能なビューポート制御に関する指示を含んでいたときに、コンピュータプログラム製品は、装置またはシステムに、プレゼンテーションを応答の中に指定されたビューポート制御に従ってレシーバデバイスにストリーミングさせるためのコンピュータプログラムコードを含む。
第4の態様によれば、コンピュータプログラム製品であって、少なくとも1つのプロセッサ上で実行されるときに、装置またはシステムに、全方位ビジュアルメディアコンテンツを含むプレゼンテーションを定義するビットストリームを生成させ、プレゼンテーションを見るためのビューポート制御オプションであり、受信デバイスによって制御可能なオプションと受信デバイスによって制御不能なオプションとを含む、ビューポート制御オプションを指示するパラメータをビットストリームに符号化し、ビットストリームをレシーバデバイスに送信させ、指示されたビューポート制御オプションのうちの1つをレシーバデバイスから応答として受信させ、プレゼンテーションをレシーバデバイスにストリーミングさせるように構成されたコンピュータプログラムコードを含み、応答が、受信デバイスによって制御可能なビューポート制御に関する指示を含んでいるときに、このコンピュータプログラム製品は、装置またはシステムに、プレゼンテーションのストリーミング中に、ビューポート定義に関する情報をレシーバデバイスから受信し、それに従ってプレゼンテーションを適合させるためのコンピュータプログラムコードを含み、応答が、受信デバイスによって制御不能なビューポート制御に関する指示を含んでいるときに、このコンピュータプログラム製品は、装置またはシステムに、プレゼンテーションを、応答の中に指定されたビューポート制御に従ってレシーバデバイスにストリーミングさせるためのコンピュータプログラムコードを含む。
ある実施形態によれば、受信デバイスによって制御可能なビューポート制御オプションは、ビューポートを、受信デバイスによって、3自由度まで、または6自由度まで、拘束された空間(constrained space)内もしくは拘束のない空間(unconstrained space)内で制御することを含む。
ある実施形態によれば、受信デバイスによって制御不能なビューポート制御オプションは、推奨ビューポートまたはプレゼンタ(presenter)ビューポートに基づくビューポート制御を含む。
ある実施形態によれば、全方位ビジュアルメディアコンテンツがネットワークを介して受信される。
ある実施形態によれば、全方位ビジュアルメディアが取り込まれる。
ある実施形態によれば、音声が受信デバイスから受信される。
以下では、添付図面を参照して、さまざまな実施形態をより詳細に説明する。
OMAFエンドツーエンドシステムの一例を示す図である。 参加者を含む会議室の例を示す図である。 遠隔会議構成の一例を示す図である。 遠隔会議のさまざまなフェーズの一例を示す図である。 360度ビデオ推奨ビューポートのシーケンスとして形成された2D映像がレシーバデバイスによってリクエストされている、シグナリングフローの一例を示す図である。 没入型のコンテンツがレシーバデバイスによってリクエストされている、シグナリングフローの一例を示す図である。 ある実施形態による方法を例示する流れ図である。 ある実施形態による装置を示す図である。
以下では、いくつかの実施形態を仮想現実(VR)の文脈で説明する。VRコンテンツの消費(consumption)は没入型である。VRコンテンツから生じていないコンテンツもしくは情報を見ること、またはそれと対話することをVRユーザに要求する多くの状況がある。本実施形態は、ネットワークを介して没入型のコンテンツが送信されているときに、デバイス上でそのコンテンツ消費を可能にする。本実施形態は360度VR会議に適用可能である。しかしながら、本発明はVR会議に限定されないことに留意すべきである。実際、さまざまな実施形態が、VR映像ストリーミングが実行される任意の環境で有用である。
写真撮影および映画撮影が始まって以降、最も一般的なタイプの画像および映像コンテンツは、比較的狭い視野を有するカメラによって取り込まれ、長方形のシーンとしてフラットディスプレイ上に表示されている。本出願では、そのようなコンテンツは「フラットコンテンツ」または「フラット画像」または「フラット映像」と呼ばれる。カメラは主として指向性であり、それによって、カメラは、限られた視野角(カメラが向けられた視野)だけを取り込む。そのようなフラット映像は、2次元コンテンツを表示することができるディスプレイデバイスによって出力される。
より最近には、新たな画像および映像取込みデバイスが使用可能になった。これらのデバイスは、デバイスの周囲全体のビジュアルおよび音声コンテンツを取り込むことができる。すなわち、これらのデバイスは全視野角を取り込むことができ、時に360度視野と呼ばれる。より正確には、これらのデバイスは球形視野(すなわち全ての空間方向に360度の視野)を取り込むことができる。さらに、ヘッドマウントディスプレイおよび他のデバイスなどの新しいタイプの出力デバイスは、人が、360度ビジュアルコンテンツを見ることを可能にする。
使用可能なメディアファイル形式規格には、国際標準化機構(ISO)ベースメディアファイル形式(ISO/IEC 14496-12。これはISOBMFFと略されることがある)、ムービングピクチャーエクスパーツグループ(MPEG)-4ファイル形式(ISO/IEC 14496-14。MP4形式としても知られている)、NAL(Network Abstraction Layer(ネットワーク抽象化層))ユニット構造化映像(unit structured video)のためのファイル形式(ISO/IEC 14496-15)、および高効率映像符号化(High Efficiency Video Coding)規格(HEVCまたはH.265/HEVC)が挙げられる。
ISOBMFFの一部の概念、構造および仕様が、それに基づいて実施形態を実施することができるコンテナファイル形式の一例として下に説明される。本発明の態様はISOBMFFに限定されず、むしろ、その上で本発明を部分的にまたは完全に実現することができる1つの可能なベースに対する説明が与えられる。
高効率画像ファイル形式(High Efficency Image File Format)(HEIF)は、画像および画像シーケンスの記憶のために、ムービングピクチャーエクスパーツグループ(MPEG)によって開発された規格である。とりわけ、この規格は、高効率映像符号化(HEVC)規格に従って符号化されたデータのファイルカプセル化を容易にする。HEIFは、使用されたISOベースメディアファイル形式(ISOBMFF)の上に構築される特徴を含む。
ISOBMFF構造および特徴は、HEIFの設計において多く使用されている。HEIFの基本設計は、アイテムとして記憶された静止画像およびトラックとして記憶された画像シーケンスを含む。
以下では、用語「全方位」が、コンテンツをレンダリングしているデバイスの視野よりも大きな空間的広がりを有し得るメディアコンテンツを指すことがある。全方位コンテンツは例えば、水平次元において実質的に360度および垂直次元において実質的に180度をカバーすることがあるが、全方位は、水平方向に360度未満のビューおよび/または垂直方向に180度未満のビューをカバーするコンテンツに関することもある。
水平に360度視野および垂直に180度視野をカバーするパノラマ画像を、正距円筒図法(equirectangular projection)(ERP)を使用して2次元画像平面にマップされた球によって表すことができる。このケースでは、水平座標は経度と同等と考えること、および垂直座標は緯度と同等と考えることができ、変換またはスケーリングは適用されない。一部のケースでは、360度の水平視野であるが180度未満の垂直視野を有するパノラマコンテンツを、球の極エリアが2次元画像平面にマップされていない、正距円筒図法の特別なケースと考えることができる。一部のケースでは、パノラマコンテンツが、360度未満の水平視野および最大180度の垂直視野を有することがあり、それ以外は正距円筒図法形式の特性を有することがある。
エンドユーザにとって、全方位コンテンツ消費などの没入型マルチメディアは、2Dコンテンツの消費に比べて複雑である。これは、より高い自由度をエンドユーザが使用できることによる。自由は、より高い不確実性ももたらす。MPEG全方位メディア形式(Omnidirectional Media Format)(OMAF)v1は、単一の3DoF(3自由度)コンテンツの全方位ストリーミングを規格化した(ビューワ(viewer)は単位球の中心に位置し、3自由度(ヨー-ピッチ-ロール)を有する。続くフェーズ規格化(MPEG-Iフェーズ1b)は完成に近い。このフェーズは、ユーザとの対話と、ビューポート依存ストリーミング(VDS)操作およびバンド幅管理を最適化する手段とを有する、多数の3DoFおよび3DoF+コンテンツ消費を可能にすることが期待される。
ビューポートは、表示およびユーザが見るのに適した全方位画像または映像の領域と定義することができる。現在のビューポート(時に単にビューポートと呼ぶことがある)は、現在表示されており、したがってユーザが見ることができる球形映像の部分と定義することができる。任意の時点において、アプリケーションによってヘッドマウントディスプレイ(HMD)上でレンダリングされた映像は、ビューポートと呼ばれる360度映像の部分をレンダリングする。同様に、従来のディスプレイ上で360度コンテンツの空間部分を見ているとき、現在表示されている空間部分がビューポートである。ビューポートは、レンダリングディスプレイを介して表示された全方位映像の中に表現された360度世界のウィンドウである。ビューポートは、水平視野(VHFoV)および垂直視野(VVFoV)によって特徴付けることができる。
全方位空間を、重なりの有るビューポートのマップとして想像することができるように、360度空間を、それぞれが所与の距離(例えば度で表現された距離)で分離されたビューポートの離散セットに分割することができ、ヘッドマウントディスプレイ(HMD)を用いてコンテンツを見ている間にユーザが自分の向きを変化させるにつれて、ビューポートは離散的に切り換えられる。ビューポート間の重なりがゼロまで低下したとき、ビューポートを、360度空間内の隣り合う重なりのないタイルとして想像することができる。H.265ビデオコーデックは、この状況(重なり有りと無しの両方)を実現するために使用することができるタイルの概念を実施する。
VR映像をストリーミングしているときに、ビューポート(すなわちその時点で見ている向き)をカバーしている360度映像コンテンツのサブセットを最高の品質/解像度で伝送することができ、一方で、360度映像の残りの部分をより低い品質/解像度で伝送することができる。これがVDSシステムの特徴であり、このことは、全方位映像が全ての方向に高い品質でストリーミングされるビューポート独立ストリーミングシステムとは対照的である。
全方位メディア形式(OMAF)規格(ISO/IEC 23090-2)は、球領域に対してジェネリック時限メタデータシンタックスを指定する。時限メタデータトラックの目的は、トラックサンプルエントリタイプによって指示される。指定された球領域に対する全てのメタデータトラックのサンプル形式は共通部分から始まり、その後に、メタデータトラックのサンプルエントリに特定の延長部分が続くことがある。それぞれのサンプルは球領域を指定する。
OMAFに指定された特定の球領域時限メタデータトラックのうちの1つは、推奨ビューポート時限メタデータトラックとして知られており、これは、ビューイング向きの制御をユーザが有していないとき、またはビューイング向きの制御をユーザがリリースしたときに表示すべきビューポートを指示する。推奨ビューポート時限メタデータトラックを使用して、推奨ビューポートを、「ディレクターズカット」に基づいてまたはビューイング統計量の測定に基づいて指示することができる。推奨ビューポートのテキスト記述をサンプルエントリの中に提供することができる。推奨ビューポートのタイプをサンプルエントリの中に指示することができ、以下の中のものとすることができる:ディレクターズカットによる推奨ビューポート、例えばコンテンツ作成者またはコンテンツプロバイダの創造的意図に従って提案されたビューポート。
図1は、OMAFシステムアーキテクチャを例示している。システムは、例えばビデオカメラ内またはネットワークサーバ内に置くことができる。図1に示されるように、全方位メディア(A)を取得する。OMAFシステムが映像源の部分である場合、全方位メディア(A)はカメラ手段から取得する。OMAFシステムがネットワークサーバ内にある場合、全方位メディア(A)は、ネットワークを介して映像源から取得する。
全方位メディアは、画像データ(Bi)および音声データ(Ba)を含み、それらは別々に処理される。画像ステッチング(image stitching)、回転、投影および領域ワイズパッキング(region-wise packing)において、入力(Bi)として提供されたソースメディアの画像/映像をステッチングして、グローバル座標軸により単位球上に球ピクチャを生成する。次いで、単位球をグローバル座標軸に対して回転させる。ローカル座標軸からグローバル座標軸へ変換するための回転量は、ローテーションボックス(RotationBox)の中に指示された回転角によって指定することができる。単位球のローカル座標軸は、回転させた座標系の軸である。ローテーションボックスの不在は、ローカル座標軸がグローバル座標軸と同じであることを指示する。次いで、回転させた単位球上の球形ピクチャを、2次元投影ピクチャに、例えば正距円筒図法を使用して変換する。立体視コンテンツの空間パッキングが適用されるときに、2つのビューのための2つの球形ピクチャを2つの成分ピクチャに変換し、その後に、フレームパッキングを適用して、1つの投影ピクチャ上に2つの成分ピクチャをパッキングする。次いで、長方形領域ワイズパッキングを適用して、投影ピクチャから、パッキングされたピクチャを取得することができる。次いで、パッキングされたピクチャ(D)を映像および画像符号化のために提供し、その結果として、符号化された画像(Ei)および/または符号化された映像ストリーム(Ev)を得る。ソースメディアの音声を、符号化された音声(Ea)として提供する音声符号化への入力(Ba)として提供する。次いで、符号化されたデータ(Ei、Ev、Ea)を、再生(F)および配信(すなわちストリーミング)(Fs)のためファイルにカプセル化する。
HMDなどのOMAFプレーヤ200内で、ファイルカプセル化解除器(file decapsulator)が、ファイル(F’、F’s)を処理し、符号化されたビットストリーム(E’i、E’v、E’a)を抽出し、メタデータを解析する。次いで、音声、映像および/または画像を復号して、復号されたデータ(D’、B’a)にする。頭部/目追跡デバイスによって感知されたビューポートおよび向きに従って、復号されたピクチャ(D’)をディスプレイ上に投影する。同様に、復号された音声(B’a)を、ラウドスピーカ/ヘッドホンを通してレンダリングする。
Matroskaファイル形式は、(限定はされないが)映像、音声、ピクチャまたはサブタイトルトラックのいずれかを1つのファイルに記憶することができる。Matroskaは、WebMなどの導出ファイル形式のためのベース形式として使用することができる。Matroskaは、拡張可能なバイナリメタ言語(Extensible Binary Meta Language)(EBML)をベースとして使用する。EBMLは、XMLの原理によってインスパイアされたバイナリおよびオクテット(バイト)アラインド形式を指定する。EBML自体は、バイナリマークアップの技法の一般化された記述である。Matroskaファイルは、EBML「文書」を構成するエレメントからなる。エレメントは、エレメントID、エレメントのサイズの記述子、およびバイナリデータ自体を含む。エレメントは入れ子にすることができる。Matroskaのセグメントエレメントは、他のトップレベル(レベル1)エレメントのためのコンテナである。Matroskaファイルは、1つのセグメントを含むことができる(しかし、1つのセグメントからなるとは限らない)。Matroskaファイルの中のマルチメディアデータは、クラスタ(またはクラスタエレメント)に編成されており、それぞれが数秒のマルチメディアデータを含むことができる。クラスタは、BlockGroupエレメントを含み、BlockGroupエレメントはブロックエレメントを含む。キューズエレメント(Cues Element)はメタデータを含み、このメタデータは、ランダムアクセスまたはシーキングを支援することができ、シークポイントに対するファイルポインタまたはそれぞれのタイムスタンプを含むことができる。
伝送チャネルまたは通信チャネルまたはチャネルは、ワイヤなどの物理伝送媒体、または多重化された媒体を介する論理接続のいずれかを指すことがある。
リアルタイムトランスポートプロトコル(RTP)は、音声および映像などの時限メディアのリアルタイムトランスポートのために広範囲に使用されている。RTPは、ユーザデータグラムプロトコル(UDP)の上で機能することができ、UDPは、インターネットプロトコル(IP)の上で機能することができる。RTPは、www.ietf.org/rfc/rfc3550.txtから入手可能なインターネットエンジニアリングタスクフォース(IETF)リクエストフォーコメンツ(RFC)3550の中に指定されている。RTPトランスポートでは、メディアデータがRTPパケットにカプセル化される。通常、それぞれのメディアタイプまたはメディアコーディング形式は専用RTPペイロード形式を有する。
RTPセッションは、RTPと通信している一群の参加者間のアソシエーションである。それは、いくつかのRTPストリームを潜在的に運ぶことができるグループ通信チャネルである。RTPストリームは、メディアデータを含むRTPパケットのストリームである。RTPストリームは、特定のRTPセッションに属するSSRCによって識別される。SSRCは、同期源(synchronization source)、またはRTPパケットヘッダの中の32ビットSSRCフィールドである同期源識別子のいずれかを指す。同期源は、同期源からの全てのパケットが、同じタイミングおよびシーケンス数空間の部分を形成し、そのため、レシーバデバイスが、再生のために同期源によってパケットをグループ化することができることを特徴とする。同期源の例は、マイクロホンもしくはカメラなどの信号源またはRTPミキサから導出されたパケットのストリームのセンダ(sender)を含む。それぞれのRTPストリームは、RTPセッション内において固有のSSRCによって識別される。
ユニフォームリソースアイデンティファイヤ(URI)は、リソースの名称を識別するために使用される文字列と定義することができる。このような識別は、特定のプロトコルを使用してネットワークを介してリソースの表現と対話することを可能にする。URIは、そのURIに対する具体的なシンタックスおよび関連するプロトコルを指定するスキームを通して定義される。ユニフォームリソースロケータ(URL)およびユニフォームリソースネーム(URN)はURIの形態である。URLは、ウェブリソースを識別し、リソースの表現に作用するまたはリソースの表現を取得する手段を指定するURIと定義することができ、リソースの主アクセス機構とネットワーク位置の両方を指定する。URNは、特定の名前空間の中の名前によってリソースを識別するURIと定義することができる。URNを使用して、リソースの位置またはリソースにどのようにアクセスするのかを暗示することなく、リソースを識別することができる。
以下では、360度会議(360-degree conference)、遠隔会議(teleconference)、テレプレゼンス(telepresence)などのストリーミング可能な360度イベントに対する実施形態について論じる。しかしながら、既述のとおり、360度会議に加えて、それらの実施形態は、他のVRストリーミング解決策に対しても適している。図2a~2cは、360度遠隔会議のさまざまな状況を表している。360度会議は、センダによってレシーバデバイスにストリーミングされるライブミーティングであることができ、センダは、360度(すなわち全方位)カメラ、または映像源に動作可能に接続されたシステムもしくは映像を記録するための手段を含むシステムなどの映像源である。センダからレシーバへのストリーミング可能なコンテンツは少なくとも映像および音声を含む。センダの目的は、記録中の映像をレシーバデバイスに向けてストリーミングすることである。センダは、レシーバデバイスから少なくとも音声データを受信するための手段を含むこともでき、受信した音声データを、ストリーミング可能なイベントの参加者に出力することもできる。
図2a~2cでは、一群の参加者が会議室でミーティングを開いている。この会議室は、物理的要素(すなわちカメラ220、ビュースクリーン210、物理的参加者)を含む仮想会議システムAと考えることができ、リモート参加者にコンテンツを共有し、リモート参加者からデータを受信することができる。既述のとおり、仮想会議システムAは、少なくとも、360度(すなわち全方位)カメラ220およびビュースクリーン210を含む。このミーティングには、会議通話を通して2人のリモート参加者B、Cも参加している。仮想会議システムAの物理的参加者は、ビュースクリーン210を使用して、リモート参加者B、Cから送られた共有プレゼンテーションおよび/または映像ストリームを表示する。リモート参加者のうちの1人であるBは、会議コンテンツの360度ビューを得るためのヘッドマウントディスプレイ、および自分の映像を取り込むカメラを使用している。リモート参加者のうちの1人であるCは、会議にアクセスするために携帯電話を使用している。この携帯電話は、会議の360度映像を示すこと、および自分の映像を取り込むことができる。
図2aの例では、任意のメディアアウェアな(madia-aware)ネットワーク要素なしで会議通話が設定されている。両リモート参加者B、Cは、自分のビューポート向きに関する情報を仮想会議システムAに送信し、仮想会議システムAは、360度カメラ220からのビューポート依存映像ストリーム(viwport-independent video stream)をリモート参加者B、Cに送信する。
図2bの例では、ネットワーク機能を使用して会議通話が設定されており、メディアリソース機能(Media Resource Function)(MRF)またはメディア制御ユニット(Media Control Unit)(MCU)230によって実行することができる。この例では、MRF/MCU230が、仮想会議システムAからビューポート独立ストリーム(viwport-independent stream)を受信する。両リモート参加者B、Cは、MRF/MCU230にビューポート向き情報を送信し、MRF/MCU230からビューポート依存ストリームを受信する。図2bに示されるように、会話式非没入型コンテンツ用のA/VチャネルもMRF/MCU230を経由することができる。図2bの例は、双方向音声および一方向没入型映像によって、遠隔会議に参加しているリモート参加者B、Cの没入体験を可能にすることを目指す。
図2cの例では、多数の会議室X用の仮想会議システムが、MRF/MCU230に360度映像を送信している。それらの会議室は、他の会議室のうちの1つの会議室を含む他の参加者から、その会議室のビュースクリーン210に表示された2D映像ストリームを受信することを選択することができる。リモート参加者B、Cは、これらの多数の会議室からの使用可能な360度映像のうちの任意の1つの映像を見ること、またはそれらの会議室からの映像を見ないことを選択することができる。1つの会議室から別の会議室への切り換えは手動で、または見ている方向もしくは優勢な話者などの他の機構を使用して引き起こすことができる。MRF/MCU230は、その時点でアクティブビューワがいない会議室のいずれかからの360度映像の受信を休止することをシグナリングすることができる。
一部の実施形態では、360度会議を完全に仮想的なものとすることができ、そのような会議では、全てのミーティング参加者がリモート参加者、すなわちネットワークを介して会議に接続しているレシーバデバイスであり、センダが、仮想会議およびリモート参加者の仮想表現を生成しているコンピュータである。
図3は、360度会議300の設定のさらなる例を例示している。この例では、360度会議300が、会議を記録している360度映像システム310などの少なくとも1つのセンダを含む。さらに、360度会議300は、ライブ参加者315に加えて、レシーバデバイス330、335を有する1人または数人のリモート参加者も含み、レシーバデバイスは、360度映像システム310によって取り込まれた360度映像を見ることを可能にする会議システムへの接続を確立することによって会議に「参加している」。以下では、ストリーミングされたコンテンツの受信者としてのデバイスの役割を強調するために、リモート参加者のデバイス330、335を「レシーバデバイス」と呼ぶ。しかしながら、レシーバデバイス330、335は、データ、例えば音声を送信することもできることが理解される。
レシーバデバイス330、335は、ヘッドマウントディスプレイ335などの仮想現実ディスプレイシステムとすることができるが、その代わりに(またはそれに加えて)2次元(2D)コンテンツだけを示すことができるディスプレイ330とすることもできる。
ヘッドマウントディスプレイは、3次元(3D)コンテンツを示すことができるデバイスである。その目的のため、ヘッドマウントディスプレイは、左目用および右目用の画像を表示するための2つのスクリーンセクションまたは2つのスクリーンを備えることができる。それらのディスプレイは目に近く、したがって、画像を見やすくするため、および目の視野をできるだけカバーするよう画像を広げるために、レンズが使用される。HMDは、ユーザの頭部に、ユーザが頭部を回転させたときでもHMDが所定の位置にとどまるように取り付けられる。このデバイスは、頭部の運動および頭部の方向を決定するための向き検出モジュールを有することができる。ヘッドマウントディスプレイは、記録された/ストリーミングされたコンテンツの3次元(3D)認知をユーザに与える。ヘッドマウントディスプレイのユーザは、所与の瞬間に、ビューポートと呼ばれる360度コンテンツの部分だけを見る。ビューポートのサイズは、HMDの垂直および水平視野によって定義される。ビューポート内では、没入型コンテンツの音声対象物の大部分が可視であることがあり、その一方で、一部の音声対象物はユーザの後ろにあることがあり、したがってビューポート内では可視でないことがある。既述のとおり、ビューポートは360度コンテンツの部分である。したがって、「ビューポート」は、表示およびユーザが見るのに適した全方位画像または映像の領域を定義するための用語であり、その時点で表示されており、したがってユーザが見ることができる球形映像の部分と定義される。
図3では、センダが、360度映像システム310として例示されている。360度映像システム310の代わりに、センダが、360度映像を共有している会議参加者の1人であってもよいこと、または、センダが、ミドルボックス(middlebox)もしくはネットワーク機器、すなわちメディア配信ができる任意のコンピュータネットワーキングデバイスであってもよいことが理解される。そのようなミドルボックスの例はメディアゲートウェイ、会議サーバなどである。センダは、MPEG DASHプロトコルを介してコンテンツを配信するように構成されたストリーミングサーバであってもよい。センダの容量に応じて、センダは、ビューポート独立またはビューポート依存配信を提供することができる。さらに、ビューポート依存配信が提供される場合には、ビューポートを決定するための制御信号を、ヘッドマウントディスプレイまたは360度コンテンツを表示することができる他のデバイスからセンダに配信する必要がある。
ビューポートは、HMD335などのレシーバデバイスのユーザの頭部および体の運動に基づいて決定することができる。ビューポートは、レシーバデバイス335から、制御チャネルを介して、360度映像システム310などのセンダに送信することができる。受信したビューポートに基づいて、センダは、決定されたビューポートに関する映像コンテンツを送信することができる。HMDユーザ自身の運動以外の手段によるビューポート制御は、ビューワの映像酔い(motion sickness)を引き起こしうることが理解される。
ビューポートを決定するため、(センダおよびレシーバの両方を含む)VR会議システムは3DoFをサポートすることができる。3DoFをサポートしているシステムは、ヨー、ピッチおよびロールの周りの頭部回転運動を可能にする。別の実施形態では、6DoF(6自由度)運動をサポートすることができる。6DoFは、回転運動に加えて、頭部または体のさらなる平行移動、例えば頭部または体を上、下、右、左、前および後ろに平行移動させることを可能にし、この平行移動は、空間内を任意の方向に歩き回ることを含む。6DoF運動は、ユーザが動き回ることができる定義された空間内に拘束された運動とすること(例えば3DoF+)、または拘束のない運動とするができる。
図4は、映像会議ストリームの配信の一例を例示している。取込みフェーズ410で、ビデオカメラ411が、何人かの参加者を含む会議の全方位データを記録する。フェーズ420で、ビデオカメラシステムまたはミドルボックスまたは一部の他のネットワークサーバが、取り込まれた全方位データ425のビューポート依存コンテンツ426、427、428を生成する(ビューポートの数は図4に示された数とは大幅に異なることがある)。消費フェーズ430で、ユーザのヘッドマウントディスプレイ435に、ある特定のコンテンツ438が提供される。提供されたコンテンツ438は、例えば、頭部運動および頭部の方向に従って、またはユーザの手動選択によって決定することができる。そのような情報は、ビューポート依存コンテンツを生成するビデオカメラシステムまたはミドルボックスに提供されたこともある。
あるいは、レシーバデバイスが、(図3に参照符号330によって示される)2Dディスプレイである場合、ディスプレイのユーザは、別のユーザのビューポートに従うことを選択することができ、またはセンダにおいて使用可能な他の予測方法、例えば優勢な話者もしくは運動追跡に基づくビューポートを選択することを選択することができる。
ビューポートに関する上記の議論に関して、本実施形態の目的は、センダ、すなわち映像源によってサポートされたビューポート制御シグナリングのタイプ、およびレシーバデバイス、すなわちリモートデバイスがセッション中に使用したいビューポート制御のタイプをシグナリングするための適切なセッションレベルシグナリングを提供することである。
レシーバデバイスが、会議の360度映像コンテンツを受信するために360度映像会議に参加したとき、360度センダは、以下の形式のうちのいずれかでレシーバデバイスに映像コンテンツを送信することができる:
- 没入型ビューポート独立映像、
- 没入型ビューポート依存映像、
- フラット化ビューポート依存2Dコンテンツ。
没入型ビューポート独立映像とは、その中に一切のビューポート定義を含まないコンテンツのことである。没入型ビューポート独立映像の配信は、センダがビューポート依存コンテンツを提供することができない場合に、センダによって選択されることがある。あるいは、多数のレシーバデバイスに映像を配信するミドルボックス(例えばメディアゲートウェイ)が、映像センダからのビューポート独立映像をリクエストし、レシーバデバイスにビューポート依存映像を再配信することもある。この種の状況は、センダが、多数のレシーバに対するビューポート依存ストリームを提供/符号化することができないときに起こることがあり、その上に、ミドルボックスは、その点に関して会議通話を支援するように構成されている。さらなる代替として、デバイス容量の限界、プライバシー上の理由または個人的好みのため、レシーバデバイスが、ビューポート独立映像をリクエストすることもできる。
没入型ビューポート依存映像とは、(例えばビューポートをより高い品質に符号化することにより)ビューポート内にある画像が球の残りの部分とは異なって取り扱われるコンテンツを指す。そのようなコンテンツは、ビューポート向きに基づいてセンダがレシーバデバイスに提供することができる。ビューポートは、シグナリングを介してセンダがレシーバデバイスから受信したビューポート情報に基づいて、センダが決定することができる。別のケースでは、ユーザAがユーザBのビューポートに従うことを選択したときに、シグナリングを介してセンダがBから受信したビューポート情報に基づいて、センダがAのビューポートを決定することができ、このことは、セッション制御中に全ての当事者間で既に協議され、合意されている。第3のケースでは、予測法または他のアプリケーションレベルの方法(例えば優勢な話者、運動追跡など)に基づいて、外部シグナリングなしで、センダが、レシーバデバイスのビューポートを決定することができる。
フラット化ビューポート依存2Dコンテンツとは、非没入型のコンテンツを指す。そのようなコンテンツは、1つのビューポートに基づいて、2Dディスプレイを有するレシーバデバイスに提供することができる。映像源は、そのビューポートを、シグナリングを介してレシーバデバイスから受信されているビューポート情報に基づいて決定することができる。別のケースでは、ユーザAがユーザBのビューポートに従うことを選択したときに、シグナリングを介してセンダがBから受信したビューポート情報に基づいて、センダがAのビューポートを決定することができ、このことは、セッション制御中に全ての当事者間で既に協議され、合意されている。第3のケースでは、予測法または他のアプリケーションレベルの方法(例えば優勢な話者、運動追跡など)に基づいて、外部シグナリングなしで、センダが、レシーバデバイスのビューポートを決定することができる。フラット化ビューポート依存2Dコンテンツは、リクエストされたコンテンツを2Dオーバレイとして他のVRコンテンツの上に表示したいHMDレシーバデバイスによってリクエストされることもある。
360度映像コンテンツのレシーバデバイスは、映像のストリーミング中に、例えば会議通話中にレシーバデバイスが使用したいであろうビューポート制御オプションを選択することができる。このことは、レシーバデバイスが、没入型コンテンツのフラット化2Dバージョンを受信したい場合であっても適用可能である。ビューポート制御オプションは以下のうちの1つでありうる:
- レシーバデバイスがビューポートを制御し、この情報が、セッション中に、例えばRTCPフィードバックを使用してセンダにシグナリングされる。2つ以上のシグナリング機構が可能である場合、センダは、異なるシグナリング機構を提供することができる。
- レシーバデバイスがビューポートを制御するが、この情報は、セッション中にセンダにシグナリングされない。このことは、メディアがビューポート依存コンテンツとして配信されないだろうことを意味する。
- レシーバデバイスは別のユーザ(プレゼンタ)のビューポートに従う。このオプションが使用される場合、センダは、レシーバデバイスのユーザに、その中から選択するための可能なプレゼンタのリストを提供することができる。プレゼンタによる許可をリクエストするために追加のシグナリングが必要となることがある。
センダは、360度映像を見るためにセンダが提供することができるビューポート制御オプションのタイプを指示するパラメータをビットストリームに符号化することができる。セッション制御中または確立されたセッション中に、ビットストリームをセンダから受信デバイスにシグナリングすることができる。ある実施形態によれば、ビューポートを制御するオプションを指定するパラメータはviewport_ctrlである(このパラメータの名称は変更できることが理解される)。viewport_ctrlは、以下の値のうちの1つまたは複数を有することができる:
○ device_signalled_3dof、
○ device_signalled_6dofc、
○ device_signalled_6dofu、
○ device_notsignalled、
○ recommended_viewport、
○ presenter_viewport。
レシーバデバイスは、これらの値のうちの1つの値を選択して、レシーバデバイスからセンダに送信する応答に含めることができる。
応答がdevice_signalled_3dofを含むとき、ビューポートは、レシーバデバイスによって最大3DoFで制御される。レシーバデバイスは、セッション中に、この情報(例えばヨー、ピッチ、ロール、または異なる形式の他のビューポート座標)をセンダにシグナリングする。ビューポートフィードバックに使用されるシグナリングのタイプは、異なるパラメータを使用して協議することができ、または、viewport_ctrl信号内で、例えばdevice_signalled_rtcpfbなどを使用して実行することができる。
応答がdevice_signalled_6dofcを含むとき、ビューポートは、レシーバデバイスによって、拘束された空間内で最大6DOFで制御され(例えばMPEG委員会によって定義された3DoF+またはWindowed 6DoF)、レシーバデバイスは、セッション中に、この情報をセンダにシグナリングする。ビューポートフィードバックに使用されるシグナリングのタイプは、異なるパラメータを使用して協議することができ、または、viewport_ctrl信号内で、例えばdevice_signalled_rtcpfbなどを使用して実行することができる。
応答がdevice_signalled_6dofuを含むとき、ビューポートは、レシーバデバイスによって、拘束のない空間で最大6DoFで制御され、レシーバデバイスは、セッション中に、この情報をセンダにシグナリングする。ビューポートフィードバックに使用されるシグナリングのタイプは、異なるパラメータを使用して協議することができ、または、これは、viewport_ctrl信号内で、例えばdevice_signalled_rtcpfbなどを使用して実行することができる。
応答がdevice_notsignalledを含むとき、ビューポートはレシーバデバイスによって制御され、レシーバデバイスは、セッション中に、(例えばプライバシー上の理由で)センダに一切の情報をシグナリングしない。このモードは、ビューポート独立ストリームを受信することに帰着する。
応答がrecommended_viewportを含むとき、レシーバデバイスは、センダによって決定される、メディアストリームの推奨ビューポートに従う。推奨ビューポートに対して2つ以上の機構が提供されることがあり、それらの機構は、別個に、またはviewport_ctrlの延長としてシグナリングすることができる。例えばrecommended_viewport_audio、recommended_viewport_motionなど。
応答がpresenter_viewportを含むとき、レシーバデバイスは、プレゼンタのビューポートに従う。この場合、プレゼンタは、同じストリームの別のビューワである。このモードを使用するときには、プレゼンタが2人以上いる場合に、レシーバデバイスが、適切なシグナリングを使用して(例えばプレゼンタの名称または索引などを指示することによって)プレゼンタを選択することができるべきである。
上で定義した情報はレシーバからセンダへ流れることができる。しかしながら、あるいは、情報をセンダからレシーバに向かって伝送することもできる。この場合、協議はないが、レシーバ側からの受容または拒否だけがあることがある。
このシグナリングは、IETF SDP(Session Description Protocol(セッション記述プロトコル))を介して実行することができる。IETF SDPは、ストリーミングメディア通信パラメータを記述するための形式である。SDPは、RTP、RTSPまたはSIPとともに使用することができる。一例として、SDPフィールドのシンタックスおよびセマンティクスを以下に示す。メディアタイプの属性として、またはビューポート制御が必要な全てのメディアタイプに当てはまるセッションレベルパラメータとして、信号viewport_ctrlを含めることができる。
シンタックス
v=0
o=Alice 2890844526 2890842807 IN IP4 131.163.72.4
s=360 VR conferencing
c=IN IP4 131.164.74.2
t=0 0
m=video 49170 RTP/AVP 99
a=rtpmap:99 H264/90000
a=viewport_ctrl:<control_type>
セマンティクス
control_type:
0->device_notsignalled
1->device_signalled_3dof
2->device_signalled_6dofc
3->device_signalled_6dofu
4->recommended_viewport
5->presenter_viewport
センダは、SDPオファーの中に、センダがサポートする全てのビューポート制御オプションのリストを含み、レシーバデバイスは、SDP応答の中に、レシーバデバイスが受信することを望むビューポート制御オプションを含む。センダとレシーバデバイスは、セッションの始めおよびセッション中に、これらの制御オプションを協議および再協議することができる。図4は、シグナリングフローの一例を例示しており、レシーバデバイスは、センダからの推奨ビューポートを有する2D映像(360度コンテンツのフラット化バージョン)をリクエストしている2Dディスプレイデバイスである。図4では、映像源が、Invite、SDPオファーを、Sessionパラメータとともに送信する。Inviteメッセージは、viewport_ctrlの信号:{device_signalled、device_notsignalled、recommended_viewport、presenter_viewport}、および任意選択でプレゼンタのリストも含む。device_signalled_xxxは、device_signalled_3dof、拘束のないまたは拘束されたdevice_signalled_6dofを指すことがある。最初のInviteメッセージは、受信デバイスが360度会議に参加するために送信される。図4の例では、レシーバデバイスが2Dディスプレイデバイスであり、この2Dディスプレイデバイスは選択されたメディアに応答し、この例では、選択されたメディアが、推奨ビューポートに従う2D映像ストリームである。メディアはRTPを介して送信され、RTCPが、ビューポート情報なしで報告する。
図5は、HMDデバイスを備えたレシーバデバイスが、デバイス制御のビューポートを有する没入型コンテンツをリクエストするときのシグナリングフローを示している。図5では、映像源が、Invite、SDPオファーを、Sessionパラメータとともに送信する。Inviteメッセージは、viewport_ctrlの信号:{device_signalled、device_notsignalled、recommended_viewport、presenter_viewport}、および任意選択でプレゼンタのリストも含む。device_signalled_xxxは、device_signalled_3dof、拘束のないまたは拘束されたdevice_signalled_6dofを指すことがある。最初のInviteメッセージは、受信デバイスが360度会議に参加するために送信される。図5の例では、レシーバデバイスがHMDディスプレイデバイスであり、このHMDディスプレイデバイスは選択されたメディアに応答し、この例では、選択されたメディアが、ビューポート制御を有する没入型映像ストリームである。メディアはRTPを介して送信され、RTCPが、ビューポート情報とともに報告する。
センダが、コンテンツがMPEG DASHプロトコルを介して配信されるストリーミングサーバである場合、上に示したシグナリングは、SDPを介して運ばれず、DASH MPDの中で運ばれる。SDPまたはDASH MPDの代わりに、他のシグナリングスキームも使用して、シグナリングされた情報を、例えばRTP/RTSP、RTCPなどによって提供される他のトランスポートプロトコルオプションを介して運ぶことができる。
ある実施形態によれば、メディア配信中に制御タイプを動的に変化させることが可能である。このことは、最初に協議された制御タイプの代わりに、レシーバデバイスが、別のタイプの制御タイプを使用することを望んでいることを意味する。そのような実施形態では、情報のシグナリングが、RTP/RTCPを介して、またはMPEG DASH(HTTP)を介して起こる。
図7は、ある実施形態による方法を例示する流れ図である。方法は、全方位ビジュアルメディアコンテンツを含むプレゼンテーションを定義するビットストリームを生成すること710、プレゼンテーションを見るためのビューポート制御オプションであり、受信デバイスによって制御可能なオプションと受信デバイスによって制御不能なオプションとを含む、ビューポート制御オプションを指示するパラメータをビットストリームに符号化し、ビットストリームをレシーバデバイスに送信すること720、指示されたビューポート制御オプションのうちの1つをレシーバデバイスから応答として受信すること730、プレゼンテーションをレシーバデバイスにストリーミングすること740、を含み、応答が、受信デバイスによって制御可能なビューポート制御に関する指示を含んでいたときに、この方法は、プレゼンテーションのストリーミング中に、ビューポート定義に関する情報をレシーバデバイスから受信し、それに従ってプレゼンテーションを適合させること750も含み、応答が、受信デバイスによって制御不能なビューポート制御に関する指示を含んでいたときに、プレゼンテーションは、応答の中に指定されたビューポート制御に従ってレシーバデバイスにストリーミングされる760。
ある実施形態による装置は、全方位ビジュアルメディアコンテンツを含むプレゼンテーションを定義するビットストリームを生成する手段と、プレゼンテーションを見るためのビューポート制御オプションであり、受信デバイスによって制御可能なオプションと受信デバイスによって制御不能なオプションとを含む、ビューポート制御オプションを指示するパラメータをビットストリームに符号化し、ビットストリームをレシーバデバイスに送信する手段と、指示されたビューポート制御オプションのうちの1つをレシーバデバイスから応答として受信する手段と、プレゼンテーションをレシーバデバイスにストリーミングする手段とを備え、応答が、レシーバデバイスによって制御可能なビューポート制御に関する指示を含んでいたときに、この装置は、プレゼンテーションのストリーミング中に、ビューポート定義に関する情報をレシーバデバイスから受信する手段、およびそれに従ってプレゼンテーションを適合させる手段も備え、応答が、受信デバイスによって制御不能なビューポート制御に関する指示を含んでいたときに、この装置は、プレゼンテーションを、応答の中に指定されたビューポート制御に従ってレシーバデバイスにストリーミングする手段を備える。これらの手段は、少なくとも1つのプロセッサと、コンピュータプログラムコードを含むメモリとを備え、プロセッサはプロセッサ回路をさらに含むことができる。このメモリおよびコンピュータプログラムコードは、この少なくとも1つのプロセッサを用いて、さまざまな実施形態に従って図7の流れ図の方法をこの装置に実行させるように構成されている。
装置の一例が図8に示される。望ましい場合には、単一の物理デバイスを用いて、例えば単一のプロセッサ内で、いくつかの機能を実行することができる。装置90は、主処理ユニット91、メモリ92、ユーザインタフェース94、通信インタフェース93を備える。図8に示される、ある実施形態による装置は、カメラモジュール95も備える。メモリ92は、コンピュータプログラムコードを含むデータを装置90に記憶する。このコンピュータプログラムコードは、図6の流れ図による方法を実施するように構成されている。カメラモジュール95は、プロセッサ91によって処理されるべき入力データを、映像ストリームの形式で受信する。通信インタフェース93は、処理されたデータを、例えばHMDなどの別のデバイスのディスプレイに転送する。装置90が、カメラモジュール95を含む映像源であるときには、ユーザインタフェースからユーザ入力を受信することができる。装置90が、ネットワーク内のミドルボックスである場合には、ユーザインタフェースはカメラモジュールなどの任意選択である。
これらのさまざまな実施形態は利点を提供することができる。例えば、実施形態は、リアルタイムセッション中にセンダ/レシーバがビューポート制御を確立する手法を提供する。実施形態は、2Dディスプレイデバイスに特定のオプション(presenter_viewportおよびrecommended_viewport)、およびジェネリックオプション(device_signalledおよびdevice_notsignalled)も提供する。没入型コンテンツの代わりにフラット2Dメディアストリームが配信されるとき、ユーザに関連情報を提供している間、センダは、バンド幅を効果的に節約することができる。一切のビューポート情報をシグナリングしないことを選択することによって、デバイスは、プライバシーを保持することができる。最後に、ビューポート依存ストリーミングを提供することができない限られた容量を有するセンダは、このことをレシーバにシグナリングすることができる。
これらのさまざまな実施形態は、メモリに存在し、関連装置に方法を実行させるコンピュータプログラムコードの助けを借りて実施することができる。例えば、デバイスは、データを処理、受信および伝送するための回路および電子装置と、メモリの中のコンピュータプログラムコードと、コンピュータプログラムコードを実行したときにある実施形態の特徴をデバイスに実行させるプロセッサとを含むことができる。さらに、サーバのようなネットワークデバイスは、データを処理、受信および伝送するための回路および電子装置と、メモリの中のコンピュータプログラムコードと、コンピュータプログラムコードを実行したときにある実施形態の特徴をネットワークデバイスに実行させるプロセッサとを含むことができる。コンピュータプログラムコードは、1つまたは複数の操作特性を含む。上記操作特性は、構成を通して、上記コンピュータによって、上記プロセッサのタイプに基づいて定義されており、バスによって上記プロセッサにシステムが接続可能であり、システムのプログラム可能な操作特性は、全方位ビジュアルメディアコンテンツを含むプレゼンテーションを定義するビットストリームを生成すること、プレゼンテーションを見るためのビューポート制御オプションであり、受信デバイスによって制御可能なオプションと受信デバイスによって制御不能なオプションとを含む、ビューポート制御オプションを指示するパラメータをビットストリームに符号化し、ビットストリームをレシーバデバイスに送信すること、指示されたビューポート制御オプションのうちの1つをレシーバデバイスから応答として受信すること、プレゼンテーションをレシーバデバイスにストリーミングすること、を含み、応答が、受信デバイスによって制御可能なビューポート制御に関する指示を含んでいたときに、この方法は、プレゼンテーションのストリーミング中に、ビューポート定義に関する情報をレシーバデバイスから受信し、それに従ってプレゼンテーションを適合させることも含み、応答が、受信デバイスによって制御不能なビューポート制御に関する指示を含んでいたときに、プレゼンテーションは、応答の中に指定されたビューポート制御に従ってレシーバデバイスにストリーミングされる。
ある実施形態によるコンピュータプログラム製品は、非一過性コンピュータ可読メディア上に実施することができる。別の実施形態によれば、このコンピュータプログラム製品は、データパケットの中でネットワークを介してダウンロードすることができる。
望ましい場合には、本明細書で論じた異なる機能を、異なる順序でおよび/または他の機能と同時に実行することができる。さらに、望ましい場合には、上で説明した機能および実施形態のうちの1つもしくは複数を任意選択とすることができ、または組み合わせることができる。
独立請求項には実施形態のさまざまな態様が記載されているが、他の態様は、単に特許請求の範囲に明示的に記載された組合せだけでなく、記載された実施形態および/または従属請求項からの特徴と独立請求項の特徴との他の組合せを含む。
以上の説明は例示的な実施形態を説明しているが、これらの説明を限定的に解釈すべきでないことも本明細書では留意すべきである。むしろ、添付の特許請求の範囲に定義された本開示の範囲を逸脱することなく実施することができるいくつかの変更および修正が存在する。

Claims (19)

  1. 方法であって、
    - 全方位ビジュアルメディアコンテンツを含むプレゼンテーションを定義するビットストリームを生成すること、
    - 前記プレゼンテーションを見るためのビューポート制御オプションであり、前記ビューポート制御オプションが受信デバイスによって制御可能なオプションと前記受信デバイスによって制御不能なオプションとを含み、前記受信デバイスによって制御不能な前記オプションが、少なくともプレゼンタビューポートに基づくビューポート制御を含む、ビューポート制御オプションを指示するパラメータをビットストリームに符号化すること、
    - 前記ビットストリームを前記レシーバデバイスに送信すること、
    - 前記指示されたビューポート制御オプションのうちの1つまたは組合せを前記レシーバデバイスから応答として受信すること、
    - 前記プレゼンテーションを前記レシーバデバイスにストリーミングすること
    を含み、
    - 前記応答が、前記受信デバイスによって制御可能なビューポート制御に関する指示を含んでいたときに、前記方法が、前記プレゼンテーションのストリーミング中に、ビューポート定義に関する情報を前記レシーバデバイスから受信し、それに従って前記プレゼンテーションを適合させることも含み、
    - 前記応答が、前記受信デバイスによって制御不能なビューポート制御に関する指示を含んでいたときに、前記プレゼンテーションが、前記応答の中に指定された前記ビューポート制御に従って前記レシーバデバイスにストリーミングされる、
    方法。
  2. 前記受信デバイスによって制御可能な前記ビューポート制御オプションが、前記ビューポートを、前記受信デバイスによって、3自由度まで、または6自由度まで拘束された空間内もしくは拘束のない空間内において制御することを含む、請求項1に記載の方法。
  3. 前記受信デバイスによって制御不能な前記ビューポート制御オプションが、推奨ビューポートに基づくビューポート制御も含む、請求項1に記載の方法。
  4. 前記全方位ビジュアルメディアコンテンツをネットワークを介して受信することをさらに含む、請求項1~3のいずれか1項に記載の方法。
  5. 前記全方位ビジュアルメディアを取り込むことをさらに含む、請求項1~3のいずれか1項に記載の方法。
  6. 前記受信デバイスから音声を受信することをさらに含む、請求項1~5のいずれか1項に記載の方法。
  7. 装置であって、
    - 全方位ビジュアルメディアコンテンツを含むプレゼンテーションを定義するビットストリームを生成する手段と、
    - 前記プレゼンテーションを見るためのビューポート制御オプションであり、前記ビューポート制御オプションが受信デバイスによって制御可能なオプションと前記受信デバイスによって制御不能なオプションとを含み、前記受信デバイスによって制御不能な前記オプションが、少なくともプレゼンタビューポートに基づくビューポート制御を含む、ビューポート制御オプションを指示するパラメータをビットストリームに符号化する手段と、
    - 前記ビットストリームを前記レシーバデバイスに送信する手段と、
    - 前記指示されたビューポート制御オプションのうちの1つまたは組合せを前記レシーバデバイスから応答として受信する手段と、
    - 前記プレゼンテーションを前記レシーバデバイスにストリーミングする手段と
    を備え、
    - 前記応答が、前記レシーバデバイスによって制御可能なビューポート制御に関する指示を含んでいたときに、前記装置が、前記プレゼンテーションのストリーミング中に、ビューポート定義に関する情報を前記レシーバデバイスから受信する手段、およびそれに従って前記プレゼンテーションを適合させる手段も備え、
    - 前記応答が、前記受信デバイスによって制御不能なビューポート制御に関する指示を含んでいたときに、前記装置が、前記プレゼンテーションを、前記応答の中に指定された前記ビューポート制御に従って前記レシーバデバイスにストリーミングする手段を備える、
    装置。
  8. 前記受信デバイスによって制御可能な前記ビューポート制御オプションが、前記ビューポートを、前記受信デバイスによって、3自由度まで、または6自由度まで拘束された空間内もしくは拘束のない空間内において制御することを含む、請求項7に記載の装置。
  9. 前記受信デバイスによって制御不能な前記ビューポート制御オプションが、推奨ビューポートに基づくビューポート制御も含む、請求項7に記載の装置。
  10. 前記全方位ビジュアルメディアコンテンツをネットワークを介して受信することをさらに含む、請求項7~9のいずれか1項に記載の装置。
  11. 前記全方位ビジュアルメディアを取り込むことをさらに含む、請求項7~10のいずれか1項に記載の装置。
  12. 前記受信デバイスから音声を受信することをさらに含む、請求項7~11のいずれか1項に記載の装置。
  13. コンピュータプログラム製品であって、少なくとも1つのプロセッサ上で実行されたときに、
    - 全方位ビジュアルメディアコンテンツを含むプレゼンテーションを定義するビットストリームを生成すること、
    - 前記プレゼンテーションを見るためのビューポート制御オプションであり、前記ビューポート制御オプションが受信デバイスによって制御可能なオプションと前記受信デバイスによって制御不能なオプションとを含み、前記受信デバイスによって制御不能な前記オプションが、少なくともプレゼンタビューポートに基づくビューポート制御を含む、ビューポート制御オプションを指示するパラメータをビットストリームに符号化すること、
    - 前記ビットストリームを前記レシーバデバイスに送信すること、
    - 前記指示されたビューポート制御オプションのうちの1つまたは組合せを前記レシーバデバイスから応答として受信すること、
    - 前記プレゼンテーションを前記レシーバデバイスにストリーミングすること、
    を装置またはシステムにさせるように構成されたコンピュータプログラムコードを含み、
    - 前記応答が、前記受信デバイスによって制御可能なビューポート制御に関する指示を含んでいたときに、前記コンピュータプログラム製品が、前記装置または前記システムに、前記プレゼンテーションのストリーミング中に、ビューポート定義に関する情報を前記レシーバデバイスから受信し、それに従って前記プレゼンテーションを適合させるためのコンピュータプログラムコードを含み、
    - 前記応答が、前記受信デバイスによって制御不能なビューポート制御に関する指示を含んでいたときに、前記コンピュータプログラム製品が、前記装置または前記システムに、前記プレゼンテーションを、前記応答の中に指定された前記ビューポート制御に従って前記レシーバデバイスにストリーミングさせるためのコンピュータプログラムコードを含む、
    コンピュータプログラム製品。
  14. 装置であって、少なくとも1つのプロセッサと、コンピュータプログラムコードを含むメモリとを備え、前記メモリおよび前記コンピュータプログラムコードが、前記少なくとも1つのプロセッサを用いて、少なくとも、
    - 全方位ビジュアルメディアコンテンツを含むプレゼンテーションを定義するビットストリームを生成すること、
    - 前記プレゼンテーションを見るためのビューポート制御オプションであり、前記ビューポート制御オプションが受信デバイスによって制御可能なオプションと前記受信デバイスによって制御不能なオプションとを含み、前記受信デバイスによって制御不能な前記オプションが、少なくともプレゼンタビューポートに基づくビューポート制御を含む、ビューポート制御オプションを指示するパラメータをビットストリームに符号化すること、
    - 前記ビットストリームを前記レシーバデバイスに送信すること、
    - 前記指示されたビューポート制御オプションのうちの1つまたは組合せを前記レシーバデバイスから応答として受信すること、
    - 前記プレゼンテーションを前記レシーバデバイスにストリーミングすること
    を前記装置に実行させるように構成されており、
    - 前記応答が、前記受信デバイスによって制御可能なビューポート制御に関する指示を含んでいたときに、前記コンピュータプログラム製品が、前記装置または前記システムに、前記プレゼンテーションのストリーミング中に、ビューポート定義に関する情報を前記レシーバデバイスから受信し、それに従って前記プレゼンテーションを適合させるためのコンピュータプログラムコードを含み、
    - 前記応答が、前記受信デバイスによって制御不能なビューポート制御に関する指示を含んでいたときに、前記コンピュータプログラム製品が、前記装置または前記システムに、前記プレゼンテーションを、前記応答の中に指定された前記ビューポート制御に従って前記レシーバデバイスにストリーミングさせるためのコンピュータプログラムコードを含む、
    装置。
  15. 前記受信デバイスによって制御可能な前記ビューポート制御オプションが、前記ビューポートを、前記受信デバイスによって、3自由度まで、または6自由度まで拘束された空間内もしくは拘束のない空間内において制御することを含む、請求項14に記載の装置。
  16. 前記受信デバイスによって制御不能な前記ビューポート制御オプションが、推奨ビューポートに基づくビューポート制御も含む、請求項14に記載の装置。
  17. 前記全方位ビジュアルメディアコンテンツをネットワークを介して受信することをさらに含む、請求項14~16のいずれか1項に記載の装置。
  18. 前記全方位ビジュアルメディアを取り込むことをさらに含む、請求項14~17のいずれか1項に記載の装置。
  19. 前記受信デバイスから音声を受信することをさらに含む、請求項14~18のいずれか1項に記載の装置。
JP2022531438A 2019-11-29 2020-11-17 映像符号化および映像復号のための方法、装置およびコンピュータプログラム Active JP7397985B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FI20196033 2019-11-29
FI20196033 2019-11-29
PCT/FI2020/050768 WO2021105552A1 (en) 2019-11-29 2020-11-17 A method, an apparatus and a computer program product for video encoding and video decoding

Publications (2)

Publication Number Publication Date
JP2023504797A true JP2023504797A (ja) 2023-02-07
JP7397985B2 JP7397985B2 (ja) 2023-12-13

Family

ID=76129260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022531438A Active JP7397985B2 (ja) 2019-11-29 2020-11-17 映像符号化および映像復号のための方法、装置およびコンピュータプログラム

Country Status (5)

Country Link
US (1) US20230012201A1 (ja)
EP (1) EP4066507A4 (ja)
JP (1) JP7397985B2 (ja)
CN (1) CN114982249A (ja)
WO (1) WO2021105552A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022013326A1 (en) 2020-07-16 2022-01-20 Nokia Technologies Oy Viewport dependent delivery methods for omnidirectional conversational video
US11711550B2 (en) * 2021-03-30 2023-07-25 Samsung Electronics Co., Ltd. Method and apparatus for supporting teleconferencing and telepresence containing multiple 360 degree videos
EP4125275A1 (en) * 2021-07-27 2023-02-01 Nokia Technologies Oy A method, an apparatus and a computer program product for video conferencing
DE102022115806A1 (de) * 2022-06-24 2024-01-04 Valeo Comfort And Driving Assistance Verfahren und System zum Bereitstellen eines durch eine Ausgabevorrichtung anzuzeigenden Bildes

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3422711A1 (en) * 2017-06-29 2019-01-02 Koninklijke Philips N.V. Apparatus and method for generating an image
WO2019093734A1 (ko) * 2017-11-08 2019-05-16 엘지전자 주식회사 미디어 데이터를 송수신하는 방법 및 그 장치
WO2019118617A1 (en) * 2017-12-15 2019-06-20 Pcms Holdings, Inc. A method for using viewing paths in navigation of 360° videos
WO2019141901A1 (en) * 2018-01-17 2019-07-25 Nokia Technologies Oy An apparatus, a method and a computer program for omnidirectional video

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6721631B2 (ja) * 2017-07-07 2020-07-15 ノキア テクノロジーズ オーユー ビデオの符号化・復号の方法、装置、およびコンピュータプログラムプロダクト
US10783668B2 (en) * 2017-12-22 2020-09-22 Samsung Electronics Co., Ltd. Handling duplicate points in point cloud compression
CN111417008B (zh) * 2019-01-08 2022-06-03 诺基亚技术有限公司 用于虚拟现实的方法、装置和计算机可读介质
US11094130B2 (en) * 2019-02-06 2021-08-17 Nokia Technologies Oy Method, an apparatus and a computer program product for video encoding and video decoding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3422711A1 (en) * 2017-06-29 2019-01-02 Koninklijke Philips N.V. Apparatus and method for generating an image
WO2019093734A1 (ko) * 2017-11-08 2019-05-16 엘지전자 주식회사 미디어 데이터를 송수신하는 방법 및 그 장치
WO2019118617A1 (en) * 2017-12-15 2019-06-20 Pcms Holdings, Inc. A method for using viewing paths in navigation of 360° videos
WO2019141901A1 (en) * 2018-01-17 2019-07-25 Nokia Technologies Oy An apparatus, a method and a computer program for omnidirectional video

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"ITT4RT PERMANENT DOCUMENT - REQUIREMENTS, WORKING ASSUMPTIONS AND POTENTIAL SOLUTIONS", 3GPP TSG-SA4 MEETING #106 S4-191256, vol. VERSION 0.4.1, JPN6023020642, 25 October 2019 (2019-10-25), US, ISSN: 0005062821 *

Also Published As

Publication number Publication date
WO2021105552A8 (en) 2022-09-01
WO2021105552A1 (en) 2021-06-03
EP4066507A4 (en) 2023-11-22
JP7397985B2 (ja) 2023-12-13
EP4066507A1 (en) 2022-10-05
CN114982249A (zh) 2022-08-30
US20230012201A1 (en) 2023-01-12

Similar Documents

Publication Publication Date Title
JP7397985B2 (ja) 映像符号化および映像復号のための方法、装置およびコンピュータプログラム
JP6721631B2 (ja) ビデオの符号化・復号の方法、装置、およびコンピュータプログラムプロダクト
US10565463B2 (en) Advanced signaling of a most-interested region in an image
US20190104326A1 (en) Content source description for immersive media data
US11094130B2 (en) Method, an apparatus and a computer program product for video encoding and video decoding
US10575018B2 (en) Enhanced high-level signaling for fisheye virtual reality video in dash
CA2800398A1 (en) Systems and methods for scalable video communication using multiple cameras and multiple monitors
US10659760B2 (en) Enhanced high-level signaling for fisheye virtual reality video
US20230033063A1 (en) Method, an apparatus and a computer program product for video conferencing
US20180343472A1 (en) High-level signalling for fisheye video data
EP4128808A1 (en) An apparatus, a method and a computer program for video coding and decoding
Osuagwu et al. Video conferencing: most effective technology to run assemblies and meetings for large audience dispersed in distant locations: is it feasible to deploy in Nigeria?
US20230146498A1 (en) A Method, An Apparatus and a Computer Program Product for Video Encoding and Video Decoding
US20230421743A1 (en) A method, an apparatus and a computer program product for video encoding and video decoding
US20240187673A1 (en) A method, an apparatus and a computer program product for video encoding and video decoding
Ahsan et al. Viewport-Dependent Delivery for Conversational Immersive Video
WO2022219229A1 (en) A method, an apparatus and a computer program product for high quality regions change in omnidirectional conversational video
EP4236326A1 (en) A method, an apparatus and a computer program product for transmission of immersive media
EP4349023A1 (en) A method, an apparatus and a computer program product for video encoding and video decoding
WO2021198550A1 (en) A method, an apparatus and a computer program product for streaming conversational omnidirectional video
WO2022263709A1 (en) A method, an apparatus and a computer program product for video conferencing
US20240007603A1 (en) Method, an apparatus and a computer program product for streaming of immersive video
EP3777219B1 (en) Method and apparatus for signaling and storage of multiple viewpoints for omnidirectional audiovisual content
WO2022269125A2 (en) An apparatus, a method and a computer program for video coding and decoding

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220527

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231101

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231201

R150 Certificate of patent or registration of utility model

Ref document number: 7397985

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150