JP6440747B2 - Hevcでタイル化されたビデオ・ストリームに基づく関心領域の決定 - Google Patents

Hevcでタイル化されたビデオ・ストリームに基づく関心領域の決定 Download PDF

Info

Publication number
JP6440747B2
JP6440747B2 JP2016575351A JP2016575351A JP6440747B2 JP 6440747 B2 JP6440747 B2 JP 6440747B2 JP 2016575351 A JP2016575351 A JP 2016575351A JP 2016575351 A JP2016575351 A JP 2016575351A JP 6440747 B2 JP6440747 B2 JP 6440747B2
Authority
JP
Japan
Prior art keywords
roi
stream
hevc
video
tile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016575351A
Other languages
English (en)
Other versions
JP2017527160A (ja
Inventor
トーマス,エマニュエル
ヴァン・ブランデンブルク,レイ
マティス・オスカー ヴァン・デーフェンテル,
マティス・オスカー ヴァン・デーフェンテル,
Original Assignee
コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ filed Critical コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ
Publication of JP2017527160A publication Critical patent/JP2017527160A/ja
Application granted granted Critical
Publication of JP6440747B2 publication Critical patent/JP6440747B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/084Configuration by using pre-existing information, e.g. using templates or copying from other elements
    • H04L41/0843Configuration by using pre-existing information, e.g. using templates or copying from other elements based on generic templates
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234363Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440263Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4728End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/858Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot
    • H04N21/8586Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot by using a URL

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Image Processing (AREA)

Description

本発明は、関心領域(ROI:region-of-interest)の決定に関するものである。排他的ではないが、特に、HEVCでタイル化された1つ以上のビデオ・ストリームに基づいて関心領域を決定する方法、関心領域の決定およびレンダリングのためのクライアント・デバイス、関心領域を決定およびレンダリングするためのビデオ・ストリームおよびデータ構造を格納するための非一時的コンピュータ可読記憶媒体、並びに当該方法を用いたコンンピュータ・プログラム製品に関するものである。
過去数年にわたり、カメラおよびイメージ処理技術の両方の進化により、より高い解像度の記録を可能にするのみならず、複数のカメラの出力をスティッチングも可能にする。これにより、カメラのセットが、8K×4Kよりも高い解像度を有する全(full)360度カメラで共に記録することができる。
これらの発展は、ユーザがビデオを経験する方法を変更するのを可能にする。従来は、例えばフットボールの試合の放送は、ディレクタによって慎重に整列および制御された一連のカメラ・ショットを含む。このようなブロードキャスト・ストリームでは、最終的なストリームでの各カメラの移動は、カメラ自体の位置、角度またはズーム・レベルへの物理的な変更に対応する。しかしながら、高解像度のパノラマ・ビデオは、ユーザ(および/またはディレクタ)が物理的な意味でカメラを操作する必要がなく視聴している(指示している)ビデオとのユーザ(および/またはディレクター)の相互作用をある程度可能にする。パン・チルト・ズームの相互作用を用いて、高解像度パノラマ・ビデオから、ユーザまたはディレクタが関心のあるビデオのサブ領域を抽出するのを可能にする。このサブ領域は、関心領域(ROI)と称されることがある。
特定の使用例では、時間内の如何なる所与の瞬間で、特定のユーザは全ビデオ・パノラマのサブセットを視聴しているに過ぎないため、帯域幅要件は、ユーザが関心のあるビデオ部分のみを送ることによって減らすことができる。このような機能性を達成することができる数多くの技術がある。これら技術の1つは、所謂、タイル化されたストリーミング技術であり、これを用いて、全ビデオ・パノラマが多数の独立したエンコード・ビデオに分割される。これにより、クライアントは多数のデコーダを有し、必要であれば数多くのこのような独立したビデオでスティッチングすることによって、如何なる全ビデオ・パノラマ部分も再構築するのを可能にする。
しかしながら、大部分のユーザ・シナリオでは、ユーザが、ビデオ・パノラマと継続的に相互作用する必要はなく、或いは望まれてさえいない。フットボールの試合の場合では、例えば、ユーザは特定の時点(例えば、画面外でファイルが行われたが、ディレクタが代わりにボールを追従することを決めた時)にビデオとの相互作用に関心があるに過ぎないことが想像され得る。しかしながら、ほとんどの時間では、ユーザはディレクタのリードを追従するのを望むに過ぎないこともある。このような場合、タイル化されたストリーミングの使用は、ビデオをストリーミングする最も効率的な方法ではない。この理由の1つに、エンコーディング方式で使用される時間的および空間的予測は最適化されないという事実がある。何故ならば、時間的および空間的予測は、タイル・サイズによって制限されるからである。第2の理由は、任意の所与のタイルのセットは、ほとんど正確にはROIを含まないことになるために、幾らかの追加のピクセル/マクロブロックが送られ、これらは所与のROIを再構築するのに厳格には必要とされないということである。
Marvlankar.Aらによる記事「An interactive region-of-interest video streaming system for online lecture viewing(オンライン講義視聴のためのインタラクティブな関心領域のビデオ・ストリーミング・システム)」PacketVideo Workshop(PV)、2010年第18回International、第64から71頁、2010年12月13日から14日には、「トラッキング・タイル」のコンセプトが説明される。このトラッキング・タイルは、独立してエンコードされたビデオであり、連続的に更新されたビデオ・パノラマの切り取り(crop)を含む。トラッキング・タイル・モードを選択することによって、ユーザは、ビデオ・パノラマ自体の周囲をナビゲートする必要なく、ビデオ・パノラマにおいて移動する特定の関心ポイント(point of interest)(例えば、フットボールの試合でのボールの位置)を受動的に追従することができる。ビデオ・パノラマ内のトラッキング・タイルの位置は、規則的なブロードキャストが行われるのと同様の方法で、ディレクタによって制御される、或いは、自動イメージ認識システムによって制御されるということが想像され得る。
トラッキング・タイルの使用により、ビデオ・パノラマの中をナビゲートする自由をユーザに提供し、ユーザが関心ポイントを受動的に追従するのを可能にするが、Mavlankarらによるトラッキング・タイルのコンセプトは、トラッキング・タイルの追従からパノラマ自体を通じたユーザ・ナビゲーティングとのシームレスな移行を実行することはできない。フットボールの試合でボールを追従するトラッキング・タイルを視聴するユーザが想定される場合、ユーザは突然、例えば行われたファウルを見るために、より少し左方向に移動したいと望むこともある。
Mavlankarらにより説明されるトラッキング・タイル方式ではシームレスな移行は可能ではない。何故ならば、システムは、所与の時点でビデオ・パノラマにおけるトラッキング・タイルの位置を認識しないからである。つまり、ユーザは、パノラマ自体の特定の位置を見つけなければならず、これにより、連続的な経験が阻害される。トラッキング・タイル・モードとユーザ制御モード間の切り替えは重大な時間を要し、リソースの浪費という結果となる。何故ならば、ユーザが関心を有しないビデオ・タイルがレンダリングされ、表示されるからである。
したがって、従来技術では、クライアントに対し、広視野イメージ領域を有するROIの効率的なストリーミングを可能にする方法およびシステムを改良する必要性がある。更に、従来技術では、クライアントへの単一ストリームに基づくROIのストリーミング(タイル化されていないモード)と、クライアントへの1つ以上の別個のタイル・ストリームに基づくROIのストリーミング(タイル化されたモード)との間をスムーズまたは一層のことシームレスに切り替えるのを可能にすることの必要性がある。
本発明の目的は、従来技術で知られる欠点の内少なくとも1つを減らすかまたは除去することである。
第1の態様では、本発明は、少なくとも1つのHEVCでタイル化された(パノラマ)ビデオ・ストリームに基づいてクライアント・デバイスの関心領域(ROI)を決定および/またはレンダリングする方法に関する。
一実施形態では、本方法は、好ましくはクライアント・デバイスにおいて、HEVCでタイル化されたビデオ・ストリームの全イメージ領域内に第1サブ領域を規定する第1ROIをレンダリングするためにROIビデオ・ストリームを受け取るステップであって、HEVCでタイル化されたパノラマ・ビデオにおけるHEVCタイルの位置がタイル位置情報によって規定される、ステップと、好ましくはクライアント・デバイスにおいて、ROIビデオ・ストリームの少なくとも1つのビデオ・フレームに関連付けられるROI位置情報を供給するステップであって、ROI位置情報が第1ROIの少なくとも第1位置を含む、ステップと、好ましくはクライアント・デバイスにおいて、HEVCでタイル化されたビデオ・ストリームにおける1つ以上のHEVCタイルを、ROI位置情報およびタイル位置情報に基づいて特定するステップであって、好ましくは、第1ROIと重複する1つ以上のHEVCタイルを特定するステップと、好ましくはクライアント・デバイスにおいて、HEVCでタイル化されたビデオ・ストリームが有する全イメージ領域内に第2サブ領域を規定する第2ROIをレンダリングするために、1つ以上の特定されたHEVCタイルに関連付けられるビデオ・データを要求するステップと、を含む。なお、本発明のベスト・モードが、本方法のステップを実行するクライアント・デバイスに関して規定されるが、本発明はまた、本発明による方法の特定のステップがクライアント・デバイス以外のエンティティによって実行される実施形態も想定することに留意されるべきである。例えばROI位置情報およびタイル位置情報がクライアント・デバイスとは異なる別のエンティティ(例えば、サーバ・コンピュータのような、クライアント・デバイスに接続されるデバイス)に供給される場合は、当該別のエンティティ(他方のデバイス)は上記の特定ステップを実行してもよい。
したがって、ROIストリームは、HEVCでタイル化されたビデオ・ストリームの全イメージ領域におけるサブ領域(ROI)のコンテンツ(例えばビデオ・データ)を含んでもよい。HEVCでタイル化されたビデオは、高解像度または極めて(ultra)高解像度ビデオでもよい。或いは、HEVCでタイル化されたストリームが、数多くの異なるビデオ(例えば異なるカメラ・アングル)から形成(構成/スティッチ)されてもよい。ROIストリームの再生の間、ROIの位置(HEVCでタイル化されたストリームにおいてHEVCでタイル化されたイメージ領域内のサブ領域が有する空間的位置または方向)は、時間と共に変化する。
タイル化されていないROIストリームに基づくROIのレンダリング(ROIストリーミング・モード)、例えば、従来のタイル化されていないMPEGストリームから、HEVCタイル(タイル化されたストリーミング・モード)とも称されるHEVCでタイル化された1つ以上のストリームに基づくROIのレンダリングへとスティッチングするとき、ROIビデオ・ストリームにおける少なくとも1つのイメージ・フレームの位置(即ち、ROI座標)を含むROI位置情報を使用して、1つ以上のHEVCタイルにおけるHEVCでエンコードされたビデオ・データを決定することができる。当該HEVCでエンコードされたビデオ・データは、クライアント・デバイスがHEVCタイルのストリーミング・モードを開始するときに使用(例えば、要求、取り出しおよびレンダリング)することになる。ROIストリーム(ROIビデオ・ストリームとも称される)におけるROIの位置は、フレーム・レベルで、即ち、クライアント装置によって受け取られたビデオ・フレームで供給される。その結果、タイル化されたストリーミング・モードへのスムーズまたはシームレスな移行を実現することができる。
HEVC規格は、所謂HEVCタイルをサポートする。HEVCエンコーダを構成して、ビデオ・フレームを、所謂HEVCタイルのビデオに分割する。ここでは、HEVCタイルはCTUを特定のグルーピングによって規定される矩形領域である。HEVCタイルは、パノラマ・ビデオのイメージ領域を多数の隣接する矩形領域に分割する。ここでは、HEVCタイルの境界は、行および列方向のHEVCタイル境界によって規定される。本出願では、HEVCタイルを含むHEVCでエンコードされたビデオ・ストリーム(HEVCストリーム、HEVCビデオ、またはHEVCビデオ・ストリームとも称される)は、HEVCでタイル化されたビデオ・ストリームと称されることもある。HEVCタイルは、別個に要求および取り出されてもよく、HEVCタイル・ストリームとも称される。これらのHEVCタイル・ストリーム/HEVCタイルは、共に、HEVCでエンコードされたビデオを形成する。
HEVCタイルは、当初、HEVCでタイル化されたストリームを並列で処理(エンコードおよびデコード)されるために、マルチ・コア・プロセッサを使用したビデオ・データのエンコードおよびデコード用にHEVC規格で導入されたものである。HEVCでタイル化されたストリームはまた、HEVCでタイル化されたストリームにおいてHEVCタイルが有するサブセットのみの取り出しおよび/または再生のために使用される。
このようなサブセットは、例えば、パノラマ・ビデオ(HEVCでタイル化されたビデオ)のイメージ領域(全イメージ領域)内の/イメージ領域(全イメージ領域)が有する関心の領域(ROI)、例えばサブ領域に関する。その場合、デコーダが多数フレームにわたるHEVCタイルのサブセットだけをデコードできるように、HEVCタイルは、経時的に独立してエンコードされなければならない。独立してデコード可能なHEVCタイルの当該セットを生成するために、HEVC規格は、HEVCエンコーダが、1つ以上のHEVCタイルの境界内でビデオ・コーディング(例えばモーション・ベクトルおよびイン・ループ・フィルタ)の時間的予測を制限するように構成されるのを可能にする。単一のHEVCデコーダによるHEVCタイルの処理は、HEVCタイル・ストリームごとに別個のデコーダ(またはデコーダ・インスタンス)を必要とする他のコーデックを用いて、従来技術で説明されるタイル方式と比較して、リソースの点で著しい利点を提供する。
本開示にて説明するように、タイルのコンセプトは、異なるビデオコーデックによってサポートされる。例えば、例示の高効率ビデオ・コーディング(HighEfficiency Video Coding)(HEVC)は、独立してデコード可能なタイル(HEVCタイル)の使用を可能にする。HEVCタイルは、エンコーダによって生成され、メディア・ストリームの各ビデオ・フレームを数多くの行および列(「タイルのグリッド(a grid of tiles)」)に分割する。タイルのグリッドは、コーディング・ツリー・ブロック(CTB)のユニットで表現される所定の幅と高さを有するタイルを規定する。HEVCのビットストリームは、ビデオ・フレームがどのようにタイルに分割されるべきかについてデコーダに通知するためのデコーダ情報を含む。デコーダ情報は、ビデオ・フレームのタイル分割について異なる方法でデコーダに通知してもよい。1つの変形態様では、デコーダ情報は、n×m個のタイルの均一グリッドに関する情報を含んでもよい。ここでは、グリッド内のタイルのサイズは、フレームの幅およびCTBサイズに基づいて導き出す(deduce)ことができる。丸めによる不正確さのために、全てのタイルが、全く同一サイズを有するわけではない。他の変形態様では、デコーダ情報は、(例えばコーディング・ツリー・ブロックのユニットで)タイルの幅と高さに関する明示的な情報を含んでもよい。この方法では、ビデオ・フレームは、異なるサイズのタイルに分割されてもよい。最後の行および最後の列のタイルについてのみ、そのサイズが残りの数のCTBから導出される。その後に、パケタイザーは、生のHEVCビットストリームを、トランスポート・プロトコルによって使用される適切なメディア・コンテナにパケット化する。
独立してデコード可能なタイルをサポートする他のビデオコーデックには、GoogleのビデオコーデックVP9、またはある程度は、MPEG−4パート10のAVC/H.264(高度ビデオ・コーディング(AVC; Advanced Video Coding)規格)が含まれる。VP9では、コーディング依存性が垂直方向のタイル境界に沿って損なわれる。このことは、同一タのイル行の2つのタイルが同時にデコードされることを意味する。同様に、AVCエンコーディングでは、スライスが使用されて、各フレームを多数行に分割する。ここでは、これら行の各々は、メディア・データが独立してデコード可能であるという意味でタイルを規定する。したがって、本開示では、「HEVCタイル」なる用語は、HEVC規格にしたがうタイルのみに制限されるのではなく、全般的に、ビデオ・フレームのイメージ領域内で、任意に形状および/または寸法を有するサブ領域を規定するものである。ここでは、タイルの境界内のメディア・データは独立してデコード可能である。他のビデオコーデックでは、セグメントまたはスライスのような他の用語が、このように独立してデコード可能な領域のために使用される。なお、本発明は、HEVC(例えばVP9)とは異なる、或いはHEVCから(将来的に)導出されるビデオコーデックがビデオをエンコードするのに適した特性を有する限りにおいて、これらビデオコーデックの用途に同等に適していることに更に留意されるべきである。これにより、ビデオを表すイメージの異なる領域(サブ領域)は、単一のエンコーディング・プロセスで独立してエンコードすることができ、また、これにより、独立してエンコードされた領域は、単一のデコーディング・プロセスでデコードすることができる。独立してという語は、エンコーディング依存性がこれら領域の間で何ら存在しないように、コーディングが実行されるという意向に関するものである。
一実施形態では、本方法は、更に、要求されたビデオ・データおよびROI位置情報に基づいて第2ROIをレンダリングするステップを含む。
一実施形態では、ROI位置情報を供給するステップが、更に、ROIビデオ・ストリームの少なくとも第1イメージ・フレームの第1ROI座標を供給するステップであって、第1ROI座標が、第2ROIをレンダリングする指示を受け取る第1時間インスタンスで、第1ROIの第1位置を規定するステップを含み、好ましくは、上記指示は、ユーザが出した指示である。本実施形態では、フレームのROI座標は、クライアント・デバイスが指示された瞬間に、例えばユーザ相互作用を通じて、クライアント・デバイスによって処理され、HEVCタイルのストリーミング・モード(即ち、所定の(「ディレクタ・カット」の)ROIをレンダリングするROIストリームではなく、HEVCタイルに基づくユーザが開始するROIのレンダリング)に切り替えるのに必要とされる1つ以上のHEVCタイルを決定するのに使用する。
一実施形態では、上記指示は、第1ROIの位置の変更を示すROIベクトルを含み、第1ROI座標およびROIベクトルが1つ以上のHEVCタイルを特定するのに使用される。ROIベクトルは、特定のユーザ相互作用(例えば、パニング、ズーミング、および/またはチルティング)と関連付けられ、また、要求されたユーザ相互作用に適したタイル表現を選択するのに使用される。
一実施形態では、ROI位置情報を供給するステップが、更に、ROIビデオ・ストリームの少なくとも第2イメージ・フレームの第2ROI座標を供給するステップであって、第2ROI座標が、処理(受け取り、バッファ、および/またはデコード)の第2時間インスタンスで、第1ROIの第2位置を規定するステップを含み、第1ROI座標および第2ROI座標が1つ以上のHEVCタイルを特定するのに使用される。本実施形態では、HEVCタイル・ストリームの要求と、クライアント・デバイスによるHEVCタイル・ストリームの処理との間でROIが移動することによる不利益な影響を低減させることができる。
一実施形態では、要求されたビデオ・データがHEVCでエンコードされ、第2ROIをレンダリングするステップが、要求されたHEVCでエンコードされたビデオ・データに基づいて、デコードされたイメージ領域を形成するステップと、任意で、デコードされたイメージ領域から第2ROIを切り取る(crop)ステップと、を含む。決定されたHEVCタイルが有するビデオ・データを使用して、イメージ領域の第2サブ領域を形成する。ROI座標を使用して、第2サブ領域から第2ROIを作成して(切り取って)、タイル化されたストリーミング・モードへのスムーズな移行を確実なものにすることができる。
一実施形態では、ROI位置情報を供給するステップが、更に、先行位置情報がクライアント・デバイスに供給された瞬間に、クライアント・デバイスによって未だ受け取られていないROIビデオ・ストリームの少なくとも1つのビデオ・フレームに関連付けられる先行位置情報を供給するステップを含み、先行位置情報が全イメージ領域における第2ROIの第2位置を含む。
ROI位置情報は時間シフトすることができ、クライアント・デバイスが時間的に前のROI位置情報を受け取ることができる。このようにして、ROIが非常に動的なものである場合(例えば、ROIに関連付けられたサブ領域において、HEVCでタイル化された(パノラマ)ビデオの全イメージ領域内の空間方向が頻繁に変化する場合)でさえも、クライアントは正確なHEVCタイル・ストリームを要求することができる。本実施形態は、動的なROI軌跡(trajectory)を含むROIストリームを取り扱うときに、特に有利である。
時間シフトは、HEVCタイル・ストリームの要求と、クライアント・デバイスによるHEVCタイル・ストリームの処理との間の時間期間にわたるROIの移動を埋め合わせる(compensate)。このようにして、要求されたHEVCタイル・ストリームによって形成されるサブ領域は、常に、要求されたROIを含む。
一実施形態では、上記の先行位置情報が、クライアント・デバイスによって未だ受け取られていないROIビデオ・ストリームの1つ以上のイメージ・フレームにおける1つ以上の時間シフトされた第1ROI座標を含む。好ましくは、当該時間シフトされた第1ROI座標は1つ以上のイメージ・フレームよりも前にクライアント・デバイスに供給され、より好ましくは、当該時間シフトされたROI座標は、時間シフトを決定する時間シフト情報、好ましくはタイムスタンプに更に関連付けられる。
一実施形態では、ROI位置情報の少なくとも一部がROIビデオ・ストリームのビットストリームにおいてクライアント・デバイスに搬送され、好ましくは、SEIメッセージまたはROI座標フラグがビットストリームのROI座標の位置を規定する。
一実施形態では、ROI位置情報の少なくとも一部が、MPEGトランスポート・ストリームにおいて、好ましくは、MPEGトランスポート・ストリームの基本(elementary)トランスポート・ストリームにおいて、または、MPEGトランスポート・ストリームにおけるDVBで規定されたSAD(同期補助データ; Synchronized Auxilary Data)パケットとして、クライアント・デバイスに搬送され、任意で、上記SADパケットが、時間シフトされたROI座標を含む。
一実施形態では、ROI位置情報の少なくとも一部がMPEG−4ストリームの所定のボックスにおいて、好ましくは、MPEG−4ストリームのmoov、trakおよび/またはstblボックスにおいて搬送される。
一実施形態では、ROI位置情報の少なくとも一部が、ウォータマークとして、好ましくは、ROIビデオ・ストリームにおけるウォータマークとして、クライアント・デバイスに搬送される。
一実施形態では、タイル位置情報の少なくとも一部が、HEVCでタイル化されたビデオ・ストリームにおいて、好ましくは、HEVCでタイル化されたビデオ・ストリームのmoovまたはmoofボックスにおいて、クライアント・デバイスに供給される。
一実施形態では、HEVCタイルのビデオ・データは記録領域における別個のビデオ・トラックとして、および、ビデオ・トラックをポイントする1つ以上のエクストラクタを含む少なくとも1つのベース・トラックとして格納される。
一実施形態では、タイル位置情報の少なくとも一部は、空間的マニフェスト・ファイルにおいてクライアント・デバイスに供給され、当該マニフェスト・ファイルが、1つ以上の配信ノードを位置決定するための1つ以上のストリーム識別子を含む。1つ以上の配信ノードが、HEVCでタイル化されたビデオ・ストリームおよび/またはROIビデオ・ストリームをクライアント・デバイスに配信するように構成される。
一実施形態では、1つ以上の特定されたHEVCタイルに関連付けられたビデオ・データが、少なくとも1つ以上のHEVCタイル識別子(好ましくは1つ以上のURL)およびタイル位置情報を含む空間的マニフェスト・ファイルに基づいて要求される。また、任意で、1つ以上のROIビデオ・ストリームに関連付けられる1つ以上のROIビデオ・ストリーム識別子(好ましくは1つ以上のビデオ・ストリーム識別子の少なくとも1つ)は、ROI位置情報が時間と共に変化することを示す動的なインジケータに関連付けられる。
一実施形態では、HEVCでエンコードされた画像データは、空間的マニフェスト・ファイルに基づいて要求される。当該マニフェスト・ファイルは、1つ以上のHEVCタイル表現を含み、それぞれがHEVCでタイル化されたビデオ・ストリームに関連付けられる。1つのHEVCタイル表現は、1つ以上のHEVCタイル識別子(好ましくは1つ以上のURLの少なくとも一部)を含み、1つ以上のHEVCでタイル化されたストリーム、および/または1つ以上のHEVCタイル・ストリームに関連付けられる。各HEVCタイル表現は、それ自体のHEVCでタイル化されたビデオ・ストリーム(例えば、各表現が異なるズーム・レベルに関係し、各ズーム・レベルのそれぞれが同一の全イメージ領域を包含する訳ではないとき)に関連付けられ、および/または単一のHEVCビデオ(ファイルまたはストリーム)(例えば、各ズーム・レベルが同一の全イメージ領域を包含する場合)に関連付けられる。
別の態様では、本発明は、関心領域(ROI)をレンダリングするクライアント・デバイスに関する。当該クライアントは、HEVCでタイル化されたビデオ・ストリームの全イメージ領域内に第1サブ領域を規定する第1ROIをレンダリングするためにROIビデオ・ストリームを受け取り、HEVCでタイル化されたビデオ・ストリームの位置がタイル位置情報によって規定され、ROIビデオ・ストリームの少なくとも1つのビデオ・フレームに関連付けられるROI位置情報を供給し、上記ROI位置情報が第1ROIの第1位置を少なくとも含み、HEVCでタイル化されたビデオ・ストリームにおける1つ以上のHEVCタイルを、ROI位置情報およびタイル位置情報に基づいて特定し、好ましくは、第1ROIと重複する1つ以上のHEVCタイルを特定し、HEVCでタイル化されたビデオ・ストリームの全イメージ領域内に第2サブ領域を規定する第2ROIをレンダリングするために、好ましくは1つ以上のHEVCタイル・ストリームに含まれる、1つ以上の特定されたHEVCタイルに関連付けられるビデオ・データを要求し、そして任意で、要求されたビデオ・データおよびROI位置情報に基づいて第2ROIをレンダリングするように構成される。
別の態様では、本発明は、ビデオ・データを格納する、記録領域を含む非一時的コンピュータ可読記憶媒体に関し、ROIストリームのビデオ・データであって、ROIが、HEVCでタイル化されたビデオ・ストリームの全イメージ領域内にサブ領域を規定するビデオ・データと、全イメージ領域のサブ領域が有する位置情報、好ましくは座標と、を含む。
一実施形態では、上記の位置情報はROIストリームのビットストリームに挿入され、好ましくは、SEIメッセージまたはROI座標フラグがビットストリームにおいてROI座標の位置を規定する。
一実施形態では、ビデオ・データがMPEGトランスポート・ストリームとして記録され、ROI位置情報の少なくとも一部がMPEGトランスポート・ストリームに収容される。
一実施形態では、ROI位置情報は、基本トランスポート・ストリームとして、またはDVBで規定されたSAD(同期補助データ;Synchronized Auxiliary Data)として、MPEGトランスポート・ストリームに収容される。更なる実施形態では、SADパケットは、時間シフトされた1つ以上のROI座標を含む。
一実施形態では、ビデオ・データはMPEG4ストリームとして記録され、ROI位置情報の少なくとも一部が、所定のボックスにおいて、好ましくは、moov、trakおよび/またはstblボックスにおいてMPEG4ストリームに収容される。
一実施形態では、ROI位置情報の少なくとも一部が、ウォータマークとしてビデオ・データに挿入される。
更なる別の態様では、本発明は、格納されたデータ構造、好ましくは空間的マニフェスト・ファイルの少なくとも一部を有する非一時的コンピュータ可読記憶媒体に関し、好ましくは上記のクライアント・デバイスによって使用するのに適する。当該データ構造は、1つ以上のHEVCタイル表現であって、それぞれがHEVCでタイル化されたビデオ・ストリームを表し、1つのHEVCタイル表現が、1つ以上のHEVCタイルを特定する1つ以上のHEVCタイル識別子を含むHEVCタイル表現と、HEVCでタイル化されたビデオ・ストリームにおいてHEVCタイルの位置を規定するタイル位置情報と、を含む。当該データ構造は、更に、ROI位置情報を含むROIストリームにおける少なくとも1つのROIストリーム識別子、好ましくはURLであって、ROIストリームが、HEVCでタイル化されたビデオ・ストリームにおける全イメージ領域内にサブ領域を規定する第1ROIをレンダリングするビデオ・データを含むROIストリーム識別子を含む。或いは、またはこれに加えて、当該データ構造は、HEVCでタイル化されたビデオ・ストリームにおける全イメージ領域内のサブ領域の位置を規定するROI位置情報を含む。この選択肢は、例えば、ROIストリームがROI位置情報を有しないような場合に見込まれる。好適な実施形態では、データ構造は、HTTP適用型ストリーミング・プロトコルに基づいて、HEVCでタイル化されたストリームとしてタイルを取り出すように構成される。
本発明はまた、コンピュータのメモリにおいて起動されると、如何なる上述した方法のステップを実行するソフトウェア・コード部を有するコンピュータ・プログラム製品にも関する。
本発明について、これより、本発明による実施形態を概略的に示した添付の図面を参照して更に説明する。本発明が、如何なる方法であれ、これらの特定の実施形態に限定されないことが理解されるであろう。
図1は、本発明の一実施形態による関心領域(ROI)ストリーミング・プロセスを示す。 図2は、本発明の一実施形態によるROIストリーミング・プロセスを示す。 図3は、本発明の一実施形態によるROIストリーミング・プロセスで使用されるHEVCでエンコードされたMPEGファイルのデータ・フォーマットを示す。 図4は、本発明の一実施形態によるROIストリームおよび関連するタイル化されるコンテンツを生成するプロセスを概略的に示す。 図5は、発明の一実施形態によるROIストリーミング・プロセスを管理するためのデータ構造を示す。 図6は、発明の一実施形態によるROIストリーミング・プロセスを管理するための空間的マニフェスト・ファイルを示す。 図7は、発明の一実施形態によるROIストリーミング・プロセスを管理するための空間的マニフェスト・ファイルを示す。 図8Aは、発明の一実施形態によるROIストリーミング・プロセスを管理するための空間的マニフェスト・ファイルを示す。 図8Bは、発明の一実施形態によるROIストリーミング・プロセスを管理するための空間的マニフェスト・ファイルを示す。 図9は、発明の一実施形態による空間的マニフェスト・ファイルに基づいてROIストリームをレンダリングするように構成されるクライアント・デバイスを示す。 図10Aは、発明の一実施形態によるROIストリームをレンダリングするプロセスの概要を示す。 図10Bは、発明の一実施形態によるROIストリームをレンダリングするプロセスの概要を示す。 図11Aは、発明の一実施形態によるROIストリーミング・プロセスのフロー図を示す。 図11Bは、発明の一実施形態によるROIストリーミング・プロセスのフロー図を示す。 図12Aは、本発明の一実施形態により、タイル化されていないROIストリーミング・モードおよびタイル化されたROIストリーミング・モードの間をシームレスに切り替えるプロセスの概要を示す。 図12Bは、本発明の一実施形態により、タイル化されていないROIストリーミング・モードおよびタイル化されたROIストリーミング・モードの間をシームレスに切り替えるプロセスの概要を示す。 図13Aは、本発明の別の実施形態により、タイル化されていないROIストリーミング・モードおよびタイル化されたROIストリーミング・モードの間をシームレスに切り替えるプロセスの概要を示す。 図13Bは、本発明の別の実施形態により、タイル化されていないROIストリーミング・モードおよびタイル化されたROIストリーミング・モードの間をシームレスに切り替えるプロセスの概要を示す。 図14は、本発明の様々な実施形態によるROIデータ・フォーマットを示す。 図15は、本発明の一実施形態により、MPEGトランスポート・ストリームの基本ストリームとしてROIデータを搬送するためのデータ・フォーマットを示す。 図16Aは、MPEGストリームにおけるエンコードされたビットストリームのROIデータを搬送するためのデータ・フォーマットを示す。 図16Bは、MPEGストリームにおけるエンコードされたビットストリームのROIデータを搬送するためのデータ・フォーマットを示す。 図17Aは、MPEG−4ストリームの新規のボックスにおいてROIデータを搬送するためのデータ・フォーマットを示す。 図17Bは、MPEG−4ストリームの新規のボックスにおいてROIデータを搬送するためのデータ・フォーマットを示す。 図18は、MPEG−4ストリームのメタデータ・トラックとしてROIデータを搬送するためのデータ・フォーマットを示す。 図19Aは、本発明の一実施形態により、タイル化されたストリーミングのための空間的バッファの使用を示す。 図19Bは、本発明の一実施形態により、タイル化されたストリーミングのための空間的バッファの使用を示す。 図20は、本発明の一実施形態による3モードのROIストリーミング・モデルを示す。 図21は、図1から図20を参照して説明したシステムおよび方法で使用される例示のデータ処理システムを示すブロック図である。
図1は、本発明の一実施形態による関心領域(ROI)ストリーミング・プロセスを示す。本出願では、ROIは、イメージ領域100(例えば、ソース・ビデオの広視野(パノラマ)イメージ領域)のサブ領域106,110として規定される。ソース・ビデオは、1つ以上の高解像度ビデオ・ファイルに基づいて(例えば組み合わせにより)形成される。高解像度ビデオ・ファイルは、広視野、異なるカメラ位置、異なるカメラ角、および3D等を有することができる。イメージ領域100内のROIの位置およびサイズは、ROI座標系103に基づいて規定される。図1に示されるように、ROIはROI軌跡を追従する。ここでは、第1ROIは、第1時間インスタンスではイメージ領域内の第1位置106にあり、第2時間インスタンスでは第2位置110にある。
ROIは、トラッキング・アルゴリズムまたはカメラ・オペレータを用いて事前選択することができる。ストリームは、ソース・ビデオにおいてデコードされたフレームのイメージ領域からROIを切り取ることによって、また、別個のストリーム(例えば、MPEGおよび/またはDVBでエンコードされたストリーム)において切り取った領域をエンコードすることによって生成される。このストリームは、ROIストリーム107と称される。切り取られた領域の座標は、ROI座標と称される。例えば、ソース・ビデオは、サッカーの試合における高解像度および広視野(パノラマ)のビデオに関する。ROIストリームは、ソース・ビデオに基づいて、ソース・ビデオのデコードされたフレームから、ボールに関連付けられるROIを切り取ることによって生成される。
或いは、ROIストリームは、例えば、ボールを追従するブロードキャスト・カメラから生じる別個のストリームとして生成することができる。その場合、イメージ・プロセッサは、公知のイメージ認識およびトラッキング・アルゴリズムを用いて、ブロードキャスト・ビデオの(制限された)視野を、ソース・ビデオの広視野イメージ領域が有する特定のサブ領域(ROI)と関連付けることができる。このようにして、イメージ・プロセッサは、所謂ROI座標を、ROIストリームのフレームに関連させることができる。
一実施形態では、ROIストリームは、ブロードキャスト技術(例えば、DVBまたはマルチキャスト技術)を使用して送信される。他の実施形態では、ROIストリームは、適応型プロトコル(例えばHTTPAdaptive Streaming(HAS))に基づいてクライアントに送信される。そのためには、マニフェスト・ファイル108は、クライアントにセグメントを配信するように構成される1つ以上の配信ノードを位置特定するセグメント識別子、例えばURL(の一部)を規定する。適応型ストリーミング・プロトコルの例には、Apple HTTP Live Streaming[http://tools.ietf.org/html/draft-pantos-http-live-streaming-13]、Microsoft Smooth Streaming[http://www.iis.net/download/SmoothStreaming]、Adobe HTTP DynamicStreaming[http://www.adobe.com/products/httpdynamicstreaming]、3GPPーDASH[TS 26.247 Transparent end-to-end Packet-switched Streaming Service(PSS); Progressive Download and Dynamic Adaptive Streaming over HTTP]、およびMPEG Dymanic AdaptiveStreaming over HTTP[MPEG DASH ISO/IEC 23001-6]が含まれる。HTTPは、効率的で、ファイアウォール・フレンドリで、且つスケーラブルなスキームによって、ビデオ・ストリーム(およびセグメント)をクライアントに配信するのを可能にする。
一実施形態では、ROIストリームは、HEVCコーデックを使用してエンコードされる。上記の例では、ROI位置情報112は、ROIストリームが形成されるときに決定される。ROI位置情報は、ソース・ビデオの広視野イメージ領域内で、ROIビデオの(制限付き視野の)イメージ領域の位置を規定する。したがって、ROIビデオのビデオ・フレームは、ソース・ビデオにおけるビデオ・フレームのイメージ領域内にサブ領域を規定する。ROI位置情報はROI座標を含む。ROI座標は、ソース・ビデオにおけるイメージ領域内にROIの位置およびサイズを規定する。実施形態では、ROIストリームのフレーム(またはフレームのセット)ごとに、ROI位置情報(ROI座標)が生成される。ROIストリームの再生の間、ROIの位置は、ソース・ビデオの全イメージ領域内で移動する。ROIストリームの再生の間、ROI座標が時間と共に変化することにより、ROI座標のストリームが形成される。ROI座標のストリームは、ソース・ビデオのイメージ領域内で空間軌跡を定める。
一実施形態では、ROI位置情報はROI座標のストリームを含む。ROI座標は、ROIストリームによって(同期して)クライアントに送られる。ROI位置情報は、別個の通信チャネルでクライアントに送られる。或いは、ROI位置情報は、ビデオ・フレームの搬送用コンテナの一部として、クライアントに搬送される。以下に更に詳細に例を説明する。
ソース・ビデオのイメージ領域内におけるROIの時間軌跡を図1に示す。(ROIで表示する)第1サブ領域は、第1時間インスタンスで、第1ROI座標および第1ROIサイズに関連付けられる第1ROI位置106で開始する。その後、サブ領域は、第2ROI座標および第2ROIサイズに関連付けられる第2ROI位置110へ移動する。軌跡の間、ROIは、ソース・ビデオのイメージ領域における所定の部分にズームする。したがって、図1に示されるROIは、ソース・ファイルのイメージ領域内にあるその位置が動的なROIであり、ソース・ファイルのイメージ領域に関するサイズが時間と共に変化する。
図1に示されるストリーム、即ち第1(ソース)ストリームおよび第2(ROI)ストリームは、適用型ストリーミング・プロトコル(例えばHTTP適用型ストリーミング(HAS)プロトコル)を使用して、再生のためにクライアントに配信される。その場合、第1(ROI)ビデオ・ストリームと第2(広視野)ビデオ・ストリームの空間的関係は特別なデータ構造で記述することができ、以降では、空間的マニフェスト・ファイル(SMF)と称する。SMFはストリーム識別子(例えばURLの一部)を特定し、クライアントが使用して、1つ以上の配信ノード(例えばメディア・サーバ)を位置決定し、それにアクセスする。1つ以上の配信ノードは、ストリームをクライアントに送信することができる。ストリーム識別子に加えて、マニフェスト・ファイルは位置情報を含み、参照系においてビデオ・ストリームの複数のイメージ領域の空間的関係を記述する。
通例、クライアント・デバイスは、レンダリングおよび帯域幅の制限された性能を有し、このため、ソース・ビデオについて高解像度品質で全イメージ領域を受信およびレンダリングすることができない。この課題の少なくとも一部は、所謂タイル化されたストリーミング技術を使用することによって解決される。ここでは、ソース・ストリーム(通例はパノラマ・ビデオ・ストリーム)がタイル・ストリームのセットに空間的に分割される。タイル・ストリームは、次いで、通例は別個にエンコードされる。タイル・ストリームは、ソース・ビデオの単一エンコーディング・プロセスから生じるのではない。クライアントは、パノラマ・ビデオにおけるタイル・ストリームのサブセットを要求することによって、ソース・ストリームの任意の部分を再構築する。従来技術のエンコーディング・スキームでは、これらタイル・ストリームが独立してエンコードされるので、これら(エンコードされた)タイル・ストリームの受け取りに応じて、クライアントは、ビデオ・データがユーザに表示されることになる前に、多数のデコーダ・インスタンスを使用してタイル・ストリームをデコードすると共に、タイル・ストリームにおいて当該デコードしたビデオ・データをスティッチする必要がある。
しかしながら、1つのクライアントについて多数のデコーダ・インスタンスを使用するのは、大量のプロセッサ・リソースというコストを生じさせる。特に、多量のタイルを使用するときは、クライアント・プロセスは非常に複雑になり、リソースが極めて集中することになる。この課題は、HEVCビデオ圧縮規格を使用することによって解決することができる。
図2は、本発明の一実施形態によるROIストリーミング・プロセスを示す。ここでは、ソース・ファイル(ビデオ)は、HEVCでタイル化されたストリームとしてエンコードされる。
HEVCでは、ビデオ・フレームは、所謂コーディング・ツリー・ユニット(CTU)に分割(partition)される。CTUは、デコーディング・プロセスのHEVC規格で使用される基本的な処理ユニットである。更に、HEVCエンコーダを構成して、ビデオ・フレーム200を所謂HEVCタイル201のHEVCストリームに分割するように構成される。HEVCファイルは、特定の複数のCTUのグループによって規定される矩形領域である。HEVCタイルは、例えば、パノラマ・ビデオのイメージ領域を、多数の隣接する矩形領域(異なるサイズを有してもよい)に分割する。ここでは、HEVCタイルの境界は行および列方向のHEVCタイル境界によって規定される。本出願では、1つ以上のHEVCタイルを含むHEVCでエンコードされたビデオ・ストリームのことを、HEVCでタイル化されたストリームと称することもある。
HEVCタイルは、(マルチ・コア・プロセッサを使用した)ビデオ・データ並列エンコーディングおよびデコーディングのためのHEVCコーデックにおいて導出され、その結果、効率的なビデオ・データの処理を達成することができる。このようにして、HEVCでタイル化されたビデオは、単一のHEVCデコーダを使用して、効果的にデコードされる。加えて、HEVCタイルはまた、HEVCでタイル化されたストリームに収容されたHEVCタイルのサブセットのみの再生のために使用される。
そのためには、HEVC規格は、エンコードおよびデコード処理のトータルの独立性を確保するために、各HEVCタイルに関連付けられる空間的および時間的制約を有するシグナリングを可能にする。特に、HEVC規格は、HEVCタイルの境界内におけるビデオ・コーディング(例えば、モーション・ベクトルおよびイン・ループ・フィルタ)において公知の空間的および時間的予測を可能にする。これら空間的および時間的制約を用いて、HEVCエンコーダは、ストリーミングするクライアントによって個別に格納およびアクセスできるのではなく、独立してデコード可能なHEVCタイルを生成するように構成される。
HEVCでタイル化されたストリームにおけるHEVCタイルの位置は、タイル位置情報205で決定される。タイル位置情報205は、座標系203に基づいて規定される。つまり、HEVCタイルの位置は、HEVCでタイル化されたストリームにおける全イメージ領域(エリア)内のタイルのイメージ・エリア(サブ領域)が有する空間位置および方向に関する。
図1を参照して説明するのと同様の方法で、HEVCストリームのイメージ領域における移動する1つ以上のROI206,210の位置は、ROI位置情報212によって規定される。ROI位置情報は、時間と共に変換することにより、ソース・ファイルのイメージ領域内において移動するROIの軌跡を定める。タイル位置情報を規定するのに使用される座標系を使用して、更に、図1を参照して詳細に説明するROIストリームにおけるROIのROI座標を決定する。イメージ領域が2Dまたは3Dのイメージ領域に関する場合、直交(Cartesian)座標系が使用される。或いは、イメージ領域が曲線イメージ領域に関する場合、他の非直交系の曲線座標系、例えば、円筒、球面または極座標系が使用される。
一実施形態では、HEVCエンコーダが、HEVCでタイル化されたビデオ・ストリームに関連付けられたHEVCタイル202を生成するように構成される。その結果、HEVCタイルを独立して格納することができ、また、HEVCデコーダによって独立してデコードすることができる。例えば、図3は、本発明の一実施形態によるROIストリーミング・プロセスで使用される、HEVCでタイル化されたMPEGファイルまたはストリーム302のためのデータ・フォーマット300を示す。一実施形態では、(HEVCタイル・ストリームに含まれる)HEVCタイルに関連付けられる独立してデコード可能なビデオ・データがトラック304〜312として格納される。特に、HEVCタイルと関連付けられるビデオ・データ314は、所謂(HEVC)タイル・トラック306〜312として格納される。
1つのタイル・トラックについてビデオ・データを生成するときに、ビデオ・コーディング(例えばモーション・ベクトルおよびイン・ループ・フィルタ)の空間的および時間的予測は、1つのHEVCタイルの境界内で全て維持される。このようにして、ビデオ・フレームの1つのHEVCタイルおよび当該ビデオ・フレームの他のHEVCタイルにおけるビデオ・データ間には、空間的デコーディングの依存関係は存在しない。加えて、ビデオ・フレームの1つのHEVCタイルおよびそれ以前のビデオ・フレームの他のHEVCタイルにおけるビデオ・データ間には、空間的デコーディングの依存関係は存在しない。
一実施形態では、タイル・トラックは、タイル位置情報316を更に含む。デコーダは、タイル位置情報を使用して、どのトラックを、デコーディングのためにHEVCストリームから抽出する必要があるかについて決定する。一実施形態では、トラックのタイル位置情報はタイルの起点(origin)およびタイル・サイズ情報(例えば、幅および高さのパラメータ)を含み、図1および図2を参照して説明した座標系によって規定される基準空間にタイルを配置する。
一実施形態では、図3のデータ・フォーマット300は、所謂、ベース・トラック304を含む。ベース・トラックはエクストラクタ318を含む。エクストラクタ318は、対応する1つ以上のタイル・トラックへの参照を規定する。ベース・トラックを解析することによって、デコーダは、それが参照するタイル・トラックのオーディオおよび/またはビデオ・データでエクストラクタを置き換える。特定のビデオ・アプリケーションが特定のタイルを要求しない場合は、デコーダはその対応のエクストラクタを無視するのみである。特定のトラックのビデオ・データが受け取られず、または取り出されない場合は、当該トラックの欠如は、HEVCデコーダによって「データ不足(missing data)」として解釈される。HEVCタイルが、他のHEVCタイルと独立してデコードされるので、1つ以上のトラックからのデータの欠如(「データ不足」)は、取り出すことができる他のトラックをデコーダがデコードするのを防止する。
一実施形態では、図3のデータ・フォーマットは更に、ROIトラックを含む。ROIトラックは、ROI位置情報、例えば、HEVCでタイル化されたストリームの全イメージ領域におけるROIストリームの(制限付き視野の)イメージ領域が有するROI座標を含む。ROI位置情報はROI座標を含む。ROI座標は、HEVCでタイル化されたストリームの全イメージ領域に関連付けられた座標系103に基づいて規定される。更なる一実施形態では、ROIトラックは、ROIのビデオ・データを含む。
図3に示されるデータ・フォーマットはまた、HEVCでタイル化されたストリームのHEVCタイルを、独立したHEVCタイル・ストリームとして格納するために使用することもでき、クライアント・デバイスのクライアントは、配信ノード(例えばサーバ)からHEVCタイル・ストリームを個別に要求するためにSMFを使用することができる。そのために、SMFは、1つ以上のタイル識別子(例えば、URLまたはURIの少なくとも一部)を含む。タイル識別子は、HEVCでタイル化されたHEデオデータを格納および配信するように構成される1つ以上の配信ノード(例えば、1つ以上のメディア・サーバまたはCDN)を位置決定するために、クライアントによって使用される。
1つのHEVCタイルを含む、HEVCでタイル化されたストリームは、HEVCタイル・ストリームと称されることもある。図2に示されるHEVCタイル・ストリームおよびROIストリームは、再生のために、適応型ストリーミング・プロトコル(例えば、HTTP適応型ストリーミング(HAS)プロトコル)を用いてクライアント・デバイスに配信される。そのためには、HEVCタイル・ストリームは、所定の期間における時間的セグメントに時間的に分割される。したがって、その場合は、SMFは更に、HEVCでタイル化されたストリームに関連付けられる時間的セグメント識別子を含み、クライアント・デバイスは、ネットワークにおいて1つ以上の配達ノードから、HEVCでタイル化されたストリームの時間的セグメントを連続して要求する。第1(ROI)ビデオ・ストリームとHEVCでタイル化された1つ以上のビデオ・ストリームとの間の時間的および空間的関係は、空間的マニフェスト・ファイル(SMF)204で規定される。MPEG−DASHストリーミング・プロトコルの場合、マニフェスト・ファイルは、メディア提示記述(MPD; media presentation description)と称されることもある。
SMFは、1つ以上のHEVCストリーム識別子、1つ以上のROIストリーム識別子、および/または1つ以上のHEVCタイル識別子を含む。SMFはまた、特定の座標系における1つ以上のROIストリームと1つ以上のHEVCストリームとの間の空間的関係を記述する位置情報を含む。別の一実施形態では、位置情報は更に、座標系における1つ以上のHECVタイル間の空間的関係を記述する情報を含んでもよい。HEVCタイルに関する空間的情報は、タイル位置情報と称されることもある。本発明の様々な実施形態による空間的マニフェスト・ファイルについてのより詳細な例について、図5〜図8を参照して以下に説明する。
1つのソース・ファイルについて、異なるHECタイル表現、即ちタイル表現(例えばタイル・サイズ、2Dおよび3Dフォーマット、異なるビデオおよび/またはオーディオ品質(例えば、SD/HD/UHD、ビットレート)、異なる解像度、異なる視野、カメラ・アングル等の表現)が生成される。タイル表現ごとに、ソース・ファイルのビデオ・フレームは、所定の数の(好ましくは独立した)デコード可能HEVCタイルを含む、HEVCでタイル化されたビデオ・ファイルにエンコードされる(HEVCでタイル化されたビデオ・ファイルは、HEVCでタイル化されたビデオ・ストリームとも称される。何故ならば、HEVCでタイル化されたビデオ・ファイルは、クライアント・デバイスにストリーミングされる、HEVCでエンコードされたビデオ・データを本質的に含むからである。)。ここでは、各HEVCタイル201は、HEVCでタイル化されたビデオ・ファイルにおける全イメージ領域のサブ領域を表す。HEVCエンコーダを使用して、HEVCタイルを含む、HEVCでエンコードされたMPEGストリームを、ソース・ファイルのビデオ・フレームに基づいて生成することができる。
(HEVCタイルの座標を含む)タイル位置情報と(ROIストリームのROI座標を含む)ROI位置情報とに基づいて、クライアントによって使用される1つのHEVCタイル・ストリームまたは多数のHEVCタイル・ストリームをクライアント・デバイスは要求し、第1サブ領域(ROI)を含むサブ領域を構築する。特に、空間的に隣接するHEVCタイルがデコーダにより使用されて、ROIストリームのROIを好ましくは含む サブ領域を構築する。
例えば、図2に示すように、第1時間インスタンスでは、ROI座標は、4つのHEVCタイル(この場合は、位置(1,0)、(1,1)、(2,0)および(2,1)のHEVCタイル)と重複する第1ROI206を規定する。これら4つのHEVCタイルは、第1時間インスタンスで、ROIを含んだ、HEVCでタイル化されたパノラマ・ストリームのイメージ領域内に第2サブ領域を形成する。同様に、ROI座標は、第2時間インスタンで、2枚のHEVCタイル(この場合は、位置(0,2)および(1,2)のHEVCタイル)と重複する第2ROI210を規定する。これら2つのHEVCタイルは、第2時間インスタンスで、ROIを含んだ、HEVCでタイル化されたパノラマ・ストリーム内に第2サブ領域を形成する。この方式を使用することで、ROIストリームからタイル化されたストリームにスムーズに切り替えることができる。
以下により詳細に説明するように、ユーザは、ユーザ・インタフェース(例えばタッチ・スクリーンまたはポインティング・デバイス)を使用して、表示されたイメージ領域と相互作用し、また、表示されたコンテンツを、(例えばパニング、ズーミング、チルティング操作に基づいて)操作する。このユーザ相互作用に応じて、インタフェースは、HEVCでタイル化されたストリームに基づいてユーザが要求したROIのレンダリングを開始するよう、クライアント・デバイスへの指示を生成する。したがって、ユーザは、ROIを移動および/または拡張し、それに応じて、適切なタイル表現、当該タイル表現においてHEVCでタイル化されたストリーム、およびHEVCでタイル化されたストリームにおける1つ以上のHEVCタイルが選択され、ROIが位置決めされる、隣接するHEVCタイルの領域を形成することができる。タイルに関連付けられたビデオ・データがクライアント・デバイスにおいて既に存在する場合は、ROIをレンダリングするのにビデオ・データを使用できるのよりも前に、タイルは、HEVCタイル・ストリームとしてクライアント・デバイスにストリーミングされる必要はない。これらデータが存在しない場合は、ROIがレンダリングされる前に、それらは、1つ以上のHEVCタイル・ストリームとして最初にストリーミングされる。ユーザにより選択されたROIをレンダリングする当該モードは、タイル化されたストリーミング・モードと称されることもある。
したがって、上述したことから次のことが理解される。即ち、1)ユーザは、(図1を参照して説明したように)ROIストリームに基づいて第1モード((タイル化されていない)ROIストリーミング・モード)で特定のシーンを視聴することができる。ここでは、ROIストリームは、例えばMPEGストリームとして、クライアント・デバイスに配信される。また、2)ユーザは、(図2を参照して説明したように)HEVCでタイル化されたストリームに基づいて第2モード(タイル化されたストリーミング・モード)で同一のシーン、シーンの詳細、またはシーンの周辺の領域を視聴することができる。図1および図2に示すように、ROIストリーミング・モードから、タイル化されたストリーミング・モードへの移行(およびその逆)は、ROI位置情報、即ちROIストリームに関連付けられたROI座標に基づいて実現される。
ROIストリームは、デフォルトのストリーミング・モードである(タイル化されていない)ROIストリーミング・モードでクライアントによって使用される。ここでは、ブロードキャスト、マルチキャスト、またはユニキャストのROIストリームがクライアント・デバイスによってレンダリングされる。HEVCでタイル化されたストリームは、クライアントによって使用されて、クライアント・デバイスのユーザ・インタフェース(Ul)を使用するユーザが操作するROIをレンダリングする。
クライアントが、ROIストリーミング・モードでROIストリームを再生するとき、クライアントは、ROI位置情報に基づいて、ソース・ビデオの全イメージ領域におけるROIの位置情報を認識することになる。ROIストリームに関連付けられるROI位置情報は、クライアントによって使用されて、タイル化されたストリーミング・モードへとスムーズに或いは一層のことシームレスに切り替えることができる。
図4は、本発明の一実施形態によるROIストリームおよび関連するHEVCでタイル化されたストリームを生成するためのプロセスを概略的に示す。この例では、1つ以上のカメラ402(例えば、1つ以上の高解像度の広視野カメラ)を使用して、ソース・ビデオ(通例はパノラマ・ビデオ)を生成または構成する。HEVCエンコーダ404を使用して、ソース・ビデオに基づいてHEVCでタイル化された1つ以上のストリーム408を生成する。HEVCでタイル化されたストリームは、ソース・ビデオにおいて異なるタイル表現409を規定する。ここでは、HEVCでタイル化されたストリームと、HEVCでタイル化されたストリームの各々のHEVCタイルと、実施形態によっては、HEVCでタイル化されたストリームにおけるセグメントの時間的関係とが、SMF410で規定される。
ソース・ビデオは、また、ROIストリーム・ジェネレータ412に配信される。ROIストリーム・ジェネレータは、ソース・フレームにおけるフレームのイメージ領域を通じたパニングおよびズーミングによってROI(例えば、特定のアクティビティを有する領域)を選択するように構成される。また、ビデオ・フレームからROIを切り取って、該切り取られたイメージ領域に基づいて新規のビデオ・ストリーム(ROIストリーム414)をビルドすることによって、ROIストリームを生成するように構成される。ROIは、アルゴリズム(例えば、イメージ内の特定のオブジェクトをトラックするトラッキング・アルゴリズム)を用いて、またはROIを選択する人間のオペレータによって自動的に選択される。ROIストリームの生成の間、ROIの座標は、ROI位置情報418として収集される。ROI位置情報は、ROIストリームのメタデータとして、または、別個のデータ・ファイルとして、クライアントに送られる。ROI位置情報が別個のストリームで送られる場合は、ROI位置情報は、ROI位置情報(例えばROI座標)をROIストリームのフレームにリンクさせる情報(例えばフレーム番号)を含む。更なる実施形態では、ROIストリームは、適応型ストリーミングについて時間的にセグメント化されたストリームとして構成される。その場合、ROIストリームのセグメントは、ROIマニフェスト・ファイル416に規定される。
一実施形態では、ROIストリームは、ソース・ファイルに基づいて(切り取ることによって)形成されるではなく、別個のブロードキャスト・カメラ、即ちブロードキャスト・ストリームの直接の出力に基づいて形成される。当該ブロードキャスト・カメラは、図1を参照して説明したソース・ビデオに収容されるのと同一のシーン部分をキャプチャする。
コンバイナ420は、ROIストリームを、HEVCでタイル化された1つ以上のストリーム408と結合し、その後に、当該ROIストリームは配信ネットワーク422に送られる。ROIストリームをHEVCでタイル化されたストリームと結合することは、HEVCでタイル化されたストリームおよびROIストリームに関する情報を共に含むSMFを形成することを含む。実施形態では、コンバイナは、ROIストリーム識別子(例えば、URLまたはURIの少なくとも一部)と、実施形態によっては、SMFにおいてROIストリームの時間的セグメントに関連付けられたマニフェスト・ファイルと、を挿入する。
HEVCでタイル化された1つ以上のストリーム(任意で、独立したHEVCタイル・ストリームの集合として)およびROIストリームは、ネットワークにおける1つ以上の配信ノード4261,2に格納される。ここでは、配信ノードは、HEVCでタイル化された1つ以上のストリームの少なくとも一部(例えば、1つ以上のHEVCタイル・ストリーム)および/またはROIストリームを、(モバイル)クライアント・デバイスのクライアント428に配信する。
一実施形態では、配信ノードはメディア・サーバである。別の一実施形態では、配信ノードの少なくとも一部(時折、代理ノードとも称される)は、専用のコンテンツ配信ネットワーク(CDN)の一部としてもよい。その場合は、HEVCでタイル化されたストリームよびROIストリームは、コンテンツ配信ネットワーク制御機能424(CDNCF; Content Delivery Network Control Function)によって採り入れられる(ingest)。次いで、CDNCFは、異なる配信ノードを通じて、HEVCでタイル化されたストリームおよびROIストリームを配信する。その結果、ストリームの効果的な配信を確実なものとすることができる。一実施形態では、CDNは、タイル(およびセグメント)識別子(URL)を更新し、クライアントはCDNの配信ノードに効果的にアクセスして、(タイル化された)コンテンツの配信を要求する。
クライアント・デバイスのクライアント428が、ROIおよび/またはHEVCでタイル化されたストリームへのアクセスを望むときに、クライアント428は、コンテンツ・プロバイダまたはCDNからSMFを受け取る。また、ROIストリームおよび/またはHEVCでタイル化されたストリームにおける関連の1つ以上のHEVCタイルを要求および再生するためにSMFを使用する。クライアント・デバイスは、通常、(モバイル)コンテンツ再生デバイス(例えば、電子タブレット、スマートフォン、ノートブック、メディア・プレーヤ、ホーム・ゲートウェイ)、またはDASH対応デバイス(例えば、DASH対応HbbTV表示デバイス)に関する。或いは、クライアント・デバイスは、コンテンツ再生デバイスによって将来消費されるコンテンツを処理し、一時的に格納するように構成されるセット・トップ・ボックスまたはコンテンツ記憶デバイスでもよく、格納されたコンテンツへのアクセスを有する。
図5は、本発明の一実施形態によるROIストリーミング・プロセスを管理するためのデータ構造500の概要を示す。特に、図5は、空間的マニフェスト・ファイル(SMF)を示し、幾らかの階層的なデータ・レベル502,508,5181,2を含む。第1データ・レベル502は、ソース・ビデオ(例えばsourcel.mp4)における1つ以上のタイル表現5061−3を規定するタイル構成情報に関する。通例、ソース・ビデオは、1つ以上の高解像度と、しばしば、広視野HDビデオ・ストリーム若しくはファイルまたは尚もUHDビデオ・ストリーム若しくはファイルとに基づいて形成される。
次のデータ・レベル508は、タイル表現5061−3を規定する。タイル表現508は、特定の品質を有するHEVCタイル511のセットを規定する。HEVCタイル・インスタンス5121−4はHEVCタイルを規定する。一実施形態では、HEVCタイルのセットは、HEVCでタイル化されたストリームのHEVCタイル・トラックとして規定される。本発明の一実施形態では、HEVCタイルのセットは、個々に格納可能でアクセス可能なHEVCタイル・ストリームのセットとして規定される。
タイル位置情報は、特定のタイル表現について、HEVCでタイル化されたストリームにおけるHEVCタイルの位置を規定する。例えば、2つのHEVCタイル(タイル位置(1,1)および(1,2))は、ソース・ビデオ(関連するHEVCでタイル化されたビデオ)のイメージ領域の上半分に関連付けられるコンテンツを含む。
タイル表現は、更に、ソース・ビデオの解像度バージョンを示す、ソース解像度510に関する情報を含み、空間マップにおいて参照されるHEVCタイルを生成するのに使用される。例えば、図5では、空間マップにおいて参照されるHEVCタイルは、4096×2160の解像度バージョンのソース・ビデオに基づいて生成される。
一実施形態では、1つのHEVCタイルに関連付けられるデータは、タイル情報5181,2(即ち、個々のHEVCタイルに関する情報)として構築される。タイル情報は、HEVCタイルの位置情報5201,2(例えばタイル座標)を含む。タイル座標は、絶対座標系、或いは相対座標系に基づき、また、HEVCデコーダによって使用され、HEVCタイルを、表示のためのシームレスなビデオ・イメージに空間的に配置する。
タイル情報は、更に、1つ以上のタイル識別子5221,2(例えばURIまたはURLの一部)を含む。一実施形態では、HEVCタイル・ストリームにおいてHEVCタイルのビデオ・データをクライアント・デバイスに送信するように構成される1つ以上の配信ノードを位置決定するために、および/または、1またはそれ以上の特定のファイル、好ましくはそれら配信ノードの内1つのストリーム可能ファイルを位置決定するために、タイル情報が使用される。
一実施形態では、SMFは更に、1つ以上のROIストリームのデータ構造505(例えば、マニフェスト・ファイル、またはマニフェスト・ファイルへの参照)を含む。ここでは、ROI・ストリームは、HEVCタイルと同一のソース・ビデオに基づいて生成される。一実施形態では、ROIストリームは、ROI位置情報を含む。別の一実施形態では、SMFは、ファイルへの参照(例えばURL)、またはROI507の位置情報を含むストリームを含む。
図6は、本発明の一実施形態によるROIストリーミング・プロセスを管理するための空間的マニフェスト・ファイル600を示す。特に、図6は、異なるMPDビデオ要素を規定するMPEG−DASHMPDについての例を示し、識別子(例えばURLまたはURIの一部)に関連付けられる。(クライアント・デバイスに常駐する)DASHクライアントは、識別子を使用して、MPDビデオ要素に関連付けられるビデオ・データにアクセスおよび取り出すことができる。例えば、この例では、第1MPDビデオ要素602は、少なくとも1つのパノラマ・ビデオ(URI「full_panorama.mp4」606によって規定される広視野ビデオ)に関連付けられる。第2MPD要素604は、ROIビデオ(URI「zoomed_part.mp4」608によって規定されるROIビデオ)に関連付けられる。複数のMPDビデオ要素の間の空間的関係の少なくとも一部は、位置情報に基づいて規定され、以下により詳細に説明する。
MPDビデオ要素は、「AdaptationSet」属性として規定され、1つ以上の表現を含む(異なるバージョンの同一または関連するコンテンツにおいて、相違が1つ以上のエンコーディング・パラメータによって定められる。)。
DASHクライアントは、MPDの情報を使用して、ネットワークからMPDビデオ要素に関連付けられるビデオ・データを要求することができる。更に、DASHクライアントは、MPDの情報(メタデータ)を使用して、HEVCデコーダを構成することができる。HEVCデコーダは、ビデオ・データを受け取るとすぐに、HEVCでエンコードされたストリームにおけるビデオ・データのデコードを開始することができる。HEVCデコーダを構成するための情報(メタデータ)は、複数のMPDビデオ要素の間、この場合は、HEVCでタイル化されたパノラマ・ビデオ・ストリームとROIストリームの間の空間的関係を含む。そのために、MPDの作成者は位置情報をMPDに含める。位置情報は、1つ以上の空間的関係の記述(SRD)610,612によって規定される。SRDは、EssentialProperty属性(記述子を処理するときにクライアントによって理解されるのに必要とされる情報)、またはSupplementalProperty属性(記述を処理するときにクライアントによって破棄される情報)において使用され、デコーダ(特にHEVCデコーダ)に対し、MPDビデオ要素の間に空間的関係が存在するのを通知することができる。一実施形態では、空間的関係記述子schemeIdUri「urn:mpeg:dash:srd:2014」が用いられる。
一実施形態では、位置情報は、@value属性614,616に基づいて定められ、これに限定されないが以下のものを含む複数のパラメータを含む。即ち、
−source_idパラメータ(618,619)は、相互に空間的関係を有するMPD要素(AdaptationSetまたはSubRepresentation)のセットを規定する。
−位置パラメータ(620,621)x,y,w,hは、MPDビデオ要素の位置を規定し、ここでは、座標x,yがMPDビデオ要素におけるイメージ領域の起点を規定し、w,hがイメージ領域の幅と高さを規定する。位置パラメータは、所与の任意の単位(例えばピクセル単位)で表されてよい。
−集合WおよびH(622,623)は、x,y,w,hと同一の任意の単位で表される基準スペースのサイズ(dimension)を規定する。
−spatial_set_id(624,625)は、コヒーレント・グループにおけるMPD要素をグループ化するのを許容する。このようなMPD要素のグループは、例えば、解像度レイヤ・インジケータとして用いられる。
−動的パラメータ(626)は、空間表現の記述子の位置612が経時的に変化することをシグナリングするのに使用される。その場合、xおよびyの値は0にセットされ、これは、MPDが値を供給しないが、MPD外でシグナリングされることを意味する。表現(Representation)の位置は、暗に、ビデオ・コンテナで見つけられることになる。
したがって、図6に示されるように、マニフェスト・ファイルは、1つ以上のHEVCでタイル化されるストリーム(例えば、HEVCでタイル化されたパノラマ・ストリーム)と、相互に空間的関係を有する1つ以上の動的なROIストリームとを規定する。異なるMPDビデオ要素が有する位置情報のソース・パラメータ「1」は、異なるMPDビデオ要素が相互に空間的に関係することを示す。
複数のストリーム間の初期の空間的関係は、HEVCでタイル化されたストリームとROIストリームの位置パラメータに基づいて規定される。その後に、複数のストリーム間の空間的関係は、時間と共に連続的に変化する。何故ならば、MPDのROIストリームが(動的パラメータによって示されるように)「動的(dynamic)」なROIストリームとして規定されるからである。ROIの移動は、ROI位置情報によってクライアントに提供される。ROI位置情報は、ROI位置データ(ROI座標)を含み、ROIストリームでクライアント・デバイスに送信される。
したがって、MPDビデオ要素に関連付けられる位置情報は、DASHクライアントが用いて、ビデオ・データが実際にクライアントによって受け取られる前に、ストリームの空間的関係についてHEVCデコーダに通知する。このようにして、HEVCデコーダは初期化され、データを受け取るとすぐにビデオ・データのデコードを開始する。
図7は、本発明の別の一実施形態によるROIストリーミング・プロセスを管理するための空間的マニフェスト・ファイル700を示す。特に、図7は、異なるMPDビデオ要素を規定するMPEG−DASHのMPDの例を示し、HEVCでタイル化された少なくとも1つのビデオ・ストリームに関連付けられる少なくとも1つの第1MPDビデオ要素702(この特定の例では、URL「full_panorama.mp4」によって特定される広視野ビデオ)と、ROIビデオ・ストリームに関連付けられる少なくとも1つの第2MPD要素704(この特定の例では、URL「roi.mp4」によって規定されるROIビデオ)と、を含む。ここでは、HEVCでタイル化されたビデオ・ストリームおよいbROIストリームにおける異なるHEVCタイル間の空間的関係は、位置情報に基づいて(1つ以上のSRDの形態で)規定される。
第1MPDビデオ要素はAdaptationSetとして規定され、表現(Representation)703と、1つ以上のサブ表現(SubRepresentations)7161−4(即ち、図3を参照して説明したように、コンテナ・レベルにおけるトラックの概念にリンクできるこのRepresentationを構成する部分)と、を含む。このことは、例えば、コンテンツ(オーディオおよびビデオ)が別々のトラックにおける同一のファイル・コンテナで多重化(mux)される場合である。一実施形態では、第1MPDビデオ要素は、HEVCでタイル化されたビデオ・ストリームを規定する。ここでは、Representation703は、タイル化された広視野パノラマ・ストリーム(この場合、4つのHEVCタイルを含む)を規定する。SubRepresentation7161−4は、個々のHEVCタイルを規定する。ここでは、各HEVCタイルは、上記図3に示されるように、MPEGストリームにおける別個のトラックとして格納される。トラックのビデオ・データはエンコードされて、デコーダにより、HEVCタイル(の時間セグメント)の独立した再生を可能とする。
エンコーダ属性「コーデック」7191−4は、ビデオ・データがHEVCタイルに属することを示す「hvt1」のタイプ・コーデックに関連する(hvtlにおけるtはタイルに関連する。)。更に、SubRepresenationの各HEVCタイルは、HEVCタイルの位置を規定するための1つ以上の位置パラメータ7201−4を含むSRD7181−4に関連付けられる。
第2MPDビデオ要素は、ROIビデオのEssentialProperty属性においてROIビデオ・ストリームのSRD706を、ROIストリームの位置を規定する1つ以上の位置パラメータ708と共に規定する。
一実施形態では、SRD方式は、schemeldUri「urn:mpeg:dash:srd:2014」によって規定される。ここでは、空間的関係が、@value属性値708,710,714,7201−4に基づいて規定される。ROIストリームのROI座標は時間と共に変化するので、ROIビデオのSRDは、図6を参照して詳細に説明したように、「dynamic」パラメータ710を含む。
第1MPDビデオ要素および第2MPDビデオ要素のSRD712,706,7181−4は、異なるストリーム間の空間的関係についてHEVCデコーダに通知するように使用される。
図7の例では、HEVCでタイル化されたストリームは、クライアント・デバイスに対し、1つのストリームとして送られる。再生のためのHEVCタイルの選択は、デコーディングの段階で実現される。
一実施形態では、トラック・ビデオ・データを連続して格納することにより、DASHクライアントが、1つのSubRepresentationに対応するSubSegmentsの一部を取り出すのを可能にする。このようなHTTP要求は、バイト範囲のシグナリングを使用する。ここでは、ISO/IEC14496のパート12による所謂「ssix」ボックスでSubRepresentationごとにバイト範囲が提供される。
トラックから抽出される時間的セグメントがそれ自体で独立(self-sufficient)していない場合は、初期化セグメントURL(InitializationSegment URL)がRepresentationの属性として提供され、この課題を解決する。所謂初期化セグメントは、HEVCタイルのセグメントでビデオ・データをレンダリングするのに必要となるメタデータを含んで規定される。初期化セグメントでは、HEVCタイルのタイル構造および/または位置が提供される。
図8Aは、本発明の別の一実施形態によりROIストリーミング・プロセスを管理するための空間的マニフェスト・ファイル800を示す。特に、図8Aは、異なるMPDビデオ要素802,8031,2,804を規定するMPEG−DASHのMPDの例を示す。第1MPDビデオ要素802は、URI「full_panorama−base.mp4」814によって規定される、HEVCでタイル化されたパノラマ・ビデオに関連付けられる。ここで、HEVCでタイル化されたパノラマ・ビデオは、「エクストラクタ」(extractor)を含むベース・トラックとして規定される。エクストラクタは、(図3を参照して説明したのと同様にして)MPDビデオ要素8031,2によって規定される、1つ以上の個別にアドレス可能なタイル・トラックを参照する。
MPDビデオ要素803は、第1タイル識別子814(「full_panorama−tile1.mp4」)によって特定される第1HEVCタイルのビデオ・データを含む第1タイル・トラックを規定する。また、MPDビデオ要素803は、第2タイル識別子814(「full_panorama―tile2.mp4」)によって特定される第2HEVCタイルのビデオ・データを含む第2タイル・トラックを規定する。最後のMPDビデオ要素804は、ROIビデオ・ストリーム(この特定例では、ROIストリーム識別子「zoomed_part.mp4」806によって規定されるROIビデオ)を規定する。
位置情報は、ROIビデオにおけるEssentialProperty属性のSRD80と、MPDビデオ要素のSupplementalProperty属性のSRD8161−3を含む。当該位置情報は、MPDビデオ要素の間の空間的関係についてHEVCデコーダに通知するのに使用される。一実施形態では、空間的関係の記述子schemeldUri「urn:mpeg:dash:srd:2014」が、位置情報を規定するのに使用される。ここでは、空間的関係は、@value属性値810,8181−3、および図6を参照して説明した「dynamic」パラメータに基づいて規定される。
この特定の実施形態では、HEVCタイルは、独立して格納可能且つアドレス可能なHEVCタイル・ストリームとしてフォーマット化される。@id「パノラマ(panorama)」によって特定される Representation802は、図3を参照して先に説明したベース・トラックを表し、また、@id「tile1」および「tile2」によって特定されるRepresentation8031,2によって規定されるHEVCタイルの結合に使用される。
したがって、クライアントはSMFを使用して、HEVCでタイル化されたパノラマ・ビデオ・ストリーム(ベース・トラック内の情報を使用)および配信ノードからのHEVCタイル・ストリームの何れかを要求することができる。次いで、要求されたトラックを受け取ると、デコーダは、ベース・トラックを解析し、また、ベース・トラックにおいてエクストラクタを、それが参照するタイル・トラックにおけるオーディオおよび/またはビデオ・データと置き換える。或いは、別の一実施形態では、クライアントはSMFを使用して、別個のHEVCタイル・トラックを個別に要求する。そして、HEVCデコーダはレンダリングのためにタイル・トラックをデコードする。
図8Bは、本発明の別の一実施形態によりROIストリーミング・プロセスを管理するための空間的マニフェスト・ファイル800を示す。特に、図8Bは、図8Aを参照して説明したのと同様の方法で、2つのHEVCタイルを含む、HEVCでタイル化されたパノラマ・ビデオを規定するMPEG−DASHのMPDの例を示す。しかしながら、この実施形態では、ROIストリーム822が、ROIビデオ・データに関連付けられる第1SubRepresentation824_1と、ROI座標に関連付けられる第2SubRepresentation824_2と、を含むRepresentationとして記述されるという意味において、ROIストリーム822は異なって規定される。
したがって、この特定の一実施形態では、ROIビデオ・データおよびROI座標は別個のトラック、即ち、(コーデック属性「hvc1」826と示される)HEVCでエンコードされたビデオ・データを含むビデオ・トラックと、(コーデック属性「coor」828と示される)座標を含むメタデータ・トラックと、に格納される。
したがって、上記のことから、クライアントは、SMFの情報を使用して、所望のビデオ・データをクライアントに配信できるネットワーク・ノードに配信ノードを位置特定するだけではなく、SMFに規定される、HEVCでタイル化されるストリームおよびROIストリームのメタデータも使用する。その結果、デコーダは、HEVCでタイル化されたビデオ・データおよび/またはROI(ビデオ)データがクライアントによって受け取られる前に構成される。このメタデータは、例えば次のものを含むことができる。即ち、
−選択された空間セグメントが、HEVCでタイル化されたビデオ・データ(例えばコーデック属性「hvt1」)に関連することを決定するための情報、
−HEVCタイルのビデオ・データが、(HEVCタイルを規定するSubRepresenationを用いて)別個のトラックに格納されることをシグナリングするための情報、
−HEVCタイルの数および/またはサイズ(例えば、SubRepresentationとして、および/またはSRDに関連付けられる位置情報の一部として表されるHEVCタイルの数)を決定するための情報、
−HEVCタイルの位置またはROIストリームの位置(例えば、SRDに関連付けられる位置情報の一部)を決定するための情報、
−ROI位置および/またはROIのサイズが(「dynamic」パラメータを用いて)時間と共に変化することをシグナリングするための情報、
−(例えば、メタデータ・トラックを規定するSubRepresentationを使用して)ROIビデオ・データとは別個にROI位置情報がトラックに格納されることをシグナリングするための情報、である。
図9は、本発明の一実施形態によるクライアント・デバイスを示す。特に、図9は、メディア・プレーヤ906によって処理された(タイル化された)コンテントとのユーザ相互作用を解釈するユーザ・ナビゲーション機能904を含むクライアント・デバイスを示す。メディア・プレーヤ906は、HEVCデコーダ922およびクロッパ924を含む。ユーザ・ナビゲーション機能はユーザ・インタフェースに接続される。ユーザ・インタフェースは、タッチ・スクリーン、カメラ、キーボード、マウス、トラックボール、ジョイスティック、マイクロフォン、頭部トラッキング・センサ、目および凝視トラッキング、ボタン、または表示されたコンテンツの操作(例えば、パニング、ズーミングおよび/またはチルティング)を可能にする他の如何なるマンマシン・インターフェースも含む。
クライアント・デバイスは、ネットワーク内のコンテンツ・プロバイダまたはコンテンツ・ソース(例えば、メディア・サーバまたはCDN)から1つ以上の空間的マニフェスト・ファイル(SMF)を受け取るためマニフェスト・キャッシュ922を更に含む。図5から図8を参照して詳細に説明したように、SMF916は、1つ以上のHEVCでタイル化されたストリームのタイル識別子(URL)(の一部)を規定する。更に、SMFは、HEVCタイルの位置を含むタイル位置情報を含む。
実施形態の中には、SMFは、HTTP適応型ストリーミング・プロトコルに基づいてフォーマット化されるROIストリームを規定するデータ構造を更に含むものもある。或いは、ROIストリームを規定するデータ構造は、別個のマニフェスト・ファイルとしてマニフェスト・キャッシュに格納されてもよい。
一実施形態では、ROIストリームは、ユニキャスト・ストリームである。別の一実施形態では、ROIストリームは、ROI座標が埋め込まれたマルチキャスト・ストリームまたはブロードキャスト・ストリームである。その場合、クライアント・デバイスは、ブロードキャスト・ストリームまたはマルチキャスト・ストリームのそれぞれを要求する(チューン・インする、またはジョインする)ように構成される。
マニフェスト・キャッシュは、ストリーム・リトリーバ910およびストリーム・セレクタ912に接続される。ストリーム・セレクタは、1つ以上のストリーム(HEVCでタイル化されたストリーム、1つ以上のHEVCタイル・ストリーム、および/またはROIストリーム)を選択し、ストリーム・リトリーバに、特定の方式にしたがってネットワーク920から1つ以上の選択されるストリームを要求するように指示する。
ユーザ相互作用がないデフォルトの状況では、SMFに関連付けられるコンテンツは、ROIストリームに基づいてクライアント・デバイスにストリームされる。ROIストリームは、図1および図2を参照して詳細に説明したようにROI位置情報を含む(または関連付けられる)。したがって、ROIストリームがHASストリームの場合は、ストリーム・セレクタは、ストリーム・リトリーバに、(デフォルトの)ROIストリームの時間的セグメントを要求するように指示する。ROIストリームのセグメントは、ストリーム・プロセッサによって処理されるのではなく、メディア・プレーヤのバッファ908に直接転送される。同様に、ROIストリームがブロードキャスト・ストリームまたはマルチキャスト・ストリームの場合は、ストリーム・セレクタは、必要なブロードキャスト・ストリームに向けてジョインまたはチューニングし、また、パケットをバッファ908に直接転送する。
ユーザ・ナビゲーション機能がユーザ相互作用によってトリガされると、ユーザ・ナビゲーション機能は、ストリーム・プロセッサに、ROIルとリームからROI位置情報を抽出し、ROIジェネレータにその情報を転送するように指示する。ROIジェネレータはROI座標の生成を開始する。ここでは、第1座標がROIストリームの1つ以上のフレームにおけるROI座標に対応する。ROI座標は、ユーザ相互作用が検出された時間インスタンスにおいてクライアント・デバイスによって処理されている。
別の一実施形態では、ストリーム・プロセッサは常に、ROIストリームからROI位置情報を抽出し、この情報をROIジェネレータに供給する。その場合、ROIストリームのストリーミングおよびレンダリングの間に、レンダリングされたフレームのROI座標は常に、クライアント・デバイスに利用可能である。実施形態の中には、ROI位置情報は、フレームをデコードすることなく、ROIストリームから抽出されるものもある。別の一実施態様では、ROI位置情報は、フレームをデコードした後にROIストリームから抽出される。その場合、ストリーム・プロセッサは、エンコードされたフレームをデコードするためのデコーダを備えるメディア・プレーヤの一部となる。
ROIジェネレータは、ユーザ・ナビゲーション出力に基づくROI座標およびROIストリームのROI座標の計算を開始する。一実施形態では、ユーザ・ナビゲーション機能はユーザ相互作用を解釈し、ROIベクトルを生成する。ROIベクトルは、ROIジェネレータによって、特定のユーザ相互作用と関連付ける新規のROI座標を計算することを可能にする。例えば、ユーザ・ナビゲーション機能は、1フィンガのスライド・ジェスチャを、ROIのパニング(変換(translation))に解釈し、そのROIジェネレータのために変換ベクトルを生成する。同様にして、2本指のピンチ・ジェスチャはROIのズーム・アクションとして、ボタン・ホールドは、ROIのフリーズとして、また、口頭のユーザ命令「フル・スクリーン」はフル・スクリーンへのズーミングとして解釈される。ROIジェネレータは、ユーザ入力を受け取ると、ROI座標の計算を継続する。
ストリーム・セレクタがROIジェネレータから計算済みのROI座標を受け取るときに、ストリーム・セレクタは、SMFのタイル位置情報と、ROIジェネレータから生じる計算済みのROI座標とを使用して、全イメージ領域内のサブ領域を形成するのに使用される隣接HEVCタイルのセットを選択する。ここでは、各HEVCタイルのビデオ・データは独立して格納可能であり、またデコード可能である。これらHEVCタイルと関連付けられるビデオ・データは、次いで、図1から図9を参照して上述したSMFに基づいて要求され、別個のHEVCタイル・ストリームのセットとして、クライアント・デバイスにストリームされる。HEVCタイル・ストリームの受け取りの後に、ストリーム・プロセッサは、異なるHEVCタイル・ストリームのビデオ・データを同期および多重化(mux)し、その後に、ROIを含むイメージ領域についてデコードされるイメージ・データを生成するために、HEVCデコーダ924にビデオ・データを送る。イメージ領域はROI座標に基づいてクロッパ926によって切り取られる。つまり、最終的なROIは、デコード・プロセスから生じるイメージ領域よりも小さい。切り取られたイメージ(それぞれがROIを含む)は、ディスプレイ(非図示)にバッファおよびレンダリングされる。
したがって、上記のことから、ユーザ相互作用は、クライアント・デバイスに、所定のROIが表示される(デフォルトの)タイル化されていないROIストリーム・モードから、ユーザに表示されるROIがユーザ作用を介して操作されるタイル化されたストリーミング・モードへと切り替えさせる。「所定の」という用語は、イメージ領域内にある当該ROIの空間的位置が、ある時間期間にわたり予め決定され、また、クライアント・デバイスのコントロール外であるということに関する。一実施形態では、ROIストリーミング・モードから、タイル化されたストリーミング・モードへと切り替えるときに、クライアント・デバイスは、切り替えに応じてこのような所定のROIストリームのROIのROI座標を決定し、これらROI座標を使用して、タイル化されたストリーミング・モードで実質的に同一のROI(例えば、同一サイズおよび実質的に同一位置を有するもの)を形成する。その結果、コンテンツのレンダリングの間におけるスムーズな移行を達成することができる。
一実施形態では、外部信号は、クライアント・デバイスに、タイル化されていないROIストリーミング・モードから、タイル化されたストリーミング・モードに切り替えさせる。例えば、ROIジェネレータをトリガして、ROIストリームの信号および他の外部信号に基づいてROI座標の計算を開始する。
ROIストリーミング・モードからタイル・ストリーミングモードへと切り替えるとき、ROIストリームのフレームおよび選択されたHEVCタイル・ストリームのフレームが、クライアントによって受け取られ、共通のコンテンツ再生タイムラインに基づいて同期される。その結果、スムーズ、更にはシームレスな両モード間の移行を可能にすることができる。
図10Aおよび10Bは、本発明の実施形態によるクライアント・プロセスの概要図を示す。特に、図10Aは、ユーザ・ナビゲーション機能から生じる情報に基づいてROIの生成を制御するためのクライアント・プロセスを示す。本プロセスは、(デフォルトの)ROIストリーミング・モードで開始する(ステップ1000)。ユーザ相互作用が検出されない限り、クライアント・デバイス(「クライアント」とも称される)は、ROIストリーム(ROIストリーミング・モード)に基づいてROIのレンダリングを継続することができる。ユーザ相互作用がクライアントによって検出されると(ステップ1002)、ROIジェネレータが開始され(ステップ1004)、ストリーム・セレクタおよびストリーム・プロセッサのためにROI座標を計算する(ステップ1006)。ROIジェネレータによって決定される第1ROI座標は、ユーザが相互作用を開始しているROIストリームにおいてレンダリングされる1つ以上のフレームのROI座標に対応する。これらROI座標は、ストリーム・セレクタに転送されて(ステップ1006)、タイル化されたストリーミング・モードに切り替える(ステップ1008。図10Bを参照してより詳細に説明する)。
ユーザ・ナビゲーション機能は、特定のユーザ相互作用を解釈し(ステップ1010)、当該情報を(ROIベクトルとして)ROIジェネレータに転送する。ROIジェネレータは、クライアントによってレンダリングされるROIフレームと関連付けられるROI位置情報の受け取りを継続する。ROIジェネレータは、ROIストリームのROI位置情報およびROIベクトルに基づいて更なるROI座標を計算する(ステップ1012)。また、計算したROI座標をストリーム・セレクタおよびストリーム・プロセッサに転送する。その結果、タイル化されたストリーミング・モードでROIをレンダリングすることができる。本プロセスは、ユーザ相互作用が検出される限り継続する(ステップ1014)。もはやユーザ・アクティビティがないものとROIジェネレータが検出するときに(ステップ1014)、ROIジェネレータはROI座標の生成を停止する。
特に、図10Bは、ROIストリーミング・モードでのROIのレンダリングから、タイル化されたストリーミング・モードでROIのレンダリングへと切り替えるためのクライアント・プロセスを示す。本プロセスは、計算されたROI座標をROIジェネレータから受け取るストリーム・セレクタによって開始する(ステップ1020)。ストリーム・セレクタによって受け取った第1ROI座標は、ユーザが相互作用を開始しているROIストリームにおいてレンダリングされる1つ以上のフレームのROI座標に対応する。ストリーム・セレクタは、タイル位置情報およびROI座標を使用して、フレームのHEVCタイルを決定する(ステップ1022)。HEVCタイルから、イメージ領域が、計算されたROIを含んで形成される。クライアントは、マニフェスト・キャッシュに格納されたSMFからタイル位置情報を取り出す。
或いは別の実施形態では、クライアント・デバイス(例えば、クライアント・デバイスのストリーム・プロセッサ)は、(格納済みの)HEVCでタイル化されたビデオから直接タイル位置情報を取得する。例えば、図3を参照して詳細にて説明したように、(ファイルとして格納される)HEVCでタイル化されたビデオ・ストリームはタイル・トラックを含み、各タイル・トラックはタイル位置情報を含む。その場合、どのHEVCタイルが所望のROIと重複するかを決定するのにSMFは必要とされない。
ストリーム・セレクタは、ネットワークから、選択されたHEVCタイルに関連付けられたビデオ・データを要求するようにストリーム・リトリーバに指示する(ステップ1024)。要求されたHEVCタイル・ストリームをクライアントが受け取ると、クライアントは、それら共通のコンテンツ再生タイムラインに基づいてストリームを同期し、HEVCでタイル化されたビデオ・ストリームを多重化し、そして、デコードのためにビデオ・データをHEVCデコーダに送る(ステップ1026)。デコードされた画像データは、ROIを含むサブ領域を表し、計算されたROI座標に基づいて切り取られる(ステップ1028)。切り取られた画像は、バッファされ、ディスプレイ上にレンダリングされる(ステップ1030)。上記のプロセスにより、タイル化されたストリーミング・モードへ切り替えるときに、ROIストリーミング・モードで最後にレンダリングされたROIが、タイル化されたストリーミング・モードで最初にレンダリングされたROIと実質的に一致するのを確実にする。このようにして、クライアントは、ROIストリーミング・モードのROIのレンダリングから、タイル化されたストリーミング・モードのROIのレンダリングへのスムーズな切り替えを可能にする。
図11Aおよび図11Bは、本発明の一実施形態によるROIストリーミング・プロセスを示す。この特定の例では、HEVCタイル・ストリームは、適応型ストリーミング・プロトコル(例えば、HTTP適応型ストリーミング・プロトコル)を用いて、CDNによってクライアント・デバイス(「クライアント」とも称される。)に配信される。本プロセスは、クライアントがコンテンツ・プロバイダCPから空間的マニフェスト・ファイルを要求および受け取ることで開始する(ステップ1100および1102)。クライアントは、SMFを解析し(ステップ1104)、ストリーミング・プロセスをROIストリーミング・モードで開始する。そのためには、クライアントは、SMFに基づいてROIストリームの第1時間的(ROI)セグメントを選択し、要求メッセージ(例えば、HTTPGETメッセージ)をCDNの要求ルーティングRRに送る(ステップ1106)。要求ルーティング・ノードは、要求された時間的ROIセグメントが格納される配信ノードを位置決定し、ローカライズされた配信ノードのURLをリダイレクト・メッセージでクライアントに送り返す(ステップ1108)。「時間的」という用語は、セグメントの(コンテンツの)再生期間に関連付けられる特定の期間をセグメントが有するという見解に関連する。よって、時間的セグメントは、ソース・ビデオ・コンテンツの時間寸法でのセグメント化の結果である。本出願で参照する如何なるセグメントも、特定の再生期間を有する。それに加え、特定カテゴリのセグメント(SMFまたは空間的マニフェスト・ファイルで参照されるもの)は、追加の空間的セグメント化プロセスの結果である。ここでは、セグメントが、ソース・ビデオ・コンテンツのイメージ領域のサブセット(例えば一部)であるイメージ領域を含むように、ビデオ・コンテンツはセグメント化される。これらセグメントは、場合によっては、空間的セグメントまたはタイル・セグメントと称されることもある。なお、タイル・セグメントは、タイル/(HEVC)タイル・ストリームに関連付けられる時間的セグメントに相当する点が留意されるべきである。空間的セグメントであるが、空間的セグメント化の結果ではないという意味において、ROIセグメントは異なる。つまり、ROIセグメントは「静的」な位置情報を有する必要はない(けれども、有する)。これとは対照的に、タイル・セグメントは、経時的に静的であり、空間的セグメント化を反映するタイル位置情報に関連付けられる。クライアントは、SMFで特定されるROIセグメントを要求するためにURLを使用する。
したがって、リダイレクト・メッセージの後に、クライアントは、要求メッセージを配信ノードに送り返す(ステップ1110)。配信ノードは、要求された時間的ROIセグメントを含む。配信ノードは、要求された第1ROIセグメントをクライアントに送り返す(ステップ1112)。この特定の例では、ROIセグメントは、ROIのROI座標を含む。ROI座標は、ソース・ビデオの空間的表現内で軌跡を定める。ストリーム内でROI座標を搬送する異なる方法について、以下により詳細に説明する。第1時間的ROIセグメントは、クライアントによってバッファおよび再生される(ステップ1114)と共に、更なる時間的セグメントのための取り出しプロセスが継続される。
特定の時間の後、例えば6番目のROIセグメントの再生の間(ステップ1116から1118)、クライアントがトリガされ、タイル化されたストリーミング・モードへと切り替える(ステップ1120)。例えば、クライアントは、ユーザ・ナビゲーション機能によって解釈されるユーザ相互作用をパニング・アクションとして検出する。タイル化されたストリーミング・モードへと切り替えるトリガに応じて、クライアントは、検出されたユーザ相互作用の間にレンダリングされている1つ以上のフレームに関連付けられた第1ROI座標を決定する(ステップ1122)。その後に、クライアントは、上記図9、図10Aおよび図10Bを参照して説明したのと同様の方法で、ROIストリームのROI位置情報に基づいて更なるROI座標の決定を継続する。
一実施形態では、クライアントは、第1ROI座標およびSMFのタイル位置情報を用いて、ROIを含むイメージ領域を形成するのに使用される空間的に隣接したHEVCタイルのセットを決定する。この例では、選択されたHEVCタイルに関連付けられるHEVCタイル・ストリームが時間的にセグメント化され、HAS(HTTP適応型ストリーミング)プロトコルを使用してタイル・セグメントをクライアントに配信する。その後に、クライアントは、SMFに基づいて、選択されたHEVCタイル・ストリームにおけるこれらタイル・セグメントの要求を開始する。特に、クライアントは、HEVCタイルにおける選択された時間的セグメントのURLを含む要求メッセージを送る(この場合、HEVCタイル7,11,12の7番目の時間的セグメント(即ち、video7_7,video7_11,video7_12))(ステップ1124から1126)。また、これに応じて、選択されたHEVCタイル・ストリームにおける要求された時間的セグメントを含む配信ノードから応答メッセージを受け取る(ステップ1128から1130)。
図3を参照して詳細に説明したように、HEVCタイルのビデオ・データが別々のビデオ・トラックに格納される場合はまた、ベース・トラックはクライアント・デバイスによって要求されなければならない(非図示)。エクストラクタを含むベース・トラックは、選択されたHEVCタイルのビデオ・データを連続イメージにデコードするために、HEVCデコーダによって使用される。
HEVCタイル・ストリームを決定および要求する上述したプロセスの間、要請する上記の方法の間、クライアントはROIセグメントの再生を継続する(非図示)。
要求されたHEVCタイル・ストリームの受け取りに応じて、クライアントは、共通のコンテンツ再生タイムラインに基づいて、HEVCタイル・ストリームと、レンダリングされたROIストリームとを同期する。隣接するHEVCタイル・ストリームにおいて同期されたフレーム(即ち、特定の共通再生時間に関連付けられるフレーム)は、HEVCデコーダによって、ROIを含むイメージ領域にデコードされる(ステップ1132)。必要に応じて、要求されたHEVCタイル・ストリームをクライアントが受け取ったときに、ROI座標を用いてイメージ領域を切り取り、再生されているROIストリームのROIに実質的に類似するイメージ領域にする。
HEVCタイル・ストリームに基づくイメージ領域の形成が、ROIストリームにおけるフレームの再生と同期しているときに、クライアントは、ROIストリームに基づくROIのレンダリングから、HEVCタイル・ストリームに基づくユーザが生成したROIのレンダリングへと切り替える(ステップ1134)。タイル化されたストリーミング・モードでは、クライアントは、HEVCタイル・ストリームの時間的セグメントを要求し、共通の再生時間に関連付けられるフレームをイメージ領域にデコードし、そして、(任意で)イメージ領域を切り取った後にイメージ領域をディスプレイにレンダリングする。
特定の時間の後に、例えば、選択されたHEVCタイルの8番目および9番目の時間的セグメントに基づいて生成された、切り取られたイメージ領域の再生(ステップ1136および1138)の後に、ユーザはクライアント・デバイスと相互作用して、デフォルトのROIストリーミング・モードへと戻すよう切り替える(ステップ1140)。このモードでは、コンテンツのレンダリングは、10番目のROIセグメントに基づいて継続される(ステップ1142)。
図12Aおよび図12Bは、本発明の実施形態により、タイル化されていないストリーミング・モードとタイル化されたストリーミング・モードとの間をシームレスに切り替えるプロセスを示す。図12Aおよび12Bに示すように、タイル化されたストリーミング・モードを開始するために選択されているHEVCタイル・ストリームは、時刻Tにおいて、ROIストリームにおける1つ以上のROIフレームに関連付けられるROI位置情報に基づいて決定される。時刻Tでは、クライアントは、タイル化されたモードへと切り替えるための(例えば、ユーザ相互作用による)トリガを受け取る。
本実施形態は、ROIストリームまたはROIストリームの特定部分のために使用される。ここでは、ROI軌跡は、隣接するHEVCタイル・ストリームによって形成されるイメージ領域の外部とはならない。隣接するHEVCタイル・ストリームは、タイル化されたストリーミング・モードに切り替える信号が受け取られる時刻でクライアントによって選択される。
図12Aは、クライアント・デバイス(「クライアント」とも称される。)が、時刻Tにおいて、ROIストリーミング・モードから、タイル化されたストリーミング・モードへと切り替える信号を受け取る状況を示す。当該時刻では、クライアントは、ROIストリームのフレームfをレダリングしている。フレームfに関連付けられるROI位置情報は、ROI座標フレームf(図12Aの位置0)を含む。これらROI座標を用いて、フレームfのROIを含むイメージ領域を形成するのに使用される、空間的に隣接する(同期された)HEVCタイル・ストリームのセットを取り出すことができる。
選択されたHEVCタイル・ストリームを取り出すのに必要とされる時間期間Δtの間、n個のROIフレームは、クライアントによってレンダリングされる。ここでは、n=Δt*Rであり、また、Rは、ROIストリームをクライアントに送信するために配信ノードによって使用される(平均)フレーム伝送速度である。時刻T+nでは、クライアントは、要求された隣接するHEVCタイル・ストリームを受け取り、タイル・フレームをROIストリームのROIフレームと同期させて、HEVCタイル・ストリームにおいて同期したフレームを、ROIを含むイメージ領域にデコードする。必要に応じて、クライアントは、時刻T+nでROIストリームにおけるROIのROI座標を使用して、時刻T+nでROIフレームのROIに実質的に一致するイメージへとイメージ領域を切り取ることができる。その後に、クライアントは、ROIストリームに基づくROIのレンダリングから、切り取られたイメージに基づくROIのレンダリングへと切り替える。その結果、タイル化されたストリーミング・モードへのスムーズな移行を実現することができる。
図12Bは、図12Aに示されるタイル化されたストリーミング・モードへのスムーズな移行を達成するステップについてのプロセス・フローを示す。最初に、クライアントは、タイル化されたストリーミング・モードに切り替える信号を受け取る(ステップ1202)。次いで、フレームfと関連付けられるROI座標がクライアントに供給される(ステップ1204)。クライアントは、ROI座標およびSMFのタイル位置情報を使用して(ステップ1206)、後の時点、即ち、選択されたタイル・ストリームがクライアントによって受け取られる時刻T+nにおいて、ROIストリームのROIを含むイメージ領域を形成するように使用することができる隣接するタイル・ストリームのセットを決定する(ステップ1208)。
選択されたHEVCタイル・ストリームは取り出されて(ステップ1210)、時刻T+nでクライアントによって受け取られる。その後に、隣接するHEVCタイル・ストリームのフレームと、レンダリングされたROIストリームのROIフレームとが同期される。コンテンツ提示タイムライン上で同一の位置を有する空間的に隣接するHEVCタイル・ストリームにおけるタイル・フレームf+nは、HEVCデコーダによってデコードされ(ステップ1212)、ROIストリームのフレームf+nのROIを含むイメージ領域を形成する(ステップ1214)。次いで、ROIフレームf+nに関連付けられるROI座標を用いて、イメージ領域からROIを切り取る(ステップ1216)。その後に、コンテンツの表示が、ROIストリームにおけるROIフレームのレンダリングから、HEVCタイル・ストリームのビデオ・データによって提供される、切り取ったイメージ領域のレンダリングへと切り替えられる(ステップ1218)。このようにして、ROIストリーミング・モードから、タイル化されたストリーミングへとスムーズに移行する。
如何なる特定の理由でも、タイルが未だ受け取られていないので、および/または、ROIが、要求された隣接するHEVCタイル・ストリームによって規定されるイメージ領域の(部分的に)外側にあるので、表示された領域が利用可能ではない場合、フォール・バック機構が実装される。一実施形態では、ストリーミング・プロセス全体にわたり、ソース・コンテンツの低解像度のビデオ・ストリームは、バックグラウンド・プロセスとしてクライアントにストリームされる。特定のコンテンツが利用可能ではないとき、低解像度ビデオを使用して、欠落したコンテンツを一時的に切り取り、該コンテンツを、欠落したHEVCタイルが取り出される間にレンダリングすることができる。このようにして、高品質ビデオが幾分遅れてレンダリングされる場合であっても、タイル化されたストリーム・モードへのスムーズな移行が達成される。
図13Aおよび図13Bは、本発明の別の一実施形態により、ROIストリーミング・モードと、タイル化されたストリーミング・モードとの間をシームレスに切り替えるプロセスを示す。幾らかの状況では、(特に、データがベストエフォート・ネットワークを通じて配信されるときに)タイル・セグメントを取り出す時間Δtは数秒のオーダとなることがある。更に、幾らかの状況では、ROIストリームにおけるROIの軌跡は、非常に動的なものとなることがあり、例えば、ソース・ファイルのイメージ領域において短い時間期間で大きな変換および/またはズーミング・アクションを含むことがある。したがって、HEVCタイルの時間的セグメントの取り出し時間の間、ROIの軌跡は、時刻Tで当初選択されたタイルのセットにおけるイメージ領域の外側にシフトされる。その結果、ROIストリーミング・モードから、タイル化されたストリーミング・モードへのスムーズなレンダリングの移行が妨害されることになる。
この課題に対処するために、本発明の特定の実施形態では、ROI位置情報は、ROIビデオ・ストリームの1つ以上のビデオ・フレームに関連付けられる先行(look-ahead)位置情報(例えば、先行位置)を含む。1つ以上のビデオ・フレームは、このような先行位置情報が受け取られるときには、未だクライアントによって受け取られていない。一実施形態では、先行位置情報は、ROIビデオ・ストリームの1つ以上のイメージ・フレームにおける1つ以上の時間シフトされた第1ROI座標を含む。1つ以上のビデオ・フレームは、先行位置情報が受け取られるときには、未だクライアントによって受け取られていない。したがって、これら時間シフトされたROI座標は、関連付けられるイメージ・フレームを受け取るのよりも前に、クライアント・デバイスに供給されている。更なる一実施形態では、時間シフトされたROI座標は、時間シフトを決定するための時間シフト情報(好ましくは、タイム・スタンプ)に関連付けられる。時間シフトは、時間シフトされたROI座標の受け取りと、それらが関係するビデオ・コンテンツ(好ましくは1つ以上のイメージ・フレーム)の受け取りとの間の期間を表す。本実施形態では、クライアント・デバイスが事前にROI位置情報を受け取ることができるようにROI位置情報は時間シフトされる。このようにして、ROIが、ソース・ビデオのイメージ領域(例えば、HEVCでタイル化されたHEデオのイメージ領域)内で非常に動的な軌跡を時間と共に追従するときであっても、クライアントは、正確なHEVCタイル・ストリームを要求することができる。
図13Aおよび図13Bでは、ROI位置情報のROI座標は、ROIストリームにおける関連付けられるフレームに関して、事前にクライアントに供給される。一実施形態では、ROI位置情報が時間期間(フレーム数で表される)n=Δt×Rにわたり時間シフトされ、ここで、RはROIストリームをクライアントに伝送するために配信ノードによって使用される(平均)伝送速度である。時間シフトされたROI位置情報は、CDNまたはネットワークの他のエンティティによって用意される。Δtは、CDNがセグメントをクライアントに配信する最大時間期間である。
時間シフトΔtは、ネットワークの特徴配信時間に基づいて決定される。例えば、ベスト・エフォート型ネットワークでは、Δtは比較的大きく(例えば数秒以上)てよい。また、特定のQoS規則にしたがってデータが配信されるネットワークでは、Δtはより小さく(例えば数秒未満または1秒未満でも)てよい。
上記のプロセスは図13Aに概略的に示され、クライアントは、時刻Tで、ROIストリーミング・モードから、タイル化されたストリーミング・モードへと切り替えるための信号を受け取る。その時点では、クライアントは、ROIストリームのフレームfをレンダリングしている。フレームfに関連付けられるROI位置情報は、事前にシフトされたROI座標である。特に、フレームfのROI位置情報は、将来のROIフレームf+n(ここでn=Δt*R)のROI座標を含む。クライアントは、時間シフトされたROIおよびSMFのタイル位置情報に基づいて、HEVCタイル・ストリームのセットを決定する。
期間Δt(nフレーム)の後に、選択されたHEVCタイル・ストリームの第1フレームは、時間T+nでクライアントに到達することになる。クライアントは、共通コンテンツ再生タイムラインに基づいて、HEVCタイル・ストリームおよびレンダリングされたROIストリームを同期させる。隣接するHEVCタイル・ストリームの同期されたフレーム(特定の共通再生時間に関連付けられる、選択されたHEVCタイル・ストリームのフレーム)は、HEVCデコーダによって、ROIを含むイメージ領域にデコードされる。次いで、クライアントは、時間シフトされたROI座標位置f+nを使用して、ROIを含むイメージ領域を形成し、フレームf+nのROIに対応するイメージを切り取る。このようにして、HEVCタイル・ストリームの取り出しの間にROIが移動しているときであっても、タイル化されたストリーミング・モードへのスムーズな移行を確実にする。
図13Bは、図13Aに示したタイル化されたストリーミング・モードへのスムーズな移行を達成するためのステップについてのプロセス・フローを示す。最初に、クライアントは、タイル化されたストリーミング・モードに切り替えるための信号を受け取る(ステップ1302)。次いで、フレームf+nに関連付けられる時間シフトされたROI座標がクライアントに供給される(ステップ1304)。クライアントは、時間シフトされたROI座標およびSMFのタイル位置情報を使用する(ステップ1306)。そして、ROIストリームのフレームf+nのROIを含むイメージ領域を形成するのに使用できる、隣接するタイル・ストリームのセットを決定する(ステップ1308)。選択されたHEVCタイル・ストリームが取り出されて(ステップ1310)、時刻T+nでクライアントによって受け取られる。その後に、隣接するHEVCタイル・ストリームのタイル・フレームと、レンダリングされたROIストリームのROIフレームとが同期される。コンテンツ提示タイムライン上で同一の位置を有する空間的に隣接するHEVCタイル・ストリームのフレームf+nがデコードされる(ステップ1312)。そして、ROIストリームのフレームf+nのROIを含むイメージ領域を形成する(ステップ1314)。時間シフトされたROI座標フレーム(posf+n)を用いて、イメージ領域からROIを切り取る(ステップ1316)。また、コンテンツの表示が、ROIストリームにおけるROIフレームのレンダリングから、HEVCタイル・ストリームにおける切り取られたイメージ領域のレンダリングへと切り替えられる(ステップ1318)。このようにして、ROIストリーミング・モードの再生コンテンツが非常に動的なROI軌跡に関する場合であっても、ROIストリーミング・モードから、タイル化されたストリーミングへのスムーズな移行を実施することができる。
図13Aおよび図13Bが、先行位置情報の使用についての一実施形態のみを提供し、他の実装もまた可能であることが提起される。例えば、一実施形態では、先行位置情報は、ソース・ビデオのイメージ領域内におけるROIの軌跡を予測するアルゴリズムによって、例えば、クライアント・デバイスのバッファにおいて利用可能であるROI位置情報を使用する公知の外挿(extrapolation)アルゴリズムを使用して生成される。
図14Aから図14Cは、本発明の様々な実施形態によるROI位置情報を示す。図14Aは、特定の関心領域を記述するXMLでエンコードされたROI位置情報の例を表す。図14AのROI位置情報は、3つの連続したROIタグを示す。
ROIタグは、ROIタグをROIストリームのROIフレームに関連付けるための情報を含む。例えば、図14Aでは、<AbsoluteTime>タグは、タイムスタンプ、またはストリームのフレームを特定するのに用いられる他の(一意の)値を含む。タイムスタンプは、ROIに関係付けられる絶対時間を規定する。一実施形態では、タイムスタンプは、それが関連付けられるROIフレームの記録時間を規定する実時間(wall-clock time)を含む。絶対時間は、浮動小数点での表記(例えばUnixエポック時間)で1970年1月1日からの秒数としてエンコードされる。タイムスタンプを使用するとき、タイムスタンプはまた、フレームが正確なROI位置情報(ROIタグ)に関連付られるようにビデオ・フレーム(1または複数)に埋め込まれてもよい。
更に、ROIタグは、ROIの位置情報を含む。例えば、<PixelX1X2Y1Y2>タグは、ピクセル単位でROIの位置を記述する。スクリーンの左上のピクセルは、(X,Y)=(0,0)に対応する。このように、X1はROIの左側を規定し、X2はROIの右側を規定し、Y1はROIの上部を規定し、そして、Y2はROIの下部を規定する。フルHD1920×1080スクリーンのための当該方式では、右下ピクセルは、(X,Y)=(1919,1079)に対応する。
本例の第1ROIは、フル・スクリーンを規定することができる。本例の第2ROIは、中央への80%のズーミングを表す。本例の第3ROIは、右側への20ピクセルの変換を表す。
図14Bは、XMLでエンコードされるROI位置情報についての別の実施形態を示す。ROIタグは、ROIに適用する相対時間を記述する<RelativeTime>タグを含む。相対時間は、ビデオ・コンテンツの出発点からカウントされ、浮動小数点での表記で秒としてエンコードされる。ROIタグをROIフレームと関連付けるために、相対時間が関連情報として使用される。相対時間を使用するときは、明確に規定されたROIストリームの出発点が規定されなければならない。
更に、ROIタグは、正規化されたフォーマット(X,Y,zoom)で記述される、<NormalizedXYzoom>タグを含む。ここで、座標「X,Y」は、ROIの左上ピクセルの位置を、浮動小数点の表記で示す。ここでは、XおよびYは共に0から1の範囲にある。この例では、スクリーンの左上ピクセルは(X,Y)=(0,0)に対応し、フル・スクリーンの右下は(X,Y)=(1、1)に対応する。パラメータ「ズーム(zoom)」はズーム・レベルを規定し、これもまた浮動小数点で表記される。zoom=1は、フル・スクリーンに対応する。
図14Bの第1ROIタグは、フル・スクリーンを表す。第2ROIは、左上への50%のズーミングを表す。本例の第3ROIは、ROIの左上のスクリーンの中央への移動を表す。
図14Cは、ROIタグで使用されるタグの例を表す。フレーム番号がコンテンツから導出できる場合、FrameNumberタグは関連情報として使用される。PixelXYWHタグは、X,Y座標に加え、ピクセル単位で表現されるROIの幅および高さを規定する。RadialNormalizedXYRタグは、円形ROIおよびその半径のX,Y座標を規定する。一実施形態では、X,Y座標は、0から1のスケールに正規化される。SpeedPixeldXdYdWdHタグは、X,Y、ROIの幅、高さの時間微分値を規定し、ピクセル/秒で表現される。
図15は、ROI位置情報がMPEGトランスポート・ストリーム(MPEGTS)の基本ストリームとして搬送される一実施形態を示す。特に、ROIストリームのROI座標は、プライベート・データ・ストリームIDを有する別個のPES(パケット化基本ストリーム)でパケット化される。ROI座標ストリームと称される当該PESストリームは、次いで、更にROIストリームを含むMPEGトランスポート・ストリームで多重送信される。
図15は、ビデオ・ストリーム(Type=0x2,PID=0x1 B63)、オーディオ・ストリーム(Type=0x3,PID=0x1 B64)およびROI座標ストリーム(新規Type=0x20,PID=0x1B66)を含む PMTのXML表現を示す。新規ストリームTypeは、ROI座標情報を収容するPESストリームを示す。当該ストリームTypeは、次いで、ROI座標ストリームを収容するPIDを示すPMT(プログラム・マップ・テーブル)テーブルで使用される。
クライアント側では、ビデオおよびROI座標の同期は、PTSタイムスタンプを用いて実現される。PTSタイムスタンプは、特定のプログラムに属する全てのパケットに共通である(また、単一のPMTで記述される)。一例では、特定の時間的瞬間で、クライアントがROIストリームにおけるROI座標を検査する必要がある場合、クライアントは現在表示されているビデオ・フレームのPTS値を検査する。その後に、クライアントは、ROI座標(ROI座標ストリーム)を含むPESにおいて、同一のPTSを有するパケットを検索する。このパケット内で、クライアントは、その特定のビデオ・ストリームについてのROI座標情報を見つけることになる。
更なる一実施形態(MPEGトランスポート・ストリームでも使用されることもある一実施形態)では新規ストリームTypeを規定するのではなく、ROI座標データ(例えば(任意に時間シフトされた)ROI座標)が、DVBで定義されたSAD(同期補助データ;SynchronisedAuxilary Data)構造(TS 102 823参照)を使用して運搬される。その場合、PMTテーブルは、プライベート・データPESストリームを示す0x06のストリームTypeを知らせる(advertise)。特定のSADがROI座標を含むことを示すために、新規の補助データ記述子(AuxilaryData Descriptor)が定義される(TS102 823の5.1参照)。
新規のPESストリームTypeを規定する替わりにROI座標ストリームを搬送および指し示すためにSAD構造を使用することは別にして、本実施形態の別の全ての態様は、図15を参照して説明した実施形態についてのものと同様である。SADパケットはまたPTS値を収容するので、これらは、ROI座標ストリームおよびROIストリームの間の同期を提供するのに使用することができる。
更なる別の実施形態では、時間シフトされたROI座標を搬送するために、SADパケットは、ROI座標データのみならず、座標が関係するタイムスタンプも含む。このようなタイムスタンプは、フレーム番号、コンテンツ・タイムスタンプ、またはPTS/DTS値の形態とすることができる。後者の場合は、パケット・ヘッダのPTS値は、TSストリームにパケットを配置するためにTSマルチプレクサによって使用される。また、ペイロードに含まれるPTSパケットは、座標を特定のビデオ・フレームに関連付けるために使用される。
図16Aおよび図16Bは、ROIデータがMPEGストリームのビットストリームで搬送される本発明の一実施形態を示す。特に、図16Aは、H.264/MPEG−4ベースのコーデックを使用してエンコードされるMPEGストリームのビットストリームにおいて、ROIデータが、補助強化情報(SEI; supplemental enhancement information)メッセージとして挿入される一実施形態を示す。
本方式では、NALユニットは、ビットストリームの基本ブロックを規定する。SEIメッセージは、補助強化情報(SEI)に関連付けられるNALユニットとして規定される(ISO/IEC14496―10 AVCの7.4.1 NAL Units semantic参照)。ここで、SEIメッセージは、タイプ5メッセージ即ち未登録ユーザ・データとして定義される。SEIメッセージは、ROIデータのパラメータのための所定数の整数(この例では4つの整数)を含む。
SEIメッセージは、デコードのプロセスを補助するために追加情報を搬送する。それにもかかわらず、デコードされる信号を構築するのにそれらの存在は義務的でない。その結果、デコーダの適合は、この追加情報を考慮に入れることを要件としない。様々なSEIメッセージおよびそれらセマンティクスの規定は、ISO/IEC14496−10:2012のD.2に定義される。
未登録のユーザ・データと称されるSEIメッセージ・タイプによって、任意のデータが、ビットストリーム内で搬送されるのを可能にする。ROI座標の場合には、当該SEIメッセージは、ROI座標を搬送するために使用される。4つのパラメータ(即ち、左上コーナーの水平および垂直位置、並びに幅および高さ)を使用して、ソース・ビデオにおいてデコードされたフレームのイメージ領域にROIを規定するのに使用される。
図16Bは、ROIデータが、コード化されたビットストリームで搬送される本発明の別の一実施形態を示す。フレーム・ヘッダ内のブール(Boolean)フラグが、このような情報が存在するかを示す。フラグがセットされる場合、フラグに続くビットは、ROI座標(例えば、水平および垂直軸における左上コーナーの位置、並びにソース・ビデオにおいてデコードされたフレームのイメージ領域内のROIの幅と高さ)を表す。
図17Aおよび図17Bは、ROIデータがビデオ・コンテナで搬送される本発明の一実施形態を示す。特に、これらの図は、ROI座標がビデオ・コンテナにおいて(例えばMP4ファイル・フォーマット(ISO/IEC14496−14)で)搬送される実施形態に関する。このようなファイルの全般的な構造について図17Aに説明する。MP4ファイル・フォーマットはボックスのセットを特定する。当該ボックスのセットは、関連付けられるメディア・データおよびメタデータを格納しそれらにアクセスするために階層構造を構成する。例えば、コンテンツに関連するメタデータのためのルート・ボックスは「moov」ボックスであり、また、メディア・データは「mdat」ボックスに格納される。より詳しくは、「stbl」ボックスまたは「サンプル・テーブル・ボックス」は、追加データを各サンプルに関連付けるのを可能にするトラックのメディア・サンプルをインデックス化する。ビデオ・トラックの場合に、サンプルはビデオ・フレームである。新規ボックスを追加する結果、ボックス「stbl」内の所謂「サンプルROI座標」または「stro」を使用して、ビデオ・トラックの全フレームのROI座標を格納する。図17Bは、ROI座標が新規ボックス「stro」において搬送される本発明の一実施形態を示す。新規ボックス「stro」は、ビデオ・トラックにおける一部または全部のサンプルについてのROI座標を含む。
図18は、ROI位置情報がMPEG−4ストリームの専用メタデータ・トラックとして搬送される本発明の一実施形態を示す。ROI位置情報トラックは、(オーディオまたはビデオのような)規則的なトラックの構造に従う。しかしながら、その中のデータは、ビデオまたはオーディオ・フレームでなく、(特定のサンプル入力コードを有する)ROI座標を収容したメタデータである。
規格ISO/IEC 14496のパート12は、ISOベース・メディア・ファイル・フォーマットで(そして、MP4ファイル・フォーマットへの継承によって)時間化されたメタデータ・トラックを含むメカニズムを提供する。本実施形態では、メタデータ・トラックおよびビデオ・トラックは、ROIデータ・トラック(ROI座標)のサンプルがビデオ・トラック(ビデオ・フレーム)のサンプルにマップされるように同期する必要がある。実際のところ、メタデータ・トラックは、参照タイプが「cdsc」であり、track_idが参照されるトラックのトラックidであるトラック参照「tref」ボックスを使用して、ビデオ・トラックにリンクされる。
更なる一実施形態では、ROI座標は、帯域外のファイルまたはストリームを介してクライアント・デバイスに配信される。同期はタイムスタンプを使用して達成される。一実施形態では、ROI座標はファイルにプットされ、(例えば、VoDストリームの場合は)再生を開始する前に、(ライブ・ストリームの場合は)WebSocketを介してデータを配信する前に取り出される。
この場合、ROI座標は実際のビデオ・データによって帯域外で送られるので、同期は、PTS値のようなビデオ・コンテナ内部情報に基づくことができない。その代わりに、コンテンツのタイムスタンプが使用される。このようなタイムスタンプは、コンテンツ時間(即ち、ビデオ・ストリームの開始において00:00:00で開始する)に基づくか、ライブのブロードキャスト・ストリームの実時間(例えば、20:31:11)に基づくものとすることができる。同様のタイムスタンプがまた、ビデオ・ストリーム自体にも存在しなければならない。MPEGDASHまたはHLSストリームのために、このようなタイムスタンプは、MPDまたはマニフェスト・ファイルによって提供される。ROIストリームが例えばDVBを通じて配信される場合は、MPEGTS Multiplex(102823参照)で挿入されるDVBタイムライン・パケットが使用される。
別の一実施形態では、ROI座標は、ビデオのウォータマーク(透かし)として搬送される。更なる一実施形態では、ROI座標は、ROIストリーム自体でウォータマークとして配置される。
図19Aおよび図19Bは、本発明の一実施形態による、タイル化されたストリーミングのための所謂「空間的バッファ」の使用について示す。図19Aは、ROIストリームにおけるROIフレームを示す。ここでは、ROIフレームは「空間的バッファ」1902、即ち(イメージ領域の中央1904の周囲にある)イメージ・データの周辺領域を含む。空間的バッファ1902はクライアントに送信されるが、表示されるコンテンツとユーザが相互作用しないとき、または表示されるコンテンツとの相互作用をユーザが許可されていないときは表示されない。したがって、その場合は、ユーザ相互作用がないときに表示される中央領域がROIフレームから切り取られて、ユーザに表示される。次いで、ユーザがコンテンツと相互作用するときに、ROI1906(の一部)は、空間的バッファとして規定されたゾーンにナビゲートされる。しかしながら、ユーザ相互作用があるので、空間的バッファからのイメージ・データの表示は許可される。ユーザ相互作用は、タイル化されたストリーミング・モードへの切り替えをトリガし、図9から図14を参照して先に詳細に説明したROIに基づいてタイルを要求する。HEVCタイル・ストリームの取り出しの間、移動するROI1908は、空間的バッファのゾーンに部分的に位置決定されるイメージ領域からROIを切り取ることによって表示される。本発明による一実施形態では、1つ以上のパラメータは、SMFにおいて、好ましくはMPD(メディア提示記述;Media Presentation Description))において規定され、空間的バッファのイメージ領域(表示されていないROIストリームにおけるイメージの領域)の寸法を示す。例えば@spatialbuffersizeと称されるこのパラメータは、以下のフォーマットの1つ以上で規定される。
即ち、
(ROIのイメージ領域の)幅と高さの%でのエッジ・サイズ
(表示されたROIのイメージ領域の周囲に一律に配信される)ピクセルでのエッジ・サイズ
(左、右、上、下、表示されたROIのイメージ領域の周囲の)ピクセルでのエッジ・サイズ
或いは、利用可能なROI座標のセットは4つ(x,y,w,h)から8つに拡張できる。つまり、内部の(表示された)ROIおよび外部のROI(空間的バッファを含む)の寸法をそれぞれ表す。
図20は、本発明の実施形態による3モードのROIストリーミング・モデルを示す。この特定の実施形態では、クライアントは、タイル化されたストリーミング・モード(第1モード)にあり、ユーザが生成したROIが4つのタイルに基づいてレンダリングされる。ユーザが相互作用を停止して、ROIストリーミング・モード(第3モード)でコンテンツを視聴するのを望む場合、システムは、即座にROIストリーミング・モードに切り替えるのではなく、所定の時間を通じて第2モードに切り替える。当該第2モードでは、クライアントは、ROIストリームのROI位置情報を受け取る間、タイル化されたストリーミング・モードのままである。次いで、クライアントは、図9から図14を参照して詳細に説明したように、ROI位置情報を用いてタイルを選択し、HEVCタイル・ストリームのセットにおいて同期されたフレームに基づいてイメージを切り取る。表示されたコンテンツとの相互作用をユーザが開始する場合は、ユーザが生成したROIを表示するために、タイル化されたストリーミング・モード(第1モード)へと即座に切り替える。或いは、ユーザが相互作用しようとしていることをクライアントが予測する場合、またはコンテンツ表示の特定の期間が開始される若しくは開始されようとしている場合は、ここでは、ユーザはコンテンツとの相互作用を望むという大きな変化があり、クライアントのロジックは第2モードへの切り替えを生じさせる。その結果、ユーザが生成したROIを表示する、タイル化されたストリーミング・モードへの移行は素早くスムーズな(シームレスな)方法で実現することができる。
図21は、図1から図20を参照して説明したシステムおよび方法で使用される例示のデータ処理システムを示すブロック図である。データ処理システム1000は、システム・バス2106を通じてメモリ素子2104に結合される少なくとも1つのプロセッサ2102を含む。このように、データ処理システムは、メモリ素子2104内にプログラム・コードを格納する。更に、プロセッサ2102は、システム・バス2106を介してメモリ素子2104からアクセスされるプログラム・コードを実行する。1つの態様では、データ処理システムは、プログラム・コードを格納および/または実行するのに適したコンピュータとして実装される。しかしながら、データ処理システム2100は、本明細書で説明した機能を実行することができる、プロセッサおよびメモリを含む如何なるシステムの形態で実装されてもよいことが認められて然るべきである。
メモリ素子2104は、1つ以上の物理メモリ・デバイス、例えば、ローカル・メモリ2108および1つ以上の大容量記憶装置2110を含んでもよい。ローカル・メモリは、ランダム・アクセス・メモリ、または実際のプログラム・コードの実行の間に通常使用されるまたは他の非持続型のメモリ・デバイス(1または複数)に関連する。大容量記憶デバイスは、ハード・ドライブまたは他の持続型データ記憶デバイスとして実装される。処理システム2100はまた、1つ以上のキャッシュ・メモリ(非図示)も含んでよく、少なくとも幾らかのプログラム・コードの時間的記憶を提供する。その結果、実行の間、大容量記憶デバイス2110から取り出されなければならないプログラム・コードの回数を低減することができる。
入出力(I/O)デバイスは、任意にデータ処理システムに結合することができる入力デバイス2112および出力デバイス2114として示される。入力デバイスの例には、これに限定されないが、キーボード、ポインティング・デバイス(例えばマウス)等が含まれる。出力デバイスの例には、これに限定されないが、モニタ或いはディスプレイ、スピーカ等が含まれる。入力デバイスおよび/または出力デバイスは、直接に、または介在する入出力コントローラを通じて、データ処理システムに結合される。ネットワーク・アダプタ2116はまた、データ処理システムに結合され、プライベートまたはパブリック・ネットワークを介在により、他のシステム、コンピュータ・システム、リモート・ネットワーク・デバイス、および/またはリモート記憶デバイスに結合されるのを可能にする。ネットワーク・アダプタは、システム、デバイスおよび/またはネットワークによって送信されたデータを受け取るためのデータ受信機と、システム、デバイスおよび/またはネットワークにデータを送信するデータ送信機とを含む。モデム、ケーブル・モデム、およびイーサネット・カードは、データ処理システム2150で使用される異なる種別のネットワーク・アダプタの例である。
図21に示されるように、メモリ素子2104は、アプリケーション2118を格納する。なお、データ処理システム2100は更に、アプリケーションの実行を促進できるオペレーティング・システム(非図示)を更に実行することが認められて然るべきである。アプリケーションは、実行可能プログラム・コードの形態で実装され、データ処理システム2100によって(例えば、プロセッサ2102によって)実行できる。アプリケーションの実行に応じて、データ処理システムは、本明細書で更に詳細に説明する1つ以上の動作を実行するように構成される。
1つの態様では、例えば、データ処理システム1000は、クライアント・データ処理システムを表す。クライアント・データ処理システムはまた、クライアント・デバイスとも称される。その場合、アプリケーション2118はクライアント・アプリケーションを表し、実行されると、「クライアント」に関して本明細書に説明した様々な機能を実行するデータ処理システム2100を構成する。クライアントの例は、これに限定されないが、パーソナル・コンピュータ、ポータブル・コンピュータ、モバイル・フォン等を含むことができる。
本明細書において用いた用語は、特定的な実施形態を説明するという目的のために過ぎず、本発明を限定することを意図するのではない。本明細書において使用する場合、文脈が明らかに別のことを示さない限り、単数形「1つ」(a)、「1つ」(an)、および「その」(the)は、複数形も含むことを意図する。更に、「含む」(comprises)および/または「含んでいる」(comprising)という用語は、本明細書において使用される場合、述べられた特徴、整数、ステップ、動作、構成要素、および/またはコンポーネントの存在を特定するが、1つ以上の他の特徴、整数、ステップ、動作、構成要素、コンポーネント、および/またはそれらのグループの存在または追加も排除しないことも理解されよう。
次の特許請求の範囲における全ての手段またはステップ・プラス機能の構成要素における対応する構造、材料、アクト、および均等物は、他の特許請求された構成要素と組み合わせて機能を実行するための任意の構造、材料、またはアクトを、具体的に特許請求されたものとして含むことを意図している。本発明の説明は、例示および説明の目的に限って提示されたのであり、網羅的であることや、開示された形態に本発明を限定することを意図するのではない。多くの変更態様および変形態様が、本発明の範囲や主旨から逸脱することなく、当業者には明白であろう。本開示の原理および実用的用途を最良に説明するように、そして当業者の他の者が、想定される特定の使用に適した種々の変更態様を有する種々の実施形態について本発明を理解することができるように、本実施形態について選択し説明した。

Claims (19)

  1. HEVCでタイル化された少なくとも1つのビデオ・ストリームに基づいてクライアント・デバイスの関心領域(ROI)を決定する方法であって、前記HEVCでタイル化されたビデオ・ストリームが全イメージ領域を含み、当該方法が、
    前記クライアント・デバイスにおいて、前記HEVCでタイル化されたビデオ・ストリームの前記全イメージ領域内に第1サブ領域を規定する第1ROIをレンダリングするためにROIビデオ・ストリームを受け取るステップであって、前記HEVCでタイル化されたビデオ・ストリームにおけるHEVCタイルの位置がタイル位置情報によって規定される、ステップと、
    前記クライアント・デバイスにおいて、前記ROIビデオ・ストリームの少なくとも1つのビデオ・フレームに関連付けられるROI位置情報を供給するステップであって、前記ROI位置情報が前記第1ROIの少なくとも第1位置を含む、ステップと、
    前記クライアント・デバイスによって、前記HEVCでタイル化されたビデオ・ストリームにおける1つ以上のHEVCタイルを、前記ROI位置情報および前記タイル位置情報に基づいて特定するステップと、
    前記クライアント・デバイスによって、前記HEVCでタイル化されたビデオ・ストリームの前記全イメージ領域内に第2サブ領域を規定する第2ROIをレンダリングするために、前記1つ以上の特定されたHEVCタイルに関連付けられるビデオ・データを要求するステップと、
    前記クライアント・デバイスによって、前記要求されたビデオ・データおよび前記ROI位置情報に基づいて前記第2ROIをレンダリングするステップと、
    を含む、方法。
  2. 請求項1記載の方法において、前記ROI位置情報を供給するステップが、更に、
    前記ROIビデオ・ストリームの少なくとも第1イメージ・フレームの第1ROI座標を供給するステップであって、前記第1ROI座標が、第2ROIをレンダリングする指示を受け取る第1時間インスタンスで、前記第1ROIの第1位置を規定するステップを含み、
    前記指示が、ユーザが出した指示である、方法。
  3. 請求項2記載の方法において、前記指示が、前記第1ROIの位置の変更を示すROIベクトルを含み、前記第1ROI座標および前記ROIベクトルが前記1つ以上のHEVCタイルを特定するのに使用される、方法。
  4. 請求項2または3記載の方法において、前記ROI位置情報を供給するステップが、更に、
    前記ROIビデオ・ストリームの少なくとも第2イメージ・フレームの第2ROI座標を供給するステップであって、前記第2ROI座標が、処理の第2時間インスタンスで、前記第1ROIの第2位置を規定するステップを含み、前記処理が、前記クライアント・デバイスによって前記ROIビデオ・ストリームを受け取り、バッファし、および/またはデコードすることの1つであり、前記第1ROI座標および前記第2ROI座標が前記1つ以上のHEVCタイルを特定するのに使用される、方法。
  5. 請求項1〜4の何れか一項記載の方法において、前記要求されたビデオ・データがHEVCでエンコードされ、前記第2ROIをレンダリングするステップが、
    前記要求されたHEVCでエンコードされたビデオ・データに基づいて、デコードされたイメージ領域を形成するステップを含む、方法。
  6. 請求項1〜5の何れか一項記載の方法において、前記ROI位置情報を供給するステップが、更に、
    前記クライアント・デバイスによって未だ受け取られていない前記ROIビデオ・ストリームの少なくとも1つのビデオ・フレームに関連付けられる先行位置情報を供給するステップを含み、前記先行位置情報が前記全イメージ領域における第2ROIの第2位置を含む、方法。
  7. 請求項6記載の方法において、前記先行位置情報が前記クライアント・デバイスによって未だ受け取られていない前記ROIビデオ・ストリームの1つ以上のイメージ・フレームにおける1つ以上の時間シフトされた第1ROI座標を含み、
    前記時間シフトされた第1ROI座標が前記1つ以上のイメージ・フレームよりも前に前記クライアント・デバイスに供給される、方法。
  8. 請求項1〜7の何れか一項記載の方法において、
    前記ROI位置情報の少なくとも一部が前記ROIビデオ・ストリームのビットストリームにおいて前記クライアント・デバイスに、SEIメッセージとして、または前記ビットストリームにおけるROI座標の位置を規定するROI座標フラグとして、搬送され、或いは、
    前記ROI位置情報の少なくとも一部が、MPEGトランスポート・ストリームにおいて、または、前記MPEGトランスポート・ストリームにおけるDVBで規定されたSAD(同期補助データ)パケットとして、前記クライアント・デバイスに搬送され、任意で、前記SADパケットが、時間シフトされたROI座標を含み、或いは、
    前記ROI位置情報の少なくとも一部がMPEG−4ストリームの所定のボックスにおいて搬送され、或いは、
    前記ROI位置情報の少なくとも一部が、ウォータマークとして、前記クライアント・デバイスに搬送される、方法。
  9. 請求項1〜7の何れか一項記載の方法において、前記ROI位置情報がMPEG−4ストリームの専用のメタデータ・トラックとして搬送され、前記メタデータ・トラックが、特定のサンプル入力コードを有する、メタデータとしてのROI座標を収容する、方法。
  10. 請求項1〜の何れか一項記載の方法において、
    前記タイル位置情報の少なくとも一部が、前記HEVCでタイル化されたビデオ・ストリームのmoovまたはmoofボックスにおいて、前記HEVCでタイル化されたビデオ・ストリームの一部として前記クライアント・デバイスに供給され、加えて/或いは、
    前記タイル位置情報の少なくとも一部が、空間的マニフェスト・ファイルで前記クライアント・デバイスに供給され、前記空間的マニフェスト・ファイルが、1つ以上の配信ノードを位置決定するための1つ以上のストリーム識別子を含み、前記1つ以上の配信ノードが、前記HEVCでタイル化されたビデオ・ストリームおよび/または前記ROIビデオ・ストリームを前記クライアント・デバイスに配信するように構成される、方法。
  11. 請求項1〜10の何れか一項記載の方法において、前記1つ以上の特定されたHEVCタイルに関連付けられた前記ビデオ・データが、空間的マニフェスト・ファイルに基づいて要求され、前記空間的マニフェスト・ファイルが、少なくとも1つ以上のHEVCタイル識別子と、前記タイル位置情報とを含む、方法。
  12. 請求項11記載の方法において、前記空間的マニフェスト・ファイルが、更に、1つ以上のROIビデオ・ストリームに関連付けられる1つ以上のROIビデオ・ストリーム識別子を含む、方法。
  13. 請求項12記載の方法において、前記1つ以上のROIビデオ・ストリーム識別子の内少なくとも1つは、前記ROI位置情報が時間と共に変化することを示す動的なインジケータに関連付けられる、方法。
  14. 請求項1〜13の何れか一項記載の方法において、前記特定するステップが、前記第1ROIと重複する1つ以上のHEVCタイルを特定することを含む、方法。
  15. 関心領域(ROI)をレンダリングするクライアント・デバイスであって、
    HEVCでタイル化されたビデオ・ストリームの全イメージ領域内に第1サブ領域を規定する第1ROIをレンダリングするためにROIビデオ・ストリームを受け、前記HEVCでタイル化されたビデオ・ストリームにおけるHEVCタイルの位置が、タイル位置情報によって規定され、
    前記ROIビデオ・ストリームの少なくとも1つのビデオ・フレームに関連付けられるROI位置情報を受け、前記ROI位置情報が前記第1ROIの第1位置を少なくとも含み、
    前記HEVCでタイル化されたビデオ・ストリームにおける1つ以上のHEVCタイルを、前記ROI位置情報および前記タイル位置情報に基づいて特定し、
    前記HEVCでタイル化されたビデオ・ストリームにおける前記全イメージ領域内に第2サブ領域を規定する第2ROIをレンダリングするために、ビデオ・データを要求し、
    前記要求されたビデオ・データおよび前記ROI位置情報に基づいて前記第2ROIをレンダリングする、
    ように構成されるクライアント・デバイス。
  16. 請求項15記載のクライアント・デバイスにおいて、
    当該クライアント・デバイスが、前記HEVCでタイル化されたビデオ・ストリームのmoovまたはmoofボックスにおいて、前記HEVCでタイル化されたビデオ・ストリームの一部として前記タイル位置情報の少なくとも一部を受けるように構成され、加えて/或いは、
    当該クライアント・デバイスが、空間的マニフェスト・ファイルで前記タイル位置情報の少なくとも一部を受けるように構成され、前記空間的マニフェスト・ファイルが、1つ以上の配信ノードを位置決定するための1つ以上のストリーム識別子を含み、前記1つ以上の配信ノードが、前記HEVCでタイル化されたビデオ・ストリームおよび/または前記ROIビデオ・ストリームを前記クライアント・デバイスに配信するように構成される、クライアント・デバイス。
  17. 請求項15または16記載のクライアント・デバイスにおいて、当該クライアント・デバイスが、前記ROIビデオ・ストリームのビットストリームにおける前記ROI位置情報の少なくとも一部を、SEIメッセージとして、または前記ビットストリームにおけるROI座標の位置を規定するROI座標フラグとして受けるように構成され、或いは、
    当該クライアント・デバイスが、前記ROI位置情報の少なくとも一部を、MPEGトランスポート・ストリームにおいて、または、前記MPEGトランスポート・ストリームにおけるDVBで規定されたSAD(同期補助データ)パケットとして受けるように構成され、任意で、前記SADパケットが、時間シフトされたROI座標を含み、或いは、
    当該クライアント・デバイスが、前記ROI位置情報の少なくとも一部を、MPEG−4ストリームの所定のボックスにおいて受けるように構成され、或いは、
    当該クライアント・デバイスが、前記ROI位置情報の少なくとも一部を、ウォータマークとして受けるように構成される、クライアント・デバイス。
  18. 請求項15または16記載のクライアント・デバイスにおいて、当該クライアント・デバイスがMPEG−4ストリームにおいて前記ROI位置情報の少なくとも一部を受けるように構成され、前記ROI位置情報が前記MPEG−4ストリームの専用のメタデータ・トラックとして搬送され、前記メタデータ・トラックが、特定のサンプル入力コードを有する、メタデータとしてのROI座標を収容する、クライアント・デバイス。
  19. コンピュータのメモリにおいて起動されると、請求項1〜14の何れかに記載の方法のステップを実行するように構成されるソフトウェア・コード部を有するコンピュータ・プログラム。
JP2016575351A 2014-06-27 2015-06-26 Hevcでタイル化されたビデオ・ストリームに基づく関心領域の決定 Active JP6440747B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14174815.2 2014-06-27
EP14174815 2014-06-27
PCT/EP2015/064511 WO2015197815A1 (en) 2014-06-27 2015-06-26 Determining a region of interest on the basis of a hevc-tiled video stream

Publications (2)

Publication Number Publication Date
JP2017527160A JP2017527160A (ja) 2017-09-14
JP6440747B2 true JP6440747B2 (ja) 2018-12-19

Family

ID=51059304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016575351A Active JP6440747B2 (ja) 2014-06-27 2015-06-26 Hevcでタイル化されたビデオ・ストリームに基づく関心領域の決定

Country Status (6)

Country Link
US (1) US10397666B2 (ja)
EP (1) EP3162074A1 (ja)
JP (1) JP6440747B2 (ja)
KR (1) KR101953679B1 (ja)
CN (1) CN106664443B (ja)
WO (1) WO2015197815A1 (ja)

Families Citing this family (167)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10530757B2 (en) 2013-07-25 2020-01-07 Convida Wireless, Llc End-to-end M2M service layer sessions
US10721530B2 (en) 2013-07-29 2020-07-21 Koninklijke Kpn N.V. Providing tile video streams to a client
US9781356B1 (en) * 2013-12-16 2017-10-03 Amazon Technologies, Inc. Panoramic video viewer
US20150253974A1 (en) 2014-03-07 2015-09-10 Sony Corporation Control of large screen display using wireless portable computer interfacing with display controller
WO2015197818A1 (en) 2014-06-27 2015-12-30 Koninklijke Kpn N.V. Hevc-tiled video streaming
WO2015197815A1 (en) 2014-06-27 2015-12-30 Koninklijke Kpn N.V. Determining a region of interest on the basis of a hevc-tiled video stream
GB2528039A (en) 2014-07-01 2016-01-13 Canon Kk Method for identifying objects across time periods and corresponding device
GB2527786B (en) * 2014-07-01 2016-10-26 Canon Kk Method, device, and computer program for encapsulating HEVC layered media data
EP3183612A4 (en) * 2014-08-18 2018-06-27 ViewsIQ Inc. System and method for embedded images in large field-of-view microscopic scans
US20160098180A1 (en) * 2014-10-01 2016-04-07 Sony Corporation Presentation of enlarged content on companion display device
CN106797499A (zh) * 2014-10-10 2017-05-31 索尼公司 编码装置和方法、再现装置和方法以及程序
TW201642655A (zh) * 2015-04-21 2016-12-01 Vid衡器股份有限公司 基於藝術意向之視訊編碼
EP3338454A1 (en) 2015-08-20 2018-06-27 Koninklijke KPN N.V. Forming one or more tile streams on the basis of one or more video streams
KR102551239B1 (ko) * 2015-09-02 2023-07-05 인터디지털 씨이 페이튼트 홀딩스, 에스에이에스 확장된 장면에서의 내비게이션을 용이하게 하기 위한 방법, 장치 및 시스템
GB201516552D0 (en) * 2015-09-18 2015-11-04 Microsoft Technology Licensing Llc Keyword zoom
GB201516553D0 (en) 2015-09-18 2015-11-04 Microsoft Technology Licensing Llc Inertia audio scrolling
WO2017060423A1 (en) 2015-10-08 2017-04-13 Koninklijke Kpn N.V. Enhancing a region of interest in video frames of a video stream
US10178414B2 (en) * 2015-10-14 2019-01-08 International Business Machines Corporation Aggregated region-based reduced bandwidth video streaming
US10506198B2 (en) * 2015-12-04 2019-12-10 Livestream LLC Video stream encoding system with live crop editing and recording
JP6587539B2 (ja) * 2015-12-28 2019-10-09 キヤノン株式会社 送信装置、情報処理方法及びプログラム
EP3412032A1 (en) * 2016-02-02 2018-12-12 Fraunhofer Gesellschaft zur Förderung der Angewand Scene section and region of interest handling in video streaming
JP6624958B2 (ja) * 2016-02-03 2019-12-25 キヤノン株式会社 通信装置、通信システム、通信制御方法およびコンピュータプログラム
CN118784881A (zh) * 2016-02-09 2024-10-15 弗劳恩霍夫应用研究促进协会 解码器、编码器、方法、网络设备以及可读存储介质
FI20165114A (fi) 2016-02-17 2017-08-18 Nokia Technologies Oy Laitteisto, menetelmä ja tietokoneohjelma videokoodausta ja videokoodauksen purkua varten
WO2017140948A1 (en) * 2016-02-17 2017-08-24 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
US10334224B2 (en) * 2016-02-19 2019-06-25 Alcacruz Inc. Systems and method for GPU based virtual reality video streaming server
US10958989B2 (en) * 2016-02-25 2021-03-23 Synamedia Limited Framework for embedding data in encoded video
US10313417B2 (en) 2016-04-18 2019-06-04 Qualcomm Incorporated Methods and systems for auto-zoom based adaptive video streaming
WO2017188714A1 (ko) * 2016-04-26 2017-11-02 엘지전자 주식회사 360도 비디오를 전송하는 방법, 360도 비디오를 수신하는 방법, 360도 비디오 전송 장치, 360도 비디오 수신 장치
US10595054B2 (en) 2016-05-10 2020-03-17 Google Llc Method and apparatus for a virtual online video channel
US10956766B2 (en) 2016-05-13 2021-03-23 Vid Scale, Inc. Bit depth remapping based on viewing parameters
US11032588B2 (en) * 2016-05-16 2021-06-08 Google Llc Method and apparatus for spatial enhanced adaptive bitrate live streaming for 360 degree video playback
US10582201B2 (en) * 2016-05-19 2020-03-03 Qualcomm Incorporated Most-interested region in an image
GB202108749D0 (en) * 2016-05-23 2021-08-04 Canon Kk Method, device, and computer program for adaptive streaming of virtual reality media content
GB2550589B (en) * 2016-05-23 2019-12-04 Canon Kk Method, device, and computer program for improving streaming of virtual reality media content
EP3466079B1 (en) * 2016-05-24 2023-07-12 Nokia Technologies Oy Method and an apparatus and a computer program for encoding media content
US10565463B2 (en) * 2016-05-24 2020-02-18 Qualcomm Incorporated Advanced signaling of a most-interested region in an image
GB2550604A (en) * 2016-05-24 2017-11-29 Canon Kk Method, device, and computer program for encapsulating and parsing timed media data
WO2017202899A1 (en) * 2016-05-25 2017-11-30 Koninklijke Kpn N.V. Spatially tiled omnidirectional video streaming
KR102277287B1 (ko) * 2016-05-26 2021-07-15 브이아이디 스케일, 인크. 뷰포트 적응형 360도 비디오 전달의 방법 및 장치
CN114727424A (zh) 2016-06-15 2022-07-08 康维达无线有限责任公司 用于新无线电的无许可上行链路传输
WO2018005823A1 (en) * 2016-07-01 2018-01-04 Jia Li Processing and formatting video for interactive presentation
US10623662B2 (en) 2016-07-01 2020-04-14 Snap Inc. Processing and formatting video for interactive presentation
US10622023B2 (en) 2016-07-01 2020-04-14 Snap Inc. Processing and formatting video for interactive presentation
WO2018009828A1 (en) * 2016-07-08 2018-01-11 Vid Scale, Inc. Systems and methods for region-of-interest tone remapping
CN106101847A (zh) * 2016-07-12 2016-11-09 三星电子(中国)研发中心 全景视频交互传输的方法和系统
CN109691113B (zh) 2016-07-15 2022-02-08 皇家Kpn公司 流式传输虚拟现实视频
KR102361314B1 (ko) * 2016-07-19 2022-02-10 한국전자통신연구원 360도 가상현실 방송 서비스 제공 방법 및 장치
KR102567002B1 (ko) * 2016-08-16 2023-08-14 삼성전자주식회사 영상 표시 장치 및 그 동작방법
US10574718B2 (en) * 2016-08-25 2020-02-25 Comcast Cable Communications, Llc Packaging content for delivery
WO2018043905A1 (ko) * 2016-08-29 2018-03-08 엘지전자 주식회사 360 비디오를 전송하는 방법, 360 비디오를 수신하는 방법, 360 비디오 전송 장치, 360 비디오 수신 장치
CA3034585A1 (en) 2016-08-30 2018-03-08 Sony Corporation Distribution device, distribution method, reception device, reception method, program, and content distribution system
WO2018049321A1 (en) * 2016-09-12 2018-03-15 Vid Scale, Inc. Method and systems for displaying a portion of a video stream with partial zoom ratios
CN109923867A (zh) * 2016-09-14 2019-06-21 皇家Kpn公司 流式传输虚拟现实视频
JP6884856B2 (ja) 2016-09-26 2021-06-09 ドルビー ラボラトリーズ ライセンシング コーポレイション コンテンツに基づいた映像データのストリーム分割
JP2018056686A (ja) * 2016-09-27 2018-04-05 株式会社ドワンゴ 画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラム
EP3301951A1 (en) 2016-09-30 2018-04-04 Koninklijke KPN N.V. Audio object processing based on spatial listener information
GB2554877B (en) * 2016-10-10 2021-03-31 Canon Kk Methods, devices, and computer programs for improving rendering display during streaming of timed media data
WO2018068213A1 (zh) 2016-10-10 2018-04-19 华为技术有限公司 一种视频数据的处理方法及装置
CN115037917A (zh) 2016-10-12 2022-09-09 弗劳恩霍夫应用研究促进协会 空间不均等流媒体化
WO2018069466A1 (en) 2016-10-12 2018-04-19 Koninklijke Kpn N.V. Processing spherical video data on the basis of a region of interest
US11197040B2 (en) * 2016-10-17 2021-12-07 Mediatek Inc. Deriving and signaling a region or viewport in streaming media
CN109845274B (zh) * 2016-10-25 2021-10-12 索尼公司 发送设备、发送方法、接收设备和接收方法
CN109891772B (zh) 2016-11-03 2022-10-04 康维达无线有限责任公司 Nr中的帧结构
WO2018083211A1 (en) 2016-11-04 2018-05-11 Koninklijke Kpn N.V. Streaming virtual reality video
US20180137119A1 (en) * 2016-11-16 2018-05-17 Samsung Electronics Co., Ltd. Image management method and apparatus thereof
US10652553B2 (en) * 2016-12-07 2020-05-12 Qualcomm Incorporated Systems and methods of signaling of regions of interest
JP2018107500A (ja) * 2016-12-22 2018-07-05 キヤノン株式会社 符号化装置、符号化方法及びプログラム、復号装置、復号方法及びプログラム
WO2018120294A1 (zh) * 2016-12-30 2018-07-05 华为技术有限公司 一种信息的处理方法及装置
WO2018128071A1 (en) * 2017-01-08 2018-07-12 Sharp Kabushiki Kaisha Systems and methods for signaling of tiles in most-interested regions for virtual reality applications
US11290755B2 (en) * 2017-01-10 2022-03-29 Qualcomm Incorporated Signaling data for prefetching support for streaming media data
KR102329061B1 (ko) * 2017-01-10 2021-11-19 삼성전자주식회사 3차원 이미지에 대한 메타데이터를 생성하기 위한 방법 및 장치
WO2018131813A1 (en) 2017-01-10 2018-07-19 Samsung Electronics Co., Ltd. Method and apparatus for generating metadata for 3d images
JPWO2018135321A1 (ja) * 2017-01-19 2019-11-07 ソニー株式会社 画像処理装置および方法
US11765406B2 (en) * 2017-02-17 2023-09-19 Interdigital Madison Patent Holdings, Sas Systems and methods for selective object-of-interest zooming in streaming video
WO2018155939A1 (ko) 2017-02-22 2018-08-30 에스케이텔레콤 주식회사 영상 복호화 방법 및 장치
KR102424829B1 (ko) * 2017-02-22 2022-07-25 에스케이텔레콤 주식회사 비디오 데이터가 부호화된 비트스트림을 처리하는 방법
EP3593536A1 (en) 2017-03-07 2020-01-15 PCMS Holdings, Inc. Tailored video streaming for multi-device presentations
US11139000B2 (en) * 2017-03-07 2021-10-05 Mediatek Inc. Method and apparatus for signaling spatial region information
WO2018169139A1 (ko) * 2017-03-17 2018-09-20 엘지전자 주식회사 360도 비디오의 영역 정보 전달 방법 및 장치
WO2018174387A1 (ko) * 2017-03-20 2018-09-27 엘지전자 주식회사 360 비디오를 전송하는 방법, 360 비디오를 수신하는 방법, 360 비디오 전송 장치, 360 비디오 수신 장치
KR102277267B1 (ko) * 2017-03-29 2021-07-14 엘지전자 주식회사 360 비디오를 전송하는 방법, 360 비디오를 수신하는 방법, 360 비디오 전송 장치, 360 비디오 수신 장치
KR20180112708A (ko) * 2017-04-03 2018-10-12 한국전자통신연구원 고화질 360도 vr 영상 처리 장치 및 방법
US20180310040A1 (en) * 2017-04-21 2018-10-25 Nokia Technologies Oy Method and apparatus for view dependent delivery of tile-based video content
CN110546960B (zh) * 2017-05-01 2022-09-06 真实网络公司 多层视频流传输系统和方法
US10475483B2 (en) 2017-05-16 2019-11-12 Snap Inc. Method and system for recording and playing video using orientation of device
US11049219B2 (en) 2017-06-06 2021-06-29 Gopro, Inc. Methods and apparatus for multi-encoder processing of high resolution content
CN107197369B (zh) * 2017-06-06 2020-01-14 清华大学 一种多子流协同的视频流媒体并行解码方法
BR112019025471A2 (pt) * 2017-06-09 2020-06-23 Sony Semiconductor Solutions Corporation Dispositivo de transmissão de figura, e, dispositivo de recepção de figura
GB2563439B (en) * 2017-06-16 2022-02-16 Canon Kk Methods, devices, and computer programs for improving streaming of portions of media data
EP3646593A4 (en) 2017-06-26 2021-03-31 Nokia Technologies Oy APPARATUS, PROCESS AND COMPUTER PROGRAM FOR OMNIDIRECTIONAL VIDEO
GB2563865A (en) 2017-06-27 2019-01-02 Canon Kk Method, device, and computer program for transmitting media content
US10679415B2 (en) * 2017-07-05 2020-06-09 Qualcomm Incorporated Enhanced signaling of regions of interest in container files and video bitstreams
KR20240038175A (ko) 2017-07-06 2024-03-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 분할된 비디오 스트리밍 개념
CN109218755B (zh) * 2017-07-07 2020-08-25 华为技术有限公司 一种媒体数据的处理方法和装置
MX2020001303A (es) * 2017-08-10 2020-03-09 Sony Corp Aparato de transmision, metodo de transmision, aparato de recepcion y metodo de recepcion.
CN118509635A (zh) * 2017-08-30 2024-08-16 Vid拓展公司 跟踪式视频缩放
JP2019054417A (ja) * 2017-09-15 2019-04-04 ソニー株式会社 画像処理装置およびファイル生成装置
JP7035401B2 (ja) * 2017-09-15 2022-03-15 ソニーグループ株式会社 画像処理装置およびファイル生成装置
JP7085816B2 (ja) * 2017-09-26 2022-06-17 キヤノン株式会社 情報処理装置、情報提供装置、制御方法、及びプログラム
EP3461132A1 (en) 2017-09-26 2019-03-27 Thomson Licensing Method and terminal for tile selection amongst a set of tiles
US11025919B2 (en) * 2017-10-03 2021-06-01 Koninklijke Kpn N.V. Client-based adaptive streaming of nonlinear media
RU2741507C1 (ru) * 2017-10-09 2021-01-26 Нокиа Текнолоджиз Ой Устройство и способ для кодирования и декодирования видео
GB2567624B (en) * 2017-10-12 2021-05-26 Canon Kk Method, device and computer program for transmitting media content
US20200294188A1 (en) * 2017-11-30 2020-09-17 Sony Corporation Transmission apparatus, transmission method, reception apparatus, and reception method
EP3493552A1 (en) * 2017-11-30 2019-06-05 Thomson Licensing Method for managing a streaming processing of a multimedia video spatially tiled stored on a network equipment, and corresponding terminal
CN109996055B (zh) 2017-12-06 2022-08-12 杜比实验室特许公司 位置零时延
US11451838B2 (en) * 2017-12-07 2022-09-20 Koninklijke Kpn N.V. Method for adaptive streaming of media
EP3503559A1 (en) * 2017-12-20 2019-06-26 Thomson Licensing Method and terminal for managing a streaming session of an immersive video spatially tiled with a set of tiles and stored on a network equipment
US10798455B2 (en) 2017-12-22 2020-10-06 Comcast Cable Communications, Llc Video delivery
US10390063B2 (en) 2017-12-22 2019-08-20 Comcast Cable Communications, Llc Predictive content delivery for video streaming services
CN109996069B (zh) 2018-01-03 2021-12-10 华为技术有限公司 视频图像编解码方法及设备
CN110035316B (zh) * 2018-01-11 2022-01-14 华为技术有限公司 处理媒体数据的方法和装置
EP3739889A4 (en) * 2018-01-12 2020-11-25 Sony Corporation TRANSMISSION DEVICE, TRANSMISSION PROCESS, RECEIVING DEVICE AND RECEPTION PROCESS
CN110035331B (zh) * 2018-01-12 2021-02-09 华为技术有限公司 一种媒体信息的处理方法及装置
US11025942B2 (en) * 2018-02-08 2021-06-01 Samsung Electronics Co., Ltd. Progressive compressed domain computer vision and deep learning systems
JP7085869B2 (ja) * 2018-03-20 2022-06-17 株式会社Nttドコモ 情報処理装置
CN110324601A (zh) * 2018-03-27 2019-10-11 京东方科技集团股份有限公司 渲染方法、计算机产品及显示装置
CN118175299A (zh) * 2018-04-02 2024-06-11 Lg电子株式会社 解码设备、编码设备和发送设备
EP3780629A1 (en) * 2018-04-05 2021-02-17 Sony Semiconductor Solutions Corporation Transmission device, reception device, and communication system
US10812828B2 (en) 2018-04-10 2020-10-20 At&T Intellectual Property I, L.P. System and method for segmenting immersive video
KR102518869B1 (ko) 2018-04-11 2023-04-06 알카크루즈 인코포레이티드 디지털 미디어 시스템
CN112771884B (zh) * 2018-04-13 2023-02-10 华为技术有限公司 具有多个机位的虚拟现实内容的沉浸式媒体度量
JP2020005038A (ja) * 2018-06-25 2020-01-09 キヤノン株式会社 送信装置、送信方法、受信装置、受信方法、及び、プログラム
US11290728B2 (en) 2018-07-02 2022-03-29 Nokia Technologies Oy Method and apparatus for tile-relative addressing in video coding
IL260438B (en) * 2018-07-05 2021-06-30 Agent Video Intelligence Ltd A method and system for identifying objects in video
CN112585978B (zh) 2018-07-30 2023-07-25 皇家Kpn公司 生成用于在vr中显示的复合视频流
KR102114466B1 (ko) * 2018-09-05 2020-05-25 트러스트팜모바일 주식회사 영상 컨텐츠 내 관심 영역 정보를 이용한 영상 디스플레이 방법 및 장치
GB2577478B (en) * 2018-09-06 2021-03-10 Maritech Development Ltd A method of creating map tiles which comprise vessel information
CN115883882A (zh) * 2018-09-19 2023-03-31 中兴通讯股份有限公司 图像处理方法、装置、系统、网络设备、终端及存储介质
WO2020068251A1 (en) 2018-09-27 2020-04-02 Convida Wireless, Llc Sub-band operations in unlicensed spectrums of new radio
US10798389B2 (en) * 2018-10-02 2020-10-06 Tencent America LLC Method and apparatus for content-aware point cloud compression using HEVC tiles
US10779014B2 (en) 2018-10-18 2020-09-15 At&T Intellectual Property I, L.P. Tile scheduler for viewport-adaptive panoramic video streaming
US11924442B2 (en) 2018-11-20 2024-03-05 Koninklijke Kpn N.V. Generating and displaying a video stream by omitting or replacing an occluded part
EP3672251A1 (en) * 2018-12-20 2020-06-24 Koninklijke KPN N.V. Processing video data for a video player apparatus
WO2020130912A1 (en) * 2018-12-20 2020-06-25 Telefonaktiebolaget Lm Ericsson (Publ) Improved tile address signalling in video encoding and decoding
US11570435B2 (en) 2019-01-16 2023-01-31 Telefonaktiebolaget Lm Ericsson (Publ) Video coding comprising uniform tile split with remainder
US10986308B2 (en) * 2019-03-20 2021-04-20 Adobe Inc. Intelligent video reframing
US11991402B2 (en) 2019-03-26 2024-05-21 Interdigital Vc Holdings, Inc. System and method for multiplexed rendering of light fields
US11523185B2 (en) 2019-06-19 2022-12-06 Koninklijke Kpn N.V. Rendering video stream in sub-area of visible display area
US11109067B2 (en) * 2019-06-26 2021-08-31 Gopro, Inc. Methods and apparatus for maximizing codec bandwidth in video applications
US11228781B2 (en) 2019-06-26 2022-01-18 Gopro, Inc. Methods and apparatus for maximizing codec bandwidth in video applications
CN114073097A (zh) 2019-07-17 2022-02-18 皇家Kpn公司 通过边缘计算促进视频流式传输和处理
KR102640664B1 (ko) * 2019-08-16 2024-02-26 엘지전자 주식회사 Vr 디바이스 및 vr 디바이스 제어 방법
US20220329886A1 (en) * 2019-08-19 2022-10-13 Telefonaktiebolaget Lm Ericsson (Publ) Methods and devices for handling media data streams
US10986337B2 (en) * 2019-08-22 2021-04-20 Immersive Tech, Inc. Systems and methods for selective transmission of media content
CN110557566B (zh) * 2019-08-30 2021-12-17 维沃移动通信有限公司 视频拍摄方法及电子设备
CN114600468B (zh) 2019-09-03 2024-06-25 皇家Kpn公司 将复合视频流中的视频流与元数据组合的组合器系统、接收器设备、计算机实现的方法和计算机可读介质
US10972753B1 (en) 2019-09-13 2021-04-06 Apple Inc. Versatile tile coding for multi-view video streaming
WO2021073336A1 (en) * 2019-10-18 2021-04-22 Guangdong Oppo Mobile Telecommunications Corp., Ltd. A system and method for creating real-time video
US11481863B2 (en) 2019-10-23 2022-10-25 Gopro, Inc. Methods and apparatus for hardware accelerated image processing for spherical projections
US11388427B2 (en) * 2020-01-09 2022-07-12 Qualcomm Incorporated Multiple decoder interface for streamed media data
KR20210100853A (ko) * 2020-02-07 2021-08-18 삼성전자주식회사 이미지를 저장하는 전자 장치 및 방법
CN111614975B (zh) * 2020-05-08 2022-07-12 深圳拙河科技有限公司 一种亿级像素视频播放方法、装置、介质及设备
US11734789B2 (en) 2020-06-02 2023-08-22 Immersive Tech, Inc. Systems and methods for image distortion correction
US20230215129A1 (en) * 2020-06-16 2023-07-06 Dolby Laboratories Licensing Corporation Representing volumetric video in saliency video streams
CN113824958A (zh) * 2020-06-18 2021-12-21 中兴通讯股份有限公司 视频分块方法、传输方法、服务器、适配器和存储介质
CN112533005B (zh) * 2020-09-24 2022-10-04 深圳市佳创视讯技术股份有限公司 一种vr视频慢直播的交互方法及系统
CN112381907B (zh) * 2020-11-12 2023-04-18 上海哔哩哔哩科技有限公司 多媒体轨道绘制方法和系统
US11956518B2 (en) 2020-11-23 2024-04-09 Clicktivated Video, Inc. System and method for creating interactive elements for objects contemporaneously displayed in live video
US20230007314A1 (en) * 2021-07-05 2023-01-05 Mediatek Singapore Pte. Ltd. System and method of server-side dynamic spatial and temporal adaptations for media processing and streaming
EP4138401A1 (en) * 2021-08-17 2023-02-22 Nokia Technologies Oy A method, an apparatus and a computer program product for video encoding and video decoding
WO2023058258A1 (ja) * 2021-10-05 2023-04-13 ソニーグループ株式会社 画像処理システム、並びに、画像処理装置および方法
WO2023212171A1 (en) * 2022-04-27 2023-11-02 Avail Medsystems, Inc. Systems and methods for computer vision
WO2024008815A2 (en) * 2022-07-05 2024-01-11 Telefonaktiebolaget Lm Ericsson (Publ) Generating encoded video data and decoded video data
US11991425B2 (en) 2022-10-11 2024-05-21 International Business Machines Corporation Multimedia stream enhancement and tailored processing
US20240129562A1 (en) * 2022-10-14 2024-04-18 Rovi Guides, Inc. Systems personalized spatial video/light field content delivery

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001095513A1 (en) 2000-06-09 2001-12-13 Imove Inc. Streaming panoramic video
JP3971437B2 (ja) * 2002-09-30 2007-09-05 帝人株式会社 炭素繊維およびマットの製造のための方法
JP2005142654A (ja) 2003-11-04 2005-06-02 Matsushita Electric Ind Co Ltd 映像送信装置および映像受信装置
US7440626B2 (en) * 2004-12-02 2008-10-21 Mitsubishi Electric Research Laboratories, Inc. Image transcoding
US7894531B1 (en) 2005-02-15 2011-02-22 Grandeye Ltd. Method of compression for wide angle digital video
FR2884027B1 (fr) 2005-04-04 2007-06-01 Canon Kk Procede et dispositif de transmission et de reception de sequences d'images entre un serveur et un client
US8494052B2 (en) * 2006-04-07 2013-07-23 Microsoft Corporation Dynamic selection of motion estimation search ranges and extended motion vector ranges
EP3145200A1 (en) 2007-01-12 2017-03-22 ActiveVideo Networks, Inc. Mpeg objects and systems and methods for using mpeg objects
KR101350853B1 (ko) * 2007-06-29 2014-01-13 톰슨 라이센싱 이미지들에서 아티팩트들을 감소시키기 위한 장치 및 방법
WO2009003885A2 (en) 2007-06-29 2009-01-08 Thomson Licensing Video indexing method, and video indexing device
US20090300692A1 (en) 2008-06-02 2009-12-03 Mavlankar Aditya A Systems and methods for video streaming and display
CN101742324A (zh) * 2008-11-14 2010-06-16 北京中星微电子有限公司 视频编解码方法、视频编解码系统及编解码器
US20100232504A1 (en) 2009-03-13 2010-09-16 The State of Oregon acting by and through the State Board of Higher Education on behalf of the Supporting region-of-interest cropping through constrained compression
JP5443299B2 (ja) * 2010-08-26 2014-03-19 日本電信電話株式会社 情報送受信システム及び情報送受信方法
WO2012107570A1 (en) * 2011-02-12 2012-08-16 Unwired Planet, Inc. A method for optimizing a video stream
HUE042122T2 (hu) 2011-06-08 2019-06-28 Koninklijke Kpn Nv Szegmens tartalom lokalizálása és visszakeresése
KR101781717B1 (ko) 2011-06-08 2017-10-23 코닌클리즈케 케이피엔 엔.브이. 공간적으로-세그먼트된 콘텐츠 전달
WO2013021656A1 (ja) 2011-08-11 2013-02-14 パナソニック株式会社 再生装置、再生方法、集積回路、放送システム、及び放送方法
US9584819B2 (en) 2011-10-24 2017-02-28 Qualcomm Incorporated Grouping of tiles for video coding
US10349077B2 (en) 2011-11-21 2019-07-09 Canon Kabushiki Kaisha Image coding apparatus, image coding method, image decoding apparatus, image decoding method, and storage medium
US10257522B2 (en) 2012-06-25 2019-04-09 Sony Corporation Image decoding device, image decoding method, image encoding device, and image encoding method
US20140007912A1 (en) * 2012-07-06 2014-01-09 Erik Allen Waagmeester Self supporting tensile tent
CN102801997B (zh) * 2012-07-11 2014-06-11 天津大学 基于感兴趣深度的立体图像压缩方法
WO2014025319A1 (en) 2012-08-08 2014-02-13 National University Of Singapore System and method for enabling user control of live video stream(s)
GB2505912B (en) 2012-09-14 2015-10-07 Canon Kk Method and device for generating a description file, and corresponding streaming method
US9554133B2 (en) * 2012-09-18 2017-01-24 Vid Scale, Inc. Method and apparatus for region of interest video coding using tiles and tile groups
GB2513139A (en) 2013-04-16 2014-10-22 Canon Kk Method and corresponding device for streaming video data
KR101786276B1 (ko) 2012-10-12 2017-11-15 캐논 가부시끼가이샤 데이터를 스트리밍하기 위한 방법, 데이터를 제공하기 위한 방법, 데이터를 획득하기 위한 방법, 컴퓨터 판독 가능 저장 매체, 서버 장치, 및 클라이언트 장치
CN105144720B (zh) 2013-01-04 2018-12-28 Ge视频压缩有限责任公司 高效可伸缩编码概念
GB2509954B (en) 2013-01-18 2016-03-23 Canon Kk Method of displaying a region of interest in a video stream
KR101972284B1 (ko) 2013-04-08 2019-04-24 소니 주식회사 Shvc를 이용한 관심 영역 확장성
GB2513303B (en) * 2013-04-16 2017-06-07 Canon Kk Method and device for partitioning an image
JP5914422B2 (ja) * 2013-07-08 2016-05-11 京セラドキュメントソリューションズ株式会社 画像読取装置及び画像形成装置
CN105532013B (zh) 2013-07-12 2018-12-28 佳能株式会社 利用推送消息控制的自适应数据流传输方法
EP3013064B1 (en) 2013-07-19 2019-03-13 Sony Corporation Information processing device and method
GB2516825B (en) 2013-07-23 2015-11-25 Canon Kk Method, device, and computer program for encapsulating partitioned timed media data using a generic signaling for coding dependencies
US10721530B2 (en) 2013-07-29 2020-07-21 Koninklijke Kpn N.V. Providing tile video streams to a client
US20150095450A1 (en) * 2013-09-30 2015-04-02 Qualcomm Incorporated Utilizing multiple switchable adaptation sets for streaming media data
GB2519746B (en) 2013-10-22 2016-12-14 Canon Kk Method, device and computer program for encapsulating scalable partitioned timed media data
WO2015104451A1 (en) 2014-01-07 2015-07-16 Nokia Technologies Oy Method and apparatus for video coding and decoding
US20150264404A1 (en) 2014-03-17 2015-09-17 Nokia Technologies Oy Method and apparatus for video coding and decoding
GB2558086B (en) 2014-03-25 2019-02-20 Canon Kk Methods, devices, and computer programs for improving streaming of partitioned timed media data
WO2015197818A1 (en) 2014-06-27 2015-12-30 Koninklijke Kpn N.V. Hevc-tiled video streaming
WO2015197815A1 (en) 2014-06-27 2015-12-30 Koninklijke Kpn N.V. Determining a region of interest on the basis of a hevc-tiled video stream
WO2017029402A1 (en) 2015-08-20 2017-02-23 Koninklijke Kpn N.V. Forming a tiled video on the basis of media streams
EP3338454A1 (en) 2015-08-20 2018-06-27 Koninklijke KPN N.V. Forming one or more tile streams on the basis of one or more video streams
WO2017060423A1 (en) 2015-10-08 2017-04-13 Koninklijke Kpn N.V. Enhancing a region of interest in video frames of a video stream

Also Published As

Publication number Publication date
KR20170018352A (ko) 2017-02-17
EP3162074A1 (en) 2017-05-03
JP2017527160A (ja) 2017-09-14
CN106664443A (zh) 2017-05-10
KR101953679B1 (ko) 2019-03-04
US20170118540A1 (en) 2017-04-27
US10397666B2 (en) 2019-08-27
CN106664443B (zh) 2020-03-24
WO2015197815A1 (en) 2015-12-30

Similar Documents

Publication Publication Date Title
JP6440747B2 (ja) Hevcでタイル化されたビデオ・ストリームに基づく関心領域の決定
EP3162075B1 (en) Hevc-tiled video streaming
CN106233745B (zh) 向客户端提供瓦片视频流
EP3459247B1 (en) Most-interested region in an image
KR102282759B1 (ko) 제어된 관찰 포인트 및 배향 선택 시청각 콘텐츠에 대한 방법 및 장치
US10565463B2 (en) Advanced signaling of a most-interested region in an image
US10862943B2 (en) Methods, devices, and computer programs for improving streaming of partitioned timed media data
JP2019521584A (ja) Httpを介した動的適応型ストリーミングにおけるバーチャルリアリティビデオのシグナリング
WO2019107175A1 (ja) 送信装置、送信方法、受信装置および受信方法
CN111557096A (zh) 发送装置、发送方法、接收装置和接收方法
EP3777219B1 (en) Method and apparatus for signaling and storage of multiple viewpoints for omnidirectional audiovisual content

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20170911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180202

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180418

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181010

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181022

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181120

R150 Certificate of patent or registration of utility model

Ref document number: 6440747

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250