JP6556126B2 - ファイルの生成方法、ファイルの生成装置、及び、プログラム。 - Google Patents

ファイルの生成方法、ファイルの生成装置、及び、プログラム。 Download PDF

Info

Publication number
JP6556126B2
JP6556126B2 JP2016523257A JP2016523257A JP6556126B2 JP 6556126 B2 JP6556126 B2 JP 6556126B2 JP 2016523257 A JP2016523257 A JP 2016523257A JP 2016523257 A JP2016523257 A JP 2016523257A JP 6556126 B2 JP6556126 B2 JP 6556126B2
Authority
JP
Japan
Prior art keywords
track
tile
generating
file
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016523257A
Other languages
English (en)
Other versions
JP2016540410A (ja
JP2016540410A5 (ja
Inventor
ドゥヌアル フランク
ドゥヌアル フランク
マゼ フレデリック
マゼ フレデリック
ルフェーブル ジャン
ルフェーブル ジャン
コンコラト シリル
コンコラト シリル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2016540410A publication Critical patent/JP2016540410A/ja
Publication of JP2016540410A5 publication Critical patent/JP2016540410A5/ja
Application granted granted Critical
Publication of JP6556126B2 publication Critical patent/JP6556126B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234345Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440227Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440245Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4728End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • Library & Information Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、一般的には、特に圧縮ビデオストリームにおける、対象とするユーザ選択領域のHTTP(ハイパーテキスト転送プロトコル)ストリーミングに関してストリーム配信を改善するための、たとえば、MPEG標準化機構によって定義されているようなベースメディアファイルフォーマットによるタイムドメディアデータのカプセル化の分野に関する。より詳細には、本発明は、データ、特に1つ以上のタイルの効率的なストリーミングを可能にする空間タイルのような分割データを含むスケーラブルなエレメンタリストリームをカプセル化するための方法、デバイス、およびコンピュータプログラムに関する。
ビデオコード化は、一連のビデオ画像を、ビデオ画像を送信または記憶することができるようにコンパクトなデジタル化ビットストリームに変換する方法である。符号化デバイスが使用されてビデオ画像がコード化され、関連する復号デバイスが、表示および閲覧のためにビットストリームを再構築するために利用可能である。一般的な目的は、元のビデオ情報よりもサイズが小さくなるように、ビットストリームを形成することである。これによって、ビットストリームコードを送信または記憶するために必要とされる、伝送ネットワークまたは記憶デバイスの容量が低減される利点がある。送信されるために、ビデオビットストリームは、ヘッダおよびチェックビットを一般的には追加する送信プロトコルに従ってカプセル化される。
最近、動画専門家集団(MPEG)は、HTTP(ハイパーテキスト転送プロトコル)を介した既存のソリューションを統合し、それらの後継となるための新たな標準を発行した。「HTTPを介した動的適応型ストリーミング(DASH)」と呼ばれるこの新たな基準は、インテリジェンス(すなわち、ストリーミングするためのメディアデータの選択、ならびに、ユーザ選択、ネットワーク状態、およびクライアント機能に対するビットストリームの動的適合)がもっぱらクライアント選択およびデバイスに依拠する、標準的なウェブサーバに基づくHTTPを介したメディアストリーミングモデルをサポートするように意図されている
このモデルにおいて、メディア表現は、データセグメント、および、表現されるべきタイムドメディアデータの編成を表す「メディア表現記述(メディアプレゼンテーションディスクリプション)」と呼ばれるマニフェストにおいて編成される。特に、マニフェストは、データセグメントをダウンロードするためのユーザに対する資源識別子を含み、有効なメディア表現を得るためにそれらのデータセグメントを組み合わせるためのコンテキストを提供する。資源識別子は一般的には、バイト範囲と組み合わされる可能性があるHTTP−URL(統一資源位置指定子)である。マニフェストに基づいて、クライアントデバイスは、任意の時点において、その要求、その能力(たとえば、サポートされるコーデック、表示サイズ、フレームレート、品質レベルなど)に従って、ネットワーク状態(たとえば、利用可能な帯域幅)に応じて、いずれのメディアセグメントがメディアデータサーバからダウンロードされるべきであるかを決定する。
加えて、ビデオ解像度は、標準精細度(SD)から高精細度(HD)、および超高精細度(たとえば、4K2Kまたは8K4K、すなわち、4,096×2,400ピクセルまたは7,680×4,320ピクセルの画像を含むビデオ)へと向かって絶えず増大している。しかしながら、特にビデオが超高精細度であるとき、すべての受信およびビデオ復号デバイスが、フル解像度におけるビデオにアクセスするための資源(たとえば、ネットワークアクセス帯域幅またはCPU(中央処理装置))を有しているわけではなく、すべてのユーザがそのようなビデオにアクセスする必要があるわけではない。そのようなコンテキストにおいて、いくつかの関心領域(ROI)にアクセスする、すなわち、ビデオシーケンス全体のうちのいくつかの空間下位区分のみにアクセスする能力を提供することが特に有利である。
ビデオに属するフレームの空間下位区分にアクセスするための既知のメカニズムは、ビデオの各フレームを、一般的にはタイルと称される、独立して復号可能な空間領域の配列として編成することに存する。SVC(スケーラブルビデオコード化)またはHEVC(高効率ビデオコード化)のようないくつかのビデオフォーマットが、タイル定義に対するサポートを提供する。ユーザ定義のROIは、1つまたはいくつかの連続したタイルをカバーし得る。
したがって、HTTPに従って、ユーザ選択のROIをストリーミングするためには、1つ以上のタイルへの空間アクセスを可能にし、アクセスされるタイルの組み合わせを可能にするように、符号化済みビデオビットストリームのタイムドメディアデータのカプセル化を可能にすることが重要である。
符号化済みビデオビットストリームは一般的には完全なフレームに対応する連続した時間サンプルのセットとして構成され、時間サンプルは、復号順序に応じて編成されることを想起されたい。そのような符号化済みビデオビットストリームをカプセル化および記述するためのファイルフォーマットが使用される。
例示を目的として、国際標準化機構ベースメディアファイルフォーマット(ISO BMFF)は、ネットワークまたは別のビットストリーム配信メカニズムを介してローカル記憶または送信のいずれかのために符号化済みタイムドメディアデータビットストリームを記述する既知の柔軟で拡張可能なフォーマットである。このファイルフォーマットはオブジェクト指向型である。これは、連続的にまたは階層的に編成され、タイミングおよび構造パラメータのような符号化済みタイムドメディアデータビットストリームのパラメータを定義する、ボックスと呼ばれる構成ブロックから構成される。このファイルフォーマットによれば、タイムドメディアデータビットストリームは、トラックボックスと称される別のデータ構造において定義されるmdatボックスと称されるデータ構造内に含まれる。トラックは、サンプルが、単一のタイムスタンプと関連付けられるすべてのデータ、すなわち、単一のフレームと関連付けられるすべてのデータ、または、同じタイムスタンプを共有するいくつかのフレームと関連付けられるすべてのデータに対応するタイムドサンプルシーケンスを表す。
SVCフォーマットのビデオのようなスケーラブルビデオについて、各トラックが特定のスケーラビリティレベルにおいてビデオを表現する、複数の従属トラックを使用することによって層状メディアデータ編成が効率的に表現され得る。トラック間のデータ重複を回避するために、抽出器が使用され得る。標準的なファイルフォーマットによれば、抽出器は、他のビットストリームからのネットワーク抽象化層(NAL)単位の効率的な抽出を可能にする、ビットストリーム内に直に含まれるデータ構造である。それゆえ、別のビットストリーム内にすでに含まれているデータを含むビットストリームは、それらを他のビットストリームから復元することを可能にする抽出器によってこれらのデータを置き換えるように処理される。たとえば、強化層トラック(エンハンスメントレイヤトラック)のビットストリームは、基本層トラック(ベースレイヤトラック)からのNAL単位を参照する抽出器を含み得る。その後、そのような強化層トラックがそのファイルフォーマットから抽出されると、抽出器は、それらが参照しているデータに置き換えられなければならない。
特にHEVCコード化フォーマットおよびそのスケーラブルな拡張のために、副情報を記述し、この部分情報へのアクセスを容易にするか、または、ビットストリームを複数のセグメントに効率的に編成するために、これらのメカニズムを組み込んでいるISO BMFFを使用するときにいくつかの戦略を採用することができる。
たとえば、「Implications of the ISO Base Media File Format on Adaptive HTTP Streaming of H.264/SVC」と題する論文において、著者Kofler他は、ISO BMFFの可能性および制限を考慮してHTTPのためのスケーラブルビデオビットストリーム(H264/SVC)を編成するための3つの異なる戦略を提示している。
a)すべてのISO BMFFメタデータ(トラック定義を含む)を含むファイルタイプボックス「ftyp」および動画ボックス「moov」を含む特定のファイルヘッダを含む単一のファイル、この単一のファイルは、符号化済みビデオビットストリーム全体を含む単一のmdatボックスをも含む。この編成は、ローカル記憶には適しているが、クライアントがビデオビットストリーム全体のうちの一部分を必要とするであろう場合があるHTTPストリーミングには適合していない。
b)フラグメンテーションに適した複数のmoof/mdatボックスを含む単一のファイル。このフォーマットはプログレッシブダウンロードを可能にする。moofボックスは、フラグメントレベルにおいてはmoovボックスと等価である。この方式によれば、フラグメント化されたメディアファイルを使用して、スケーラブルビデオビットストリームが、異なるスケーラビリティレベルにおいてビデオを表現する複数の従属トラックに分割される。他のトラックからのNAL単位を参照するために抽出器が使用される。タイルごとのトラックが使用される場合、すべてのアドレス指定可能なトラックが前もって準備される必要があり、トラックを独立して選択することはできない。いくつかのタイルが表示されるべきである場合、いくつかのビットストリームが復号されなければならず、基本層が数回復号される。
c)複数のセグメントファイル、各ファイルはそれ自体のURLによってアクセス可能であり、独立してダウンロード可能である。各セグメントは一般的には、一種のファイルヘッダとして作用するセグメントタイプボックス(styp)、任意選択のセグメントインデックスボックス(sidx)および1つ以上のフラグメントから構成される。ここでも、各フラグメントはmoofおよびmdatボックスから構成される。この方式によれば、フラグメント化メディアファイルを使用して、各トラックがそれ自体のセグメント内に記憶され、関連するビットストリームが1つのスケーラビリティレベルに関連している。必要である場合、従属トラックから必要とされるビットストリームを参照するために抽出器が使用される。そのようなコード化方式は、トラックを独立してストリーミングするのに特に適している。それはDASH規格によく適合しているが、いくつかのビットストリームが復号されるべきであり、したがって、トラックあたり1つの復号器が必要とされるため、タイルストリーミングには適合していない。その上、2つ以上のタイルを選択するとき、基本層のビットストリームが重複する可能性がある。
空間タイルに適用されるとき、これらの戦略はいずれも、HTTPストリーミングの文脈において特定のファイルに対する効率的なアクセスを可能にしない。実際、既存のファイルフォーマットの定義によれば、所与の時間間隔に対応するいくつかのフレームの空間タイルを表示するためには、依然として符号化済みビデオビットストリームにおける複数の非連続的なバイト範囲にアクセスする必要があるか、または、結果としてビットストリームが重複することになる。
米国特許第8,442,109号明細書は、ファイルフォーマット、特にSVCタイプのビデオ圧縮フォーマットにおいてROIスケーラビリティ情報を伝えるための方法を開示している。この文献において開示されているシステムの目的は、メディアファイルからROIデータを抽出する能力を提供するための、関心領域およびスケーラビリティ層におけるNAL単位のマッピングに関するものである。この文献は、関心領域の幾何形状を伝えるために、参照される新規のボックスIroiInfoBoxを使用することを開示している。関心領域においてNAL単位をマッピングするための(すなわち、NAL単位をROI識別子に関連付けるための)3つの異なる解決策、すなわち、タイル化メタデータを使用すること、トラックのサンプル上の入れ子ループを含む専用ボックスを使用すること、および、NAL単位、または、割り当てられたROI識別子を有するすべてのNAL単位を網羅的にリストしている特定のVisualSampleGroupEntry記述子を使用することが開示されている。
スケーラビリティ層におけるNAL単位のマッピングに関連して、「tier」ボックスが使用される(単語「tier(層)」は、ドラフトSVCファイルフォーマットにおける層を記述するために使用されている)。そうすることによって、ROIの幾何形状情報が、識別情報から分離される。
しかしながら、ROIの幾何形状情報および識別情報を同じ構造内で処理するとともに、(NAL単位をインデックス付けする代わりに)タイルおよびROIをインデックス付けすることが、構文解析効率の観点から、ならびに、関心領域およびタイルの抽出の観点から好ましい。
これらの問題を解決するために、いずれのトラック組み合わせがクライアントアプリケーションによって選択されようとも、ISO BMFF構文解析の結果が常にビデオ復号器にとって有効なビデオエレメンタリストリームをもたらすことを保証する、スケーラブルビデオビットストリーム内の空間タイルに適切な、効率的なデータ編成およびトラック記述方式が提供される。
これらの制約に直面し、本発明者らは、サーバにおいてタイル化タイムドメディアデータをカプセル化し、複数のメディアセグメントファイル内にカプセル化されているタイル化タイムドメディアデータからタイムドメディアデータビットストリームを提供するための方法およびデバイスを提供する。
本発明の概略の目的は、上述したような従来技術の欠点を改善することである。
本発明の生成方法は、例えば、以下の構成を有する。すなわち、それぞれが複数のタイル領域を有する1以上のサンプルを含むメディアデータに基づいてメディアファイルを生成する生成方法であって、1つのサンプルに対応する複数のタイル領域のうちの1以上のタイル領域に対応するメディアデータを有するトラックを生成するトラック生成工程と、前記トラック生成工程により生成されるトラックを含むメディアファイルを生成するファイル生成工程であって、前記トラック生成工程により生成されるトラックが有するメディアデータのメタデータを記述するためのサンプル記述ボックスには、前記トラックがタイルトラックであることを示す情報が記述され、且つ、前記サンプル記述ボックスには、前記トラックが有するメディアデータのデコードのためにデコーダにより参照されるべきSPS(シーケンスパラメータセット)が記述されず、且つ、前記SPSが、複数のタイルトラックに関するパラメータを少なくとも記述する共通トラックのトラックボックスに記述されたメディアファイルを生成するファイル生成工程とを有する。
本発明の第1の態様によれば、サーバにおいて分割同期型メディアデータをカプセル化するための方法が提供され、前記分割同期型メディアデータは同期型サンプルを含み、各同期型サンプルは、第1の層と、少なくとも1つの第2の層とを含み、前記層のうちの少なくとも1つは、1つ以上のコード化単位によって表現される複数のサブサンプルを含み、前記方法は、
1つの前記同期型サンプルの前記複数のサブサンプルの中から少なくとも1つのサブサンプルを得るステップであって、前記得られるサブサンプルが、前記1つの同期型サンプルの前記サブサンプルのセットのサブセットを形成する、サブサンプルを得るステップと、
前記少なくとも1つの得られるサブサンプルを含む1つのトラックを作成するステップと、
少なくとも1つのメディアセグメントファイルにおいて前記作成されたトラックを独立してカプセル化するステップであって、前記メディアセグメントファイルは、前記同期型サンプルの1つおよびそれが属する前記層に関する、前記少なくとも1つの得られるサブサンプルについての情報を提供するためのマッピングメタデータを含む、カプセル化するステップと
を含む。
したがって、本発明は、種々のスケーラブル部分、特に、種々のスケーラブルタイルの組み合わせ、および、クライアントデバイスによってダウンロードされるスケーラブル部分またはタイルの選択されるセットが何であれ、有効なファイルフォーマットを作成することを可能にする。
それゆえ、本発明の方法は、独立したスケーラブル部分またはタイルの効率的なストリーミングに適しており、有用なデータのみがクライアントデバイスに対して送信されることが必要であり、2つ以上の部分または選択タイル(すなわち、任意のROI)に適しており、インデックス付けオーバヘッドを低減し、MPEG規格に統合することができる。
その上、ROIの幾何形状情報および識別情報を同じ構造内で処理するとともに、タイルおよびROIをインデックス付けすることによって、構文解析効率ならびに関心領域およびタイルの抽出が改善される。
ある実施形態において、前記マッピングメタデータは同じ構造内に記憶される。
ある実施形態において、前記分割タイムドメディアデータはタイル化タイムドメディアデータであり、前記サブサンプルは空間サブサンプルである。
ある実施形態において、前記方法は、第1のグループがサブサンプルのコード化単位を特性化する第1のタイプの情報と関連付けられ、第2のグループがサブサンプルのコード化単位を特性化する第2のタイプの情報と関連付けられる、種々のサブサンプルグループの定義を含むマッピングメタデータを記憶するためのデータ記述子を構成するステップをさらに含む。
ある実施形態において、前記第1のタイプの情報は、サブサンプルのコード化単位と、対応する前記タイムドサンプルとの間の関係を特性化する情報に関し、前記第2のタイプの情報は、サブサンプルのコード化単位と前記分割タイムドメディアデータの層編成との間の関係を特性化する情報に関する。
ある実施形態において、グループタイプは、サブサンプルの各コード化単位と関連付けられ、各コード化単位が、前記第1のグループと関連付けられる情報に応じて、または、前記第2のグループと関連付けられる情報に応じて処理されることが可能である。
ある実施形態において、前記方法は、サブサンプルグループの定義を含むマッピングメタデータを記憶するためのデータ記述子を構成するステップをさらに含み、前記マッピングメタデータは、サブサンプルのコード化単位と、対応する前記タイムドサンプルとの間の関係を特性化する情報を含む。
ある実施形態において、前記定義は、サブサンプルの少なくとも1つのコード化単位と、前記分割タイムドメディアデータの前記層編成との間の関係を特性化する情報をさらに含む。
ある実施形態において、サブサンプルの少なくとも1つのコード化単位と前記分割タイムドメディアデータの前記層編成との間の関係を特性化する前記情報は、サブサンプルの層従属関係情報を含む。
ある実施形態において、サブサンプルの前記層従属関係情報は、サブサンプル定義へのリンクを含む。
ある実施形態において、前記サブサンプルの少なくとも1つのコード化単位と前記分割タイムドメディアデータの前記層編成との間の関係を特性化する前記情報は、前記分割タイムドメディアデータの前記層編成の層記述へのリンクを含む。
ある実施形態において、前記データ記述子は、デフォルトで、サブサンプルのコード化単位を特性化するために使用され、前記方法は、サブサンプル識別子、ならびに、前記識別されるサブサンプルのコード化単位と前記対応するタイムドサンプルとの間の関係を特性化する対応する情報を含むマッピングメタデータを記憶するための少なくとも1つのさらなるデータ記述子を構成するステップをさらに含む。
ある実施形態において、前記マッピングメタデータを記憶するための前記少なくとも1つのさらなるデータ記述子のマッピングメタデータは、前記識別されるサブサンプルの少なくとも1つのコード化単位と前記分割タイムドメディアデータの前記層編成との間の関係を特性化する情報をさらに含む。
ある実施形態において、前記サーバは、ハイパーテキスト転送プロトコル(HTTP)に適合する。
ある実施形態において、前記作成されるトラックをカプセル化する結果としてもたらされる前記メディアセグメントファイルは、国際標準化機構によって定義されているものとしてのHTTPフォーマットを介した動的適応型ストリーミングおよびベースメディアファイルフォーマットに適合する。
本発明の第2の態様によれば、クライアントデバイスにおいて、メディアセグメントファイル内にカプセル化されている分割タイムドメディアデータからタイムドメディアデータビットストリームを提供するための方法が提供され、前記分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、第1の層と少なくとも1つの第2の層とを含み、前記層のうちの少なくとも1つは、1つ以上のコード化単位によって表現される複数のサブサンプルを含み、前記メディアセグメントファイルは、1つの前記タイムドサンプルの前記複数のサブサンプルの中から選択される少なくとも1つのサブサンプルを含むトラックを含み、前記少なくとも1つのサブサンプルは、前記1つのタイムドサンプルの前記サブサンプルのセットのサブセットを形成し、前記方法は、
少なくとも1つのサブサンプルを表す情報の項目を選択するステップと、
前記選択された情報の項目によって表現される前記少なくとも1つのサブサンプルを含む前記トラックを要求するステップと、
前記メディアセグメントファイルを受信するステップであって、前記受信されるメディアセグメントファイルは、対応する前記サンプルおよびそれが属する前記層に対する、前記選択された情報の項目によって表現される前記少なくとも1つのサブサンプルについての情報を提供するためのマッピングメタデータを含む、メディアセグメントファイルを受信するステップと、
前記マッピングメタデータに応じて、前記受信されたメディアセグメントファイルから、前記選択された情報の項目によって表現される前記少なくとも1つのサブサンプルを復元するステップと
を含む。
したがって、本発明は、種々のスケーラブル部分、特に、種々のスケーラブルタイルの組み合わせること、および、クライアントデバイスによってダウンロードされるスケーラブル部分またはタイルの選択されるセットが何であれ有効なファイルフォーマットを作成することを可能にする。
それゆえ、本発明の方法は、独立したスケーラブル部分またはタイルの効率的なストリーミングに適しており、有用なデータのみがクライアントデバイスに対して送信されることが必要であり、2つ以上の部分または選択タイル(すなわち、任意のROI)に適しており、インデックス付けオーバヘッドを低減し、MPEG規格に統合することができる。
その上、ROIの幾何形状情報および識別情報を同じ構造内で処理するとともに、タイルおよびROIをインデックス付けすることによって、構文解析効率ならびに関心領域およびタイルの抽出が改善される。
ある実施形態において、前記マッピングメタデータは同じ構造内に記憶される。
ある実施形態において、前記分割タイムドメディアデータはタイル化タイムドメディアデータであり、前記サブサンプルは空間サブサンプルである。
ある実施形態において、前記方法は、第1のグループがサブサンプルのコード化単位を特性化する第1のタイプの情報と関連付けられ、第2のグループがサブサンプルのコード化単位を特性化する第2のタイプの情報と関連付けられる、種々のサブサンプルグループの定義を含むマッピングメタデータを記憶するデータ記述子を、前記受信されたメディアセグメントファイルから得るステップをさらに含む。
ある実施形態において、前記第1のタイプの情報は、サブサンプルのコード化単位と,対応する前記タイムドサンプルとの間の関係を特性化する情報に関し、前記第2のタイプの情報は、サブサンプルのコード化単位と前記分割タイムドメディアデータの層編成との間の関係を特性化する情報に関する。
ある実施形態において、前記方法は、前記受信されたサブサンプルの各コード化単位のグループタイプを判定するステップと、前記第1のグループと関連付けられる前記情報に応じて、または、前記第2のグループと関連付けられる前記情報に応じて、前記コード化単位の各々を処理するステップとをさらに含む。
ある実施形態において、前記方法は、サブサンプルグループの定義を含むマッピングメタデータを記憶するデータ記述子を、前記受信されたメディアセグメントファイルから得るステップをさらに含み、前記マッピングメタデータは、前記受信されたサブサンプルのコード化単位と、対応するタイムドサンプルとの間の関係を特性化する情報を含む。
ある実施形態において、前記定義は、受信されたサブサンプルの少なくとも1つのコード化単位と、前記分割タイムドメディアデータの前記層編成との間の関係を特性化する情報をさらに含み、前記方法は、前記コード化単位と前記分割タイムドメディアデータの前記層編成との間の前記関係を特性化する前記情報に応じて受信されたサブサンプルのコード化単位を処理するステップをさらに含む。
ある実施形態において、前記方法は、サブサンプルの層従属関係情報に応じて、前記受信されたサブサンプルの前記コード化単位を処理するステップをさらに含む。
ある実施形態において、前記方法は、前記処理されるコード化単位の従属先であるサブサンプルのサブサンプル定義を得るステップをさらに含む。
ある実施形態において、受信されたサブサンプルの少なくとも1つのコード化単位と、前記分割タイムドメディアデータの前記層編成との間の関係を特性化する前記情報は、前記分割タイムドメディアデータの前記層編成の層記述へのリンクを含み、前記方法は、前記分割タイムドメディアデータの前記層編成の前記層記述への前記リンクに応じて受信されたサブサンプルのコード化単位を処理するステップをさらに含む。
ある実施形態において、前記データ記述子は、デフォルトで、受信されたサブサンプルのコード化単位を特性化するために使用され、前記方法は、サブサンプル識別子、ならびに、前記識別されるサブサンプルのコード化単位と,対応する前記タイムドサンプルとの間の関係を特性化する対応する情報を含むマッピングメタデータを記憶する少なくとも1つのさらなるデータ記述子を得るステップをさらに含み、前記方法は、処理されるべきサブサンプルが前記さらなるデータ記述子内で識別されるか否かを判定するステップをさらに含む。
ある実施形態において、マッピングメタデータを記憶している前記少なくとも1つのさらなるデータ記述子の前記マッピングメタデータは、前記識別されたサブサンプルの少なくとも1つのコード化単位と、前記分割タイムドメディアデータの前記層編成との間の関係を特性化する情報をさらに含み、前記方法は、前記識別されたサブサンプルの少なくとも1つのコード化単位と、前記分割タイムドメディアデータの前記層編成との間の関係を特性化する前記情報に応じて受信されたサブサンプルを処理するステップをさらに含む。
ある実施形態において、前記クライアントデバイスは、ハイパーテキスト転送プロトコル(HTTP)に適合する。
ある実施形態において、前記受信されるメディアセグメントファイルは、国際標準化機構によって定義されているものとしてのHTTPフォーマットを介した動的適応型ストリーミング及びベースメディアファイルフォーマットに適合する。
本発明の第3の態様によれば、サーバにおいて分割タイムドメディアデータをカプセル化するための方法が提供され、前記分割タイムドメディアデータは、1つ以上のコード化単位によって表現される複数のサブサンプルを含むタイムドサンプルを含み、前記方法は、
1つの前記タイムドサンプルの前記複数のサブサンプルの中から少なくとも1つのサブサンプルを得るステップであって、前記得られるサブサンプルが、前記1つのタイムドサンプルの前記サブサンプルのセットのうちのサブセットを形成する、サブサンプルを得るステップと、
前記得られたサブサンプルごとに1つのトラックを作成するステップと、
少なくとも1つのメディアセグメントファイルにおいて前記作成されたトラックをカプセル化するステップであって、前記メディアセグメントファイルは、
前記作成されたトラックが同じタイムドサンプルの一部であるサブサンプルを含むことを伝えるためのメタデータと、
チャンクに編成されているメディアデータであって、各チャンクは考慮されている前記タイムドサンプルの同じサブサンプルの前記コード化単位を含む、メディアデータと
を含む、カプセル化するステップと
を含む。
したがって、本発明は、種々のスケーラブル部分、特に、種々のスケーラブルタイルの組み合わせること、および、クライアントデバイスによってダウンロードされるスケーラブル部分またはタイルの選択されるセットが何であれ有効なファイルフォーマットを作成することを可能にする。
それゆえ、本発明の方法は、独立したスケーラブル部分またはタイルの効率的なストリーミングに適しており、有用なデータのみがクライアントデバイスに対して送信されることが必要であり、2つ以上の部分または選択タイル(すなわち、任意のROI)に適しており、インデックス付けオーバヘッドを低減し、MPEG規格に統合することができる。
その上、ROIの幾何形状情報および識別情報を同じ構造内で処理するとともに、タイルおよびROIをインデックス付けすることによって、構文解析効率ならびに関心領域およびタイルの抽出が改善される。
本発明の第4の態様によれば、クライアントデバイスにおいて、メディアセグメントファイル内にカプセル化されている分割タイムドメディアデータからタイムドメディアデータビットストリームを提供するための方法が提供され、前記分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、第1の層と少なくとも1つの第2の層とを含み、前記層のうちの少なくとも1つは、1つ以上のコード化単位によって表現される複数のサブサンプルを含み、前記メディアセグメントファイルは複数のトラックを含み、各トラックは、1つの前記タイムドサンプルの前記複数のサブサンプルの中から選択される1つのサブサンプルを含み、前記トラックの前記サブサンプルは、前記1つのタイムドサンプルの前記サブサンプルのセットのサブセットを形成し、前記方法は、
少なくとも1つのサブサンプルを表す情報の項目を選択するステップと、
前記選択された情報の項目によって表現される前記サブサンプルを含む前記トラックを要求するステップと、
前記メディアセグメントファイルを受信するステップであって、前記受信されるメディアセグメントファイルは、
前記受信されるトラックが、同じタイムドサンプルの一部であるサブサンプルを含むことを伝えるためのメタデータと、
チャンクに編成されているメディアデータであって、各チャンクは考慮されている前記タイムドサンプルの同じサブサンプルの前記コード化単位を含む、メディアデータと
を含む、メディアセグメントファイルを受信するステップと、
前記マッピングメタデータに応じて、前記受信されたメディアセグメントファイルから、前記選択された情報の項目によって表現される前記サブサンプルを復元するステップと
を含む。
したがって、本発明は、種々のスケーラブル部分、特に、種々のスケーラブルタイルの組み合わせること、および、クライアントデバイスによってダウンロードされるスケーラブル部分またはタイルの選択されるセットが何であれ有効なファイルフォーマットを作成することを可能にする。
それゆえ、本発明の方法は、独立したスケーラブル部分またはタイルの効率的なストリーミングに適しており、有用なデータのみがクライアントデバイスに対して送信されることが必要であり、2つ以上の部分または選択タイル(すなわち、任意のROI)に適しており、インデックス付けオーバヘッドを低減し、MPEG規格に統合することができる。
その上、ROIの幾何形状情報および識別情報を同じ構造内で処理するとともに、タイルおよびROIをインデックス付けすることによって、構文解析効率ならびに関心領域およびタイルの抽出が改善される。
本発明の第5の態様によれば、サーバにおいて分割タイムドメディアデータをカプセル化するためのデバイスが提供され、前記分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、第1の層と、少なくとも1つの第2の層とを含み、前記層のうちの少なくとも1つは、1つ以上のコード化単位によって表現される複数のサブサンプルを含み、前記デバイスは、前記1つのタイムドサンプルの前記複数のサブサンプルの中から少なくとも1つのサブサンプルを得るステップであって、前記得られるサブサンプルが、前記1つのタイムドサンプルの前記サブサンプルのセットのうちのサブセットを形成する、サブサンプルを得るステップと、
前記少なくとも1つの得られるサブサンプルを含む1つのトラックを作成するステップと、
少なくとも1つのメディアセグメントファイルにおいて前記作成されたトラックを独立してカプセル化するステップであって、前記メディアセグメントファイルは、前記1つのタイムドサンプルおよびそれが属する前記層に対する、前記少なくとも1つの得られるサブサンプルについての情報を提供するためのマッピングメタデータを含む、トラックをカプセル化するステップと
を実行するように構成されている少なくとも1つのマイクロプロセッサを備える。
したがって、本発明は、種々のスケーラブル部分、特に、種々のスケーラブルタイルの組み合わせること、および、クライアントデバイスによってダウンロードされるスケーラブル部分またはタイルの選択されるセットが何であれ有効なファイルフォーマットを作成することを可能にする。
それゆえ、本発明のデバイスは、独立したスケーラブル部分またはタイルの効率的なストリーミングに適しており、有用なデータのみがクライアントデバイスに対して送信されることが必要であり、2つ以上の部分または選択タイル(すなわち、任意のROI)に適しており、インデックス付けオーバヘッドを低減し、MPEG規格に統合することができる。
その上、ROIの幾何形状情報および識別情報を同じ構造内で処理するとともに、タイルおよびROIをインデックス付けすることによって、構文解析効率ならびに関心領域およびタイルの抽出が改善される。
ある実施形態において、前記マッピングメタデータは同じ構造内に記憶される。
ある実施形態において、前記分割タイムドメディアデータはタイル化タイムドメディアデータであり、前記サブサンプルは空間サブサンプルである。
ある実施形態において、前記マイクロプロセッサは、第1のグループがサブサンプルのコード化単位を特性化する第1のタイプの情報と関連付けられ、第2のグループがサブサンプルのコード化単位を特性化する第2のタイプの情報と関連付けられる、種々のサブサンプルグループの定義を含むマッピングメタデータを記憶するためのデータ記述子を構成するステップを実行するようにさらに構成されている。
ある実施形態において、前記第1のタイプの情報は、サブサンプルのコード化単位と、対応する前記タイムドサンプルとの間の関係を特性化する情報に関し、前記第2のタイプの情報は、サブサンプルのコード化単位と前記分割タイムドメディアデータの層編成との間の関係を特性化する情報に関する。
ある実施形態において、グループタイプは、サブサンプルの各コード化単位と関連付けられ、各コード化単位が、前記第1のグループと関連付けられる情報に応じて、または、前記第2のグループと関連付けられる情報に応じて処理されることが可能である。
ある実施形態において、前記マイクロプロセッサは、サブサンプルグループの定義を含むマッピングメタデータを記憶するためのデータ記述子を構成する前記ステップを実行するようにさらに構成されており、前記マッピングメタデータは、サブサンプルのコード化単位と、対応する前記タイムドサンプルとの間の関係を特性化する情報を含む。
ある実施形態において、前記定義は、サブサンプルの少なくとも1つのコード化単位と、前記分割タイムドメディアデータの前記層編成との間の関係を特性化する情報をさらに含む。
ある実施形態において、サブサンプルの少なくとも1つのコード化単位と前記分割タイムドメディアデータの前記層編成との間の関係を特性化する前記情報は、サブサンプルの層従属関係情報を含む。
ある実施形態において、サブサンプルの前記層従属関係情報は、サブサンプル定義へのリンクを含む。
ある実施形態において、前記サブサンプルの少なくとも1つのコード化単位と前記分割タイムドメディアデータの前記層編成との間の関係を特性化する前記情報は、前記分割タイムドメディアデータの前記層編成の層記述へのリンクを含む。
ある実施形態において、前記データ記述子は、デフォルトで、サブサンプルのコード化単位を特性化するために使用され、前記マイクロプロセッサは、サブサンプル識別子、ならびに、前記識別されるサブサンプルのコード化単位と前記対応するタイムドサンプルとの間の関係を特性化する対応する情報を含むマッピングメタデータを記憶するための少なくとも1つのさらなるデータ記述子を構成する前記ステップを実行するようにさらに構成されている。
ある実施形態において、前記マッピングメタデータを記憶するための前記少なくとも1つのさらなるデータ記述子のマッピングメタデータは、前記識別されるサブサンプルの少なくとも1つのコード化単位と前記分割タイムドメディアデータの前記層編成との間の関係を特性化する情報をさらに含む。
本発明の第6の態様によれば、クライアントデバイスにおいて、メディアセグメントファイル内にカプセル化されている分割タイムドメディアデータからタイムドメディアデータビットストリームを提供するためのデバイスが提供され、前記分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、第1の層と少なくとも1つの第2の層とを含み、前記層のうちの少なくとも1つは、1つ以上のコード化単位によって表現される複数のサブサンプルを含み、前記メディアセグメントファイルは、1つの前記タイムドサンプルの前記複数のサブサンプルの中から選択される少なくとも1つのサブサンプルを含むトラックを含み、前記少なくとも1つのサブサンプルは、前記1つのタイムドサンプルの前記サブサンプルのセットのサブセットを形成し、前記デバイスは、
少なくとも1つのサブサンプルを表す情報の項目を選択するステップと、
前記選択された情報の項目によって表現される前記少なくとも1つのサブサンプルを含む前記トラックを要求するステップと、
前記メディアセグメントファイルを受信するステップであって、前記受信されるメディアセグメントファイルは、対応する前記サンプルおよびそれが属する前記層に対する、前記選択された情報の項目によって表現される前記少なくとも1つのサブサンプルについての情報を提供するためのマッピングメタデータを含む、メディアセグメントファイルを受信するステップと、
前記マッピングメタデータに応じて、前記受信されたメディアセグメントファイルから、前記選択された情報の項目によって表現される前記少なくとも1つのサブサンプルを復元するステップと
を実行するように構成されている少なくとも1つのマイクロプロセッサを備える。
したがって、本発明は、種々のスケーラブル部分、特に、種々のスケーラブルタイルの組み合わせること、および、クライアントデバイスによってダウンロードされるスケーラブル部分またはタイルの選択されるセットが何であれ有効なファイルフォーマットを作成することを可能にする。
それゆえ、本発明のデバイスは、独立したスケーラブル部分またはタイルの効率的なストリーミングに適しており、有用なデータのみがクライアントデバイスに対して送信されることが必要であり、2つ以上の部分または選択タイル(すなわち、任意のROI)に適しており、インデックス付けオーバヘッドを低減し、MPEG規格に統合することができる。
その上、ROIの幾何形状情報および識別情報を同じ構造内で処理するとともに、タイルおよびROIをインデックス付けすることによって、構文解析効率ならびに関心領域およびタイルの抽出が改善される。
ある実施形態において、前記マッピングメタデータは同じ構造内に記憶される。
ある実施形態において、前記分割タイムドメディアデータはタイル化タイムドメディアデータであり、前記サブサンプルは空間サブサンプルである。
ある実施形態において、前記マイクロプロセッサは、第1のグループがサブサンプルのコード化単位を特性化する第1のタイプの情報と関連付けられ、第2のグループがサブサンプルのコード化単位を特性化する第2のタイプの情報と関連付けられる、種々のサブサンプルグループの定義を含むマッピングメタデータを記憶するデータ記述子を、前記受信されたメディアセグメントファイルから得るステップを実行するようにさらに構成されている。
ある実施形態において、前記第1のタイプの情報は、サブサンプルのコード化単位と、対応する前記タイムドサンプルとの間の関係を特性化する情報に関し、前記第2のタイプの情報は、サブサンプルのコード化単位と前記分割タイムドメディアデータの層編成との間の関係を特性化する情報に関する。
ある実施形態において、前記マイクロプロセッサは、前記受信されたサブサンプルの各コード化単位のグループタイプを判定するステップと、前記第1のグループと関連付けられる前記情報に応じて、または、前記第2のグループと関連付けられる前記情報に応じて、前記コード化単位の各々を処理するステップとを実行するようにさらに構成されている。
ある実施形態において、前記マイクロプロセッサは、サブサンプルグループの定義を含むマッピングメタデータを記憶するデータ記述子を、前記受信されたメディアセグメントファイルから得る前記ステップを実行するようにさらに構成されており、前記マッピングメタデータは、受信されたサブサンプルのコード化単位と、対応する前記タイムドサンプルとの間の関係を特性化する情報を含む。
ある実施形態において、前記定義は、受信されたサブサンプルの少なくとも1つのコード化単位と、前記分割タイムドメディアデータの前記層編成との間の関係を特性化する情報をさらに含み、前記マイクロプロセッサは、前記コード化単位と前記分割タイムドメディアデータの前記層編成との間の前記関係を特性化する前記情報に応じて受信されたサブサンプルのコード化単位を処理するステップを実行するようにさらに構成されている。
ある実施形態において、前記マイクロプロセッサは、サブサンプルの層従属関係情報に応じて、前記受信されたサブサンプルの前記コード化単位を処理する前記ステップを実行するようにさらに構成されている。
ある実施形態において、前記マイクロプロセッサは、前記処理されるコード化単位の従属先であるサブサンプルのサブサンプル定義を得るステップを実行するようにさらに構成されている。
ある実施形態において、受信されたサブサンプルの少なくとも1つのコード化単位と、前記分割タイムドメディアデータの前記層編成との間の関係を特性化する前記情報は、前記分割タイムドメディアデータの前記層編成の層記述へのリンクを含み、前記マイクロプロセッサは、前記分割タイムドメディアデータの前記層編成の前記層記述への前記リンクに応じて受信されたサブサンプルのコード化単位を処理する前記ステップを実行するようにさらに構成されている。
ある実施形態において、前記データ記述子は、デフォルトで、受信されたサブサンプルのコード化単位を特性化するために使用され、前記マイクロプロセッサは、サブサンプル識別子、ならびに、前記識別されるサブサンプルのコード化単位と、対応する前記タイムドサンプルとの間の関係を特性化する対応する情報を含むマッピングメタデータを記憶する少なくとも1つのさらなるデータ記述子を得るステップを実行するようにさらに構成されており、前記マイクロプロセッサは、処理されるべきサブサンプルが前記さらなるデータ記述子内で識別されるか否かを判定するステップを実行するようにさらに構成されている。
ある実施形態において、マッピングメタデータを記憶している前記少なくとも1つのさらなるデータ記述子の前記マッピングメタデータは、前記識別されたサブサンプルの少なくとも1つのコード化単位と、前記分割タイムドメディアデータの前記層編成との間の関係を特性化する情報をさらに含み、前記マイクロプロセッサは、前記識別されたサブサンプルの少なくとも1つのコード化単位と、前記分割タイムドメディアデータの前記層編成との間の関係を特性化する前記情報に応じて受信されたサブサンプルを処理するステップを実行するようにさらに構成されている。
本発明の第7の態様によれば、サーバにおいて分割タイムドメディアデータをカプセル化するためのデバイスが提供され、前記分割タイムドメディアデータは、1つ以上のコード化単位によって表現される複数のサブサンプルを含むタイムドサンプルを含み、前記デバイスは、
1つの前記タイムドサンプルの前記複数のサブサンプルの中から少なくとも1つのサブサンプルを得るステップであって、前記得られるサブサンプルが、前記1つのタイムドサンプルの前記サブサンプルのセットのうちのサブセットを形成する、得るステップと、
得られたサブサンプルごとに1つのトラックを作成するステップと、
少なくとも1つのメディアセグメントファイルにおいて前記作成されたトラックをカプセル化するステップであって、前記メディアセグメントファイルは、
前記作成されたトラックが同じタイムドサンプルの一部であるサブサンプルを含むことを伝えるためのメタデータと、
チャンクに編成されているメディアデータであって、各チャンクは考慮されているタイムドサンプルの同じサブサンプルの前記コード化単位を含む、チャンクに編成されているメディアデータとを含む、カプセル化するステップと
を実行するように構成されている少なくとも1つのマイクロプロセッサを備える。
したがって、本発明は、種々のスケーラブル部分、特に、種々のスケーラブルタイルの組み合わせること、および、クライアントデバイスによってダウンロードされるスケーラブル部分またはタイルの選択されるセットが何であれ有効なファイルフォーマットを作成することを可能にする。
それゆえ、本発明のデバイスは、独立したスケーラブル部分またはタイルの効率的なストリーミングに適しており、有用なデータのみがクライアントデバイスに対して送信されることが必要であり、2つ以上の部分または選択タイル(すなわち、任意のROI)に適しており、インデックス付けオーバヘッドを低減し、MPEG規格に統合することができる。
その上、ROIの幾何形状情報および識別情報を同じ構造内で処理するとともに、タイルおよびROIをインデックス付けすることによって、構文解析効率ならびに関心領域およびタイルの抽出が改善される。
本発明の第8の態様によれば、クライアントデバイスにおいて、メディアセグメントファイル内にカプセル化されている分割タイムドメディアデータからタイムドメディアデータビットストリームを提供するためのデバイスが提供され、前記分割タイムドメディアデータはタイムドサンプルを含み、各タイムドサンプルは、第1の層と少なくとも1つの第2の層とを含み、前記層のうちの少なくとも1つは、1つ以上のコード化単位によって表現される複数のサブサンプルを含み、前記メディアセグメントファイルは複数のトラックを含み、各トラックは、1つの前記タイムドサンプルの前記複数のサブサンプルの中から選択される1つのサブサンプルを含み、前記トラックのサブサンプルは、前記1つのタイムドサンプルの前記サブサンプルのセットのサブセットを形成し、前記デバイスは、
少なくとも1つのサブサンプルを表す情報の項目を選択するステップと、
前記選択された情報の項目によって表現される前記サブサンプルを含む前記トラックを要求するステップと、
前記メディアセグメントファイルを受信するステップであって、前記受信されるメディアセグメントファイルは、前記受信されるトラックが、同じタイムドサンプルの一部であるサブサンプルを含むことを伝えるためのメタデータと、チャンクに編成されているメディアデータであって、各チャンクは考慮されているタイムドサンプルの同じサブサンプルの前記コード化単位を含む、チャンクに編成されているメディアデータとを含む、メディアセグメントファイルを受信するステップと、
前記マッピングメタデータに応じて、前記受信されたメディアセグメントファイルから、前記選択された情報の項目によって表現される前記サブサンプルを復元するステップと
を実行するように構成されている少なくとも1つのマイクロプロセッサを備える。
したがって、本発明は、種々のスケーラブル部分、特に、種々のスケーラブルタイルの組み合わせること、および、クライアントデバイスによってダウンロードされるスケーラブル部分またはタイルの選択されるセットが何であれ有効なファイルフォーマットを作成することを可能にする。
それゆえ、本発明のデバイスは、独立したスケーラブル部分またはタイルの効率的なストリーミングに適しており、有用なデータのみがクライアントデバイスに対して送信されることが必要であり、2つ以上の部分または選択タイル(すなわち、任意のROI)に適しており、インデックス付けオーバヘッドを低減し、MPEG規格に統合することができる。
その上、ROIの幾何形状情報および識別情報を同じ構造内で処理するとともに、タイルおよびROIをインデックス付けすることによって、構文解析効率ならびに関心領域およびタイルの抽出が改善される。
ある実施形態において、サーバはハイパーテキスト転送プロトコル(HTTP)に適合しており、受信されるメディアセグメントファイルは、国際標準化機構によって定義されているものとしてのHTTPフォーマットを介した動的適応型ストリーミングおよびベースメディアファイルフォーマットに適合する。
ある実施形態において、クライアントデバイスはハイパーテキスト転送プロトコル(HTTP)に適合しており、受信されるメディアセグメントファイルは、国際標準化機構によって定義されているものとしてのHTTPフォーマットを介した動的適応型ストリーミングおよびベースメディアファイルフォーマットに適合する。
本発明の第9の態様および第10の態様によれば、上述したデバイスを備えるビデオ符号化器および復号器が提供される。
したがって、本発明は、種々のスケーラブル部分、特に、種々のスケーラブルタイルの組み合わせること、および、クライアントデバイスによってダウンロードされるスケーラブル部分またはタイルの選択されるセットが何であれ有効なファイルフォーマットを作成することを可能にする。
それゆえ、本発明のビデオ符号化器およびビデオ復号器は、独立したスケーラブル部分またはタイルの効率的なストリーミングに適しており、有用なデータのみがクライアントデバイスに対して送信されることが必要であり、2つ以上の部分または選択タイル(すなわち、任意のROI)に適しており、インデックス付けオーバヘッドを低減し、MPEG規格に統合することができる。
その上、ROIの幾何形状情報および識別情報を同じ構造内で処理するとともに、タイルおよびROIをインデックス付けすることによって、構文解析効率ならびに関心領域およびタイルの抽出が改善される。
本発明はソフトウェアにおいて実装することができるため、本発明は、任意の適切なキャリア媒体上でプログラム可能装置に提供するためのコンピュータ可読コードとして具現化することができる。有形キャリア媒体は、フロッピーディスク、CD−ROM、ハードディスクドライブ、磁気テープデバイスまたはソリッドステートメモリデバイスなどのような記憶媒体を含んでもよい。一時的キャリア媒体は、電気信号、電子信号、光信号、音響信号、磁気信号または電磁信号、たとえば、マイクロ波もしくはRF信号のような信号を含んでもよい。
本発明のさらなる利点は、図面および詳細な説明を精査すれば、当業者には明らかになろう。任意の追加の利点が本明細書に組み込まれることが意図されている。
これから、本発明の実施形態が、例としてのみ、添付の図面を参照して説明される。
図1aおよび図1bよりなる図1は、符号化済みビデオビットストリーム内のコード化タイルの例を示す。 図2は、提示されるべき、ユーザによって選択されるタイルの時間パイプを示す。 図3a、図3b、および図3cよりなる図3は、HEVCスケーラブルビットストリームの構成の種々の例を示す。 図4は、単一のmp4トラックとして符号化されている、HEVC規格に従うタイル化ビデオビットストリームの例を示す。 図5は、mp4ファイルとして符号化されている、ISO/IEC 14496−15に従う、サンプルベースカプセル化SVCストリームの例を示す。 図6aおよび図6bよりなる図6は、第1の実施形態による、単一のトラックとしてのHEVCタイプのタイル化スケーラブルビデオストリームのmp4ファイルへのカプセル化の例を示す。 図7aおよび図7bよりなる図7は、第2の実施形態による、単一のトラックとしてのHEVCタイプのタイル化スケーラブルビデオストリームのmp4ファイルへのカプセル化の例を示す。 図8は、HEVCタイプのタイル化スケーラブルビデオストリームの、mp4ファイルのようなファイルへのカプセル化を可能にするTileRegionGroupEntry記述子の新規のパラメータの例を示す。 図9aおよび図9bよりなる図9は、第3の実施形態による、単一のトラックとしてのHEVCタイプのタイル化スケーラブルビデオストリームのmp4ファイルへのカプセル化の例を示す。 図10は、HEVCビットストリームをカプセル化するための、特定の実施形態によるタイルおよびスケーラブル層記述子を示す。 図11aおよび図11bよりなる図11は、特定の実施形態による、サーバとクライアントデバイスとの間でタイムドメディアデータを送信するためのステップを示す流れ図である。 図12は、1つ以上の実施形態のステップを実施することができるサーバまたはクライアントデバイスのブロック図を示す。 図13a、図13b、および図13cよりなる図13は、HEVCビットストリーム内のタイルおよびスライスセグメントの例を示す。 図14aおよび図14bよりなる図14は、様々なタイル化構成を処理するように適合している、全ビデオ中のタイルの位置、タイルのサイズ、および、いかなるアーティファクトもなくサブサンプルレベルでタイルトラックを復号することができるという指示の伝達を示す。 図15aおよび図15bよりなる図15は、効率的なデータアドレス指定のための、複数トラックにおけるタイルのカプセル化の例を示す。
特定の実施形態によれば、タイル化タイムドメディアデータ(たとえば、ビデオデータ)のようなスケーラブル分割タイムドメディアデータが、メディアセグメントファイル、たとえば、mp4(ISO/IEC 14496−14)に適合するメディアセグメントファイルのセットとして送信される。メディアセグメントファイルは一般的には、ヘッダ部分およびデータ部分から構成される。ヘッダ部分は、データ部分内に含まれるデータをアドレス指定および抽出するための記述メタデータを含む。タイムドサンプルは、空間サブサンプル(タイル)を有する1つ以上の表現層(スケーラブルビデオ)を含む。各空間サブサンプルは、1つまたはいくつかのNAL単位によって表現することができる。
初期化セグメントファイルを使用して、メディアセグメントファイルを復号するために必要とされるメタデータを送信することができる。
図1aおよび図1bよりなる図1は、符号化済みビデオビットストリーム内のコード化タイルの例を示す。
例示を目的として、以下の説明においては、各ビデオフレーム(タイムドサンプル)が、ビデオフレームの空間下位部分(空間サブサンプル)に対応する、独立して復号可能なタイルから構成されると考えられる。ビデオはスケーラブルであり、種々のレベルのスケーラビリティにおいて編成されることが好ましい。図1aに示すように、ビデオフレーム100は、HD基本層(102)と、4K2K強化層(104)とを含むことができる。さらに例示を目的として、強化層104は、a、b、c、およびdとして示されている4つの規則的なタイルに分割することができる。異なる形状のタイルが処理されてもよいことが留意されるべきである。同様に、基本層102もいくつかのタイルに分割することができる。
図1bは、一般的な符号化済みビデオビットストリームを復号順序で示す。図示されているように、符号化済みビデオビットストリームはここでは、時系列順に符号化されている3つのビデオフレーム(110、112、および114)を含む。各ビデオフレームは強化層のNAL単位が後続する基本層(BL)のすべてのネットワーク抽象化層(NAL)単位を含む。たとえば、第1のビデオフレーム(110)の基本層(102−1)のNAL単位(1BL、116)には、第1のビデオフレームの強化層(104−1)のNAL単位(1共通、1a、1b、1c、1d、118)が後続する。
空間タイルを有する強化層に対応するビデオビットストリームの部分は、各タイルのNAL単位から構成される。任意選択的に、これは、すべてのタイルに共通でありタイルのいずれかを復号するために必要とされるNAL単位をも含んでもよい。所与のフレームのすべてのタイルに共通であるNAL単位は、ビデオビットストリームの対応する部分の任意の箇所(すなわち、ビデオフレームのタイルのNAL単位の前、間、または後)に位置することができる。
図示されているように、空間タイルa、b、c、およびdを含む、第1のビデオフレーム(110)の強化層に対応するビデオビットストリームの部分は、各タイルのNAL単位(1a、1b、1c、および1d)ならびにすべてのタイルa、b、c、およびdに共通であるNAL単位(1共通)から構成される。
図2は、提示されるべき、ユーザによって選択されるタイルの時間パイプを示す。より正確には、図2は、第1のビデオフレームnおよび第2のビデオフレームn+m(nおよびmは整数値)を表し、第1のビデオフレームおよび第2のビデオフレームの各々は、1〜12の番号を付された12個のタイルを含む。これらの12個のタイルのうち、第3のタイルおよび第7のタイルのみを表示するものとする(太い線で示す)。ビデオフレームnおよびn+mは、所与の期間に対応する一連の連続したフレームに属する。それゆえ、フレームnからフレームn+mへの各フレームの第3のタイルおよび第7のタイルが連続して表示される。
図1に示すように、ビデオビットストリームのデータは、全フレームに対応する時間サンプルとして編成される。したがって、図2を参照して上述したように所与の期間の間にこれらのフレームの特定の空間領域がアクセスされるものとするとき、各フレームのいくつかの小さいバイト範囲にアクセスすることが必要とされる。
それゆえ、ROIストリーミングのために圧縮ビデオにおいて効率的なアクセスをもたらすためには、すなわち、特定のタイルおよび特定のスケーラビリティ層のデータに対する効率的なアクセスをもたらすためには、タイムドメディアデータビットストリームは効率的に記述されるべきである。
図3a、図3b、および図3cよりなる図3は、HEVCスケーラブルビットストリームの構成の種々の例を示す。
図3aは、基本層300および強化層305を含む空間スケーラブルビデオビットストリームの例である。強化層310は基本層300に応じて符号化される。そのようなビデオビットストリームフォーマットにおいては、基本層および強化層のいずれもがタイルを含むことにはならないため、画像から画像への従属関係が存在する。
図3bは、基本層310および強化層315を含むスケーラブルビデオビットストリームの別の例を示す。この例によれば、強化層315は、特にタイル320を含むタイル化強化層である。そのようなビデオビットストリームフォーマットにおいては、強化層のタイルが基本層に従属するため、タイルから画像への従属関係が存在する。
図3cはさらに、基本層325および強化層330を含むスケーラブルビデオビットストリームの別の例を示す。この例によれば、基本層325は、特にタイル335および340を含むタイル化基本層であり、強化層330は、特にタイル345およびタイルセット350を含むタイル化強化層である。基本層325は、強化層330によって空間的に強化することができる。そのようなビデオビットストリームフォーマットにおいては、強化層のタイルが基本層のタイルに従属するため、タイルからタイルへの従属関係が存在する。強化層のタイルセットが基本層のタイルに従属するため、タイルセットからタイルへの従属関係も存在する。例示を目的として、タイル345はタイル340に従属し、タイルセット350はタイル335に従属する。タイルからタイルセットへの従属関係またはタイルセットからタイルセットへの従属関係のような他の従属関係が存在する場合がある。
同様の構成が、同じくタイル化されている場合がありまたはされていない場合がある基本層の上に、タイル化されている場合がありまたはされていない場合があるSNRスケーラブル層について存在することが留意されるべきである。
図4は、データを符号化するための第1の部分400と、記述メタデータを含む第2の部分410を含む単一のmp4トラックとして符号化されている、HEVC規格に適合するタイル化ビデオビットストリームの例を示す。
ビデオデータは、パラメータセット401と、サンプルデータ、たとえば、それぞれサンプル1およびサンプルSに対応するサンプルデータ402および403とを含むmdatボックス400内に符号化される。図示されているように、パラメータセットは一般的には、VPS(ビデオパラメータセット)、SPS(シーケンスパラメータセット)、PPS(画像パラメータセット)、およびSEI(補足強化情報)を含む。各サンプルは、NAL単位404を含むサンプルSのように、NAL単位を含む。図4に示す特定の構成によれば、各タイルが1つのNAL単位内に符号化される。たとえば、NAL単位404はタイル405を含む。
示されているように、記述メタデータはmoovボックス410内に含まれる。これは主に、サンプルグループ化情報を含む。特に、これは、サンプルのサンプルグループへの割り当てを記述するSampleToGroupボックス(「sbgp」)411と、各々が特定のサンプルグループ内のサンプルの特定タイプの共通の特性を記述する2つのSampleGroupDescriptionボックス(「sgpd」)412および413とを含む。第1のSampleToGroupDescriptionボックス412は、NAL単位の、タイル記述を定義するグループ(groupID識別子を用いて識別される)へのマッピングを記述する。これらのタイル記述は、第2のSampleGroupDescriptionボックス413において記述されている。
所与の例に示すように、NALUMapEntryボックス414において宣言されている各NAL単位は、TileRegionGroupEntryボックス415および416のようなTileRegionGroupEntryボックス(「trif」(タイル領域情報)フラグ)によって識別される)を指す。各TileRegionGroupEntryボックスは、タイルデータが独立して復号可能であるか否かを指示し、タイル位置およびタイルサイズを指示するための復号指示のようなタイル情報を提供する。
図5は、mp4ファイル500として符号化されている、ISO/IEC 14496−15に従う、サンプルベースカプセル化SVCストリームの例を示す。
示されているように、記述メタデータがmoovボックス501内に含まれており、ビデオデータがmdatボックス502内に符号化されている。
moovボックス501は、ビデオデータサンプル、たとえば、ビデオデータサンプル504、505および506が記述にどのようにマッピングするかを主に記述する単一のトラック503をカプセル化している。その目的のために、SampleToGroupDescriptionボックス508および509を参照するSampleToGroupボックス507が使用される。より正確には、SampleToGroupボックス507は、スケーラビリティ層へのそのNAL単位マッピングに応じて、各サンプルにマップ識別子を割り当てる。図示されているように、各サンプルは、所与の例においては、マップ0またはマップ1識別子に割り当てることができる。各NAL単位マッピングは、SampleToGroupDescriptionボックス508に記憶されているScalableNALUMapEntry記述子において記述されている。各ScalableNALUMapEntry記述子において、groupIDパラメータは、SampleGroupDescriptionボックス510のいずれのSampleGroupEntryボックス内で記述を見つけることができるかを示している。言い換えれば、groupIDパラメータは、サンプルグループ記述子内で指示されているような、対応するスケーラブル、多視点、タイル、タイルセット、またはHEVC層グループエントリを指示する。このパラメータの値がゼロである場合、これらの識別されたNAL単位にグループは関連付けられない。
スケーラビリティ層の記述は、SVCカプセル化のために導入される特定の概念に従って層を記述するために使用される「Tier」において宣言することができる。より正確には、「Tier」は、トラック内の動作点のセットを記述し、動作点、および、対応するビデオビットストリーム部分にどのようにアクセスすべきかに関する指示に関する情報が与えられる。SVC規格によれば、動作点は、以下の3つの識別子、すなわち、dependency_id、temporal_id、およびquality_idを含むトリプレットによって表現される。「Tier」は、ScalableGroupEntryボックス509のようなScalableGroupEntryボックス内に記憶される1つまたはいくつかのボックスによって表現される。TierInfoBoxとして参照される1つのボックスは、ScalableGroupEntryボックス509において示すように、ビデオエレメンタリストリームならびに空間および時間分解能ストリームにおいて符号化されているようなプロファイルおよびレベル情報を提供するために、「Tier」記述において必須である。
図6aおよび図6bよりなる図6は、第1の実施形態による、単一のトラックとしてのHEVCタイプのタイル化スケーラブルビデオストリームのmp4ファイルへのカプセル化の例を示す。
図6aに示すように、ビデオストリームは、2つの独立した空間強化層601および602によって強化することができる基本層600を含むと仮定される。強化層Aとして参照される強化層601はタイルT1およびT2を含み、強化層Bとして参照される強化層602は、タイルT1、T2、T3、およびT4を含む(強化層AのタイルT1およびT2は、強化層BのタイルT1およびT2とは異なる)。
図6bを参照すると、HEVC規格に従ってmp4ファイル610に符号化されているタイル化スケーラブルビデオストリームをカプセル化するために、ビデオデータがmdatボックス612内に、特にサンプル620を含むサンプルのリストとして記憶される。各サンプルは1つ以上のNAL単位のセットとして符号化されている。図示されているように、サンプル620は、基本層(NAL単位621)、タイル化強化層A(NAL単位622および623)、およびタイル化強化層B(NAL単位624〜627)に対応するインターレースされたNAL単位621〜627を含む。
これらのデータの記述は、特にNAL単位マッピングおよびサンプルグループ化を記述するための「trak」ボックスを含むmoovボックス611内に記憶されている。所与の例によれば、図4を参照して説明したようなタイルへのNAL単位マッピング、および、図5を参照して説明したようなスケーラビリティ層へのNAL単位マッピングを記述することが必要とされる。
図4および図5を参照して開示される解決策を組み合わせる結果として、NAL単位をタイルにマッピングするためのマップ(NALUMapEntryボックス615)に応じて、および、NAL単位をスケーラビリティ層にマッピングするためのマップ(NALUMapEntryボックス615)に応じて各ビデオデータサンプルをマッピングするために2つのSampleToGroupボックス613および614が使用されることになる。タイル関係は、専用のSampleGroupDescriptionボックス(図6には示さず)内のTileRegionGroupEntry構造内に記述することができ、一方、スケーラブル層関係は、「Tier」ボックスと等価なボックスを使用して記述することができる。
しかしながら、「Tier」はHEVC規格においては定義されていないため、等価な構造を、層編成に関する情報を記憶するのに使用すべきである。これは、図6bに示すような各層のHEVCLayerDefinitionBoxボックスを使用することによって行うことができ、HEVCLayerDefinitionBoxボックス617、618、および619は、それぞれ基本層、強化層A、および強化層Bに関する情報を与える。HEVCLayerDefinitionBoxボックスの構造の例が図8を参照して説明される(参照符号802)。
タイル記述に使用されるgroupID識別子とスケーラビリティ層に使用されるgroupID識別子との間の如何なる衝突も避けるために、タイルと関連付けられるNAL単位とスケーラビリティ層と関連付けられるNAL単位との間の関係が確立されるべきである。その目的のために、ref_grouping_typeとして参照される場合がある新たなパラメータを用いてNALUMapEntry構造が拡張される。
class NALUMapEntry() extends VisualSampleGroupEntry (‘nalm’) {
unsigned int(32)ref_grouping_type;
unsigned int(6) reserved = 0;
unsigned int(1) large_size;
unsigned int(1) mode;
if (large_size) unsigned int(16) entry_count;
else unsigned int(8) entry_count;
for (i=1; i<= entry_count; i++) {
if (mode) {
if (large_size) unsigned int(16) NALU_start_number;
else unsigned int(8) NALU_start_number;

unsigned int(32) groupID;

図6に示す例によれば、ref_grouping_typeパラメータの値は、マップ615(タイル記述を指す)として参照されるタイルに特有であるNALUMapEntry記述子を選択するための「trif」に、および、マップ616(スケーラビリティ層記述を指す)として参照されるスケーラビリティに特有である別のNALUMapEntry記述子を選択するための「scif」(スケーラビリティ情報を提供するスケーラブルグループエントリ)に設定することができる。
「trif」は、図4を参照して、「sgpd」ボックスにおいて上述している。明瞭にするために、このボックスは図6bには示していない。しかしながら、図4に示すように、「sgpd」ボックスは「moov」ボックス内に含むことができる。
「scif」は、操作点の識別子(「tier」)または「tier」ボックスに対する参照としての、スケーラビリティに関する情報を提供する別の既知のボックスである(図面を単純にするためにここでは示していない)。
これは、NALUマップエントリの終わりに置かれるgroupID識別子の分解能に関する、mp4パーサに対する有用な指示を与える(groupIDに対応する情報は任意のSampleGroupDescriptionボックス内にあり得るため)。ref_grouping_type情報が分かることによって、パーサは、特定のgroupIDに関係する情報を得るために1つのみのSampleGroupDescriptionボックスを探索することが可能になる(探索されるSampleGroupDescriptionボックスは、ref_grouping_typeの値に対応するものである)。
上述したように、タイルおよびROIの幾何形状情報および識別情報(位置、従属関係、層など)を同じ構造(NALUMapEntry記述子)内で処理するとともに、(NAL単位をインデックス付けする代わりに)タイルおよびROIをインデックス付けすることが、構文解析効率の観点から、ならびに、関心領域およびタイルのより迅速な抽出の観点から好ましい。
図7aおよび図7bよりなる図7は、重複する情報の量を低減することを可能にする第2の実施形態による、単一のトラックとしてのHEVCタイプのタイル化スケーラブルビデオストリームのmp4ファイルへのカプセル化の例を示す。
図6aと同様である図7aに示すように、ビデオストリームは、2つの独立した空間強化層701および702によって強化することができる基本層700を含むと仮定される。強化層Aとして参照される強化層701はタイルT1およびT2を含み、強化層Bとして参照される強化層702は、タイルT1、T2、T3、およびT4を含む(強化層AのタイルT1およびT2は、強化層BのタイルT1およびT2とは異なる)。
ここでも、図7bを参照すると、HEVC規格に従ってmp4ファイル710に符号化されているタイル化スケーラブルビデオストリームをカプセル化するために、ビデオデータがmdatボックス712内に、特にサンプル720を含むサンプルのリストとして記憶される。各サンプルは1つ以上のNAL単位のセットとして符号化されている。図示されているように、サンプル720は、基本層(NAL単位721)、タイル化強化層A(NAL単位722および723)、およびタイル化強化層B(NAL単位724〜727)に対応するインターレースされたNAL単位721〜727を含む。
しかしながら、いくつかのNALUMapEntryボックスが使用される図6を参照して説明したカプセル化方式とは対照的に、ここでのカプセル化方式は、NALUMapEntryボックス714において記述されている単一のNAL単位マッピングに基づく。NALUMapEntryボックス714は、サンプルあたりのNAL単位の数がサンプル間で一定であると考えられるため、単一のエントリを有するSampleToGroupボックス713から参照される。それゆえ、トラックのすべてのサンプルは、NALUMapEntryボックス714の内容に応じてマッピングされる。
NAL単位を参照するためのgroupID識別子を使用することによって、NAL単位が、タイル記述に応じて、または、スケーラビリティ層記述に応じてのいずれかでマッピングされることが可能になることが留意されるべきである。スケーラビリティ層がタイルを含むとき、NAL単位は最初にタイル記述に応じてマッピングされ、次にスケーラビリティ層記述に応じてマッピングされ、タイル情報は、図8を参照して説明している様に、いずれの層からそれが来るかを指示する。
図7を参照して説明した実施形態によるカプセル化は、単一のNAL単位マッピングが必要とされるという点において、図6を参照して説明したものよりもコンパクトであることも留意されるべきである。
図8は、HEVCタイプのタイル化スケーラブルビデオストリームの、mp4ファイルのようなファイルへのカプセル化を可能にするTileRegionGroupEntry記述子の新規のパラメータの例を示す。
図示されているように、TileRegionGroupEntry記述子800および801は、この所与の例において、スケーラビリティ情報およびタイルまたは画像従属関係情報にアクセスするためのdependentGroupIDパラメータ803およびlayerGroupIDパラメータ804を含む。この所与の例によれば、スケーラビリティ情報はHEVCLayerDefinitionBox記述子802内に記憶されており、タイルまたは画像従属関係情報は、TileRegionGroupEntry記述子801内に記憶されている。
HEVCLayerDefinitionBox記述子802は、識別子、従属関係伝達メカニズム、および、ビデオエレメンタリビットストリームに由来する追加の特性を含むHEVCLayerDefinitionBox記述子(またはHEVCLayerDefinitionBoxボックス)のパラメータの例を示す。例示を目的として、追加の特性は、visualWidthおよびvisualHeightパラメータを含む。しかしながら、追加の特性はまた、フレームレート、ビットレートならびにプロファイルおよびレベル情報のような他のパラメータをも含んでもよい。それらの特性はまた、スケーラビリティ層を記述する高レベル構文情報をも含んでもよい。
修正TileRegionGroupEntry記述子801の新たな修正されたパラメータは、以下のように定義することができる:
(TileRegionGroupEntry記述子によって定義されるような)タイル、(TileSetGroupEntry記述子によって定義されているような)タイルセット、または、このタイルが依存する(HEVCLayerDefinitionBox記述子、たとえば、HEVCLayerDefinitionBox記述子802によって定義されているような)HEVC層の識別子を与えるdependentGroupID(参照符号803)。従属関係がトラック参照ボックスから導き出されるとき、このパラメータは、0に設定されることが好ましい;
このタイルが属する(HEVCLayerDefinitionBox記述子によって定義されているような)HEVC層の識別子を与えるlayerGroupID(参照符号804)。従属関係がこのトラック参照ボックスから導き出されるとき、パラメータは0に設定される;および
layerGroupIDパラメーターの値がゼロと異なる場合のlayerGroupIDパラメーターによって識別される層の、または、当業者に周知である、「moov」ボックス内に含まれている「stsd」ボックスの視覚サンプルエントリにおいて指示されているものとしてのフレームの、輝度サンプルに関し、タイルによって表現される矩形領域の幅および高さをそれぞれ定義するregion_widthおよびregion_height。
groupIDパラメータを符号化するために使用されるビット数を修正しながら、同様の新たなおよび修正されたパラメータもTileSetGroupEntry記述子に適用される(タイル化およびスケーラビリティ構成は組み合わされ、単一の名前空間が使用されるため、groupIDパラメータの値の数は増大されることになる)。
別の必要とされる適合は、(TileRegionGroupEntry記述子によって定義されるような)タイル、(TileSetGroupEntry記述子によって定義されているような)タイルセット、または、このタイルが依存する(HEVCLayerDefinitionBox記述子によって定義されているような)HEVC層の識別子を定義することができるdependencyTileGroupID属性の解釈に関する。dependencyTileGroupID属性の値がゼロに等しい場合、従属関係はトラック参照ボックスから導き出される。
例示を目的として、新たなHEVCLayerDefinitionBox記述子(参照符号802)のパラメータは以下のように定義することができる:
グループによって記述される層の固有の識別子であるgroupID。値0は「nalm」ボックスにおける特別な用途のために確保される;
その層が依存する(HEVCLayerDefinitionBox記述子によって定義されているような)HEVC層のgroupID識別子を指示するdependentGroupID。dependentGroupIDパラメータの値がゼロに等しい場合、従属関係は上述したトラック参照ボックス「stsd」から導き出される。これはたとえば、SHVCビットストリームがAVC|H264トラックを強化する場合である;
輝度サンプルにおけるコード化画像またはビューの幅の値を与えるvisualWidth;および
輝度サンプルにおけるコード化画像またはビューの高さの値を与えるvisualHeight。
タイル化が層記述子を参照するようにすること、および、層記述子がタイルまたは層のいずれかの記述子を参照することを可能にすることの利点は、groupID識別子の使用を通じて常に、統一された柔軟な従属関係伝達がもたらされることである。タイル、タイルセットおよびHEVC層のgroupID識別子の名前空間を統一することによって、また、2つの従属関係識別子(dependentGroupIDおよびlayerGroupIDパラメータ)を導入することによって、以下の従属関係:
タイル化層間の従属関係;
非タイル化層間の従属関係;
非タイル化強化層とタイル化基本層との間の従属関係;および
タイル化強化層と非タイル化基本層との間の従属関係
が単純に定義される。
groupID識別子の名前空間が基本層であると定義される場合(たとえば、一般的なmp4ファイルにはビデオストリームの基本層は1つしか存在しないため、ほとんどの事例において、groupID名前空間の範囲がmoovボックスと関連付けられることを念頭に置くと、groupIDの同じ値が同じ基本を参照する異なるトラックにおいては使用されない)、あるDASHベースの解決策の場合にそうであり得るように、図6〜図8を参照して説明した解決策は、層またはタイルが異なるトラック内に記憶される場合に適用可能であることが留意されるべきである。
図9aおよび図9bよりなる図9は、第3の実施形態による、単一のトラックとしてのHEVCタイプのタイル化スケーラブルビデオストリームのmp4ファイルへのカプセル化の例を示す。この実施形態は、サンプルあたりのNAL単位の数がサンプルごとに変動する事例に特に適合する。図10は、HEVCビットストリームをカプセル化するための、特定の実施形態によるタイルおよびスケーラブル層記述子を示す。
図6aおよび図7aと同様である図9aに示すように、ビデオストリームは、2つの独立した空間強化層901および902によって強化することができる基本層900を含むと仮定される。強化層Aとして参照される強化層901はタイルT1およびT2を含み、強化層Bとして参照される強化層902は、タイルT1、T2、T3、およびT4を含む(強化層AのタイルT1およびT2は、強化層BのタイルT1およびT2とは異なる)。
ここでも、図9bを参照すると、HEVC規格に従ってmp4ファイル910に符号化されているタイル化スケーラブルビデオストリームをカプセル化するために、ビデオデータがmdatボックス912内に、特にサンプル919および921を含むサンプルのリストとして記憶される。各サンプルは1つ以上のNAL単位のセットとして符号化されている。サンプルあたりのNAL単位の数は変動する場合がある。
図示されているように、サンプル919は、基本層(1つのNAL単位)、タイル化強化層A(2つのNAL単位)、およびタイル化強化層B(4つのNAL単位)に対応する7つのインターレースされたNAL単位を含むが、サンプル921は、基本層(1つのNAL単位)、タイル化強化層A(3つのNAL単位)、およびタイル化強化層B(5つのNAL単位)に対応する9つのインターレースされたNAL単位を含む。事実、強化層BのタイルT3は、サンプル919内の1つのNAL単位(参照符号920)内にカプセル化され、一方で、2つのNAL単位内にカプセル化される(サンプル921内の参照符号922および923)。
サンプルあたりのNAL単位の数が変動するであろうとき、上述したようなNALUMapEntry記述子は、1つのみのNAL単位マッピングを有するタイルおよびスケーラビリティ層に関して、サンプルおよびそれらのNAL単位を記述するには適していない。
特定の実施形態によれば、そのようなNAL単位の数の変動に対処するために、mp4アグリゲータを使用することが可能である。しかしながら、mp4アグリゲータはSVCおよび/またはMVCフォーマットに特有であるため、HEVC規格には利用可能でなく、加えて、これには、mdatボックスを生成するときに特定のNAL単位を挿入し、エレメンタリストリームを抽出するためにmdatボックスを構文解析するときにビットストリームを書き換える必要がある。存在するNAL単位パターンと同数のNALUMapEntryを作成するために、サンプル内の異なるNAL単位パターンを分析することを行うことができるが、これには高い記述コストがかかることが理解されるべきである。
また特定の実施形態によれば、デフォルトのNAL単位マッピングが使用される。そのようなデフォルトのNAL単位マッピングはMPEG−4 Part−12のAmendment 3において導入されているdefaultSampleGroupメカニズムを使用することができる。これは、NALUMapEntry記述子915において伝えることができる。これは、最も一般的なNAL単位パターンに対応するように選択されることが好ましい。あるいは、そのようなデフォルトのNAL単位マッピングは、最初のNAL単位マッピング、または、タイルあたり1つのNAL単位のような、事前定義の構成に対応してもよい。
groupIDパラメータの特定の値、たとえば、ゼロの値は、デフォルトとして使用されるNALUMapEntry記述子(図9に示す例においてはNALUMapEntry記述子915)を伝えるために確保される。
加えて、HEVCファイルフォーマットのために導入されるSubSampleInformationボックスは、図10において参照符号1001および1002によって示されているように、デフォルトのNAL単位マッピングに対応するNALUMapEntry記述子(すなわち、参照符号1005)とともに使用される、新たな「確保済み」パラメータを導入するために修正される。
したがって、SubSampleInformationボックスは、サンプルまたはサンプルグループ(参照符号1003)の各サブサンプルまたは各サブサンプルグループ(参照符号1004)を記述することを可能にするので、動的なNALUマップを容易に定義することができ、サブサンプルはここではNAL単位に対応する。
たとえば、SubSampleInformationボックスの「flags」パラメータをオーバーロードすることによって、groupIDベースのサブサンプルである追加の種類のサブサンプル(CTU行、タイル、スライス、およびISO/IEC 14496 Part 15において定義されている他のものの後)を定義することが可能である。
そのような事例において、サブサンプルは、図9において参照符号914を用いて示されているように、そのgroupIDによって識別されるHEVC層、タイル、またはタイルセットにマッピングされる。NALUMapEntryサンプルグループ記述がデフォルトのdefault_sample_description_indexと共に存在する場合、デフォルトの値は無視される(たとえば、SubSampleInformationBox記述子は、NALUMapEntry記述子内に存在する定義に優先する)。groupIDの値がゼロに等しい場合、このNALUと関連付けられるグループはない。
groupIDパラメータの値がゼロに等しい場合、このNAL単位(またはNAL単位グループ)と関連付けられるグループはなく、これはNAL単位(またはNAL単位グループ)が、デフォルトのNALUMapEntry記述子においてこのNAL単位(またはNAL単位グループ)について宣言されているgroupIDパラメータに関連付けられることを意味する。これは、たとえば、サンプルi(919)のNAL単位がデフォルトのマッピングに従い、一方で、明確なマッピングがサンプルj(921)に与えられる、図9bにおける「subs」ボックス914の場合である。
この組み合わせは、通常使用されるデフォルトのNALUパターンの一時的な修正を記述するための単純な方法を提供する。SubSampleInformationBoxボックスがサブサンプル(NAL単位)またはサブサンプルグループ(NAL単位グループ)のバイトサイズを与えるため、そのような記述は、パーサが、NAL単位グループとmdatボックスにおけるそれらの位置との間のマッピングを容易に構築することを可能にする。これは、所与の基準、たとえば、空間領域または所与の層に関与するデータに従ってデータ抽出することを容易にする。
図11aおよび図11bよりなる図11は、特定の実施形態による、サーバとクライアントデバイスとの間でタイムドメディアデータを送信するためのステップを示す流れ図である。図11aに示すステップは、タイル化タイムドメディアデータビットストリームからROIストリーミングに適合するセグメントファイルを作成することによってメディア表現を準備するためにサーバ内で実施され、一方で、図11bに示すステップは、クライアントデバイス内で実施される。
第1のステップ(ステップ1100)において、ビデオストリームは、タイルを含む、特に高分解能の1つ以上の層を有するスケーラブルビデオに圧縮される。以下のステップ(ステップ1102)において、サーバは、タイルと関連付けられるすべてのNAL単位を識別し、各タイルについて、その所与のタイルに対応するすべてのNAL単位から構成されるサブサンプルを含むタイル記述子を作成する。その間、サーバは、スケーラビリティ層記述子を各タイルに関連付ける。非タイル化層の場合、スケーラビリティ層記述子のみがNAL単位と関連付けられる。たとえば、サーバは、NAL単位の種々の領域との関連を識別するためにサブ画像レベルSEIメッセージに依拠し、HEVC標準化(proposal JCTVC−K0128)において提案されているように各ROIの位置およびサイズを識別するためのシーケンスレベルSEIメッセージに依拠することができる。
次に、ステップ1104において、サーバは、図3および図6を参照して説明したように、ISO BMFF表現に従って期間を含むメディアセグメントファイルおよび初期化セグメントファイルを生成および記憶する。すべてのタイムドメディアデータトラック(たとえば、ビデオトラック)が別個のメディアセグメントファイル(時間セグメント化されている)に記憶される。
その後、サーバは、要求に応じて、初期化およびメディアセグメントファイルをクライアントデバイスに供する(ステップ1106)。サーバは、HTTP要求に応答する従来のHTTPサーバであってもよい。
HTTPストリーミングの文脈において、また好ましい実施形態において、クライアントデバイスは、サーバから利用可能なメディア表現を記述するマニフェストファイルにアクセスすることができると仮定される。このマニフェストファイルは、クライアントデバイスが、サーバから最初に初期化セグメントを要求し、その後、メディアセグメントファイルを要求することによってメディア表現をストリーミングすることを可能にするのに十分な情報(メディア特性およびセグメントのリスト)を提供する。
クライアントデバイス側で、一般的には、ポインティングデバイスのような選択手段を用いてディスプレイ上でROIが選択されると、タイル化ビデオのストリーミング中に、選択されたROIに対応するタイルが判定される(図11bにおけるステップ1108)。
次に、各期間について、スケーラブルメディアデータの場合、クライアントデバイスは、サーバに、従属層に対応するセグメントファイルをダウンロードすることを求める要求を送信する(ステップ1110)。特定の実施形態によれば、従属される層は、層から従属されている層に従属している層の前にダウンロードされる。たとえば、基本層セグメントファイルは、強化層セグメントファイルの前にダウンロードされる。
以下のステップにおいて、クライアントデバイスは、サーバに、選択されたタイルに対応するメディアセグメントファイルをダウンロードすることを求める要求を送信する(ステップ1112)。
次に、ダウンロードされたセグメントファイルが、クライアントデバイスによって、選択されたROIに対応する、ISO BMFF規格に適合する有効な(復号可能な)タイムドメディアデータビットストリームを構築するために連結される(ステップ1114)。
図12は、1つ以上の実施形態のステップを実施することができるサーバまたはクライアントデバイス1200のブロック図を示す。
デバイス1200は、通信バス1202と、デバイスが電源投入されたときにプログラムROM1206からの命令を実行し、電源投入後にメインメモリ1208からのソフトウェアアプリケーションに関係する命令を実行することが可能な中央処理装置(CPU)1204とを備える。メインメモリ1208は、たとえば、通信バス1202を介してCPU1204の作業領域として機能するランダムアクセスメモリ(RAM)タイプのものであり、そのメモリ容量は、拡張ポート(図示せず)に接続される任意選択のRAMによって拡張することができる。ソフトウェアアプリケーションに関係する命令は、たとえば、ハードディスク(HD)1210またはプログラムROM1206からメインメモリ1208にロードすることができる。そのようなソフトウェアアプリケーションは、CPU1204によって実行されると、図11aを参照して説明されたステップをサーバにおいて実施させ、図11bを参照して説明されたステップをクライアントデバイスにおいて実施させる。
参照符号1212は、デバイス1200の通信ネットワーク1214への接続を可能にするネットワークインターフェースである。ソフトウェアアプリケーションは、CPU1204によって実行されると、ネットワークインターフェースを通じて受信される要求に反応し、ネットワークを介して他のデバイスにデータストリームおよび要求を提供するように適合されている。
参照符号1216は、ユーザに情報を提示し、かつ/またはユーザからの入力を受信するためのユーザインターフェースを示す。
ここで、変形形態として、マルチメディアビットストリームの受信または送信を管理するためのデバイス1200は、図11aおよび図11bを参照して説明された方法を実施することが可能である1つ以上の専用集積回路(ASIC)から構成することができることを指摘しておくべきである。これらの集積回路は、たとえば、非限定的に、ビデオシーケンスを生成もしくは表示し、および/またはオーディオシーケンスを聴くための装置に統合される。
上述したように、本発明の実施形態は、特に、HEVCとして知られているビデオフォーマットに適用することができる。
HEVC規格によれば、画像を、タイル、スライス、およびスライスセグメントへと空間的に分割することができる。この規格において、タイルは、水平および垂直境界(すなわち、行および列)によって画定される画像の矩形領域に対応する。これは、整数個のコード化ツリー単位(CTU)を含む。それゆえ、タイルは、たとえば、関心領域の位置およびサイズを定義することによって、関心領域を識別するのに効率よく使用することができる。しかしながら、HEVCビットストリームの構造およびネットワーク抽象化層(NAL)単位としてのそのカプセル化は、タイルを考慮して編成されず、スライスに基づく。
HEVC規格において、スライスはスライスセグメントのセットであり、スライスセグメントのセットのうちの第1のスライスセグメントは独立したスライスセグメント、すなわち、ヘッダ内に記憶されている一般的な情報が別のスライスセグメントのものを参照しないスライスセグメントである。スライスセグメントセットの他のスライスセグメントは、存在する場合、従属スライスセグメント(すなわち、ヘッダ内に記憶されている一般的な情報が独立したスライスセグメントのうちの1つを参照するスライスセグメント)である。
スライスセグメントは、整数個の連続した(ラスタ走査順の)コード化ツリー単位を含む。それゆえ、スライスセグメントは、矩形形状のものとすることができるか、またはそうでなくてもよく、そのため、関心領域を表現するのに適していない。これは、スライスセグメントデータが後続するスライスセグメントヘッダの形態においてHEVCビットストリーム内に符号化される。独立スライスセグメントと従属スライスセグメントとは、それらのヘッダが異なっており、従属スライスセグメントは独立スライスセグメントに従属するため、そのヘッダの情報量が独立スライスセグメントのものよりも小さい。独立スライスセグメントおよび従属スライスセグメントは両方ともタイルを定義するためにまたは、エントロピー復号同期点として使用される、対応するビットストリーム内のエントリポイントのリストを含む。
図13a、図13b、および図13cよりなる図13は、タイルおよびスライスセグメントの例を示す。より正確には、図13aは、垂直境界1305−1および1305−2ならびに水平境界1310−1および1310−2によって9つの部分に分割されている画像(1300)を示す。1315−1〜1315−9として参照されている9つの部分の各々が、特定のタイルを表す。
図13bは、垂直境界1305’によって区切られている2つの垂直タイルを含む画像(1300’)を示す。画像1300’は、5つのスライスセグメント、すなわち、1つの独立スライスセグメント1320−1(斜線によって表されている)および4つの従属スライスセグメント1320−2〜1320−5を含む単一のスライス(参照符号なし)を含む。
図13cは、垂直境界1305’’によって区切られている2つの垂直タイルを含む画像(1300’’)を示す。左タイルは2つのスライス、すなわち、1つの独立スライスセグメント(1320’−1)および1つの従属スライスセグメント(1320’−2)を含む第1のスライス、ならびに、1つの独立スライスセグメント(1320’−3)および1つの従属スライスセグメント(1320’−4)を含む第2のスライスを含む。右タイルは、1つの独立スライスセグメント(1320’−5)および1つの従属スライスセグメント(1320’−6)を含む1つのスライスを含む。
HEVC規格によれば、スライスセグメントは、以下のように要約することができる規則に従ってタイルにリンクされる(一方または両方の条件が満たされなければならない):
スライスセグメント内のすべてのCTUが同じタイルに属する(すなわち、スライスセグメントはいくつかのタイルに属することはできない);および
タイル内のすべてのCTUが同じスライスセグメントに属する(すなわち、いくつかのスライスセグメントの各々がそのタイルのみに属することを条件として、タイルはこれらのいくつかのスライスセグメントに分割することができる)。
明瞭にするために、以下において、1つのタイルが1つの独立スライスセグメントのみを有する1つのスライスを含むと考えられる。しかしながら、本発明の実施形態は、図13bおよび図13cに示すもののような他の構成によって実行されてもよい。
上述したように、タイルは関心領域のための適切なサポートと考えることができるが、スライスセグメントは、通信ネットワークにわたる搬送のためにNAL単位内に実際に置かれ、アクセス単位(すなわち、ファイルフォーマットレベルにおけるコード化画像またはサンプル)を形成するために集約されるエンティティである。
HEVC規格によれば、このタイプのNAL単位は、以下のように定義することができる2バイトのNAL単位ヘッダ内に符号化されることを想起されたい。
nal_unit_header () {
forbidden_zero_bit
nal_unit_type
nuh_layer_id
nuh_temporal_id_plus1
スライスセグメントをコード化するために使用されるNAL単位は、スライスセグメントアドレス構文要素によってスライスセグメント内の最初のCTUのアドレスを示すスライスセグメントヘッダを含む。そのようなスライスセグメントヘッダは以下のように定義することができる。
slice_segment_header () {
first_slice_segment_in_pic_flag
if(nal_unit_type >= BLA_W_LP && nal_unit_type <= RSV_IRAP_VCL23)
no_output_of_prior_pics_flag
slice_pic_parameter_set_id
if(!first_slice_segment_in_pic_flag){
if(dependent_slice_segments_enabled_flag)
dependent_slice_segment_flag
slice_segment_address
If(!dependent_slice_segment_flag){
[…]
タイル化情報は、PPS(画像パラメータセット)NAL単位において提供される。その後、スライスセグメントとタイルとの間の関係をこれらのパラメータから推定することができる。
空間予測は(定義により)タイル境界上でリセットされるが、タイルが基準フレーム内の異なるタイルからの時間予測器を使用することを妨げるものはない。したがって、独立タイルを構築するために、符号化中、予測単位の運動ベクトルは、基準フレーム内の同じ位置にあるタイル内にあるままにするために、タイル内部に制約されることが有利である。加えて、1つのみのタイルを複合しているときにエラードリフトが導入されないように、タイル境界上ではインループフィルタ(非ブロック化およびサンプル適応オフセット(SAO)フィルタ)は機能停止されていることが好ましい。そのようなインループフィルタの制御はHEVC規格において利用可能であることが留意されるべきである。これは、スライスセグメントヘッダ内でloop_filter_across_tiles_enabled_flagとして知られているフラグによって設定される。このフラグを明確にゼロに設定することによって、タイル境界にある画素が、隣接するタイルの境界にかかる画素に従属することはできない。運動ベクトルおよびインループフィルタに関係するこれら2つの条件が満たされるとき、タイルは「独立復号可能タイル」または「独立タイル」と考えることができる。
ビデオビットストリームが独立タイルのセットとして符号化されると、これはその後、基準データの喪失および再構築エラーの伝播の一切の危険性なしにフレームごとのタイルベースの復号を可能にする。したがって、この構成は、たとえば、図2に示す関心領域(タイル3および7を含む)に対応する可能性がある元のビデオの空間部分のみを再構築することを可能にする。そのような構成は、タイルベースの復号が信頼できることを示すように、ビデオビットストリーム内の補足情報として示すことができる。
本発明の一実施形態によれば、HTTPストリーミングの文脈におけるタイルへの効率のよいアクセスが、HEVC規格に適用されるISO BMFFファイルフォーマットを使用することによってもたらされる。したがって、コード化される独立タイル(たとえば、図2に示す12個のタイル)の各々が、図6を参照して下記に説明するような「TileRegionGroupEntry」と呼ばれる、関連付けられる記述子によってカプセル化される。
上述したように、初期化セグメントファイルは、他のメディアセグメントファイル内にカプセル化されているタイムドメディアデータビットストリームを定義するのに必要であるすべてのメタデータを送信するのに使用される。初期化セグメントファイルは、ファイルタイプボックス「ftyp」および動画ボックス「moov」を含む。ファイルタイプボックスは、いずれのISO BMFF仕様にセグメントファイルが適合するかを識別し、その仕様のバージョン番号を示すことが好ましい。動画ボックス「moov」は、メディアセグメントファイルに記憶されている表現を記述するすべてのメタデータ、特に、その表現内で利用可能なすべてのトラックを提供する。
動画ボックスは、トラック(「trak」ボックス)の各々の定義を含む。
各トラックボックスは、少なくともトラックヘッダボックス「tkhd」およびトラックメディアボックス「mdia」を含む。トラックが他のトラックからのデータに従属する場合、トラック基準ボックス「tref」も存在する。
上述したように、タイムドメディアデータビットストリームをカプセル化するのに使用されるISO BMFF仕様に応じて、他のボックスが必須または任意選択である場合があることが留意されるべきである。しかしながら、本発明の実施形態は、これらのボックスが適用可能であることには依拠しないため、それらはここでは提示しない。
図6を参照して説明した実施形態によれば、全ビデオ中のタイルの位置、タイルのサイズ、および、いかなるアーティファクトもなしにタイルトラックを復号することができるという指示のシグナリングは、トラックヘッダボックス「tkhd」(図示せず)およびメディア情報ボックス「mdia」(図示せず)のボックスを使用して、各トラック定義において、「moov」ボックス(611)内でカプセル化されるHEVCビットストリーム全体に対して一度行われる。
ビデオシーケンスに沿ったタイル化構成の変動に対処するように適合されている特定の実施形態によれば、タイルの伝達は、ISO BMFF規格からのサンプルグループ化メカニズムを使用して、サンプルレベルで行われる。
そのようなサンプルグループ化メカニズムは、トラック内のサンプルの区切りを表現するのに使用される。それらは、2つのボックス、すなわち、サンプルのサンプルグループへの割り当てを記述するSampleToGroupボックス(「sbgp」)と、特定のサンプルグループ内のサンプルの共通の特性を記述するSampleGroupDescriptionボックス(「sgpd」)とを使用することに依拠する。特定のタイプのサンプルグループ化は、タイプフィールド(「grouping_type」)を介して1つのSampleToGroupボックスと1つのSampleGroupDescriptionボックスとを組み合わせることによって定義される。種々のグループ化基準に基づいて、複数のグループ化インスタンス(すなわち、SampleToGroupボックスとSampleGroupDescriptionボックスとの組み合わせ)が存在する可能性がある。
特定の実施形態によれば、サンプルのタイル化に関係付けられるグループ化基準が定義される。「tile(タイル)」と呼ばれるこのgrouping_typeは、タイルの特性を記述し、標準的なVisualSampleGroupEntryから導き出される。これは、TileRegionGroupEntryとして参照することができ、以下のように定義される。
class TileRegionGroupEntry () extends VisualSampleGroupEntry (‘trif’) {
unsigned int(32) groupID;
unsigned int(2) independent;
unsigned int(6) reserved=0;
unsigned int(16) horizontal_offset;
unsigned int(16) vertical_offset;
unsigned int(16) region_width;
unsigned int(16) region_height;
この新たなタイプのグループエントリによれば、groupIDパラメータは、グループによって記述されるタイルの固有の識別子である。horizontal_offsetおよびvertical_offsetパラメータはそれぞれ、基本領域の輝度サンプルにおける、HEVCフレームの左上画素に対する、タイルによって表現される矩形領域の左上画素の水平および垂直オフセットを設定するのに使用される。region_widthおよびregion_heightパラメータはそれぞれ、HEVCフレームの輝度サンプルにおける、タイルによって表現される矩形領域の幅および高さを設定するのに使用される。独立パラメータは、タイルが、独立タイルの定義に対する参照である上述のように、同一タイルのみに属するサンプルに関係付けられる復号従属関係を含むことを指定する2ビット語である。例示を目的として、またタイル編成を記述するためのSEIメッセージの標準的な使用を参照して、tile_section_exact_match_flagとして知られるフラグを使用して、独立フラグの値を設定することができる。後者の意味は、以下のように設定することができる:独立パラメータが0に等しい場合、このタイルと同じフレームまたは先行するフレーム内の他のタイルとの間のコード化従属関係は分からない;独立パラメータが1に等しい場合、このタイルと同じフレーム内の他のタイルとの間の空間コード化従属関係はないが、このタイルと、先行するフレーム内の同じタイルIDを有するタイルとの間にはコード化従属関係がある可能性がある、および、独立パラメータが2に等しい場合、このタイルと同じフレーム内または先行するフレーム内の同じタイルIDを有する他のタイルとの間にはコード化従属関係はない;独立パラメータ値3は確保されている。
任意選択的に、タイルあたりの平均ビットレートを記述するパラメータを、帯域幅に基づく適合のためにストリーミングクライアントに提供されるように、タイル記述子において設定することができる。
ある実施形態によれば、各タイルの特性は、各タイルトラックについて、「trif」grouping_typeおよびTileRegionGroupEntryを有する1つのSampleGroupDescriptionボックス(「sgpd」)を定義することによって動画ヘッダ(「moov」ボックス)内で一度与えられる。その後、ISO BMFF規格によれば、サンプルの数は前もって分からないため、タイルトラックフラグメントの各サンプルをその特性と関連付けるために、各タイルトラックフラグメントにおいてSampleToGroupボックスが定義される。
図14aおよび図14bよりなる図14は、様々なタイル化構成を処理するように適合している、全ビデオ中のタイルの位置、タイルのサイズ、および、いかなるアーティファクトもなくサブサンプルレベルでタイルトラックを復号することができるという指示の伝達の例を示す。
図14aは、クライアントデバイス(たとえば、ビデオプレーヤ)によって実行されるステップを示し、一方で、図14bは、単一のトラックを含むファイルの例を示し、HEVCタイプのタイル化スケーラブルビデオストリームがカプセル化されている。より正確には、図14bは,タイル化記述の例を示す。
第1のステップ(ステップ1400)において、クライアントデバイスは、初期化データ、たとえば、一般的にはmoovボックスの内容である、MPEG−4規格に適合するカプセル化ビットストリームの初期化データをダウンロードするか、または、ファイルがローカルファイルである場合は初期化データを読み出す。
これらの初期化データから、クライアントデバイスは、トラックボックス、特に、サンプル情報および記述がコード化されているサンプルテーブルボックスに含まれるトラック情報を構文解析することができる(ステップ1405)。次に、ステップ1410において、クライアントデバイスは、すべての利用可能なサンプルグループ記述ボックス(たとえば、図14bにおけるサンプルグループ記述ボックス1470および1475)のリストを構築する。結果として、クライアントデバイスは、NALUMapEntry記述子(たとえば、NALUMapEntryボックス1470)から参照されるgroupIDの全リストを保持することになる。
それゆえ、サンプル記述は、クライアントデバイスが、タイル化されたスケーラブルビデオの特定の事例について、所与の分解能または品質において特定の関心領域をレンダリングするために、いずれのNAL単位をダウンロード(送信使用の場合)または抽出(ローカルファイルの場合)しなければならないかを判定することを可能にする。タイルおよび層選択は、タイル記述およびスケーラビリティ情報をレンダリングするクライアントデバイス(ステップ1415)のグラフィカルインターフェースを介して行うことができる。1つ以上のタイルおよび/またはスケーラビリティ層を選択することができる。
構文解析ステップ1410に続いて、バイト範囲のリストを、mdatボックス(たとえば、参照符号1460)内の各対応する構成(タイル、層、サンプル)に関連付けるために、任意選択のインデックス付けステップが、中間データ構造において実行されてもよいことが留意されるべきである。そのような中間データ構造を構築することによって、中間クライアントデバイスが、所与の構成(タイル、層、サンプル)のデータをより迅速にダウンロードまたは抽出することが可能になる。この任意選択の構文解析ステップは、圧縮ビデオデータがカプセル化されているときはサーバ側で行うこともできる。これはその後、タイルまたは特定の層をダウンロードするためのバイト範囲に関して通知するために、また、サーバが、所与の(タイル、層、サンプル)構成をより迅速に抽出するために使用され得る。
次に、クライアントデバイスによってデータがダウンロードまたは読み出しされ(ステップ1420)、抽出または受信されたデータ(mdatボックス1460からのサンプル)が表示のためにビデオ復号器に提供される(ステップ1425)。
図14bに示すように、タイル化記述1450は、動画ボックス「moov」1455および「mdat」データボックス1460を含む。ボックス1455は、種々のサンプルグループを記述するSampleToGroupボックス1465を含むトラックあたり1つのSampleTableボックスと、各サンプルのNAL単位とタイルとの間のマッピングを記述するサンプルグループ記述ボックス1470と、タイル記述を含むサンプルグループ記述ボックス1475とを含む。サンプル対グループボックス1465は、グループエントリNALUMapEntry記述子の「nalm」グループ化タイプを示す。
図15aおよび図15bよりなる図15は、効率的なデータアドレス指定のための、複数トラックにおけるタイルのカプセル化の例を示す。
図15aは、タイル構成の例を示す。例示を目的として、これは、4つのタイル(タイル1〜タイル4)を含み、各タイルのサイズは、310ピクセル幅および256ピクセル高さである。
図15bに示すように、各タイルはそれ自体のトラック内にカプセル化され、結果として、5つのトラック、すなわち、各タイルをカプセル化するための、1501、1502、1503、および1504として参照される4つのタイルトラックならびにすべてのタイルトラックに共通の1つのパラメータセットトラック1510としてビデオがカプセル化されることになる。
HEVCタイルトラックは、それに対して基本HEVC層からの「dond」(復号順序従属関係)トラック参照またはHEVC層への「sbas」参照のいずれかがあるビデオトラックである。
各タイルトラック(1501、1502、1503、および1504)の記述は、TileRegionGroupEntryボックス1506のようなTileRegionGroupEntryボックス(「trif」参照によって識別される)に基づく。
ここで「trif」ボックスは、トラックのすべてのサンプルが同じタイル記述を有することを示すために、デフォルトのサンプルグループ化メカニズム(属性def_sample_descr_index=1を有する)を使用する。たとえば、タイル1に対応するNAL単位1521は、TileRegionGroupEntryボックス1506内のトラック1(1501として参照される)において記述されている。
ここで、所与のトラック内のすべてのサンプルがこのトラックによって記述されるタイルにマッピングするため、NALUMapEntry記述子は必要ない。参照符号1521および1522はそれぞれ、時間1から時間Sまで(トラックフラグメントの場合のメディアセグメントまたはメディアファイルの継続時間)のタイル1およびタイル4のデータを含むデータチャンクを示す。
実際には、トラックサンプルは、この実施形態によれはタイルサンプルであるため、一般的なビデオサンプルではなく、タイルトラック内に記憶されているサンプルはISO/IEC 23008−2(HEVC)において定義されているような、1つ以上のタイルのスライスの完全なセットである。タイルトラック内に記憶されているHEVCサンプルは、サンプル内に含まれるコード化スライスが瞬時復号リフレッシュ(IDR)スライス、クリーンランダムアクセス(CRA)スライス、またはブロークンリンクアクセス(BLA)スライスであることをサンプル内のVCL NAL単位が示す場合、syncサンプルとして考えられる。そのため、それらは一般的なサンプルと同じサイズを有せず、図15aの例によれば、一般的なHEVCサンプルは、640×512ピクセルのサイズを有し、一方、ここでは、各タイルトラック内に記憶されているHEVCサンプルは、320×256ピクセルのサイズを有する。構文解析時間における曖昧さを回避するために、タイルサンプルは新たなタイプのVisualSampleEntry記述子、すなわち、トラック1に割り当てられているHEVCTileSampleEntry記述子1505(4文字コード「hvt1」を用いて示されている)のような、HEVCTileSampleEntry記述子を用いてシグナリングされる。
TileRegionGroupEntryについて、独立トラックにおける記述であるTileRegionGroupEntryも使用され得ることが留意されるべきである。この事例において、サンプルのサイズは、タイルセットの境界ボックスのサイズになる。
サイズ情報に加えて、サンプルを記述するための任意の関連情報が、任意選択のextra_boxesとしてこのHEVCTileSampleEntry内に置かれ得る。
正式には、HEVCビデオトラックのサンプルエントリは、各トラックヘッダのサンプル記述ボックス内で宣言されているHEVCSampleEntryである。ここで、同じビデオストリームを表現する複数のトラックが使用されているため、各タイルトラックは、トラック内のサンプルは完全なビデオストリームの下位部分の実際のサンプルである指示を含み、これらのサンプルがHEVCTileSampleEntry(各トラックのサンプル記述ボックス「stsd」内の各「hvt1」ボックス)であることが示される。
サンプル記述タイプ「hvt1」について、タイルトラック内のサンプルまたはサンプル記述ボックスのいずれもPS、SPSまたはPPS NAL単位を含むべきではなく、これらのNAL単位はサンプル内、もしくは、スケーラビリティの場合は基本層(トラック参照によって識別される)を含むトラックのサンプル記述ボックス内、または、図15bにおける専用トラック1510のような専用トラック内にあるべきである。
通常のHEVCサンプルについて定義されているサブサンプルおよびサンプルグループ化は、HEVCタイルサンプルについて同じ定義を有する。パラメータセットトラック1510とタイルトラックとの間の従属関係は、1511として参照される復号順序従属関係「dond」によって記述される。「dond」トラック参照は、タイル順序(ここでは1、2、3、および4)を得るためにスライスヘッダを構文解析することなく元のビットストリームを再構築するのに使用することができる、順序情報を提供するため、これを使用することが推奨される。
HEVCビデオのタイルが異なるトラック内に記憶されているとき、基本層内にサンプルが存在しない事例が起こり得る。適合するHEVCビットストリームを形成するためにタイルサンプルがどのように再構築されるか、および、再構築されるか否かは、実施態様に委ねられる。
当然ながら、ローカルなおよび特定の要件を満たすために、当業者は、上述した解決策に多くの修正および変更を適用することができるが、これらのすべてが添付の特許請求の範囲によって規定されているような本発明の保護範囲内に含まれる。

Claims (21)

  1. それぞれが複数のタイル領域を有する1以上のサンプルを含むメディアデータに基づいてメディアファイルを生成する生成方法であって、
    1つのサンプルに対応する複数のタイル領域のうちの1以上のタイル領域に対応するメディアデータを有するトラックを生成するトラック生成工程と、
    前記トラック生成工程により生成されるトラックを含むメディアファイルを生成するファイル生成工程であって、前記トラック生成工程により生成されるトラックが有するメディアデータのメタデータを記述するためのサンプル記述ボックスには、前記トラックがタイルトラックであることを示す情報が記述され、且つ、前記サンプル記述ボックスには、前記トラックが有するメディアデータのデコードのためにデコーダにより参照されるべきSPS(シーケンスパラメータセット)が記述されず、且つ、前記SPSが、複数のタイルトラックに関するパラメータを少なくとも記述する共通トラックのトラックボックスに記述されたメディアファイルを生成するファイル生成工程とを有することを特徴とする生成方法。
  2. それぞれが複数のタイル領域を有する1以上の画像を含むビデオデータに基づいてメディアファイルを生成する生成方法であって、
    1つの画像内の複数のタイル領域のうちの1以上のタイル領域に対応するビデオデータを有するトラックを生成するトラック生成工程と、
    前記トラック生成工程により生成されるトラックを含むメディアファイルを生成するファイル生成工程であって、前記トラック生成工程により生成されるトラックが有するビデオデータのメタデータを記述するためのサンプル記述ボックスには、前記トラックがタイルトラックであることを示す情報が記述され、且つ、前記サンプル記述ボックスには、前記トラックが有するビデオデータのデコードのためにデコーダにより参照されるべきSPS(シーケンスパラメータセット)が記述されず、且つ、前記SPSが、複数のタイルトラックに関するパラメータを少なくとも記述する共通トラックのトラックボックスに記述されたメディアファイルを生成するファイル生成工程とを有することを特徴とする生成方法。
  3. それぞれが複数のタイル領域を有する1以上のサンプルを含むメディアデータに基づいてメディアファイルを生成する生成方法であって、
    1つのサンプルに対応する複数のタイル領域のうちの1以上のタイル領域に対応するメディアデータを有するトラックを生成するトラック生成工程と、
    前記トラック生成工程により生成されるトラックを含むメディアファイルを生成するファイル生成工程であって、前記トラック生成工程により生成されるトラックが有するメディアデータのメタデータを記述するためのサンプル記述ボックスには、前記トラックがタイルトラックであることを示す情報が記述され、且つ、前記サンプル記述ボックスには、前記トラックが有するメディアデータのデコードのためにデコーダにより参照されるべきVPS(ビデオパラメータセット)が記述されず、且つ、前記VPSが、複数のタイルトラックに関するパラメータを少なくとも記述する共通トラックのトラックボックスに記述されたメディアファイルを生成するファイル生成工程とを有することを特徴とする生成方法。
  4. それぞれが複数のタイル領域を有する1以上の画像を含むビデオデータに基づいてメディアファイルを生成する生成方法であって、
    1つの画像内の複数のタイル領域のうちの1以上のタイル領域に対応するビデオデータを有するトラックを生成するトラック生成工程と、
    前記トラック生成工程により生成されるトラックを含むメディアファイルを生成するファイル生成工程であって、前記トラック生成工程により生成されるトラックが有するビデオデータのメタデータを記述するためのサンプル記述ボックスには、前記トラックがタイルトラックであることを示す情報が記述され、且つ、前記サンプル記述ボックスには、前記トラックが有するビデオデータのデコードのためにデコーダにより参照されるべきVPS(ビデオパラメータセット)が記述されず、且つ、前記VPSが、複数のタイルトラックに関するパラメータを少なくとも記述する共通トラックのトラックボックスに記述されたメディアファイルを生成するファイル生成工程とを有することを特徴とする生成方法。
  5. それぞれが複数のタイル領域を有する1以上のサンプルを含むメディアデータに基づいてメディアファイルを生成する生成方法であって、
    1つのサンプルに対応する複数のタイル領域のうちの1以上のタイル領域に対応するメディアデータを有するトラックを生成するトラック生成工程と、
    前記トラック生成工程により生成されるトラックを含むメディアファイルを生成するファイル生成工程であって、前記トラック生成工程により生成されるトラックが有するメディアデータのメタデータを記述するためのサンプル記述ボックスには、前記トラックがタイルトラックであることを示す情報が記述され、且つ、前記サンプル記述ボックスには、前記トラックが有するメディアデータのデコードのためにデコーダにより参照されるべきPPS(ピクチャパラメータセット)が記述されず、且つ、前記PPSが、複数のタイルトラックに関するパラメータを少なくとも記述する共通トラックのトラックボックスに記述されたメディアファイルを生成するファイル生成工程とを有することを特徴とする生成方法。
  6. それぞれが複数のタイル領域を有する1以上の画像を含むビデオデータに基づいてメディアファイルを生成する生成方法であって、
    1つの画像内の複数のタイル領域のうちの1以上のタイル領域に対応するビデオデータを有するトラックを生成するトラック生成工程と、
    前記トラック生成工程により生成されるトラックを含むメディアファイルを生成するファイル生成工程であって、前記トラック生成工程により生成されるトラックが有するビデオデータのメタデータを記述するためのサンプル記述ボックスには、前記トラックがタイルトラックであることを示す情報が記述され、且つ、前記サンプル記述ボックスには、前記トラックが有するビデオデータのデコードのためにデコーダにより参照されるべきPPS(ピクチャパラメータセット)が記述されず、且つ、前記PPSが、複数のタイルトラックに関するパラメータを少なくとも記述する共通トラックのトラックボックスに記述されたメディアファイルを生成するファイル生成工程とを有することを特徴とする生成方法。
  7. 前記複数のタイル領域のそれぞれは、HEVC(High Efficiency Video Coding)に基づいて符号化されることを特徴とする請求項1乃至6のうち、何れか1項に記載の生成方法。
  8. 前記サンプルは画像であり、前記メディアデータはビデオデータであることを特徴とする請求項1に記載の生成方法。
  9. 前記トラックがタイルトラックであることを示す前記情報は、HEVCTileSampleEntry識別子を用いて表されることを特徴とする請求項1乃至のうち、何れか1項に記載の生成方法。
  10. 前記トラックがタイルトラックであることを示す前記情報は、hvt1からなる4文字コードによって表されることを特徴とする請求項1乃至のうち、何れか1項に記載の生成方法。
  11. それぞれが複数のタイル領域を有する1以上のサンプルを含むメディアデータに基づいてメディアファイルを生成する生成装置であって、
    1つのサンプルに対応する複数のタイル領域のうちの1以上のタイル領域に対応するメディアデータを有するトラックを生成するトラック生成手段と、
    前記トラック生成手段により生成されるトラックを含むメディアファイルを生成するファイル生成手段であって、前記トラック生成手段により生成されるトラックが有するメディアデータのメタデータを記述するためのサンプル記述ボックスには、前記トラックがタイルトラックであることを示す情報が記述され、且つ、前記サンプル記述ボックスには、前記トラックが有するメディアデータのデコードのためにデコーダにより参照されるべきSPS(シーケンスパラメータセット)が記述されず、且つ、前記SPSが、複数のタイルトラックに関するパラメータを少なくとも記述する共通トラックのトラックボックスに記述されたメディアファイルを生成するファイル生成手段とを有することを特徴とする生成装置。
  12. それぞれが複数のタイル領域を有する1以上の画像を含むビデオデータに基づいてメディアファイルを生成する生成装置であって、
    1つの画像内の複数のタイル領域のうちの1以上のタイル領域に対応するビデオデータを有するトラックを生成するトラック生成手段と、
    前記トラック生成手段により生成されるトラックを含むメディアファイルを生成するファイル生成手段であって、前記トラック生成手段により生成されるトラックが有するビデオデータのメタデータを記述するためのサンプル記述ボックスには、前記トラックがタイルトラックであることを示す情報が記述され、且つ、前記サンプル記述ボックスには、前記トラックが有するビデオデータのデコードのためにデコーダにより参照されるべきSPS(シーケンスパラメータセット)が記述されず、且つ、前記SPSが、複数のタイルトラックに関するパラメータを少なくとも記述する共通トラックのトラックボックスに記述されたメディアファイルを生成するファイル生成手段とを有することを特徴とする生成装置。
  13. それぞれが複数のタイル領域を有する1以上のサンプルを含むメディアデータに基づいてメディアファイルを生成する生成装置であって、
    1つのサンプルに対応する複数のタイル領域のうちの1以上のタイル領域に対応するメディアデータを有するトラックを生成するトラック生成手段と、
    前記トラック生成手段により生成されるトラックを含むメディアファイルを生成するファイル生成手段であって、前記トラック生成手段により生成されるトラックが有するメディアデータのメタデータを記述するためのサンプル記述ボックスには、前記トラックがタイルトラックであることを示す情報が記述され、且つ、前記サンプル記述ボックスには、前記トラックが有するメディアデータのデコードのためにデコーダにより参照されるべきVPS(ビデオパラメータセット)が記述されず、且つ、前記VPSが、複数のタイルトラックに関するパラメータを少なくとも記述する共通トラックのトラックボックスに記述されたメディアファイルを生成するファイル生成手段とを有することを特徴とする生成装置。
  14. それぞれが複数のタイル領域を有する1以上の画像を含むビデオデータに基づいてメディアファイルを生成する生成装置であって、
    1つの画像内の複数のタイル領域のうちの1以上のタイル領域に対応するビデオデータを有するトラックを生成するトラック生成手段と、
    前記トラック生成手段により生成されるトラックを含むメディアファイルを生成するファイル生成手段であって、前記トラック生成手段により生成されるトラックが有するビデオデータのメタデータを記述するためのサンプル記述ボックスには、前記トラックがタイルトラックであることを示す情報が記述され、且つ、前記サンプル記述ボックスには、前記トラックが有するビデオデータのデコードのためにデコーダにより参照されるべきVPS(ビデオパラメータセット)が記述されず、且つ、前記VPSが、複数のタイルトラックに関するパラメータを少なくとも記述する共通トラックのトラックボックスに記述されたメディアファイルを生成するファイル生成工程とを有することを特徴とする生成装置。
  15. それぞれが複数のタイル領域を有する1以上のサンプルを含むメディアデータに基づいてメディアファイルを生成する生成装置であって、
    1つのサンプルに対応する複数のタイル領域のうちの1以上のタイル領域に対応するメディアデータを有するトラックを生成するトラック生成手段と、
    前記トラック生成手段により生成されるトラックを含むメディアファイルを生成するファイル生成手段であって、前記トラック生成手段により生成されるトラックが有するメディアデータのメタデータを記述するためのサンプル記述ボックスには、前記トラックがタイルトラックであることを示す情報が記述され、且つ、前記サンプル記述ボックスには、前記トラックが有するメディアデータのデコードのためにデコーダにより参照されるべきPPS(ピクチャパラメータセット)が記述されず、且つ、前記PPSが、複数のタイルトラックに関するパラメータを少なくとも記述する共通トラックのトラックボックスに記述されたメディアファイルを生成するファイル生成手段とを有することを特徴とする生成装置。
  16. それぞれが複数のタイル領域を有する1以上の画像を含むビデオデータに基づいてメディアファイルを生成する生成装置であって、
    1つの画像内の複数のタイル領域のうちの1以上のタイル領域に対応するビデオデータを有するトラックを生成するトラック生成手段と、
    前記トラック生成手段により生成されるトラックを含むメディアファイルを生成するファイル生成手段であって、前記トラック生成手段により生成されるトラックが有するビデオデータのメタデータを記述するためのサンプル記述ボックスには、前記トラックがタイルトラックであることを示す情報が記述され、且つ、前記サンプル記述ボックスには、前記トラックが有するビデオデータのデコードのためにデコーダにより参照されるべきPPS(ピクチャパラメータセット)が記述されず、且つ、前記PPSが、複数のタイルトラックに関するパラメータを少なくとも記述する共通トラックのトラックボックスに記述されたメディアファイルを生成するファイル生成手段とを有することを特徴とする生成装置。
  17. 前記複数のタイル領域のそれぞれは、HEVC(High Efficiency Video Coding)に基づいて符号化されることを特徴とする請求項11乃至16のうち、何れか1項に記載の生成装置。
  18. 前記サンプルは画像であり、前記メディアデータはビデオデータであることを特徴とする請求項11に記載の生成装置。
  19. 前記トラックがタイルトラックであることを示す前記情報は、HEVCTileSampleEntry識別子を用いて表されることを特徴とする請求項11乃至18のうち、何れか1項に記載の生成装置。
  20. 前記トラックがタイルトラックであることを示す前記情報は、hvt1からなる4文字コードによって表されることを特徴とする請求項11乃至19のうち、何れか1項に記載の生成装置。
  21. コンピュータを請求項11乃至20のうち、何れか1項に記載の生成装置の各手段として動作させるためのプログラム。
JP2016523257A 2013-10-22 2014-10-22 ファイルの生成方法、ファイルの生成装置、及び、プログラム。 Active JP6556126B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1318685.3A GB2519746B (en) 2013-10-22 2013-10-22 Method, device and computer program for encapsulating scalable partitioned timed media data
GB1318685.3 2013-10-22
PCT/EP2014/072659 WO2015059194A1 (en) 2013-10-22 2014-10-22 Method, device, and computer program for encapsulating scalable partitioned timed media data

Publications (3)

Publication Number Publication Date
JP2016540410A JP2016540410A (ja) 2016-12-22
JP2016540410A5 JP2016540410A5 (ja) 2017-11-30
JP6556126B2 true JP6556126B2 (ja) 2019-08-07

Family

ID=49727183

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016523257A Active JP6556126B2 (ja) 2013-10-22 2014-10-22 ファイルの生成方法、ファイルの生成装置、及び、プログラム。

Country Status (8)

Country Link
US (3) US10075743B2 (ja)
EP (2) EP3595320A1 (ja)
JP (1) JP6556126B2 (ja)
KR (2) KR101954041B1 (ja)
CN (2) CN105684452B (ja)
GB (2) GB2542282B (ja)
RU (2) RU2635549C1 (ja)
WO (1) WO2015059194A1 (ja)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105052167B (zh) 2013-01-18 2018-10-09 佳能株式会社 用于封装分区定时媒体数据的方法、装置和计算机可读存储介质
GB2546027B (en) * 2013-04-09 2017-12-20 Canon Kk Method, device, and computer program for encapsulating partioned timed media data
KR102084104B1 (ko) 2013-07-25 2020-03-03 콘비다 와이어리스, 엘엘씨 종단간 m2m 서비스 계층 세션
EP3028472B1 (en) 2013-07-29 2020-02-26 Koninklijke KPN N.V. Providing tile video streams to a client
GB2542282B (en) * 2013-10-22 2018-08-01 Canon Kk Method, device, and computer program for encapsulating partitioned timed media data in a server
GB2524726B (en) * 2014-03-25 2018-05-23 Canon Kk Image data encapsulation with tile support
US10397666B2 (en) 2014-06-27 2019-08-27 Koninklijke Kpn N.V. Determining a region of interest on the basis of a HEVC-tiled video stream
US10694192B2 (en) 2014-06-27 2020-06-23 Koninklijke Kpn N.V. HEVC-tiled video streaming
GB2538998A (en) * 2015-06-03 2016-12-07 Nokia Technologies Oy A method, an apparatus, a computer program for video coding
GB2538997A (en) 2015-06-03 2016-12-07 Nokia Technologies Oy A method, an apparatus, a computer program for video coding
GB2539462B (en) 2015-06-16 2019-04-03 Canon Kk Obtaining media data and metadata from encapsulated bit-streams wherein operating point descriptors can be dynamically set
GB2539461B (en) * 2015-06-16 2020-01-08 Canon Kk Image data encapsulation
WO2017029400A1 (en) 2015-08-20 2017-02-23 Koninklijke Kpn N.V. Forming one or more tile streams on the basis of one or more video streams
EP3360330B1 (en) * 2015-10-08 2021-03-24 Koninklijke KPN N.V. Enhancing a region of interest in video frames of a video stream
US10034010B2 (en) 2015-10-14 2018-07-24 Qualcomm Incorporated Alignment of operation point sample group in multi-layer bitstreams file format
US20170180758A1 (en) * 2015-12-22 2017-06-22 Vallabhajosyula S. Somayazulu Tiled Wireless Display
WO2017137444A1 (en) * 2016-02-09 2017-08-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for picture/video data streams allowing efficient reducibility or efficient random access
WO2017140948A1 (en) * 2016-02-17 2017-08-24 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
FI20165114A (fi) 2016-02-17 2017-08-18 Nokia Technologies Oy Laitteisto, menetelmä ja tietokoneohjelma videokoodausta ja videokoodauksen purkua varten
EP3456058A1 (en) 2016-05-13 2019-03-20 VID SCALE, Inc. Bit depth remapping based on viewing parameters
GB2550604A (en) * 2016-05-24 2017-11-29 Canon Kk Method, device, and computer program for encapsulating and parsing timed media data
EP4336850A3 (en) 2016-07-08 2024-04-17 InterDigital Madison Patent Holdings, SAS Systems and methods for region-of-interest tone remapping
GB2554877B (en) * 2016-10-10 2021-03-31 Canon Kk Methods, devices, and computer programs for improving rendering display during streaming of timed media data
CN109891772B (zh) 2016-11-03 2022-10-04 康维达无线有限责任公司 Nr中的帧结构
EP3583780B1 (en) 2017-02-17 2023-04-05 InterDigital Madison Patent Holdings, SAS Systems and methods for selective object-of-interest zooming in streaming video
KR102628139B1 (ko) * 2017-03-07 2024-01-22 인터디지털 매디슨 페턴트 홀딩스 에스에이에스 멀티-디바이스 프리젠테이션을 위한 맞춤형 비디오 스트리밍
US11062738B2 (en) * 2017-03-23 2021-07-13 Qualcomm Incorporated Signalling of video content including sub-picture bitstreams for video coding
GB2560921B (en) * 2017-03-27 2020-04-08 Canon Kk Method and apparatus for encoding media data comprising generated content
GB2563865A (en) 2017-06-27 2019-01-02 Canon Kk Method, device, and computer program for transmitting media content
GB2567625B (en) * 2017-10-12 2020-07-15 Canon Kk Method, device, and computer program for generating timed media data
CN108984744B (zh) * 2018-07-16 2022-02-18 夸克链科技(深圳)有限公司 一种非主链区块自增长方法
WO2020068251A1 (en) 2018-09-27 2020-04-02 Convida Wireless, Llc Sub-band operations in unlicensed spectrums of new radio
CN110971906B (zh) * 2018-09-29 2021-11-30 上海交通大学 层级化的点云码流封装方法和系统
EP3843385A4 (en) * 2018-10-08 2021-09-22 Samsung Electronics Co., Ltd. METHOD AND DEVICE FOR GENERATING A MEDIA FILE WITH THREE-DIMENSIONAL VIDEO CONTENT AND METHOD AND DEVICE FOR REPLAYING THREE-DIMENSIONAL VIDEO CONTENT
KR20230093377A (ko) 2018-12-07 2023-06-27 삼성전자주식회사 타일 및 슬라이스를 이용하는 비디오 부호화 방법 및 복호화 방법, 및 타일 및 슬라이스를 이용하는 비디오 부호화 장치 및 복호화 장치
BR112021014857A2 (pt) 2019-02-01 2021-10-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador e codificador de vídeo e seus métodos, aparelho de composição de vídeo, composição de vídeo e fluxo de dados
US11317104B2 (en) * 2019-05-15 2022-04-26 Tencent America LLC Method and apparatus for video coding
CN112040302B (zh) 2019-06-03 2023-01-03 优视科技有限公司 视频缓冲方法、装置、电子设备及计算机可读存储介质
US11523185B2 (en) 2019-06-19 2022-12-06 Koninklijke Kpn N.V. Rendering video stream in sub-area of visible display area
RU2743956C1 (ru) * 2019-08-15 2021-03-01 Сцреенлифе Лимитед Способ создания вертикально ориентированного видео
CN113766271B (zh) * 2020-06-04 2022-07-12 腾讯科技(深圳)有限公司 一种沉浸媒体的数据处理方法、装置及设备
JPWO2021251141A1 (ja) * 2020-06-09 2021-12-16
GB2597642B (en) * 2020-06-16 2023-08-02 Canon Kk Method, device, and computer program for encapsulating media data into a media file
GB2602644A (en) * 2021-01-06 2022-07-13 Canon Kk Method, device, and computer program for encapsulating timed media content data in a single track of encapsulated media content data

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4012691B2 (ja) * 2001-01-17 2007-11-21 ヤマハ株式会社 波形データ処理装置及び波形データ処理方法並びに波形データ処理装置において読み取り可能な記録媒体
US7613727B2 (en) 2002-02-25 2009-11-03 Sont Corporation Method and apparatus for supporting advanced coding formats in media files
US20040267715A1 (en) * 2003-06-26 2004-12-30 Microsoft Corporation Processing TOC-less media content
US7015842B1 (en) * 2005-01-12 2006-03-21 Teranetics, Inc. High-speed sampling architectures
MX2007012564A (es) 2005-04-13 2007-11-15 Nokia Corp Codificacion, almacenamiento y senalizacion de informacion de escalabilidad.
CN102271249B (zh) 2005-09-26 2014-04-09 韩国电子通信研究院 用于可伸缩视频的感兴趣区域信息设置方法和解析方法
KR20070108433A (ko) * 2006-01-09 2007-11-12 한국전자통신연구원 청크 디스크립터를 이용한 svc 파일포맷에서의 비디오데이터 공유방법
EP2041976A4 (en) 2006-07-12 2012-06-20 Nokia Corp SIGNALING OF SCALABILITY INFORMATION FROM THE INTERESTING REGION IN MEDIA FILES
US7647229B2 (en) * 2006-10-18 2010-01-12 Nokia Corporation Time scaling of multi-channel audio signals
KR101072341B1 (ko) 2007-01-18 2011-10-11 노키아 코포레이션 Rtp 페이로드 포맷에서의 sei 메시지들의 전송
WO2008090928A1 (ja) * 2007-01-24 2008-07-31 Humming Heads Inc. 記憶媒体上のデータ変換方法、装置およびプログラム
KR101227029B1 (ko) * 2007-05-14 2013-01-28 삼성전자주식회사 방송 송신 방법 및 장치와 방송 수신 방법 및 장치
KR101530713B1 (ko) * 2008-02-05 2015-06-23 삼성전자주식회사 영상 파일을 생성하고 표시하기 위한 장치 및 방법
EP2314072B1 (en) * 2008-07-16 2014-08-27 SISVEL International S.A. Track and track-subset grouping for multi view video decoding.
US20100161716A1 (en) * 2008-12-22 2010-06-24 General Instrument Corporation Method and apparatus for streaming multiple scalable coded video content to client devices at different encoding rates
KR20110106465A (ko) * 2009-01-28 2011-09-28 노키아 코포레이션 비디오 코딩 및 디코딩을 위한 방법 및 장치
US9036705B2 (en) * 2009-03-13 2015-05-19 Telefonaktiebolaget L M Ericsson (Publ) Technique for bringing encoded data items into conformity with a scalable coding protocol
JP5591932B2 (ja) 2009-09-22 2014-09-17 クゥアルコム・インコーポレイテッド ファイルフォーマットトラック選択のためのメディアエクストラクタトラック
PL2491720T3 (pl) * 2009-10-20 2018-08-31 Telefonaktiebolaget Lm Ericsson (Publ) Zapewnienie uzupełniających informacji przetwarzania
US9075560B2 (en) * 2009-12-10 2015-07-07 Microsoft Technology Licensing, Llc Real-time compression with GPU/CPU
KR20130107266A (ko) * 2010-06-14 2013-10-01 톰슨 라이센싱 코딩된 다중 성분 비디오를 캡슐화하는 방법 및 장치
US8930562B2 (en) * 2010-07-20 2015-01-06 Qualcomm Incorporated Arranging sub-track fragments for streaming video data
US9131033B2 (en) * 2010-07-20 2015-09-08 Qualcomm Incoporated Providing sequence data sets for streaming video data
US8190677B2 (en) * 2010-07-23 2012-05-29 Seawell Networks Inc. Methods and systems for scalable video delivery
CN102404560B (zh) * 2010-09-17 2013-12-18 中兴通讯股份有限公司南京分公司 实现可伸缩视频编码业务协同传输的方法及系统
KR20120055488A (ko) * 2010-11-23 2012-05-31 삼성전자주식회사 멀티미디어 시스템에서 다계층 영상을 위한 미디어 파일 생성 방법 및 장치와 이를 이용한 미디어 파일 재생 장치
CA2829493A1 (en) * 2011-03-10 2012-09-13 Vidyo, Inc. Dependency parameter set for scalable video coding
US8489760B2 (en) * 2011-03-31 2013-07-16 Juniper Networks, Inc. Media file storage format and adaptive delivery system
CN102232298B (zh) * 2011-04-07 2013-10-09 华为技术有限公司 媒体内容的传输处理方法、装置与系统
PL3313083T3 (pl) 2011-06-08 2020-05-18 Koninklijke Kpn N.V. Dostarczanie treści segmentowanej przestrzennie
US9584819B2 (en) * 2011-10-24 2017-02-28 Qualcomm Incorporated Grouping of tiles for video coding
CN103139559B (zh) * 2011-11-30 2016-01-27 中国电信股份有限公司 多媒体信号传输方法和装置
EP3879825A3 (en) 2012-04-06 2022-07-13 Sony Group Corporation Decoding device and decoding method, and encoding device and encoding method
US9544641B2 (en) * 2012-05-10 2017-01-10 Humax Co., Ltd. Hybrid transmission method through MMT packet format extension
KR20140002447A (ko) * 2012-06-29 2014-01-08 삼성전자주식회사 멀티미디어 시스템에서 적응적 미디어 구조 송수신 방법 및 장치
CN104885456A (zh) * 2012-09-18 2015-09-02 Vid拓展公司 使用图块和图块组的感兴趣区域视频编码
US20140098851A1 (en) * 2012-10-04 2014-04-10 Qualcomm Incorporated Indication of video properties
CN105052167B (zh) * 2013-01-18 2018-10-09 佳能株式会社 用于封装分区定时媒体数据的方法、装置和计算机可读存储介质
US9749627B2 (en) * 2013-04-08 2017-08-29 Microsoft Technology Licensing, Llc Control data for motion-constrained tile set
GB2551296B (en) * 2013-04-09 2018-02-28 Canon Kk Method, device, and computer program for encapsulating partitioned timed media data
GB2546027B (en) * 2013-04-09 2017-12-20 Canon Kk Method, device, and computer program for encapsulating partioned timed media data
GB2516825B (en) * 2013-07-23 2015-11-25 Canon Kk Method, device, and computer program for encapsulating partitioned timed media data using a generic signaling for coding dependencies
GB2516826B (en) * 2013-07-23 2016-06-22 Canon Kk Method, device and computer program for encapsulating partitioned timed media data by creating tracks to be independently encapsulated in at least one media f
GB2542282B (en) * 2013-10-22 2018-08-01 Canon Kk Method, device, and computer program for encapsulating partitioned timed media data in a server

Also Published As

Publication number Publication date
CN109257624B (zh) 2021-08-17
GB2542282B (en) 2018-08-01
EP3061255B1 (en) 2019-12-11
US11128898B2 (en) 2021-09-21
KR101954041B1 (ko) 2019-03-04
JP2016540410A (ja) 2016-12-22
GB201318685D0 (en) 2013-12-04
GB2542282A8 (en) 2017-09-27
RU2635549C1 (ru) 2017-11-14
US10687094B2 (en) 2020-06-16
KR102061389B1 (ko) 2019-12-31
RU2681086C1 (ru) 2019-03-04
CN105684452B (zh) 2018-10-19
GB2542282A (en) 2017-03-15
KR20160074485A (ko) 2016-06-28
US10075743B2 (en) 2018-09-11
US20200275143A1 (en) 2020-08-27
US20180249192A1 (en) 2018-08-30
CN109257624A (zh) 2019-01-22
US20160255381A1 (en) 2016-09-01
EP3595320A1 (en) 2020-01-15
GB2519746B (en) 2016-12-14
EP3061255A1 (en) 2016-08-31
GB2519746A (en) 2015-05-06
KR20180017226A (ko) 2018-02-20
CN105684452A (zh) 2016-06-15
WO2015059194A1 (en) 2015-04-30

Similar Documents

Publication Publication Date Title
JP6556126B2 (ja) ファイルの生成方法、ファイルの生成装置、及び、プログラム。
US20220038793A1 (en) Method, device, and computer program for encapsulating partitioned timed media data
KR102037009B1 (ko) 동작 포인트 디스크립터가 동적으로 설정될 수 있는 캡슐화된 비트-스트림으로부터 미디어 데이터 및 메타데이터를 획득하는 방법, 디바이스, 및 컴퓨터 프로그램
KR102521495B1 (ko) 인터-계층 종속성을 인코딩하기 위한 방법, 디바이스, 및 컴퓨터 프로그램
CN105556981B (zh) 使用针对编码依赖性的通用信号通知来封装分区定时媒体数据的方法、装置和计算机程序
CN109982154B (zh) 用于再现空间区域的图像的方法、设备及存储介质
JP2017525249A (ja) Hevc階層化メディアデータをカプセル化する方法、装置およびコンピュータプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171019

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171019

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181002

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190319

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190709

R151 Written notification of patent or utility model registration

Ref document number: 6556126

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151