JP2022522575A - カプセル化されたメディアコンテンツの利用可能な部分をシグナリングするための方法、装置、及びコンピュータプログラム - Google Patents

カプセル化されたメディアコンテンツの利用可能な部分をシグナリングするための方法、装置、及びコンピュータプログラム Download PDF

Info

Publication number
JP2022522575A
JP2022522575A JP2021531284A JP2021531284A JP2022522575A JP 2022522575 A JP2022522575 A JP 2022522575A JP 2021531284 A JP2021531284 A JP 2021531284A JP 2021531284 A JP2021531284 A JP 2021531284A JP 2022522575 A JP2022522575 A JP 2022522575A
Authority
JP
Japan
Prior art keywords
media
preselection
data
initialization
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021531284A
Other languages
English (en)
Other versions
JP7241874B2 (ja
Inventor
フランク ドゥヌアル,
フレデリック マゼ,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2022522575A publication Critical patent/JP2022522575A/ja
Application granted granted Critical
Publication of JP7241874B2 publication Critical patent/JP7241874B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/23439Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2355Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages
    • H04N21/2358Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages for generating different versions, e.g. for different recipient devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26258Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for generating a list of items to be played back in a given order, e.g. playlist, or scheduling item distribution according to such list
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • H04N21/4355Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream involving reformatting operations of additional data, e.g. HTML pages on a television screen
    • H04N21/4358Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream involving reformatting operations of additional data, e.g. HTML pages on a television screen for generating different versions, e.g. for different peripheral devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format

Abstract

実施形態によれば、本発明はサーバによってメディアコンテンツを提供する方法を提供し、メディアコンテンツはメディアコンポーネントを含み、それぞれのメディアコンポーネントは初期化データ及びメディアデータを含み、方法は、サーバによって実行され、複数のメディアコンポーネントの事前選択について、複数のメディアコンポーネントのどの初期化データが事前選択のメディアコンポーネントのメディアデータを処理するためにクライアントによって使用されるべきかの指示を取得することと、メディアプレゼンテーション記述における事前選択を記述することとを含み、事前選択の記述は複数のメディアコンポーネントのそれぞれのメディアコンポーネントへの参照及び得られた指示を含む。

Description

本発明はカプセル化されたメディアコンテンツの利用可能な部分をシグナリングし、カプセル化されたメディアコンテンツの部分の伝送を最適化することができるようにするための方法、装置、及びコンピュータプログラムに関する。
本発明は例えばMPEG標準化団体によって定義されたISOベースメディアファイルフォーマットに従った、メディアコンテンツのカプセル化、解析、及びストリーミングに関するものであり、メディアコンテンツのグループの相互交換、管理、編集、及び提示を容易にし、適応型httpストリーミングプロトコルを用いてインターネットのようなIPネットワーク上でのその配信を改善する柔軟で拡張可能なフォーマットを提供する。
国際標準化機構ベースメディアファイルフォーマット(ISO BMFF、ISO/IEC14496-12)は、ローカル格納又はネットワークを介した伝送若しくは別のビットストリーム配信メカニズムを介した伝送のための、エンコードされ時間を決められたメディアデータビットストリームを記述する周知の柔軟かつ拡張可能なフォーマットである。このファイルフォーマットはいくつかの拡張を有し、例えば、様々なNAL(ネットワーク抽象化レイヤ)ユニットベースのビデオエンコーディングフォーマットのためのカプセル化ツールを記述するパート15、ISO/IEC14496-15を有する。このようなエンコーディングフォーマットの例は、AVC(Advanced Video Coding)、SVC(Scalable Video Coding)、HEVC(High Efficiency Video Coding)、又はL-HEVC(Layered HEVC)である。このファイルフォーマットはオブジェクト指向である。これは、逐次的又は階層的に編成され、タイミング及び構造パラメータのような、エンコードされ時間を決められたメディアデータビットストリームの記述パラメータを定義する、ボックスと呼ばれるビルディングブロック(又はデータ構造であり、それぞれが4文字コードによって識別される)から構成される。ファイルフォーマットでは、時間にわたるプレゼンテーションの全体はムービーと呼ばれる。ムービーは、メディア又はプレゼンテーションファイルの最上位階層にあるムービーボックス(4文字コード「moov」)で記述される。このムービーボックスは、プレゼンテーションを記述する様々なボックスのセットを含む初期化情報コンテナを表す。これはトラックボックス(4文字コード「trak」)で表されるトラックへと論理的に分割されるかもしれない。各トラック(トラック識別子(track_ID)によって一意に識別される)は、プレゼンテーション(例えばビデオのフレーム)に関する、メディアデータの時間を決められたシーケンスを表す。各トラック内で、時間を決められたデータの単位はサンプルと呼ばれる。これは、ビデオ、オーディオ、又は時間を決められたメタデータのフレームであってもよい。サンプルは、暗黙のうちに順番に番号付けされる。実際のサンプルデータは、ムービーボックスと同じ階層にあるメディアデータボックス(Media Data Box、4文字コード「mdat」)と呼ばれるボックスにある。ムービーはまた、フラグメント化されてもよく、すなわち、全体のプレゼンテーションについての情報を含み、それにムービーフラグメントのリストが続くムービーボックスと、メディアデータボックスとのペアとして、時間的に編成されてもよい。ムービーフラグメント(4文字コード「moof」のボックス)内には、ムービーフラグメントごとに0個以上のトラックフラグメントのセット(4文字コード「traf」のボックス)がある。トラックフラグメントは次に、0個以上のトラックランボックス(「trun」)を含み、各トラックランボックスは、そのトラックフラグメントについてのサンプルの連続したランを文書化する。
ISOBMFFでカプセル化されたメディアデータは、HTTPでの適応ストリーミングに使用することができる。例えば、MPEG DASH(「Dynamic adaptive streaming over HTTP」の場合)及びスムースストリーミングは、メディアファイルのセグメント又はフラグメントベースの配信を可能にするHTTP適応ストリーミングプロトコルである。MPEG DASH規格(「ISO/IEC23009-1、Dynamic Adaptive Streaming over HTTP(DASH)、Part 1:Media presentation description and segment formats」参照)はメディアプレゼンテーションのコンテンツのコンパクトな記述とHTTPアドレス(例えばURL)との間のリンクを確立することを可能にする。通常、この関連付けは、マニフェストファイル又は記述ファイルと呼ばれるファイルで記述される。DASHのコンテクストでは、このマニフェストファイルはMPDファイル(メディアプレゼンテーション記述として)とも呼ばれるファイルである。クライアント装置がMPDファイルを取得すると、メディアコンテンツのエンコードされた配信可能な各バージョンの記述をクライアントが容易に判別できる。マニフェストファイルを読み取る又は解析することにより、クライアントはメディアプレゼンテーションで提案されたメディアコンテンツコンポーネントの種類を知り、関連するメディアコンテンツコンポーネントをダウンロードするためのHTTPアドレスを知る。したがって、どのメディアコンテンツコンポーネントを(例えばHTTPリクエスト経由で)ダウンロードし、及び再生する(メディアデータセグメントの受信後にデコードして再生する)のかを決定することができる。DASHは、いくつかのタイプのセグメント、主に初期化セグメント、メディアセグメント、又はインデックスセグメントを定義する。初期化セグメントは、設定情報及びメディアコンテンツを記述するメタデータを含み、典型的にはISOBMFFメディアファイルの「ftyp」ボックス及び「moov」ボックスを少なくとも含む。メディアセグメントは、メディアデータを含む。これは、例えばISOBMFFファイルの1つ以上の「moof」及び「mdat」ボックスであってもよく、又はISOBMFFファイルの「mdat」ボックスのバイト範囲であってもよい。メディアセグメントは、サブセグメントにさらに分割することができる(これはまた、1つ以上の完全な「moof及び「mdat」ボックスにも対応する)。DASHマニフェストはストリーミングクライアントがHTTP要求を介してこれらのセグメントを扱うために、セグメントURL又はセグメントに対するバイト範囲を備えるファイルに対するベースURLを提供する場合がある。
図1は、サーバからクライアントにメディアデータをストリーミングする例を示している。
図示されているように、サーバ100はカプセル化モジュール105を備え、このカプセル化モジュール105はネットワークインターフェース(図示せず)を介して通信ネットワーク110に接続されており、この通信ネットワーク110にはまたネットワークインターフェース(図示せず)を介してクライアント120のカプセル化解除モジュール115が接続されている。
サーバ100はストリーミング又は格納のために、データ、例えば、ビデオ及び/又はオーディオデータを処理する。その目的で、サーバ100は、例えば画像125のオリジナルのシーケンスを含む、データを取得又は受信し、表されていないメディアエンコーダ(例えば、ビデオエンコーダ)を使用して、画像のシーケンスをメディアデータ(すなわち、ビットストリーム)にエンコードし、カプセル化モジュール105を使用して、メディアデータを1つ以上のメディアファイル又はメディアセグメント130にカプセル化する。カプセル化モジュール105は、メディアデータをカプセル化するためのライタ又はパッケージャのうちの少なくとも1つを備える。メディアエンコーダは、受信データをエンコードするためにカプセル化モジュール105内に実装されてもよく、又はカプセル化モジュール105とは別個であってもよい。
クライアント120は、例えばメディアファイル130を処理するために、通信ネットワーク110から受信したデータを処理するために使用される。受信されたデータがカプセル化解除モジュール115(パーサとも呼ばれる)でカプセル化解除された後、メディアデータビットストリームに対応するカプセル化解除されたデータ(又は解析されたデータ)はデコードされ、例えば格納、表示又は出力され得るオーディオ及び/又はビデオデータを形成する。メディアデコーダは、カプセル化解除モジュール115内に実装されてもよく、又はカプセル化解除モジュール115とは別個であってもよい。メディアデコーダは、1つ以上のビデオビットストリームを並列にデコードするように構成してもよい。
メディアファイル130は、異なる方法でカプセル化解除モジュール115に通信されてもよいことに留意されたい。特に、クライアント120から要求を受信すると、カプセル化モジュール105はメディア記述(例えばDASH MPD)を有するメディアファイル130を生成し、それをカプセル化解除モジュール115に直接通信(又はストリーミング)することができる。
説明の目的で、メディアファイル130はメディアデータ(例えば、エンコードされたオーディオ又はビデオ)を、ISOベースメディアファイルフォーマット(ISOBMFF、ISO/IEC14496-12及びISO/IEC14496-15規格)に従うボックスへとカプセル化することができる。
図2は、クライアントによって選択されたレプレゼンテーション(Representation)についてのDASHセグメントのストリーミングの例を示す。
DASHによれば、また図示されているように、クライアントがストリーミングのためにレプレゼンテーションを選択する際に(例えば、図1のクライアント120)、初期化セグメント、例えば、イニシャライゼーションセグメント205を要求する。説明のために、メディアデータがISOベースメディアファイルフォーマット(ISO/IEC14496-12)に従ってカプセル化される場合、イニシャライゼーションセグメントは、「moov」ボックス及びそのサブボックスからなる。
イニシャライゼーションセグメントに含まれる情報項目を受信すると、クライアントは、そのメディアデコーダをセットアップする(これは図1を参照して記述したカプセル化解除モジュール115の一部であってもよい)。セットアップが完了すると、クライアントは、選択されたレプレゼンテーションに対応するデータセグメント、例えばメディアセグメント(MediaSegment)210-1及び210-2、を要求し、これらはセグメントベースでサーバによってストリーミングされる。例200によれば、メディアセグメントは、「Delta_t」に等しい時間長を有する。メディアが1つのセグメント(例えば、210-1)から別のセグメント(例えば、210-2)へスムーズに再生されるように、適切な時刻に要求を発行することはクライアント次第である。
定義により、イニシャライゼーションセグメント205の連結200、及びそれに続くメディアセグメント201-1及び210-2のような1つ以上のメディアセグメントは、適合する(又は対応する)ビットストリームをもたらす。
メディアデータを要求し送信するためのこれらのファイルフォーマット及びこれらの方法が効率的であることが証明されている一方で、クライアントに送信されるべきデータの選択を改善し、要求される帯域幅を減らし、クライアントによるデータのカプセル化解除及びデコードを容易にするために、送信されるデータのシグナリングを改善することが絶えず必要とされている。
本発明は、前述の懸念の1つ以上に対処するために考案された。
本発明の第1の態様によれば、サーバによってメディアコンテンツを提供する方法が提供され、メディアコンテンツはメディアコンポーネントを含み、それぞれのメディアコンポーネントは初期化データ及びメディアデータを含み、方法は、サーバによって実行され、
複数のメディアコンポーネントの事前選択について、複数のメディアコンポーネントのどの初期化データが事前選択のメディアコンポーネントのメディアデータを処理するためにクライアントによって使用されるべきかの指示を取得することと、
メディアプレゼンテーション記述における事前選択を記述することと、を含み、事前選択の記述は、複数のメディアコンポーネントのそれぞれのメディアコンポーネントへの参照と、取得した指示とを含む。
したがって、本発明の方法は、サーバからクライアントに送信されるデータをクライアントの視点で適切に選択することができ、一方、クライアントによるデータのカプセル化解除及びデコードを容易にすることができる。さらに、本発明の方法は、ストリーミングクライアントとの相互運用性及びストリーミングクライアント間の一貫した体験を保証することを可能にする。メディアパッケージャはストリーミングマニフェストにおいて宣言された事前選択について、メディアコンポーネントのセット全体が単一の初期化セグメントにつながるか、又は初期化セグメントのセット、例えばメディアコンポーネントごとに1つ、につながるかをシグナリングする。この追加のシグナリングはDASH MPDにおいて使用可能であり、ストリーミングクライアントがそのデコーダを適切にセットアップできるようにするために何を最初にフェッチするのかを知ることを可能にする。
実施形態によれば、取得された指示は、複数のメディアコンポーネントのうちの単一のメディアコンポーネントに属する初期化データが事前選択のメディアコンポーネントのメディアデータを処理するために使用されるべきであることをシグナリングする。
実施形態によれば、初期化データが使用されるべきである単一のメディアコンポーネントへの参照が予め決定されている。
実施形態によれば、取得された指示は、事前選択によって参照されるメディアコンポーネントのメディアデータが、事前選択によって参照される他のメディアコンポーネントの他のメディアデータとは独立して処理されることができないことをさらにシグナリングする。
実施形態によれば、取得された指示は、複数のメディアコンポーネントのうちのいくつかのメディアコンポーネントからの初期化データが、事前選択のメディアコンポーネントのメディアデータを処理するために使用されるべきであることをシグナリングする。
実施形態によれば、この方法は、クライアントへの流布のためにストリーミングサーバ上でメディアプレゼンテーション記述を公開することをさらに含む。
本発明の第2の態様によれば、クライアントによってメディアコンテンツを処理する方法が提供され、メディアコンテンツはメディアコンポーネントを含み、それぞれのメディアコンポーネントは初期化データ及びメディアデータを含み、この方法は、クライアントによって実行され、
メディアプレゼンテーション記述を取得することであって、メディアプレゼンテーション記述は複数のメディアコンポーネントの事前選択の記述を含み、事前選択の記述は、複数のメディアコンポーネントのうちのメディアコンポーネントへの参照と、事前選択のメディアコンポーネントのメディアデータを処理するために、複数のメディアコンポーネントのどの初期化データがクライアントによって使用されるべきかの指示とを含む、取得することと、
複数のメディアコンポーネントのどの初期化データが使用されるべきかの指示を取得するために取得されたメディアプレゼンテーション記述を解析することと、を含む。
本発明の第2の態様は、上記の第1の態様と同様の利点を有する。
実施形態によれば、この方法は、使用されるべき複数のメディアコンポーネントの初期化データを要求することと、使用されるべき複数のメディアコンポーネントの初期化データの関数としてクライアントの少なくとも1つのデコーダを初期化することと、をさらに含む。
実施形態によれば、取得された指示は、複数のメディアコンポーネントのうちの単一のメディアコンポーネントに属する初期化データが、事前選択のメディアコンポーネントのメディアデータを処理するために使用されるべきであることをシグナリングする。
実施形態によれば、初期化データが使用されるべき単一のメディアコンポーネントは、複数のメディアコンポーネントのメディアコンポーネントに対応する適応セットのうちの主適応セットの表現に関連付けられる。
実施形態によれば、取得された指示は、事前選択によって参照されるメディアコンポーネントのメディアデータが、事前選択によって参照される他のメディアコンポーネントの他のメディアデータと独立して処理することができないことをさらにシグナリングする。
実施形態によれば、取得された指示は、複数のメディアコンポーネントのうちのいくつかのメディアコンポーネントからの初期化データが、事前選択のメディアコンポーネントのメディアデータを処理するために使用されるべきであることをシグナリングする。
実施形態によれば、メディアコンテンツはパーティション化されたメディアデータに対応する。
実施形態によれば、メディアプレゼンテーション記述はMPEG DASH規格に適合する。
実施形態によれば、各メディアコンポーネントは適応セットに属する表現に関連付けられ、複数のメディアコンポーネントのうちの各メディアコンポーネントは、複数のメディアコンポーネントの他のメディアコンポーネントに関連付けられている表現を備える適応セットとは異なる適応セットに属する表現に、関連付けられる。
本発明の第3の態様によれば、カプセル化されたメディアデータを提供又は処理するための装置が提供され、この装置は、上述の方法のステップのそれぞれを実行するように構成された処理部を備える。
本発明の第3の態様は、上記第1の態様と同様の利点を有する。
本発明の第4の態様によれば、メディアコンテンツのための情報データセットを搬送する信号が提供され、情報データセットはメディアプレゼンテーション記述を含み、メディアコンテンツはメディアコンポーネントを含み、各メディアコンポーネントは初期化データ及びメディアデータを含み、メディアプレゼンテーション記述はメディアコンテンツの複数のメディアコンポーネントの事前選択の記述と、事前選択のメディアコンポーネントのメディアデータを処理するために複数のメディアコンポーネントのどの初期化データがクライアントによって使用されるべきかの指示と、を少なくとも含む。
本発明の第4の態様は、上記第1の態様と同様の利点を有する。
本発明の第5の態様によれば、メディアコンテンツのための情報データセットを搬送する信号を格納するメディア格納装置が提供され、情報データセットはメディアプレゼンテーション記述を含み、メディアコンテンツはメディアコンポーネントを含み、各メディアコンポーネントは初期化データ及びメディアデータを含み、メディアプレゼンテーション記述は、メディアコンテンツの複数のメディアコンポーネントの事前選択の記述と、事前選択のメディアコンポーネントのメディアデータを処理するために複数のメディアコンポーネントのうちのどの初期化データがクライアントによって使用されるべきかの指示と、を少なくとも含む。
本発明の第5の態様は、上記第1の態様と同様の利点を有する。
本発明の実施形態に係る方法の少なくとも一部は、コンピュータによって実装されてもよい。したがって、本発明は、完全にハードウェアの実施形態、全体的にソフトウェアの実施形態(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)、又はソフトウェア及びハードウェアの態様を組み合わせた実施形態の形態をとることができ、これらはすべて本明細書において一般に「回路」、「モジュール」、又は「システム」と呼ばれることがある。さらに、本発明は、媒体に実装されたコンピュータ使用可能プログラムコードを有する、任意の有形の表現媒体に実装されたコンピュータプログラム製品の形態をとることができる。
本発明をソフトウェアで実装することができるため、本発明は、プログラム可能機器に提供するための、任意の適したキャリア媒体上のコンピュータ可読コードとして実装することができる。有形キャリア媒体は、フロッピーディスク、CD-ROM、ハードディスクドライブ、磁気テープ装置又はソリッドステートメモリ装置などの記憶媒体を含むことができる。一時的搬送媒体は、電気信号、電子信号、光信号、音響信号、磁気信号、又は例えばマイクロ波又はRF信号のような電磁信号を含むことができる。
本発明の実施形態は、単なる例示として、以下の図面を参照して記述される。
サーバからクライアントにメディアデータをストリーミングする例を示す。 図2は、データストリーミングの例である。 MPEG DASH規格に従うDASHにおけるメディア表現の典型的な記述をしめす。 特に3つの適応セット及び1つの事前選択を記述する、メディアプレゼンテーション記述の一部の例を示す。 本発明の実施形態に従う、特に3つの適応セット及び1つの事前選択を記述し、使用される初期化セグメントのシグナリングを記述する、メディアプレゼンテーション記述の一部の例を示す。 本発明の実施形態に従う、メディアサーバが複数のコンポーネントを有するメディアデータをパッケージ化しストリーミングを準備するための方法のステップの例を示す。 特に使用する初期化セグメントのシグナリングのために、プリセレクション内で宣言されたプリセレクション及びアダプテーションセットに関するストリーミングクライアントの期待される挙動を記述するために、サーバによって実行されるステップの例を示す。 本発明の実施形態に従う、ストリーミングマニフェストを受信した際にクライアントがメディアデータを処理するためのステップの例を示す。 本発明の実施形態に従う、事前選択の記述をクライアントが解釈するためのステップの例を示す。 本発明の少なくとも1つの実施形態を実装するように構成された処理装置を概略的に示す。
本発明者らは、メディアコンポーネントの事前選択を使用することができるオーディオブロードキャストにおいて高度なユースケースが存在すること、及び、例えばビューポート依存ストリーミング又はタイルベースストリーミングのように、メディアコンポーネントの事前選択が有益でありえる適応ビデオストリーミングおいてもユースケースが存在し得ることに注目した。
このような場合、クライアントに送信されるデータを選択し、及び/又は送信されるデータをシグナリングすることについての具体的な必要性がある。これは特に、複数のストリーム又は複数の部分としてのメディアコンテンツのストリーミングを考える場合に当てはまる。このようなコンテンツの例は、いくつかのオーディオストリーム(音楽、異なる言語のダイアログ、サウンドエフェクトなど)がオーディオシーンを表現するために使用されてもよいマルチストリームオーディオである。オーディオシーンの一部を表す各オーディオストリームは、MPDの中の1つのアダプテーションセット(AdaptationSet)として記述することができる。次いで、各部分は、メディアプレゼンテーションのメディアコンポーネントと考えられてもよい。別の例は、ビデオの場合、タイル化されたビデオ、又はビデオの空間的部分若しくは矩形領域であり、これは、全方向又は広角のビデオストリーミングのために使用することができる。各空間的部分、タイル、又は領域は、MPDにおいて1つのアダプテーションセットとして記述され、ビデオシーンの1つのメディアコンポーネントとして考慮され得る。使用の一例は、OMAF(ISO/IEC23090-2)におけるビューポート依存ストリーミング、又はより一般にはタイルベースストリーミングである。
実施形態によれば、HTTPを介した適応ストリーミングのために、パーティション化されたビデオ、特にタイル化されたビデオを利用することができ、クライアントに対してメディアコンポーネントの事前選択、例えば、クライアントのニーズ及びクライアントの文脈を考慮した、ビデオを取得及びレンダリングするためのビデオの空間的部分(又はタイル)の事前選択、を選択する可能性を与える。これは、クライアントにメディアコンポーネントの事前選択を選択する可能性を与え、選択された事前選択に対応するカプセル化されたデータを適切にシグナリングすることによって得られる。
説明の目的で、本明細書で記述される多くの実施形態は、HEVC規格又はその拡張に基づいている。しかしながら、本発明の実施形態は、AVCのような既に利用可能な、又は規格策定中のMPEGバーサタイルビデオコーディング(VVC)のような、まだ利用可能でない又は開発されていない他の符号化規格にも適用される。特定の実施形態では、ビデオエンコーダはタイルをサポートし、独立してデコード可能なタイル、タイルセット又はタイルグループ(ときにモーションコンストレインドタイルセットとも呼ばれる)を生成するようにエンコーディングを制御することができる。
例えばMPDのようなマニフェストは、所与のメディアプレゼンテーションのためにアクセスできるすべてのメディアコンテンツコンポーネントを記述する文書、典型的にはXMLファイルである(又はHTTPライブストリーミングの場合はプレーンテキストファイルですらある)ことが思い出される。DASHクライアントは、ストリーミングサーバとの通信により、メディアコンポーネントの選択のためにMPDで提供されるメタデータを使用してもよい。このような記述はメディアコンテンツコンポーネントのタイプ(例えば、オーディオ、オーディオチャンネル、ビデオ、オーディオ-ビデオ、ビデオの一部、メタデータ、又はテキスト)、メディアセグメントの時間長、及びメディアセグメントに関連するアドレス(例えばURL)、すなわちメディアコンテンツコンポーネントを取得することができるアドレス、を含むことができる。メディアコンテンツコンポーネントは同じコンテンツの代替バージョンとして、又は同じコンテンツの一部(例えば、空間関係記述子(SRD)を有するビデオの空間的部分、関心領域、若しくはタイル、又は仮想現実若しくは全方向メディアコンテンツのビューポート)として、又は一緒に提示又は表示されるように意図されたコンテンツコンポーネントを記述する「メディア体験」の一部として記述することができる。
典型的には、MPDは図3に示すような階層データモデルに基づく。
図3は、MPEG DASH規格に従うDASHにおけるメディアプレゼンテーションの典型的な説明を示す。
図示されているように、これは主に、300で示される1つ又はいくつかの期間からなり、これらの期間はそれぞれ、ピリオド要素によって記述され、各ピリオド要素は開始時刻及び時間長を有する。次に、各ピリオド要素は主に、301で示される1つ又はいくつかのアダプテーションセット要素からなる。
アダプテーションセット要素は符号302で示されるように、1つ以上のメディアコンテンツコンポーネント及びその種々のエンコードされた代替物に関する情報を提供する。同じメディアコンテンツコンポーネントの各エンコードされた代替物は、典型的には303で示される1つ又はいくつかのメディア及び/又は初期化セグメントからなるレプレゼンテーションと呼ばれる。
上述したように、ユーザの必要性及び状況(例えば、帯域幅及び処理リソースの観点から)に応じてユーザが選択することができるメディアコンポーネントのセットを作成することは有益である。メディアコンポーネントのセットはいくつかのメディアコンポーネントを含み、メディアコンポーネントは例えば、特定の適応セットの特定の表現に関連するセグメントであり、これは例えばアダプテーションセット1のレプレゼンテーション1に対応する図3に303で示されるセグメントである。
図4は、特に3つの適応セット及び1つの事前選択を記述するメディアプレゼンテーション記述の一部の例を示す。事前選択は一緒に消費されることが期待されるメディアコンポーネントのサブセットであり、典型的には、バンドル内のアダプテーションセットの組み合わせである。バンドルは、単一のデコーダインスタンスによって一緒に消費され得るメディアコンポーネントのセットである。MPDには複数のプリセレクションが存在し得る。そのような場合、クライアントはいくつかのプリセレクション属性又は記述子(例えば、役割、格付けなど)に従って、どの1つがその必要性又は能力によりよく適合するかを決定する。
メディアプレゼンテーション記述(図4に400で示される)のそれぞれの適応セット(図4に405-1から405-3で示される)は図3を参照して記述されるように、1つ以上の代替表現を含むことができ、各表現は、少なくとも1つの初期化セグメント及び1つ以上のメディアセグメント(その各々が与えられたURLを介してアクセス可能である)を有するセグメントのリストとして記述される。
図示されているように、メディアプレゼンテーション記述400は、図示されている例では3つのアダプテーションセットを含む事前選択の宣言(図4のプリセレクション410)をさらに含む。
説明の目的で、アダプテーションセット405-1が、(preselectionComponents属性を使用して)プリセレクションのメディアコンポーネントのリストで最初に宣言されたものであるために、プリセレクションの主アダプテーションセットであると仮定する。アダプテーションセット405-2及び405-3は、(主アダプテーションセットとは違い)部分アダプテーションセットである。
図4に示されたマニフェストの一部から、クライアントがデコーダによって期待される正しいセグメント連結を決定することができないことがあることが観察される。特に、クライアントはプリセレクションを再生するときに、どの初期化セグメントをダウンロードして使用すべきかを決定することができない(すなわち、クライアントはアダプテーションセット405-1から405-3の各初期化セグメントの連結を必要とするのか?あるいは、主適応セット、すなわちアダプテーションセット405-1からのからの初期化セグメントのみを必要とするのか?)。さらに、クライアントは、識別子id=1を有する適応セット、識別子id=2を有する適応セット、又は識別子id=3を有する適応セットのみを、単独で再生されるメディアストリームとして選択することも可能であることに留意されたい。そして、1つ以上のメディアセグメントに続く初期化セグメントの通常の連結は、同様に適合したビットストリームを導くだろう。
図5は、本発明の実施形態に従う、特に3つの適応セットと1つの事前選択とを記述し、使用される初期化セグメントのシグナライゼーションを記述する、メディアプレゼンテーション記述の一部の第1の例を示す。
図示されているように、メディアプレゼンテーション記述500は、図4を参照して記述された3つのアダプテーションセット405-1~405-3に類似する、505-1~505-3で示される3つの適応セットを含む。
メディアプレゼンテーション記述500は、図4のプリセレクション410に比べて拡張された、510で示されるプリセレクションをさらに含み、新しい属性は例えば「init」と呼ばれ、515で示される。
この属性は、プリセレクションの初期化モードを記述することを目的としている。
図示された例によれば、この属性の値は「preselect_only」を示し、プリセレクション510についてのセグメントの正しい連結はメディアプレゼンテーション記述500の下に示されるものであることを意味する。この例では1つの初期化セグメントのみ、例えば、主アダプテーションセット505-1の1つのレプレゼンテーションからの初期化セグメントのみが、全体の事前選択に関連する。これは、主アダプテーションセットがタイルベーストラック又はエクストラクタトラックに対応し、部分適応セットがタイルトラック(例えば、ビデオがHEVCでエンコードされる場合の「hvt1」タイルトラック、又は各タイルが独立したHEVCビットストリームでエンコードされる場合の「hvc1」トラック)に対応する場合に当てはまる。
メディアプレゼンテーション記述500の下に示される連結は、適合するビットストリームをもたらすだろう(例えば、ISOBMFFにカプセル化される場合、連結されたセグメントは、ISOBMFFパーサによって読み取られることができる)。これは、520で示される初期化セグメント、例えば主適応セットの初期化セグメント(すなわち、与えられた例ではアダプテーションセット505-1の初期化セグメント)と、525-1から525-3で示される対応するURLで定義される、事前選択に属する適応セットからのメディアセグメント(すなわち、与えられた例ではアダプテーションセット505-1から505-3のメディアセグメント)とを含む。メディアセグメントのURLは、$time$パラメータを使用したテンプレートURLであることに注意する。もちろん、$Number$を使用するテンプレートであってもよい。それらは、本発明を変更することなく、セグメントテンプレートの代わりにセグメントリストとして宣言されることもできる。
図示された例によれば、部分アダプテーションセット505-2及び505-3はそれ自体で、又はプリセレクション内でのみ、選択可能かつ再生可能であってもよい。前者の場合、部分アダプテーションセット内の所与のレプレゼンテーションについて、そのイニシャライゼーションセグメントの後に1つ以上の対応するメディアセグメントが続くような連結が、適合するビットストリームをもたらすだろうことを意味する。
「preselect_only」が識別子id=1を有する適応セット、識別子id=2を有する適応セット、又は識別子id=3を有する適応セットの単独での選択を禁止するように定義されてもよいことに留意されたい。このような定義は、これらの適応セットのそれぞれについて独立した、初期化セグメントの後に1つ以上のメディアセグメントが続くような連結が、適合するビットストリームをもたらさないかもしれないことを意味する。各アダプテーションセットは(例えば、OMAFのSubPicCompositionId:@noSingleSelection = trueを使用して)事前選択の外側で、又は単独で、選択可能でない(例えば隠されている)又は再生可能でないことを示すために、追加の又は専用のシグナリングを有することができる。
図6は、本発明の実施形態に従う、特に3つの適応セットと1つの事前選択とを記述し、使用される初期化セグメントのシグナライゼーションを記述する、メディアプレゼンテーション記述の一部の第2の例を示す。
図示されているように、メディアプレゼンテーション記述600は、図4及び図5を参照してそれぞれ記述されている3つのアダプテーションセット405-1~405-3及び505-1~505-3に類似する、605-1~605-3で示される3つの適応セットを含む。
メディアプレゼンテーション記述500と同様に、メディアプレゼンテーション記述600は、図6において615で示される同じ新しい属性「init」を含む、610で示される事前選択をさらに含む。この新しい属性は、やはり、プリセレクションについての初期化モードを記述することを目的とする。
プリセレクション610についてのセグメントの連結は、メディアプレゼンテーション記述600の下に示されている。
図示された例によれば、この属性の値は「AS_only」を示し、これは、各アダプテーションセットがプリセレクション610で又は独立して使用されてよいことを意味する(サーバがセグメントを、それらのアダプテーションセットレベルでの連結が適合するビットストリームをもたらすように構築したため)。
この例は例えば、デジタルビデオブロードキャスティング(DVB)規格に記述されているように、複数のオーディオストリームを伴ういくつかのオーディオユースケースに対応することができる。そのような場合、アダプテーションセット605-1~605-3の各々は、各々がオーディオストリームを記述する1つ以上のレプレゼンテーションを含む。各レプレゼンテーションは、イニシャライゼーションセグメント及び1つ以上のメディアセグメントを宣言する。
図6に図示された例によれば、セグメントは、(メディアプレゼンテーション記述600の下に示すように)レプレゼンテーション又はアダプテーションセットごとに連結される。このことは、プリセレクションにおけるそれぞれのアダプテーションセットが自身のイニシャライゼーションセグメントを有することを意味する。例えば、アダプテーションセット605-1の初期化セグメントは対応するURL625-1で定義されているアダプテーションセット605-1のメディアセグメントと連結され、アダプテーションセット605-3の初期化セグメントは対応するURL625-3で定義されているアダプテーションセット605-3のメディアセグメントと連結される(これはアダプテーションセット605-2及びプリセレクションで宣言されている任意のアダプテーションセットについて同じである)。次いで、これらのストリームは、これらの個々のストリームをマルチストリーム(例えば、ISO/IEC23008-3におけるようなオーディオストリームのためのMPEG-H 3Dオーディオストリーム)へと統合するエンコーダインターフェースに提供されてもよい。
符号620で表されるアダプテーションセットベースの連結は、それぞれ適合するビットストリームをもたらすだろう。初期化モード属性が「AS_only」に設定されている事前選択によって、各アダプテーションセットが単独でプリセレクションの外側で選択及び再生されることが防止されるわけではない。
図7は、本発明の実施形態に従う、特に3つの適応セットと1つの事前選択とを記述し、使用される初期化セグメントのシグナライゼーションを記述する、メディアプレゼンテーション記述の一部の第3の例を示す。
図示されているように、メディアプレゼンテーション記述700は、図4、図5、及び図6を参照して記述されたものと同様の、705-1~705-3で示される3つの適応セットを含む。
メディアプレゼンテーション記述500及び600と同様に、メディアプレゼンテーション記述700は、図7において715で示される同じ新しい属性「init」を含む、710で示される事前選択をさらに含む。この新しい属性は、やはり、プリセレクションについての初期化モードを記述することを目的とする。プリセレクション710についてのセグメントの可能な連結は、メディアプレゼンテーション記述700の下に示されている。
図示された例によれば、この属性の値は、連結750又は761から763がすべて適合するビットストリームを導くことを意味する、「preselect_or_AS」を示す。連結750はプリセレクション内のメディアコンポーネント又はメディア部分のストリーミングに対応する(すなわち、主アダプテーションセットからの1つの単一のイニシャライゼーションセグメントの後に、プリセレクションのアダプテーションセットからのメディアセグメント725-1、725-2、725-3などの連続する連結が続く)。連結761~763は、1つのメディアコンポーネントのみの、すなわちプリセレクションの外側でのストリーミングに対応する。一例として、761~763はそれぞれ、独立したビットストリーム、トラック、又はレプレゼンテーションとしてエンコードされ及び提供される、ビデオストリーム内の1つの関心領域に対応することができる。カプセル化750は、オリジナルのビデオストリーム内に一緒に構成されるこれらの注目領域に対応し得る。
図8は、本発明の実施形態に従う、サーバが、複数のメディアコンポーネントを有するメディアデータをパッケージ化し、ストリーミングの準備をするためのステップの一例を示す。
図示されているように、第1のステップ(ステップ800)は、1つ以上のビットストリームにおけるデータエンコーディング、典型的にはデータ圧縮、を対象とし、これはいくつかのメディアコンポーネント、例えばいくつかのISOBMFFトラックへと、カプセル化されたる(ステップ805)。カプセル化されたメディアコンポーネント、又はこれらのカプセル化されたメディアコンポーネントのいくつかのサブセットは、異なる組み合わせに従って組み合わせることができる。これらの組み合わせのいくつかは、特に関連するものとして識別され、そして事前選択として提案されてもよい。
クライアントが事前選択(すなわち、メディアコンポーネントの予め決定された組み合わせ)を選択できるようにするために、これらの事前選択は、メディアプレゼンテーション記述においてサーバによって示される(ステップ810)。こうすることにより、サーバは、メディアデータ選択のためのストリーミングクライアントのありうる選択を簡素化する。さらに、プリセレクションの定義はコンテンツ作成者の意図をより良く記述し、メディアプレゼンテーションにおいて好ましいエントリポイントを提供する。その目的で、サーバは初期化セグメントについてのルールを定義するために、注釈をメディアプレゼンテーション記述の中に入れる。
図9及び10は、メディアプレゼンテーション記述にある事前選択のシグナリングの例を提供する。
次に、これらの記述を有するメディアファイル又はセグメントは、クライアントへの流布のためにストリーミングサーバ上に公開される(ステップ815)。
図9は、図8のステップ810を参照して記述されるように、特に使用する初期化初期化セグメントのシグナリングのために、プリセレクション及びプリセレクション内で宣言されたアダプテーションセットに関してストリーミングクライアントに期待される挙動を記述するために、サーバによって実行されるステップの第1の例を示す。
図示されているように、第1のステップ(ステップ900)は考慮されるプリセレクションが単一の初期化セグメントと共に使用されるべきか否か、すなわち、使用される初期化セグメントの個数が1以上であるか否かを決定することに向けられている。これはコンテンツに依存する。例えば、タイル化されたビデオについてこのテストは真になるかもしれず、複数のオーディオストリームについてこのテストは偽になるかもしれない。
考慮されたプリセレクションが単一の初期化セグメントと共に使用されるならば、メディアプレゼンテーション記述を書き込む責任を負うサーバモジュールは、一つの初期化セグメントのみが使用されるべきであることを示すためにプリセレクション要素に属性を追加する(ステップ905)。デフォルトでは、すなわち単一のイニシャライゼーションセグメントが使用されるプリセレクションにおいて指示が与えられないとき、使用される初期化は主アダプテーションセットからのイニシャライゼーションセグメントである。実施形態によれば、使用される初期化セグメントが主アダプテーションセットからのものでない場合、使用される初期化セグメントがシグナリングされる(ステップ910)。例えば、これはプリセレクション要素内の別の属性「initSegment」を使用してシグナリングされることが可能である。新しい「initSegment」属性は、preselectionComponents属性内で宣言される、アダプテーションセットidのリスト内に存在する1つのアダプテーションセットのidを提供するだろう:
<Preselection single_init = "true" preselectionComponents="1 2 3 initSegment="2" .../>
この例では、プリセレクションのメディアコンポーネントのセグメントの連結に使用する単一の初期化セグメントが、id=「2」をもつアダプテーションセットからの初期化セグメントである。
使用される初期化セグメントの誤った記述の例は、以下の通りである:
<Preselection single_init = "true" preselectionComponents="1 2 3 initSegment="4" .../>.
このような場合、クライアントはこのプリセレクションを無視する必要がある。MPDスキーマバリデータは、そのような宣言を受け入れるべきではなく、MPDを無効と考えるべきである。
変形例では、initSegment属性の値が、アダプテーションセットIDのpreselectionComponentsリスト内のインデックス(1ベースのインデックス)を提供してもよい。例えば、preselectionComponentsが「12 45 123」のプリセレクションでは、initSegment=「2」は、id=「45」のアダプテーションセットの初期化セグメントを考慮すべきであることを示す。
次に、プリセレクションは、それが含むメディアコンポーネントの一覧と共に記述される(ステップ915)。
図10は、図8のステップ810を参照して記述されるように、特に使用する初期化セグメントをシグナリングするために、プリセレクション及びプリセレクション内で宣言されたアダプテーションセットに関するストリーミングクライアントの期待される挙動を記述するために、サーバによって実行されるステップの第2の例を示す。
図示されているように、第1のステップ(ステップ1000)は、プリセレクションがいくつかの初期化セグメントと共に使用されるべきか否かを決定することに向けられている。これはコンテンツに依存する。この場合も、これは、アプリケーション及びメディアストリームの性質に依存する。
プリセレクションがいくつかの初期化セグメントと共に使用されるならば、特定のinit_modeパラメータの値は、記述されるプリセレクション要素の属性に設定される(ステップ1005)。この特定のinit_modeパラメータ値は、プリセレクションの各アダプテーションセットの中の各レプレゼンテーションについて、例えば図6を参照して記述されるように(ここで、init_modeは「init」属性によって表されている)、対応する初期化セグメントが考慮されることを示す。説明のために、このinit_modeパラメータの値は2に設定されてもよい。反対に、プリセレクションが単一の初期化セグメントと共に使用される場合、サーバは、部分適応セットが事前選択の外側で再生されてもよいかどうかをさらにチェックする(ステップ1015)。
部分適応セットが事前選択においてのみ再生されるならば、例えば図5を参照して記述されているように(ここでinit_modeは「init」属性によって表されている)、サーバは特定のinit_modeパラメータの値を、主アダプテーションセットからの(又はシグナリングされるであろう(ステップ1030)別の単一の初期化セグメントからの)イニシャライゼーションセグメントのみが考慮されるべきであることを示す値に設定する(ステップ1020)。説明のために、このinit_modeパラメータの値は1に設定されてもよい。
反対に、部分適応セットが事前選択の外側で再生されてもよい場合、特定のinit_modeパラメータ値は、図7を参照して記述されるような(ここでinit_modeは「init」属性によって表されている)連結が使用されてもよく、これが適合するビットストリームを導くことをクライアントに示すように設定される(ステップ1025)。初期化セグメントは、デフォルトでは主アダプテーションセットからのものか、又は任意的にはプリセレクション要素のinitSegment属性に示されているアダプテーションセットの初期化セグメントである。説明のために、このinit_modeパラメータの値は3に設定されてもよい。主アダプテーションセットについてのものではない初期化セグメントを提供するステップ1030は、図9のステップ910を参照して記述した任意的なinitSegment属性を使用してシグナリングすることができる。
次に、プリセレクションは、それが含むメディアコンポーネントのリストと共に記述される(ステップ1035)。
上述したように、また実施形態によれば、プリセレクション要素は、例えば(図9を参照して記述する)ブーリアン属性、又は(図10を参照して記述する)列挙された値又は事前定義された値をとる属性でありうる、新しい属性で拡張される。
初期化モードを示す新しい属性は任意的なものであってもよく、存在しないとき、クライアントは図6を参照して記述されたような連結を想定するだろう。属性がブーリアン(例えば「single_init」)である場合における次の意味は、プリセレクション要素のこの新しい属性を定義する。
真に設定されると、この属性は、主アダプテーションセットの(任意的にはinitSegment属性によって示されるものからのもの)イニシャライゼーションセグメントの、後にプリセレクションで宣言されたそれぞれのアダプテーションセットのメディアセグメントが後に続くような連結が、DASHビットストリーム連結ルールに適合し、このレプレゼンテーションについての@mimeType属性で識別されるメディアタイプに適合する、適合するセグメントシーケンスを表すことを示すだろう。メディアセグメントは、必ずしもプリセレクションにおける宣言順ではなく、任意の順序で連結されてもよいことが思い出される。
偽又は存在しないに設定された場合、この属性は、プリセレクションにおける各アダプテーションセットの初期化セグメントとメディアセグメントとの各連結が、DASHビットストリーム連結ルールに従い、このレプレゼンテーションについての@mimeType属性で識別されるメディアタイプに適合する、適合するセグメントシーケンスを表すことを示すだろう。
また、プリセレクションにおいて宣言されたそれぞれの部分アダプテーションセットのレプレゼンテーションが、適合するセグメントのシーケンスにつながる場合もあれば、つながらない場合もあることにも留意されたい。これは、プリセレクション記述子の有無を調べることによって決定することができる。EssentialProperty記述子が存在する場合、プリセレクションの外側でアダプテーションセットを選択し及び再生することはできない。SupplementalPropertyとして存在する場合、プリセレクションの外側でアダプテーションセットが選択され、再生されてもよい。
PreselectionTypeのXMLスキーマは、以下のように更新できる(任意的属性は太字とする(訳注:本翻訳文においては下線を付した)):
<xs:complexType name="PreselectionType">
<xs:complexContent>
<xs:extension base="RepresentationBaseType">
<xs:sequence>
<xs:element name="Accessibility" type="DescriptorType" minOccurs="0" maxOccurs="unbounded"/>
<xs:element name="Role" type="DescriptorType" minOccurs="0" maxOccurs="unbounded"/>
<xs:element name="Rating" type="DescriptorType" minOccurs="0" maxOccurs="unbounded"/>
<xs:element name="Viewpoint" type="DescriptorType" minOccurs="0" maxOccurs="unbounded"/>
</xs:sequence>
<xs:attribute name="id" type="StringNoWhitespaceType" default="1"/>
<xs:attribute name="preselectionComponents" type="StringVectorType" use="required"/>
<xs:attribute name="lang" type="xs:language"/>
<xs:attribute name="single_init" type="xs:Boolean"/>
<xs:attribute name="initSegment" type="StringNoWhitespaceType" />
</xs:extension>
</xs:complexContent>
</xs:complexType>
上述のように(特に図5、6、及び7を参照)、新しいプリセレクションの属性についての明示的な値の例は、「preselect_only」又は「As_only」又は「preselect_or_As」である。これらの値は、それぞれが3つの初期化モードの1つに対応する、値1、2、及び3でエンコードされてもよい。当然、新しい応用例が追加の値を必要とする場合、追加の値を予約することによってこの機構は容易に拡張できる(これは、Boolean属性を使うことによる場合には当てはまらない)。
この変形例では、PreselectionTypeのXMLスキーマは以下のように更新されてもよい(任意的属性は太字とする(訳注:本翻訳文においては下線を付した)):
<xs:complexType name="PreselectionType">
<xs:complexContent>
<xs:extension base="RepresentationBaseType">
<xs:sequence>
<xs:element name="Accessibility" type="DescriptorType" minOccurs="0" maxOccurs="unbounded"/>
<xs:element name="Role" type="DescriptorType" minOccurs="0" maxOccurs="unbounded"/>
<xs:element name="Rating" type="DescriptorType" minOccurs="0" maxOccurs="unbounded"/>
<xs:element name="Viewpoint" type="DescriptorType" minOccurs="0" maxOccurs="unbounded"/>
</xs:sequence>
<xs:attribute name="id" type="StringNoWhitespaceType" default="1"/>
<xs:attribute name="preselectionComponents" type="StringVectorType" use="required"/>
<xs:attribute name="lang" type="xs:language"/>
<xs:attribute name="initMode" type="InitalizationModeType" default="AS_only"/>
<xs:attribute name="initSegment" type="StringNoWhitespaceType" />
</xs:extension>
</xs:complexContent>
</xs:complexType>
InitializationModeTypeは以下のように定義される:
<xs:simpleType name=" InitializationModeType">
<xs:restriction base="xs:string">
<xs:enumeration value="preselect_only"/>
<xs:enumeration value="AS_only"/>
<xs:enumeration value="preselect_or_AS"/>
</xs:restriction>
</xs:simpleType>
プリセレクションで宣言できるさまざまな初期化モードの意味は、次のように定義される:
initMode属性は、DASHクライアントによって適用される連結ルールを示す。値が「preselect-only」、又はプリセレクション内の1つのアダプテーションセットからの1つの初期化セグメントのみが使用されることを示す任意の値である場合、主アダプテーションセットのイニシャライゼーションセグメントの(任意的にはinitSegment属性によって示されるものからの)、後にプリセレクション内で宣言された各アダプテーションセットのメディアセグメントが続くような連結は、DASHビットストリーム連結ルールに従い、このレプレゼンテーションについての@mimeType属性で識別されるメディアタイプに適合する、適合するセグメントシーケンスを表すだろう。メディアセグメントは、必ずしもプリセレクションにおける宣言順ではなく、任意の順序で連結されてもよいことが思い出される。さらに、この値はアダプテーションセットがプリセレクションの外側で選択又は再生されてはいけないこと、すなわち各アダプテーションセットごとのイニシャライゼーションセグメントとメディアセグメントのシーケンスとの連結が、適合するビットストリームに導かないかもしれないこと、を示す。
値が「AS_only」、又は各アダプテーションセットが自身の初期化セグメントを使用することを示す任意の値である場合、プリセレクションの各アダプテーションセットの初期化セグメントとメディアセグメントとの各連結は、DASHビットストリーム連結ルールに従い、このレプレゼンテーションについての@mimeType属性で指定されるメディアタイプに適合する、適合するセグメントシーケンスを表すだろう。
値が「Preselect_or_AS」に設定された場合、プリセレクションにおける各アダプテーションセットの初期化セグメントとメディアセグメントとの連結は、適合するセグメントシーケンスを表し、主アダプテーションセットの(任意的にはinitSegment属性によって示されるものからの)イニシャライゼーションセグメントの、後にプリセレクションにおいて宣言された各アダプテーションセットのメディアセグメントが続くような連結は、適合するセグメントシーケンスを表すだろう。DASH規則に従って適合するセグメントシーケンスは、適合するビットストリームをもたらす。
プリセレクション記述子はこれらの新しい属性で拡張することもでき、ここではプリセレクション要素に対するものと同じ意味が適用されるだろう。
図11は、本発明の実施形態に従う、ストリーミングマニフェストを受信した際にクライアントがメディアデータを処理するためのステップの例を示す。
メディアプレゼンテーション記述を取得した後で(ステップ1100)、クライアントは、メディアプレゼンテーション記述が事前選択を含むかどうかをチェックする(1105)。事前選択がない場合、クライアントは、独立したアダプテーションセットに基づいて、標準的なコンテンツ選択及び適応ストリーミングを実行する(ステップ1110)。クライアントは、そのデコーダを初期化し(ステップ1115)、メディアコンポーネント、例えばメディアトラックを解析し(ステップ1120)、メディアストリームをデコードし(ステップ1125)、メディアプレゼンテーションを表示し又は格納する(ステップ1130)。
反対に、メディアプレゼンテーション記述が1つ以上の事前選択を含む場合、クライアントは、対応するプレゼンテーションをストリーミングするために事前選択を選択することができる(ステップ1135)。次に、クライアントは、選択された事前選択の記述を解析して、事前選択のメディアコンポーネントのリストを取得する(ステップ1140)。このステップは事前選択を再生するための、考慮する初期化セグメントに関する指示を提供することができる。
得られた記述から、クライアントはそのデコーダを初期化し(ステップ1115)、初期化が成功した場合、クライアントはプリセレクションのそれぞれのレプレゼンテーションからメディアセグメントを取得し、対応するトラックが解析され、デコードされ、クライアントのユーザインターフェース上でレンダリングされる(ステップ1120~1130)。
ステップ1140の間に実行されるステップの例が、図12及び13に示される。
図12は、本発明の実施形態に従う、クライアントが事前選択の記述を解釈するためのステップの第1の例を示す。
図示されているように、クライアントは、選択された事前選択の記述を得た後(ステップ1200)、プリセレクションの属性が、単一の初期化セグメントを使用することがシグナリングされたことを示しているかどうかをチェックする(ステップ1205)。
プリセレクションの属性が、単一の初期化セグメントを使用することがシグナリングされたことを示す場合、クライアントは主アダプテーションセットの(ステップ1210、又は任意的にはinitSegment属性によって示される1つのアダプテーションセットの)1つのレプレゼンテーションからの初期化セグメントを要求し、部分アダプテーションセットのレプレゼンテーションからのものを無視する。逆に、単一の初期化セグメントが使用されることがプリセレクションでシグナリングされていいない場合、クライアントは、プリセレクションで宣言されたアダプテーションセットごとに1つの初期化セグメントを要求する(ステップ1215)。
これらの初期化セグメントは次に、メディアデコーダに情報を提供し、それらのセットアップ又は初期化を実行するために、クライアントの解析/カプセル化解除モジュールによって処理される。クライアントは、プリセレクションからの任意のアダプテーションセットが選択可能であり、それ自体で再生可能であると仮定してもよい。各アダプテーションセットはまた、図9を参照して記述したように、このアダプテーションセットを選択し、再生することができるように、クライアントがプリセレクションをサポートするはずかどうかを示すプリセレクションディスクリプタ(PreselectionDescriptor)を有することができる。
図13は、使用される初期化セグメントをシグナリングする属性が、初期化モードについての明示的な値(例えば「init」又は「initMode」属性)をとることができる場合における、本発明の実施形態に従う、クライアントによる事前選択の記述の解釈のためのステップの第2の例を示す。
図示されるように、選択された事前選択の記述を取得した後(ステップ1300)、クライアントは事前選択要素記述から、初期化モードに関する情報を提供する属性の値、例えば「init」又は「init_mode」属性を読み出す(ステップ1305)。
値が「preselect_only」、すなわち事前選択のみモードを示すならば、クライアントは主アダプテーションセットの(ステップ1310、又は任意的にinitSegment属性によって示される1つのアダプテーションセットからの)1つのレプレゼンテーションからの初期化セグメントを要求し、部分アダプテーションセットのレプレゼンテーションからのものを無視する。反対に、値が事前選択のみモードを示さない場合、クライアントは、値がアダプテーションセットごとの初期化セグメントを示すかどうかをチェックする(ステップ1315)。
値がアダプテーションセットごとの初期化、すなわち「AS_only」を示すならば、クライアントはプリセレクションで宣言されたアダプテーションセットごとに1つの初期化セグメントを要求する(ステップ1320)。逆に、値が事前選択のみモードを示さず、またはアダプテーションセットごとの初期化、すなわち「AS_only」を示さない場合、クライアントは、プリセレクションからの任意のアダプテーションセット、又はプリセレクション全体を再生することを決定してもよい(ステップ1325)。前者の場合、選択されたアダプテーションセットの1つのレプレゼンテーションについての初期化セグメントのみを必要とする。後者の場合、主アダプテーションセット内の(又任意的にはinitSegment属性によって示される1つのアダプテーションセットからの)1つのレプレゼンテーションの初期化セグメントを取得するだけでよい。
これらの初期化セグメントは次に、クライアントの解析/カプセル化解除モジュールによって処理され、メディアデコーダに情報を提供し、それらのセットアップ又は初期化を実行する。
図14は、本発明の1つ以上の実施形態を実装するためのコンピューティング装置1400の概略ブロック図である。コンピューティング装置1400は、マイクロコンピュータ、ワークステーション、又は軽量ポータブル装置などの装置であってもよい。コンピューティング装置1400は、以下のもの接続された通信バス1402を備える:
マイクロプロセッサのような中央処理装置(CPU)1404;
本発明の実施形態の方法の実行可能なコードを格納するためのランダムアクセスメモリ(RAM)1408に加えて、メディアデータを伝送する方法を実装するために必要な変数及びパラメータを記録するように構成され、そのメモリ容量が例えば拡張ポートに接続された任意的なRAMによって拡張可能であるレジスタ;
本発明の実施形態を実装するためのコンピュータプログラムを格納するため読み出し専用メモリ(ROM)1406;
ネットワークインターフェース1412であって、引き続いて典型的には通信ネットワーク1414に接続され、この通信ネットワークを介して処理されるデジタルデータが送信又は受信される。ネットワークインターフェース1412は単一のネットワークインターフェースであってもよいし、異なるネットワークインターフェースのセット(例えば、有線及び無線インターフェース、又は異なる種類の有線又は無線インターフェース)から構成されてもよい。データは、CPU1404内で実行されているソフトウェアアプリケーションの制御の下で、送信のためにネットワークインターフェースに書き込まれ、又は受信のためにネットワークインターフェースから読み出される;
ユーザからの入力を受信し、又はユーザに情報を表示するためのユーザインターフェース(UI)1416;
ハードディスク(HD)1410;
ビデオソース又はディスプレイのような外部装置から/へとデータを受信/送信するためのI/Oモジュール1418。
実行可能コードは、読み出し専用メモリ1406、ハードディスク1410、又は例えばディスクのようなリムーバブルデジタル媒体のいずれかに格納することができる。変形例によれば、プログラムの実行可能コードは、実行される前に、ハードディスク1410のような通信装置1400の格納手段の1つに格納されるように、ネットワークインターフェース1412を介して通信ネットワークを用いて受信することができる。
中央処理装置1404は、前述の格納手段の1つに格納されている、本発明の実施形態に従う1つのプログラム又は複数のプログラムのソフトウェアコードの命令又は部分の実行を制御し、指示するように構成されている。電源投入後、CPU1404は、例えばプログラムROM1406又はハードディスク(HD)1410からそれらの命令がロードされた後に、ソフトウェアアプリケーションに関する主RAMメモリ1408からの命令を実行することができる。このようなソフトウェアアプリケーションは、CPU1404によって実行されると、前の図に示されたフローチャートのステップを実行させる。
この実施形態では、装置は本発明を実装するためにソフトウェアを使用するプログラム可能装置である。しかしながら、代替的に、本発明はハードウェア(例えば、特定用途向け集積回路又はASICの形態)で実装されてもよい。
本発明が特定の実施形態を参照して上述されたが、本発明は特定の実施形態に限定されず、本発明の範囲内にある変形例は当業者には明らかであろう。
多くのさらなる変形例及びバリエーションが、前述の例示的な実施形態を参照した当業者に対して示唆されており、前述の例示的な実施形態は例示としてのみ与えられたものであり、本発明の範囲を限定することを意図したものではなく、本発明の範囲は、添付の特許請求の範囲によってのみ決定される。特に、様々な実施形態からの異なる特徴は、適宜、交換されてもよい。
特許請求の範囲において、単語「含む」は他の要素又はステップを除外せず、不定冠詞「a」又は「and」は複数を除外しない。異なる特徴が相互に異なる従属請求項に記載されているという単なる事実は、これらの特徴の組み合わせを有利に使用できないことを示すものではない。
特許請求の範囲において、単語「含む」は他の要素又はステップを除外しない。異なる特徴が相互に異なる従属請求項に記載されているという単なる事実は、これらの特徴の組み合わせを有利に使用できないことを示すものではない。

Claims (20)

  1. サーバがメディアプレゼンテーション記述(MPD)を生成する方法であって、
    複数のメディアコンポーネントの事前選択を処理するために使用される連結ルールを識別するための情報項目を取得することと、
    前記事前選択を記述し、前記事前選択のそれぞれのメディアコンポーネントへの参照、及び取得された前記情報項目を含む、前記メディアプレゼンテーション記述を生成することと、
    を含む方法。
  2. 前記連結ルールは、前記メディアプレゼンテーション記述にアクセスするクライアントが、適合するビットストリームを生成するために前記事前選択を処理することを可能とする、請求項1に記載の方法。
  3. 各メディアコンポーネントは初期化データ及びメディアデータを含み、前記連結ルールは、前記事前選択の前記メディアコンポーネントのメディアデータを処理するためにクライアントによって使用される前記複数のメディアコンポーネントの初期化データを特徴付ける、請求項1又は2に記載の方法。
  4. 前記連結ルールは、前記複数のメディアコンポーネントのうちの単一のメディアコンポーネントに属する初期化データが、前記事前選択の前記メディアコンポーネントのメディアデータを処理するために使用されるべきであることをシグナリングする、請求項3に記載の方法。
  5. 前記初期化データが使用されるべきである前記単一のメディアコンポーネントへの参照が予め決定されている、請求項4に記載の方法。
  6. 前記メディアプレゼンテーション記述は、前記事前選択によって参照されるメディアコンポーネントの前記メディアデータが、前記事前選択によって参照される他のメディアコンポーネントの他のメディアデータとは独立して処理されることができるか否かを示すためのデータを含む、請求項4又は5に記載の方法。
  7. 前記連結ルールは、前記複数のメディアコンポーネントのうちのいくつかのメディアコンポーネントからの初期化データが、前記事前選択の前記メディアコンポーネントのメディアデータを処理するために使用されるべきであることをシグナリングする、請求項3に記載の方法。
  8. 記述された前記事前選択は複数のアダプテーションセットからのレプレゼンテーションのセットを参照し、前記複数のアダプテーションセットのそれぞれは1つ以上のメディアコンポーネントを記述し、各メディアコンポーネントは初期化データ及びメディアデータを含む、請求項1から7のいずれか1項に記載の方法。
  9. 連結ルールを識別するための前記情報項目は、記述された前記事前選択の第1のアダプテーションセットに属する初期化データがクライアントによって使用されるべきであることをシグナリングし、前記初期化データは記述された前記事前選択に含まれる他のアダプテーションセットのメディアデータと連結されるべきであり、前記他のアダプテーションセットは前記第1のアダプテーションセットとは異なる、請求項4に直接又は間接的に従属する請求項8に記載の方法。
  10. 前記初期化データが初期化セグメントに対応し、前記メディアデータが1つ又はいくつかのメディアセグメントに対応する、請求項3に直接的又は間接的に従属する、請求項3から6、8及び9のいずれか1項に記載の方法。
  11. 前記初期化セグメントはムービーボックスを含み、前記メディアセグメントはムービーフラグメントボックス及びメディアデータボックスを含む、請求項10に記載の方法。
  12. クライアントがメディアコンテンツを処理する方法であって、前記メディアコンテンツはメディアコンポーネントを含み、前記方法は前記クライアントによって実行され、
    メディアプレゼンテーション記述を取得することを含み、
    前記メディアプレゼンテーション記述は、複数のメディアコンポーネントの事前選択の記述を含み、前記事前選択の前記記述は、前記複数のメディアコンポーネントのうちの前記メディアコンポーネントへの参照と、前記事前選択を処理するために使用される連結ルールを識別するための情報項目とを含み、
    前記連結ルールを識別するための前記情報項目を得るために取得された前記メディアプレゼンテーション記述を解析することを含む方法。
  13. 各メディアコンポーネントは初期化データ及びメディアデータを含み、前記連結ルールは、前記複数のメディアコンポーネントのどの初期化データが前記事前選択の前記メディアコンポーネントのメディアデータを処理するためにクライアントによって使用されるべきかを特徴付け、前記方法は、前記連結ルールの関数として前記複数のメディアコンポーネントの初期化データを識別することと、識別された前記初期化データを要求することと、識別された前記初期化データの関数として前記クライアントの少なくとも1つのデコーダを初期化することをさらに含む、請求項12に記載の方法。
  14. 前記連結ルールは、前記複数のメディアコンポーネントのうちの単一のメディアコンポーネントに属する初期化データが、前記事前選択の前記メディアコンポーネントのメディアデータを処理するために使用されるべきであることをシグナリングする、請求項13に記載の方法。
  15. 前記連結ルールは、前記事前選択によって参照されるメディアコンポーネントの前記メディアデータは、前記事前選択によって参照される他のメディアコンポーネントの他のメディアデータとは独立して処理されることができないことをさらにシグナリングする、請求項14に記載の方法。
  16. プログラム可能装置のためのコンピュータプログラムであって、前記プログラム可能装置へとロードされ及び前記プログラム可能装置によって実行されたときに、請求項1から15のいずれか1項に記載の方法のステップのそれぞれを実行するための一連の命令を含む、コンピュータプログラム。
  17. 請求項1から15のいずれか1項に記載の方法のステップのそれぞれを実行するためのコンピュータプログラムの命令を格納する、コンピュータが読み取り可能な記憶媒体。
  18. 請求項1から15のいずれか1項に記載の方法のステップのそれぞれを実行するように構成された処理部を備える、メディアプレゼンテーション記述を生成する又はカプセル化されたメディアデータを処理する装置。
  19. メディアコンテンツのための情報データセットを搬送する信号であって、前記情報データセットはメディアプレゼンテーション記述を含み、前記メディアコンテンツはメディアコンポーネントを含み、前記メディアプレゼンテーション記述は、前記メディアコンテンツの複数のメディアコンポーネントの事前選択の記述と、前記事前選択を処理するためにクライアントによって使用される連結ルールを識別するための情報項目と、を少なくとも含む、信号。
  20. メディアコンテンツのための情報データセットを搬送する信号を格納するメディア格納装置であって、前記情報データセットはメディアプレゼンテーション記述を含み、前記メディアコンテンツはメディアコンポーネントを含み、前記メディアプレゼンテーション記述は、前記メディアコンテンツの複数のメディアコンポーネントの事前選択の記述と、前記事前選択を処理するためにクライアントによって使用される連結ルールを識別するための情報項目と、を少なくとも含む、メディア格納装置。
JP2021531284A 2019-03-12 2020-03-02 カプセル化されたメディアコンテンツの利用可能な部分をシグナリングするための方法、装置、及びコンピュータプログラム Active JP7241874B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1903394.3 2019-03-12
GB1903394.3A GB2582155B (en) 2019-03-12 2019-03-12 Method, device, and computer program for signaling available portions of encapsulated media content
PCT/EP2020/055464 WO2020182524A1 (en) 2019-03-12 2020-03-02 Method, device, and computer program for signaling available portions of encapsulated media content

Publications (2)

Publication Number Publication Date
JP2022522575A true JP2022522575A (ja) 2022-04-20
JP7241874B2 JP7241874B2 (ja) 2023-03-17

Family

ID=66380253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021531284A Active JP7241874B2 (ja) 2019-03-12 2020-03-02 カプセル化されたメディアコンテンツの利用可能な部分をシグナリングするための方法、装置、及びコンピュータプログラム

Country Status (5)

Country Link
US (1) US11575951B2 (ja)
JP (1) JP7241874B2 (ja)
CN (1) CN113615205A (ja)
GB (1) GB2582155B (ja)
WO (1) WO2020182524A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220078298A (ko) * 2020-12-03 2022-06-10 삼성전자주식회사 적응적 증강 현실 스트리밍 제공 방법 및 이를 수행하는 장치
WO2023159143A2 (en) * 2022-02-17 2023-08-24 Bytedance Inc. Method, apparatus, and medium for video processing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018069357A1 (en) * 2016-10-10 2018-04-19 Canon Kabushiki Kaisha Methods, devices, and computer programs for improving rendering display during streaming of timed media data
JP2018522469A (ja) * 2015-06-16 2018-08-09 キヤノン株式会社 画像データカプセル化
JP2019504341A (ja) * 2015-12-01 2019-02-14 クアルコム,インコーポレイテッド トランスポートのためのコード化された次世代オーディオデータの選択

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8918533B2 (en) * 2010-07-13 2014-12-23 Qualcomm Incorporated Video switching for streaming video data
KR101739272B1 (ko) * 2011-01-18 2017-05-24 삼성전자주식회사 멀티미디어 스트리밍 시스템에서 컨텐트의 저장 및 재생을 위한 장치 및 방법
US10284612B2 (en) * 2013-04-19 2019-05-07 Futurewei Technologies, Inc. Media quality information signaling in dynamic adaptive video streaming over hypertext transfer protocol
GB2533624B (en) * 2014-12-23 2017-08-09 Canon Kk Methods, devices, and computer programs for improving coding of media presentation description data
EP3703384B1 (en) * 2016-02-16 2024-02-14 Nokia Technologies Oy Media encapsulating and decapsulating
JP7035401B2 (ja) * 2017-09-15 2022-03-15 ソニーグループ株式会社 画像処理装置およびファイル生成装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018522469A (ja) * 2015-06-16 2018-08-09 キヤノン株式会社 画像データカプセル化
JP2019504341A (ja) * 2015-12-01 2019-02-14 クアルコム,インコーポレイテッド トランスポートのためのコード化された次世代オーディオデータの選択
WO2018069357A1 (en) * 2016-10-10 2018-04-19 Canon Kabushiki Kaisha Methods, devices, and computer programs for improving rendering display during streaming of timed media data

Also Published As

Publication number Publication date
US11575951B2 (en) 2023-02-07
US20220150557A1 (en) 2022-05-12
GB2582155B (en) 2023-12-27
GB201903394D0 (en) 2019-04-24
WO2020182524A1 (en) 2020-09-17
JP7241874B2 (ja) 2023-03-17
CN113615205A (zh) 2021-11-05
GB2582155A (en) 2020-09-16

Similar Documents

Publication Publication Date Title
JP6924266B2 (ja) 生成されたコンテンツを含むビデオデータを符号化するための方法および装置
US11638066B2 (en) Method, device and computer program for encapsulating media data into a media file
US20230025332A1 (en) Method, device, and computer program for improving encapsulation of media content
JP2017515336A (ja) 分割タイムドメディアデータのストリーミングを改善するための方法、デバイス、およびコンピュータプログラム
JP7249413B2 (ja) カプセル化メディアコンテンツの部分の送信を最適化する方法、装置及びコンピュータプログラム
KR20110101101A (ko) 파일 포맷 기반의 적응적 스트림 생성, 재생 방법 및 장치와 그 기록 매체
JP2013532441A (ja) 符号化マルチコンポーネント・ビデオをカプセル化する方法および装置
CN110996160B (zh) 视频处理方法、装置、电子设备及计算机可读取存储介质
US20130097334A1 (en) Method and apparatus for encapsulating coded multi-component video
JP7241874B2 (ja) カプセル化されたメディアコンテンツの利用可能な部分をシグナリングするための方法、装置、及びコンピュータプログラム
JP6632550B2 (ja) タイムピリオドにまたがってオブジェクトを識別する方法および対応デバイス
US20230370659A1 (en) Method, device, and computer program for optimizing indexing of portions of encapsulated media content data
WO2022148650A1 (en) Method, device, and computer program for encapsulating timed media content data in a single track of encapsulated media content data
US20220337922A1 (en) Methods and devices for improving storage and transmission of uncompressed data while using a standard format
US20220360831A1 (en) Method, device, and computer program for encapsulating media data into a media file
GB2620582A (en) Method, device, and computer program for improving indexing of portions of encapsulated media data
JP2013534101A (ja) 符号化マルチコンポーネント・ビデオをカプセル化する方法および装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210802

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210802

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221026

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230307

R151 Written notification of patent or utility model registration

Ref document number: 7241874

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151