JP7182727B2 - セッションのメディア・データを受信する方法、装置及びコンピュータ・プログラム - Google Patents

セッションのメディア・データを受信する方法、装置及びコンピュータ・プログラム Download PDF

Info

Publication number
JP7182727B2
JP7182727B2 JP2021554631A JP2021554631A JP7182727B2 JP 7182727 B2 JP7182727 B2 JP 7182727B2 JP 2021554631 A JP2021554631 A JP 2021554631A JP 2021554631 A JP2021554631 A JP 2021554631A JP 7182727 B2 JP7182727 B2 JP 7182727B2
Authority
JP
Japan
Prior art keywords
session
dash
sbd
period
files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021554631A
Other languages
English (en)
Other versions
JP2022525298A (ja
Inventor
ソダガァ,イラジ
Original Assignee
テンセント・アメリカ・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・アメリカ・エルエルシー filed Critical テンセント・アメリカ・エルエルシー
Publication of JP2022525298A publication Critical patent/JP2022525298A/ja
Application granted granted Critical
Publication of JP7182727B2 publication Critical patent/JP7182727B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/612Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for unicast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26258Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for generating a list of items to be played back in a given order, e.g. playlist, or scheduling item distribution according to such list
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • H04N21/4353Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream involving decryption of additional data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/643Communication protocols
    • H04N21/64322IP
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

参照による援用
本願は、2020年9月23日付で出願された米国特許出願第17/029,948号「動的適応ストリーミング・オーバーHTTPのためのセッション・ベース情報」に対する優先権の利益を主張しており、同出願は、2019年9月30日付で出願された米国仮特許出願第62/908,251号「ピリオド依存セッション・ベースDASHオペレーション」に対する優先権の利益を主張している。先の出願の開示全体は参照により全体的に本願に組み込まれる。
技術分野
本開示は、一般に、ハイパーテキスト・トランスファ・プロトコルによる動的適応ストリーミング(DASH)のためのセッション・ベース情報に関連する実施形態を述べている。
本願で提供される背景の説明は、本開示の状況を一般的に提示するためのものである。目下の発明者名による仕事は、その仕事が、出願時の先行技術としての地位を有しない可能性のあるこの背景のセクション及び明細書の態様で説明される限りにおいて、本開示に対する先行技術として明示的にも暗示的にも認められていない。
動画エキスパート・グループ(MPEG)は、セッション・ベースのDASHオペレーションに対する動的適応ストリーミング・オーバー・ハイパーテキスト・トランスファ・プロトコル(DASH)標準化において新しい部分を開始した。メディア・プレゼンテーション記述子(MPD)ファイルは、すべてのクライアントに対して汎用的であるが、クライアントは、セッション・ベース記述(SBD)ファイルのようなサイド・ファイルを取得する可能性があり、これは、MPDをセッションに対して固有にするようにクライアントに指示を与える。しかしながら、現在の設計では、単独のSBDがMPD全体に適用される。
開示の態様は、セッションのメディア・データを受信する装置を提供する。1つの装置は、メディア・プレゼンテーション記述(MPD)ファイルと1つ以上のセッション・ベース記述(SBD)ファイルとを受信する処理回路を含む。MPDファイルはセッション・ベースの動的適応ストリーミング・オーバー・ハイパーテキスト・トランスファ・プロトコル(DASH)に対する1つ以上のエッセンシャル・プロパティ記述子を含む。セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、1つ以上のSBDファイル内の異なるSBDファイルに関連付けられている。処理回路は、MPDファイルにおけるピリオドに関し、ピリオドはセッション・ベースのDASHに対する補足プロパティ記述子を有するかどうかを決定する。処理回路は、ピリオドがセッション・ベースのDASHに対する如何なる補足プロパティ記述子も有しないことに応答して、1つ以上のSBDファイルのすべてをピリオドに適用する。
一実施形態では、セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、関連するSBDファイルを識別する識別(ID)値を含む。
一実施形態では、処理回路は、ピリオドがセッション・ベースのDASHに対する補足プロパティ記述子を有することに応答して、セッション・ベースのDASHに対する補足プロパティ記述子におけるID値が、セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の1つに含まれているかどうかを判定する。
一実施形態では、処理回路は、セッション・ベースのDASHに対する補足プロパティ記述子におけるID値が、セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の1つに含まれていることに応答して、セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子におけるID値に関連する1つのSBDを、ピリオドに適用する。
一実施形態では、処理回路は、セッション・ベースのDASHに対する補足プロパティ記述子におけるID値が、セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子における如何なるID値にも対応していないことに応答して、1つ以上のSBDファイルはピリオドに適用されるべきでないことを決定する。
一実施形態では、セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、関連するSBDファイルに対するユニフォーム・リソース・ロケータ(URL)アドレスを示す属性を含む。
一実施形態では、セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、個々のエッセンシャル・プロパティ記述子がセッション・ベースのDASHに使用されることを示す属性を含み、及び、セッション・ベースのDASHに対する補足プロパティ記述子は、補足プロパティ記述子がセッション・ベースのDASHに使用されることを示す属性を含む。
一実施形態では、処理回路は、1つ以上のSBDファイルの所定の順序に基づいて、1つ以上のSBDファイルのすべてを、ピリオドに関連するリクエストに適用する。
開示の態様は、セッションのメディア・データを取り出す方法を提供する。1つの方法において、MPDファイル及び1つ以上のSBDファイルが受信される。MPDファイルはセッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子を含む。前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、1つ以上のSBDファイル内の異なるSBDファイルに関連付けられる。MPDファイルにおけるピリオドに関し、ピリオドはセッション・ベースのDASHに対する補足プロパティ記述子を有するかどうかが決定される。ピリオドがセッション・ベースのDASHに対する如何なる補足プロパティ記述子も有しないことに応答して、1つ以上のSBDファイルのすべてがピリオドに適用される。
開示の態様は、命令を記憶する非一時的なコンピュータ読み取り可能な媒体も提供し、命令は、セッションのメディア・データを受信するためにコンピュータにより実行されると、セッションのメディア・データを受信する方法のうちの任意の1つ又は組み合わせをコンピュータに実行させる。
開示される対象事項の更なる特徴、性質、及び種々の利点は、以下の詳細な説明及び添付の図面から更に明らかになるであろう。
本開示の一実施形態による例示的なセッション・ベースの動的適応ストリーミング・オーバー・ハイパーテキスト・トランスファ・プロトコル(DASH)システムを示す。
本開示の一実施形態による別の例示的なセッション・ベースのDASHシステムを示す。
セッション・ベースのDASHに対するエッセンシャル・プロパティ記述子属性をリスト化する例示的な表を示す。
セッション・ベースのDASHに対する補足プロパティ記述子属性をリスト化する例示的な表を示す。
幾つかの実施形態によるプロセス例を要約したフローチャートを示す。
一実施形態によるコンピュータ・システムの概略図である。
I.動的適応ストリーミング・オーバー・ハイパーテキスト・トランスファ・プロトコル(DASH)及びメディア・プレゼンテーション記述(MPD)
動的適応ストリーミング・オーバー・ハイパーテキスト・トランスファ・プロトコル(DASH)は、ウェブ・サーバー、コンテンツ配信ネットワーク(CDN)、各種プロキシ及びキャッシュなどのハイパーテキスト・トランスファ・プロトコル(HTTP)インフラストラクチャを使用してメディア・コンテンツのストリーミングを可能にする適応ビットレート・ストリーミング技術である。DASHは、DASHサーバーからDASHクライアントへのオンデマンド及びライブ・ストリーミングの両方をサポートし、DASHクライアントがストリーミング・セッションを制御できるようにし、その結果、DASHサーバーは、大規模な配備において、ストリーム適応管理の追加的な負荷に対処することを要しない。また、DASHは、DASHクライアントが様々なDASHサーバーからストリーミングを選択できるようにし、従って、DASHクライアントの利益に関し、ネットワークの更なるロード・バランシングを達成することが可能である。DASHは、例えば、ネットワーク条件に適応するためにビットレートを変化させることによって、異なるメディア・トラック間の動的なスイッチングを提供する。
DASHでは、メディア・プレゼンテーション記述(MPD)ファイルは、DASHサーバーからメディア・セグメントをダウンロードすることにより、メディア・コンテンツを適応的にストリーミングするための情報をDASHクライアントに提供する。MPDファイルは、分割され、部分的に配信されて、セッションのスタート・アップ遅延を減らすことが可能である。MPDファイルはまた、ストリーミング・セッション中に更新されることも可能である。幾つかの例では、MPDファイルは、コンテンツ・アクセシビリティ機能、レーティング、及びカメラ視野の表現をサポートする。DASHはまた、マルチ・ビュー及びスケーラブルなコード化されたコンテンツの配信もサポートする。
MPDファイルは、1つ以上のピリオド(period)のシーケンスを含むことが可能である。1つ以上のピリオドのそれぞれは、MPDファイルにおけるピリオド要素によって定義することが可能である。MPDファイルは、MPDに対するavailableStartTime属性と各ピリオドに対するスタート(start)属性とを含むことが可能である。動的なタイプ(例えば、ライブ・サービスに使用されるもの)のメディア・プレゼンテーションの場合、ピリオドのスタート属性とMPD属性availableStartTimeの合計及びメディア・セグメントの継続時間は、ピリオドの利用可能時間を協定世界時(UTC)の形式で、特に対応するピリオドにおける各リプレゼンテーション(representation)の第1メディア・セグメントを示すことが可能である。静的なタイプ(例えば、オンデマンド・サービスに使用されるもの)のメディア・プレゼンテーションの場合、第1ピリオドのスタート属性は0であるとすることが可能である。その他の何らかのピリオドに関し、スタート属性は、第1ピリオドのスタート時間に対する、対応するピリオドのスタート時間の間の時間オフセットを指定することが可能である。各ピリオドは、次のピリオドのスタートまで、又は最後のピリオドの場合はメディア・プレゼンテーションの終了まで延長することが可能である。ピリオドのスタート時間は正確であり、過去のすべてのピリオドのメディアを再生した結果生じる実際のタイミングを反映することが可能である。
各ピリオドは、1つ以上のアダプテーション・セット(adaptations sets)を含むことが可能であり、アダプテーション・セットの各々は、同一のメディア・コンテンツに対する1つ以上のリプレゼンテーションを含むことが可能である。リプレゼンテーションは、オーディオ又はビデオ・データの多数の代替的な符号化されたバージョンのうちの1つであるとすることが可能である。リプレゼンテーションは、符号化するタイプによって、例えばビットレート、解像度、及び/又はビデオ・データやビットレートのコーデック、及び/又はオーディオ・データのコーデックによって、相違する可能性がある。リプレゼンテーションという用語は、マルチメディア・コンテンツの特定のピリオドに対応する符号化されたオーディオ又はビデオ・データのセクションであって特定の方法で符号化されたものを指すために使用することが可能である。
特定のピリオドのアダプテーション・セットは、MPDファイルのグループ(group)属性で示されたグループに割り当てることが可能である。同じグループ内のアダプテーション・セットは、一般に、互いに代替的であると考えられる。例えば、特定のピリオドのビデオ・データの各アダプテーション・セットは同じグループに割り当てることが可能であり、その結果、対応するピリオドのマルチメディア・コンテンツのビデオ・データを表示するために、任意のアダプテーション・セットを復号化のために選択することが可能である。1つのピリオド内のメディア・コンテンツは、もし存在するならば、グループ0からの1つのアダプテーション・セット、又は幾つかの例では、非ゼロの各グループからの多くとも1つのアダプテーション・セットの組み合わせのうちの何れかによって表現することが可能である。ピリオドの各リプレゼンテーションのタイミング・データは、ピリオドのスタート時間に対して表現されることが可能である。
リプレゼンテーションは1つ以上のセグメントを含むことが可能である。各リプレゼンテーションは初期化セグメントを含むことが可能であり、あるいはリプレゼンテーションの各セグメントは自己初期化することが可能である。存在する場合、初期化セグメントは、リプレゼンテーションにアクセスするための初期化情報を含むことが可能である。場合によっては、初期化セグメントはメディア・データを含まない。セグメントは、ユニフォーム・リソース・ロケータ(URL)、ユニフォーム・リソース・ネーム(URN)、又はユニフォーム・リソース識別子(URI)のような識別子によって一意に参照することが可能である。MPDファイルは各セグメントの識別子を提供することが可能である。幾つかの例では、MPDファイルは、URL、URN、又はURIによってアクセス可能なファイル内のセグメントのデータに対応することが可能なレンジ(range)属性の形式で、バイト範囲を提供することも可能である。
各リプレゼンテーションは、1つ以上のメディア・コンポーネントを含むことも可能であり、各メディア・コンポーネントは、オーディオ、ビデオ、又は(例えば、クローズド・キャプションなどの)タイムド・テキストのような、1つの個別的なメディア・タイプの符号化されたバージョンに対応することが可能である。メディア・コンポーネントは、1つのリプレゼンテーション内で連続したメディア・セグメントの境界を横切って、時間的に連続であるとすることが可能である。
幾つかの実施形態では、DASHクライアントはDASHサーバーからMPDファイルにアクセスし、ダウンロードすることが可能である。即ち、DASHクライアントは、ライブ・セッションを開始する際に使用するMPDファイルを取り出すことが可能である。MPDファイルに基づいて、そして選択された各リプレゼンテーションに対して、DASHクライアントは幾つかの決定を行うことが可能であり、決定は、サーバー上で利用可能な最新セグメントは何であるかを決定すること、次のセグメント及び可能性のある将来のセグメントのセグメント利用スタート時間を決定すること、セグメントの再生をスタートさせる時点及びセグメント中のどのタイムラインからかを決定すること、及び新しいMPDファイルをいつ取得/獲得するかを決定することを含む。いったんサービスが再生されると、クライアントは、ライブ・サービスとそれ自身の再生との間のドリフトを追跡することが可能であり、これは検出されて補償されることを要する。
II.セッション・ベースのDASHオペレーション及びセッション・ベース記述(SBD)
MPDファイルはすべてのDASHクライアントに対して汎用であり得ることに留意すべきである。MPDファイルをDASHクライアントのセッションに特有にするために、動画エキスパート・グループ(MPEG)は、セッション・ベースのDASHオペレーションを提供する。セッション・ベースのDASHオペレーションでは、DASHクライアントは、セッション・ベース記述(SBD)ファイルのようなサイド・ファイルを受け取ることが可能であり、これは、セッション毎に場合によってはクライアント毎にMPDファイルをカスタマイズするための指示をDASHクライアントに提供する。しかしながら、幾つかの関連する例では、セッション・ベースのDASHオペレーションはアプリケーション特有である。即ち、新しいアプリケーション各々について、新しいSBDフォーマットが要求される。
本開示は、すべてのセッション・ベースのアプリケーションに対して単一の解決策を提供することが可能な一般化されたSBDフォーマットを提示する。
図1は、本開示の実施形態によるセッション・ベースのDASHオペレーション(100)の例示的なアーキテクチャを示す。セッション・ベースのDASHオペレーション・アーキテクチャ(100)では、MPDファイルがDASHサーバー(101)(例えば、コンテンツ・サーバー)からDASHクライアント(102)に送信される。DASHクライアント(102)は、MPDファイルに基づいてDASHサーバー(101)からメディア・セグメントを受信することが可能である。更に、DASHクライアント(102)は、DASHサーバー(101)又は第三者(例えば、セッション・コントローラ)からSBDファイルを受信することが可能である。
開示の態様によれば、SBDファイルは、複数の時間範囲と対応するキー-バリュー・ペア(key-value pairs)(又はネーム-バリュー・ペア(name-value pairs))を、追加的なメタデータとともに含むことが可能である。SBDファイルは、例えばURLによって、MPDファイル内で参照することが可能である。SBDファイルは、DASHクライアント(102)によって受信されるMPDファイルを、DASHクライアント(102)のセッションに固有であるようにカスタマイズするために使用することが可能である。例えば、SBDファイルは、固有のセッション毎のMPDを生成することなく、セッション固有の要素をセグメントURLに追加することが可能である。
図2は、本開示の実施形態による別の例示的なセッション・ベースのDASHオペレーション・アーキテクチャ200を示す。セッション・ベースのDASHオペレーション・アーキテクチャ200では、マルチメディア・コンテンツは、オーディオ・ソース(例えば、マイクロホン)及びビデオ・ソース(例えば、ビデオ・カメラ)を含むことが可能なコンテンツ生成デバイス(201)(例えば、スマートフォン)によって準備及び生成される。マルチメディア・コンテンツは、コンテンツ生成デバイス(201)によって記憶されるか、又は様々なマルチメディア・コンテンツを記憶することができるコンテンツ・サーバー(202)へ送信することが可能である。コンテンツ・サーバー(202)は、マルチメディア・コンテンツの1つ以上のメディア・セグメントについて、DASHアクセス・クライアント203のようなクライアント・デバイスから、リクエストを受信することが可能である。マルチメディア・コンテンツはMPDファイルによって記述され、MPDファイルは、コンテンツ・サーバー(202)によって記憶及び更新され、DASHアクセス・クライアント(203)を含むクライアント・デバイスによって、メディア・セグメントを検索するためにアクセスされる。
セッション特有のメディア・セグメントを検索するために、DASHアクセス・クライアント(203)は、SBDファイルにアクセスするためにリクエストをSBDクライアント(204)へ送信することが可能であり、SBDファイルは、SBDクライアント(204)によって受信されており、現在のセッションに対する複数の時間範囲と対応するキー-バリュー・ペアを含む。例えば、DASHアクセス・クライアント(203)は、キー・ネームと時間範囲をSBDクライアント(204)へ送信することが可能であり、SBDクライアント(204)は、キー・ネームと時間範囲を解析し、キー・ネームと時間範囲に対応する値をDASHアクセス・クライアント(203)に返す。DASHアクセス・クライアント(203)はその値をセグメントURLのクエリに値に含めることが可能であり、クエリは、セグメント・リクエストがHTTP GET又はパーシャルGETリクエストである場合に、セッション固有のメディア・セグメントを要求するためにコンテンツ・サーバー(202)へ送信されることが可能である。
SBDクライアント(204)は、セッション・コントローラ(205)やセッション・コントローラ(206)のような異なるセッション・コントローラから、複数のSBDファイルを受信できることに留意すべきである。
開示の態様によれば、コンテンツ・サーバー(202)(例えば、DASHサーバー)の機能の一部又は全部は、コンテンツ配信ネットワーク(CDN)の1つ以上のデバイス、例えばルーター、ブリッジ、プロキシ・デバイス、スイッチ、又は他のデバイスにおいて実現することが可能である。コンテンツ・サーバー(202)は、クライアント・デバイス(例えば、DASHアクセス・クライアント(203))からネットワーク・リクエストを受信するように構成されたリクエスト処理ユニットを含むことが可能である。例えば、リクエスト処理ユニットは、HTTP GET又はパーシャルGETリクエストを受信し、リクエストに応じてマルチメディア・コンテンツのデータを提供するように構成されることが可能である。リクエストはセグメントのURLを使用してセグメントを指定することが可能である。幾つかの例では、リクエストはセグメントの1つ以上のバイト範囲を指定することが可能であり、即ちパーシャルGETリクエストを含んでいる。リクエスト処理ユニットは、HTTP HEADリクエストに応対してセグメントのヘッダ・データを提供するように更に構成されることが可能である。
幾つかの実施形態では、コンテンツ生成デバイス(201)及びコンテンツ・サーバー(202)は、無線ネットワーク又は有線ネットワークによって結合することが可能であるし、又は直接的に通信可能に結合することが可能である。
幾つかの実施形態では、コンテンツ生成デバイス(201)及びコンテンツ・サーバー(202)は、同じデバイスに含めることが可能である。
幾つかの実施形態では、コンテンツ・サーバー(202)及びセッション・コントローラ(205)-(206)は、同じデバイスに含めることが可能である。
幾つかの実施形態では、コンテンツ・サーバー(202)及びDASHアクセス・クライアント(203)は、無線ネットワーク又は有線ネットワークによって結合することが可能である。
幾つかの実施形態では、SBDクライアント(204)及びセッション・コントローラ(205)-(206)は、無線ネットワーク又は有線ネットワークによって結合することが可能であるし、又は直接的に通信可能に結合することが可能である。
幾つかの実施形態では、DASHアクセス・クライアント(203)及びSBDクライアント(204)は、同じデバイスに含めることが可能である。
開示の態様によれば、複数のSBDをMPDにリンクするために、セッション・ベースのDASHに関する1つ以上のエッセンシャル・プロパティ記述子をMPDレベルで使用することが可能であり、セッション・ベースのDASHに関する各々のエッセンシャル・プロパティ記述子は、類似又は同一のエッセンシャル・プロパティ記述子属性を含む。
図3は、本開示の幾つかの実施形態による、セッション・ベースのDASHに関するエッセンシャル・プロパティ記述子属性を、MPDレベルでリスト化した例示的な表(300)を示す。テーブル(300)では、属性(attribute)@schemeIdUriは、例えば“urn:mpeg:dash:session-based-description:2019”であるように設定され、表(300)でリスト化されているエッセンシャル・プロパティ記述子属性はセッション・ベースのDASHに使用されることを示す。例えば、@id属性の異なる値がこのMPDの異なるSBDファイルを識別できるように、属性@idがSBDファイルを識別するために使用される。従って、MPDは、セッション・ベースのDASH (例えば、1つ以上のテーブル(300))について1つ以上のエッセンシャル・プロパティ記述子を有することが可能であり、各々は異なるSBDファイルに対応する。更に、セッション・ベースのDASHに対する各エッセンシャル・プロパティ記述子における属性@は、対応するSBDファイルのURLを示すために使用される。1つ以上のこれらのSBDは、ピリオド・レベルでのシグナリングに依存して、セッションの任意の瞬間にアクティブであり得ることに留意すべきである。
開示の態様によれば、様々なSBDを様々なピリオドに適用するために、セッション・ベースのDASHに対する補足プロパティ記述子を、ピリオド・レベルで許容することが可能である。セッション・ベースのDASHに対する補足プロパティ記述子は、どのSBDファイルがピリオドに適用できるかを定義することが可能である。
図4は、本開示の幾つかの実施形態による、セッション・ベースのDASHに対する補足プロパティ記述子属性を、ピリオド・レベルでリスト化した例示的な表(400)を示す。即ち、MPDの各ピリオドは、そのような補足プロパティ記述子テーブル(400)を有することが可能である。テーブル(400)では、属性@schemeIdUriは、例えば“urn:mpeg:dash:session-based-description:2019”であるように設定され、表(400)でリスト化されている補足プロパティ記述子属性はセッション・ベースのDASHに使用されることを示す。例えば、属性@idは、どのSBDファイルが対応するピリオドに適用されるかを識別するために使用される。あるピリオドに関し、テーブル(400)における@id値がテーブル(300)における@id値に等しい場合、テーブル(300)の@id値に対応するSBDファイルを、そのピリオドに適用することが可能である。テーブル(400)における@id値がテーブル(300)における如何なる@id値にも等しくない場合、SBDファイルをピリオドに適用することはできない。ピリオドに関し、テーブル(300)で使用されるものと同じ@schemeIdUriを有する如何なる補足プロパティ記述子も存在しない場合、表(300)にリスト化されているすべてのSBDファイルを、そのピリオドに適用することが可能である。実施形態では、これらのSBDファイルの適用順序は、これらのSBDファイルに対応するエッセンシャル・プロパティ記述子の順序、例えば、拡張可能マークアップ言語(XML)フォーマットにおける左から右へ(又は上から下へ)の順序に従う。
例えば、テーブル(300)では、@id値は1又は2にすることが可能であり、@id=1はSBD[0]に対応し、@id=2はSBD[1]に対応する。ピリオド1に関し、テーブル(400)における@id値は1であるように設定され、これはSBD[0]をピリオド1に適用できることを示す。ピリオド2に関し、テーブル(400)が存在せず、又はテーブル(400)における@ schemeIdUri値がテーブル(300)における@schemeIdUri値と同じではなく、これは、SBD[0]とSBD[1]の両方をピリオド2に適用できることを示す。ピリオド3に関し、テーブル(400)における@id値は3であるように設定され、これはSBDをピリオド3に適用できないことを示す。
開示の態様によれば、MPD及びSBD間をリンクすることをシグナリングするために、MPDに追加されるリンク情報以外に、MPDに追加される追加情報は存在しない。リンク情報に基づいて、1つ以上のSBDは、MPDレベルにおける@idインジケータを用いて記述され且つ分離されることが可能である。どのSBDをMPDの各ピリオドに適用できるかは、ピリオド・レベルで追加される情報に基づいて決定される。
実施形態では、ピリオドに関し、補足プロパティ記述子@schemeIdUriが、MPDレベルにおけるエッセンシャル・プロパティ記述子@schemeIdUriと同一でない場合、エッセンシャル・プロパティ記述子@id及び@valueに対応する全てのSBDをピリオドに適用することが可能である。補足プロパティ記述子@schemeIdUriが、MPDレベルのエッセンシャル・プロパティ記述子@schemeIdUriと同じであれば、1つ以上のSBDをピリオドに適用することが可能である。一例では、ピリオドの補足プロパティ記述子におけるピリオド要素@idが、MPDエッセンシャル・プロパティ記述子でリスト化されている@id値の1つに等しい場合、ピリオド要素@idに対応するSBDをそのピリオドに適用することが可能である。一例では、ピリオドの補足プロパティ記述子におけるピリオド要素@idが、MPDエッセンシャル・プロパティ記述子でリスト化されている@id値の何れにも等しくない場合、SBDをピリオドに適用することはできない。
開示の態様によれば、1つ以上のSBDファイルがピリオドに適用される場合、1つ以上のSBDファイルは、このピリオド中にリクエストに適用されることが可能である。例えば、リクエストは、セグメント・リクエスト、MPD更新リクエスト、又はXMLリンキング言語(XLINK)リクエストであるとすることが可能である。各SBDファイルの1つ以上のキー-バリュー・ペアを、リクエストのURLのクエリに追加するか、又はリクエストのHTTPヘッダに含めることが可能である。リクエストは、一例ではDASHクライアント(102)からDASHサーバー(101)へ送信されること、別の例ではDASHアクセス・クライアント(203)からコンテンツ・サーバー(202)へ送信されることが可能である。
実施形態では、複数のSBDファイルがリクエストに適用される場合、複数のSBDファイルは、所定の順序、例えば左から右へ、又はXMLフォーマットにおいて上から下への順序に従って適用される。
III.フローチャート
図5は、本開示の実施形態によるプロセス(500)を要約したフローチャートを示す。様々な実施形態において、プロセス(500)は、DASHクライアント(102)における処理回路、DASHアクセス・クライアント(203)における処理回路、SBDクライアント(204)における処理回路のような処理回路によって実行される。幾つかの実施形態において、プロセス(500)は、ソフトウェア命令で実現され、従って、処理回路がソフトウェア命令を実行すると、処理回路はプロセス(500)を実行する。プロセス(500)は(S510)から始まり、プロセス(500)はMPDファイル及び1つ以上のSBDファイルを受信する。MPDファイルは、セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子を含む。セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、1つ以上のSBDファイル内の異なるSBDファイルに関連付けられている。実施形態では、セッション・ベースDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、関連するSBDファイルを識別するID値を含む。次いで、プロセス(500)はステップ(520)に進む。
ステップ(520)において、プロセス(500)は、MPDファイル内のピリオドに関し、ピリオドがセッション・ベースのDASHに対する補足プロパティ記述子を有するかどうかを判定する。ピリオドがセッション・ベースのDASHに対する補足プロパティ記述子を有しないと判定された場合、プロセス(500)はステップ(S530)に進む。そうではない場合、プロセス(500)はステップ(S540)に進む。
ステップ(S530)において、プロセス(500)は1つ以上のSBDファイルのすべてをピリオドに適用する。
ステップ(S540)において、プロセス(500)は、セッション・ベースのDASHに対する補足プロパティ記述子のID値が、セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の1つに含まれているかどうかを判定する。セッション・ベースのDASHに対する補足プロパティ記述子のID値が、セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の1つに含まれていると判定された場合、プロセス(500)はステップ(S550)に進む。そうではない場合、プロセス(500)はステップ(S560)に進む。
ステップ(S550)において、プロセス(500)は、セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子のID値に関連付けられた1つのSBDファイルを、そのピリオドに適用する。
ステップ(S560)において、プロセス(500)は、1つ以上のSBDファイルの何れもピリオドに適用しないことを決定する。
そして、プロセス(500)は終了する。
実施形態では、セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、関連するSBDファイルのユニフォーム・リソース・ロケータ(URL)アドレスを示す属性を含む。
実施形態では、セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、それぞれのエッセンシャル・プロパティ記述子がセッション・ベースのDASHに使用されることを示す属性を含み、セッション・ベースのDASHに対する補足プロパティ記述子は、補足プロパティ記述子がセッション・ベースのDASHに対して使用されることを示す属性を含む。
実施形態では、処理回路は、1つ以上のSBDファイルの所定の順序に基づいて、1つ以上のSBDファイルの全てを、ピリオドに関連付けられたリクエストに適用する。
IV.コンピュータ・システム
上述した技術は、コンピュータ読み取り可能な命令を用いるコンピュータ・ソフトウェアであって、1つ以上のコンピュータ読み取り可能な媒体に物理的に記憶されるものとして実装することが可能である。例えば、図6は、開示される対象事項の特定の実施形態を実施するのに適したコンピュータ・システム(900)を示す。
コンピュータ・ソフトウェアは、直接的に又は解釈、マイクロコード実行等を介して、1つ以上のコンピュータ中央処理ユニット(CPU)、グラフィックス処理ユニット(GPU)等によって実行されることが可能な命令を含むコードを生成するために、アセンブリ、コンパイル、リンク等のメカニズムの影響を受けることが可能な、任意の適切なマシン・コード又はコンピュータ言語を使用してコーディングされることが可能である。
命令は、例えば、パーソナル・コンピュータ、タブレット・コンピュータ、サーバー、スマートフォン、ゲーミング・デバイス、モノのインターネット(IoT)デバイス等を含む、種々の種類のコンピュータ又はその構成要素において実行されることが可能である。
コンピュータ・システム(600)に関する図6に示される構成要素は、本質的に例示的なものであり、本開示の実施形態を実現するコンピュータ・ソフトウェアの用途又は機能性の範囲に関する如何なる限定も示唆するようには意図されていない。また、構成要素の構成は、コンピュータ・システム(600)の例示的な実施形態に示される構成要素の任意の1つ又は組み合わせに関する何らかの従属性又は要件を有するものとして解釈されるべきではない。
コンピュータ・システム(600)は、特定のヒューマン・インターフェース入力デバイスを含んでもよい。このようなヒューマン・インターフェース入力デバイスは、例えば、触覚入力(例えば、キーストローク、スワイプ、データ・グローブの動き)、オーディオ入力(例えば、声、拍手)、視覚入力(例えば、ジェスチャ)、嗅覚入力(図示せず)を介して、1人以上の人間ユーザーによる入力に応答することができる。また、ヒューマン・インターフェース・デバイスは、オーディオ(例えば、会話、音楽、周囲の音)、画像(例えば、スキャンされた画像、静止画像カメラから得られる写真画像)、ビデオ(例えば、2次元ビデオ、立体ビデオを含む3次元ビデオ)のような、人間による意識的入力に必ずしも直接的に関係しない特定のメディアを捕捉するために使用することも可能である。
入力ヒューマン・インターフェース・デバイスは、キーボード(601)、マウス(602)、トラックパッド(603)、タッチ・スクリーン(610)、データ・グローブ(図示せず)、ジョイスティック(605)、マイクロホン(606)、スキャナ(607)、カメラ(608)のうちの1つ以上を(各々1つしか描いていないが)含んでもよい。
コンピュータ・システム(600)は、特定のヒューマン・インターフェース出力デバイスを含むことも可能である。このようなヒューマン・インターフェース出力デバイスは、例えば、触覚出力、音、光、及び匂い/味を通じて、1人以上の人間ユーザーの感覚を刺激することができる。このようなヒューマン・インターフェース出力デバイスは、触覚出力デバイス(例えば、タッチ・スクリーン(610)、データ・グローブ(図示せず)、ジョイスティック(605)による触覚フィードバックであるが、入力デバイスとして機能しない触覚フィードバック・デバイスであるとすることも可能である)、オーディオ出力デバイス(例えば、スピーカー(609)、ヘッドフォン(図示せず))、視覚的出力デバイス(CRTスクリーン、LCDスクリーン、プラズマ・スクリーン、OLEDスクリーンを含むスクリーン(610)であって、各々はタッチ・スクリーン入力機能を備えているか又は備えておらず、各々は触覚フィードバック能力を備えているか又は備えておらず、それらの内の一部は、ステレオ投影出力のような手段を介して、2次元視覚出力又は3次元以上の次元の出力を出力することが可能であるもの;仮想現実眼鏡(図示せず)、ホログラフィック・ディスプレイ及びスモーク・タンク(図示せず))、及びプリンタ(図示せず)を含むことができる。これらの視覚的な出力デバイス(スクリーン(610)など)は、グラフィックス・アダプタ(650)を介してシステム・バス(648)に接続することが可能である。
コンピュータ・システム(600)は、CD/DVD又は類似の媒体(621)を有するCD/DVD ROM/RW(620)を含む光媒体、サム・ドライブ(922)、取り外し可能なハード・ドライブ又はソリッド・ステート・ドライブ(623)、テープ及びフロッピー・ディスク(図示せず)のようなレガシー磁気媒体、セキュリティ・ドングル(図示せず)のような特殊化されたROM/ASIC/PLDベースのデバイスなどのような、人間がアクセスできる記憶装置及びそれらの関連媒体を含むことも可能である。
当業者は、本開示の対象事項に関連して使用される用語「コンピュータ読み取り可能な媒体」は、伝送媒体、搬送波、又は他の一時的な信号を包含しないことも理解するはずである。
コンピュータ・システム(600)は、1つ以上の通信ネットワークに対するインターフェースを含むことも可能である。1つ以上の通信ネットワーク(655)は、例えば、無線、有線、光であるとすることが可能である。1つ以上の通信ネットワークは、更に、ローカル、ワイド・エリア、メトロポリタン、車両及びインダストリアル、リアルタイム、遅延耐性などであるとすることが可能である。1つ以上の通信ネットワーク(655)の例は、イーサーネット、無線LAN、セルラー・ネットワーク(GSM、3G、4G、5G、LTEなどを含む)、TV有線又は無線ワイド・エリア・デジタル・ネットワーク(ケーブルTV、衛星TV、地上放送TVを含む)、CANBusを含む車両及びインダストリアル等を含む。特定のネットワークは、一般に、特定の汎用データ・ポート又は周辺バス(649)に接続される外部ネットワーク・インターフェース・アダプタ(例えば、コンピュータ・システム(600)のUSBポート)を必要とし;他のネットワークは、一般に、後述するようなシステム・バスへの接続によって、コンピュータ・システム(600)のコアに組み込まれる(例えば、イーサーネット・インターフェースはPCコンピュータ・システムに組み込まれ、セルラー・ネットワーク・インターフェースはスマートフォン・コンピュータ・システムに組み込まれる)。これらの任意のネットワークを使用して、コンピュータ・システム(600)は、他のエンティティと通信することができる。このような通信は、片-指向性、受信専用(例えば、放送TV)、片-指向性送信専用(例えば、特定のCANbusデバイスに対するCANbus)、又は、双-指向性、例えばローカル又はワイド・エリア・デジタル・ネットワークを使用する他のコンピュータ・システムに対するものであるとすることが可能である。特定のプロトコル及びプロトコル・スタックは、上述のように、それらのネットワーク及びネットワーク・インターフェースの各々で使用されることが可能である。
前述のヒューマン・インターフェース・デバイス、人間がアクセス可能な記憶装置、及びネットワーク・インターフェースは、コンピュータ・システム(600)のコア(640)に取り付けることが可能である。
コア(640)は、1つ以上の中央処理ユニット(CPU)(641)、グラフィックス処理ユニット(GPU)(642)、フィールド・プログラマブル・ゲート・エリア(FPGA)(943)の形式における特定のプログラマブル処理ユニット、特定のタスクのためのハードウェア・アクセラレータ(644)などを含むことが可能である。これらのデバイスは、リード・オンリ・メモリ(ROM)(645)、ランダム・アクセス・メモリ(RAM)(646)、内部大容量ストレージ、例えば内部のユーザー・アクセス不能なハード・ドライブ、SSD、及び類似のもの(647)と共に、システム・バス(648)を介して接続されてもよい。幾つかのコンピュータ・システムでは、システム・バス(648)は、追加のCPU、GPUなどによる拡張を可能にするために、1つ以上の物理プラグの形式でアクセス可能であるとすることが可能である。周辺デバイスは、コアのシステム・バス(648)に直接的に或いは周辺バス(949)を介して取り付けることが可能である。周辺バスのアーキテクチャは、PCI、USB等を含む。
CPU(641)、GPU(642)、FPGA(643)、及びアクセラレータ(644)は、組み合わされて、上述のコンピュータ・コードを構築することが可能な特定の命令を実行することが可能である。そのコンピュータ・コードは、ROM(645)又はRAM(646)に記憶することが可能である。一時的なデータはRAM(646)に記憶することも可能である一方、永続的なデータは、例えば内部大容量ストレージ(647)に記憶することが可能である。1つ以上のCPU(641)、GPU(642)、大容量ストレージ(647)、ROM(645)、RAM(646)などと密接に関連付けることが可能なキャッシュ・メモリを使用することによって、任意のメモリ・デバイスに対する高速な記憶及び検索を可能にすることができる。
コンピュータ読み取り可能な媒体は、様々なコンピュータ実装動作を実行するためのコンピュータ・コードをそこに含むことが可能である。媒体及びコンピュータ・コードは、本開示の目的のために特別に設計及び構築されたものであるとすることが可能であり、或いはそれらは、コンピュータ・ソフトウェア分野の当業者に周知で利用可能な種類のものであるとすることが可能である。
限定ではなく一例として、アーキテクチャ(600)、具体的にはコア(640)を有するコンピュータ・システムは、1つ以上の有形のコンピュータ読み取り可能な媒体に具現化されたソフトウェアを実行するプロセッサ(CPU、GPU、FPGA、アクセラレータ等を含む)に由来する機能を提供することができる。そのようなコンピュータ読み取り可能な媒体は、コア内部大容量ストレージ(647)又はROM(645)のような非一時的な性質のコア(640)の特定のストレージと同様に、上述したようなユーザー・アクセス可能な大容量ストレージに関連する媒体であるとすることが可能である。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに記憶され、コア(640)によって実行されることが可能である。コンピュータ読み取り可能な媒体は、特定のニーズに応じて、1つ以上のメモリ・デバイス又はチップを含むことが可能である。ソフトウェアは、コア(640)、特にその中のプロセッサ(CPU、GPU、FPGAなどを含む)が、RAM(646)に記憶されたデータ構造を定め、そのようなデータ構造をソフトウェアによって定められたプロセスに従って修正することを含む、本願で説明される特定のプロセス又は特定のプロセスの特定の部分を実行することを引き起こすことが可能である。更に又は代替として、コンピュータ・システムは、回路(例えば、アクセラレータ(644))内に配線されたロジック又はその他の方法で組み込まれたものに由来する機能を提供することが可能であり、回路は、本願で説明される特定のプロセス又は特定のプロセスの特定の部分を実行するために、ソフトウェアの代わりに又はソフトウェアと共に動作することが可能である。ソフトウェアに対する言及は、ロジックを含むことが可能であり、必要に応じてその逆も可能である。コンピュータ読み取り可能な媒体に対する参照は、実行用のソフトウェアを記憶する回路(例えば、集積回路(IC))、実行用のロジックを具現化する回路、又は適切な場合にはそれら両方を含むことが可能である。本開示は、ハードウェア及びソフトウェアの任意の適切な組み合わせを包含する。
本開示は、幾つかの例示的な非限定的な実施例を説明しているが、本開示の範囲内に該当する変更、置換、及び種々の代替的な均等物が存在する。従って、本願で明示的には図示も説明もされていないが、本開示の原理を具現化し、従って本願の精神及び範囲内にある多くのシステム及び方法を、当業者は案出することが可能であろうということが、認められるであろう。
(付記1)
セッションのメディア・データを受信する方法であって、
メディア・プレゼンテーション記述(MPD)ファイルと1つ以上のセッション・ベース記述(SBD)ファイルとを受信するステップであって、前記MPDファイルはセッション・ベースの動的適応ストリーミング・オーバー・ハイパーテキスト・トランスファ・プロトコル(DASH)に対する1つ以上のエッセンシャル・プロパティ記述子を含み、前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、前記1つ以上のSBDファイル内の異なるSBDファイルに関連付けられている、ステップと、
前記MPDファイルにおけるピリオドに関し、前記ピリオドはセッション・ベースのDASHに対する補足プロパティ記述子を有するかどうかを決定するステップと、
前記ピリオドがセッション・ベースのDASHに対する如何なる補足プロパティ記述子も有しないことに応答して、前記1つ以上のSBDファイルのすべてを前記ピリオドに適用するステップと
を含む方法。
(付記2)
前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、関連するSBDファイルを識別する識別(ID)値を含んでいる、付記1に記載の方法。
(付記3)
前記ピリオドが前記セッション・ベースのDASHに対する補足プロパティ記述子を有することに応答して、前記セッション・ベースのDASHに対する補足プロパティ記述子におけるID値が、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子の1つに含まれているかどうかを判定するステップ
を更に含む付記2に記載の方法。
(付記4)
前記セッション・ベースのDASHに対する補足プロパティ記述子における前記ID値が、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子の1つに含まれていることに応答して、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子における前記ID値に関連する1つのSBDを、前記ピリオドに適用するステップ
を更に含む付記3に記載の方法。
(付記5)
前記セッション・ベースのDASHに対する補足プロパティ記述子における前記ID値が、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子における如何なるID値にも対応していないことに応答して、前記1つ以上のSBDファイルは前記ピリオドに適用されるべきでないことを決定するステップ
を更に含む付記3に記載の方法。
(付記6)
前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、関連するSBDファイルに対するユニフォーム・リソース・ロケータ(URL)アドレスを示す属性を含んでいる、付記1に記載の方法。
(付記7)
前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、個々のエッセンシャル・プロパティ記述子がセッション・ベースのDASHに使用されることを示す属性を含み、及び
前記セッション・ベースのDASHに対する補足プロパティ記述子は、前記補足プロパティ記述子がセッション・ベースのDASHに使用されることを示す属性を含んでいる、付記1に記載の方法。
(付記8)
前記適用するステップは、更に、
前記1つ以上のSBDファイルの所定の順序に基づいて、前記1つ以上のSBDファイルのすべてを、前記ピリオドに関連するリクエストに適用するステップ
を含む、付記1に記載の方法。
(付記9)
セッションのメディア・データを受信する、処理回路を含む装置であって、
前記処理回路は、メディア・プレゼンテーション記述(MPD)ファイルと1つ以上のセッション・ベース記述(SBD)ファイルとを受信するように構成され、前記MPDファイルはセッション・ベースの動的適応ストリーミング・オーバー・ハイパーテキスト・トランスファ・プロトコル(DASH)に対する1つ以上のエッセンシャル・プロパティ記述子を含み、前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、前記1つ以上のSBDファイル内の異なるSBDファイルに関連付けられており、
前記処理回路は、前記MPDファイルにおけるピリオドに関し、前記ピリオドはセッション・ベースのDASHに対する補足プロパティ記述子を有するかどうかを決定するように構成され、
前記処理回路は、前記ピリオドがセッション・ベースのDASHに対する如何なる補足プロパティ記述子も有しないことに応答して、前記1つ以上のSBDファイルのすべてを前記ピリオドに適用するように構成されている、装置。
(付記10)
前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、関連するSBDファイルを識別する識別(ID)値を含んでいる、付記9に記載の装置。
(付記11)
前記処理回路は、更に、
前記ピリオドが前記セッション・ベースのDASHに対する補足プロパティ記述子を有することに応答して、前記セッション・ベースのDASHに対する補足プロパティ記述子におけるID値が、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子の1つに含まれているかどうかを判定するように構成されている、付記10に記載の装置。
(付記12)
前記処理回路は、更に、
前記セッション・ベースのDASHに対する補足プロパティ記述子における前記ID値が、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子の1つに含まれていることに応答して、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子における前記ID値に関連する1つのSBDを、前記ピリオドに適用するように構成されている、付記11に記載の装置。
(付記13)
前記処理回路は、更に、
前記セッション・ベースのDASHに対する補足プロパティ記述子における前記ID値が、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子における如何なるID値にも対応していないことに応答して、前記1つ以上のSBDファイルは前記ピリオドに適用されるべきでないことを決定するように構成されている、付記11に記載の装置。
(付記14)
前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、関連するSBDファイルに対するユニフォーム・リソース・ロケータ(URL)アドレスを示す属性を含んでいる、付記9に記載の装置。
(付記15)
前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、個々のエッセンシャル・プロパティ記述子がセッション・ベースのDASHに使用されることを示す属性を含み、及び
前記セッション・ベースのDASHに対する補足プロパティ記述子は、前記補足プロパティ記述子がセッション・ベースのDASHに使用されることを示す属性を含んでいる、付記9に記載の装置。
(付記16)
前記処理回路は、更に、
前記1つ以上のSBDファイルの所定の順序に基づいて、前記1つ以上のSBDファイルのすべてを、前記ピリオドに関連するリクエストに適用するように構成されている、付記9に記載の装置。
(付記17)
命令を記憶する非一時的なコンピュータ読み取り可能な媒体であって、前記命令は、セッションのメディア・データを受信するためにコンピュータにより実行されると、コンピュータに、
メディア・プレゼンテーション記述(MPD)ファイルと1つ以上のセッション・ベース記述(SBD)ファイルとを受信するステップであって、前記MPDファイルはセッション・ベースの動的適応ストリーミング・オーバー・ハイパーテキスト・トランスファ・プロトコル(DASH)に対する1つ以上のエッセンシャル・プロパティ記述子を含み、前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、前記1つ以上のSBDファイル内の異なるSBDファイルに関連付けられている、ステップと、
前記MPDファイルにおけるピリオドに関し、前記ピリオドはセッション・ベースのDASHに対する補足プロパティ記述子を有するかどうかを決定するステップと、
前記ピリオドがセッション・ベースのDASHに対する如何なる補足プロパティ記述子も有しないことに応答して、前記1つ以上のSBDファイルのすべてを前記ピリオドに適用するステップと
を実行させる、媒体。
(付記18)
前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、関連するSBDファイルを識別する識別(ID)値を含んでいる、付記17に記載の非一時的なコンピュータ読み取り可能な媒体。
(付記19)
記憶されている前記命令は、前記コンピュータに:
前記ピリオドが前記セッション・ベースのDASHに対する補足プロパティ記述子を有することに応答して、前記セッション・ベースのDASHに対する補足プロパティ記述子におけるID値が、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子の1つに含まれているかどうかを判定するステップ
を実行させる、付記18に記載の非一時的なコンピュータ読み取り可能な媒体。
(付記20)
記憶されている前記命令は、前記コンピュータに:
前記セッション・ベースのDASHに対する補足プロパティ記述子における前記ID値が、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子の1つに含まれていることに応答して、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子における前記ID値に関連する1つのSBDを、前記ピリオドに適用するステップ
を実行させる、付記19に記載の非一時的なコンピュータ読み取り可能な媒体。


Claims (10)

  1. セッションのメディア・データを受信する方法であって、
    メディア・プレゼンテーション記述(MPD)ファイルと1つ以上のセッション・ベース記述(SBD)ファイルとを受信するステップであって、前記MPDファイルはセッション・ベースの動的適応ストリーミング・オーバー・ハイパーテキスト・トランスファ・プロトコル(DASH)に対する1つ以上のエッセンシャル・プロパティ記述子と1つ以上のピリオドとを含み、前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、前記1つ以上のSBDファイル内の異なるSBDファイルに関連付けられ、前記1つ以上のピリオドの各々は異なる開始時間に関連付けられている、ステップと、
    前記MPDファイルにおける前記1つ以上のピリオドのうちの1つに関し、前記ピリオドはセッション・ベースのDASHに対する補足プロパティ記述子を有するかどうかを決定するステップと、
    前記1つ以上のピリオドのうちの1つのピリオドがセッション・ベースのDASHに対する如何なる補足プロパティ記述子も有しないことに応答して、前記1つ以上のSBDファイルのすべてを、前記1つ以上のピリオドのうちの1つのピリオドに適用するステップと
    を含む方法。
  2. 前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、関連するSBDファイルを識別する識別(ID)値を含んでいる、請求項1に記載の方法。
  3. 前記1つ以上のピリオドのうちの1つのピリオドが前記セッション・ベースのDASHに対する補足プロパティ記述子を有することに応答して、前記セッション・ベースのDASHに対する補足プロパティ記述子におけるID値が、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子の1つに含まれているかどうかを判定するステップ
    を更に含む請求項2に記載の方法。
  4. 前記セッション・ベースのDASHに対する補足プロパティ記述子における前記ID値が、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子の1つに含まれていることに応答して、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子の1つにおける前記ID値に関連する1つのSBDを、前記1つ以上のピリオドのうちの1つのピリオドに適用するステップ
    を更に含む請求項3に記載の方法。
  5. 前記セッション・ベースのDASHに対する補足プロパティ記述子における前記ID値が、前記セッション・ベースのDASHに対する前記1つ以上のエッセンシャル・プロパティ記述子における如何なるID値にも対応していないことに応答して、前記1つ以上のSBDファイルは、前記1つ以上のピリオドのうちの1つのピリオドに適用されるべきでないことを決定するステップ
    を更に含む請求項3に記載の方法。
  6. 前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、関連するSBDファイルに対するユニフォーム・リソース・ロケータ(URL)アドレスを示す属性を含んでいる、請求項1-5のうちの何れか1項に記載の方法。
  7. 前記セッション・ベースのDASHに対する1つ以上のエッセンシャル・プロパティ記述子の各々は、個々のエッセンシャル・プロパティ記述子がセッション・ベースのDASHに使用されることを示す属性を含み、及び
    前記セッション・ベースのDASHに対する補足プロパティ記述子は、前記補足プロパティ記述子がセッション・ベースのDASHに使用されることを示す属性を含んでいる、請求項1-6のうちの何れか1項に記載の方法。
  8. 前記適用するステップは、更に、
    前記1つ以上のSBDファイルの所定の順序に基づいて、前記1つ以上のSBDファイルのすべてを、前記1つ以上のピリオドのうちの1つのピリオドに関連するリクエストに適用するステップ
    を含む、請求項1-7のうちの何れか1項に記載の方法。
  9. セッションのメディア・データを受信する装置であって、請求項1-8のうちの何れか1項に記載の方法を実行する処理回路を有する装置。
  10. 請求項1-8のうちの何れか1項に記載の方法を装置のコンピュータに実行させるコンピュータ・プログラム。
JP2021554631A 2019-09-30 2020-09-25 セッションのメディア・データを受信する方法、装置及びコンピュータ・プログラム Active JP7182727B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962908251P 2019-09-30 2019-09-30
US62/908,251 2019-09-30
US17/029,948 2020-09-23
US17/029,948 US11616822B2 (en) 2019-09-30 2020-09-23 Session-based information for dynamic adaptive streaming over HTTP
PCT/US2020/052804 WO2021067139A1 (en) 2019-09-30 2020-09-25 Session-based information for dynamic adaptive streaming over http

Publications (2)

Publication Number Publication Date
JP2022525298A JP2022525298A (ja) 2022-05-12
JP7182727B2 true JP7182727B2 (ja) 2022-12-02

Family

ID=75162337

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021554631A Active JP7182727B2 (ja) 2019-09-30 2020-09-25 セッションのメディア・データを受信する方法、装置及びコンピュータ・プログラム

Country Status (6)

Country Link
US (2) US11616822B2 (ja)
EP (1) EP4038859A4 (ja)
JP (1) JP7182727B2 (ja)
KR (1) KR102632387B1 (ja)
CN (2) CN113748659B (ja)
WO (1) WO2021067139A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11228796B2 (en) * 2020-01-07 2022-01-18 Tencent America LLC Pattern addressing for session-based dash operations
US11470136B2 (en) * 2020-10-07 2022-10-11 Tencent America LLC URL customization using the session-based dash operations
US11895172B2 (en) * 2021-04-21 2024-02-06 Tencent America LLC Session-based description URL customization using the session-based DASH operations
US11888913B2 (en) * 2021-04-28 2024-01-30 Lemon Inc. External stream representation properties
CN118044199A (zh) * 2021-10-01 2024-05-14 字节跳动有限公司 用于视频处理的方法、装置和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015530002A (ja) 2012-07-09 2015-10-08 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 動的適応ストリーミングオーバーハイパーテキスト転送プロトコルクライアント挙動フレームワークおよびセッション管理の実装
WO2016056412A1 (ja) 2014-10-10 2016-04-14 ソニー株式会社 受信装置、受信方法、送信装置、及び、送信方法
US20160261665A1 (en) 2015-03-04 2016-09-08 Qualcomm Incorporated File format based streaming with dash formats based on lct
WO2018087275A1 (en) 2016-11-11 2018-05-17 Telefonaktiebolaget Lm Ericsson (Publ) Content-aware optimized delivery of personalized ads in a cdn
WO2019187437A1 (ja) 2018-03-29 2019-10-03 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9590814B2 (en) * 2011-08-01 2017-03-07 Qualcomm Incorporated Method and apparatus for transport of dynamic adaptive streaming over HTTP (DASH) initialization segment description fragments as user service description fragments
US9866608B2 (en) * 2014-03-24 2018-01-09 Qualcomm Incorporated Processing continuous multi-period content
GB2534136A (en) * 2015-01-12 2016-07-20 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
US20180176650A1 (en) * 2015-06-12 2018-06-21 Sony Corporation Information processing apparatus and information processing method
KR102014800B1 (ko) * 2015-07-06 2019-08-27 엘지전자 주식회사 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법
US11709799B2 (en) * 2015-08-29 2023-07-25 Vmware, Inc. Content or file based application virtualization using a cache
JP7085816B2 (ja) * 2017-09-26 2022-06-17 キヤノン株式会社 情報処理装置、情報提供装置、制御方法、及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015530002A (ja) 2012-07-09 2015-10-08 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 動的適応ストリーミングオーバーハイパーテキスト転送プロトコルクライアント挙動フレームワークおよびセッション管理の実装
WO2016056412A1 (ja) 2014-10-10 2016-04-14 ソニー株式会社 受信装置、受信方法、送信装置、及び、送信方法
US20160261665A1 (en) 2015-03-04 2016-09-08 Qualcomm Incorporated File format based streaming with dash formats based on lct
WO2018087275A1 (en) 2016-11-11 2018-05-17 Telefonaktiebolaget Lm Ericsson (Publ) Content-aware optimized delivery of personalized ads in a cdn
WO2019187437A1 (ja) 2018-03-29 2019-10-03 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
JP2022525298A (ja) 2022-05-12
KR20210130805A (ko) 2021-11-01
EP4038859A4 (en) 2023-07-12
EP4038859A1 (en) 2022-08-10
KR102632387B1 (ko) 2024-02-02
US20220116442A1 (en) 2022-04-14
WO2021067139A1 (en) 2021-04-08
US11616822B2 (en) 2023-03-28
CN113748659A (zh) 2021-12-03
CN116366616A (zh) 2023-06-30
US11785067B2 (en) 2023-10-10
CN113748659B (zh) 2023-01-31
US20210099508A1 (en) 2021-04-01

Similar Documents

Publication Publication Date Title
JP7182727B2 (ja) セッションのメディア・データを受信する方法、装置及びコンピュータ・プログラム
JP7297086B2 (ja) セッションのメディアデータを受信するための方法、装置、およびプログラム
CN113826088B (zh) 接收媒体数据的方法和装置
JP7252373B2 (ja) メディアコンテンツのメディアデータを受信する方法、装置、およびコンピュータプログラム
JP2023518786A (ja) メディアデータを受信する方法、装置、コンピュータプログラム、及び非一時的なコンピュータ可読記憶媒体
JP7190589B2 (ja) セッションベースdash動作のためのパターン指定
JP2023519240A (ja) Httpによる動的適応ストリーミングのための方法及び装置
JP7395766B2 (ja) Httpを介した動的適応ストリーミングのための方法および装置
JP7387209B2 (ja) Http上の動的適応ストリーミングのための方法および装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221025

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221121

R150 Certificate of patent or registration of utility model

Ref document number: 7182727

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150