JP6610538B2 - 受信装置、受信方法、送信装置、及び、送信方法 - Google Patents

受信装置、受信方法、送信装置、及び、送信方法 Download PDF

Info

Publication number
JP6610538B2
JP6610538B2 JP2016514865A JP2016514865A JP6610538B2 JP 6610538 B2 JP6610538 B2 JP 6610538B2 JP 2016514865 A JP2016514865 A JP 2016514865A JP 2016514865 A JP2016514865 A JP 2016514865A JP 6610538 B2 JP6610538 B2 JP 6610538B2
Authority
JP
Japan
Prior art keywords
layer
component
level
mpd
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016514865A
Other languages
English (en)
Other versions
JPWO2015163172A1 (ja
Inventor
靖明 山岸
直久 北里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2015163172A1 publication Critical patent/JPWO2015163172A1/ja
Application granted granted Critical
Publication of JP6610538B2 publication Critical patent/JP6610538B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26258Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for generating a list of items to be played back in a given order, e.g. playlist, or scheduling item distribution according to such list
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/643Communication protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/611Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for multicast or broadcast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440227Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/643Communication protocols
    • H04N21/64322IP
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuits Of Receivers In General (AREA)
  • Information Transfer Between Computers (AREA)

Description

本技術は、受信装置、受信方法、送信装置、及び、送信方法に関し、特に、MPEG-DASH方式を利用して放送サービスを提供することができるようにした受信装置、受信方法、送信装置、及び、送信方法に関する。
IPTV(Internet Protocol Television)等のインターネットストリーミングにおける標準化の流れとして、HTTP(Hypertext Transfer Protocol)ストリーミングによるVoD(Video On Demand)ストリーミングや、ライブストリーミングに適用される方式の標準化が行われている。特に、ISO/IEC/MPEGで標準化が行われているMPEG-DASH(Moving Picture Expert Group - Dynamic Adaptive Streaming over HTTP)が注目されている(例えば、非特許文献1参照)。
MPEG-DASHは、MPD(Media Presentation Description)と呼ばれるメタファイルと、そこに記述されるチャンク化されたオーディオ、ビデオ、又は字幕等のメディアデータのアドレス(URL:Uniform Resource Locator)に従い、ストリーミングデータを取得して再生するものである。
MPDに記述されるメディアデータのストリーム(Representation)は、属性の異なる複数候補が列挙される。MPDを処理するアプリケーション(例えば、ストリームプレイヤ等)は、それらの複数候補のストリームの中から、現在のネットワーク環境条件に応じた最適なストリームを選択し、当該ストリームを取得して再生する。
そして、ネットワーク環境が変化すれば、それに応じて取得対象のストリームを変更することになる。また、当該選択の基準は、エンドユーザ(視聴者)による選択か、あるいはデバイスの能力属性(例えば、実装されている機能、方式属性(例えばコーデック等)、能力属性(例えばメモリ容量や処理能力等))等が想定されている。
ISO/IEC 23009-1:2012 Information technology Dynamic adaptive streaming over HTTP (DASH)
ところで、MPEG-DASH方式を利用して放送サービスを提供することが想定されているが、そのような放送サービスを提供するための技術方式は確立されていない。
本技術はこのような状況に鑑みてなされたものであり、MPEG-DASH方式を利用して放送サービスを提供することができるようにするものである。
本技術の第1の側面の受信装置は、デジタル放送の放送波を受信する受信部と、前記放送波又は通信網で伝送される、MPEG-DASH(Moving Picture Expert Group - Dynamic Adaptive Streaming over HTTP)の規格に準拠したMPD(Media Presentation Description)のあらかじめ規定されている複数の要素の間の関係と、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための第1の要素に基づいて、前記コンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御する制御部とを備え、前記レイヤ構造は、第1のレイヤ、第2のレイヤ、及び、第3のレイヤの3層からなり、前記第3のレイヤは、前記コンポーネントを適応的に選択するためのレイヤであり、前記第2のレイヤは、前記第3のレイヤで選択されたコンポーネント、及び、前記第3のレイヤの対象となっていないコンポーネントを1つのコンポーネントに構造化するためのレイヤであり、前記第1のレイヤは、前記第2のレイヤで構造化されたコンポーネント、前記第3のレイヤで選択されたコンポーネント、及び、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントの中から、1つのコンポーネントを選択するためのレイヤである受信装置である。
前記第3のレイヤの機能は、前記MPDのAdaptationSet要素とRepresentation要素との関係を利用することで実現され、前記第2のレイヤの機能は、前記第1の要素によって、コンポーネントの構造化の対象となる複数の要素をグルーピングすることで実現され、前記第1のレイヤの機能は、前記第1の要素によって、コンポーネントの選択の対象となる複数の要素をグルーピングすることで実現されるようにすることができる。
前記第1の要素は、EssentialProperty要素又はSupplementalProperty要素であり、前記EssentialProperty要素又は前記SupplementalProperty要素のschemeIdUri属性とvalue属性によって、グルーピングする対象の要素が指定されるようにすることができる。
前記第2のレイヤの機能は、前記第3のレイヤで選択されたコンポーネントと、前記第3のレイヤの対象となっていないコンポーネントとが、同一のグループIDによりグルーピングされることで実現されるようにすることができる。
前記第1のレイヤの機能は、前記第2のレイヤで構造化されたコンポーネントと、前記第3のレイヤで選択されたコンポーネントと、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントとが、同一のグループIDによりグルーピングされることで実現されるようにすることができる。
前記MPDには、前記複数のレイヤ構造に関する規定の枠外で、AdaptationSet要素の組を指定する第2の要素が含まれるようにすることができる。
前記第2の要素は、Subset要素であり、前記Subset要素のcontains属性により、前記AdaptationSet要素の組が指定されるようにすることができる。
前記第3のレイヤの機能は、前記第1の要素によって、コンポーネントの選択の対象となる複数の要素をグルーピングすることで実現され、前記第2のレイヤの機能は、前記第1の要素によって、コンポーネントの構造化の対象となる複数の要素をグルーピングすることで実現され、前記第1のレイヤの機能は、前記MPDのAdaptationSet要素とRepresentation要素との関係を利用することで実現されるようにすることができる。
前記第1の要素は、EssentialProperty要素又はSupplementalProperty要素であり、前記EssentialProperty要素又は前記SupplementalProperty要素のschemeIdUri属性とvalue属性によって、グルーピングする対象の要素が指定されるようにすることができる。
前記第3のレイヤの機能は、前記第3のレイヤで適応的に選択されるコンポーネントが、同一のグループIDによりグルーピングされることで実現されるようにすることができる。
前記第2のレイヤの機能は、前記第2のレイヤで構造化されるコンポーネントが、前記MPDのRepresentation要素とSubRepresentation要素との関係を利用してグルーピングされることで実現されるようにすることができる。
前記MPDには、前記複数のレイヤ構造に関する規定の枠外で、Representation要素の組を指定する第2の要素が含まれるようにすることができる。
前記第2の要素は、Subset要素であり、前記Subset要素のcontains属性により、前記Representation要素の組が指定されるようにすることができる。
前記コンポーネントは、前記放送波又は前記通信網で伝送されるようにすることができる。
受信装置は、独立した装置であってもよいし、1つの装置を構成している内部ブロックであってもよい。
本技術の第1の側面の受信方法は、上述した本技術の第1の側面の受信装置に対応する受信方法である。
本技術の第1の側面の受信装置及び受信方法においては、デジタル放送の放送波が受信され、前記放送波又は通信網で伝送される、MPEG-DASHの規格に準拠したMPDのあらかじめ規定されている複数の要素の間の関係と、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための第1の要素に基づいて、前記コンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生が制御される。また、前記レイヤ構造は、第1のレイヤ、第2のレイヤ、及び、第3のレイヤの3層からなり、前記第3のレイヤは、前記コンポーネントを適応的に選択するためのレイヤであり、前記第2のレイヤは、前記第3のレイヤで選択されたコンポーネント、及び、前記第3のレイヤの対象となっていないコンポーネントを1つのコンポーネントに構造化するためのレイヤであり、前記第1のレイヤは、前記第2のレイヤで構造化されたコンポーネント、前記第3のレイヤで選択されたコンポーネント、及び、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントの中から、1つのコンポーネントを選択するためのレイヤである。
本技術の第2の側面の送信装置は、MPEG-DASHの規格に準拠したMPDとして、前記MPDのあらかじめ規定されている複数の要素の間の関係と、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための第1の要素に基づいて、前記コンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御することが可能な情報を少なくとも含む前記MPDを生成する生成部と、生成された前記MPDを、デジタル放送の放送波又は通信網を介して送信する送信部とを備え、前記レイヤ構造は、第1のレイヤ、第2のレイヤ、及び、第3のレイヤの3層からなり、前記第3のレイヤは、前記コンポーネントを適応的に選択するためのレイヤであり、前記第2のレイヤは、前記第3のレイヤで選択されたコンポーネント、及び、前記第3のレイヤの対象となっていないコンポーネントを1つのコンポーネントに構造化するためのレイヤであり、前記第1のレイヤは、前記第2のレイヤで構造化されたコンポーネント、前記第3のレイヤで選択されたコンポーネント、及び、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントの中から、1つのコンポーネントを選択するためのレイヤである送信装置である。
送信装置は、独立した装置であってもよいし、1つの装置を構成している内部ブロックであってもよい。
本技術の第2の側面の送信方法は、上述した本技術の第2の側面の送信装置に対応する送信方法である。
本技術の第2の側面の送信装置及び送信方法においては、MPEG-DASHの規格に準拠したMPDとして、前記MPDのあらかじめ規定されている複数の要素の間の関係と、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための第1の要素に基づいて、前記コンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御することが可能な情報を少なくとも含む前記MPDが生成され、生成された前記MPDが、デジタル放送の放送波又は通信網を介して送信される。また、前記レイヤ構造は、第1のレイヤ、第2のレイヤ、及び、第3のレイヤの3層からなり、前記第3のレイヤは、前記コンポーネントを適応的に選択するためのレイヤであり、前記第2のレイヤは、前記第3のレイヤで選択されたコンポーネント、及び、前記第3のレイヤの対象となっていないコンポーネントを1つのコンポーネントに構造化するためのレイヤであり、前記第1のレイヤは、前記第2のレイヤで構造化されたコンポーネント、前記第3のレイヤで選択されたコンポーネント、及び、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントの中から、1つのコンポーネントを選択するためのレイヤである。
本技術の第1の側面及び第2の側面によれば、MPEG-DASH方式を利用して放送サービスを提供することができる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
MPDの構造を示す図である。 MPDの記述例を示す図である。 多重化されたストリームを表現する場合における、AdaptationSet要素とRepresentation要素の関係を示す図である。 多重化されたストリームを表現する場合における、AdaptationSet要素と、Representation要素と、SubRepresentation要素の関係を示す図である。 AdaptationSet要素に含めることが可能な属性や要素の例を示す図である。 Representation要素とSubRepresentation要素に含めることが可能な属性や要素の例を示す図である。 コンポーネントレイヤ構造を示す図である。 レベル3のレイヤの機能の実現方法を示す図である。 レベル2のレイヤの機能の実現方法を示す図である。 レベル1のレイヤの機能の実現方法を示す図である。 第1の実施の形態における各レベルのレイヤの機能の実現方法を示す図である。 運用例1を説明するための図である。 運用例2を説明するための図である。 運用例3を説明するための図である。 レベル3のレイヤの機能の実現方法を示す図である。 レベル2のレイヤの機能の実現方法を示す図である。 レベル1のレイヤの機能の実現方法を示す図である。 第2の実施の形態における各レベルのレイヤの機能の実現方法を示す図である。 運用例4を説明するための図である。 運用例5を説明するための図である。 運用例6を説明するための図である。 放送通信システムの構成例を示す図である。 送信側の装置の構成例を示す図である。 受信側の装置の構成例を示す図である。 マルチキャスト配信時の各装置における具体的な処理の流れを説明するフローチャートである。 ユニキャスト配信時の各装置における具体的な処理の流れを説明するフローチャートである。 コンピュータの構成例を示す図である。
以下、図面を参照しながら本技術の実施の形態について説明する。なお、説明は以下の順序で行うものとする。
1.MPDの構造
2.コンポーネントレイヤ構造
3.第1の実施の形態
(1)各レベルのレイヤの機能の実現方法
(1−1)レベル3のレイヤの機能
(1−2)レベル2のレイヤの機能
(1−3)レベル1のレイヤの機能
(2)具体的な運用例
(2−1)運用例1:オーディオのミキシング再生
(2−2)運用例2:オーディオのグループ選択
(2−3)運用例3:ビデオとオーディオの同時提示
4.第2の実施の形態
(1)各レベルのレイヤの機能の実現方法
(1−1)レベル3のレイヤの機能
(1−2)レベル2のレイヤの機能
(1−3)レベル1のレイヤの機能
(2)具体的な運用例
(2−1)運用例4:オーディオのミキシング再生
(2−2)運用例5:オーディオのグループ選択
(2−3)運用例6:ビデオとオーディオの同時提示
5.システム構成
6.各装置における具体的な処理の流れ
7.コンピュータの構成
<1.MPDの構造>
(MPDの構造)
図1は、MPD(Media Presentation Description)の構造を示す図である。なお、MPDファイルは、図2の記述例で示すように、例えばXML(Extensible Markup Language)等のマークアップ言語による階層構造で記述される。
ここで、図1に示すように、MPDは、Period要素、AdaptationSet要素、Representation要素、及び、SubRepresentation要素が階層構造で記述されている。Period要素は、番組等のコンテンツの構成を記述する単位となる。また、AdaptationSet要素、Representation要素、又は、SubRepresentation要素は、ビデオやオーディオ、字幕等のそれぞれのストリームごとに利用され、ぞれぞれのストリームの属性を記述できるようになっている。
具体的には、AdaptationSet要素は、各種のソースからエンコードされたストリームを表している。そして、当該ストリームを、例えばビットレート等のパラメトリックに応じて、受信機側で選択させるために、AdaptationSet要素内に、Representation要素を配置して、例えばビットレート等のパラメータが異なる複数の選択肢となるストリームを列挙している。通常、AdaptationSet要素やRepresentation要素は、ビデオやオーディオ、字幕のストリームなど、単一のストリームに対応させている。
また、AdaptationSet要素が、ビデオストリームやオーディオストリーム、字幕ストリームなどの複数のストリームが多重化されたストリームを表現する場合、AdaptationSet要素内に、Representation要素を配置して、例えばビットレート等のパラメータが異なる複数の選択肢となる多重化されたストリームを列挙する。すなわち、図3に示すように、時間間隔を表すPeriod要素ごとに、多重化されたストリームを表す複数のAdaptationSet要素が配置され、それらのAdaptationSet要素内に配置された複数のRepresentation要素により、例えばビットレートが異なる多重化されたストリームを複数列挙することができる。
また、この場合においては、Representation要素の配下にさらにSubRepresentation要素を配置することで、多重化されたストリームを構成する各コンポーネントのストリームの属性を記述することもできる。すなわち、図4に示すように、時間間隔を表すPeriod要素ごとに、多重化されたストリームを表す複数のAdaptationSet要素が配置され、それらのAdaptationSet要素内に、例えばビットレートが異なる多重化されたストリームを表す複数のRepresentation要素が配置され、さらに、それらのRepresentation要素内に配置されたSubRepresentation要素により、例えば、ビデオストリームやオーディオストリーム、字幕ストリームの属性を記述することができる。
なお、AdaptationSet要素は、ビデオストリームやオーディオストリーム等の単一のストリームの他、複数のストリームが多重化されたストリームに対応している。MPEG-DASHの規格においては、このようなAdaptationSet要素に含めることが可能な属性や要素として、図5の属性や要素が既に規定されている。また、Representation要素は、その上位要素(親要素)となるAdaptationSet要素の範囲内で、例えばビットレート等のパラメータが異なる複数の選択肢となるストリームを列挙している。MPEG-DASHの規格においては、このようなRepresentation要素に含めることが可能な属性や要素として、図6の属性や要素が既に規定されている。なお、図6の属性や要素は、SubRepresentation要素に含めるようにすることができる。
<2.コンポーネントレイヤ構造>
ところで、放送サービスにおける要件として、ストリームとして伝送されるコンポーネントの選択と構造化の要件がある。ここで、コンポーネントの選択とは、受信機の対応しているコーデックの能力やネットワーク環境などの各種の条件に応じて、最適なコンポーネントを選択することをいう。また、コンポーネントの構造化とは、複数のコンポーネントを組み合わせて同時に表示することなどをいう。このようなコンポーネントの選択と構造化の要件を満たすために、図7に示すように、コンポーネントを複数のレイヤ構造で表現するようにする。
図7においては、コンポーネントのレイヤは、レベル1のレイヤ、レベル2のレイヤ、及び、レベル3の3つのレイヤからなる。また、図7において、エレメンタリコンポーネント(Elementary Component)は、ビデオやオーディオ、字幕等のコンポーネントそのものを表している。
レベル3のレイヤは、図中の「Level3」に対応し、n個(nは0以上の整数)のエレメンタリコンポーネントの中から1つのコンポーネントを選択するレイヤである。したがって、レベル3のレイヤは、ピックワンコンポーネント(PickOneComponent)のレイヤであると言える。なお、レベル3のレイヤは、例えば、アダプティブレイヤ(Adaptive Layer)など、他の名称で呼ばれる場合がある。
レベル2のレイヤは、図中の「Level2」に対応し、レベル3のレイヤで選択されたn個(nは0以上の整数)のコンポーネント、又は、n個(nは0以上の整数)のエレメンタリコンポーネントを、複数組み合わせて同時に表示させるためにグルーピング(構造化)するレイヤである。グルーピングされた複数のコンポーネントは、まとめて1つのコンポーネントとみなされる。したがって、レベル2のレイヤは、コンポジットコンポーネント(Composite Component)のレイヤであると言える。なお、レベル2のレイヤは、例えば、コンポジットレイヤ(Composite Layer)など、他の名称で呼ばれる場合がある。
レベル1のレイヤは、図中の「Level1」に対応し、レベル2のレイヤでグルーピングされたn個(nは0以上の整数)のコンポーネント、レベル3のレイヤで選択されたn個(nは0以上の整数)のコンポーネント、又は、n個(nは0以上の整数)のエレメンタリコンポーネントの中から1つのコンポーネントを選択するレイヤである。したがって、レベル1のレイヤは、ピックワンコンポーネント(PickOneComponent)のレイヤであると言える。なお、レベル1のレイヤは、例えば、セレクティブレイヤ(Selective Layer)など、他の名称で呼ばれる場合がある。
以上のようにして、コンポーネントを複数のレイヤ構造で表現することで、例えば、レベル1のレイヤとレベル3のレイヤによってコンポーネントの選択の要件が満たされるとともに、レベル2のレイヤによってコンポーネントの構造化の要件が満たされることになる。以下、MPEG-DASH方式を利用して放送サービスを提供する場合において、図7のコンポーネントレイヤ構造を実現するための具体的な方法について、2つの実施の形態で説明する。
<3.第1の実施の形態>
(1)各レベルのレイヤの機能の実現方法
第1の実施の形態においては、MPEG-DASH方式を利用して放送サービスを提供する場合において、図7のコンポーネントレイヤ構造のサービス要件を満たすために、既にMPDの標準仕様で定義されている要素を利用することができる。以下、第1の実施の形態における各レベルのレイヤの機能の実現方法の詳細について説明する。
(1−1)レベル3のレイヤの機能
図8は、図7のレベル3のレイヤの機能の実現方法を示す図である。図8に示すように、レベル3のレイヤの機能は、レベル3のピックワンコンポーネント(PickOneComponent)を、MPDのAdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネント(Elementary Component)にマッピングすることで実現することができる。
すなわち、MPDのAdaptationSet要素とRepresentation要素の間の関係を利用することで、レベル3のピックワンコンポーネントのレイヤでは、複数のエレメンタリコンポーネントの中から、1つのコンポーネントが選択されることになる。この場合、AdaptationSet要素とRepresentation要素の間の関係を利用するため、特別な拡張は必要とされない。なお、以降の図面の記述では、AdaptationSet要素を「AS」、Representation要素を「Rep」と略記するものとする。
(1−2)レベル2のレイヤの機能
図9は、図7のレベル2のレイヤの機能の実現方法を示す図である。図9に示すように、レベル2のレイヤの機能は、MPDで規定されているAdaptationSet要素の下位要素となるEssentialProperty要素(図5)やSupplementalProperty要素(図5)を利用して、新たな要素を定義して、コンポジットコンポーネント(Composite Component)のレイヤの対象要素をグルーピングできるように拡張することで実現することができる。
ここでは、EssentialProperty要素を利用した場合を中心に説明する。EssentialProperty要素は、schemeIdUri属性と、そのschemeIdUri属性の値(URI:Uniform Resource Identifier)により特定されるフォーマットに則して値が決定されるvalue属性からなる。なお、value属性はオプショナルな属性とされる。
図9に示すように、レベル2のコンポジットコンポーネントのレイヤで構造化(例えばミキシング)されるエレメンタリコンポーネントは、MPDの記述例D2−1のように表すことができる。この記述例D2−1においては、AdaptationSet要素に、EssentialProperty要素が配置され、さらにschemeIdUri属性とvalue属性が配置されている。
ここで、例えば、名前空間オーソリティとして、"atsc"を定義して、そのオーソリティが規定する"atsc:…: serviceModel:L2:Composite:mixing"というUri属性値を定義する。これにより、このUri属性値をschemeIdUri属性の値として持っているEssentialProperty要素を有するエレメンタリコンポーネントは、レベル2のコンポジットコンポーネントのレイヤでミキシングされて出力されることを意味するように定義することができる。
このとき、value属性には、レベル2のコンポジットコンポーネントのレイヤでミキシングされるべきコンポーネント群のグループを識別するための値("L2GroupId")が指定される。すなわち、このレベル2のグループIDにより、レベル2のコンポジットコンポーネントのレイヤでのグルーピングが行われる。また、value属性には、レベル2のグループIDのほか、ミキシングパラメータの値("…mixingParametersForEachAS…")などを定義することができる。例えば、オーディオコンポーネントがミキシングされる場合、当該オーディオコンポーネントのミキシングされた後の全体音量に対する相対音量などを定義することができる。この全体音量に対する相対音量としては、例えば、全体音量を1としたときの0〜1の範囲内の小数値が指定される。
また、図9に示すように、レベル2のコンポジットコンポーネントのレイヤで構造化(例えばミキシング)される、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネントは、MPDの記述例D2−2のように表すことができる。この記述例D2−2においては、上述した記述例D2−1と同様に、AdaptationSet要素に、EssentialProperty要素が配置され、そのschemeIdUri属性値として、"atsc:…: serviceModel:L2:Composite:mixing"が指定されている。すなわち、当該コンポーネントがレベル2のコンポジットコンポーネントのレイヤでミキシングされて出力されることを意味している。
このとき、value属性には、"L2GroupId"が指定されている。すなわち、記述例D2−2のvalue属性には、記述例D2−1のvalue属性と同一のレベル2のグループID("L2GroupId")が指定されており、記述例D2−2により表されるレベル3のピックワンコンポーネントのレイヤで選択されるコンポーネントは、記述例D2−1により表されるエレメンタリコンポーネントと同一のレベル2のグループに属することになる。
これにより、レベル2のコンポジットコンポーネントのレイヤにおいて、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネントと、エレメンタリコンポーネントとがグルーピングされ、当該グルーピングされたコンポーネントが構造化(例えばミキシング)されて出力されることになる。このように、EssentialProperty要素を、レベル2のコンポジットコンポーネントの対象要素をグルーピングできるように拡張することで、レベル2のレイヤの機能が実現されることになる。
(1−3)レベル1のレイヤの機能
図10は、図7のレベル1のレイヤの機能の実現方法を示す図である。図10に示すように、レベル1のレイヤの機能は、MPDで規定されているAdaptationSet要素の下位要素となるEssentialProperty要素(図5)やSupplementalProperty要素(図5)を利用して、新たな要素を定義して、コンポジットコンポーネント(Composite Component)のレイヤの対象要素をグルーピングできるように拡張することで実現することができる。なお、ここでは、EssentialProperty要素を利用した場合を中心に説明する。
図10に示すように、レベル1のピックワンコンポーネントのレイヤで選択されるエレメンタリコンポーネントは、MPDの記述例D1−1のように表すことができる。この記述例D1−1においては、AdaptationSet要素に、EssentialProperty要素が配置され、さらにschemeIdUri属性とvalue属性が配置されている。
ここで、例えば、名前空間オーソリティとして、"atsc"が定義されている場合に、そのオーソリティが規定する"atsc:…:serviceModel:L1:pickOne"というUri属性値を定義する。これにより、このUri属性値をschemeIdUri属性の値として持っているEssentialProperty要素を有するエレメンタリコンポーネントは、レベル1のピックワンコンポーネントのレイヤで選択されて出力されることを意味するように定義することができる。
このとき、value属性には、レベル1のピックワンコンポーネントのレイヤで選択されるべきコンポーネントのグループを識別するための値("L1GroupId")が指定される。すなわち、このレベル1のグループIDにより、レベル1のピックワンコンポーネントのレイヤでのグルーピングが行われる。
また、図10に示すように、レベル1のピックワンコンポーネントのレイヤで選択される、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネントは、MPDの記述例D1−2のように表すことができる。この記述例D1−2においては、上述した記述例D1−1と同様に、AdaptationSet要素に、EssentialProperty要素が配置され、そのschemeIdUri属性値として、"atsc:…:serviceModel:L1:pickOne"が指定されている。すなわち、当該コンポーネントがレベル1のピックワンコンポーネントのレイヤで選択されて出力されることを意味している。このとき、value属性には、"L1GroupId"が指定されている。
さらに、図10に示すように、レベル1のピックワンコンポーネントのレイヤで選択される、レベル2のコンポジットコンポーネントのレイヤで構造化(例えばミキシング)されたコンポーネントは、MPDの記述例D1−3のように表すことができる。この記述例D1−3においては、上述した記述例D1−1,D1−2と同様に、AdaptationSet要素に、EssentialProperty要素が配置され、そのschemeIdUri属性値として、"atsc:…:serviceModel:L2:Composite:mixing:L1:pickOne"が指定されている。すなわち、当該コンポーネントが、レベル2のコンポジットコンポーネントのレイヤでミキシングされて出力されるとともに、レベル1のピックワンコンポーネントのレイヤで選択されて出力されることを意味している。
このとき、value属性には、"L2GroupId","…mixingParametersForEachAS…","L1GroupId"が指定されている。すなわち、当該コンポーネントは、レベル2のコンポジットコンポーネントのレイヤでミキシングされるが、そのミキシングの際に、レベル2のグループID("L2GroupId")によりグルーピングされることを意味している。また、ここでは、例えばミキシングされた後の全体音量に対する相対音量などのミキシングパラメータを指定することができる。
また、記述例D1−3のvalue属性には、記述例D1−1,D1−2のvalue属性と同一のレベル1のグループID("L1GroupId")が指定されており、記述例D1−3により表されるレベル2のコンポジットコンポーネントのレイヤで構造化されるコンポーネントは、記述例D1−1により表されるエレメンタリコンポーネント、及び、記述例D1−2により表されるレベル3のピックワンコンポーネントのレイヤで選択されるコンポーネントと同一のレベル1のグループに属することになる。
これにより、レベル1のピックワンコンポーネントのレイヤにおいて、レベル2のコンポジットコンポーネントのレイヤで構造化されたコンポーネント、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネント、及び、エレメンタリコンポーネントの中から1つのコンポーネントが選択されて出力されることになる。このように、EssentialProperty要素を、レベル1のピックワンコンポーネントの対象要素をグルーピングできるように拡張することで、レベル1のレイヤの機能が実現されることになる。
ここで、上述した各レイヤの機能の実現方法をまとめると、図11に示すようになる。すなわち、図11は、第1の実施の形態における各レベルのレイヤの機能の実現方法を示している。
図11に示すように、レベル3のレイヤの機能は、MPDのAdaptationSet要素とRepresentation要素の間の関係を利用することで実現する。したがって、ここでは、特別な拡張は必要とされない。
レベル2のレイヤの機能は、MPDで規定されているAdaptationSet要素の下位要素となるEssentialProperty要素を利用して、新たな要素を定義して、コンポジットコンポーネント(Composite Component)のレイヤの対象要素をグルーピングできるように拡張することで実現する。上述したMPDの記述例D2−1,D2−2では、レベル2のコンポジットコンポーネントのレイヤにおいて、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネントと、エレメンタリコンポーネントとが同一のレベル2のグループID("L2GroupId")によりグルーピングされ、当該グルーピングされたコンポーネントが構造化(例えばミキシング)される例を説明した。
レベル1のレイヤの機能は、レベル2のレイヤの機能と同様に、EssentialProperty要素を利用して、新たな要素を定義して、レベル1のピックワンコンポーネントのレイヤの対象要素をグルーピングできるように拡張することで実現する。上述したMPDの記述例D1−1,D1−2,D1−3では、レベル1のピックワンコンポーネントのレイヤにおいて、レベル2のコンポジットコンポーネントのレイヤで構造化されたコンポーネント、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネント、及び、エレメンタリコンポーネントが同一のレベル1のグループID("L1GroupId")によりグルーピングされ、当該グルーピングされたコンポーネント群の中から1つのコンポーネントが選択される例を説明した。
以上のように、第1の実施の形態では、MPDを利用して、第3のレイヤの機能を、AdaptationSet要素とRepresentation要素との関係を利用することで実現し、第2のレイヤの機能を、EssentialProperty要素によって、コンポーネントの構造化の対象となる複数の要素をグルーピングすることで実現し、第1のレイヤの機能を、EssentialProperty要素によって、コンポーネントの選択の対象となる複数の要素をグルーピングすることで実現して、図7のコンポーネントレイヤ構造のサービス要件が満たされるようにして、MPEG-DASH方式を利用して放送サービスを提供することができるようにしている。
なお、第1の実施の形態では、MPDにおいて、複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための要素として、EssentialProperty要素を利用した場合を中心に説明したが、それに限らず、例えば、SupplementalProperty要素を利用するなど、他の要素や属性などを利用するようにしてもよい。
(2)具体的な運用例
次に、図12乃至図14を参照して、第1の実施の形態についての具体的な運用例について説明する。
(2−1)運用例1
図12は、オーディオストリームのミキシング再生を行う運用例1を説明するための図である。図12においては、当該運用例1を実現するためのMPDの記述内容が示されており、「AS」はAdaptationSet要素、「R」はRepresentation要素をそれぞれ表している。さらに、AdaptationSet要素とRepresentation要素の「A」はオーディオコンポーネントを表している。また、図中の「EP」はEssentialProperty要素、「@」は属性を意味しているため、「@sIUri」、「@val」は、EssentialProperty要素のschemeIdUri属性と、value属性を表している。なお、「SP」はSupplementalProperty要素を表しているが、ここでは、EssentialProperty要素を利用した場合を中心に説明する。また、これらの略語の関係は後述する他の図でも同様とされる。
ここで、図12の運用例1においては、AdaptationSet要素におけるEssentialProperty要素のschemeIdUri属性の属性値として、「atsc:…:sM:L2:C:m」("atsc:…:serviceModel:L2:Composite:mixing"の略)が定義されており、この属性値を持っているEssentialProperty要素を有するオーディオコンポーネントのAdaptationSet属性群は、ミキシングされて出力されることを意味している。また、EssentialProperty要素のvalue属性には、その値が、オーディオコンポーネントがミキシングされるべきオーディオコンポーネント群のグループID("L2GroupId")と、任意のミキシングパラメータの値を意味することが定義されている。
図12においては、単一のオーディオストリームに対応した3つのAdaptationSet要素が記述され、それらのAdaptationSet要素の配下に1又は複数のRepresentation要素が記述されている。
図中の上から1つ目のAdaptationSet要素の配下には、2つのRepresentation要素が記述され、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのダイアログ(Dlg:Dialog)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
なお、1つ目のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L2:C:m"が指定され、value属性として"L2G-1"が指定されている。つまり、このレベル3のレイヤで選択されたコンポーネントは、"1"であるレベル2のグループID("L2GroupId")が指定されたミキシンググループ1に属していることになる。
図中の上から2つ目のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、オーディオコンポーネントとして、エフェクト(Efct:Effect)が列挙されており、1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
なお、2つ目のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L2:C:m"が指定され、value属性として"L2G-1"が指定されている。つまり、このエレメンタリコンポーネントに相当するコンポーネントは、"1"であるレベル2のグループID("L2GroupId")が指定されたミキシンググループ1に属していることになる。
図中の上から3つ目のAdaptationSet要素の配下には、2つのRepresentation要素が記述され、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのミュージック(Music)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
なお、3つ目のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L2:C:m"が指定され、value属性として"L2G-1"が指定されている。つまり、このレベル3のレイヤで選択されたコンポーネントは、"1"であるレベル2のグループID("L2GroupId")が指定されたミキシンググループ1に属していることになる。
このように、レベル3のピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、オーディオコンポーネントの選択が行われる。
そして、3つのAdaptationSet要素にはともに、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L2:C:m"が指定され、value属性として"L2G-1"が指定されているので、同一のミキシンググループ1に属している。このように、EssentialProperty要素のschemeIdUri属性とvalue属性によって、複数のAdaptationSet要素のグルーピングが行われることで、図7のコンポーネントレイヤ構造におけるレベル2のレイヤの機能が実現され、当該レベル2(コンポジットコンポーネント)のレイヤにおいて、オーディオコンポーネントのミキシングが行われることになる。
以上、図12の運用例1においては、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで実現される。また、レベル2のレイヤの機能が、AdaptationSet要素に配置されるEssentialProperty要素のschemeIdUri属性とvalue属性によって、レベル2のコンポジットコンポーネント(Composite Component)のレイヤの対象要素がグルーピングされることで実現される。このようにして、レベル2のレイヤとレベル3のレイヤの機能が実現されることで、オーディオストリームのミキシング再生が行われる。
(2−2)運用例2
図13は、オーディオストリームのグループ選択を行う運用例2を説明するための図である。
図13においては、当該運用例2を実現するためのMPDの記述内容が示されており、図12と同様に、「AS」、「R」は、AdaptationSet要素と、Representation要素をそれぞれ表している。また、図12と同様に、「@sIUri」、「@val」は、EssentialProperty要素のschemeIdUri属性と、value属性を表している。
また、図13の運用例2においては、AdaptationSet要素におけるEssentialProperty要素のschemeIdUri属性の属性値として、「atsc:…:sM:L1:p」("atsc:…:serviceModel:L1:pickOne"の略)が定義されており、この属性値を持っているEssentialProperty要素を有するオーディオコンポーネントは、レベル1のピックワンコンポーネントのレイヤで選択されて出力されることを意味している。
さらにまた、EssentialProperty要素のschemeIdUri属性の属性値として、「atsc:…:sM:L2:C:m:L1:p」("atsc:…:serviceModel:L2:Composite:mixing:L1:pickOne"の略)が定義されており、この属性値を持っているEssentialProperty要素を有するオーディオコンポーネントは、レベル2のコンポジットコンポーネントのレイヤでミキシングされて出力されるとともに、レベル1のピックワンコンポーネントのレイヤで選択されて出力されることを意味している。
また、EssentialProperty要素のvalue属性には、その値が、オーディオコンポーネントがミキシングされるべきオーディオコンポーネント群のグループID("L2GroupId")と、レベル1のピックワンコンポーネントのレイヤで選択されるべきコンポーネントのグループID("L1GroupId")と、任意のミキシングパラメータの値を意味することが定義されている。
図13においては、単一のオーディオストリームに対応した4つのAdaptationSet要素が記述され、それらのAdaptationSet要素の配下に1又は複数のRepresentation要素が記述されている。
図中の上から1つ目のAdaptationSet要素の配下には、2つのRepresentation要素が記述され、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのステレオ(STR:Stereo)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
なお、1つ目のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L1:p"が指定され、value属性として"L1G-1"が指定されている。つまり、このレベル3のレイヤで選択されたコンポーネントは、"1"であるレベル1のグループID("L1GroupId")が指定されたセレクティブグループ1に属していることになる。
図中の上から2つ目のAdaptationSet要素の配下には、2つのRepresentation要素が記述され、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのミュージック(Music)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
なお、2つ目のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L2:C:m:L1:p"が指定され、value属性として"L1G-1"と"L2G-1"が指定されている。つまり、このレベル3のレイヤで選択されたコンポーネントは、"1"であるレベル2のグループID("L2GroupId")が指定されたミキシンググループ1に属しているとともに、"1"であるレベル1のグループID("L1GroupId")が指定されたセレクティブグループ1にも属していることになる。
図中の上から3つ目のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、オーディオコンポーネントとして、ダイアログ(Dlg:Dialog)が列挙されており、1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
なお、3つ目のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L2:C:m:L1:p"が指定され、value属性として"L1G-1"と"L2G-1"が指定されている。つまり、このコンポーネントは、"1"であるレベル2のグループID("L2GroupId")が指定されたミキシンググループ1に属しているとともに、"1"であるレベル1のグループID("L1GroupId")が指定されたセレクティブグループ1にも属していることになる。
図中の上から4つ目のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、オーディオコンポーネントとして、エフェクト(Efct:Effect)が列挙されており、1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
なお、4つ目のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L2:C:m:L1:p"が指定され、value属性として"L1G-1"と"L2G-1"が指定されている。つまり、このコンポーネントは、"1"であるレベル2のグループID("L2GroupId")が指定されたミキシンググループ1に属しているとともに、"1"であるレベル1のグループID("L1GroupId")が指定されたセレクティブグループ1にも属していることになる。
このように、レベル3のピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、オーディオコンポーネントの選択が行われる。
また、4つのAdaptationSet要素のうち、2つ目乃至4つ目のAdaptationSet要素にはともに、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L2:C:m:L1:p"が指定され、value属性として"L1G-1"と"L2G-1"が指定されているので、同一のミキシンググループ1に属している。このように、EssentialProperty要素のschemeIdUri属性とvalue属性によって、複数のAdaptationSet要素のグルーピングが行われることで、図7のコンポーネントレイヤ構造におけるレベル2のレイヤの機能が実現され、当該レベル2(コンポジットコンポーネント)のレイヤにおいて、オーディオコンポーネントのミキシングが行われる。
さらに、1つ目のAdaptationSet要素には、"atsc:…:sM:L1:p"が指定され、value属性として"L1G-1"が指定されているので、4つのAdaptationSet要素は、同一のセレクティブグループ1に属している。このように、AdaptationSet要素のschemeIdUri属性とvalue属性によって、複数のAdaptationSet要素のグルーピングが行われることで、図7のコンポーネントレイヤ構造におけるレベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、同一のグループ内のオーディオコンポーネントの中から1つのオーディオコンポーネントが選択されることになる。
ここでは、セレクティブグループ1に属している、レベル3(ピックワンコンポーネント)のレイヤで選択されたオーディオコンポーネント(ステレオ)と、レベル2(コンポジットコンポーネント)のレイヤでミキシングされたオーディオコンポーネント(ミュージック、ダイアログ、エフェクト)のうち、いずれか一方のオーディオコンポーネントが選択されることになる。
以上、図13の運用例2においては、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで実現される。また、レベル2のレイヤの機能が、AdaptationSet要素に配置されるEssentialProperty要素のschemeIdUri属性とvalue属性によって、レベル2のコンポジットコンポーネントのレイヤの対象要素がグルーピングされることで実現される。さらにまた、レベル1のレイヤの機能が、AdaptationSet要素に配置されるEssentialProperty要素のschemeIdUri属性とvalue属性によって、レベル1のピックワンコンポーネントのレイヤの対象要素がグルーピングされることで実現される。このようにして、レベル1、レベル2、及び、レベル3のレイヤの機能が実現されることで、オーディオコンポーネントのグループ選択が行われ、オーディオコンポーネントが再生される。
(2−3)運用例3
図14は、コンポーネントの同時提示のためのグルーピングを行う運用例3を説明するための図である。図14においては、当該運用例3を実現するためのMPDの記述内容が示されており、「AS」と「R」は、AdaptationSet要素とRepresentation要素をそれぞれ表している。さらに、AdaptationSet要素とRepresentation要素の「A」と「V」は、オーディオとビデオのコンポーネントを表している。さらにまた、「@sIUri」、「@val」は、EssentialProperty要素のschemeIdUri属性と、value属性を表している。また、AdaptationSet要素には、「@id」で示したid属性が記述されている。
また、「SS」は、Subset要素を表している。Subset要素で、AdaptationSet要素の集合を指定するには、Subset要素のcontains属性に、AdaptationSet要素のid属性の値をリストとして格納することになるが、ここでは、Subset要素を、コンポーネントレイヤ構造に関する規定の枠外で、ビデオやオーディオなどの複数のコンポーネントの同時提示のためのグルーピングを定義するために用いている。
図14の運用例3においては、AdaptationSet要素におけるEssentialProperty要素のschemeIdUri属性の属性値として、「atsc:…:sM:L1:p」("atsc:…:serviceModel:L1:pickOne"の略)が定義されており、この属性値を持っているEssentialProperty要素を有するビデオコンポーネントは、レベル1のピックワンコンポーネントのレイヤで選択されて出力されることを意味している。また、EssentialProperty要素のvalue属性には、その値が、レベル1のピックワンコンポーネントのレイヤで選択されるべきコンポーネントのグループID("L1GroupId")を意味することが定義されている。
すなわち、図14のMPDには、ビデオのセレクティブグループ1に属する4つのAdaptationSet要素(id="11","12","13","14")と、オーディオのセレクティブグループ2に属する4つのAdaptationSet要素(id="21","22","23","24")が記述され、それらのAdaptationSet要素の配下にそれぞれ、1又は複数のRepresentation要素が記述されている。
ビデオのセレクティブグループ1(L1G-1)において、各Representation要素には、ビデオコンポーネントとして、「base」、「ext」、「SV1」、及び、「SV2」が列挙されている。ここで、「base」は、単独で再生可能な基本の映像信号に相当するビデオコンポーネントを表し、「ext」は、拡張用の映像信号に相当するビデオコンポーネントを表している。また、「SV1」と「SV2」において、「SV」は、主の表示領域であるメインビューに対する補助的な領域となるサブビューを表している。
id="11"のAdaptationSet要素の配下には、1つのRepresentation要素(「V-base」)のみが記述され、単独で再生可能な基本の映像信号に相当する1つのビデオコンポーネントが常に選択されることになる。このようにして選択されるビデオコンポーネントは、エレメンタリコンポーネントに相当している。なお、当該ビデオコンポーネントは、メインビュー用とされている。
id="12"のAdaptationSet要素の配下には、4つのRepresentation要素(「V-base」、「V-ext-1」、「V-ext-2」、「V-ext-3」)が記述され、それらのRepresentation要素群が互いに、Base-Enhance関係の依存関係を有している。すなわち、id='12'のAdaptationSet要素の配下には、基本の映像信号に相当するビデオコンポーネントが1つ列挙されているほか、拡張用の映像信号に相当するビデオコンポーネントが3つ列挙されており、Base-Enhance関係の依存関係を有している。これにより、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、基本の映像信号と拡張用の映像信号に相当するビデオコンポーネントが選択されることになる。なお、当該ビデオコンポーネントは、メインビュー用とされている。
id="13"のAdaptationSet要素の配下には、1つのRepresentation要素(「V-SV-1」)のみが記述され、サブビュー1用の1つのビデオコンポーネントが常に選択されることになる。このようにして選択されるビデオコンポーネントは、エレメンタリコンポーネントに相当している。
id="14"のAdaptationSet要素の配下には、3つのRepresentation要素(「V-SV2-1」、「V-SV2-2」、「V-SV2-3」)が記述され、サブビュー2用のビデオコンポーネントが3つ列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えば、ネットワーク環境条件などに応じて、適応的に1つのビデオコンポーネントが選択されることになる。
このように、レベル3のピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、ビデオコンポーネントの選択が行われる。
ここで、図14のMPDにおいて、id="11"のAdaptationSet要素、id="12"のAdaptationSet要素、id="13"のAdaptationSet要素、及び、id="14"のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L1:p"が指定され、value属性として"L1G-1"が指定されている。つまり、このレベル3のレイヤで選択されたビデオコンポーネントは、"1"であるレベル1のグループID("L1GroupId")が指定されたセレクティブグループ1に属していることになる。
このように、AdaptationSet要素におけるEssentialProperty要素のschemeIdUri属性とvalue属性によって、グルーピングを行うことで、図7のコンポーネントレイヤ構造におけるレベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、同一のグループ内のビデオコンポーネントの中から1つのビデオコンポーネントが選択されることになる。ここでは、セレクティブグループ1に属している、レベル3(ピックワンコンポーネント)のレイヤで選択されたビデオコンポーネント(「V-base」、「V-ext-1」、「V-ext-2」又は「V-ext-3」と、「V-SV2-1」、「V-SV2-2」又は「V-SV2-3」)と、エレメンタリコンポーネント(「V-base」、「V-SV-1」)の中から、1つのビデオコンポーネントが選択される。
一方、オーディオのセレクティブグループ2(L1G-2)において、各Representation要素には、オーディオコンポーネントとして、「NrRbst」、「HiRbst」、「MCD」、「SV1」、及び、「SV2」が列挙されている。「NrRbst」は、通常のロバスト性を有するオーディオコンポーネントを意味する。また、「HiRbst」は、高いロバスト性を有するオーディオコンポーネントを意味する。「MCD」は、マルチチャンネルのオーディオコンポーネントを表している。さらに、「SV1」と「SV2」において、「SV」は、サブビュー用のオーディオコンポーネントを表している。
id="21"のAdaptationSet要素の配下には、2つのRepresentation要素(「A-NrRbst」、「A-HiRbst」)が記述され、通常のロバスト性を有するオーディオコンポーネントと、高いロバスト性を有するオーディオコンポーネントが列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。なお、当該オーディオコンポーネントは、メインビュー用とされている。
id="22"のAdaptationSet要素の配下には、1つのRepresentation要素(「A-MCD」)のみが記述され、マルチチャンネルの1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。なお、当該オーディオコンポーネントは、メインビュー用とされている。
id="23"のAdaptationSet要素の配下には、1つのRepresentation要素(「A-SV1」)のみが記述され、サブビュー1用の1つのオーディオコンポーネントが常に選択されることになる。同様にid="24"のAdaptationSet要素の配下には、1つのRepresentation要素(「A-SV2」)のみが記述され、サブビュー2用の1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるサブビュー用のオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
ここで、図14のMPDにおいては、id="21"のAdaptationSet要素、id="22"のAdaptationSet要素、id="23"のAdaptationSet要素、及び、id="24"のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L1:p"が指定され、value属性として"L1G-2"が指定されている。つまり、このレベル3のレイヤで選択されたオーディオコンポーネントは、"2"であるレベル1のグループID("L1GroupId")が指定されたセレクティブグループ2に属していることになる。
このように、AdaptationSet要素におけるEssentialProperty要素のschemeIdUri属性とvalue属性によって、グルーピングを行うことで、図7のコンポーネントレイヤ構造におけるレベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、同一のグループ内のオーディオコンポーネントの中から1つのオーディオコンポーネントが選択されることになる。ここでは、セレクティブグループ2に属している、レベル3(ピックワンコンポーネント)のレイヤで選択されたオーディオコンポーネント(「A-NrRbst」又は「A-HiRbst」)と、エレメンタリコンポーネント(「A-MCD」、「A-SV1」、「A-SV2」)の中から、1つのオーディオコンポーネントが選択される。
また、図14のMPDにおいては、Subset要素が、コンポーネントレイヤ構造に関する規定の枠外で、ビデオやオーディオなどの複数のコンポーネントの同時提示のためのグルーピングを定義するために用いられている。
具体的には、図中の上から1つ目のSubset要素のcontains属性には"11 21"が指定されており、id="11"のAdaptationSet要素と、id="21"のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」)と、オーディオコンポーネント(「A-NrRbst」又は「A-HiRbst」)は、同時に再生されるメインビュー用のコンポーネントとなる。
図中の上から2つ目のSubset要素のcontains属性には"11 22"が指定されており、id="11"のAdaptationSet要素と、id="22"のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」)と、オーディオコンポーネント(「A-MCD」)は、同時に再生されるメインビュー用のコンポーネントとなる。
図中の上から3つ目のSubset要素のcontains属性には"12 21"が指定されており、id="12"のAdaptationSet要素と、id="21"のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」と「V-ext」)と、オーディオコンポーネント(「A-NrRbst」又は「A-HiRbst」)は、同時に再生されるメインビュー用のコンポーネントとなる。
図中の上から4つ目のSubset要素のcontains属性には"12 22"が指定されており、id="12"のAdaptationSet要素と、id="22"のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」と「V-ext」)と、オーディオコンポーネント(「A-MCD」)は、同時に再生されるメインビュー用のコンポーネントとなる。
図中の上から5つ目のSubset要素のcontains属性には"13 23"が指定されており、id="13"のAdaptationSet要素と、id="23"のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-SV1」)と、オーディオコンポーネント(「A-SV1」)は、同時に再生されるサブビュー1用のコンポーネントとなる。
図中の上から6つ目のSubset要素のcontains属性には"14 24"が指定されており、id="14"のAdaptationSet要素と、id="24"のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-SV2」)と、オーディオコンポーネント(「A-SV2」)は、同時に再生されるサブビュー2用のコンポーネントとなる。
以上、図14の運用例3においては、Subset要素を、図7のコンポーネントレイヤ構造に関する規定の枠外で、ビデオやオーディオなどの複数のコンポーネントの同時提示のためのグルーピングを定義するために用いることで、例えば、ビデオとオーディオのコンポーネントの間で、メインビュー用、サブビュー1用、又は、サブビュー2用などの関連付けを行うことができる。なお、このような関連付けが行われることから、例えば、ビデオとオーディオのコンポーネントのうち、一方のコンポーネントが特定されれば、他方のコンポーネントを特定することが可能となる。
<4.第2の実施の形態>
(1)各レベルのレイヤの機能の実現方法
第2の実施の形態においては、上述した第1の実施の形態と同様に、MPEG-DASH方式を利用して放送サービスを提供する場合において、図7のコンポーネントレイヤ構造のサービス要件を満たすために、既にMPDの標準仕様で定義されている要素を利用することになる。以下、第2の実施の形態における各レベルのレイヤの機能の実現方法の詳細について説明する。
(1−1)レベル3のレイヤの機能
図15は、図7のレベル3のレイヤの機能の実現方法を示す図である。図15に示すように、レベル3のレイヤの機能は、MPDで規定されているSubRepresentation要素の下位要素となるEssentialProperty要素(図6)やSupplementalProperty要素(図6)を利用して、新たな要素を定義して、レベル3のピックワンコンポーネント(PickOneComponent)の対象要素をグルーピングできるように拡張することで実現することができる。なお、以降の図面の記述では、SubRepresentation要素を「SubRep」と略記するものとする。
ここでは、EssentialProperty要素を利用した場合を中心に説明するが、上述したように、EssentialProperty要素は、schemeIdUri属性と、そのschemeIdUri属性の値により特定されるフォーマットに則して値が決定されるvalue属性からなる。
図15に示すように、レベル3のピックワンコンポーネントのレイヤで選択されるエレメンタリコンポーネント(Elementary Component)は、MPDの記述例D3−1のように表すことができる。この記述例D3−1においては、SubRepresentation要素に、EssentialProperty要素が配置され、さらにschemeIdUri属性とvalue属性が配置されている。
ここで、例えば、名前空間オーソリティとして、"atsc"を定義して、そのオーソリティが規定する"atsc:…:serviceModel:L3:PickOne"というUri属性値を定義する。これにより、このUri属性値をschemeIdUri属性の値として持っているEssentialProperty要素を有するエレメンタリコンポーネントは、レベル3のピックワンコンポーネントのレイヤで選択されて出力されることを意味するように定義することができる。
このとき、value属性には、レベル3のピックワンコンポーネントのレイヤで選択されるべきコンポーネント群のグループを識別するための値("L3GroupId")が指定される。すなわち、このレベル3のグループIDにより、レベル3のピックワンコンポーネントのレイヤでのグルーピングが行われる。
これにより、レベル3のピックワンコンポーネントのレイヤにおいて、複数のエレメンタリコンポーネントがグルーピングされ、当該グルーピングされた複数のエレメンタリコンポーネントの中から、1つのコンポーネントが選択されることになる。このように、EssentialProperty要素を、レベル3のピックワンコンポーネントの対象要素をグルーピングできるように拡張することで、レベル3のレイヤの機能が実現されることになる。
(1−2)レベル2のレイヤの機能
図16は、図7のレベル2のレイヤの機能の実現方法を示す図である。図16に示すように、レベル2のレイヤの機能は、MPDで規定されているSubRepresentation要素の下位要素となるEssentialProperty要素(図6)やSupplementalProperty要素(図6)を利用して、新たな要素を定義して、レベル2のコンポジットコンポーネント(Composite Component)の対象要素をグルーピングできるように拡張することで実現することができる。
図16に示すように、レベル2のコンポジットコンポーネントのレイヤで構造化(例えばミキシング)されるエレメンタリコンポーネントは、MPDの記述例D2−3のように表すことができる。この記述例D2−3においては、SubRepresentation要素に、EssentialProperty要素が配置され、さらにschemeIdUri属性とvalue属性が配置されている。
ここで、例えば、名前空間オーソリティとして、"atsc"を定義して、そのオーソリティが規定する"atsc:…: serviceModel:L2:Composite:mixing"というUri属性値を定義する。これにより、このUri属性値をschemeIdUri属性の値として持っているEssentialProperty要素を有するエレメンタリコンポーネントは、レベル2のコンポジットコンポーネントのレイヤでミキシングされて出力されることを意味するように定義することができる。
このとき、value属性には、ミキシングパラメータの値("…mixingParametersForEachAS…")などを定義することができるが、第2の実施の形態では、レベル2のグループIDを定義する必要がない。すなわち、SubRepresentation要素は、Representation要素の配下に配置されるので、同一のRepresentation要素の配下に列挙された複数のSubRepresentation要素は、当該Representation要素によりまとめられ、いわばグルーピングされるため、あえてレベル2のグループIDを指定する必要がないからである。
また、図16に示すように、レベル2のコンポジットコンポーネントのレイヤで構造化(例えばミキシング)される、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネントは、MPDの記述例D2−4のように表すことができる。この記述例D2−4においては、上述した記述例D2−3と同様に、SubRepresentation要素に、EssentialProperty要素が配置され、そのschemeIdUri属性として、"atsc:…:serviceModel:L3:pickOne:L2:Composite:mixing"が指定されている。すなわち、当該コンポーネントが、レベル3のピックワンコンポーネントのレイヤで選択されて出力されるとともに、レベル2のコンポジットコンポーネントのレイヤでミキシングされて出力されることを意味している。
このとき、value属性には、"L3GroupId","…mixingParametersForEachAS…"が指定されている。すなわち、当該コンポーネントは、レベル3のピックワンコンポーネントのレイヤで選択されるが、その選択の際に、レベル3のグループID("L3GroupId")によりグルーピングされることを意味している。また、ここでは、レベル2のコンポジットコンポーネントのレイヤでミキシングされた後の全体音量に対する相対音量などのミキシングパラメータを指定することができるが、記述例D2−4においても、上述した記述例D2−3と同様の理由で、レベル2のグループIDを定義する必要がない。
そして、エレメンタリコンポーネントが列挙されたSubRepresentation要素と、レベル3のピックワンコンポーネントのレイヤで選択されるコンポーネントが列挙されたSubRepresentation要素とは、同一のRepresentation要素の配下に配置されるので、当該Representation要素によって、それらのSubRepresentation要素に列挙されたコンポーネントがグルーピングされて、当該グルーピングされたコンポーネントが構造化(例えばミキシング)されて出力されることになる。このように、EssentialProperty要素を、レベル2のコンポジットコンポーネントの対象要素をグルーピングできるように拡張することで、レベル2のレイヤの機能が実現されることになる。
(1−3)レベル1のレイヤの機能
図17は、図7のレベル1のレイヤの機能の実現方法を示す図である。図17に示すように、レベル1のレイヤの機能は、レベル1のピックワンコンポーネントを、MPDのAdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、レベル2のコンポジットコンポーネントのレイヤで構造化されたコンポーネント、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネント、及び、エレメンタリコンポーネントにマッピングすることで実現することができる。
すなわち、MPDのAdaptationSet要素とRepresentation要素の間の関係を利用することで、レベル1のピックワンコンポーネントのレイヤでは、レベル2のコンポジットコンポーネントのレイヤで構造化されたコンポーネント、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネント、及び、エレメンタリコンポーネントの中から、1つのコンポーネントが選択されることになる。この場合、AdaptationSet要素とRepresentation要素の間の関係を利用するため、特別な拡張は必要とされない。
ここで、上述した各レイヤの機能の実現方法をまとめると、図18に示すようになる。ずなわち、図18は、第2の実施の形態における各レベルのレイヤの機能の実現方法を示している。
図18に示すように、レベル3のレイヤの機能は、SubRepresentation要素の下位要素となるEssentialProperty要素を利用して、新たな要素を定義して、レベル3のピックワンコンポーネントの対象要素をグルーピングできるように拡張することで実現する。上述したMPDの記述例D3−1では、レベル3のピックワンコンポーネントのレイヤにおいて、複数のエレメンタリコンポーネントが同一のレベル3のグループID("L3GroupId")によりグルーピングされ、当該グルーピングされた複数のエレメンタリコンポーネントの中から、1つのコンポーネントが選択される例を説明した。
レベル2のレイヤの機能は、レベル3のレイヤの機能と同様に、EssentialProperty要素を利用して、新たな要素を定義して、レベル2のコンポジットコンポーネントの対象要素をグルーピングできるように拡張することで実現する。上述したMPDの記述例D2−3,D2−4では、同一のRepresentation要素の配下に列挙された複数のSubRepresentation要素が、当該Representation要素によりグルーピングされることを利用して、当該グルーピングされたレベル3のピックワンコンポーネントのレイヤで選択されるコンポーネントと、エレメンタリコンポーネントが構造化(例えばミキシング)される例を説明した。
レベル1のレイヤの機能は、MPDのAdaptationSet要素とRepresentation要素の間の関係を利用することで実現する。したがって、ここでは、特別な拡張は必要とされない。
以上のように、第2の実施の形態では、MPDを利用して、第3のレイヤの機能を、EssentialProperty要素によって、コンポーネントの選択の対象となる複数の要素をグルーピングすることで実現し、第2のレイヤの機能を、EssentialProperty要素によって、コンポーネントの構造化の対象となる複数の要素をグルーピングすることで実現し、第1のレイヤの機能を、MPDのAdaptationSet要素とRepresentation要素との関係を利用することで実現して、図7のコンポーネントレイヤ構造のサービス要件が満たされるようにして、MPEG-DASH方式を利用して放送サービスを提供することができるようにしている。
なお、第2の実施の形態では、MPDにおいて、複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための要素として、EssentialProperty要素を利用した場合を中心に説明したが、それに限らず、例えば、SupplementalProperty要素を利用するなど、他の要素や属性などを利用するようにしてもよい。
(2)具体的な運用例
次に、図19乃至図21を参照して、第2の実施の形態についての具体的な運用例について説明する。
(2−1)運用例4
図19は、オーディオストリームのミキシング再生を行う運用例4を説明するための図である。図19においては、当該運用例4を実現するためのMPDの記述内容が示されており、「R」、「SR」は、Representation要素と、SubRepresentation要素をそれぞれ表している。また、「EP」はEssentialProperty要素を表し、「@sIUri」、「@val」は、EssentialProperty要素のschemeIdUri属性と、value属性を表している。なお、「SP」はSupplementalProperty要素を表しているが、ここでも、EssentialProperty要素を利用した場合を中心に説明する。また、これらの略語の関係は後述する他の図でも同様とされる。
ここで、図19の運用例4においては、SubRepresentation要素におけるEssentialProperty要素のschemeIdUri属性の属性値として、「atsc:…:sM:L3:p:L2:C:m」("atsc:…:serviceModel:L3:pickOne:L2:Composite:mixing"の略)が定義されており、この属性値を持っているEssentialProperty要素を有するオーディオコンポーネントは、レベル3のピックワンコンポーネントのレイヤで選択されて出力されるとともに、レベル2のコンポジットコンポーネントのレイヤでミキシングされて出力されることを意味している。
当該EssentialProperty要素のvalue属性には、その値が、レベル3のピックワンコンポーネントのレイヤで選択されるべきコンポーネントのグループID("L3GroupId")と、任意のミキシングパラメータの値を意味することが定義されている。なお、ミキシングを行う際のグルーピングは、上述したように、同一のRepresentation要素の配下に列挙された複数のSubRepresentation要素が、当該Representation要素によりグルーピングされることを利用するため、ここでは、レベル2のグループIDを定義する必要がない。
また、EssentialProperty要素のschemeIdUri属性の属性値として、「atsc:…:sM:L2:C:m」("atsc:…: serviceModel:L2:Composite:mixing"の略)が定義されており、この属性値を持っているEssentialProperty要素を有するオーディオコンポーネントは、レベル2のコンポジットコンポーネントのレイヤでミキシングされて出力されることを意味している。
当該EssentialProperty要素のvalue属性には、その値が、任意のミキシングパラメータの値を意味することが定義されている。なお、ミキシングを行う際のグルーピングは、上述したように、同一のRepresentation要素の配下に列挙された複数のSubRepresentation要素が、当該Representation要素によりグルーピングされることを利用するため、ここでは、レベル2のグループIDを定義する必要がない。
図19においては、単一のオーディオストリームに対応した1つのRepresentation要素が記述され、そのRepresentation要素の配下に、5つのSubRepresentation要素が記述されている。
図中の上から1つ目と2つ目のSubRepresentation要素には、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのダイアログ(Dlg:Dialog)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
なお、1つ目と2つ目のSubRepresentation要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L3:p:L2:C:m"が指定され、value属性として"L3G-1"が指定されている。つまり、このレベル3のレイヤで選択されたコンポーネントは、"1"であるレベル3のグループID("L3GroupId")が指定されたセレクティブグループ1に属していることになる。
図中の上から3つ目のSubRepresentation要素には、オーディオコンポーネントとして、エフェクト(Efct:Effect)が列挙されており、1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。なお、3つ目のSubRepresentation要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L2:C:m"が指定されている。
図中の上から4つ目と5つ目のSubRepresentation要素には、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのミュージック(Music)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
なお、4つ目と5つ目のSubRepresentation要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L3:p:L2:C:m"が指定され、value属性として"L3G-3"が指定されている。つまり、このレベル3のレイヤで選択されたコンポーネントは、"3"であるレベル3のグループID("L3GroupId")が指定されたセレクティブグループ3に属していることになる。
このように、SubRepresentation要素の下位要素となるEssentialProperty要素を利用して、新たな要素を定義して、レベル3のピックワンコンポーネントの対象要素をグルーピングできるように拡張することで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、オーディオコンポーネントの選択が行われる。
そして、レベル3のピックワンコンポーネントのレイヤで選択されるダイアログ(Dlg:Dialog)とミュージック(Music)、さらに、エレメンタリコンポーネントとしてのエフェクト(Efct:Effect)は、同一のRepresentation要素の配下のSubRepresentation要素にそれぞれ列挙されているため、同一のグループに属していることになる。このように、Representation要素とSubRepresentation要素の関係を利用したグルーピングが行われることで、図7のコンポーネントレイヤ構造におけるレベル2のレイヤの機能が実現され、当該レベル2(コンポジットコンポーネント)のレイヤにおいて、オーディオコンポーネントのミキシングが行われることになる。
以上、図19の運用例4においては、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が、SubRepresentation要素に配置されるEssentialProperty要素のschemeIdUri属性とvalue属性によって、レベル3のピックワンコンポーネントの対象要素がグルーピングされることで実現される。また、レベル2の機能が、Representation要素とSubRepresentation要素の関係を利用したグルーピングが行われることで実現される。このようにして、レベル2のレイヤとレベル3のレイヤの機能が実現されることで、オーディオストリームのミキシング再生が行われる。
(2−2)運用例5
図20は、オーディオストリームのグループ選択を行う運用例5を説明するための図である。
図20においては、当該運用例5を実現するためのMPDの記述内容が示されており、「AS」、「R」、「SR」は、AdaptationSet要素と、Representation要素と、SubRepresentation要素をそれぞれ表している。また、図19と同様に、「@sIUri」、「@val」は、EssentialProperty要素のschemeIdUri属性と、value属性を表している。
ここで、図20の運用例5においては、SubRepresentation要素におけるEssentialProperty要素のschemeIdUri属性の属性値として、「atsc:…:sM:L3:p」("atsc:…:serviceModel:L3:pickOne"の略)が定義されており、この属性値を持っているEssentialProperty要素を有するオーディオコンポーネントは、レベル3のピックワンコンポーネントのレイヤで選択されて出力されることを意味している。当該EssentialProperty要素のvalue属性には、その値が、レベル3のピックワンコンポーネントのレイヤで選択されるべきコンポーネントのグループID("L3GroupId")を意味することが定義されている。
また、EssentialProperty要素のschemeIdUri属性の属性値として、「atsc:…:sM:L3:p:L2:C:m」("atsc:…:serviceModel:L3:pickOne:L2:Composite:mixing"の略)が定義されており、この属性値を持っているEssentialProperty要素を有するオーディオコンポーネントは、レベル3のピックワンコンポーネントのレイヤで選択されて出力されるとともに、レベル2のコンポジットコンポーネントのレイヤでミキシングされて出力されることを意味している。
当該EssentialProperty要素のvalue属性には、その値が、レベル3のピックワンコンポーネントのレイヤで選択されるべきコンポーネントのグループID("L3GroupId")と、任意のミキシングパラメータの値を意味することが定義されている。なお、ミキシングを行う際のグルーピングは、上述したように、同一のRepresentation要素の配下に列挙された複数のSubRepresentation要素が、当該Representation要素によりグルーピングされることを利用するため、ここでは、レベル2のグループIDを定義する必要がない。
さらに、EssentialProperty要素のschemeIdUri属性の属性値として、「atsc:…:sM:L2:C:m」("atsc:…: serviceModel:L2:Composite:mixing"の略)が定義されており、この属性値を持っているEssentialProperty要素を有するオーディオコンポーネントは、レベル2のコンポジットコンポーネントのレイヤでミキシングされて出力されることを意味している。
当該EssentialProperty要素のvalue属性には、その値が、任意のミキシングパラメータの値を意味することが定義されている。なお、ミキシングを行う際のグルーピングは、上述したように、同一のRepresentation要素の配下に列挙された複数のSubRepresentation要素が、当該Representation要素によりグルーピングされることを利用するため、ここでは、レベル2のグループIDを定義する必要がない。
単一のオーディオストリームに対応した1つのAdaptationSet要素が記述され、そのAdaptationSet要素の配下に2つのRepresentation要素が記述され、さらに、一方のRepresentation要素には、2つのSubRepresentation要素が記述され、他方のRepresentation要素には、4つのSubRepresentation要素が記述されている。
図中の上から1つ目と2つ目のSubRepresentation要素には、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのステレオ(STR:Stereo)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
なお、1つ目と2つ目のSubRepresentation要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L3:p"が指定され、value属性として"L3G-4"が指定されている。つまり、このレベル3のレイヤで選択されたコンポーネントは、"4"であるレベル3のグループID("L3GroupId")が指定されたセレクティブグループ4に属していることになる。
図中の上から3つ目と4つ目のSubRepresentation要素には、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのミュージック(Music)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
なお、3つ目と4つ目のSubRepresentation要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L3:p:L2:C:m"が指定され、value属性として"L3G-1"が指定されている。つまり、このレベル3のレイヤで選択されたコンポーネントは、"1"であるレベル3のグループID("L3GroupId")が指定されたセレクティブグループ1に属していることになる。
図中の上から5つ目のSubRepresentation要素には、オーディオコンポーネントとして、ダイアログ(Dlg:Dialog)が列挙されており、1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。なお、5つ目のSubRepresentation要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L2:C:m"が指定されている。
図中の上から6つ目のSubRepresentation要素には、オーディオコンポーネントとして、エフェクト(Efct:Effect)が列挙されており、1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。なお、6つ目のSubRepresentation要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L2:C:m"が指定されている。
このように、SubRepresentation要素の下位要素となるEssentialProperty要素を利用して、新たな要素を定義して、レベル3のピックワンコンポーネントの対象要素をグルーピングできるように拡張することで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、オーディオコンポーネントの選択が行われる。
また、6つのSubRepresentation要素のうち、図中の上から3つ目乃至6つ目のSubRepresentation要素には、EssentialProperty要素のschemeIdUri属性として"atsc:…:sM:L3:p:L2:C:m"又は"atsc:…:sM:L2:C:m"が指定されているので、レベル2のコンポジットコンポーネントのレイヤの対象要素となっている。
そして、レベル3のピックワンコンポーネントのレイヤで選択されるミュージック(Music)、さらに、エレメンタリコンポーネントとしてのダイアログ(Dlg:Dialog)とエフェクト(Efct:Effect)は、同一のRepresentation要素の配下のSubRepresentation要素にそれぞれ列挙されているため、同一のグループに属していることになる。このように、Representation要素とSubRepresentation要素の関係を利用したグルーピングが行われることで、図7のコンポーネントレイヤ構造におけるレベル2のレイヤの機能が実現され、当該レベル2(コンポジットコンポーネント)のレイヤにおいて、オーディオコンポーネントのミキシングが行われることになる。
さらにまた、AdaptationSet要素には、その配下に2つのRepresentation要素が記述されているが、図中の上側のRepresentation要素では、セレクティブグループ4に属する高ビットレートと低ビットレートのステレオ(STR:Stereo)のうち、一方のオーディオコンポーネントが選択されている。また、図中の下側のRepresentation要素では、Representation要素とSubRepresentation要素の関係を利用したグルーピングが行われることで、ミュージック(Music)、ダイアログ(Dlg:Dialog)、及び、エフェクト(Efct:Effect)がミキシングされている。そして、AdaptationSet要素とRepresentation要素の間の関係を利用することで、図7のコンポーネントレイヤ構造におけるレベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、AdaptationSet要素の配下のRepresentation要素のオーディオコンポーネントの中から1つのオーディオコンポーネントが選択されることになる。
ここでは、AdaptationSet要素の配下の2つのRepresentation要素のオーディオコンポーネント、すなわち、レベル3(ピックワンコンポーネント)のレイヤで選択されたオーディオコンポーネント(ステレオ)と、レベル2(コンポジットコンポーネント)のレイヤでミキシングされたオーディオコンポーネント(ミュージック、ダイアログ、エフェクト)のうち、いずれか一方のオーディオコンポーネントが選択されることになる。
以上、図20の運用例5においては、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が、SubRepresentation要素に配置されるEssentialProperty要素のschemeIdUri属性とvalue属性によって、レベル3のピックワンコンポーネントの対象要素がグルーピングされることで実現される。また、レベル2のレイヤの機能が、Representation要素とSubRepresentation要素の関係を利用したグルーピングが行われることで実現される。さらにまた、レベル1のレイヤの機能が、AdaptationSet要素とRepresentation要素の間の関係を利用することで実現される。このようにして、レベル1、レベル2、及び、レベル3のレイヤの機能が実現されることで、オーディオコンポーネントのグループ選択が行われ、オーディオコンポーネントが再生される。
(2−3)運用例6
図21は、コンポーネントの同時提示のためのグルーピングを行う運用例6を説明するための図である。図21においては、当該運用例6を実現するためのMPDの記述内容が示されており、「AS」、「R」、「SR」は、AdaptationSet要素と、Representation要素と、SubRepresentation要素をそれぞれ表している。また、図19及び図20等と同様に、「@sIUri」、「@val」は、EssentialProperty要素のschemeIdUri属性と、value属性を表している。さらにまた、Representation要素には、「@id」で示したid属性が記述されている。
また、「SS」は、図14と同様に、Subset要素を表している。Subset要素で、Representation要素の集合を指定するには、Subset要素のcontains属性に、Representation要素のid属性の値をリストとして格納することになるが、ここでは、Subset要素を、コンポーネントレイヤ構造に関する規定の枠外で、ビデオやオーディオなどの複数のコンポーネントの同時提示のためのグルーピングを定義するために用いている。
図21の運用例6においては、SubRepresentation要素におけるEssentialProperty要素のschemeIdUri属性の属性値として、「atsc:…:sM:L3:p」("atsc:…:serviceModel:L3:pickOne"の略)が定義されており、この属性値を持っているEssentialProperty要素を有するオーディオコンポーネントは、レベル3のピックワンコンポーネントのレイヤで選択されて出力されることを意味している。当該EssentialProperty要素のvalue属性には、その値が、レベル3のピックワンコンポーネントのレイヤで選択されるべきコンポーネントのグループID("L3GroupId")を意味することが定義されている。
すなわち、図21のMPDには、ビデオのセレクティブグループ2に属する4つのSubRepresentation要素(「base」、「ext-1」、「ext-2」、「ext-3」)と、ビデオのセレクティブグループ4に属する3つのSubRepresentation要素(「SV2-1」、「SV2-2」、「SV2-3」)と、オーディオのセレクティブグループ5に属する2つのSubRepresentation要素(「NrRbst」、「HiRbst」)が記述され、レベル3のピックワンコンポーネントのレイヤで選択されるべきコンポーネントとしてグルーピングされている。
なお、図21において、「base」は、単独で再生可能な基本の映像信号に相当するビデオコンポーネントを表し、「ext」は、拡張用の映像信号に相当するビデオコンポーネントを表している。また、「SV1」と「SV2」において、「SV」は、主の表示領域であるメインビューに対する補助的な領域となるサブビューを表している。「NrRbst」は、通常のロバスト性を有するオーディオコンポーネントを意味する。また、「HiRbst」は、高いロバスト性を有するオーディオコンポーネントを意味する。「MCD」は、マルチチャンネルのオーディオコンポーネントを表している。さらに、「SV1」と「SV2」において、「SV」は、サブビュー用のオーディオコンポーネントを表している。
id="11"のRepresentation要素の配下には、1つのSubRepresentation要素(「V-base」)のみが記述され、単独で再生可能な基本の映像信号に相当する1つのビデオコンポーネントが常に選択されることになる。このようにして選択されるビデオコンポーネントは、エレメンタリコンポーネントに相当している。なお、当該ビデオコンポーネントは、メインビュー用とされている。
id="12"のRepresentation要素の配下には、4つのSubRepresentation要素(「V-base」、「V-ext-1」、「V-ext-2」、「V-ext-3」)が記述され、それらのSubRepresentation要素群が互いに、Base-Enhance関係の依存関係を有している。すなわち、id='12'のRepresentation要素の配下には、基本の映像信号に相当するビデオコンポーネントが1つ列挙されているほか、拡張用の映像信号に相当するビデオコンポーネントが3つ列挙されており、Base-Enhance関係の依存関係を有している。これにより、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、セレクティブグループ2に属しているビデオコンポーネントの中から、基本の映像信号と拡張用の映像信号に相当するビデオコンポーネントが選択されることになる。なお、当該ビデオコンポーネントは、メインビュー用とされている。
id="13"のRepresentation要素の配下には、1つのSubRepresentation要素(「V-SV-1」)のみが記述され、サブビュー1用の1つのビデオコンポーネントが常に選択されることになる。このようにして選択されるビデオコンポーネントは、エレメンタリコンポーネントに相当している。
id="14"のRepresentation要素の配下には、3つのSubRepresentation要素(「V-SV2-1」、「V-SV2-2」、「V-SV2-3」)が記述され、サブビュー2用のビデオコンポーネントが3つ列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えば、ネットワーク環境条件などに応じて、セレクティブグループ4に属しているビデオコンポーネントの中から、適応的に1つのビデオコンポーネントが選択されることになる。
このように、SubRepresentation要素におけるEssentialProperty要素のschemeIdUri属性とvalue属性によって、グルーピングを行うことで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、当該レベル3(ピックワンコンポーネント)のレイヤにおいて、同一のグループ内のビデオコンポーネントの中から1つのビデオコンポーネントが選択されることになる。なお、図21の運用例6では、レベル2(コンポジットコンポーネント)のレイヤにおいて、複数のビデオコンポーネントを組み合わせて同時に表示させるためにグルーピング(構造化)を行う必要がないので、Representation要素は、いわば、通常のRepresentation要素として用いられている。
そして、AdaptationSet要素とRepresentation要素の間の関係を利用することで、レベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、AdaptationSet要素の配下のRepresentation要素のビデオコンポーネントの中から1つのビデオコンポーネントが選択されることになる。ここでは、AdaptationSet要素の配下の4つのRepresentation要素(id="11","12","13","14")のビデオコンポーネント、すなわち、レベル3(ピックワンコンポーネント)のレイヤで選択されたビデオコンポーネント(「V-base」、「V-ext-1」、「V-ext-2」又は「V-ext-3」と、「V-SV2-1」、「V-SV2-2」又は「V-SV2-3」)と、エレメンタリコンポーネント(「V-base」、「V-SV-1」)の中から、1つのビデオコンポーネントが選択されることになる。
以上、ビデオコンポーネントについて述べたが、オーディオコンポーネントについては次のようになる。すなわち、id="21"のRepresentation要素の配下には、2つのSubRepresentation要素(「A-NrRbst」、「A-HiRbst」)が記述され、通常のロバスト性を有するオーディオコンポーネントと、高いロバスト性を有するオーディオコンポーネントが列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、セレクティブグループ5に属しているオーディオコンポーネントのうち、適応的に一方のオーディオコンポーネントが選択されることになる。なお、当該オーディオコンポーネントは、メインビュー用とされている。
id="22"のRepresentation要素の配下には、1つのSubRepresentation要素(「A-MCD」)のみが記述され、マルチチャンネルの1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。なお、当該オーディオコンポーネントは、メインビュー用とされている。
id="23"のRepresentation要素の配下には、1つのSubRepresentation要素(「A-SV1」)のみが記述され、サブビュー1用の1つのオーディオコンポーネントが常に選択されることになる。同様にid="24"のRepresentation要素の配下には、1つのSubRepresentation要素(「A-SV2」)のみが記述され、サブビュー2用の1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるサブビュー用のオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
このように、SubRepresentation要素におけるEssentialProperty要素のschemeIdUri属性とvalue属性によって、グルーピングを行うことで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、当該レベル3(ピックワンコンポーネント)のレイヤにおいて、同一のグループ内のオーディオコンポーネントの中から1つのオーディオコンポーネントが選択されることになる。なお、図21の運用例6では、レベル2(コンポジットコンポーネント)のレイヤにおいて、複数のオーディオコンポーネントを組み合わせて同時に表示させるためにグルーピング(構造化)を行う必要がないので、Representation要素は、いわば、通常のRepresentation要素として用いられている。
そして、AdaptationSet要素とRepresentation要素の間の関係を利用することで、レベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、AdaptationSet要素の配下のRepresentation要素のオーディオコンポーネントの中から1つのオーディオコンポーネントが選択されることになる。ここでは、AdaptationSet要素の配下の4つのRepresentation要素(id="21","22","23","24")のオーディオコンポーネント、すなわち、レベル3(ピックワンコンポーネント)のレイヤで選択されたオーディオコンポーネント(「A-NrRbst」又は「A-HiRbst」)と、エレメンタリコンポーネント(「A-MCD」、「A-SV1」、「A-SV2」)の中から、1つのオーディオコンポーネントが選択されることになる。
また、図21のMPDにおいては、Subset要素が、コンポーネントレイヤ構造に関する規定の枠外で、ビデオやオーディオなどの複数のコンポーネントの同時提示のためのグルーピングを定義するために用いられている。
具体的には、図中の上から1つ目のSubset要素のcontains属性には"11 21"が指定されており、id="11"のRepresentation要素と、id="21"のRepresentation要素は、同時に提示されるRepresentation要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」)と、オーディオコンポーネント(「A-NrRbst」又は「A-HiRbst」)は、同時に再生されるメインビュー用のコンポーネントとなる。
図中の上から2つ目のSubset要素のcontains属性には"11 22"が指定されており、id="11"のRepresentation要素と、id="22"のRepresentation要素は、同時に提示されるRepresentation要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」)と、オーディオコンポーネント(「A-MCD」)は、同時に再生されるメインビュー用のコンポーネントとなる。
図中の上から3つ目のSubset要素のcontains属性には"12 21"が指定されており、id="12"のRepresentation要素と、id="21"のRepresentation要素は、同時に提示されるRepresentation要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」と「V-ext」)と、オーディオコンポーネント(「A-NrRbst」又は「A-HiRbst」)は、同時に再生されるメインビュー用のコンポーネントとなる。
図中の上から4つ目のSubset要素のcontains属性には"12 22"が指定されており、id="12"のRepresentation要素と、id="22"のRepresentation要素は、同時に提示されるRepresentation要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」と「V-ext」)と、オーディオコンポーネント(「A-MCD」)は、同時に再生されるメインビュー用のコンポーネントとなる。
図中の上から5つ目のSubset要素のcontains属性には"13 23"が指定されており、id="13"のRepresentation要素と、id="23"のRepresentation要素は、同時に提示されるRepresentation要素の組であることを示している。すなわち、ビデオコンポーネント(「V-SV1」)と、オーディオコンポーネント(「A-SV1」)は、同時に再生されるサブビュー1用のコンポーネントとなる。
図中の上から6つ目のSubset要素のcontains属性には"14 24"が指定されており、id="14"のRepresentation要素と、id="24"のRepresentation要素は、同時に提示されるRepresentation要素の組であることを示している。すなわち、ビデオコンポーネント(「V-SV2」)と、オーディオコンポーネント(「A-SV2」)は、同時に再生されるサブビュー2用のコンポーネントとなる。
以上、図21の運用例6においては、Subset要素を、図7のコンポーネントレイヤ構造に関する規定の枠外で、ビデオやオーディオなどの複数のコンポーネントの同時提示のためのグルーピングを定義するために用いることで、例えば、ビデオとオーディオのコンポーネントの間で、メインビュー用、サブビュー1用、又は、サブビュー2用などの関連付けを行うことができる。なお、このような関連付けが行われることから、例えば、ビデオとオーディオのコンポーネントのうち、一方のコンポーネントが特定されれば、他方のコンポーネントを特定することが可能となる。
<5.システム構成>
(放送通信システムの構成例)
図22は、本技術を適用した放送通信システムの構成例を示す図である。
図22に示すように、放送通信システム1は、チャンネルストリーマ10、MPD提供装置20、DASHセグメンタ・ストリーマ30、及び、クライアント装置50から構成される。また、クライアント装置50は、インターネット等のネットワーク90を介して、MPD提供装置20及びDASHセグメンタ・ストリーマ30と相互に接続されている。なお、送信側の装置である、チャンネルストリーマ10、MPD提供装置20、及び、DASHセグメンタ・ストリーマ30は、例えば、放送事業者により提供され、放送局などに設置される。また、受信側の装置である、クライアント装置50は、視聴者の各家庭などに設置される。
チャンネルストリーマ10は、ビデオやオーディオ、字幕などの各種のコンポーネントからなるコンテンツのメタデータを、MPD提供装置20に提供する。また、チャンネルストリーマ10は、ビデオやオーディオ、字幕などの各種のコンポーネントからなるコンテンツのストリームデータを、DASHセグメンタ・ストリーマ30に提供する。
ここでは、例えば、コンテンツを提供するサービスにおいて、アダプティブストリーミング配信を実現するために、当該コンテンツを構成するコンポーネントとして、1Mbps,5Mbps,10Mbps,20Mbps等の異なるビットレートのビデオやオーディオのコンポーネントが用意されている。チャンネルストリーマ10は、これらのコンポーネントを、ストリームデータとして、DASHセグメンタ・ストリーマ30に提供する。
MPD提供装置20は、チャンネルストリーマ10から提供されるコンテンツのメタデータと、DASHセグメンタ・ストリーマ30から提供されるセグメントメタデータに基づいて、MPD(Media Presentation Description)を生成する。生成されたMPDは、放送又は通信を利用して伝送される。
すなわち、MPD提供装置20において、デジタル放送信号でMPDを伝送する場合には、例えば、MPDファイルがFLUTE(File Delivery over Unidirectional Transport)セッションによって、周期的にマルチキャスト配信されることになる。また、MPD提供装置20において、通信網を介してMPDを伝送する場合には、例えば、クライアント装置50からのMPDの要求に応じて、MPDファイルがネットワーク90を介してクライアント装置50にユニキャスト配信されることになる。
DASHセグメンタ・ストリーマ30は、チャンネルストリーマ10から提供されるコンテンツのストリームデータに基づいて、セグメントデータを生成する。生成されたセグメントデータは、放送又は通信を利用して伝送される。
すなわち、DASHセグメンタ・ストリーマ30において、デジタル放送信号でセグメントデータを伝送する場合には、例えばセグメントデータがFLUTEセッションによって、周期的にマルチキャスト配信されることになる。また、DASHセグメンタ・ストリーマ30において、通信網を介してセグメントデータを伝送する場合には、例えば、クライアント装置50からのセグメントデータの要求に応じて、セグメントデータがネットワーク90を介してクライアント装置50にユニキャスト配信されることになる。
クライアント装置50は、MPD提供装置20によってマルチキャスト配信又はユニキャスト配信されるMPDファイルを受信する。また、クライアント装置50は、MPDファイルに基づいて、コンテンツを構成する複数のコンポーネントの候補の中から、最適なコンポーネントを選択する。クライアント装置50は、コンポーネントの選択の結果に基づいて、DASHセグメンタ・ストリーマ30によってマルチキャスト配信又はユニキャスト配信されるセグメントデータを受信する。そして、クライアント装置50は、受信したセグメントデータから、コンテンツのストリームデータを復元することで、コンテンツを再生する。なお、クライアント装置50は、上述した受信機に対応している。
放送通信システム1は、以上のように構成される。次に、図22の放送通信システム1を構成する各装置の詳細な構成について説明する。
(送信側の装置の構成例)
図23は、送信側の装置の構成例を示す図である。
図23に示すように、送信側の装置は、チャンネルストリーマ10、MPD提供装置20、及び、DASHセグメンタ・ストリーマ30から構成される。
チャンネルストリーマ10は、コンテンツ管理部101、コンテンツ蓄積部102、及び、通信部103から構成される。コンテンツ管理部101は、コンテンツ蓄積部102に蓄積されるコンテンツを管理する。
通信部103は、コンテンツ管理部101からの制御に従い、コンテンツ蓄積部102に蓄積されたコンテンツのメタデータを、MPD提供装置20に供給する。また、通信部103は、コンテンツ管理部101からの制御に従い、コンテンツ蓄積部102に蓄積されたコンテンツのストリームデータを、DASHセグメンタ・ストリーマ30に供給する。
MPD提供装置20は、MPD生成部201、通信部202、及び、送信部203から構成される。
通信部202は、チャンネルストリーマ10から提供されるコンテンツのメタデータと、DASHセグメンタ・ストリーマ30から提供されるセグメントメタデータを受信して、MPD生成部201に供給する。MPD生成部201は、通信部202から供給されるコンテンツのメタデータ及びセグメントメタデータに基づいて、MPDファイルを生成し、通信部202又は送信部203に供給する。
通信部202は、クライアント装置50からのMPDの要求に応じて、MPD生成部201から供給されるMPDファイルを、ネットワーク90を介してクライアント装置50に送信する。また、送信部203は、MPD生成部201から供給されるMPDファイルを変調し、アンテナ204を介してデジタル放送信号で送信する。なお、このとき、MPDファイルは、例えばFLUTEセッションで伝送される。
DASHセグメンタ・ストリーマ30は、セグメントデータ生成部301、セグメントメタデータ生成部302、通信部303、及び、送信部304から構成される。
通信部303は、チャンネルストリーマ10から提供されるコンテンツのストリームデータを受信して、セグメントデータ生成部301に供給する。セグメントデータ生成部301は、通信部303から供給されるコンテンツのストリームデータに基づいて、セグメントデータを生成し、通信部303又は送信部304に供給する。
通信部303は、クライアント装置50からのセグメントデータの要求に応じて、セグメントデータ生成部301から供給されるセグメントデータを、ネットワーク90を介してクライアント装置50に送信する。また、送信部304は、セグメントデータ生成部301から供給されるセグメントデータを変調し、アンテナ305を介してデジタル放送信号で送信する。なお、このとき、セグメントデータは、例えばFLUTEセッションで伝送される。
また、セグメントデータ生成部301は、生成されたセグメントデータを、セグメントメタデータ生成部302に供給する。セグメントメタデータ生成部302は、セグメントデータ生成部301から供給されるセグメントデータに基づいて、セグメントメタデータを生成し、通信部303に供給する。通信部303は、セグメントメタデータ生成部302から供給されるセグメントメタデータを、MPD提供装置20に供給する。
なお、図22及び図23においては、説明の都合上、送信側のチャンネルストリーマ10、MPD提供装置20、及び、DASHセグメンタ・ストリーマ30は別個の装置であるとして説明しているが、送信側の装置は、図23に示した機能的構成を有していればよく、例えば、チャンネルストリーマ10、MPD提供装置20、及び、DASHセグメンタ・ストリーマ30を、1つの装置として捉えることができる。その際、例えば、通信部や送信部などの重複した機能については1つにまとめることができる。
(受信側の装置の構成例)
図24は、受信側のクライアント装置の構成例を示す図である。
図24に示すように、クライアント装置50は、制御部501、受信部502、ディスプレイ503、スピーカ504、記録部505、及び、通信部506から構成される。
制御部501は、クライアント装置50の各部の動作を制御する。
受信部502は、制御部501からの制御に従い、アンテナ507を介して、送信側の装置から送信されるデジタル放送信号を受信する。受信部502は、デジタル放送信号を復調し、それにより得られるデータを制御部501に供給する。制御部501は、受信部502から供給されるデータに対する各種の処理を行う。
ディスプレイ503は、制御部501からの制御に従い、コンテンツのストリームデータに応じた映像や字幕を表示する。スピーカ504は、制御部501からの制御に従い、コンテンツのストリームデータに応じた音声を出力する。
記録部505は、例えばハードディスクなどから構成され、制御部501からの制御に従い、コンテンツのストリームデータなどを記録する。通信部506は、制御部501からの制御に従い、ネットワーク90を介して、送信側の装置と各種のデータをやりとりする。
また、制御部501は、MPD取得部551、コンポーネント選択部552、セグメントデータ取得部553、及び、セグメントデータ再生部554から構成される。
MPD取得部551は、受信部502又は通信部506を制御して、放送又は通信で伝送されるMPDファイルを取得し、コンポーネント選択部552に供給する。コンポーネント選択部552は、MPD取得部551から供給されるMPDファイルに基づいて、複数のコンポーネントの候補の中から、最適なコンポーネントを選択し、その選択の結果を、セグメントデータ取得部553に供給する。
セグメントデータ取得部553は、コンポーネント選択部552からの選択の結果に基づいて、受信部502又は通信部506を制御して、放送又は通信で伝送されるセグメントデータを取得し、セグメントデータ再生部554に供給する。セグメントデータ再生部554は、セグメントデータ取得部553からのセグメントデータから得られる、ビデオストリームデータをディスプレイ503に、オーディオストリームデータをスピーカ504にそれぞれ供給する。これにより、コンテンツの映像がディスプレイ503に表示され、その映像に同期した音声がスピーカ504から出力される。
なお、図24のクライアント装置50の構成では、ディスプレイ503やスピーカ504を含む構成としているが、ディスプレイ503やスピーカ504を含まない構成として、単体と構成されるようにしてもよいし、テレビジョン受像機やビデオレコーダ等に内蔵されるようにしてもよい。
<6.各装置における具体的な処理の流れ>
上述したように、送信側の装置は、MPDファイルやセグメントデータを、受信側のクライアント装置50からの要求に応じてユニキャスト配信する場合と、受信側のクライアント装置50からの要求に関係なく、周期的にマルチキャスト配信する場合がある。そこで、以下、MPDファイルやセグメントデータがマルチキャスト配信される場合と、ユニキャスト配信される場合についてそれぞれ説明する。
(マルチキャスト配信時の処理の流れ)
まず、図25のフローチャートを参照して、マルチキャスト配信時の各装置における具体的な処理の流れを説明する。なお、図25においては、送信側の装置として、チャンネルストリーマ10、MPD提供装置20、及び、DASHセグメンタ・ストリーマ30における処理の流れが示され、受信側の装置として、クライアント装置50における処理の流れが示されている。
チャンネルストリーマ10は、ステップS101乃至S102の処理を実行する。具体的には、ステップS101において、コンテンツ管理部101は、コンテンツ蓄積部102からコンテンツのメタデータを取得し、通信部103を介してMPD提供装置20に提供する。また、ステップS102において、コンテンツ管理部101は、コンテンツ蓄積部102からコンテンツのストリームデータを取得し、通信部103を介してDASHセグメンタ・ストリーマ30に供給する。
MPD提供装置20は、ステップS201乃至S202の処理を実行する。具体的には、MPD提供装置20では、チャンネルストリーマ10から提供されるコンテンツのメタデータと、DASHセグメンタ・ストリーマ30から提供されるセグメントメタデータが取得される(ステップS101,S303)。ステップS201において、MPD生成部201は、コンテンツのメタデータ及びセグメントメタデータに基づいて、MPDを生成する。
ステップS202において、送信部203は、ステップS201の処理で生成されたMPDに対応するデジタル放送信号を、アンテナ204を介して送信する。ここでは、MPDファイルが、FLUTEセッションによって、周期的にマルチキャスト配信される。
DASHセグメンタ・ストリーマ30は、ステップS301乃至S304の処理を実行する。具体的には、DASHセグメンタ・ストリーマ30では、チャンネルストリーマ10から提供されるコンテンツのストリームデータが取得される(ステップS102)。ステップS301において、セグメントデータ生成部301は、コンテンツのストリームデータに基づいて、セグメントデータを生成する。また、ステップS302において、セグメントメタデータ生成部302は、ステップS301の処理で生成されたセグメントデータに基づいて、セグメントメタデータを生成する。
ステップS303において、通信部303は、ステップS302の処理で生成されたセグメントメタデータを、MPD提供装置20に提供する。また、ステップS304において、送信部304は、ステップS301の処理で生成されたセグメントデータに対応するデジタル放送信号を、アンテナ305を介して送信する。ここでは、セグメントデータが、FLUTEセッションによって、周期的にマルチキャスト配信される。
クライアント装置50は、ステップS501乃至S504の処理を実行する。具体的には、ステップS501において、受信部502は、アンテナ507を介して、MPD提供装置20からマルチキャスト配信されるMPDに対応するデジタル放送信号を受信する。ここでは、MPD取得部551が、デジタル放送信号を復調して得られる、FLUTEセッションで伝送されているMPDファイルを取得することになる。
ステップS502において、コンポーネント選択部552は、ステップS501の処理で取得したMPDファイルに基づいて、複数のコンポーネントの候補の中から、最適なコンポーネントを選択する。ここでは、コンポーネントは、図7のコンポーネントレイヤ構造を有しているが、上述した第1の実施の形態及び第2の実施の形態で説明したように、MPDファイルの記述内容に応じて、レベル1乃至レベル3のレイヤの機能が実現され、最適なコンポーネントが選択されることになる。
ステップS503において、受信部502は、アンテナ507を介して、DASHセグメンタ・ストリーマ30からマルチキャスト配信されるセグメントデータに対応するデジタル放送信号を受信する。ここでは、セグメントデータ取得部553が、ステップS502の選択処理の結果に基づいて、DASHセグメンタ・ストリーマ30からマルチキャスト配信され、FLUTEセッションで伝送されているセグメントデータを取得することになる。
ステップS504において、セグメントデータ再生部554は、ステップS503の処理で取得されたセグメントデータから、コンテンツのストリームデータを復元し、ビデオストリームデータをディスプレイ503に、オーディオストリームデータをスピーカ504に供給する。これにより、コンテンツの映像がディスプレイ503に表示され、その映像に同期した音声がスピーカ504から出力される。
以上、マルチキャスト配信時の各装置における具体的な処理の流れについて説明した。
(ユニキャスト配信時の処理の流れ)
次に、図26のフローチャートを参照して、ユニキャスト配信時の各装置における具体的な処理の流れを説明する。なお、図26においては、図25と同様に、送信側の装置として、チャンネルストリーマ10、MPD提供装置20、及び、DASHセグメンタ・ストリーマ30における処理の流れが示され、受信側の装置として、クライアント装置50における処理の流れが示されている。
チャンネルストリーマ10により実行されるステップS151乃至S152の処理の内容は、図25のステップS101乃至S102の処理と同様である。すなわち、ステップS151乃至S152においては、コンテンツのメタデータがMPD提供装置20に提供され、コンテンツのストリームデータがDASHセグメンタ・ストリーマ30に供給される。
MPD提供装置20は、ステップS251乃至S252の処理を実行する。具体的には、MPD提供装置20では、チャンネルストリーマ10から提供されるコンテンツのメタデータと、DASHセグメンタ・ストリーマ30から提供されるセグメントメタデータが取得される(ステップS151,S353)。ステップS251において、MPD生成部201は、コンテンツのメタデータ及びセグメントメタデータに基づいて、MPDファイルを生成する。
ステップS252において、通信部202は、クライアント装置50からのMPDの要求を受信した場合には、そのMPDの要求に応じて、ステップS251の処理で生成されたMPDファイルを、ネットワーク90を介して、クライアント装置50に送信する。
DASHセグメンタ・ストリーマ30は、ステップS351乃至S354の処理を実行する。具体的には、DASHセグメンタ・ストリーマ30では、チャンネルストリーマ10から提供されるコンテンツのストリームデータが取得される(ステップS152)。ステップS351において、セグメントデータ生成部301は、コンテンツのストリームデータに基づいて、セグメントデータを生成する。また、ステップS352において、セグメントメタデータ生成部302は、ステップS351の処理で生成されたセグメントデータに基づいて、セグメントメタデータを生成する。
ステップS353において、通信部303は、ステップS352の処理で生成されたセグメントメタデータを、MPD提供装置20に提供する。また、ステップS354において、通信部303は、クライアント装置50からのセグメントデータの要求を受信した場合には、そのセグメントデータの要求に応じて、ステップS351の処理で生成されたセグメントデータを、ネットワーク90を介して、クライアント装置50に送信する。
クライアント装置50は、ステップS551乃至S556の処理を実行する。具体的には、ステップS551において、通信部506は、MPD取得部551からの制御に従い、ネットワーク90を介してMPD提供装置20にアクセスして、MPDを要求する。ステップS552において、通信部506は、MPD取得部551からの制御に従い、ネットワーク90を介してMPD提供装置20からユニキャスト配信されるMPDファイルを受信する。
ステップS553において、コンポーネント選択部552は、ステップS552の処理で取得したMPDファイルに基づいて、複数のコンポーネントの候補の中から、最適なコンポーネントを選択する。ここでは、コンポーネントは、図7のコンポーネントレイヤ構造を有しているが、上述した第1の実施の形態及び第2の実施の形態で説明したように、MPDファイルの記述内容に応じて、レベル1乃至レベル3のレイヤの機能が実現され、最適なコンポーネントが選択されることになる。
ステップS554において、通信部506は、セグメントデータ取得部553からの制御に従い、ネットワーク90を介してDASHセグメンタ・ストリーマ30にアクセスして、セグメントデータを要求する。ステップS555において、通信部506は、セグメントデータ取得部553からの制御に従い、ネットワーク90を介してDASHセグメンタ・ストリーマ30からユニキャスト配信されるセグメントデータを受信する。
ステップS556において、セグメントデータ再生部554は、ステップS555の処理で取得されたセグメントデータから、コンテンツのストリームデータを復元し、ビデオストリームデータをディスプレイ503に、オーディオストリームデータをスピーカ504に供給する。これにより、コンテンツの映像がディスプレイ503に表示され、その映像に同期した音声がスピーカ504から出力される。
以上、ユニキャスト配信時の各装置における具体的な処理の流れについて説明した。
<7.コンピュータの構成>
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。図27は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示す図である。
コンピュータ900において、CPU(Central Processing Unit)901,ROM(Read Only Memory)902,RAM(Random Access Memory)903は、バス904により相互に接続されている。バス904には、さらに、入出力インターフェース905が接続されている。入出力インターフェース905には、入力部906、出力部907、記録部908、通信部909、及び、ドライブ910が接続されている。
入力部906は、キーボード、マウス、マイクロフォンなどよりなる。出力部907は、ディスプレイ、スピーカなどよりなる。記録部908は、ハードディスクや不揮発性のメモリなどよりなる。通信部909は、ネットワークインターフェースなどよりなる。ドライブ910は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア911を駆動する。
以上のように構成されるコンピュータ900では、CPU901が、ROM902や記録部908に記憶されているプログラムを、入出力インターフェース905及びバス904を介して、RAM903にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ900(CPU901)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア911に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することができる。
コンピュータ900では、プログラムは、リムーバブルメディア911をドライブ910に装着することにより、入出力インターフェース905を介して、記録部908にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部909で受信し、記録部908にインストールすることができる。その他、プログラムは、ROM902や記録部908に、あらかじめインストールしておくことができる。
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであってもよいし、複数のコンピュータによって分散処理されるものであってもよい。
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
また、本技術は、以下のような構成をとることができる。
(1)
デジタル放送の放送波を受信する受信部と、
前記放送波又は通信網で伝送される、MPEG-DASH(Moving Picture Expert Group - Dynamic Adaptive Streaming over HTTP)の規格に準拠したMPD(Media Presentation Description)のあらかじめ規定されている複数の要素の間の関係と、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための第1の要素に基づいて、前記コンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御する制御部と
を備える受信装置。
(2)
前記レイヤ構造は、第1のレイヤ、第2のレイヤ、及び、第3のレイヤの3層からなり、
前記第3のレイヤは、前記コンポーネントを適応的に選択するためのレイヤであり、
前記第2のレイヤは、前記第3のレイヤで選択されたコンポーネント、及び、前記第3のレイヤの対象となっていないコンポーネントを1つのコンポーネントに構造化するためのレイヤであり、
前記第1のレイヤは、前記第2のレイヤで構造化されたコンポーネント、前記第3のレイヤで選択されたコンポーネント、及び、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントの中から、1つのコンポーネントを選択するためのレイヤである
(1)に記載の受信装置。
(3)
前記第3のレイヤの機能は、前記MPDのAdaptationSet要素とRepresentation要素との関係を利用することで実現され、
前記第2のレイヤの機能は、前記第1の要素によって、コンポーネントの構造化の対象となる複数の要素をグルーピングすることで実現され、
前記第1のレイヤの機能は、前記第1の要素によって、コンポーネントの選択の対象となる複数の要素をグルーピングすることで実現される
(2)に記載の受信装置。
(4)
前記第1の要素は、EssentialProperty要素又はSupplementalProperty要素であり、
前記EssentialProperty要素又は前記SupplementalProperty要素のschemeIdUri属性とvalue属性によって、グルーピングする対象の要素が指定される
(3)に記載の受信装置。
(5)
前記第2のレイヤの機能は、前記第3のレイヤで選択されたコンポーネントと、前記第3のレイヤの対象となっていないコンポーネントとが、同一のグループIDによりグルーピングされることで実現される
(4)に記載の受信装置。
(6)
前記第1のレイヤの機能は、前記第2のレイヤで構造化されたコンポーネントと、前記第3のレイヤで選択されたコンポーネントと、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントとが、同一のグループIDによりグルーピングされることで実現される
(4)又は(5)に記載の受信装置。
(7)
前記MPDには、前記複数のレイヤ構造に関する規定の枠外で、AdaptationSet要素の組を指定する第2の要素が含まれる
(3)乃至(6)のいずれか一項に記載の受信装置。
(8)
前記第2の要素は、Subset要素であり、
前記Subset要素のcontains属性により、前記AdaptationSet要素の組が指定される
(7)に記載の受信装置。
(9)
前記第3のレイヤの機能は、前記第1の要素によって、コンポーネントの選択の対象となる複数の要素をグルーピングすることで実現され、
前記第2のレイヤの機能は、前記第1の要素によって、コンポーネントの構造化の対象となる複数の要素をグルーピングすることで実現され、
前記第1のレイヤの機能は、前記MPDのAdaptationSet要素とRepresentation要素との関係を利用することで実現される
(2)に記載の受信装置。
(10)
前記第1の要素は、EssentialProperty要素又はSupplementalProperty要素であり、
前記EssentialProperty要素又は前記SupplementalProperty要素のschemeIdUri属性とvalue属性によって、グルーピングする対象の要素が指定される
(9)に記載の受信装置。
(11)
前記第3のレイヤの機能は、前記第3のレイヤで適応的に選択されるコンポーネントが、同一のグループIDによりグルーピングされることで実現される
(10)に記載の受信装置。
(12)
前記第2のレイヤの機能は、前記第2のレイヤで構造化されるコンポーネントが、前記MPDのRepresentation要素とSubRepresentation要素との関係を利用してグルーピングされることで実現される
(10)又は(11)に記載の受信装置。
(13)
前記MPDには、前記複数のレイヤ構造に関する規定の枠外で、Representation要素の組を指定する第2の要素が含まれる
(9)乃至(12)のいずれか一項に記載の受信装置。
(14)
前記第2の要素は、Subset要素であり、
前記Subset要素のcontains属性により、前記Representation要素の組が指定される
(13)に記載の受信装置。
(15)
前記コンポーネントは、前記放送波又は前記通信網で伝送される
(1)乃至(14)のいずれか一項に記載の受信装置。
(16)
受信装置の受信方法において、
前記受信装置が、
デジタル放送の放送波を受信し、
前記放送波又は通信網で伝送される、MPEG-DASHの規格に準拠したMPDのあらかじめ規定されている複数の要素の間の関係と、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための第1の要素に基づいて、前記コンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御する
ステップを含む受信方法。
(17)
MPEG-DASHの規格に準拠したMPDとして、前記MPDのあらかじめ規定されている複数の要素の間の関係と、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための第1の要素に基づいて、前記コンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御することが可能な情報を少なくとも含む前記MPDを生成する生成部と、
生成された前記MPDを、デジタル放送の放送波又は通信網を介して送信する送信部と
を備える送信装置。
(18)
送信装置の送信方法において、
前記送信装置が、
MPEG-DASHの規格に準拠したMPDとして、前記MPDのあらかじめ規定されている複数の要素の間の関係と、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための第1の要素に基づいて、前記コンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御することが可能な情報を少なくとも含む前記MPDを生成し、
生成された前記MPDを、デジタル放送の放送波又は通信網を介して送信する
ステップを含む送信方法。
1 放送通信システム, 10 チャンネルストリーマ, 20 MPD提供装置, 30 DASHセグメンタ・ストリーマ, 50 クライアント装置, 90 ネットワーク, 101 コンテンツ管理部, 102 コンテンツ蓄積部, 103 通信部, 201 MPD生成部, 202 通信部, 203 送信部, 301 セグメントデータ生成部, 302 セグメントメタデータ生成部, 303 通信部, 304 送信部, 501 制御部, 502 受信部, 503 ディスプレイ, 504 スピーカ, 505 記録部, 506 通信部, 551 MPD取得部, 552 コンポーネント選択部, 553 セグメントデータ取得部, 554 セグメントデータ再生部, 900 コンピュータ, 901 CPU

Claims (17)

  1. デジタル放送の放送波を受信する受信部と、
    前記放送波又は通信網で伝送される、MPEG-DASH(Moving Picture Expert Group - Dynamic Adaptive Streaming over HTTP)の規格に準拠したMPD(Media Presentation Description)のあらかじめ規定されている複数の要素の間の関係と、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための第1の要素に基づいて、前記コンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御する制御部と
    を備え
    前記レイヤ構造は、第1のレイヤ、第2のレイヤ、及び、第3のレイヤの3層からなり、
    前記第3のレイヤは、前記コンポーネントを適応的に選択するためのレイヤであり、
    前記第2のレイヤは、前記第3のレイヤで選択されたコンポーネント、及び、前記第3のレイヤの対象となっていないコンポーネントを1つのコンポーネントに構造化するためのレイヤであり、
    前記第1のレイヤは、前記第2のレイヤで構造化されたコンポーネント、前記第3のレイヤで選択されたコンポーネント、及び、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントの中から、1つのコンポーネントを選択するためのレイヤである
    受信装置。
  2. 前記第3のレイヤの機能は、前記MPDのAdaptationSet要素とRepresentation要素との関係を利用することで実現され、
    前記第2のレイヤの機能は、前記第1の要素によって、コンポーネントの構造化の対象となる複数の要素をグルーピングすることで実現され、
    前記第1のレイヤの機能は、前記第1の要素によって、コンポーネントの選択の対象となる複数の要素をグルーピングすることで実現される
    請求項に記載の受信装置。
  3. 前記第1の要素は、EssentialProperty要素又はSupplementalProperty要素であり、
    前記EssentialProperty要素又は前記SupplementalProperty要素のschemeIdUri属性とvalue属性によって、グルーピングする対象の要素が指定される
    請求項に記載の受信装置。
  4. 前記第2のレイヤの機能は、前記第3のレイヤで選択されたコンポーネントと、前記第3のレイヤの対象となっていないコンポーネントとが、同一のグループIDによりグルーピングされることで実現される
    請求項に記載の受信装置。
  5. 前記第1のレイヤの機能は、前記第2のレイヤで構造化されたコンポーネントと、前記第3のレイヤで選択されたコンポーネントと、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントとが、同一のグループIDによりグルーピングされることで実現される
    請求項又はに記載の受信装置。
  6. 前記MPDには、前記複数のレイヤ構造に関する規定の枠外で、AdaptationSet要素の組を指定する第2の要素が含まれる
    請求項乃至のいずれかに記載の受信装置。
  7. 前記第2の要素は、Subset要素であり、
    前記Subset要素のcontains属性により、前記AdaptationSet要素の組が指定される
    請求項に記載の受信装置。
  8. 前記第3のレイヤの機能は、前記第1の要素によって、コンポーネントの選択の対象となる複数の要素をグルーピングすることで実現され、
    前記第2のレイヤの機能は、前記第1の要素によって、コンポーネントの構造化の対象となる複数の要素をグルーピングすることで実現され、
    前記第1のレイヤの機能は、前記MPDのAdaptationSet要素とRepresentation要素との関係を利用することで実現される
    請求項に記載の受信装置。
  9. 前記第1の要素は、EssentialProperty要素又はSupplementalProperty要素であり、
    前記EssentialProperty要素又は前記SupplementalProperty要素のschemeIdUri属性とvalue属性によって、グルーピングする対象の要素が指定される
    請求項に記載の受信装置。
  10. 前記第3のレイヤの機能は、前記第3のレイヤで適応的に選択されるコンポーネントが、同一のグループIDによりグルーピングされることで実現される
    請求項に記載の受信装置。
  11. 前記第2のレイヤの機能は、前記第2のレイヤで構造化されるコンポーネントが、前記MPDのRepresentation要素とSubRepresentation要素との関係を利用してグルーピングされることで実現される
    請求項又は10に記載の受信装置。
  12. 前記MPDには、前記複数のレイヤ構造に関する規定の枠外で、Representation要素の組を指定する第2の要素が含まれる
    請求項乃至11のいずれかに記載の受信装置。
  13. 前記第2の要素は、Subset要素であり、
    前記Subset要素のcontains属性により、前記Representation要素の組が指定される
    請求項12に記載の受信装置。
  14. 前記コンポーネントは、前記放送波又は前記通信網で伝送される
    請求項1乃至13のいずれかに記載の受信装置。
  15. 受信装置の受信方法において、
    前記受信装置が、
    デジタル放送の放送波を受信し、
    前記放送波又は通信網で伝送される、MPEG-DASHの規格に準拠したMPDのあらかじめ規定されている複数の要素の間の関係と、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための第1の要素に基づいて、前記コンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御する
    ステップを含み、
    前記レイヤ構造は、第1のレイヤ、第2のレイヤ、及び、第3のレイヤの3層からなり、
    前記第3のレイヤは、前記コンポーネントを適応的に選択するためのレイヤであり、
    前記第2のレイヤは、前記第3のレイヤで選択されたコンポーネント、及び、前記第3のレイヤの対象となっていないコンポーネントを1つのコンポーネントに構造化するためのレイヤであり、
    前記第1のレイヤは、前記第2のレイヤで構造化されたコンポーネント、前記第3のレイヤで選択されたコンポーネント、及び、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントの中から、1つのコンポーネントを選択するためのレイヤである
    受信方法。
  16. MPEG-DASHの規格に準拠したMPDとして、前記MPDのあらかじめ規定されている複数の要素の間の関係と、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための第1の要素に基づいて、前記コンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御することが可能な情報を少なくとも含む前記MPDを生成する生成部と、
    生成された前記MPDを、デジタル放送の放送波又は通信網を介して送信する送信部と
    を備え
    前記レイヤ構造は、第1のレイヤ、第2のレイヤ、及び、第3のレイヤの3層からなり、
    前記第3のレイヤは、前記コンポーネントを適応的に選択するためのレイヤであり、
    前記第2のレイヤは、前記第3のレイヤで選択されたコンポーネント、及び、前記第3のレイヤの対象となっていないコンポーネントを1つのコンポーネントに構造化するためのレイヤであり、
    前記第1のレイヤは、前記第2のレイヤで構造化されたコンポーネント、前記第3のレイヤで選択されたコンポーネント、及び、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントの中から、1つのコンポーネントを選択するためのレイヤである
    送信装置。
  17. 送信装置の送信方法において、
    前記送信装置が、
    MPEG-DASHの規格に準拠したMPDとして、前記MPDのあらかじめ規定されている複数の要素の間の関係と、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択又は構造化を行う特定のレイヤの対象要素をグルーピングするための第1の要素に
    基づいて、前記コンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御することが可能な情報を少なくとも含む前記MPDを生成し、
    生成された前記MPDを、デジタル放送の放送波又は通信網を介して送信する
    ステップを含み、
    前記レイヤ構造は、第1のレイヤ、第2のレイヤ、及び、第3のレイヤの3層からなり、
    前記第3のレイヤは、前記コンポーネントを適応的に選択するためのレイヤであり、
    前記第2のレイヤは、前記第3のレイヤで選択されたコンポーネント、及び、前記第3のレイヤの対象となっていないコンポーネントを1つのコンポーネントに構造化するためのレイヤであり、
    前記第1のレイヤは、前記第2のレイヤで構造化されたコンポーネント、前記第3のレイヤで選択されたコンポーネント、及び、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントの中から、1つのコンポーネントを選択するためのレイヤである
    送信方法。
JP2016514865A 2014-04-24 2015-04-13 受信装置、受信方法、送信装置、及び、送信方法 Expired - Fee Related JP6610538B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014090102 2014-04-24
JP2014090102 2014-04-24
PCT/JP2015/061312 WO2015163172A1 (ja) 2014-04-24 2015-04-13 受信装置、受信方法、送信装置、及び、送信方法

Publications (2)

Publication Number Publication Date
JPWO2015163172A1 JPWO2015163172A1 (ja) 2017-04-13
JP6610538B2 true JP6610538B2 (ja) 2019-11-27

Family

ID=54332339

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016514865A Expired - Fee Related JP6610538B2 (ja) 2014-04-24 2015-04-13 受信装置、受信方法、送信装置、及び、送信方法

Country Status (7)

Country Link
US (2) US10334323B2 (ja)
EP (1) EP3136739A4 (ja)
JP (1) JP6610538B2 (ja)
KR (1) KR102331016B1 (ja)
CA (1) CA2944840C (ja)
MX (1) MX365275B (ja)
WO (1) WO2015163172A1 (ja)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120083747A (ko) * 2011-01-18 2012-07-26 삼성전자주식회사 방송통신 융합형 서비스를 위한 전송 방법 및 장치
US9043849B2 (en) * 2011-11-25 2015-05-26 Humax Holdings Co., Ltd. Method for linking MMT media and DASH media
US9451298B2 (en) * 2012-07-02 2016-09-20 Sony Corporation Transmission device, transmission method, and network apparatus
CN104429093B (zh) * 2012-07-09 2018-01-05 华为技术有限公司 超文本传输协议动态自适应流媒体客户端及其会话管理实施方法
EP2873212B1 (en) * 2012-07-10 2022-10-12 VID SCALE, Inc. Quality-driven streaming
JP6348251B2 (ja) * 2012-09-13 2018-06-27 サターン ライセンシング エルエルシーSaturn Licensing LLC 端末装置、受信方法、およびプログラム
US9646162B2 (en) * 2013-04-10 2017-05-09 Futurewei Technologies, Inc. Dynamic adaptive streaming over hypertext transfer protocol service protection
US9705955B2 (en) * 2013-04-18 2017-07-11 Futurewei Technologies, Inc. Period labeling in dynamic adaptive streaming over hypertext transfer protocol
US10841353B2 (en) 2013-11-01 2020-11-17 Ericsson Ab System and method for optimizing defragmentation of content in a content delivery network

Also Published As

Publication number Publication date
MX2016013594A (es) 2017-01-26
CA2944840A1 (en) 2015-10-29
US20190313159A1 (en) 2019-10-10
KR20160146694A (ko) 2016-12-21
MX365275B (es) 2019-05-29
EP3136739A1 (en) 2017-03-01
EP3136739A4 (en) 2017-12-13
CA2944840C (en) 2022-11-01
KR102331016B1 (ko) 2021-11-25
WO2015163172A1 (ja) 2015-10-29
US10334323B2 (en) 2019-06-25
US10979776B2 (en) 2021-04-13
JPWO2015163172A1 (ja) 2017-04-13
US20170048593A1 (en) 2017-02-16

Similar Documents

Publication Publication Date Title
US10382801B2 (en) Transmission apparatus, transmission method, reception apparatus, and reception method
WO2014042028A1 (ja) コンテンツ供給装置、コンテンツ供給方法、プログラム、およびコンテンツ供給システム
JP6329964B2 (ja) 送信装置、送信方法、受信装置、及び、受信方法
JP6630860B2 (ja) 端末装置および受信方法
US10110972B2 (en) Transmitting device, transmitting method, receiving device, and receiving method
WO2014203745A1 (ja) コンテンツ供給装置、コンテンツ供給方法、プログラム、端末装置、およびコンテンツ供給システム
JP6471922B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP6340882B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
WO2014196393A1 (ja) コンテンツ供給装置、コンテンツ供給方法、プログラム、端末装置、およびコンテンツ供給システム
JP6610538B2 (ja) 受信装置、受信方法、送信装置、及び、送信方法
CA2925455A1 (en) Content supplying apparatus, content supplying method, program, terminal device, and content supplying system
WO2015012140A1 (ja) コンテンツ供給装置、コンテンツ供給方法、プログラム、端末装置、およびコンテンツ供給システム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180412

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191001

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191014

R151 Written notification of patent or utility model registration

Ref document number: 6610538

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees