JPWO2016009944A1 - 送信装置、送信方法、受信装置および受信方法 - Google Patents

送信装置、送信方法、受信装置および受信方法 Download PDF

Info

Publication number
JPWO2016009944A1
JPWO2016009944A1 JP2016505353A JP2016505353A JPWO2016009944A1 JP WO2016009944 A1 JPWO2016009944 A1 JP WO2016009944A1 JP 2016505353 A JP2016505353 A JP 2016505353A JP 2016505353 A JP2016505353 A JP 2016505353A JP WO2016009944 A1 JPWO2016009944 A1 JP WO2016009944A1
Authority
JP
Japan
Prior art keywords
metadata
audio stream
audio
identification information
receiving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016505353A
Other languages
English (en)
Other versions
JP6607183B2 (ja
Inventor
塚越 郁夫
郁夫 塚越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2016009944A1 publication Critical patent/JPWO2016009944A1/ja
Application granted granted Critical
Publication of JP6607183B2 publication Critical patent/JP6607183B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • H04N21/2335Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2362Generation or processing of Service Information [SI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • H04N21/4363Adapting the video stream to a specific local network, e.g. a Bluetooth® network
    • H04N21/43632Adapting the video stream to a specific local network, e.g. a Bluetooth® network involving a wired protocol, e.g. IEEE 1394
    • H04N21/43635HDMI
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/633Control signals issued by server directed to the network components or client
    • H04N21/6332Control signals issued by server directed to the network components or client directed to client
    • H04N21/6336Control signals issued by server directed to the network components or client directed to client directed to decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/858Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot
    • H04N21/8586Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot by using a URL

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Systems (AREA)

Abstract

オーディオストリームにメタデータが挿入されていることを受信側で容易に認識可能とする。メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを送信する。コンテナのレイヤに、オーディオストリームにメタデータが挿入されていることを示す識別情報を挿入する。受信側では、オーディオストリームにメタデータが挿入されていることを容易に認識でき、この認識に基づいてオーディオストリームに挿入されているメタデータの抽出処理を行うことで、無駄なく確実にメタデータの取得が可能となる。

Description

本技術は、送信装置、送信方法、受信装置および受信方法に関し、特に、オーディオストリームにメタデータを挿入して送信する送信装置等に関する。
従来、メタデータをオーディオストリームに挿入して送信することが提案されている(例えば、特許文献1参照)。
特開2012−010311号公報
メタデータはオーディオストリームの例えばユーザデータ領域に定義される。しかし、全てのオーディオストリームにメタデータが挿入されるわけではない。
本技術の目的は、オーディオストリームにメタデータが挿入されていることを受信側で容易に認識可能として処理の便宜を図ることにある。
本技術の概念は、
メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを送信する送信部と、
上記コンテナのレイヤに、上記オーディオストリームに上記メタデータが挿入されていることを示す識別情報を挿入する情報挿入部を備える
送信装置にある。
本技術においては、送信部により、メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナが送信される。そして、情報挿入部により、コンテナのレイヤに、オーディオストリームにメタデータが挿入されていることを示す識別情報が挿入される。
例えば、メタデータは、ネットワークアクセス情報を含む、ようにされてもよい。この場合、例えば、ネットワークアクセス情報は、コンテナが有するビデオストリームに含まれる画像データに関係したメディア情報をネットワーク上のサーバから取得するためのネットワークアクセス情報である、ようにされてもよい。
また、例えば、メタデータは、メディア情報の再生制御情報を含む、ようにされてもよい。この場合、例えば、メディア情報は、コンテナが有するビデオストリームに含まれる画像データに関係したメディア情報である、ようにされてもよい。
このように本技術においては、コンテナのレイヤに、オーディオストリームにメタデータが挿入されていることを示す識別情報が挿入される。そのため、受信側では、オーディオストリームにメタデータが挿入されていることを容易に認識でき、この認識に基づいてオーディオストリームに挿入されているメタデータの抽出処理を行うことで、無駄なく確実にメタデータの取得が可能となる。
なお、本技術において、例えば、識別情報には、オーディオストリームにおける音声データの符号化方式の情報が付加されている、ようにされてもよい。この情報の付加により、受信側では、オーディオストリームにおける音声データの符号化方式を容易に把握できる。
また、本技術において、例えば、識別情報には、メタデータのタイプを示すタイプ情報が付加されている、ようにされてもよい。この情報の付加により、受信側では、メタデータのタイプ、すなわちメタデータがどのようなメタデータであるかを容易に把握でき、例えば取得するか否かの判断を行うことも可能となる。
また、本技術において、例えば、識別情報には、メタデータがオーディオストリームのみに挿入されているか否かを示すフラグ情報が付加されている、ようにされてもよい。この情報の付加により、受信側では、メタデータがオーディオストリームのみに挿入されているか否かを容易に把握できる。
また、本技術において、例えば、識別情報には、オーディオストリームに対するメタデータの挿入頻度のタイプを示すタイプ情報が付加されている、ようにされてもよい。この情報の付加により、受信側では、オーディオストリームに対するメタデータの挿入頻度を容易に把握できる。
また、本技術の他の概念は、
メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを受信する受信部を備え、
上記コンテナのレイヤには、上記オーディオストリームに上記メタデータが挿入されていることを示す識別情報が挿入されており、
上記オーディオストリームを、該オーディオストリームにメタデータが挿入されていることを示す識別情報と共に、所定の伝送路を介して、外部機器に送信する送信部をさらに備える
受信装置にある。
本技術において、受信部により、メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナが受信される。コンテナのレイヤには、オーディオストリームにメタデータが挿入されていることを示す識別情報が挿入されている。そして、送信部により、オーディオストリームは、このオーディオストリームにメタデータが挿入されていることを示す識別情報と共に、所定の伝送路を介して、外部機器に送信される。
例えば、送信部は、コンテナが有するビデオストリームをデコードして得られる画像データのブランキング期間にオーディオストリームおよび識別情報を挿入し、この画像データを外部機器に送信することで、オーディオストリームおよび識別情報を外部機器に送信する、ようにされてもよい。この場合、例えば、所定の伝送路は、HDMIケーブルである、ようにされてもよい。
このように本技術においては、メタデータが挿入されたオーディオストリームが、このオーディオストリームにメタデータが挿入されていることを示す識別情報と共に外部機器に送信される。そのため、外部機器側では、オーディオストリームにメタデータが挿入されていることを容易に認識でき、この認識に基づいてオーディオストリームに挿入されているメタデータの抽出処理を行うことで、無駄なく確実にメタデータの取得が可能となる。
また、本技術の他の概念は、
外部機器から、所定の伝送路を介して、オーディオストリームを、該オーディオストリームにメタデータが挿入されていることを示す識別情報と共に受信する受信部と、
上記識別情報に基づいて、上記オーディオストリームをデコードして上記メタデータを抽出するメタデータ抽出部と、
上記メタデータを用いた処理を行う処理部を備える
受信装置にある。
本技術において、受信部により、外部機器から、所定の伝送路を介して、オーディオストリームが、このオーディオストリームにメタデータが挿入されていることを示す識別情報と共に受信される。メタデータ抽出部により、識別情報に基づいて、オーディオストリームがデコードされてメタデータが抽出される。そして、処理部により、メタデータを用いた処理が行われる。
例えば、メタデータは、ネットワークアクセス情報を含み、処理部は、ネットワークアクセス情報に基づいて、ネットワーク上の所定のサーバにアクセスして所定のメディア情報を取得する、ようにされてもよい。また、例えば、所定の伝送路は、HDMIケーブルである、ようにされてもよい。
このように本技術においては、オーディオストリームと共に受信される識別情報に基づいてこのオーディオストリームからメタデータが抽出されて処理に用いられる。そのため、オーディオストリームに挿入されているメタデータを無駄なく確実に取得でき、メタデータを用いた処理を適切に実行できる。
なお、本技術において、例えば、オーディオストリームを、外部スピーカシステムに送信するインタフェース部をさらに備える、ようにされてもよい。この場合、外部スピーカシステムでオーディオストリームをデコードして、外部スピーカシステムで音声を出力することが可能となる。
また、本技術の他の概念は、
メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを受信する受信部を備え、
上記コンテナのレイヤには、上記オーディオストリームに上記メタデータが挿入されていることを示す識別情報が挿入されており、
上記識別情報に基づいて、上記オーディオストリームをデコードして上記メタデータを抽出するメタデータ抽出部と、
上記メタデータを用いた処理を行う処理部を備える
受信装置にある。
本技術において、受信部により、メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナが受信される。コンテナのレイヤには、オーディオストリームにメタデータが挿入されていることを示す識別情報が挿入されている。データ抽出部により、識別情報に基づいて、オーディオストリームがデコードされてメタデータが抽出される。そして、処理部により、メタデータを用いた処理が行われる。
このように本技術においては、コンテナに挿入されている識別情報に基づいてオーディオストリームからメタデータが抽出されて処理に用いられる。そのため、オーディオストリームに挿入されているメタデータを無駄なく確実に取得でき、メタデータを用いた処理を適切に実行できる。
本技術によれば、オーディオストリームにメタデータが挿入されていることを受信側で容易に認識可能となる。なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。
実施の形態としての画像表示システムの構成例を示すブロック図である。 放送送出装置が備えるストリーム生成部の構成例を示すブロック図である。 AC3のフレーム(AC3 Synchronization Frame)の構造を示す図である。 AACの1024サンプル分の音声データが入るフレーム(Raw_data_block)の構造を示す図である。 圧縮フォーマットがAC3の場合にメタデータMDが挿入される「AUX(AUXILIARY DATA)」のの構成を示す図である。 圧縮フォーマットがAACの場合にメタデータMDが挿入される「DSE(data stream element)」の構成を示す図である。 メタデータ汎用シンタクスの一例を説明するための図である。 メタデータ汎用シンタクスの一例を説明するための図である。 メタデータ汎用シンタクスの一例を説明するための図である。 メタデータ汎用シンタクスにおける主要なデータ規定内容を示す図である。 一連のメタデータ(メタデータパケット)を分割して送信する場合における、「metadata_counter」、「metadata_start_flag」の変化例を示す図である。 複数のメタデータが各々の同期対象と同期管理される例を示す図である。 「metadata_linking_Packet()」のシンタクスを示す図である。 「metadata_linking_Packet()」の主要なデータ規定内容を示す図である。 複数のメタデータユニットが各々の同期対象と同期管理される例を示す図である。 オーディオ・ユーザデータ・デスクリプタの構造例を示している。 オーディオ・ユーザデータ・デスクリプタの構造例における主要な情報の内容を示している。 トランスポートストリームおけるビデオ、オーディオのアクセスユニットの配置例と、オーディオストリームに対するメタデータの挿入頻度を説明するための図である。 トランスポートストリームの構成例を示す図である。 画像表示システムを構成するセットトップボックスの構成例を示すブロック図である。 データアイランド区間に配置される、オーディオ・インフォフレーム・パケットの構造例を示す図である。 画像表示システムを構成するテレビ受信機の構成例を示すブロック図である。 セットトップボックスのHDMI送信部と示すテレビ受信機のHDMI受信部の構成例を示すブロック図である。 TMDSチャネルで画像データが伝送される場合の各種の伝送データの区間を示している。 テレビ受信機におけるメタデータを用いた処理の具体例を説明するための図である。 テレビ受信機でメタデータに基づいてネットサービスにアクセスする場合の画面表示の遷移例を示す図である。 実施の形態におけるテレビ受信機における音声出力系の構成を示すブロック図である。 テレビ受信機における音声出力系の他の構成例を示すブロック図である。 画像表示システムの他の構成例を示すブロック図である。
以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明を以下の順序で行う。
1.実施の形態
2.変形例
<1.実施の形態>
[画像表示システムの構成例]
図1は、実施の形態としての画像表示システム10の構成例を示している。この画像表示システム10は、放送送出装置100と、セットトップボックス(STB)200と、テレビ受信機(TV)300を有している。セットトップボックス200とテレビ受信機300は、HDMI(High Definition Multimedia Interface)ケーブル400を介して接続されている。なお、「HDMI」は登録商標である。
放送送出装置100は、トランスポートストリームTSを、放送波に載せて送信する。このトランスポートストリームTSには、ビデオストリームおよびオーディオストリームが含まれる。放送送出装置100は、オーディオストリームに、メタデータを挿入する。このメタデータは、例えば、ネットアクセス情報、メディア情報の再生制御情報などである。
放送送出装置100は、コンテナのレイヤに、オーディオストリームにメタデータが挿入されていることを示す識別情報を挿入する。放送送出装置100は、この識別情報を、例えば、プログラムマップテーブル(PMT:Program Map Table)の配下のオーディオ・エレメンタリストリーム・ループに内にデスクリプタとして挿入する。
放送送出装置100は、この識別情報に、オーディオストリームにおける音声データの符号化方式の情報、メタデータのタイプを示すタイプ情報、メタデータが上記オーディオストリームのみに挿入されているか否かを示すフラグ情報、オーディオストリームに対するメタデータの挿入頻度のタイプを示すタイプ情報などを付加する。
セットトップボックス200は、放送送出装置100から放送波に載せて送信されてくるトランスポートストリームTSを受信する。このトランスポートストリームTSには、上述したように、ビデオストリームおよびオーディオストリームが含まれており、オーディオストリームにはメタデータが挿入されている。
セットトップボックス200は、オーディオストリームを、このオーディオストリームにメタデータが挿入されていることを示す識別情報と共に、HDMIケーブル400を介して、テレビ受信機300に送信する。
ここで、セットトップボックス200は、ビデオストリームをデコードして得られた画像データのブランキング期間にオーディオストリームおよび識別情報を挿入し、この画像データをテレビ受信機300に送信することで、オーディオストリームおよび識別情報をテレビ受信機300に送信する。セットトップボックス200は、この識別情報を、例えば、オーディオ・インフォフレーム・パケット(Audio InfoFrame packet)に挿入する。
テレビ受信機300は、セットトップボックス200から、HDMIケーブル400を介して、オーディオストリームを、このオーディオストリームにメタデータが挿入されていることを示す識別情報と共に、受信する。すなわち、テレビ受信機300は、セットトップボックス200から、オーディオストリームおよび識別情報がブランキング期間に挿入されている画像データを受信する。テレビ受信機300は、識別情報に基づいて、オーディオストリームをデコードしてメタデータを抽出し、このメタデータを用いた処理をする。
[放送送出装置のストリーム生成部]
図2は、放送送出装置100が備えるストリーム生成部110の構成例を示している。このストリーム生成部110は、制御部111と、ビデオエンコーダ112と、オーディオエンコーダ113と、マルチプレクサ114を有している。
制御部111は、CPU111aを備えており、ストリーム生成部110の各部を制御する。ビデオエンコーダ112は、画像データSVに対して、MPEG2、H.264/AVC、H.265/HEVCなどの符号化を施し、ビデオストリーム(ビデオエレメンタリストリーム)を生成する。画像データSVは、例えば、HDDなどの記録媒体から再生された画像データ、あるいはビデオカメラで得られたライブ画像データなどである。
オーディオエンコーダ113は、音声データSAに対して、AC3、AAC、USACなどの圧縮フォーマットによる符号化を施し、オーディオストリーム(オーディオエレメンタリストリーム)を生成する。音声データSAは、上述の画像データSVに対応した音声データであり、HDDなどの記録媒体から再生された音声データ、あるいはマイクロホンで得られたライブ音声データなどである。
オーディオエンコーダ113は、オーディオ符号化ブロック部113aおよびオーディオフレーミング部113bを有している。オーディオ符号化ブロック部113aで符号化ブロックが生成され、オーディオフレーミング部113bでフレーミングが行われる。この場合、圧縮フォーマットにより、符号化ブロックが異なると共に、フレーミングも異なる。
オーディオエンコーダ113は、制御部111による制御のもと、オーディオストリームに、メタデータMDを挿入する。この実施の形態において、メタデータMDは、ネットワーク上のサーバに接続するためのネットワークアクセス情報(URL、ネットワークインフォメーション)、サーバ接続後のメディア情報の再生制御情報(start/wait/resume/stop)を含んでいる。例えば、ネットワークアクセス情報は、ビデオストリームに含まれる画像データに関係したメディア情報をネットワーク上のサーバから取得するための情報とされる。ここで、メタデータMDは、オーディオストリームのユーザデータ領域に埋め込まれる。
制御部111は、オーディオエンコーダ113に、メタデータMDを供給すると共に、このメタデータMDをユーザデータ領域に埋め込むためのサイズ情報を供給する。そして、制御部111は、オーディオストリームのユーザデータ領域にメタデータMDの埋め込みが行われるように、制御する。
例えば、圧縮フォーマットがAC3の場合、制御部111は、サイズS=(frmsizcod−AUXDATA)の情報を、オーディオエンコーダ113に供給する。ここで、サイズSは、AC3のオーディオフレームのサイズであり、ビットレートおよびサンプリング周波数に応じた値が規定されている。
例えば、ビットレートが128kbpsで、サンプリング周波数が32kHzの場合には、384*2Bytesである。また、例えば、ビットレートが128kbpsで、サンプリング周波数が44.1kHzの場合には、279*2Bytesである。また、例えば、ビットレートが128kbpsで、サンプリング周波数が48kHzの場合には、256*2Bytesである。
図3は、詳細説明は省略するが、AC3のフレーム(AC3 Synchronization Frame)の構造を示している。オーディオエンコーダ113は、サイズSを目標値として符号化し、「Audblock 5」の“mantissa data”と、「AUX」と、「CRC」との合計サイズが全体の3/8を超えないように、音声データSAをエンコードする。そして、「AUX」のエリアにメタデータMDを挿入し、CRCを施してストリームを完成する。
また、例えば、圧縮フォーマットがAACの場合、制御部111は、メタデータMDを挿入すべきDSE(data stream element)のサイズDSE_S=cntの情報を、オーディオエンコーダ113に供給する。図4は、詳細説明は省略するが、AACの1024サンプル分の音声データが入るフレーム(Raw_data_block)の構造を示している。オーディオエンコーダ113は、音声データSAをエンコードすると共に、メタデータMDが挿入されたDSEを付加して、ストリームを完成する。
なお、オーディオエンコーダ113は、2回に分けてエンコードすることも可能である。この場合、オーディオエンコーダ113は、最初は通常の、つまりDSEあるいはAUXがない場合のエンコードを行い、その後に予め予約しておいたサイズのDSEあるいはAUXにメタデータMDを挿入して、再度エンコードを行う。
上述したように、メタデータMDは、オーディオストリームのユーザデータ領域(AC3の場合は「AUX」、AACの場合は「DSE」)に埋め込まれるが、その詳細については後述する。詳細説明は省略するが、圧縮フォーマットがUSACの場合も同様に、メタデータMDはオーディオストリームのユーザデータ領域に埋め込まれる。
図2に戻って、マルチプレクサ114は、ビデオエンコーダ112から出力されるビデオストリームおよびオーディオエンコーダ113から出力されるオーディオストリームを、PESパケット化し、さらにトランスポートパケット化して多重し、多重化ストリームとしてのトランスポートストリームTSを得る。
また、マルチプレクサ114は、プログラムマップテーブル(PMT)の配下に、オーディオストリームにメタデータMDが挿入されていることを示す識別情報を挿入する。この識別情報の挿入には、オーディオ・ユーザデータ・デスクリプタ(audio_userdata_descriptor)を用いる。このデスクリプタの詳細については後述する。
図2に示すストリーム生成部110の動作を簡単に説明する。画像データSVはビデオエンコーダ112に供給される。このビデオエンコーダ112では、その画像データSVに対してH.264/AVC、H.265/HEVCなどの符号化が施され、符号化ビデオデータを含むビデオストリームが生成される。
また、音声データSAは、オーディオエンコーダ113に供給される。このオーディオエンコーダ113では、その音声データSAに対して、AC3、AAC、USACなどの符号化が施され、オーディオストリームが生成される。
この際、制御部111からオーディオエンコーダ113に、メタデータMDが供給されると共に、このメタデータMDをユーザデータ領域に埋め込むためのサイズ情報が供給される。そして、オーディオエンコーダ113では、オーディオストリームのユーザデータ領域(例えば、AC3の場合は「AUX」、AACの場合は「DSE」など)に、メタデータMDを埋め込むことが行われる。
ビデオエンコーダ112で生成されたビデオストリームは、マルチプレクサ114に供給される。また、オーディオエンコーダ113で生成された、ユーザデータ領域にメタデータMDが埋め込まれたオーディオストリームは、マルチプレクサ114に供給される。そして、このマルチプレクサ114では、各エンコーダから供給されるストリームがパケット化されて多重され、伝送データとしてトランスポートストリームTSが得られる。
[メタデータMDの埋め込みの詳細]
オーディオストリームのユーザデータ領域へのメタデータMDの埋め込みについてさらに説明する。上述したように、圧縮フォーマットがAC3の場合、メタデータMDは「AUX(AUXILIARY DATA)」の領域に挿入される。
図5は、「AUX(AUXILIARY DATA)」の構成(Syntax)を示している。「auxdatae」が“1”のとき、「aux data」がイネーブルされ、「auxdatal」の14ビット(ビット単位)で示されるサイズのデータが、「auxbits」の中に定義される。その際の「audbits」のサイズは「nauxbits」に記載される。本技術においては、「auzbits」の空間が、「metadata()」と定義される。
図6は、「DSE(data stream element)」の構成(Syntax)を示している。「element_instance_tag」は4ビットで、「data_stream_element」の中のデータ種別を示すが、DSEを統一したユーザデータとして利用する場合は、この値を“0”としてもよい。「Data_byte_align_flag」は、“1”とされ、DSEの全体がバイトアラインされるようにする。「count」、あるいは、その追加バイト数を意味する「esc_count」は、ユーザデータのサイズによって適宜、値が決められる。本技術においては、「data_stream_byte」の空間が、「metadata ()」と定義される。
図7〜図9は、メタデータ汎用シンタクス(Syntax)を示している。また、図10は、メタデータ汎用シンタクスにおける主要なデータ規定内容(semantics)を示している。
「sync_byte」の8ビットフィールドは、メタデータ・コンテナ(metadata container)を示すユニークワードとされる。「metadata_type」の8ビットフィールドは、メタデータのタイプ情報を示す。このタイプ情報により、複数のタイプのメタデータを選択的に送信することが可能となる。例えば、“00000001”は、送信されるメタデータが連携する他サービスのアクセス情報であることを示す。
「metadata_length 」の11ビットフィールドは、以降のバイト数を示す。「metadata_ID」の3ビットフィールドは、メタデータのタイプ内において種類を識別する識別子を示す。この識別子により、同一タイプの複数種類の情報を同時に送信するこが可能となる。
「metadata_counter」の3ビットフィールドは、一連のメタデータを分割して送信する場合に、何番目の分割情報であるかを示すカウント情報である。このカウント情報はオーディオフレーム毎にインクリメントされるカウンタのカウント値である。「metadata_start_flag」の1ビットフィールドは、一連のメタデータ(メタデータパケット)を分割して送信する場合に、最初の分割情報であるか否かを示す。例えば、“1”は最初の分割情報であることを示し、“0”は最初の分割情報ではなく、前のフレームの分割情報に続く分割情報であることを示す。
図11は、一連のメタデータ(メタデータパケット)が3分割され、3つの分割情報が3つのオーディオフレームのユーザデータ領域に埋め込まれて送信される場合における、「metadata_counter」、「metadata_start_flag」の変化例を示している。最初のオーディオフレームでは、「metadata_counter=0」、「metadata_start_flag=1」となる。次のオーディオフレームでは、「metadata_counter=1」、「metadata_start_flag=0」となる。さらに、最後のオーディオフレームでは、「metadata_counter=2」、「metadata_start_flag=0」となる。
図7に戻って、「sync_control_flag 」の1ビットフィールドは、メタデータが同期管理されているか否かを示す。“1”は、「PTS_management()」内のPTSによって同期管理されることを示す。“0”は、同期管理されていないことを示す。「sync_control_flag 」が“1”であるとき、「PTS_management()」が存在する。
図8は、「PTS_management()」の構造(Syntax)を示しており、PTS[32-0]の33ビットで示される時間情報が存在する。図12は、複数のメタデータが各々の同期対象と同期管理される例を示している。この例では、メタデータ(ID1)はオーディオ PTS1と同期し、メタデータ(ID2)はビデオ PTS1と同期し、メタデータ(ID3)はオーディオ PTS2およびビデオ PTS2と同期している。
図7に戻って、「metadata_length 」で示されるバイト数分の「data_byte」は、メタデータパケット「Metadata_packet()」の全体、あるいは、このメタデータパケット「Metadata_packet()」を複数個に分割して得られたいずれかの分割情報を構成する。
図9は、メタデータパケット「metadata_packet()」の構成(syntax)を示している。「packet_type」の8ビットフィールドは、メタデータ「metadata()」(図7参照)内の「metadata_type」の8ビットフィールドと同様に、メタデータのタイプ情報を示す。「metadata_packet_length」の16ビットフィールドは、以降のバイト数を示す。そして、この「metadata_packet_length」で示されるバイト数分の「data_byte」に、メタデータが記載される。
次に、メタデータが他サービスのアクセス情報(Metadata for linking service)である場合の「metadata_packet()」、つまり「metadata_linking_Packet()」について説明する。リンクサービスなどのサーバへの接続の場合、コンテンツあるいはサービスの供給元サーバとして、「http://www/xxx/com/yyy.zzz」の個々の文字は、文字データで「unit_data」になる。また、その他の制御符号は別途定義される約束に基づき、該当符号を「unit_data」に入れる。
図13は、「metadata_linking_packet()」のシンタクス(Syntax)を示している。また、図14は、「metadata_linking_packet()」の主要なデータ規定内容(semantics)を示している。「packet_type」の8ビットフィールドは、メタデータのタイプが他サービスアクセス情報であることを示す。「metadata_linking_packet_length」の16ビットフィールドは、以降のバイト数を示す。「number_of_units」の8ビットフィールドは、メタデータエレメントの数を示す。
「unit_ID」の8ビットフィールドは、ユニット(unit)を識別する識別子を示す。「unit_size」の8ビットフィールドは、メタデータエレメント(metadata_element)のサイズを示す。「extended_size」の8ビットフィールドは、ユニットサイズ(unit_size)の拡張を示す。ユニットサイズ(unit_size)が254を超えるときは、unit_size=255として、拡張サイズ(exended_size)を入力する。「unit_data」の8ビットフィールドは、メタデータエレメント(metadata_element)を示す。
図15は、複数のメタデータユニットが各々の同期対象と同期管理される例を示している。この例で、メタデータ(ID1)のユニット(Unit_ID1)はURLによるリンクサーバの指定を行うための情報、メタデータ(ID1)のユニット(Unit_ID2)は、“Activate”または“Inactivate”を制御するコマンド群である。また、この例で、メタデータ(ID2)のユニット(Unit_ID1)はURLによるリンクサーバの指定を行うための情報、メタデータ(ID2)のユニット(Unit_ID2)は、“Activate”または“Inactivate”などの、リンクサービスに対しての制御をおこなうコマンド群である。
メタデータ(ID1)のユニット(Unit_ID1)は、オーディオ PTS1と同期している。また、メタデータ(ID1)のユニット(Unit_ID2)は、ビデオ PTS1と同期している。また、メタデータ(ID2)のユニット(Unit_ID1)は、オーディオ PTS2およびビデオ PTS2と同期している。
[オーディオ・ユーザデータ・デスクリプタの詳細]
図16は、オーディオ・ユーザデータ・デスクリプタ(audio_userdata_descriptor)の構造例(Syntax)を示している。また、図17は、その構造例における主要な情報の内容(Semantics)を示している。
「descriptor_tag」の8ビットフィールドは、デスクリプタタイプを示す。ここでは、オーディオ・ユーザデータ・デスクリプタであることを示す。「descriptor_length」の8ビットフィールドは、デスクリプタの長さ(サイズ)を示し、デスクリプタの長さとして、以降のバイト数を示す。
「audio_codec_type」の8ビットフィールドは、オーディオの符号化方式(圧縮フォーマット)を示す。例えば、“1”は「MPEG4 AAC」を示し、“2”は「USAC」を示し、“3”は「AC3」を示す。この情報の付加により、受信側では、オーディオストリームにおける音声データの符号化方式を容易に把握できる。
「metadata_type」の3ビットフィールドは、メタデータのタイプを示す。例えば、“1”は、メタデータが連携する他サービスのアクセス情報であることを示す。この情報の付加により、受信側では、メタデータのタイプ、すなわちメタデータがどのようなメタデータであるかを容易に把握でき、例えば取得するか否かの判断を行うことも可能となる。
「coordinated_control_flag」の1ビットフラグ情報は、メタデータがオーディオストリームのみに挿入されているか否かを示す。例えば、“1”は他のコンポーネントのストリームにも挿入されていることを示し、“0”はオーディオストリームのみに挿入されていることを示す。この情報の付加により、受信側では、メタデータがオーディオストリームのみに挿入されているか否かを容易に把握できる。
「frequency_type」の3ビットフィールドは、オーディオストリームに対するメタデータの挿入頻度のタイプを示す。例えば、“1”は各オーディオアクセスユニットに一つのユーザデータ(メタデータ)が挿入されていることを示す。“2”は一つのオーディオアクセスユニットに一つ以上のユーザデータ(メタデータ)が挿入されていることを示す。さらに、“3”はランダムアクセスポイントを含むグループ毎に、その先頭のオーディオアクセスユニットに少なくとも一つのユーザデータ(メタデータ)が挿入されていることを示す。この情報の付加により、受信側では、オーディオストリームに対するメタデータの挿入頻度を容易に把握できる。
図18(a)は、トランスポートストリームTSおけるビデオ、オーディオのアクセスユニットの配置例を示している。「VAU」は、ビデオアクセスユニットを示している。「AAU」は、オーディオアクセスユニットを示している。図18(b)は、「frequency_type = 1」である場合であって、各オーディオアクセスユニットに一つのユーザデータ(メタデータ)が挿入されていることを示している。
図18(c)は、「frequency_type = 2」である場合であって、各オーディオアクセスユニットに一つのユーザデータ(メタデータ)が挿入されていることを示している。一つのオーディオアクセスユニットに一つ以上のユーザデータ(メタデータ)が挿入されていることを示している。図18(d)は、「frequency_type = 3」である場合であって、ランダムアクセスポイントを含むグループ毎に、その先頭のオーディオアクセスユニットに少なくとも一つのユーザデータ(メタデータ)が挿入されていることを示している。
[トランスポートストリームTSの構成]
図19は、トランスポートストリームTSの構成例を示している。この構成例では、PID1で識別されるビデオストリームのPESパケット「video PES」が存在すると共に、PID2で識別されるオーディオストリームのPESパケット「audio PES」が存在する。PESパケットは、PESヘッダ(PES_header)とPESペイロード(PES_payload)からなっている。PESヘッダには、DTS,PTSのタイムスタンプが挿入されている。オーディオストリームのPESパケットのPESペイロードにはメタデータを含むユーザデータ領域が存在する。
また、トランスポートストリームTSには、PSI(Program Specific Information)として、PMT(Program Map Table)が含まれている。PSIは、トランスポートストリームに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。PMTには、プログラム全体に関連する情報を記述するプログラム・ループ(Program loop)が存在する。
また、PMTには、各エレメンタリストリームに関連した情報を持つエレメンタリストリーム・ループが存在する。この構成例では、ビデオストリームに対応したビデオエレメンタリストリーム・ループ(video ES loop)が存在すると共に、オーディオストリームに対応したオーディオエレメンタリストリーム・ループ(audio ES loop)が存在する
ビデオエレメンタリストリーム・ループ(video ES loop)には、ビデオストリームに対応して、ストリームタイプ、PID(パケット識別子)等の情報が配置されると共に、そのビデオストリームに関連する情報を記述するデスクリプタも配置される。このビデオストリームの「Stream_type」の値は「0x24」に設定され、PID情報は、上述したようにビデオストリームのPESパケット「video PES」に付与されるPID1を示すものとされる。デスクリプタの一つして、HEVC デスクリプタが配置される。
また、オーディオエレメンタリストリーム・ループ(audio ES loop)には、オーディオストリームに対応して、ストリームタイプ、PID(パケット識別子)等の情報が配置されると共に、そのオーディオストリームに関連する情報を記述するデスクリプタも配置される。このオーディオストリームの「Stream_type」の値は「0x11」に設定され、PID情報は、上述したようにオーディオストリームのPESパケット「audio PES」に付与されるPID2を示すものとされる。デスクリプタの一つとして、上述したオーディオ・ユーザデータ・デスクリプタ(audio_userdata_descriptor)が配置される。
[セットトップボックスの構成例]
図20は、セットトップボックス200の構成例を示している。このセットトップボックス200は、アンテナ端子203と、デジタルチューナ204と、デマルチプレクサ205と、ビデオデコーダ206と、オーディオフレーミング部207と、HDMI送信部208と、HDMI端子209を有している。また、セットトップボックス200は、CPU211と、フラッシュROM212と、DRAM213と、内部バス214と、リモコン受信部215と、リモコン送信機216を有している。
CPU211は、セットトップボックス200の各部の動作を制御する。フラッシュROM212は、制御ソフトウェアの格納およびデータの保管を行う。DRAM213は、CPU211のワークエリアを構成する。CPU211は、フラッシュROM212から読み出したソフトウェアやデータをDRAM213上に展開してソフトウェアを起動させ、セットトップボックス200の各部を制御する。
リモコン受信部215は、リモコン送信機216から送信されたリモーコントロール信号(リモコンコード)を受信し、CPU211に供給する。CPU211は、このリモコンコードに基づいて、セットトップボックス200の各部を制御する。CPU211、フラッシュROM212およびDRAM213は内部バス214に接続されている。
アンテナ端子203は、受信アンテナ(図示せず)で受信されたテレビ放送信号を入力する端子である。デジタルチューナ204は、アンテナ端子203に入力されたテレビ放送信号を処理して、ユーザの選択チャネルに対応したトランスポートストリームTSを出力する。
デマルチプレクサ205は、トランスポートストリームTSからビデオストリームのパケットを抽出し、ビデオデコーダ206に送る。ビデオデコーダ206は、デマルチプレクサ205で抽出されたビデオのパケットからビデオストリームを再構成し、復号化処理を行って非圧縮の画像データを得る。また、デマルチプレクサ205は、トランスポートストリームTSからオーディオストリームのパケットを抽出し、オーディオストリームを再構成する。オーディオフレーミング部207は、このように再構成されたオーディオストリームに対してフレーミングを行う。
また、デマルチプレクサ205は、トランスポートストリームTSから各種デスクリプタなどを抽出し、CPU211に送信する。ここで、デスクリプタには、オーディオストリームにメタデータが挿入されていることを示す識別情報としてのオーディオ・ユーザデータ・デスクリプタ(図16参照)も含まれる。
HDMI送信部208は、HDMIに準拠した通信により、ビデオデコーダ206で得られた非圧縮の画像データと、オーディオフレーミング部207でフレーミングされた後のオーディオストリームを、HDMI端子209から送出する。HDMI送信部208は、HDMIのTMDSチャネルで送信するため、画像データおよびオーディオストリームをパッキングして、HDMI端子209に出力する。
HDMI送信部208は、CPU211の制御のもと、オーディオストリームにメタデータが挿入されていることを示す識別情報を挿入する。HDMI送信部208は、オーディオストリームおよび識別情報を画像データのブランキング期間に挿入する。このHDMI送信部209の詳細は後述する。
この実施の形態において、HDMI送信部208は、画像データのブランキング期間に配置されるオーディオ・インフォフレーム・パケット(Audio InfoFrame packet)に識別情報を挿入する。このオーディオ・インフォフレーム・パケットは、データアイランド区間に配置される。
図21は、オーディオ・インフォフレーム・パケットの構造例を示している。HDMIでは、このオーディオ・インフォフレーム・パケットにより、音声に関する付帯情報をソース機器からシンク機器に伝送可能となっている。
第0バイトにデータパケットの種類を示す「Packet Type」が定義されており、オーディオ・インフォフレーム・パケットは「0x84」となっている。第1バイトにパケットデータ定義のバージョン情報を記述する。第2バイトに、パケット長を表す情報を記述する。
この実施の形態では、第5バイトの第5ビットに、「userdata_presence_flag」の1ビットフラグ情報が定義される。このフラグ情報が“1”であるとき、第9バイトに識別情報が定義される。第7ビットから第5ビットは「metadata_type」のフィールドとされ、第4ビットは「coordinated_control_flag」のフィールドとされ、第2ビットから第0ビットは「frequency_type」のフィールドとされる。詳細説明は省略するが、これらの各フィールドは、図16に示すオーディオ・ユーザデータ・デスクリプタにおける各フィールドと同じ情報を示す。
セットトップボックス200の動作を簡単に説明する。アンテナ端子203に入力されたテレビ放送信号はデジタルチューナ204に供給される。このデジタルチューナ204では、テレビ放送信号が処理されて、ユーザの選択チャネルに対応したトランスポートストリームTSが出力される。
デジタルチューナ204から出力されるトランスポートストリームTSは、デマルチプレクサ205に供給される。このデマルチプレクサ205では、トランスポートストリームTSからビデオのエレメンタリストリームのパケットが抽出され、ビデオデコーダ206に送られる。
ビデオデコーダ206では、デマルチプレクサ205で抽出されたビデオのパケットからビデオストリームが再構成された後、そのビデオストリームに対してデコード処理が行われて、画像データが得られる。この画像データは、HDMI送信部208に供給される。
また、デマルチプレクサ205では、トランスポートストリームTSからオーディオストリームのパケットが抽出され、オーディオストリームが再構成される。このオーディオストリームはオーディオフレーミング部207でフレーミングされた後に、HDMI送信部208に供給される。そして、HDMI送信部208では、画像データおよびオーディオストリームがパッキングされ、HDMI端子209からHDMIケーブル400に送出される。
また、デマルチプレクサ205では、トランスポートストリームTSから各種デスクリプタなどが抽出され、CPU211に送られる。ここで、デスクリプタには、オーディオ・ユーザデータ・デスクリプタも含まれ、CPU211は、このデスクリプタに基づいて、オーディオストリームにメタデータが挿入されていることを把握する。
HDMI送信部208では、CPU211の制御のもと、画像データのブランキング期間に配置されるオーディオ・インフォフレーム・パケットに、オーディオストリームにメタデータが挿入されていることを示す識別情報が挿入される。これにより、セットトップボックス200からHDMIテレビ受信機300に、オーディオストリームにメタデータが挿入されていることを示す識別情報を送信することが行われる。
[テレビ受信機の構成例]
図22は、テレビ受信機300の構成例を示している。このテレビ受信機300は、アンテナ端子305と、デジタルチューナ306と、デマルチプレクサ307と、ビデオデコーダ308と、映像処理回路309と、パネル駆動回路310と、表示パネル311を有している。
また、テレビ受信機300は、オーディオデコーダ312と、音声処理回路313と、音声増幅回路314と、スピーカ315と、HDMI端子316と、HDMI受信部317と、通信インタフェース318を有している。また、テレビ受信機300は、CPU321と、フラッシュROM322と、DRAM323と、内部バス324と、リモコン受信部325と、リモコン送信機326を有している。
CPU321は、テレビ受信機300の各部の動作を制御する。フラッシュROM322は、制御ソフトウェアの格納およびデータの保管を行う。DRAM323は、CPU321のワークエリアを構成する。CPU321は、フラッシュROM322から読み出したソフトウェアやデータをDRAM323上に展開してソフトウェアを起動させ、テレビ受信機300の各部を制御する。
リモコン受信部325は、リモコン送信機326から送信されたリモートコントロール信号(リモコンコード)を受信し、CPU321に供給する。CPU321は、このリモコンコードに基づいて、テレビ受信機300の各部を制御する。CPU321、フラッシュROM322およびDRAM323は、内部バス324に接続されている。
通信インタフェース318は、CPU321の制御のもと、インターネット等のネットワーク上に存在するサーバとの間で通信を行う。この通信インタフェース318は、内部バス324に接続されている。
アンテナ端子305は、受信アンテナ(図示せず)で受信されたテレビ放送信号を入力する端子である。デジタルチューナ306は、アンテナ端子305に入力されたテレビ放送信号を処理して、ユーザの選択チャネルに対応したトランスポートストリームTSを出力する。
デマルチプレクサ307は、トランスポートストリームTSからビデオストリームのパケットを抽出し、ビデオデコーダ308に送る。ビデオデコーダ308は、デマルチプレクサ307で抽出されたビデオのパケットからビデオストリームを再構成し、復号化処理を行って非圧縮の画像データを得る。
また、デマルチプレクサ205は、トランスポートストリームTSからオーディオストリームのパケットを抽出し、オーディオストリームを再構成する。また、デマルチプレクサ307は、トランスポートストリームTSから各種デスクリプタなどを抽出し、CPU321に送信する。ここで、このデスクリプタには、オーディオストリームにメタデータが挿入されていることを示す識別情報としてのオーディオ・ユーザデータ・デスクリプタ(図16参照)も含まれる。ビデオデコーダ308は、デマルチプレクサ307で抽出されたビデオのパケットからビデオストリームを再構成し、復号化処理を行って非圧縮の画像データを得る。
HDMI受信部317は、HDMIに準拠した通信により、HDMIケーブル400を介してHDMI端子316に供給される画像データおよびオーディオストリームを受信する。また、HDMI受信部317は、画像データのブランキング期間に挿入されている種々の制御情報を抽出し、CPU321に送信する。ここで、この制御情報には、オーディオ・インフォフレーム・パケットに挿入された、オーディオストリームにメタデータが挿入されていることを示す識別情報(図21参照)も含まれる。このHDMI受信部317の詳細は後述する。
映像処理回路309は、ビデオデコーダ308で得られた、あるいはHDMI受信部316で得られた画像データ、さらには、通信インタフェース318でネット上のサーバから受信された画像データなどに対してスケーリング処理、合成処理などを行って、表示用の画像データを得る。
パネル駆動回路310は、映像処理回路309で得られる表示用の画像データに基づいて、表示パネル311を駆動する。表示パネル311は、例えば、LCD(Liquid Crystal Display)、有機ELディスプレイ(organic electroluminescence display)などで構成されている。
オーディオデコーダ312は、デマルチプレクサ307で得られた、あるいはHDMI受信部317で得られたオーディオストリームに対して復号化処理を行って非圧縮の音声データを得る。また、オーディオデコーダ312は、オーディオストリームに挿入されているメタデータを抽出し、CPU321に送信する。CPU321は、適宜、テレビ受信機300の各部にメタデータを用いた処理を行わせる。
音声処理回路313は、オーディオデコーダ312で得られた音声データに対してD/A変換等の必要な処理を行う。音声増幅回路314は、音声処理回路313から出力される音声信号を増幅してスピーカ315に供給する。
図22に示すテレビ受信機300の動作を簡単に説明する。アンテナ端子305に入力されたテレビ放送信号はデジタルチューナ306に供給される。このデジタルチューナ306では、テレビ放送信号が処理されて、ユーザの選択チャネルに対応したトランスポートストリームTSが得られる。
デジタルチューナ306で得られるトランスポートストリームTSは、デマルチプレクサ307に供給される。デマルチプレクサ307では、トランスポートストリームTSからビデオストリームのパケットが抽出され、ビデオデコーダ308に供給される。ビデオデコーダ308では、デマルチプレクサ307で抽出されたビデオのパケットからビデオストリームが再構成され、復号化処理が行われて、非圧縮の画像データが得られる。この画像データは、映像処理回路309に供給される。
また、デマルチプレクサ307では、トランスポートストリームTSからオーディオストリームのパケットが抽出され、オーディオストリームが再構成される。このオーディオストリームは、オーディオデコーダ312に供給される。また、デマルチプレクサ307では、トランスポートストリームTSから各種デスクリプタなどが抽出され、CPU321に送られる。
このデスクリプタには、オーディオストリームにメタデータが挿入されていることを示す識別情報としてのオーディオ・ユーザデータ・デスクリプタも含まれる。そのため、CPU321は、この識別情報に基づいて、オーディオデコーダ312の動作を制御し、オーディオストリームからメタデータを抽出させることが可能となる。
HDMI受信部317では、HDMIに準拠した通信により、HDMIケーブル400を介してHDMI端子316に供給される画像データおよびオーディオストリームが受信される。画像データは、映像処理回路309に供給される。また、オーディオストリームはオーディオデコーダ312に供給される。
また、HDMI受信部317では、画像データのブランキング期間に挿入されている種々の制御情報が抽出され、CPU321に送られる。この制御情報には、オーディオ・インフォフレーム・パケットに挿入された、オーディオストリームにメタデータが挿入されていることを示す識別情報も含まれる。そのため、CPU321は、この識別情報に基づいて、オーディオデコーダ312の動作を制御し、オーディオストリームからメタデータを抽出させることが可能となる。
映像処理回路309では、ビデオデコーダ308で得られた、あるいはHDMI受信部317で得られた画像データ、さらには、通信インタフェース318でネット上のサーバから受信された画像データなどに対してスケーリング処理、合成処理などが施され、表示用の画像データが得られる。ここで、テレビ放送信号を受信して処理する場合は、映像処理回路309では、ビデオデコーダ308で得られた画像データが取り扱われる。一方、セットトップボックス200がHDMIインタフェースで接続される場合は、映像処理回路309では、HDMI受信部317で得られた画像データが取り扱われる。
映像処理回路309で得られた表示用の画像データはパネル駆動回路310に供給される。パネル駆動回路310では、表示用の画像データに基づいて、表示パネル311を駆動することが行われる。これにより、表示パネル311には、表示用の画像データに対応した画像が表示される。
オーディオデコーダ312では、デマルチプレクサ307で得られた、あるいはHDMI受信部316で得られたオーディオストリームに対して復号化処理が行われて非圧縮の音声データが得られる。ここで、テレビ放送信号を受信して処理する場合は、オーディオデコーダ312では、デマルチプレクサ307で得られたオーディオストリームが取り扱われる。一方、セットトップボックス200がHDMIインタフェースで接続される場合は、オーディオデコーダ312では、HDMI受信部317で得られたオーディオストリームが取り扱われる。
オーディオデコーダ312で得られる音声データは、音声処理回路313に供給される。音声処理回路313では、音声データに対してD/A変換等の必要な処理が施される。この音声データは、音声増幅回路314で増幅された後に、スピーカ315に供給される。そのため、スピーカ315から、表示パネル311の表示画像に対応した音声が出力される。
また、オーディオデコーダ312では、オーディオストリームに挿入されているメタデータが抽出される。例えば、このメタデータの抽出処理は、上述したように、CPU321が、オーディオストリームにメタデータが挿入されていることを識別情報に基づいて把握して、オーディオデコーダ312の動作を制御することで、無駄なく確実に行われる。
このようにオーディオデコーダ312で抽出されるメタデータは、CPU321に送られる。そして、CPU321の制御により、適宜、テレビ受信機300の各部でメタデータを用いた処理が行われる。例えば、ネットワーク上のサーバから画像データを取得して、マルチ画面表示が行われる。
[HDMI送信部、HDMI受信部の構成例]
図23は、図20に示すセットトップボックス200のHDMI送信部(HDMIソース)208と、図22に示すテレビ受信機300のHDMI受信部(HDMIシンク)317の構成例を示している。
HDMI送信部208は、有効画像区間(以下、適宜、アクティブビデオ区間ともいう)において、非圧縮の1画面分の画像の画素データに対応する差動信号を、複数のチャネルで、HDMI受信部317に一方向に送信する。ここで、有効画像区間は、ある垂直同期信号から次の垂直同期信号までの区間から、水平帰線区間及び垂直帰線区間を除いた区間である。また、HDMI送信部208は、水平帰線区間または垂直帰線区間において、少なくとも画像に付随する音声データや制御データ、その他の補助データ等に対応する差動信号を、複数のチャネルで、HDMI受信部317に一方向に送信する。
HDMI送信部208とHDMI受信部317とからなるHDMIシステムの伝送チャネルには、以下の伝送チャネルがある。すなわち、HDMI送信部208からHDMI受信部317に対して、画素データおよび音声データを、ピクセルクロックに同期して、一方向にシリアル伝送するための伝送チャネルとしての、3つのTMDSチャネル#0乃至#2がある。また、ピクセルクロックを伝送する伝送チャネルとしての、TMDSクロックチャネルがある。
HDMI送信部208は、HDMIトランスミッタ81を有する。トランスミッタ81は、例えば、非圧縮の画像の画素データを対応する差動信号に変換し、複数のチャネルである3つのTMDSチャネル#0,#1,#2で、HDMIケーブル400を介して接続されているHDMI受信部317に、一方向にシリアル伝送する。
また、トランスミッタ81は、非圧縮の画像に付随する音声データ、さらには、必要な制御データその他の補助データ等を、対応する差動信号に変換し、3つのTMDSチャネル#0,#1,#2でHDMI受信部317に、一方向にシリアル伝送する。
さらに、トランスミッタ81は、3つのTMDSチャネル#0,#1,#2で送信する画素データに同期したピクセルクロックを、TMDSクロックチャネルで、HDMIケーブル400を介して接続されているHDMI受信部317に送信する。ここで、1つのTMDSチャネル#i(i=0,1,2)では、ピクセルクロックの1クロックの間に、10ビットの画素データが送信される。
HDMI受信部317は、アクティブビデオ区間において、複数のチャネルで、HDMI送信部208から一方向に送信されてくる、画素データに対応する差動信号を受信する。また、このHDMI受信部317は、水平帰線区間または垂直帰線区間において、複数のチャネルで、HDMI送信部208から一方向に送信されてくる、音声データや制御データに対応する差動信号を受信する。
すなわち、HDMI受信部317は、HDMIレシーバ82を有する。このHDMIレシーバ82は、TMDSチャネル#0,#1,#2で、HDMI送信部208から一方向に送信されてくる、画素データに対応する差動信号と、音声データや制御データに対応する差動信号を受信する。この場合、HDMI送信部208からTMDSクロックチャネルで送信されてくるピクセルクロックに同期して受信する。
HDMIシステムの伝送チャネルには、上述のTMDSチャネル#0乃至#2およびTMDSクロックチャネルの他に、DDC(Display Data Channel)83やCECライン84と呼ばれる伝送チャネルがある。DDC83は、HDMIケーブル400に含まれる図示しない2本の信号線からなる。DDC83は、HDMI送信部208が、HDMI受信部317から、E−EDID(Enhanced Extended Display Identification Data)を読み出すために使用される。
HDMI受信部317は、HDMIレシーバ81の他に、自身の性能(Configuration/capability)に関する性能情報であるE−EDIDを記憶している、EDID ROM(Read Only Memory)85を有している。HDMI送信部208は、例えば、CPU211(図20参照)からの要求に応じて、HDMIケーブル400を介して接続されているHDMI受信部317から、E−EDIDを、DDC83を介して読み出す。
HDMI送信部208は、読み出したE−EDIDをCPU211に送る。CPU211は、このE−EDIDを、フラッシュROM212あるいはDRAM213に格納する。
CECライン84は、HDMIケーブル400に含まれる図示しない1本の信号線からなり、HDMI送信部208とHDMI受信部317との間で、制御用のデータの双方向通信を行うために用いられる。このCECライン84は、制御データラインを構成している。
また、HDMIケーブル400には、HPD(Hot Plug Detect)と呼ばれるピンに接続されるライン(HPDライン)86が含まれている。ソース機器は、当該ライン86を利用して、シンク機器の接続を検出することができる。なお、このHPDライン86は双方向通信路を構成するHEAC−ラインとしても使用される。また、HDMIケーブル400には、ソース機器からシンク機器に電源を供給するために用いられる電源ライン87が含まれている。さらに、HDMIケーブル400には、ユーティリティライン88が含まれている。このユーティリティライン88は双方向通信路を構成するHEAC+ラインとしても使用される。
図24は、TMDSチャネル#0,#1,#2において、横×縦が1920ピクセル×1080ラインの画像データが伝送される場合の、各種の伝送データの区間を示している。HDMIの3つのTMDSチャネル#0,#1,#2で伝送データが伝送されるビデオフィールド(Video Field)には、伝送データの種類に応じて、ビデオデータ区間17(Video Data Period)、データアイランド区間18(Data Island Period)、およびコントロール区間19(Control Period)の3種類の区間が存在する。
ここで、ビデオフィールド区間は、ある垂直同期信号の立ち上がりエッジ(Active Edge)から次の垂直同期信号の立ち上がりエッジまでの区間であり、水平帰線期間15(Horizontal Blanking)、垂直帰線期間16(Vertical Blanking)、並びに、ビデオフィールド区間から、水平帰線期間および垂直帰線期間を除いた区間である有効画素区間14(Active Video)に分けられる。
ビデオデータ区間17は、有効画素区間14に割り当てられる。このビデオデータ区間17では、非圧縮の1画面分の画像データを構成する1920ピクセル(画素)×1080ライン分の有効画素(Active Pixel)のデータが伝送される。データアイランド区間18およびコントロール区間19は、水平帰線期間15および垂直帰線期間16に割り当てられる。このデータアイランド区間18およびコントロール区間19では、補助データ(Auxiliary Data)が伝送される。
すなわち、データアイランド区間18は、水平帰線期間15と垂直帰線期間16の一部分に割り当てられている。このデータアイランド区間18では、補助データのうち、制御に関係しないデータである、例えば、音声データのパケット等が伝送される。コントロール区間19は、水平帰線期間15と垂直帰線期間16の他の部分に割り当てられている。このコントロール区間19では、補助データのうちの、制御に関係するデータである、例えば、垂直同期信号および水平同期信号、制御パケット等が伝送される。
次に、図25を参照して、テレビ受信機300におけるメタデータを用いた処理の具体例を説明する。テレビ受信機300は、例えば、メタデータとして、初期サーバURL、ネットワーク・サービス識別情報、対象ファイル名、セッション開始・終了コマンド、メディア記録・再生コマンドなどを取得する。
ネットワーククライアントであるテレビ受信機300は、初期サーバURLを用いて、プライマリサーバにアクセスする。そして、テレビ受信機300は、プライマリサーバから、ストリーミングサーバURL、対象ファイル名、ファイルのタイプを示すマイムタイプ、メディア再生時間情報などの情報を取得する。
そして、テレビ受信機300は、ストリーミングサーバURLを用いて、ストリーミングサーバにアクセスする。そして、テレビ受信機300は、対象ファイル名を指定する。ここで、マルチキャストでのサービスを受ける場合は、ネットワーク識別情報とサービス識別情報で番組のサービスを特定する。
そして、テレビ受信機300は、セッション開始・終了コマンドにより、ストリーミングサーバとの間のセッションを開始し、あるいはそのセッションを終了する。また、テレビ受信機300は、ストリーミングサーバとの間のセッション続行中に、メディア記録・再生コマンドを用いて、ストリーミングサーバからメディアデータを取得する。
なお、図25の例では、プライマリサーバとストリーミングサーバとが別個に存在している。しかし、これらのサーバは、一体的に構成されていてもよい。
図26は、テレビ受信機300でメタデータに基づいてネットサービスにアクセスする場合の画面表示の遷移例を示している。図26(a)は、表示パネル311に画像が表示されていない状態を示す。図26(b)は、放送受信が開始され、この放送受信に係るメインコンテンツが、表示パネル311に、全画面表示されている状態を示す。
図26(c)は、メタデータによるサービスへのアクセスがあり、テレビ受信機300とサーバとの間のセッションが開始された状態を示す。この場合、放送受信に係るメインコンテンツが全画面表示から部分画面表示となる。
図26(d)は、サーバからのメディア再生が行われ、表示パネル311に、メインコンテンツの表示と並行して、ネットサービスコンテンツ1が表示された状態を示す。そして、図26(e)は、サーバからのメディア再生が行われ、表示パネル311に、メインコンテンツの表示と並行して、サネットサービスコンテンツ1の表示と共に、ネットサービスコンテンツ2がメインコンテンツ表示上に重畳表示された状態を示す。
図26(f)は、ネットからのサービスコンテンツの再生が終了し、テレビ受信機300とサーバとの間のセッションが終了した状態を示す。この場合、表示パネル311に、放送受信に係るメインコンテンツが全画面表示される状態に戻る。
なお、図22に示すテレビ受信機300は、スピーカ314を備え、図27に示すように、オーディオデコーダ312で得られた音声データが音声処理回路313および音声増幅回路314を介してスピーカ315に供給され、このスピーカ315から音声が出力される構成とされている。
しかし、図28に示すように、テレビ受信機300はスピーカを備えず、デマルチプレクサ307あるいはHDMI受信部317で得られるオーディオストリームをインタフェース部331から外部スピーカシステム350に供給する構成も考えられる。インタフェース部331は、例えば、HDMI(High-Definition Multimedia Interface)、SPDIF(Sony Philips Digital Interface)、MHL(Mobile High-definition Link)などのデジタルインタフェースである。
この場合、オーディオストリームは、外部スピーカシステム350が有するオーディオデコーダ351aで復号化処理が行われ、この外部スピーカシステム350から音声が出力される。なお、テレビ受信機300がスピーカ315を備える場合(図27参照)であっても、オーディオストリームをインタフェース部331から外部スピーカシステム350に供給する構成(図28参照)もさらに考えられる。
上述したように、図1に示す画像表示システム10において、放送送出装置100は、オーディオストリームにメタデータを挿入すると共に、オーディオストリームにメタデータが挿入されていることを示す識別情報をコンテナのレイヤに挿入する。そのため、受信側(セットトップボックス200、テレビ受信機300)では、オーディオストリームにメタデータが挿入されていることを容易に認識できる。
また、図1に示す画像表示システム10において、セットトップボックス200は、メタデータが挿入されたオーディオストリームを、このオーディオストリームにメタデータが挿入されていることを示す識別情報と共に、テレビ受信機300に、HDMIで送信する。そのため、テレビ受信機300では、オーディオストリームにメタデータが挿入されていることを容易に認識でき、この認識に基づいてオーディオストリームに挿入されているメタデータの抽出処理を行うことで、無駄なく確実にメタデータを取得して利用できる。
また、図1に示す画像表示システム10において、テレビ受信機300は、オーディオストリームと共に受信される識別情報に基づいてこのオーディオストリームからメタデータを抽出して処理に用いる。そのため、オーディオストリームに挿入されているメタデータを無駄なく確実に取得でき、メタデータを用いた処理を適切に実行できる。
<2.変形例>
なお、上述実施の形態において、セットトップボックス200は、放送送出装置100からの放送信号から画像データおよびオーディオストリームを受信する構成となっている。しかし、セットトップボックス200は、配信サーバ(ストリーミングサーバ)からネットワークを介して画像データおよびオーディオストリームを受信する構成も考えられる。
また、上述実施の形態において、セットトップボックス200はテレビ受信機300に画像データ、オーディオストリームを送信する構成となっている。しかし、テレビ受信機300の代わりに、モニタ装置、あるいはプロジェクタ等に送信する構成も考えられる。また、セットトップボックス200の代わりに、受信機能付きのレコーダ、パーソナルコンピュータ等である構成も考えられる。
また、上述実施の形態において、セットトップボックス200とテレビ受信機300はHDMIケーブル400で接続されてなるものである。しかし、これらの間が、HDMIと同様のデジタルインタフェースで有線接続される場合、さらには、無線によって接続される場合にも、この発明を同様に適用できることは勿論である。
また、上述実施の形態において、画像表示システム10は、放送送出装置100、セットトップボックス200およびテレビ受信機300で構成されているものを示した。しかし、図29に示すように、放送送出装置100およびテレビ受信機300で構成される画像表示システム10Aも考えられる。
また、上述実施の形態においては、コンテナがトランスポートストリーム(MPEG−2 TS)である例を示した。しかし、本技術は、MP4やそれ以外のフォーマットのコンテナで配信されるシステムにも同様に適用できる。例えば、MPEG−DASHベースのストリーム配信システム、あるいは、MMT(MPEG Media Transport)構造伝送ストリームを扱う送受信システムなどである。
なお、本技術は、以下のような構成もとることができる。
(1)メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを送信する送信部と、
上記コンテナのレイヤに、上記オーディオストリームに上記メタデータが挿入されていることを示す識別情報を挿入する情報挿入部を備える
送信装置。
(2)上記メタデータは、ネットワークアクセス情報を含む
前記(1)に記載の送信装置。
(3)上記ネットワークアクセス情報は、上記コンテナが有するビデオストリームに含まれる画像データに関係したメディア情報をネットワーク上のサーバから取得するためのネットワークアクセス情報である
前記(2)に記載の送信装置。
(4)上記メタデータは、メディア情報の再生制御情報を含む
前記(1)に記載の送信装置。
(5)上記メディア情報は、上記コンテナが有するビデオストリームに含まれる画像データに関係したメディア情報である
前記(4)に記載の送信装置。
(6)上記識別情報には、上記オーディオストリームにおける音声データの符号化方式の情報が付加されている
前記(1)から(5)のいずれかに記載の送信装置。
(7)上記識別情報には、上記メタデータのタイプを示すタイプ情報が付加されている
前記(1)から(6)のいずれかに記載の送信装置。
(8)上記識別情報には、上記メタデータが上記オーディオストリームのみに挿入されているか否かを示すフラグ情報が付加されている
前記(1)から(7)のいずれかに記載の送信装置。
(9)上記識別情報には、上記オーディオストリームに対する上記メタデータの挿入頻度のタイプを示すタイプ情報が付加されている
前記(1)から(8)のいずれかに記載の送信装置。
(10)送信部により、メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを送信する送信ステップと、
上記コンテナのレイヤに、上記オーディオストリームに上記メタデータが挿入されていることを示す識別情報を挿入する情報挿入ステップを有する
送信方法。
(11)メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを受信する受信部を備え、
上記コンテナのレイヤには、該オーディオストリームにメタデータが挿入されていることを示す識別情報が挿入されており、
上記オーディオストリームを、上記オーディオストリームに上記メタデータが挿入されていることを示す識別情報と共に、所定の伝送路を介して、外部機器に送信する送信部をさらに備える
受信装置。
(12)上記送信部は、
上記コンテナが有するビデオストリームをデコードして得られる画像データのブランキング期間に上記オーディオストリームおよび上記識別情報を挿入し、該画像データを上記外部機器に送信することで、上記オーディオストリームおよび上記識別情報を上記外部機器に送信する
前記(11)に記載の受信装置。
(13)上記所定の伝送路は、HDMIケーブルである
前記(11)または(12)に記載の受信装置。
(14)受信部により、メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを受信する受信ステップを有し、
上記コンテナのレイヤには、該オーディオストリームにメタデータが挿入されていることを示す識別情報が挿入されており、
上記オーディオストリームを、上記オーディオストリームに上記メタデータが挿入されていることを示す識別情報と共に、所定の伝送路を介して、外部機器に送信する送信ステップをさらに有する
受信方法。
(15)外部機器から、所定の伝送路を介して、オーディオストリームを、該オーディオストリームにメタデータが挿入されていることを示す識別情報と共に受信する受信部と、
上記識別情報に基づいて、上記オーディオストリームをデコードして上記メタデータを抽出するメタデータ抽出部と、
上記メタデータを用いた処理を行う処理部を備える
受信装置。
(16)上記オーディオストリームを、外部スピーカシステムに送信するインタフェース部をさらに備える
前記(15)に記載の受信装置。
(17)上記所定の伝送路は、HDMIケーブルである
前記(15)または(16)に記載の受信装置。
(18)上記メタデータは、ネットワークアクセス情報を含み、
上記処理部は、上記ネットワークアクセス情報に基づいて、ネットワーク上の所定のサーバにアクセスして所定のメディア情報を取得する
前記(15)から(17)のいずれかに記載の受信装置。
(19)受信部により、外部機器から、所定の伝送路を介して、オーディオストリームを、該オーディオストリームにメタデータが挿入されていることを示す識別情報と共に受信する受信ステップと、
上記識別情報に基づいて、上記オーディオストリームをデコードして上記メタデータを抽出するメタデータ抽出ステップと、
上記メタデータを用いた処理を行う処理ステップを有する
受信方法。
(20)メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを受信する受信部を備え、
上記コンテナのレイヤには、上記オーディオストリームに上記メタデータが挿入されていることを示す識別情報が挿入されており、
上記識別情報に基づいて、上記オーディオストリームをデコードして上記メタデータを抽出するメタデータ抽出部と、
上記メタデータを用いた処理を行う処理部を備える
受信装置。
本技術の主な特徴は、オーディオストリームにメタデータを挿入すると共に、オーディオストリームにメタデータが挿入されていることを示す識別情報をコンテナのレイヤに挿入することで、受信側において、オーディオストリームにメタデータが挿入されていることを容易に認識可能としたことである(図19参照)。
10,10A・・・画像表示システム
14・・・有効画素区間
15・・・水平帰線期間
16・・・垂直帰線期間
17・・・ビデオデータ区間
18・・・データアイランド区間
19・・・コントロール区間
81・・・HDMIトランスミッタ
82・・・HDMIレシーバ
83・・・DDC
84・・・CECライン
85・・・EDID ROM
100・・・放送送出装置
110・・・ストリーム生成部
111・・・制御部
111a・・・CPU
112・・・ビデオエンコーダ
113・・・オーディオエンコーダ
113a・・・オーディオ符号化ブロック部
113b・・・オーディオフレーミング部
114・・・マルチプレクサ
200・・・セットトップボックス(STB)
203・・・アンテナ端子
204・・・デジタルチューナ
205・・・デマルチプレクサ
206・・・ビデオデコーダ
207・・・オーディオフレーミング部
208・・・HDMI送信部
209・・・HDMI端子
211・・・CPU
212・・・フラッシュROM
213・・・DRAM
214・・・内部バス
215・・・リモコン受信部
216・・・リモコン送信機
300・・・テレビ受信機
305・・・アンテナ端子
306・・・デジタルチューナ
307・・・デマルチプレクサ
308・・・ビデオデコーダ
309・・・映像処理回路
310・・・パネル駆動回路
311・・・表示パネル
312・・・オーディオデコーダ
313・・・音声処理回路
314・・・音声増幅回路
315・・・スピーカ
316・・・HDMI端子
317・・・HDMI受信部
318・・・通信インタフェース
321・・・CPU
322・・・フラッシュROM
323・・・DRAM
324・・・内部バス
325・・・リモコン受信部
326・・・リモコン送信機
350・・・外部スピーカシステム
400・・・HDMIケーブル

Claims (20)

  1. メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを送信する送信部と、
    上記コンテナのレイヤに、上記オーディオストリームに上記メタデータが挿入されていることを示す識別情報を挿入する情報挿入部を備える
    送信装置。
  2. 上記メタデータは、ネットワークアクセス情報を含む
    請求項1に記載の送信装置。
  3. 上記ネットワークアクセス情報は、上記コンテナが有するビデオストリームに含まれる画像データに関係したメディア情報をネットワーク上のサーバから取得するためのネットワークアクセス情報である
    請求項2に記載の送信装置。
  4. 上記メタデータは、メディア情報の再生制御情報を含む
    請求項1に記載の送信装置。
  5. 上記メディア情報は、上記コンテナが有するビデオストリームに含まれる画像データに関係したメディア情報である
    請求項4に記載の送信装置。
  6. 上記識別情報には、上記オーディオストリームにおける音声データの符号化方式の情報が付加されている
    請求項1に記載の送信装置。
  7. 上記識別情報には、上記メタデータのタイプを示すタイプ情報が付加されている
    請求項1に記載の送信装置。
  8. 上記識別情報には、上記メタデータが上記オーディオストリームのみに挿入されているか否かを示すフラグ情報が付加されている
    請求項1に記載の送信装置。
  9. 上記識別情報には、上記オーディオストリームに対する上記メタデータの挿入頻度のタイプを示すタイプ情報が付加されている
    請求項1に記載の送信装置。
  10. 送信部により、メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを送信する送信ステップと、
    上記コンテナのレイヤに、上記オーディオストリームに上記メタデータが挿入されていることを示す識別情報を挿入する情報挿入ステップを有する
    送信方法。
  11. メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを受信する受信部を備え、
    上記コンテナのレイヤには、該オーディオストリームにメタデータが挿入されていることを示す識別情報が挿入されており、
    上記オーディオストリームを、上記オーディオストリームに上記メタデータが挿入されていることを示す識別情報と共に、所定の伝送路を介して、外部機器に送信する送信部をさらに備える
    受信装置。
  12. 上記送信部は、
    上記コンテナが有するビデオストリームをデコードして得られる画像データのブランキング期間に上記オーディオストリームおよび上記識別情報を挿入し、該画像データを上記外部機器に送信することで、上記オーディオストリームおよび上記識別情報を上記外部機器に送信する
    請求項11に記載の受信装置。
  13. 上記所定の伝送路は、HDMIケーブルである
    請求項12に記載の受信装置。
  14. 受信部により、メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを受信する受信ステップを有し、
    上記コンテナのレイヤには、該オーディオストリームにメタデータが挿入されていることを示す識別情報が挿入されており、
    上記オーディオストリームを、上記オーディオストリームに上記メタデータが挿入されていることを示す識別情報と共に、所定の伝送路を介して、外部機器に送信する送信ステップをさらに有する
    受信方法。
  15. 外部機器から、所定の伝送路を介して、オーディオストリームを、該オーディオストリームにメタデータが挿入されていることを示す識別情報と共に受信する受信部と、
    上記識別情報に基づいて、上記オーディオストリームをデコードして上記メタデータを抽出するメタデータ抽出部と、
    上記メタデータを用いた処理を行う処理部を備える
    受信装置。
  16. 上記オーディオストリームを、外部スピーカシステムに送信するインタフェース部をさらに備える
    請求項15に記載の受信装置。
  17. 上記所定の伝送路は、HDMIケーブルである
    請求項15に記載の受信装置。
  18. 上記メタデータは、ネットワークアクセス情報を含み、
    上記処理部は、上記ネットワークアクセス情報に基づいて、ネットワーク上の所定のサーバにアクセスして所定のメディア情報を取得する
    請求項15に記載の受信装置。
  19. 受信部により、外部機器から、所定の伝送路を介して、オーディオストリームを、該オーディオストリームにメタデータが挿入されていることを示す識別情報と共に受信する受信ステップと、
    上記識別情報に基づいて、上記オーディオストリームをデコードして上記メタデータを抽出するメタデータ抽出ステップと、
    上記メタデータを用いた処理を行う処理ステップを有する
    受信方法。
  20. メタデータが挿入されたオーディオストリームを有する所定フォーマットのコンテナを受信する受信部を備え、
    上記コンテナのレイヤには、上記オーディオストリームに上記メタデータが挿入されていることを示す識別情報が挿入されており、
    上記識別情報に基づいて、上記オーディオストリームをデコードして上記メタデータを抽出するメタデータ抽出部と、
    上記メタデータを用いた処理を行う処理部を備える
    受信装置。
JP2016505353A 2014-07-18 2015-07-09 送信装置、送信方法、受信装置および受信方法 Expired - Fee Related JP6607183B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014147308 2014-07-18
JP2014147308 2014-07-18
PCT/JP2015/069781 WO2016009944A1 (ja) 2014-07-18 2015-07-09 送信装置、送信方法、受信装置および受信方法

Publications (2)

Publication Number Publication Date
JPWO2016009944A1 true JPWO2016009944A1 (ja) 2017-04-27
JP6607183B2 JP6607183B2 (ja) 2019-11-20

Family

ID=55078438

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016505353A Expired - Fee Related JP6607183B2 (ja) 2014-07-18 2015-07-09 送信装置、送信方法、受信装置および受信方法

Country Status (9)

Country Link
US (2) US10313720B2 (ja)
EP (1) EP3171605B1 (ja)
JP (1) JP6607183B2 (ja)
KR (1) KR102396133B1 (ja)
CN (1) CN105532009B (ja)
CA (1) CA2923532C (ja)
MX (1) MX367005B (ja)
RU (1) RU2687065C2 (ja)
WO (1) WO2016009944A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10271094B2 (en) * 2015-02-13 2019-04-23 Samsung Electronics Co., Ltd. Method and device for transmitting/receiving media data
CN107615767B (zh) * 2015-06-02 2021-05-25 索尼公司 发送装置、发送方法、媒体处理装置、媒体处理方法以及接收装置
US10397663B2 (en) * 2016-04-08 2019-08-27 Source Digital, Inc. Synchronizing ancillary data to content including audio
US10594758B2 (en) * 2017-12-15 2020-03-17 Cisco Technology, Inc. Latency reduction by sending audio and metadata ahead of time
GB2577045A (en) * 2018-09-11 2020-03-18 Nokia Technologies Oy Determination of spatial audio parameter encoding
WO2023106432A1 (ko) * 2021-12-06 2023-06-15 엘지전자 주식회사 Tv 및 그 제어 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008048438A (ja) * 1997-11-14 2008-02-28 Sony Internatl Europ Gmbh パーシャルトランスポートストリーム伝送装置、パーシャルトランスポートストリーム伝送方法、及び、トランスポートストリーム受信装置
JP2011223353A (ja) * 2010-04-09 2011-11-04 Toshiba Corp デジタル放送のデータ送出方法
WO2013065566A1 (ja) * 2011-11-01 2013-05-10 ソニー株式会社 再生装置、再生方法、及びプログラム
JP2014042312A (ja) * 2006-11-07 2014-03-06 Sony Corp 送信装置および通信方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6829368B2 (en) 2000-01-26 2004-12-07 Digimarc Corporation Establishing and interacting with on-line media collections using identifiers in media signals
US5835493A (en) * 1996-01-02 1998-11-10 Divicom, Inc. MPEG transport stream remultiplexer
KR100378538B1 (ko) * 1997-06-06 2003-03-29 톰슨 콘슈머 일렉트로닉스, 인코포레이티드 프로그램 가이드 포맷을 시청자에 의해 선택적으로 변경하기 위한 방법 및 장치
US6925577B1 (en) 1997-11-14 2005-08-02 Sony International (Europe) Gmbh Method for recording/storing multiple transport streams by dividing into series of packets
JP3823929B2 (ja) * 2002-05-17 2006-09-20 ソニー株式会社 情報処理装置、情報処理方法、およびコンテンツ配信装置、コンテンツ配信方法、並びにコンピュータ・プログラム
KR100565080B1 (ko) 2004-09-13 2006-03-30 삼성전자주식회사 대표 타이틀 정보가 부가된 메타 데이터를 포함한 av데이터를 기록한 정보저장매체, 그 재생장치 및 메타데이터 검색방법
US8456188B2 (en) 2006-11-07 2013-06-04 Sony Corporation Electronic apparatus and cable device
CN101536519B (zh) 2006-11-07 2012-04-04 索尼株式会社 电子设备、内容再现方法以及内容解码方法
JP4479776B2 (ja) 2007-10-05 2010-06-09 ソニー株式会社 表示装置および送信装置
JP5572929B2 (ja) * 2008-03-05 2014-08-20 ソニー株式会社 送信装置
US8743906B2 (en) * 2009-01-23 2014-06-03 Akamai Technologies, Inc. Scalable seamless digital video stream splicing
US8345681B2 (en) * 2009-09-23 2013-01-01 Samsung Electronics Co., Ltd. Method and system for wireless communication of audio in wireless networks
JP2012010311A (ja) 2010-05-26 2012-01-12 Sony Corp 送信装置、送信方法、受信装置、受信方法および送受信システム
AU2011315435B2 (en) * 2010-10-15 2016-05-12 Interdigital Ce Patent Holdings Method for synchronizing multimedia flows and corresponding device
GB2486002A (en) * 2010-11-30 2012-06-06 Youview Tv Ltd Media Content Provision
TWI574565B (zh) * 2011-03-31 2017-03-11 Sony Corp A transmitting apparatus, a transmitting method, a receiving apparatus, a receiving method, a computer-readable medium, and a broadcasting system
TW202339510A (zh) * 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
KR20130048035A (ko) * 2011-11-01 2013-05-09 엘지전자 주식회사 미디어 장치, 컨텐츠 서버 및 그 동작방법
JP6003901B2 (ja) * 2012-03-01 2016-10-05 ソニー株式会社 送信装置、送信方法および受信装置
EP2946495B1 (en) * 2013-01-21 2017-05-17 Dolby Laboratories Licensing Corporation Encoding and decoding a bitstream based on a level of trust
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008048438A (ja) * 1997-11-14 2008-02-28 Sony Internatl Europ Gmbh パーシャルトランスポートストリーム伝送装置、パーシャルトランスポートストリーム伝送方法、及び、トランスポートストリーム受信装置
JP2014042312A (ja) * 2006-11-07 2014-03-06 Sony Corp 送信装置および通信方法
JP2011223353A (ja) * 2010-04-09 2011-11-04 Toshiba Corp デジタル放送のデータ送出方法
WO2013065566A1 (ja) * 2011-11-01 2013-05-10 ソニー株式会社 再生装置、再生方法、及びプログラム

Also Published As

Publication number Publication date
US20170127093A1 (en) 2017-05-04
US10848801B2 (en) 2020-11-24
US20190253740A1 (en) 2019-08-15
RU2016108851A (ru) 2017-09-14
CN105532009A (zh) 2016-04-27
CA2923532C (en) 2023-06-27
RU2016108851A3 (ja) 2018-11-01
KR20170032212A (ko) 2017-03-22
EP3171605A1 (en) 2017-05-24
EP3171605A4 (en) 2018-03-14
MX2016003223A (es) 2016-06-30
RU2687065C2 (ru) 2019-05-07
JP6607183B2 (ja) 2019-11-20
MX367005B (es) 2019-08-02
US10313720B2 (en) 2019-06-04
EP3171605B1 (en) 2020-10-14
CA2923532A1 (en) 2016-01-21
KR102396133B1 (ko) 2022-05-10
CN105532009B (zh) 2021-03-12
WO2016009944A1 (ja) 2016-01-21

Similar Documents

Publication Publication Date Title
JP6607183B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP7099510B2 (ja) 受信装置および受信方法
JP6809450B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP6891806B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP2021119712A (ja) 送信装置、送信方法、メディア処理装置、メディア処理方法および受信装置
WO2017154646A1 (ja) 送信装置、送信方法、受信装置および受信方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190924

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191007

R151 Written notification of patent or utility model registration

Ref document number: 6607183

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees