JP6567747B2 - 受信装置および受信方法 - Google Patents

受信装置および受信方法 Download PDF

Info

Publication number
JP6567747B2
JP6567747B2 JP2018164875A JP2018164875A JP6567747B2 JP 6567747 B2 JP6567747 B2 JP 6567747B2 JP 2018164875 A JP2018164875 A JP 2018164875A JP 2018164875 A JP2018164875 A JP 2018164875A JP 6567747 B2 JP6567747 B2 JP 6567747B2
Authority
JP
Japan
Prior art keywords
stream
image data
video stream
video
transmission mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2018164875A
Other languages
English (en)
Other versions
JP2018186583A (ja
Inventor
塚越 郁夫
郁夫 塚越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Saturn Licensing LLC
Original Assignee
Saturn Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=50183278&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP6567747(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Saturn Licensing LLC filed Critical Saturn Licensing LLC
Publication of JP2018186583A publication Critical patent/JP2018186583A/ja
Application granted granted Critical
Publication of JP6567747B2 publication Critical patent/JP6567747B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2362Generation or processing of Service Information [SI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/23439Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2355Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages
    • H04N21/2358Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages for generating different versions, e.g. for different recipient devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2365Multiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2389Multiplex stream processing, e.g. multiplex stream encrypting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4345Extraction or processing of SI, e.g. extracting service information from an MPEG stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4347Demultiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4621Controlling the complexity of the content stream or additional data, e.g. lowering the resolution or bit-rate of the video stream for a mobile client with a small screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/631Multimode Transmission, e.g. transmitting basic layers and enhancement layers of the content over different transmission paths or transmitting with different error corrections, different keys or with different transmission protocols

Description

本技術は、受信装置および受信方法に関し、特に、従来画像の画像データと、空間的あるいは時間的な超高解像度画像の画像データとを時分割的に受信する受信装置等に関する。
従来、有効画素数が1920×1080であるHD画像の他に、有効画素数が水平、垂直にそれぞれ2倍、4倍である4K、8K等の空間的な超高解像度画像のサービスが考えられている(例えば、特許文献1参照)。また、フレーム周波数が60Hzである60fpsの画像の他に、フレーム周波数が120Hz、240Hz等の時間的な超高解像度画像のサービスが考えられている。
特開2011―057069号公報
例えば、放送やネットのサービスにおいて、従来画像(例えば、HD解像度、25fps、30fps画像など)の画像データと、空間的あるいは時間的な超高解像度画像の画像データ(スケーラブル符号化画像データ)とを、時分割的に送信することが考えられる。その際、受信側の超高解像度画像対応の受信機では、画像データの切り替えに同期して、処理の切り替えを行うことが必要となる。
本技術の目的は、ストリーム構成の変化、つまり、配信内容の動的な変化に的確に対応でき、正しいストリーム受信を行い得るようにすることにある。
本技術の概念は、
1つまたは複数のビデオストリームを送信する送信部と、
スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよび上記スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを送信する第1の送信モードと、基本画像データを含む基本ビデオストリームのみを送信する第2の送信モードとを識別するための識別情報を、上記ビデオストリームに挿入する識別情報挿入部とを備える
送信装置にある。
本技術において、送信部により、1つまたは複数のビデオストリームが送信される。第1の送信モードでは、スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームと、スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームとが送信される。また、第2の送信モードでは、基本画像データを含む基本ビデオストリームのみが送信される。
例えば、第1の送信モードでは、基本ビデオストリームと所定数の拡張ビデオストリームが、1つまたは複数のビデオエレメンタリストリームに挿入されて送信される。基本ビデオストリームと所定数の拡張ビデオストリームが1つのビデオエレメンタリストリームに挿入されて送信される場合、各ビデオストリームの間にストリーム境界を示す情報が配置される、ようにされてもよい。これにより、各ビデオストリームのピクチャの先頭データに瞬時にアクセスすることが可能となる。
識別情報挿入部により、第1の送信モードと第2の送信モードとを識別するための識別情報がビデオストリームに挿入される。例えば、識別情報挿入部は、識別情報を、少なくとも、番組単位、シーン単位、ピクチャグループ単位、あるいはピクチャ単位で挿入する、ようにされてもよい。
例えば、識別情報挿入部は、第1の送信モードでは、ビデオストリームに、この第1の送信モードであることを示す識別情報を挿入し、第2の送信モードでは、ビデオストリームに、この第2の送信モードであることを示す識別情報を挿入する、ようにされてもよい。また、例えば、識別情報挿入部は、第1の送信モードでは、ビデオストリームに、この第1の送信モードであることを示す識別情報を挿入し、第2の送信モードでは、ビデオストリームに、識別情報を挿入しない、ようにされてもよい。また、例えば、識別情報挿入部は、第1の送信モードでは、ビデオストリームに、識別情報を挿入せず、第2の送信モードでは、ビデオストリームに、この第2の送信モードであることを示す識別情報を挿入する、ようにされてもよい。
例えば、識別情報には、第1の送信モードを示す場合、拡張ビデオストリームの個数を示す情報が含まれていてもよい。また、例えば、識別情報には、第1の送信モードを示す場合、スケーラビリティ拡張のタイプを示す情報が含まれていてもよい。また、例えば、識別情報には、第1の送信モードを示す場合、スケーラビリティ拡張における上位階層との合成の際のスケーリング比の情報が含まれていてもよい。
このように本技術においては、第1の送信モードでは、スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよびスケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを送信し、第2の送信モードでは、基本画像データを含む基本ビデオストリームのみを送信するものである。そして、第1のモードおよび第2のモードを識別するための識別情報をビデオストリームに挿入するものである。
そのため、受信側では、この識別情報に基づいて、第1の送信モードであるか第2の送信モードであるかを容易に把握でき、ストリーム構成の変化、つまり、配信内容の動的な変化に的確に対応でき、正しいストリーム受信を行うことが可能となる。つまり、従来画像(例えば、HD解像度、25fps、30fps画像など)の画像データと、空間的あるいは時間的な超高解像度画像の画像データ(スケーラブル符号化画像データ)とが時分割的に送信される場合に、受信側において、処理の切り替えを良好に行い得る。
なお、本技術において、例えば、送信部は、1つまたは複数のビデオストリームを含む所定フォーマットのコンテナを送信し、このコンテナのレイヤに、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報を挿入する識別情報挿入部をさらに備える、ようにされてもよい。このようにコンテナのレイヤに識別情報が挿入されることで、受信側において、フレキシブルな動作が可能となる。
例えば、識別情報には、第1の送信モードを示す場合、スケーラビリティ拡張のタイプを示す情報が付加されていてもよい。また、例えば、識別情報には、1つまたは複数のビデオストリームが1つのビデオエレメンタリストリームで供給されるか否かを示す情報が付加されていてもよい。また、例えば、識別情報には、第1の送信モードを示す場合、拡張ビデオストリームの個数を示す情報が付加されていてもよい。
また、本技術において、送信部は、1つまたは複数のビデオストリームを含む所定フォーマットのコンテナを送信し、コンテナのレイヤに、1つまたは複数のビデオストリームを挿入するビデオエレメンタリストリームの個数を識別するための識別情報を挿入する識別情報挿入部をさらに備える、ようにされてもよい。
また、本技術の他の概念は、
1つまたは複数のビデオストリームを受信する受信部と、
上記ビデオストリームに挿入されている識別情報に基づいて、スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよび上記スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを送信する第1の送信モードであるか、基本画像データを含む基本ビデオストリームのみを送信する第2の送信モードであるかを識別する送信モード識別部と、
上記受信されたビデオストリームに対して、上記モード識別結果に基づき、各モードに応じた処理を行って、画像表示のための画像データを得る処理部とを備える
受信装置にある。
本技術において、受信部により、1つまたは複数のビデオストリームが受信される。第1の送信モードの場合には、スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよびスケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームが受信される。また、第2の送信モードの場合には、基本画像データを含む基本ビデオストリームのみが受信される。
送信モード識別部により、ビデオストリームに挿入されている識別情報に基づいて、第1の送信モードであるか第2の送信モードであるかが識別される。処理部により、モード識別結果に基づき、受信されたビデオストリームに対して、各モードに応じた処理が行われて、画像表示のための画像データが得られる。
このように本技術においては、第1の送信モードでは、スケーラブル符号化画像データを構成する、最下位階層の画像データを含む基本ビデオストリームおよび最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを受信し、第2の送信モードでは、基本画像データを含む基本ビデオストリームのみを受信するものである。そして、ビデオストリームに挿入されている識別情報に基づいて、第1の送信モードであるか第2の送信モードであるかを識別するものである。
そして、受信されたビデオストリームに対して、識別されたモードに応じた処理を行って、画像表示のための画像データを取得するものである。第1の送信モードであるか第2の送信モードであるかを容易に把握でき、ストリーム構成の変化、つまり、配信内容の動的な変化に的確に対応でき、正しいストリーム受信を行うことが可能となる。つまり、従来画像(例えば、HD解像度、25fps、30fps画像など)の画像データと、空間的あるいは時間的な超高解像度画像の画像データ(スケーラブル符号化画像データ)とが時分割的に送信される場合に、処理の切り替えを良好に行い得る。
なお、本技術において、例えば、受信部は、ビデオストリームを含む所定フォーマットのコンテナを受信し、コンテナのレイヤには、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報が挿入されており、送信モード識別部は、コンテナのレイヤに挿入されている識別情報およびビデオストリームに挿入されている識別情報に基づいて、第1の送信モードにあるか第2の送信モードにあるかを識別する、ようにされてもよい。
本技術によれば、ストリーム構成の変化、つまり、配信内容の動的な変化に的確に対応でき、正しいストリーム受信を行うことが可能となる。
実施の形態としての画像送受信システムの構成例を示すブロック図である。 空間解像度が異なる画像データ例を示す図である。 時間解像度が異なる画像データ例を示す図である。 空間解像度スケーラビリティの一例を示す図である。 空間解像度スケーラビリティにおける受信側(デコード側)の具体的な構成例を示す図である。 空間解像度スケーラビリティのデコーディングプロセスの一例を示す図である。 時間解像度スケーラビリティの一例を示す図である。 基本ビデオストリームおよび第1の拡張ビデオストリームが送られる場合におけるデコード例を示す図である。 時間解像度スケーラビリティにおける受信側(デコード側)の具体的な構成例を示す図である。 時間解像度スケーラビリティのデコーディングプロセスの一例を示す図である。 複数のビデオストリーム(サブストリーム)のピクチャの符号化データを含むビデオエレメンタリストリームの一例を示す図である。 第1の送信モードと、第2の送信モードが交互に連続する場合であって、モード識別のための識別情報(シグナリング)がない例を示す図である。 識別情報をビデオストリームに「方法1」により挿入する例を説明するための図である。 識別情報をビデオストリームに「方法2」により挿入する例を説明するための図である。 識別情報をビデオストリームに「方法3」により挿入する例を説明するための図である。 放送局においてトランスポートストリームを生成する送信データ生成部の構成例を示すブロック図である。 基本ビデオストリームおよび所定数の拡張ビデオストリームが1つのビデオエレメンタリストリームに挿入される場合(Single PID)におけるストリーム内の符号化パケット順を示す図である。 基本ビデオストリームおよび所定数の拡張ビデオストリームの各ビデオストリームがそれぞれ1つのビデオエレメンタリストリームに挿入される場合(Multiple PID)における各ストリーム内の符号化パケット順を示す図である。 GOP(Group Of Pictures)の先頭のアクセスユニットおよびその先頭以外のアクセスユニットの構成例を示す図である。 SEIメッセージ「Enhancement scalability SEI message」の構造例を示す図である。 エンハンスメント・スケーラビリティ・データ(enhancement_scalability_data())の構造例を示す図である。 エンハンスメント・スケーラビリティ・データ(enhancement_scalability_data())の構造例における主要な情報の内容を示す図である。 スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)の構造例を示す図である。 スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)の構造例の主要な情報の内容を示す図である。 マルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)の構造例を示す図である。 ビデオストリーム(サブストリーム)が挿入されるビデオエレメンタリストリームが1つである場合(Single PID)のTS構成例を示す図である。 ビデオストリーム(サブストリーム)が挿入されるビデオエレメンタリストリームが複数である場合(Multiple PID)のTS構成例を示す図である。 画像送受信システムを構成する受信機の構成例を示すブロック図である。 高精細番組と従来番組の切り替え時の受信処理の切り替え制御を説明するための図である。 高精細番組と従来番組の切り替え時の受信処理の切り替え制御を説明するための図である。
以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明は以下の順序で行う。
1.実施の形態
2.変形例
<1.実施の形態>
[画像送受信システム]
図1は、実施の形態としての画像送受信システム10の構成例を示している。この画像送受信システム10は、放送局100および受信機200により構成されている。放送局100は、コンテナとしてのトランスポートストリームTSを放送波に載せて送信する。
第1の送信モードにある場合、すなわち、空間的あるいは時間的な超高解像度画像の表示を可能とするためのスケーラブル符号化画像データの送信時には、トランスポートストリームTSに、複数のビデオストリーム(ビデオサブストリーム)が含まれる。この場合、トランスポートストリームTSに、スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームと、スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームが含まれる。
また、第2の送信モードにある場合、すなわち、従来画像(例えば、HD解像度、25fps、30fps画像など)の画像データの送信時には、トランスポートストリームTSに、1つのビデオストリーム(ビデオサブストリーム)が含まれる。この場合、トランスポートストリームTSに、従来画像の画像データを基本画像データとして含む基本ビデオストリームのみが含まれる。
図2(a)は、従来画像の画像データとして、有効画素数が1920*1080であるHD画像の画像データを示している。図2(b)は、空間的に超高解像度の画像データとして、HD(High-Definition)に対して有効画素数が水平、垂直にそれぞれ2倍の4Kの画像データを示している。図2(c)は、空間的に超高解像度の画像データとして、HDに対して有効画素数が水平、垂直にそれぞれ4倍の8Kの画像データを示している。
図3(a)は、従来画像の画像データとして、フレーム周波数が60Hzである60fpsの画像データを示している。図3(b)は、時間的に超高解像度の画像データとして、フレーム周波数が120Hzである120fpsの画像データを示している。図3(c)は、時間的に超高解像度の画像データとして、フレーム周波数が240Hzである240fpsの画像データを示している。
図4は、空間解像度スケーラビリティの一例を示している。この例は、空間的に超高解像度の画像データとして、例えば、8Kの画像データS-8Kを取り扱う例である。最初に送信側(エンコード側)について説明する。画像データS-8Kに対して、ダウンサンプリング部301で1/β倍、ここでは1/2倍のダウンサンプリング処理が施されて、4Kの画像データS-4Kが生成される。また、この画像データS-4Kに対して、ダウンサンプリング部302で1/α倍、ここでは1/2倍のダウンサンプリング処理が施されて、HDの画像データS-HDが生成される。
また、画像データS-HDに対して、アップサンプリング部303でα倍、ここでは2倍のアップサンプリング処理が施されて、4Kの画像データS-4K_Lが生成される。この4Kの画像データS-4K_Lは、画像データS-4Kに対して、ダウンサンプリング処理およびアップサンプリング処理が施されたものであり、4Kレベルの高周波成分が欠如したものとなる。減算器304において、画像データS-4Kから画像データS-4K_Lが減算されて、4Kレベルの高周波成分S-4K_Hが生成される。
また、画像データS-4Kに対して、アップサンプリング部305でβ倍、ここでは2倍のアップサンプリング処理が施されて、8Kの画像データS-8K_Lが生成される。この8Kの画像データS-8K_Lは、画像データS-8Kに対して、ダウンサンプリング処理およびアップサンプリング処理が施されたものであり、8Kレベルの高周波成分が欠如したものとなる。減算器306において、画像データS-8Kから画像データS-8K_Lが減算されて、8Kレベルの高周波成分S-8K_Hが生成される。
画像データS-HDは、第1階層(最下位階層)の画像データを構成する。この画像データS-HDがビデオエンコーダ307において符号化されることで、基本ビデオストリームSt1が得られる。この基本ビデオストリームSt1は、エンコードバッファ308に、一時的に蓄積される。また、4Kレベルの高周波成分S-4K_Hは、第2階層の画像データを構成する。この高周波成分S-4K_Hがビデオエンコーダ309において符号化されることで、第1の拡張ビデオストリームSt2が得られる。この第1の拡張ビデオストリームSt2は、エンコードバッファ310に、一時的に蓄積される。
また、8Kレベルの高周波成分S-8K_Hは、第3階層の画像データを構成する。この高周波成分S-8K_Hがビデオエンコーダ311において符号化されることで、第2の拡張ビデオストリームSt3が得られる。この第2の拡張ビデオストリームSt3は、エンコードバッファ312に、一時的に蓄積される。基本ビデオストリームSt1、第1の拡張ビデオストリームSt2および第2拡張ビデオストリームSt3は、マルチプレクサ313で合成され、合成ストリームが受信側に送信される。
次に、受信側(デコード側)について説明する。デマルチプレクサ351で、合成ストリームから、基本ビデオストリームSt1、第1の拡張ビデオストリームSt2および第2拡張ビデオストリームSt3が分離される。基本ビデオストリームSt1は、デコードバッファ352に、一時的に蓄積される。そして、この基本ビデオストリームSt1がデコーダ353で復号化されることで、第1階層(最下位階層)の画像データとして、HDの画像データS-HDが得られる。この画像データS-HDにより、HD画像の表示が可能となる。
また、第1の拡張ビデオストリームSt2は、デコードバッファ354に、一時的に蓄積される。そして、この第1の拡張ビデオストリームSt2がデコーダ355で復号化されることで、第2階層の画像データとしての4Kレベルの高周波成分S-4K_Hが得られる。また、画像データS-HDに対して、アップサンプリング部356でα倍、ここでは2倍のアップサンプリング処理が施されて、4Kの画像データS-4K_Lが生成される。加算器357において、4Kの画像データS-4K_Lに4Kレベルの高周波成分S-4K_Hが加算されて、4Kの画像データS-4Kが得られる。この画像データS-4Kにより、4K画像の表示が可能となる。
また、第2の拡張ビデオストリームSt3は、デコードバッファ358に、一時的に蓄積される。そして、この第2の拡張ビデオストリームSt3がデコーダ359で復号化されることで、第3階層の画像データとしての8Kレベルの高周波成分S-8K_Hが得られる。また、画像データS-4Kに対して、アップサンプリング部360でβ倍、ここでは2倍のアップサンプリング処理が施されて、8Kの画像データS-8K_Lが生成される。加算器361において、8Kの画像データS-8K_Lに8Kレベルの高周波成分S-8K_Hが加算されて、8Kの画像データS-4Kが得られる。この画像データS-8Kにより、8K画像の表示が可能となる。
図5は、上述した空間解像度スケーラビリティにおける受信側(デコード側)の具体的な構成例を示している。なお、この構成例は2レイヤ(第1階層、第2階層)の場合を示している。基本ビデオストリームSt1は、エントロピーデコーディング部353aでエントロピーデコード処理が行われ、クオンタイズィングデコーディング部353bで逆量子化処理が行われる。さらに、逆量子化処理後のデータは、フリクェンシーコンバージョンデコーダ353cで、周波数軸データから時間軸データに戻されて、データD1(n)が得られる。
加算器353fにおいて、このフリクェンシーコンバージョンデコード後のデータD1(n)に、フレームバッファ353dから得られる1フレーム前の画像データS-HD(n-1)がモーションコンペンセーション部353eで動き補償処理された後に加算される。そして、この加算器353fから、現在フレームのHDの画像データS-HD(n)が得られる。
また、第1拡張ビデオストリームSt2は、エントロピーデコーディング部355aでエントロピーデコード処理が行われ、クオンタイズィングデコーディング部355bで逆量子化処理が行われる。さらに、逆量子化処理後のデータは、フリクェンシーコンバージョンデコーダ355cで、周波数軸データから時間軸データに戻されて、データD2(n)が得られる。
加算器355fにおいて、このフリクェンシーコンバージョンデコード後のデータD2(n)に、フレームバッファ355dから得られる1フレーム前の高周波成分S-4K_H(n-1)がモーションコンペンセーション部355eで動き補償処理された後に加算される。この加算器355fから、現在フレームの4Kレベルの高周波成分S-4K_H(n)が得られる。また、画像データS-HD(n)に対して、アップサンプリング部356でα倍、ここでは2倍のアップサンプリング処理が施されて、4Kの画像データS-4K_L(n)が生成される。加算器357において、4Kの画像データS-4K_L(n)に4Kレベルの高周波成分S-4K_H(n)が加算されて、現在フレームの4Kの画像データS-4K(n)が得られる。
図6は、空間解像度スケーラビリティのデコーディングプロセスの一例を示している。この例では、第1階層(最下位階層)の画像データを含む基本ビデオストリーム(Base stream)が存在する。また、この例では、第2の階層の画像データ(高周波成分)を含む第1の拡張ビデオストリーム(1st enhancement stream)および第3の階層の画像データ(高周波成分)を含む第2の拡張ビデオストリーム(2nd enhancement stream)が存在する。そして、この例は、基本ビデオストリームの空間解像度を、第1の拡張ビデオストリームにより、‘Up scaling ratio 1’倍とし、第2の拡張ビデオストリームにより、さらに‘Up scaling ratio 2’倍とする例である。
基本ビデオストリームがデコードされて第1階層の画像データV1が得られる。この画像データV1がアップサンプリングされることで、水平、垂直の解像度がそれぞれ‘Up scaling ratio 1’倍された画像データV2Lが得られる。また、第1の拡張ビデオストリームがデコードされて第2階層の画像データV2Hが得られる。画像データV2L,V2Hが加算されて、画像データV1に対して、水平、垂直の解像度がそれぞれ‘Up scaling ratio 1’倍された画像データV2が得られる。
また、画像データV2がアップサンプリングされることで、水平、垂直の解像度がそれぞれ‘Up scaling ratio 2’倍された画像データV3Lが得られる。また、第2の拡張ビデオストリームがデコードされて第3階層の画像データV3Hが得られる。画像データV3L,V3Hが加算されて、画像データV2に対して、水平、垂直の解像度がそれぞれ‘Up scaling ratio 2’倍された表示用の画像データV3が得られる。
図7は、時間解像度スケーラビリティの一例を示している。この例は、時間的に超高解像度の画像データとして、図7(a)に示すように、120fpsの画像データS-120を取り扱う例である。この画像データS-120は、第1階層(最下位階層)と第2階層の2階層に分離される。
第1階層の画像データ(偶数フレームの画像データ)は、例えば、図7(b)に示すように、符号化されて、基本ビデオストリームSt1が生成される。この基本ビデオストリームSt1は、Iピクチャ(Intra picture)、Pピクチャ(Predictive picture)およびBピクチャ(Bi-directional predictive picture)で構成される。Iピクチャは他ピクチャを参照せず、PピクチャおよびBピクチャは、この基本ビデオストリームSt1内のIピクチャまたはPピクチャしか参照しない。そのため、この基本ビデオストリームSt1は、このストリームだけでデコード可能となる。
また、第2階層の画像データ(奇数フレームの画像データ)は、例えば、図7(c)に示すように、符号化されて、第1の拡張ビデオストリームSt2が生成される。この第1の拡張ビデオストリームSt2は、PピクチャおよびBピクチャで構成される。PピクチャおよびBピクチャは、この第1の拡張ビデオストリームSt2内のPピクチャだけでなく、基本ビデオストリームSt1内のIピクチャ、Pピクチャ、さらにはBピクチャも参照する。そのため、この第1の拡張ビデオストリームSt2は、このストリームだけでなく、基本ビデオストリームSt1のデコード結果が必要となる。
なお、図7(c)に示す第1の拡張ビデオストリームSt2のBピクチャは「B」で示されるのに対して、図7(b)に示す基本ビデオストリームSt1のBピクチャは「Br」で示されている。「B」は他のピクチャから参照されないBピクチャであることを表し、「Br」は他のピクチャから参照されるBピクチャであることを表している。
送信側(エンコード側)から受信側(デコード側)には、上述した基本ビデオストリームSt1および第1の拡張ビデオストリームSt2が送られる。受信側では、基本ビデオストリームSt1を復号化することで、60fpsの画像データS-60を得ることができる。また、受信側では、基本ビデオストリームSt1および第1の拡張ビデオストリームSt2の双方を復号化して合成することで、120fpsの画像データS-120を得ることができる。
図8は、上述した基本ビデオストリームSt1および第1の拡張ビデオストリームSt2が送られる場合におけるデコード例を示している。基本ビデオストリームのSt1に関しては、第0フレームのIピクチャ(I_0)、第6フレームのPピクチャ(P_6)、第2フレームのBピクチャ(Br_2)、第4フレームのBピクチャ(Br_4)、・・・の順にデコード処理が行われる。なお、図中の矢印は、ピクチャの参照関係を示している。このように基本ビデオストリームSt1のデコードが行われることで、60fpsの画像データS-60が得られる。
また、第1の拡張ビデオストリームSt2に関しては、第1フレームのPピクチャ(P_1)、第7フレームのPピクチャ(P_7)、第3フレームのBピクチャ(B_3)、第5フレームのBピクチャ(B_5)、・・・の順にデコード処理が行われる。なお、図中の矢印は、ピクチャの参照関係を示している。上述の基本ビデオストリームSt1のデコードの他に、このように第1の拡張ビデオストリームSt2のデコードが行われることで、120fpsの画像データS-120が得られる。
図9は、上述した時間解像度スケーラビリティにおける受信側(デコード側)の具体的な構成例を示している。なお、この構成例は2レイヤ(第1階層、第2階層)の場合を示している。基本ビデオストリームSt1は、エントロピーデコーディング部403aでエントロピーデコード処理が行われ、クオンタイズィングデコーディング部403bで逆量子化処理が行われる。さらに、逆量子化処理後のデータは、フリクェンシーコンバージョンデコーダ403cで、周波数軸データから時間軸データに戻されて、現在フレームのデコードデータD1(n)が得られる。
加算器403fにおいて、このデコードデータD1(n)に、フレームバッファ403dから得られる参照ピクチャの画像データがモーションコンペンセーション部403e部で動き補償処理された後に加算される。そして、この加算器403fから、現在フレームの60fpsの画像データS-60(n)が得られる。
また、第1拡張ビデオストリームSt2は、エントロピーデコーディング部405aでエントロピーデコード処理が行われ、クオンタイズィングデコーディング部405bで逆量子化処理が行われる。さらに、逆量子化処理後のデータは、フリクェンシーコンバージョンデコーダ405cで、周波数軸データから時間軸データに戻されて、現在フレームのデコードデータD2(n)が得られる。
加算器405fにおいて、このデコードデータD2(n)に、フレームバッファ403dやフレームバッファ405dから得られる参照ピクチャの画像データがモーションコンペンセーション部405e部で動き補償処理された後に加算される。この加算器405fから、現在フレームの60fpsの画像データS-60(n)′が得られる。そして、合成部406において、上述の60fpsの画像データS-60(n)に、この60fpsの画像データS-60(n)′が合成されて、120fpsの画像データS-120が得られる。
1つまたは複数のビデオストリーム(ビデオサブストリーム)は、1つまたは複数のビデオエレメンタリストリームに挿入して送信される。すなわち、トランスポートストリームTSには、1つまたは複数のビデオエレメンタリストリームが含まれる。基本ビデオストリームおよび所定数の拡張ビデオストリームを1つのビデオエレメンタリストリームに挿入して送信する場合、1アクセスユニット(access unit)の中に、全てのストリームのピクチャが含まれる
図10は、時間解像度スケーラビリティのデコーディングプロセスの一例を示している。なお、図中の矢印は、ピクチャの被参照方向を示している。この例では、第1階層(最下位階層)の画像データを含む基本ビデオストリーム(Base stream)が存在する。また、この例では、第2の階層の画像データを含む第1の拡張ビデオストリーム(1st enhancement stream)および第3の階層の画像データを含む第2の拡張ビデオストリーム(2nd enhancement stream)が存在する。そして、この例は、基本ビデオストリームのフレーム表示周波数を、第1の拡張ビデオストリームにより、2倍とし、第2の拡張ビデオストリームにより、さらに2倍とする例である。
そして、この例は、基本ビデオストリームと第1の拡張ビデオストリームとの間で、拡張層(Enhanced layer)のピクチャ挿入が1ピクチャであり、また、第1の拡張ビデオストリームと第2の拡張ビデオストリームとの間で、拡張層(Enhanced layer)のピクチャ挿入が1ピクチャである。
基本ビデオストリームの各ピクチャは、この基本ビデオストリーム内のピクチャのみが参照されてデコードされる。第1の拡張ビデオストリームの各ピクチャは、基本ビデオストリーム内のピクチャが参照されてデコードされる。また、第2の拡張ビデオストリームの各ピクチャは、基本ビデオストリーム内および第1の拡張ビデオストリーム内のピクチャが参照されてデコードされる。
このように、基本ビデオストリーム、第1の拡張ビデオストリームおよび第2の拡張ビデオストリームがデコードされることで、最終的に、基本ビデオストリームのフレーム表示周波数に対して4倍の表示周波数を有する画像データが得られる。
図11(a),(b)は、複数のビデオストリーム(サブストリーム)のピクチャの符号化データを含むビデオエレメンタリストリームの一例を示している。各アクセスユニットに、各サブストリームのピクチャの符号化データが順次配置される。この場合、最初のサブストリームのピクチャの符号化データは、“SPS 〜 Coded Slice”で構成され、2番目以降のサブストリームのピクチャの符号化データは、“Subset SPS 〜 Coded Slice”で構成される。なお、この例は、MPEG4−AVCの符号化がされている例であるが、他の符号化方式でも適用可能である。なお、図中の16進数字は「 NAL unit type 」を示している。
各サブストリームのピクチャの符号化データが1つのビデオエレメンタリストリームに共存する場合、各ピクチャの境界が瞬時に識別可能なことが要求される。しかし、AUD(access unit delimiter)は、一つのアクセスユニットの先頭にのみ付すことが可能である。そこで、図11(b)に示すように、各サブストリームのピクチャの符号化データの間に、「Substream Separation Marker」という境界を示す新たな“NAL unit”を定義して配置することが考えられる。
これにより、各サブストリームのピクチャの先頭データに瞬時にアクセスすることが可能となる。なお、図11(a)は、各サブストリームのピクチャの符号化データの間に、「Substream Separation Marker」が配置されていない例を示している。
図12は、第1の送信モードと、第2の送信モードが交互に連続する場合であって、モード識別のための識別情報(シグナリング)がない例を示している。期間A、期間Cは第1の送信モードにある期間を示し、期間Bは第2の送信モードにある期間を示している。各期間は、例えば、番組単位、あるいはシーン単位を表す。
第1の送信モードの期間には、基本ビデオストリームと共に、空間的あるいは時間的な超高解像度化のための拡張ビデオストリームが存在する。第2の送信モードの期間には、基本ビデオストリームのみが存在する。なお、基本ビデオストリームは、SPSを先頭として、所定数のアクセスユニット(AU)が続く構成となっている。また、拡張ビデオストリームは、サブセットSPS(SSSPS)を先頭として、所定数のアクセスユニット(AU)が続く構成となっている。また、アクセスユニット(AU)は、“PPS, Substream SEIs, Coded Slice”で構成されている。
期間Aから期間Bへの切換えタイミングにおいて、受信機の受信バッファへの拡張ビデオストリームの供給がなくなった際に、エンコーダあるいは伝送路の都合で到着に余計な時間がかかっているのか、あるいは拡張ビデオストリームのエンコードが途絶えて、基本ビデオストリームのみになったのかは、受信機としては不明である。その場合、受信機側のバッファは必要以上に待ちが生じることがあり、結果としてアンダーフロー(underflow)になる可能性がある。
そうなった場合は、受信機の判断で、例えば、予め設定したタイムアウト(timeout)時間との比較を行うことにより、超高解像度画像から基本画像(従来画像)の表示モードへ変更する、など行う。しかし、このような判断を受信機が行う場合、そのための処理時間がかかり、瞬時に判断することは困難である。つまり、ストリーム構成の変化、つまり、配信内容の動的な変化に的確に対応でき、正しいストリーム受信を行うことができなくなる。
そのような状態に陥ることを回避するには、送信モードの切り替えに同期したモード識別情報(シグナリング)を供給し、受信機がその信号を検出することで、送信モードの切り替え時点を瞬時に判断できるようにすることが必要となる。この実施の形態においては、ビデオストリームに、第1の送信モードと第2の送信モードとを識別するための識別情報が挿入される。
識別情報の挿入は、例えば、以下の「方法1」、「方法2」あるいは「方法3」により行われる。「方法1」は、図13に示すように、ビデオストリームに第1の送信モードであることを示す識別情報「EHF」あるいは第2の送信モードであること(拡張ビデオストリームが存在しないこと)を示す識別情報「BCF」の挿入を行う。すなわち、第1の送信モードでは、ビデオストリームに識別情報「EHF」を挿入し、第2の送信モードではビデオストリームに識別情報「BCF」を挿入する、というものである。
「方法2」は、図14に示すように、ビデオストリームに第1の送信モードであること(拡張ビデオストリームが存在すること)を示す識別情報「EHF」の挿入を行う。すなわち、第1の送信モードでは、ビデオストリームに識別情報「EHF」を挿入し、第2の送信モードでは、ビデオストリームに、識別情報を挿入しない、というものである。
「方法3」は、図15に示すように、ビデオストリームに第2の送信モードであることを示す識別情報「BCF」の挿入を行う。すなわち、第1の送信モードでは、ビデオストリームに、識別情報を挿入することをせず、第2の送信モードでは、ビデオストリームに識別情報「BCF」を挿入する、というものである。
この識別情報には、第1の送信モードを示す場合、つまり識別情報「EHF」の場合には、拡張ビデオストリームの個数を示す情報、スケーラビリティ拡張のタイプを示す情報、スケーラビリティ拡張における上位階層との合成の際のスケーリング比の情報等が含まれている。
この識別情報は、例えば、ビデオストリームのピクチャヘッダまたはシーケンスヘッダのユーザデータ領域などに挿入される。この識別情報は、少なくとも、番組単位、シーン単位、ピクチャグループ単位、あるいはピクチャ単位で挿入される。なお、上述の図13、図14、図15に示す例は、ピクチャ単位で挿入される例を示している。
上述したようにビデオストリームに送信モードの識別情報を挿入することで、受信側では、送信モードの切り替えに応じて、超高解像度画像の表示処理または従来画像の表示処理を適切に切り替えることができる。なお、従来画像の表示処理を行う際には解像度アップ処理が施される。この識別情報(「EHF」、「BCF」)の詳細については後述する。
また、トランスポートストリームTSのレイヤに、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報が挿入される。この識別情報は、イベント単位あるいは時間的に静的または動的なユースケースにおいて、最適な位置に配置される。例えば、この識別情報は、トランスポートストリームTSに含まれるプログラム・マップ・テーブル(PMT:Program Map Table)のビデオエレメンタリ・ループ(Video ES loop)の配下に挿入される。この識別情報により、受信側では、第1の送信モードにあるか第2の送信モードにあるかを、ビデオストリームをデコードすることなく、大まかに把握することが可能となる。
第1の送信モードを示す場合、拡張ビデオストリームの個数を示す情報、スケーラビリティ拡張のタイプを示す情報、所定数の拡張ビデオストリームが1つのビデオエレメンタリストリームで供給されるか否かを示す情報等が含まれている。この識別情報の詳細については後述する。
また、トランスポートストリームTSのレイヤに、1つまたは複数のビデオストリーム(サブストリーム)を挿入するビデオエレメンタリストリームの個数を識別するための識別情報が挿入される。この識別情報は、イベント単位あるいは時間的に静的または動的なユースケースにおいて、最適な位置に配置される。例えば、この識別情報は、トランスポートストリームTSに含まれるプログラム・マップ・テーブル(PMT:Program Map Table)のプログラム・ループ(Program_loop)の配下に挿入される。この識別情報により、受信側では、デコードすべきビデオエレメンタリストリームの個数を把握することが可能となる。この識別情報の詳細については後述する。
受信機200は、放送局100から放送波に載せて送られてくるトランスポートストリームTSを受信する。また、受信機200は、第1の送信モードの期間は、このトランスポートストリームTSに含まれるビデオストリーム(基本ビデオストリーム、所定数の拡張ビデオストリーム)をデコードして、超高解像度画像の表示画像データを取得する。また、受信機200は、第2の送信モードの期間は、このトランスポートストリームTSに含まれるビデオストリーム(基本ビデオストリーム)をデコードして、従来画像の表示画像データを取得する。
「送信データ生成部の構成例」
図16は、放送局100において、上述したトランスポートストリームTSを生成する送信データ生成部110の構成例を示している。この送信データ生成部110は、画像データ出力部111と、ビデオエンコーダ112と、グラフィクスデータ出力部113と、グラフィクスエンコーダ114と、音声データ出力部115と、オーディオエンコーダ116と、マルチプレクサ117を有している。
最初に、第1の送信モードにある場合について説明する。画像データ出力部111は、空間的あるいは時間的な超高解像度画像の画像データを出力する。この画像データ出力部111は、例えば、被写体を撮像して画像データを出力するカメラ、あるいは記憶媒体から画像データを読み出して出力する画像データ読み出し部などにより構成される。この画像データとしては、例えば、空間的な超高解像度画像を表示する、4Kの画像データ、8Kの画像データ等が該当する。また、この画像データとしては、例えば、時間的な超高解像度画像を表示する、120fpsの画像データ、240fpsの画像データ等が該当する。
ビデオエンコーダ112は、画像データ出力部111から出力される画像データに対してスケーラブル符号化の処理を行って、最下位階層の画像データを含む基本ビデオストリーム(サブストリーム)と、最下位層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリーム(サブストリーム)を生成する。各ビデオストリーム(サブストリーム)には、例えば、MPEG4−AVC、MPEG2video等の符号化が施される。そして、ビデオエンコーダ112は、後段に備えるストリームフォーマッタ(図示せず)により、基本ビデオストリームおよび所定数の拡張ビデオストリームが挿入された1つまたは複数のビデオエレメンタリストリームを生成する。
ビデオエンコーダ112は、上述の「方法1」、あるいは「方法2」を採用する場合には、基本ビデオストリームに、第1の送信モードであることを示す識別情報「EHF」を挿入する。この識別情報「EHF」には、拡張ビデオストリームの個数を示す情報、スケーラビリティ拡張のタイプを示す情報、スケーラビリティ拡張における上位階層との合成の際のスケーリング比の情報等が含まれている。
図17は、基本ビデオストリームおよび所定数の拡張ビデオストリームが1つのビデオエレメンタリストリームに挿入される場合(Single PID)におけるストリーム内の符号化パケット順を示している。この例は、拡張ビデオストリームが1つである場合を示している。なお、詳細は後述するが、識別情報「EHF」は、基本ビデオストリームに、SEIメッセージとして挿入される。
図18は、基本ビデオストリームおよび所定数の拡張ビデオストリームの各ビデオストリームがそれぞれ1つのビデオエレメンタリストリームに挿入される場合(Multiple PID)における各ストリーム内の符号化パケット順を示している。この例は、拡張ビデオストリームが1つである場合を示している。
図16に戻って、グラフィクスデータ出力部113は、画像に重畳するグラフィクス(字幕としてのサブタイトルも含む)のデータを出力する。グラフィクスエンコーダ114は、グラフィクスデータ出力部113から出力されたグラフィクスデータを含むグラフィクスストリーム(グラフィクスエレメンタリストリーム)を生成する。ここで、グラフィクスは、重畳情報を構成し、例えば、ロゴ、字幕などである。
グラフィクスデータは、主にはビットマップデータである。このグラフィクスデータには、画像上の重畳位置を示すオフセット情報が付加されている。このオフセット情報は、例えば、画像の左上の原点から、グラフィクスの重畳位置の左上の画素までの垂直方向、水平方向のオフセット値を示す。なお、字幕データをビットマップデータとして伝送する規格は、例えば、ヨーロッパのデジタル放送規格であるDVBで「DVB_Subtitling」として規格化され、運用されている。
音声データ出力部115は、画像データに対応した音声データを出力する。この音声データ出力部115は、例えば、マイクロホン、あるいは記憶媒体から音声データを読み出して出力する音声データ読み出し部などにより構成される。オーディオエンコーダ116は、音声データ出力部115から出力される音声データに対して、MPEG−2 Audio、AAC等の符号化を施し、オーディオストリーム(オーディオエレメンタリストリーム)を生成する。
マルチプレクサ117は、ビデオエンコーダ112、グラフィクスエンコーダ114およびオーディオエンコーダ116で生成された各エレメンタリストリームをパケット化して多重し、トランスポートストリームTSを生成する。この場合、それぞれのPES(Packetized Elementary Stream)のヘッダには、受信側における同期再生のために、PTS(Presentation Time Stamp)が挿入される。
マルチプレクサ117は、トランスポートストリームTSのレイヤに、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報を挿入する。ここでは、この識別情報は、第1の送信モードであることを示す。この識別情報は、例えば、トランスポートストリームTSに含まれるプログラム・マップ・テーブル(PMT)のビデオエレメンタリ・ループ(Video ES loop)の配下に挿入される。
また、マルチプレクサ117は、トランスポートストリームTSのレイヤに、1つまたは複数のビデオストリーム(サブストリーム)を挿入するビデオエレメンタリストリームの個数を識別するための識別情報を挿入する。ここでは、この識別情報は、「1」または「拡張ビデオストリームの個数+1」を示す。この識別情報は、例えば、トランスポートストリームTSに含まれるプログラム・マップ・テーブル(PMT)のプログラム・ループ(Program_loop)の配下に挿入される。
次に、第2の送信モードにある場合について説明する。画像データ出力部111は、従来画像、例えばHD画像の画像データを出力する。ビデオエンコーダ112は、画像データ出力部111から出力される画像データに対して、MPEG4−AVC、MPEG2video等の符号化を施し、基本ビデオストリーム(サブストリーム)を生成する。そして、ビデオエンコーダ112は、後段に備えるストリームフォーマッタ(図示せず)により、基本ビデオストリームが挿入された1つのビデオエレメンタリストリームを生成する。
ビデオエンコーダ112は、上述の「方法1」、あるいは「方法3」を採用する場合には、基本ビデオストリームに、第2の送信モードであることを示す識別情報「BCF」を挿入する。
詳細説明は省略するが、グラフィクスデータ出力部113、グラフィクスエンコーダ114、音声データ出力部115およびオーディオエンコーダ116に関しては、第1の送信モードにある場合と同様である。
マルチプレクサ117は、ビデオエンコーダ112、グラフィクスエンコーダ114およびオーディオエンコーダ116で生成された各エレメンタリストリームをパケット化して多重し、トランスポートストリームTSを生成する。この場合、それぞれのPES(Packetized Elementary Stream)のヘッダには、受信側における同期再生のために、PTS(Presentation Time Stamp)が挿入される。
マルチプレクサ117は、トランスポートストリームTSのレイヤに、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報を挿入する。ここでは、この識別情報は、第2の送信モードであることを示す。この識別情報は、例えば、トランスポートストリームTSに含まれるプログラム・マップ・テーブル(PMT)のビデオエレメンタリ・ループ(Video ES loop)の配下に挿入される。
また、マルチプレクサ117は、トランスポートストリームTSのレイヤに、1つまたは複数のビデオストリーム(サブストリーム)を挿入するビデオエレメンタリストリームの個数を識別するための識別情報を挿入する。ここでは、この識別情報は、「1」を示す。この識別情報は、例えば、トランスポートストリームTSに含まれるプログラム・マップ・テーブル(PMT)のプログラム・ループ(Program_loop)の配下に挿入される。
図16に示す送信データ生成部110の動作を簡単に説明する。最初に、第1の送信モードにある場合について説明する。画像データ出力部111から出力される、空間的あるいは時間的な超高解像度画像の画像データは、ビデオエンコーダ112に供給される。
このビデオエンコーダ112では、その画像データに対してスケーラブル符号化の処理が施され、最下位階層の画像データを含む基本ビデオストリーム(サブストリーム)と、最下位層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリーム(サブストリーム)が生成される。そして、ビデオエンコーダ112では、基本ビデオストリームおよび所定数の拡張ビデオストリームが挿入された1つまたは複数のビデオエレメンタリストリームが生成される。このビデオエレメンタリストリームは、マルチプレクサ117に供給される。また、このビデオエンコーダ112では、上述の「方法1」、あるいは「方法2」を採用する場合には、基本ビデオストリームに、第1の送信モードであることを示す識別情報「EHF」が挿入される(図13、図14参照)。
また、グラフィクスデータ出力部113から出力されるグラフィクスデータ(サブタイトルデータも含む)は、グラフィクスエンコーダ114に供給される。このグラフィクスエンコーダ114では、グラフィクスデータを含むグラフィクスストリーム(グラフィクスエレメンタリストリーム)が生成される。このグラフィクスストリームは、マルチプレクサ115に供給される。
また、音声データ出力部115から出力される音声データは、オーディオエンコーダ116に供給される。このオーディオエンコーダ116では、音声データに対して、MPEG−2 Audio、AAC等の符号化が施され、オーディオストリーム(オーディオエレメンタリストリーム)が生成される。このオーディオストリームは、マルチプレクサ117に供給される。
マルチプレクサ117では、各エンコーダから供給されるエレメンタリストリームがパケット化されて多重され、トランスポートストリームTSが生成される。この場合、それぞれのPESヘッダには、受信側における同期再生のために、PTSが挿入される。また、マルチプレクサ117では、PMTのビデオエレメンタリ・ループ(Video ES loop)の配下に、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報が挿入される。また、マルチプレクサ117では、PMTのプログラム・ループの配下に、ビデオエレメンタリストリームの個数を識別するための識別情報が挿入される。
次に、第2の送信モードにある場合について説明する。画像データ出力部111から出力される、従来画像、例えばHD画像の画像データは、ビデオエンコーダ112に供給される。このビデオエンコーダ112では、その画像データに対して、MPEG4−AVC、MPEG2video等の符号化が施され、基本ビデオストリーム(サブストリーム)が生成される。そして、このビデオエンコーダ112では、基本ビデオストリームが挿入された1つのビデオエレメンタリストリームが生成される。また、このビデオエンコーダ112では、上述の「方法1」、あるいは「方法3」を採用する場合には、基本ビデオストリームに、第2の送信モードであることを示す識別情報「BCF」が挿入される(図13、図15参照)。
マルチプレクサ117では、ビデオエンコーダ112、グラフィクスエンコーダ114およびオーディオエンコーダ116で生成された各エレメンタリストリームがパケット化されて多重され、トランスポートストリームTSが生成される。この場合、それぞれのPESヘッダには、受信側における同期再生のために、PTSが挿入される。また、マルチプレクサ117では、例えば、PMTのビデオエレメンタリ・ループ(Video ES loop)の配下に、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報が挿入される。また、マルチプレクサ117では、例えば、PMTのプログラム・ループの配下に、ビデオエレメンタリストリームの個数を識別するための識別情報が挿入される。
[各識別情報の構造とTS構成]
上述したように、ビデオストリームに、第1の送信モードと第2の送信モードとを識別するための識別情報(「EHF」、「BCF」)が挿入される。例えば、符号化方式がMPEG4−AVCである場合、または、HEVCのような、NALパケットなどの符号化構造が似通っている符号化方式である場合にも、この識別情報は、アクセスユニット(AU)の“SEIs”の部分に、SEIメッセージ(Enhancement scalability SEI message)として挿入される。
図19(a)は、GOP(Group Of Pictures)の先頭のアクセスユニットを示しており、図19(b)は、GOPの先頭以外のアクセスユニットを示している。識別情報(「EHF」、「BCF」)がGOP単位で挿入される場合、GOPの先頭のアクセスユニットにのみ「Enhancement scalability SEI message」が挿入される。なお、この図において、「Enhancement scalability SEI message」以外のSEIメッセージは、上述の図17、図18において、「従来SEI」と記載されている部分に相当する。
図20(a)は、「Enhancement scalability SEI message」の構造例(Syntax)を示している。「uuid_iso_iec_11578」は、“ISO/IEC 11578:1996 AnnexA.”で示されるUUID値をもつ。「user_data_payload_byte」のフィールドに、「userdata_for_enhancement_scalability_data()」が挿入される。図20(b)は、「userdata_for_enhancement_scalability_data()」の構造例(Syntax)を示している。この中に、エンハンスメント・スケーラビリティ・データ(enhancement_scalability_data())が挿入される。「userdata_id」は、符号なし16ビットで示されるエンハンスメント・スケーラビリティ・データの識別子である。
図21は、エンハンスメント・スケーラビリティ・データ(enhancement_scalability_data())の構造例(Syntax)を示している。また、図22は、その構造例における主要な情報の内容(Semantics)を示している。
「enhancement_scalability_type」の2ビットフィールドは、スケーラビリティ拡張のタイプを示す。例えば、“00”はスケーラビリティでないことを示し、“01”は空間解像度スケーラビリティであることを示し、“10”は時間解像度スケーラビリティであることを示す。第1の送信モードであることを示す識別情報「EHF」の場合、この2ビットフィールドは、例えば、“01”あるいは“10”となる。また、第2の送信モードであることを示す識別情報「BCF」の場合、この2ビットフィールドは“00”となる。そのため、この2ビットフィールドにより、第1の送信モードにあるか第2の送信モードにあるかを識別することが可能となる。
「number_of_enhanced_streams」の3ビットフィールドは、拡張ビデオストリームの数(個数)を示す。例えば、“000”は0ストリームを示し、“001”は1ストリームを示し、“010”は2ストリームを示し、“011”は3ストリームを示す。第1の送信モードであることを示す識別情報「EHF」の場合、この3ビットフィールドは1ストリーム以上を示すものとなる。一方、第2の送信モードであることを示す識別情報「BCF」の場合、この3ビットフィールドは0ストリームを示すものとなる。
「enhancement_scalability_type」の2ビットフィールドが空間解像度スケーラビリティを示すとき、拡張ビデオストリームの数(個数)分だけ、「spatial_scaling_ratio」の3ビットフィールドが存在する。この3ビットフィールドは、一段上の拡張レイヤ(enhancement layer)のデコード後のピクチャ(画像)との合成を行う際の、空間的スケーリング比を示すもので、ローワーレーヤー(lower layer)のデコード後のピクチャをスケーリングする水平画素比率、そして垂直画素比率の組み合わせを表す(図6参照)。
例えば、“000”はスケーリングしないことを示す。“001”は水平・垂直共に、アップスケーリング比が50%(3/2倍にする)であることを示す。“010”は水平・垂直共に、アップスケーリング比が100%(2倍にする)であることを示す。さらに、“011”は水平・垂直共に、アップスケーリング比が150%(5/2倍にする)であることを示す。
また、「enhancement_scalability_type」の2ビットフィールドが時間解像度スケーラビリティを示すとき、拡張ビデオストリームの数(個数)分だけ、「temporal_scaling_ratio」の3ビットフィールドが存在する。この3ビットフィールドは、一段上の拡張層(enhancement layer)のデコード後のピクチャとの合成を行う際の、時間的スケーリング比を示すもので、ローワーレーヤー(lower layer)のデコード後のピクチャ(画像)の間に表示させる拡張層(enhanced layer)のピクチャの数を示す(図10参照)。
例えば、“000”は拡張層のピクチャ挿入がないことを示す。“001”は拡張層のピクチャ挿入が1ピクチャであることを示し、“010”は拡張層のピクチャ挿入が2ピクチャであることを示し、“011”は拡張層のピクチャ挿入が3ピクチャであることを示す。
また、上述したように、例えば、トランスポートストリームTSのプログラム・マップ・テーブル(PMT)のビデオエレメンタリ・ループ(Video ES loop)の配下に、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報が挿入される。図23は、この識別情報としてのスケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)の構造例(Syntax)を示している。また、図24は、その構造例における主要な情報の内容(Semantics)を示している。
このスケーラブル・エンハンスメント・デスクリプタは、例えば、第1の送信モードにある場合にのみ挿入される。そのため、このデスクリプタの存在により、トランスポートストリームTSのレイヤにおいて第1の送信モードあることの識別が可能となり、逆に、このデスクリプタの非存在により、トランスポートストリームTSのレイヤにおいて第2の送信モードあることの識別が可能となる。
「scalable_enhancement_tag」の8ビットフィールドは、デスクリプタタイプを示し、ここでは、スケーラブル・エンハンスメント・デスクリプタであることを示す。「scalable_enhancement_length」の8ビットフィールドは、デスクリプタの長さ(サイズ)を示し、デスクリプタの長さとして以降のバイト数を示す。
「Scalable_enhancement_type」の2ビットフィールドは、スケーラビリティ拡張のタイプを示す。例えば、“01”は空間解像度スケーラビリティであることを示し、“10”は時間解像度スケーラビリティであることを示す。
「stream_delivery_type」の1ビットフィールドは、基本、拡張のビデオストリームが供給されるビデオエレメンタリストリーム構成を示す。“1”は各ビデオストリームが1つのビデオエレメンタリストリームで供給されることを示し、“0”は各ビデオストリームが複数のビデオエレメンタリストリームで供給されることを示す。
「number_of_enhanced_streams」の3ビットフィールドは、拡張ビデオストリームの数(個数)を示す。例えば、“000”は0ストリームを示し、“001”は1ストリームを示し、“010”は2ストリームを示し、“011”は3ストリームを示す。
また、上述したように、例えば、トランスポートストリームTSのプログラム・マップ・テーブル(PMT)のプログラム・ループ(Program_loop)の配下に、1つまたは複数のビデオストリーム(サブストリーム)を挿入するビデオエレメンタリストリームの個数を識別するための識別情報が挿入される。図25(a)は、この識別情報としてのマルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)の構造例(Syntax)を示している。
「multiple_stream_tag」の8ビットフィールドは、デスクリプタタイプを示し、ここでは、マルチプル・ストリーム・デスクリプタであることを示す。「multiple_stream_length」の8ビットフィールドは、デスクリプタの長さ(サイズ)を示し、デスクリプタの長さとして以降のバイト数を示す。
「number_of_video_streams」の3ビットフィールドは、ビデオエレメンタリストリームの個数を示す。例えば、図25(b)に示すように、“001”は1ストリームを示し、“010”は2ストリームを示し、“011”は3ストリームを示し、“100”は4ストリームを示す。第1の送信モードである場合、この3ビットフィールドは1ストリーム以上を示すものとなる。一方、第2の送信モードである場合、この3ビットフィールドは1ストリームのみを示すものとなる。
図26は、トランスポートストリームTSの構成例を示している。この例は、図面の簡単化のために、オーディオおよびグラフィクスに関する部分については、その図示を省略している。この例は、基本ビデオストリームのみ、あるいは基本ビデオストリームおよび所定数の拡張ビデオストリームが1つのビデオエレメンタリストリームに挿入されて送信される場合(Single PID)の例を示している。すなわち、この1つのビデオエレメントストリームには、第1の送信モードの場合には基本ビデオストリームと所定数の拡張ビデオストリームが挿入されており、第2の送信モードの場合には基本ビデオストリームのみが挿入されている。
トランスポートストリームTSには、1つのビデオエレメンタリストリームのPESパケット「PID1:video PES1」が含まれている。このビデオエレメンタリストリームに挿入される基本ビデオストリーム(サブストリーム)に、第1の送信モードと第2の送信モードとを識別するための識別情報(「EHF」、「BCF」)が、SEIメッセージ(Enhancement scalability SEI message)として挿入されている(図21参照)。
また、トランスポートストリームTSには、PSI(Program Specific Information)として、PMT(Program Map Table)が含まれている。このPSIは、トランスポートストリームに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。
PMTには、各エレメンタリストリームに関連した情報を持つエレメンタリ・ループが存在する。この構成例では、ビデオエレメンタリ・ループ(Video ES loop)が存在する。このビデオエレメンタリ・ループには、上述の1つのビデオエレメンタリストリームに対応して、ストリームタイプ、パケット識別子(PID)等の情報が配置されると共に、そのビデオエレメンタリストリームに関連する情報を記述するデスクリプタも配置される。
このPMTのビデオエレメンタリ・ループ(Video ES loop)の配下に、上述の1つのビデオエレメンタリストリームに関連して、スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)が挿入される(図23参照)。また、PMTのプログラム・ループ(Program loop)の配下に、マルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)が挿入される(図25参照)。なお、スケーラブル・エンハンスメント・デスクリプタは、上述したように、例えば、第1の送信モードにある場合のみ挿入されるものである。
図27も、トランスポートストリームTSの構成例を示している。この例も、図面の簡単化のために、オーディオおよびグラフィクスに関する部分については、その図示を省略している。この例は、基本ビデオストリームおよび所定数の拡張ビデオストリームがそれぞれ別個のビデオエレメンタリストリームに挿入されて送信される場合(Multiple PID)の例を示している。なお、この例は、拡張ビデオストリームが2個の場合の例を示している。
この構成例では、基本ビデオストリーム(サブストリーム)が挿入されたビデオエレメンタリストリームのPESパケット「PID1:video PES1」が含まれている。この基本ビデオストリームに、第1の送信モードと第2の送信モードとを識別するための識別情報(「EHF」、「BCF」)が、SEIメッセージ(Enhancement scalability SEI message)として挿入されている(図21参照)。
また、この構成例では、第1の拡張ビデオストリーム(サブストリーム)が挿入されたビデオエレメンタリストリームのPESパケット「PID2:video PES2」と、第2の拡張ビデオストリーム(サブストリーム)が挿入されたビデオエレメンタリストリームのPESパケット「PID3:video PES3」が含まれている。
また、トランスポートストリームTSには、PSI(Program Specific Information)として、PMT(Program Map Table)が含まれている。このPSIは、トランスポートストリームに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。
PMTには、各エレメンタリストリームに関連した情報を持つエレメンタリ・ループが存在する。この構成例では、ビデオエレメンタリ・ループ(Video ES loop)が存在する。このビデオエレメンタリ・ループには、ビデオエレメンタリストリーム毎に、ストリームタイプ、パケット識別子(PID)等の情報が配置されると共に、そのビデオエレメンタリストリームに関連する情報を記述するデスクリプタも配置される。
このPMTのビデオエレメンタリ・ループ(Video ES loop)の配下に、上述の各ビデオエレメンタリストリームにそれぞれ関連して、同一内容のスケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)が挿入される(図23参照)。なお、基本ビデオストリームが挿入されるビデオエレメンタリストリームに関連してのみ、スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)が挿入されてもよい。また、PMTのプログラム・ループ(Program loop)の配下に、マルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)が挿入される(図25参照)。なお、スケーラブル・エンハンスメント・デスクリプタは、上述したように、例えば、第1の送信モードにある場合のみ挿入されるものである。
「受信機の構成例」
図28は、受信機200の構成例を示している。この受信機200は、CPU201と、フラッシュROM202と、DRAM203と、内部バス204と、リモートコントロール受信部(RC受信部)205と、リモートコントロール送信機(RC送信機)206を有している。また、この受信機200は、アンテナ端子211と、デジタルチューナ212と、トランスポートストリームバッファ(TSバッファ)213と、デマルチプレクサ214を有している。
また、この受信機200は、コーデッドバッファ215と、ビデオデコーダ216と、基本ストリームデコーデッドバッファ217と、拡張ストリームデコーデッドバッファ218と、合成処理部219と、ビデオRAM220と、解像度アップ処理部221と、重畳部2222を有している。また、この受信機200は、コーデッドバッファ231と、グラフィクスデコーダ232と、ピクセルバッファ233と、スケーラ234と、コーデッドバッファ241と、オーディオデコーダ242と、チャネルミキシング部243を有している。
CPU201は、受信機200の各部の動作を制御する。フラッシュROM202は、制御ソフトウェアの格納およびデータの保管を行う。DRAM203は、CPU201のワークエリアを構成する。CPU201は、フラッシュROM202から読み出したソフトウェアやデータをDRAM203上に展開してソフトウェアを起動させ、受信機200の各部を制御する。RC受信部205は、RC送信機206から送信されたリモーコントロール信号(リモコンコード)を受信し、CPU201に供給する。CPU201は、このリモコンコードに基づいて、受信機200の各部を制御する。CPU201、フラッシュROM202およびDRAM203は、内部バス204に接続されている。
アンテナ端子211は、受信アンテナ(図示せず)で受信されたテレビ放送信号を入力する端子である。デジタルチューナ212は、アンテナ端子211に入力されたテレビ放送信号を処理して、ユーザの選択チャネルに対応した所定のトランスポートストリーム(ビットストリームデータ)TSを出力する。トランスポートストリームバッファ(TSバッファ)213は、デジタルチューナ212から出力されたトランスポートストリームTSを一時的に蓄積する。
このトランスポートストリームTSには、1つまたは複数のビデオエレメンタリストリームと、グラフィクスエレメンタリストリームと、オーディオエレメンタリストリームが含まれている。そして、この1つまたは複数のビデオエレメンタリストリームには、第1の送信モードにある場合および第2の送信モードにある場合において、以下のサブストリームが挿入されている。
すなわち、第1の送信モードにある場合には、基本ビデオストリームと、所定数の拡張ビデオストリームが挿入されている。この場合、基本ビデオストリームには、スケーラブル符号化画像データ(空間的あるいは時間的な超高解像度画像の画像データ)を構成する最下位階層の画像データが含まれている。また、所定数の拡張ビデオストリームには、スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データがそれぞれ含まれている。また、このトランスポートストリームTSには、第2の送信モードにある場合、基本ビデオストリームのみが挿入されている。この場合、基本ビデオストリームには、従来画像(例えば、HD解像度、25fps、30fps画像など)の画像データが基本画像データとして含まれている。
また、基本ビデオストリームには、第1の送信モードと第2の送信モードとを識別するための識別情報(「EHF」、「BCF」)としてのSEIメッセージ(Enhancement scalability SEI message)が挿入されている(図21参照)。また、トランスポートストリームTSのレイヤに、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報として、スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)が挿入されている(図23参照)。さらに、トランスポートストリームTSのレイヤに、ビデオエレメンタリストリームの個数を識別するための識別情報として、マルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)が挿入されている(図25参照)。
デマルチプレクサ214は、TSバッファ213に一時的に蓄積されたトランスポートストリームTSから、ビデオ、グラフィクスおよびオーディオの各エレメンタリストリームを抽出する。また、デマルチプレクサ214は、このトランスポートストリームTSから、上述したスケーラブル・エンハンスメント・デスクリプタと、マルチプル・ストリーム・デスクリプタとを抽出し、CPU201に送る。
CPU201は、これらのデスクリプタに含まれる情報に基づいて、受信機200におけるデコード等の処理を制御する。例えば、マルチプル・ストリーム・デスクリプタに含まれるビデオエレメンタリストリームの個数だけ、ビデオエレメンタリ・ループ(Video ES loop)の配下のスケーラブル・エンハンスメント・デスクリプタと、それに関連付けられるビデオエレメンタリストリーム(PESストリーム)をデコードするように制御する。
コーデッドバッファ215は、デマルチプレクサ214で抽出される1つまたは複数のビデオエレメンタリストリームを一時的に蓄積する。ビデオデコーダ216は、CPU201の制御のもと、コーデッドバッファ215に記憶されているビデオエレメンタリストリームに挿入されている1つまたは複数のビデオストリーム(サブストリーム)を取り出してデコードする。
第1の送信モードにある場合には、基本ビデオストリームと、所定数の拡張ビデオストリームが取り出されてデコードされる。この場合、基本ビデオストリームがデコードされることで、スケーラブル符号化画像データを構成する最下位階層の画像データ(例えば、HD解像度、25fps、30fps画像などの画像データ)が得られる。また、所定数の拡張ビデオストリームがそれぞれデコードされることでスケーラブル符号化画像データを構成する最下位階層以外の階層の画像データが得られる。また、第2の送信モードにある場合には、基本ビデオストリームのみが取り出されてデコードされる。この場合、基本ビデオストリームがデコードされることで、従来画像(例えば、HD解像度、25fps、30fps画像など)の画像データが得られる。
また、ビデオデコーダ216は、基本ビデオストリームに挿入されているSEIメッセージ(Enhancement scalability SEI message)を抽出し、CPU201に送る。CPU201は、上述のスケーラブル・エンハンスメント・デスクリプタ存在、非存在の他に、このSEIメッセージ内のモード情報により、第1の送信モードにあるか第2の送信モードにあるかを識別し、各モードに応じた処理が行われるように、受信機200の各部を制御する。例えば、スケーラブル・エンハンスメント・デスクリプタの存在、非存在によりトランスポートストリームTSのレイヤでモード切り替わりが識別された場合、その後のSEIメッセージ内のモード情報でそのモード切り替わりが識別された時点で、処理の切り替えが行われる。
基本ストリームデコーデッドバッファ217は、ビデオデコーダ216で基本ビデオストリームがデコードされて得られた画像データを一時的に蓄積する。この画像データは、第1の送信モードにある場合にはスケーラブル符号化画像データを構成する最下位階層の画像データであり、第2の送信モードにある場合には従来画像の画像データである。拡張ストリームデコーデッドバッファ218は、ビデオデコーダ216で所定数の拡張ビデオストリームがデコードされて得られた各画像データを一時的に蓄積する。この各画像データは、第1の送信モードにある場合のみ得られ、スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データである。
合成処理部219は、第1の送信モードにある場合のみ処理を行う。この合成処理部219は、基本ストリームデコーデッドバッファ217に記憶されている最下位階層の画像データと、拡張ストリームデコーデッドバッファ218に記憶されている最下位階層以外の階層の画像データとの合成処理を行って、超高解像度画像の表示用画像データVaを生成する(図6、図10参照)。この場合、合成処理部219では、スケーラビリティ拡張のタイプに応じて、SEIメッセージ(Enhancement scalability SEI message)に含まれるスケーリング比などの情報を参照して、空間解像度スケーラビリティあるいは時間解像度スケーラビリティの合成処理を行う。
解像度アップ処理部221は、第2の送信モードにある場合のみ処理を行う。この解像度アップ処理部221は、基本ストリームデコーデッドバッファ217に記憶されている従来画像の画像データに対して、解像度アップ処理を行って、上述の超高解像度画像の表示用画像データVaの解像度と同等の解像度を持つ表示用画像データVbを生成する。ここで、空間解像度スケーラビリティの場合には空間解像度のアップ処理が行われ、時間解像度スケーラビリティの場合にはフレーム周波数のアップ処理が行われる。
ビデオRAM220は、第1の送信モードにある場合には、合成処理部219で生成された画像データVaを一時的に蓄積する。また、ビデオRAM220は、第2の送信モードにある場合には、解像度アップ処理部221で生成された画像データVbを一時的に蓄積する。
コーデッドバッファ231は、デマルチプレクサ214で抽出されるグラフィクスストリームを一時的に蓄積する。グラフィクスデコーダ232は、上述の送信データ生成部110のグラフィクスエンコーダ114(図16参照)とは逆の処理を行う。すなわち、グラフィクスデコーダ232は、コーデッドバッファ231に記憶されているグラフィクスストリームの復号化処理を行って、復号化されたグラフィクスデータ(サブタイトルデータを含む)を得る。また、グラフィクスデコーダ232は、このグラフィクスデータに基づいて、画像データに重畳するグラフィクスのビットマップデータを発生する。
ピクセルバッファ233は、グラフィクスデコーダ232で発生されるグラフィクスのビットマップデータを一時的に蓄積する。スケーラ234は、ピクセルバッファ233に蓄積されているグラフィクスのビットマップデータのサイズを、表示用画像データのサイズに対応するように調整する。重畳部222は、ビデオRAM220で記憶されている表示用画像データVa,Vbに、スケーリング後のグラフィクスのビットマップデータを重畳して、最終的な表示用画像データを得る。
コーデッドバッファ241は、デマルチプレクサ214で抽出されるオーディオストリームを一時的に蓄積する。オーディオデコーダ242は、上述の送信データ生成部110のオーディオエンコーダ116(図16参照)とは逆の処理を行う。すなわち、オーディオデコーダ242は、コーデッドバッファ241に記憶されているオーディオスストリームの復号化処理を行って、復号化された音声データを得る。チャネルミキシング部243は、オーディオデコーダ242で得られる音声データに対して、例えば5.1chサラウンド等を実現するための各チャネルの音声データを得る。
なお、基本ストリームデコーデッドバッファ217および拡張ビデオストリームデコーデッドバッファ218からの画像データの読み出しと、ピクセルバッファ233からのグラフィクスのビットマップデータの読み出しとは、PTSに基づいて行われ、転送同期が取られる。
受信機200の動作を説明する。最初に、第1の送信モードにある場合について説明する。アンテナ端子211に入力されたテレビ放送信号はデジタルチューナ212に供給される。このデジタルチューナ212では、テレビ放送信号が処理されて、ユーザの選択チャネルに対応した所定のトランスポートストリームTSが出力される。このトランスポートストリームTSは、TSバッファ213に一時的に蓄積される。
このトランスポートストリームTSには、1つまたは複数のビデオエレメンタリストリームと、グラフィクスエレメンタリストリームと、オーディオエレメンタリストリームが含まれている。そして、この1つまたは複数のビデオエレメンタリストリームには、基本ビデオストリームと、所定数の拡張ビデオストリームが挿入されている。
デマルチプレクサ214では、TSバッファ213に一時的に蓄積されたトランスポートストリームTSから、ビデオ、グラフィクスおよびオーディオの各エレメンタリストリームが抽出される。また、デマルチプレクサ214では、このトランスポートストリームTSから、スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)と、マルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)とが抽出され、CPU201に送られる。CPU201では、これらのデスクリプタに含まれる情報に基づいて、受信機200におけるデコード等の処理を制御することが行われる。
デマルチプレクサ214で抽出される1つまたは複数のビデオエレメンタリストリームは、コーデッドバッファ215に供給されて一時的に蓄積される。ビデオデコーダ216では、CPU201の制御のもと、コーデッドバッファ215に記憶されているビデオエレメンタリストリームに挿入されている1つまたは複数のビデオストリーム(サブストリーム)が取り出されてデコードされる。
この場合、基本ビデオストリームと、所定数の拡張ビデオストリームが取り出されてデコードされる。基本ビデオストリームがデコードされることで、スケーラブル符号化画像データを構成する最下位階層の画像データ(例えば、HD解像度、25fps、30fps画像など)が得られる。また、所定数の拡張ビデオストリームがそれぞれデコードされることでスケーラブル符号化画像データを構成する最下位階層以外の階層の画像データが得られる。
また、ビデオデコーダ216では、基本ビデオストリームに挿入されているSEIメッセージ(Enhancement scalability SEI message)が抽出され、CPU201に送られる。CPU201では、上述のスケーラブル・エンハンスメント・デスクリプタの存在の他に、このSEIメッセージ内のモード情報により、第1の送信モードにあるか第2の送信モードにあるかが識別される。そして、この場合においては第1の送信モードであることが識別され、この第1の送信モードに応じた処理が行われるように受信機200の各部を制御することが行われる。
ビデオデコーダ216で得られたスケーラブル符号化画像データを構成する最下位階層の画像データは、基本ストリームデコーデッドバッファ217に一時的に蓄積される。また、ビデオデコーダ216で得られたスケーラブル符号化画像データを構成する最下位階層以外の階層の画像データは、拡張ストリームデコーデッドバッファ218に一時的に蓄積される。
合成処理部219では、基本ストリームデコーデッドバッファ217に記憶されている最下位階層の画像データと、拡張ストリームデコーデッドバッファ218に記憶されている最下位階層以外の階層の画像データとの合成処理が行われる。そして、この合成処理部219では、超高解像度画像の表示用画像データVaが生成される。この表示用画像データVaは、ビデオRAM220に一時的に蓄積される。
また、デマルチプレクサ214で抽出されるグラフィクスストリームは、コーデッドバッファ231に供給されて一時的に蓄積される。グラフィクスデコーダ232では、コーデッドバッファ231に記憶されているグラフィクスストリームの復号化処理が行われて、復号化されたグラフィクスデータ(サブタイトルデータを含む)が得られる。また、このグラフィクスデコーダ232では、このグラフィクスデータに基づいて、画像データに重畳するグラフィクスのビットマップデータが発生される。
グラフィクスデコーダ232で発生されるグラフィクスのビットマップデータは、ピクセルバッファ233に供給されて一時的に蓄積される。スケーラ234では、ピクセルバッファ233に蓄積されているグラフィクスのビットマップデータのサイズが、表示用画像データVaのサイズに対応するように調整される。重畳部222では、ビデオRAM220で記憶されている表示用画像データVaに、スケーリング後のグラフィクスのビットマップデータが重畳されて、最終的な表示用画像データが得られる。この表示用画像データがディスプレイに供給されることで、空間的あるいは時間的な超高解像度画像の表示が行われる。
また、デマルチプレクサ214で抽出されるオーディオストリームは、コーデッドバッファ241に供給されて一時的に蓄積される。オーディオデコーダ242では、コーデッドバッファ241に記憶されているオーディオストリームの復号化処理が行われて、復号化された音声データが得られ。この音声データはチャネルミキシング部243に供給される。チャネルミキシング部243では、音声データに対して、例えば5.1chサラウンド等を実現するための各チャネルの音声データが生成される。この音声データは例えばスピーカに供給され、画像表示に合わせた音声出力がなされる。
次に、第2の送信モードにある場合について説明する。アンテナ端子211に入力されたテレビ放送信号はデジタルチューナ212に供給される。このデジタルチューナ212では、テレビ放送信号が処理されて、ユーザの選択チャネルに対応した所定のトランスポートストリームTSが出力される。このトランスポートストリームTSは、TSバッファ213に一時的に蓄積される。
このトランスポートストリームTSには、1つのビデオエレメンタリストリームと、グラフィクスエレメンタリストリームと、オーディオエレメンタリストリームが含まれている。そして、この1つのビデオエレメンタリストリームには、基本ビデオストリームが挿入されている。
デマルチプレクサ214では、TSバッファ213に一時的に蓄積されたトランスポートストリームTSから、ビデオ、グラフィクスおよびオーディオの各エレメンタリストリームが抽出される。また、デマルチプレクサ214では、このトランスポートストリームTSから、マルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)が抽出され、CPU201に送られる。CPU201では、このデスクリプタに含まれる情報に基づいて、受信機200におけるデコード等の処理を制御することが行われる。
デマルチプレクサ214で抽出される1つのビデオエレメンタリストリームは、コーデッドバッファ215に供給されて一時的に蓄積される。ビデオデコーダ216では、CPU201の制御のもと、コーデッドバッファ215に記憶されているビデオエレメンタリストリームに挿入されている基本ビデオストリーム(サブストリーム)が取り出されてデコードされる。このデコードにより、従来画像(例えば、HD解像度、25fps、30fps画像など)の画像データが得られる。この画像データは、基本ストリームデコーデッドバッファ217に一時的に蓄積される。
また、ビデオデコーダ216では、基本ビデオストリームに挿入されているSEIメッセージ(Enhancement scalability SEI message)が抽出され、CPU201に送られる。CPU201では、上述のスケーラブル・エンハンスメント・デスクリプタの非存在の他に、このSEIメッセージ内のモード情報により、第1の送信モードにあるか第2の送信モードにあるかが識別される。そして、この場合においては第2の送信モードであることが識別され、この第2の送信モードに応じた処理が行われるように受信機200の各部を制御することが行われる。
解像度アップ処理部221では、基本ストリームデコーデッドバッファ217に記憶されている従来画像の画像データに対して、解像度アップ処理が行われ、上述の超高解像度画像の表示用画像データVaの解像度と同等の解像度を持つ表示用画像データVbが生成される。ここで、空間解像度スケーラビリティの場合には空間解像度のアップ処理が行われ、時間解像度スケーラビリティの場合にはフレーム周波数のアップ処理が行われる。
また、デマルチプレクサ214で抽出されるグラフィクスストリームは、コーデッドバッファ231に供給されて一時的に蓄積される。グラフィクスデコーダ232では、コーデッドバッファ231に記憶されているグラフィクスストリームの復号化処理が行われて、復号化されたグラフィクスデータ(サブタイトルデータを含む)が得られる。また、このグラフィクスデコーダ232では、このグラフィクスデータに基づいて、画像データに重畳するグラフィクスのビットマップデータが発生される。
グラフィクスデコーダ232で発生されるグラフィクスのビットマップデータは、ピクセルバッファ233に供給されて一時的に蓄積される。スケーラ234では、ピクセルバッファ233に蓄積されているグラフィクスのビットマップデータのサイズが、表示用画像データVbのサイズに対応するように調整される。重畳部222では、ビデオRAM220で記憶されている表示用画像データVbに、スケーリング後のグラフィクスのビットマップデータが重畳されて、最終的な表示用画像データが得られる。この表示用画像データがディスプレイに供給されることで、従来画像に解像度アップ処理が施された画像の表示が行われる。
なお、音声系の動作に関しては、第1の送信モードにある場合と同様であるので、その説明は省略する。
[高精細番組と従来番組の切り替え時の受信処理の切り替え制御]
ここで、受信機200における高精細番組と従来番組の切り替え時における受信処理の切り替えについて説明する。ここで、高精細番組は第1の送信モードで送られてくるが、従来番組は第2の送信モードで送られてくる。
図29は、受信処理の切り替え制御の一例を示している。この例は、第1の送信モードにおいては、基本ビデオストリームと所定数の拡張ビデオストリームとが1つのビデオエレメンタリストリームに挿入されて供給されるものである。この場合、基本ビデオストリームには最下位階層(第1階層)の画像データ(HD画像データ)が含まれており、所定数の拡張ビデオストリームには最下位階層以外の階層(enhanced layer)の画像データが含まれている。なお、第2の送信モードにおいては、基本ビデオストリームが挿入された1つのビデオストリームが供給されるものである。
トランスポートストリームTSのレイヤに挿入されているマルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)の「number_of_video_streams」は、高精細番組(第1の送信モード)の期間および従来番組(第2の送信モード)の期間の双方で“001”とされ、いずれの期間でもビデオエレメンタリストリームの個数が1つであることが示される。
また、高精細番組(第1の送信モード)でトランスポートストリームTSのレイヤに挿入されるスケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)の「scalable_enhancement_type」は、“01”とされ、空間解像度スケーラビリティあることが示される。また、このデスクリプタの「stream_delivery_type」は、“1”とされ、基本および拡張のビデオストリームが1つのビデオエレメンタリストリームで供給されることが示される。
基本ストリームには、SEIメッセージ(Enhancement scalability SEI message)が挿入されている。高精細番組(第1の送信モード)の期間、このSEIメッセージに含まれる「enhancement_scalability_type」は空間解像度スケーラビリティあることを示す“01”であり、高精細番組(第1の送信モード)であることの識別も可能とされる。一方、従来番組(第2の送信モード)の期間、「enhancement_scalability_type」は“00”であり、従来番組(第2の送信モード)の期間であることが識別可能とされる。
受信機200における受信処理の切り替え制御は、例えば、以下のように行われる。従来番組(第2の送信モード)から高精細番組(第1の送信モード)への受信処理の切り替えの場合、まず、スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)の存在によりトランスポートストリームTSのレイヤで高精細番組(第2の送信モード)への切り替えが識別される。その後、基本ストリームに挿入されているSEIメッセージ(Enhancement scalability SEI message)の「enhancement_scalability_type」が“01”となってビデオレイヤで高精細番組(第2の送信モード)への切り替えが識別される。この識別タイミング(「Ta」で図示)で、従来番組(第2の送信モード)から高精細番組(第1の送信モード)に受信処理が切り替えられる。
一方、高精細番組(第1の送信モード)から従来番組(第2の送信モード)への受信処理の切り替えの場合、まず、スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)の非存在によりトランスポートストリームTSのレイヤで従来番組(第2の送信モード)への切り替えが識別される。その後、基本ストリームに挿入されているSEIメッセージ(Enhancement scalability SEI message)の「enhancement_scalability_type」が“00”となってビデオレイヤで従来番組(第2の送信モード)への切り替えが識別される。この識別タイミング(「Tb」で図示)で、高精細番組(第1の送信モード)から従来番組(第2の送信モード)に受信処理が切り替えられる。
図30は、受信処理の切り替え制御の一例を示している。この例は、第1の送信モードにおいては、基本ビデオストリームと2つの拡張ビデオストリームとが3つのビデオエレメンタリストリームに挿入されて供給されるものである。この場合、基本ビデオストリームには最下位階層(第1階層)の画像データ(HD画像データ)が含まれている。また、第1の拡張ビデオストリームには第2階層の画像データ(高周波成分)が含まれており、第2の拡張ビデオストリームには第3階層の画像データ(高周波成分)が含まれている。なお、第2の送信モードにおいては、基本ビデオストリームが挿入された1つのビデオストリームが供給されるものである。
トランスポートストリームTSのレイヤに挿入されているマルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)の「number_of_video_streams」は、高精細番組(第1の送信モード)の期間では“011”とされ、ビデオエレメンタリストリームの個数が3つであることが示される。一方、この「number_of_video_streams」は、従来番組(第2の送信モード)の期間では“001”とされ、ビデオエレメンタリストリームの個数が1つであることが示される。
また、高精細番組(第1の送信モード)でトランスポートストリームTSのレイヤに挿入されるスケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)の「scalable_enhancement_type」は、“01”とされ、空間解像度スケーラビリティあることが示される。また、このデスクリプタの「stream_delivery_type」は、“0”とされ、基本および拡張のデオストリームが複数のビデオエレメンタリストリームで供給されることが示される。
基本ストリームには、SEIメッセージ(Enhancement scalability SEI message)が挿入されている。高精細番組(第1の送信モード)の期間、このSEIメッセージに含まれる「enhancement_scalability_type」は空間解像度スケーラビリティあることを示す“01”であり、高精細番組(第1の送信モード)であることの識別も可能とされる。一方、従来番組(第2の送信モード)の期間、「enhancement_scalability_type」は“00”であり、従来番組(第2の送信モード)の期間であることが識別可能とされる。
詳細説明は、省略するが、この図30に示す例においても、上述の図29に示す例と同様に、トランスポートストリームTSのレイヤでの番組切り替えの識別と、その後のビデオレイヤでの番組切り替わり識別に基づいて、受信機200における受信処理の切り替え制御が行われる。
上述したように、図1に示す画像送受信システム10においては、第1の送信モードでは、スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよびスケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを送信し、第2の送信モードでは、基本画像データを含む基本ビデオストリームのみを送信するものである。そして、第1のモードおよび第2のモードを識別するための識別情報(「EHF」、「BCF」)をビデオストリームに挿入するものである。
そのため、受信側では、この識別情報に基づいて、第1の送信モードであるか第2の送信モードであるかを容易に把握でき、ストリーム構成の変化、つまり、配信内容の動的な変化に的確に対応でき、正しいストリーム受信を行うことが可能となる。つまり、従来画像の画像データと、空間的あるいは時間的な超高解像度画像の画像データ(スケーラブル符号化画像データ)とが時分割的に送信される場合に、受信側において、処理の切り替えを良好に行うことができる。
<2.変形例>
なお、上述実施の形態においては、コンテナがトランスポートストリーム(MPEG−2 TS)である例を示した。しかし、本技術は、インターネット等のネットワークを利用して受信端末に配信される構成のシステムにも同様に適用できる。インターネットの配信では、MP4やそれ以外のフォーマットのコンテナで配信されることが多い。つまり、コンテナとしては、デジタル放送規格で採用されているトランスポートストリーム(MPEG−2 TS)、インターネット配信で使用されているMP4などの種々のフォーマットのコンテナが該当する。
また、本技術は、以下のような構成を取ることもできる。
(1)1つまたは複数のビデオストリームを送信する送信部と、
スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよび上記スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを送信する第1の送信モードと、基本画像データを含む基本ビデオストリームのみを送信する第2の送信モードとを識別するための識別情報を、上記ビデオストリームに挿入する識別情報挿入部とを備える
送信装置。
(2)上記識別情報挿入部は、
上記第1の送信モードでは、上記ビデオストリームに、該第1の送信モードであることを示す識別情報を挿入し、上記第2の送信モードでは、上記ビデオストリームに、上記識別情報を挿入しない
前記(1)に記載の送信装置。
(3)上記識別情報挿入部は、
上記第1の送信モードでは、上記ビデオストリームに、該第1の送信モードであることを示す識別情報を挿入し、上記第2の送信モードでは、上記ビデオストリームに、該第2の送信モードであることを示す識別情報を挿入する
前記(1)に記載の送信装置。
(4)上記識別情報挿入部は、
上記第1の送信モードでは、上記ビデオストリームに、上記識別情報を挿入せず、上記第2の送信モードでは、上記ビデオストリームに、該第2の送信モードであることを示す識別情報を挿入する
前記(1)に記載の送信装置。
(5)上記識別情報挿入部は、
上記基本ビデオストリームに、上記識別情報を、少なくとも、番組単位、シーン単位、ピクチャグループ単位、あるいはピクチャ単位で挿入する
前記(1)から(4)のいずれかに記載の送信装置。
(6)上記送信部は、
上記第1の送信モードでは、上記基本ビデオストリームと上記所定数の拡張ビデオストリームを、1つまたは複数のビデオエレメンタリストリームに挿入して送信する
前記(1)から(5)のいずれかに記載の送信装置。
(7)上記基本ビデオストリームと上記所定数の拡張ビデオストリームを1つのビデオエレメンタリストリームに挿入して送信する場合、各ビデオストリームの間にストリーム境界を示す情報が配置される
前記(6)に記載の送信装置。
(8)上記識別情報には、上記第1の送信モードを示す場合、上記拡張ビデオストリームの個数を示す情報が含まれている
前記(1)から(7)のいずれかに記載の送信装置。
(9)上記識別情報には、上記第1の送信モードを示す場合、スケーラビリティ拡張のタイプを示す情報が含まれている
前記(1)から(8)のいずれかに記載の送信装置。
(10)上記識別情報には、上記第1の送信モードを示す場合、スケーラビリティ拡張における上位階層との合成の際のスケーリング比の情報が含まれている
前記(1)から(9)のいずれかに記載の送信装置。
(11)上記送信部は、上記1つまたは複数のビデオストリームを含む所定フォーマットのコンテナを送信し、
上記コンテナのレイヤに、上記第1の送信モードにあるか上記第2の送信モードにあるかを識別するための識別情報を挿入する識別情報挿入部をさらに備える
前記(1)から(10)のいずれかに記載の送信装置。
(12)上記識別情報には、上記第1の送信モードを示す場合、スケーラビリティ拡張のタイプを示す情報が付加されている
前記(11)に記載の送信装置。
(13)上記識別情報には、上記1つまたは複数のビデオストリームが1つのビデオエレメンタリストリームで供給されるか否かを示す情報が付加されている
前記(11)または(12)に記載の送信装置。
(14)上記識別情報には、上記第1の送信モードを示す場合、上記拡張ビデオストリームの個数を示す情報が付加されている
前記(11)から(13)のいずれかに記載の送信装置。
(15)上記送信部は、上記1つまたは複数のビデオストリームを含む所定フォーマットのコンテナを送信し、
上記コンテナのレイヤに、上記1つまたは複数のビデオストリームを挿入するビデオエレメンタリストリームの個数を識別するための識別情報を挿入する識別情報挿入部をさらに備える
前記(1)から(14)のいずれかに記載の送信装置。
(16)1つまたは複数のビデオストリームを送信するステップと、
スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよび上記スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを送信する第1の送信モードと、基本画像データを含む基本ビデオストリームのみを送信する第2の送信モードとを識別するための識別情報を、上記基本ビデオストリームに挿入するステップとを備える
送信方法。
(17)1つまたは複数のビデオストリームを受信する受信部と、
上記ビデオストリームに挿入されている識別情報に基づいて、スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよび上記スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを送信する第1の送信モードであるか、基本画像データを含む基本ビデオストリームのみを送信する第2の送信モードであるかを識別する送信モード識別部と、
上記受信されたビデオストリームに対して、上記モード識別結果に基づき、各モードに応じた処理を行って、画像表示のための画像データを得る処理部とを備える
受信装置。
(18)上記受信部は、上記ビデオストリームを含む所定フォーマットのコンテナを受信し、
上記コンテナのレイヤには、上記第1の送信モードにあるか上記第2の送信モードにあるかを識別するための識別情報が挿入されており、
上記送信モード識別部は、上記コンテナのレイヤに挿入されている識別情報および上記ビデオストリームに挿入されている識別情報に基づいて、上記第1の送信モードにあるか上記第2の送信モードにあるかを識別する
前記(17)に記載の受信装置。
(19)1つまたは複数のビデオストリームを受信するステップと、
上記ビデオストリームに挿入されている識別情報に基づいて、スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよび上記スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを送信する第1の送信モードであるか、基本画像データを含む基本ビデオストリームのみを送信する第2の送信モードであるかを識別するステップと、
上記受信されたビデオストリームに対して、上記モード識別結果に基づき、各モードに応じた処理を行って、画像表示のための画像データを得るステップとを備える
受信方法。
本技術の主な特徴は、超高解像度画像(基本ストリームと拡張ストリーム)と従来画像(基本ストリーム)とを時分割的に送信する際に、ビデオストリームに送信モード識別情報(EHF,BCF)を挿入することで、受信側で,ストリーム構成の変化、つまり、配信内容の動的な変化に的確に対応でき、正しいストリーム受信を行うことを可能にしたことである(図13参照)。
10・・・画像送受信システム
100・・・放送局
110・・・送信データ生成部
111・・・画像データ出力部
112・・・ビデオエンコーダ
113・・・グラフィクスデータ出力部
114・・・グラフィクスエンコーダ
115・・・音声データ出力部
116・・・オーディオエンコーダ
117・・・マルチプレクサ
200・・・受信機
201・・・CPU
211・・・アンテナ端子
212・・・デジタルチューナ
213・・・トランスポートストリームバッファ(TSバッファ)
214・・・デマルチプレクサ
215・・・コーデッドバッファ
216・・・ビデオデコーダ
217・・・基本ストリームデコーデッドバッファ
218・・・拡張ストリームデコーデッドバッファ
219・・・合成処理部
220・・・ビデオRAM
221・・・解像度アップ処理部
222・・・重畳部
231・・・コーデッドバッファ
232・・・グラフィクスデコーダ
233・・・ピクセルバッファ
234・・・スケーラ
241・・・コーデッドバッファ
242・・・オーディオデコーダ
243・・・チャネルミキシング部

Claims (3)

  1. 第1のフレームレートの画像データで構成される基本ビデオストリームと、前記基本ビデオストリームと合成して前記第1のフレームレートよりも周波数の高い第2のフレームレートの画像データが得られる拡張ビデオストリームとからなる第1の期間と、前記第1のフレームレートの画像データで構成される基本ビデオストリームのみからなる第2の期間を切り替えて得られるビデオストリームを含む所定フォーマットのコンテナを受信する受信部を備え、
    前記第1の期間の基本ビデオストリームと前記第2の期間の基本ビデオストリームには同じPIDが設定され、
    前記第1の期間の拡張ビデオストリームには前記第2の期間の基本ビデオストリームとは別のPIDが設定され、
    前記コンテナのレイヤに、前記第1の期間の基本ビデオストリームと拡張ビデオストリームのそれぞれについて、時間方向スケーラビリティのストリームであることを示す識別情報を含むデスクリプタが挿入されており、
    前記受信されたコンテナに含まれるビデオストリームに対して、前記PIDおよび前記デスクリプタに基づいて前記第1の期間の処理を行って、画像表示のための画像データを得る処理部をさらに備える
    受信装置。
  2. 前記第1のフレームレートは60Hzであり、前記第2のフレームレートは120Hzである
    請求項1に記載の受信装置。
  3. 受信部が、第1のフレームレートの画像データで構成される基本ビデオストリームと、前記基本ビデオストリームと合成して前記第1のフレームレートよりも周波数の高い第2のフレームレートの画像データが得られる拡張ビデオストリームとからなる第1の期間と、前記第1のフレームレートの画像データで構成される基本ビデオストリームのみからなる第2の期間を切り替えて得られるビデオストリームを含む所定フォーマットのコンテナを受信する受信ステップを有し、
    前記第1の期間の基本ビデオストリームと前記第2の期間の基本ビデオストリームには同じPIDが設定され、
    前記第1の期間の拡張ビデオストリームには前記第2の期間の基本ビデオストリームとは別のPIDが設定され、
    前記コンテナのレイヤに、前記第1の期間の基本ビデオストリームと拡張ビデオストリームのそれぞれについて、時間方向スケーラビリティのストリームであることを示す識別情報を含むデスクリプタが挿入されており、
    処理部が、前記受信されたコンテナに含まれるビデオストリームに対して、前記PIDおよび前記デスクリプタに基づいて前記第1の期間の処理を行って、画像表示のための画像データを得る処理ステップをさらに有する
    受信方法。
JP2018164875A 2012-08-27 2018-09-03 受信装置および受信方法 Expired - Fee Related JP6567747B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012187073 2012-08-27
JP2012187073 2012-08-27

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016138975A Division JP6397855B2 (ja) 2012-08-27 2016-07-13 送信装置、送信方法、受信装置および受信方法

Publications (2)

Publication Number Publication Date
JP2018186583A JP2018186583A (ja) 2018-11-22
JP6567747B2 true JP6567747B2 (ja) 2019-08-28

Family

ID=50183278

Family Applications (5)

Application Number Title Priority Date Filing Date
JP2014532931A Active JP6003992B2 (ja) 2012-08-27 2013-08-19 受信装置および受信方法
JP2016138835A Active JP6004132B1 (ja) 2012-08-27 2016-07-13 送信装置および送信方法
JP2016138975A Expired - Fee Related JP6397855B2 (ja) 2012-08-27 2016-07-13 送信装置、送信方法、受信装置および受信方法
JP2016138961A Active JP6004133B1 (ja) 2012-08-27 2016-07-13 送受信システムおよび送受信方法
JP2018164875A Expired - Fee Related JP6567747B2 (ja) 2012-08-27 2018-09-03 受信装置および受信方法

Family Applications Before (4)

Application Number Title Priority Date Filing Date
JP2014532931A Active JP6003992B2 (ja) 2012-08-27 2013-08-19 受信装置および受信方法
JP2016138835A Active JP6004132B1 (ja) 2012-08-27 2016-07-13 送信装置および送信方法
JP2016138975A Expired - Fee Related JP6397855B2 (ja) 2012-08-27 2016-07-13 送信装置、送信方法、受信装置および受信方法
JP2016138961A Active JP6004133B1 (ja) 2012-08-27 2016-07-13 送受信システムおよび送受信方法

Country Status (7)

Country Link
US (1) US9525895B2 (ja)
EP (1) EP2890139A4 (ja)
JP (5) JP6003992B2 (ja)
CN (1) CN104584562B (ja)
BR (1) BR112015003707A2 (ja)
RU (1) RU2015105986A (ja)
WO (1) WO2014034463A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5836424B2 (ja) * 2014-04-14 2015-12-24 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US11134254B2 (en) * 2014-04-25 2021-09-28 Sony Corporation Transmission apparatus, transmission method, reception apparatus, and reception method
WO2016006970A1 (ko) 2014-07-11 2016-01-14 엘지전자 주식회사 방송 신호 송수신 방법 및 장치
US10582269B2 (en) * 2014-07-11 2020-03-03 Lg Electronics Inc. Method and device for transmitting and receiving broadcast signal
WO2016017961A1 (ko) 2014-07-29 2016-02-04 엘지전자 주식회사 방송 신호 송수신 방법 및 장치
EP3177025A4 (en) * 2014-07-31 2018-01-10 Sony Corporation Transmission apparatus, transmission method, reception apparatus and reception method
PL3179729T3 (pl) * 2014-08-07 2021-12-20 Sony Group Corporation Urządzenie nadawcze, sposób nadawania i urządzenie odbiorcze
JP6301816B2 (ja) * 2014-11-17 2018-03-28 株式会社東芝 送信装置及び送受信システム
JP6448386B2 (ja) * 2015-01-21 2019-01-09 キヤノン株式会社 符号化装置、復号化装置及び映像送受信システム
MX2017011816A (es) * 2015-03-24 2017-12-07 Sony Corp Dispositivo de transmision, metodo de transmision, dispositivo de recepcion y metodo de recepcion.
JP6671120B2 (ja) * 2015-08-03 2020-03-25 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US10567702B2 (en) * 2015-09-30 2020-02-18 Sony Corporation Transmission device, transmission method, reception device, and reception method
US10200701B2 (en) * 2015-10-14 2019-02-05 Qualcomm Incorporated HDR and WCG coding architecture with SDR backwards compatibility in a single bitstream for video coding
CA3009777C (en) 2016-02-09 2024-04-16 Sony Corporation Transmission device, transmission method, reception device and reception method
JP6969541B2 (ja) * 2016-04-12 2021-11-24 ソニーグループ株式会社 送信装置および送信方法
EP3614680B1 (en) * 2017-04-17 2024-05-01 Sony Group Corporation Transmission device, transmission method, reception device, reception method, recording device, and recording method
GB2574575A (en) * 2018-04-27 2019-12-18 V Nova Int Ltd Video decoder chipset
US11196669B2 (en) * 2018-05-17 2021-12-07 At&T Intellectual Property I, L.P. Network routing of media streams based upon semantic contents
WO2022217555A1 (zh) * 2021-04-15 2022-10-20 深圳市大疆创新科技有限公司 无人机的图像传输方法、无人机及计算机可读存储介质

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060053442A1 (en) * 1995-09-18 2006-03-09 Stefan Ridderheim Apparatus and method for insertion of material in broadcasting
US5852565A (en) * 1996-01-30 1998-12-22 Demografx Temporal and resolution layering in advanced television
ATE290749T1 (de) * 1997-11-03 2005-03-15 Koninkl Philips Electronics Nv Anordnung mit einfügungsmittel zur identifizierung mittels zusatzinformation eines informationspaketstroms, der kodierte digitale daten überträgt
US6323909B1 (en) * 1998-10-28 2001-11-27 Hughes Electronics Corporation Method and apparatus for transmitting high definition television programming using a digital satellite system transport and MPEG-2 packetized elementary streams (PES)
JP2000209565A (ja) * 1999-01-19 2000-07-28 Fujitsu Ltd 画像配信方法及び画像配信システム
US6871006B1 (en) * 2000-06-30 2005-03-22 Emc Corporation Processing of MPEG encoded video for trick mode operation
US6771703B1 (en) * 2000-06-30 2004-08-03 Emc Corporation Efficient scaling of nonscalable MPEG-2 Video
US20030079222A1 (en) * 2000-10-06 2003-04-24 Boykin Patrick Oscar System and method for distributing perceptually encrypted encoded files of music and movies
US6937770B1 (en) * 2000-12-28 2005-08-30 Emc Corporation Adaptive bit rate control for rate reduction of MPEG coded video
US6968091B2 (en) * 2001-09-18 2005-11-22 Emc Corporation Insertion of noise for reduction in the number of bits for variable-length coding of (run, level) pairs
US6959116B2 (en) * 2001-09-18 2005-10-25 Emc Corporation Largest magnitude indices selection for (run, level) encoding of a block coded picture
US7715477B2 (en) * 2002-05-29 2010-05-11 Diego Garrido Classifying image areas of a video signal
JP2004186992A (ja) * 2002-12-03 2004-07-02 Victor Co Of Japan Ltd 符号化装置
US20040152479A1 (en) * 2003-01-31 2004-08-05 Rainbolt Bradley J. Data channel procedure for systems employing frequency diversity
JP4329358B2 (ja) * 2003-02-24 2009-09-09 富士通株式会社 ストリーム配信方法、及びストリーム配信システム
JP2007513565A (ja) * 2003-12-03 2007-05-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Mpeg−2システムにおいてスケーラビリティ・サポートを向上させたシステム及び方法
JP4340970B2 (ja) * 2004-07-05 2009-10-07 ソニー株式会社 記録情報生成装置および記録情報生成方法、情報再生装置および情報再生方法、記録再生装置および記録再生方法、並びに、プログラム
KR100662350B1 (ko) * 2004-08-23 2007-01-02 엘지전자 주식회사 영상 전송 장치 및 방법
WO2006100736A1 (ja) * 2005-03-18 2006-09-28 Fujitsu Limited 動画像データ編集装置、動画像データ再生装置、動画像データ編集方法及び動画像データ再生方法
JP2009508454A (ja) * 2005-09-07 2009-02-26 ヴィドヨ,インコーポレーテッド スケーラブルなビデオ符号化を用いたスケーラブルで低遅延のテレビ会議用システムおよび方法
CA2647823A1 (en) * 2006-03-27 2007-10-04 Vidyo, Inc. System and method for management of scalability information in scalable video and audio coding systems using control messages
EP1855478A1 (en) * 2006-05-09 2007-11-14 Alcatel Lucent Method for fast zapping between tv channels
WO2007148863A1 (en) * 2006-06-20 2007-12-27 Lg Electronics Inc. Digital broadcasting system and method of processing data
WO2008019524A1 (en) * 2006-07-17 2008-02-21 Thomson Licensing Method and apparatus for encoding video color enhancement data, and method and apparatus for decoding video color enhancement data
WO2008042852A2 (en) * 2006-09-29 2008-04-10 Vidyo, Inc. System and method for multipoint conferencing with scalable video coding servers and multicast
GB2441365B (en) * 2006-09-04 2009-10-07 Nds Ltd Displaying video data
KR20080114388A (ko) * 2007-06-27 2008-12-31 삼성전자주식회사 스케일러블 영상 부호화장치 및 방법과 그 영상 복호화장치및 방법
US8572670B2 (en) * 2008-02-20 2013-10-29 Nec Corporation Video distribution device, video distribution system, and video distribution method
US20090265751A1 (en) * 2008-04-22 2009-10-22 Limberg Allen Leroy Reception of ancillary 8VSB signals controlled responsive to information signaling version of broadcast standard being used
JP2009267537A (ja) 2008-04-22 2009-11-12 Toshiba Corp 階層化されたエレメンタリーストリームの多重化装置、分離装置及び多重化方法並びにプログラム
TWI471016B (zh) * 2009-05-11 2015-01-21 Mstar Semiconductor Inc 重建數位視訊資料流的方法與裝置
JP5446913B2 (ja) * 2009-06-29 2014-03-19 ソニー株式会社 立体画像データ送信装置および立体画像データ送信方法
JP2011066871A (ja) 2009-08-21 2011-03-31 Sony Corp コンテンツ伝送方法及び表示装置
JP5271211B2 (ja) 2009-09-09 2013-08-21 本田技研工業株式会社 自動二輪車用シート高調整装置
JP2011109469A (ja) * 2009-11-18 2011-06-02 Canon Inc コンテンツ受信装置及びコンテンツ受信装置の制御方法
JP5594002B2 (ja) * 2010-04-06 2014-09-24 ソニー株式会社 画像データ送信装置、画像データ送信方法および画像データ受信装置
US9118939B2 (en) * 2010-12-20 2015-08-25 Arris Technology, Inc. SVC-to-AVC rewriter with open-loop statistical multiplexer
JP6078883B2 (ja) * 2011-02-08 2017-02-15 サン パテント トラスト 多数の参照ピクチャを用いる動画像符号化方法、動画像復号方法、動画像符号化装置、および動画像復号方法
JP2012235308A (ja) 2011-04-28 2012-11-29 Sony Corp 画像データ送信装置、画像データ送信方法、画像データ受信装置および画像データ受信方法
JP6192902B2 (ja) * 2011-11-11 2017-09-06 サターン ライセンシング エルエルシーSaturn Licensing LLC 画像データ送信装置、画像データ送信方法、画像データ受信装置および画像データ受信方法
US20130125188A1 (en) * 2011-11-16 2013-05-16 General Instrument Corporation Multimedia presentation processing
US8793721B1 (en) * 2012-02-23 2014-07-29 The Directv Group, Inc. System and method for providing multiple rating versions in media programming
KR101699367B1 (ko) * 2012-05-16 2017-02-14 한국전자통신연구원 3dtv 다중화 방법 및 그 장치

Also Published As

Publication number Publication date
JP2016220217A (ja) 2016-12-22
US20150195587A1 (en) 2015-07-09
CN104584562A (zh) 2015-04-29
JP2016220218A (ja) 2016-12-22
JP6004132B1 (ja) 2016-10-05
JP6397855B2 (ja) 2018-09-26
JP6003992B2 (ja) 2016-10-05
JPWO2014034463A1 (ja) 2016-08-08
WO2014034463A1 (ja) 2014-03-06
JP2018186583A (ja) 2018-11-22
BR112015003707A2 (pt) 2017-07-04
RU2015105986A (ru) 2016-09-10
JP6004133B1 (ja) 2016-10-05
US9525895B2 (en) 2016-12-20
EP2890139A4 (en) 2016-04-06
CN104584562B (zh) 2018-10-09
JP2016195449A (ja) 2016-11-17
EP2890139A1 (en) 2015-07-01

Similar Documents

Publication Publication Date Title
JP6567747B2 (ja) 受信装置および受信方法
US11700388B2 (en) Transmission device, transmitting method, reception device, and receiving method
JP5594002B2 (ja) 画像データ送信装置、画像データ送信方法および画像データ受信装置
US20140071232A1 (en) Image data transmission device, image data transmission method, and image data reception device
US9693033B2 (en) Transmitting apparatus, transmitting method, receiving apparatus and receiving method for transmission and reception of image data for stereoscopic display using multiview configuration and container with predetermined format
WO2012147596A1 (ja) 画像データ送信装置、画像データ送信方法、画像データ受信装置および画像データ受信方法
JP5976189B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP6614281B2 (ja) 受信装置および受信方法
JP6350638B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP5976188B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP6052354B2 (ja) 送信装置、送信方法、受信装置および受信方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180920

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190520

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190731

R150 Certificate of patent or registration of utility model

Ref document number: 6567747

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees