JP2015136057A - 通信装置、通信データ生成方法、および通信データ処理方法 - Google Patents

通信装置、通信データ生成方法、および通信データ処理方法 Download PDF

Info

Publication number
JP2015136057A
JP2015136057A JP2014006879A JP2014006879A JP2015136057A JP 2015136057 A JP2015136057 A JP 2015136057A JP 2014006879 A JP2014006879 A JP 2014006879A JP 2014006879 A JP2014006879 A JP 2014006879A JP 2015136057 A JP2015136057 A JP 2015136057A
Authority
JP
Japan
Prior art keywords
data
packet
gop
media
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014006879A
Other languages
English (en)
Inventor
山岸 靖明
Yasuaki Yamagishi
靖明 山岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2014006879A priority Critical patent/JP2015136057A/ja
Priority to CA2904959A priority patent/CA2904959A1/en
Priority to MX2015012247A priority patent/MX342827B/es
Priority to US14/770,150 priority patent/US10924524B2/en
Priority to EP14878449.9A priority patent/EP3096524B1/en
Priority to PCT/JP2014/081713 priority patent/WO2015107784A1/ja
Priority to CN201480013818.5A priority patent/CN105191324B/zh
Priority to KR1020157022754A priority patent/KR102247976B1/ko
Publication of JP2015136057A publication Critical patent/JP2015136057A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23605Creation or processing of packetized elementary streams [PES]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving MPEG packets from an IP network
    • H04N21/4383Accessing a communication channel
    • H04N21/4384Accessing a communication channel involving operations to reduce the access time, e.g. fast-tuning for reducing channel switching latency
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/64Addressing
    • H04N21/6405Multicasting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/643Communication protocols
    • H04N21/64322IP
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/643Communication protocols
    • H04N21/6437Real-time Transport Protocol [RTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8543Content authoring using a description language, e.g. Multimedia and Hypermedia information coding Expert Group [MHEG], eXtensible Markup Language [XML]

Abstract

【課題】GOPを分割したデータ単位でコンテンツ配信を行い、受信装置側でGOP復元と再生を実行可能とした装置、方法を提供する。
【解決手段】送信装置が、GOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成し、サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録したパケットを生成して送信する。受信装置は、受信パケットに設定されたGOP内位置識別子を参照して複数のパケットに分割格納されたメディアデータを配列してGOPを再構築して復号する。
【選択図】図7

Description

本開示は、通信装置、通信データ生成方法、および通信データ処理方法に関する。さらに詳細には例えば放送波やネットワークを介したデータの送信または受信を実行する通信装置、通信データ生成方法、および通信データ処理方法に関する。
画像データや音声データ等のコンテンツを各通信事業者のサービス形態に関わらず配信可能としたデータ配信方式としてOTT(Over The Top)が知られている。OTTによる配信コンテンツはOTTコンテンツと呼ばれ、また、OTTを利用した画像(ビデオ)データの配信サービスはOTTビデオやOTT−V(Over The Top Video)と呼ばれる。
例えばOTT−Vに従ったデータストリーミング配信の基盤技術としてDASH(Dynamic Adaptive Streaming overHTTP)が利用される。DASHは、HTTP(HyperText Transfer Protocol)プロトコルを使用したアダプティブ(適応型)ストリーミング技術の標準規格である。
アダプティブ(適応型)ストリーミングでは、コンテンツ配信サーバは様々なクライアントで配信コンテンツの再生を可能とするため、複数のビットレートの動画コンテンツの細分化ファイルとこれらの属性情報やURLを記述したマニフェスト・ファイルを作成し保持する。
クライアントは、マニフェスト・ファイルをサーバから取得して、自装置の表示部のサイズや利用可能な通信帯域に応じた最適なビットレートコンテンツを選択し、選択コンテンツを受信して再生する。ネットワーク帯域の変動に応じてビットレートの動的な変更も可能であり、クライアント側では、状況に応じた最適なコンテンツを随時切り替えて受信することが可能となり、映像途切れの発生を低減した動画コンテンツ再生が実現される。なお、アダプティブ(適応型)ストリーミングについては、例えば特許文献1(特開2011−87103号公報)に記載がある。
MPEG(Moving Picture Expert Group)符号化された動画や音声データを上記のDASHに従ってストリーミング配信するための仕様を定めた規格としてMPEG−DASH規格がある。
MPEG−DASH規格には、以下の2つの規格が含まれる。
(a)動画や音声ファイルの管理情報であるメタデータを記述するためのマニフェスト・ファイル(MPD:Media Presentation Description)に関する規格。
(b)動画コンテンツ伝送用のファイル・フォーマット(セグメント・フォーマット)に関する規格。
MPEGデータをDASHに従ってストリーミング配信する場合は、このMPEG−DAH規格に従った処理が行われる。
しかし、アダプティブ(適応型)ストリーミング技術の標準規格であるDASHは1対1の通信処理であるポイントトゥーポイント(Point−to−point)型のHTTPストリーミング技術をベースとしている。
このため、例えばスポーツ中継等、多数のクライアントが同時に視聴する可能性のあるコンテンツ(番組)のストリーミング配信に適用する場合にはCDN(Content Delivery Network)のサポートが必要となる。
しかし、CDNを適用したポイントトゥーポイントのHTTPストリーミングを構築するにはコスト的な制約があり、放送配信に匹敵する程のスケーラビリティを実現することは困難である。上述したようにDASHはHTTPをベースのストリーミングプロトコルを利用しており、放送配信のように多数のクライアントが同時に視聴するコンテンツ配信には不向きであるという問題がある。
特開2011−87103号公報
本開示は、HTTPをベースとするストリーミングプロトコルを利用したコンテンツ配信において、同時に多数のクライアントにコンテンツを提供し、各クライアントにおいて遅延の少ないリアルタイム再生を実現する通信装置、通信データ生成方法、および通信データ処理方法を提供することを目的とする。
本開示の第1の側面は、
符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成し、
前記サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録したパケットを生成するデータ処理部と、
前記データ処理部の生成したパケットを送信する通信部を有する通信装置にある。
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、GOPの構成データであるNALユニットを1つ以上含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成する。
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、パケット格納セグメントが、メディアデータを格納しない初期化セグメントであるか、メディアデータを格納したメディアセグメントであるかを識別可能としたセグメント識別情報をパケット付加情報として記録したパケットを生成する。
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、前記サブGOPメディアセグメントの格納データであるメディアデータが、GOPの先頭位置、中間位置、末尾位置のいずれの位置の構成データであるかを識別可能としたGOP内位置識別子をパケット付加情報として生成する。
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、前記付加情報を生成パケット内のHTTPヘッダに記録する。
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、前記付加情報を生成パケット内の拡張ヘッダに記録する。
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、前記付加情報を生成パケット内のLCTヘッダに記録する。
さらに、本開示の通信装置の一実施態様において、前記通信部は、前記データ処理部の生成したパケットを、放送波を介してブロードキャスト配信、またはマルチキャスト配信する。
さらに、本開示の第2の側面は、
符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとし、
前記サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録したパケットを受信する通信部と、
前記通信部の受信したパケットを入力して処理を実行するデータ処理部を有する通信装置にある。
さらに、本開示の通信装置の一実施態様において、前記データ処理部は、受信パケットに記録されたGOP内位置識別子を参照して、複数の受信パケットに分散格納されたGOP構成データの配列を実行してGOPデータを再構築する。
さらに、本開示の通信装置の一実施態様において、前記通信部は、GOPの構成データであるNALユニットを1つ以上含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントを格納したパケットを受信し、前記データ処理部は、受信パケットからNALユニットを1つ以上含むメディアデータを取得し、受信パケットに記録されたGOP内位置識別子を参照して、複数の受信パケットに分散格納されたNALユニットの配列を実行してGOPデータを再構築する。
さらに、本開示の通信装置の一実施態様において、前記通信部は、パケット格納セグメントが、メディアデータを格納しない初期化セグメントであるか、メディアデータを格納したメディアセグメントであるかを識別可能としたセグメント識別情報をパケット付加情報として記録したパケットを受信し、前記データ処理部は、受信パケットに記録された付加情報から、前記セグメント識別情報を取得し、受信パケットに格納されたセグメントの種類を判別して、判別結果に応じた処理を実行する。
さらに、本開示の通信装置の一実施態様において、前記通信部は、前記サブGOPメディアセグメントの格納データであるメディアデータが、GOPの先頭位置、中間位置、末尾位置のいずれの位置の構成データであるかを識別可能としたGOP内位置識別子をパケット付加情報として設定したパケットを受信し、前記データ処理部は、受信パケットに記録されたGOP内位置識別子に基づいて、前記サブGOPメディアセグメントの格納データであるメディアデータが、GOPの先頭位置、中間位置、末尾位置のいずれの位置の構成データであるかを判別する。
さらに、本開示の通信装置の一実施態様において、前記通信部は、前記パケット付加情報をHTTPヘッダに記録したパケットを受信し、前記データ処理部は、受信パケットのHTTPヘッダから前記パケット付加情報を取得する。
さらに、本開示の通信装置の一実施態様において、前記通信部は、前記パケット付加情報を拡張ヘッダに記録したパケットを受信し、前記データ処理部は、受信パケットの拡張ヘッダから前記パケット付加情報を取得する。
さらに、本開示の通信装置の一実施態様において、前記通信部は、前記パケット付加情報をLCTヘッダに記録したパケットを受信し、前記データ処理部は、受信パケットのLCTヘッダから前記パケット付加情報を取得する。
さらに、本開示の通信装置の一実施態様において、前記通信部は、前記パケットを、放送波を介して受信する。
さらに、本開示の第3の側面は、
データ送信装置において実行する通信データ生成方法であり、
データ処理部が、符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成し、
前記サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録した送信パケットを生成する通信データ生成方法にある。
さらに、本開示の第4の側面は、
データ受信装置において実行する通信データ処理方法であり、
通信部が、符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとし、
前記サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録したパケットを受信し、
データ処理部が、前記通信部の受信したパケットを入力して処理を実行する通信データ処理方法にある。
本開示のさらに他の目的、特徴や利点は、後述する本開示の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
本開示の一実施例の構成によれば、GOPを分割したデータ単位でコンテンツ配信を行い、受信装置側でGOP復元と再生を実行可能とした装置、方法が実現される。
具体的には、送信装置が、GOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成し、サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録したパケットを生成して送信する。受信装置は、受信パケットに設定されたGOP内位置識別子を参照して複数のパケットに分割格納されたメディアデータを配列してGOPを再構築して復号する。
本構成により、GOPを分割したデータ単位でコンテンツ配信を行い、受信装置側でGOP復元と再生を実行可能とした装置、方法が実現される。
なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。
本開示の処理を実行する通信システムの一構成例について説明する図である。 送信装置の送信データについて説明する図である。 DASHセグメントの構成例について説明する図である。 フラグメント生成シーケンスについて説明する図である。 フラグメント内のメディアデータ(mdat)を1GOP単位のデータではなく、1GOPを細分化したデータに設定した構成例について説明する図である。 サブGOPメディアセグメントにHTTPヘッダを設定したHTTPパケットの構成例について説明する図である。 メディアセグメントHTTPパケットのHTTPヘッダの記録情報について説明する図である。 メディアセグメントHTTPパケットのHTTPヘッダの記録情報について説明する図である。 初期化セグメントHTTPパケットのHTTPヘッダの記録情報について説明する図である。 IPパケットの構成例について説明する図である。 送信装置と受信装置のプロトコルスタックについて説明する図である。 受信装置のプロトコルスタックについて説明する図である。 送信装置の実行する処理シーケンスについて説明するフローチャートを示す図である。 受信装置の実行する処理シーケンスについて説明するフローチャートを示す図である。 拡張ヘッダに付加情報を記録した実施例について説明する図である。 FLUTEプロトコルに従って設定されるLCTヘッダの構成例について説明する図である。 LCTヘッダのヘッダ拡張部に対するデータ記録構成について説明する図である。 LCTヘッダのヘッダ拡張部に記録するデータについて説明する図である。 HEVC符号化データの構成について説明する図である。 通信装置のハードウェア構成例について説明する図である。
以下、図面を参照しながら本開示の通信装置、通信データ生成方法、および通信データ処理方法の詳細について説明する。なお、説明は以下の項目に従って行なう。
1.通信システムの構成例について
2.一斉同時配信型のコンテンツ配信における問題点について
3.送信データの細分化処理構成について
4.HTTPヘッダに付加情報を記録した実施例について
5.パケットの構成について
6.送信装置と受信装置の構成と処理について
7.送信装置と受信装置の処理シーケンスについて
8.拡張ヘッダに付加情報を記録した実施例について
9.LCTヘッダに付加情報を記録した実施例について
10.HEVC符号化データに対する適用例について
11.各装置のハードウェア構成例について
12.本開示の構成のまとめ
[1.通信システムの構成例について]
まず、図1を参照して本開示の処理を実行する通信システムの一構成例について説明する。
図1に示すように、通信システム10は、画像データや音声データ等のコンテンツを送信する通信装置である送信装置20と、送信装置20の送信コンテンツを受信する通信装置である受信装置30を有する。
送信装置20は、具体的には、例えば放送局21やコンテンツサーバ22等、コンテンツを提供する側の装置である。
一方、受信装置30は、一般ユーザのクライアント装置であり、具体的には、例えばテレビ31、PC32、携帯端末33等によって構成される。
送信装置20と受信装置30間のデータ通信は、インターネット等のネットワークを介した双方向通信、あるいは、放送波等による一方向通信の少なくともいずれか、あるいは両者を利用した通信として行われる。
送信装置20から受信装置30に対するコンテンツ送信は、アダプティブ(適応型)ストリーミング技術の規格であるMPEG−DASH規格に従って実行する。
先に説明したように、MPEG−DASH規格には、以下の2つの規格が含まれる。
(a)動画や音声ファイルの管理情報であるメタデータを記述するためのマニフェスト・ファイル(MPD:Media Presentation Description)に関する規格、
(b)動画コンテンツ伝送用のファイル・フォーマット(セグメント・フォーマット)に関する規格、
送信装置20から、受信装置30に対するコンテンツ配信は、上記のMPEG−DASH規格に従って実行する。
送信装置20は、コンテンツデータを符号化し、符号化データおよび符号化データのメタデータを含むデータファイルを生成する。符号化処理は、例えばMPEGにおいて規定されるMP4ファイルフォーマットに従って行われる。なお、送信装置20がMP4形式のデータファイルを生成する場合の符号化データのファイルは「mdat」、メタデータは「moov」や「moof」等と呼ばれる。
これらの符号化データの詳細については後段で説明する。
送信装置20が受信装置30に提供するコンテンツは、例えば音楽データや、映画、テレビ番組、ビデオ、写真、文書、絵画および図表などの映像データや、ゲームおよびソフトウェアなど、様々なデータである。
送信装置20の送信データについて図2を参照して説明する。
MPEG−DASH規格に従ってデータ送信を実行する送信装置20は、図2に示すように、初期化セグメント(Initialization Segment)50と、メディアセグメント(Media Segment)60を、それぞれパケットに格納して受信装置30に送信する。これらの各セグメントはDASHセグメントと呼ばれる。
メディアセグメント60各々はMPEG符号化されたコンテンツデータを分割して格納したセグメントである。
初期化セグメント50はメディアセグメント60の格納コンテンツを受信装置30側で再生する場合に必要となる初期設定情報、例えばコーデックの設定情報などを格納したセグメントである。
なお、送信装置20は、例えば1つの映画や番組等のコンテンツを、多数のメディアセグメント60に分割格納して順次送信する。
送信装置20は、図2に示す初期化セグメント50、メディアセグメント60をHTTPパケットに格納し、さらに、HTTPパケットを格納したIPパケットを生成して送信する。送信パケットの構成の詳細については後段で説明する。
図2に示す受信装置30は、まず、1つの初期化セグメント50を受信し、初期化セグメントに格納された設定情報に従ってコーデック等の設定処理等を実行する。続いて、メディアセグメント60を順次、受信し、再生順に従ってデコードを行なって再生処理を行なう。
[2.一斉同時配信型のコンテンツ配信における問題点について]
前述したように、アダプティブ(適応型)ストリーミング技術の標準規格であるDASHはポイントトゥーポイントのHTTPストリーミングをベースとしており、多数のクライアントが同時に視聴する一斉同時配信型コンテンツの配信には向かないという問題がある。
しかし、マルチキャストやブロードキャスト(MC/BC)を併用することで、コンテンツを同時に多数のクライアント(受信装置)に遅延なく提供することが可能であると考えられる。
マルチキャストやブロードキャスト(MC/BC)型のストリーミングに適用可能なトランスポートプロトコルには、例えばRTP(Real−time Transport Protocol)やFLUTE(File Delivery over Uni−directional Transport)がある。
図3を参照して、FLUTEプロトコルを利用してHTTPストリーミングベースのDASH規格に従ってコンテンツストリーム配信を行う場合に利用可能なDASHセグメントの構成例について説明する。
先に図2を参照して説明したように、DASHセグメントは、
(a)初期化セグメント(Initialization Segment)、
(b)メディアセグメント(Media Segment)、
これらの2種類に分けられる。
(a)初期化セグメント(Initialization Segment)は、受信装置30におけるデコーダの設定等、コンテンツ再生を実行するために必要となる設定情報等の初期化データを格納したセグメントである。
(b)メディアセグメント(Media Segment)は、再生対象となる符号化コンテンツを格納したセグメントである。
図3に示すように(a)初期化セグメントは、以下の各情報を含む。
(a1)セグメントのファイルタイプ情報等からなるヘッダ情報(dash)、
(a2)メディアセグメントによって送信する符号化コンテンツであるメディアデータ(mdat)のコーデック(符号化態様)情報等の初期化情報を含むメタデータ(moov)、
一方、(b)メディアセグメントは、図3に示すように以下の各情報を含む。
(b1)セグメントのファイルタイプ情報等からなるヘッダ情報(msdh)、
(b2)メディアセグメントに格納された複数のサブセグメント(Sub−Segment)の境界情報や、メディアセグメントに格納された符号化コンテンツであるメディアデータ(mdat)のランダムアクセスポイント等を示すアクセス情報(sidx)、
(b3)複数のサブセグメント(Sub−Segment)70、
また、複数のサブセグメント(Sub−Segment)70は1つまたは複数のフラグメント(Fragment)80で構成される。
フラグメント(Fragment)80は、以下の各データを含む。
再生対象となる符号化コンテンツであるメディアデータ(mdat)、
メディアデータ(mdat)に対応するメタデータ(moof)。
なお、(b)メディアセグメントのアクセス情報(sidx)に記録されるランダムアクセスポイントは、DASHではSAP(Stream Access Point)と呼ばれる。
SAPは、例えばストリームを復号するために必要なすべての状態をリセットすることができる画像シーケンスの先頭ピクチャの先頭バイト位置を示す。具体的には、例えばMPEGデータのIピクチャの位置等を示す情報である。
フラグメント(Fragment)80に格納するメディアデータ(mdat)対応のメタデータ(moof)には、例えばフラグメント格納メディアデータ(mdat)の再生時間情報としてのプレゼンテーションタイム等が記録される。
1つのフラグメント80に格納するメディアデータ(mdat)は、現行では、通常、DASHの制御対象となるコンテンツストリームの処理単位(チャンク)に設定される。処理単位(チャンク)とは、例えばMPEG(Moving Picture Expert Group)符号化の処理単位であるGOP(Group of Pictures)である。
なお、GOPは再生時間が約0.5〜2秒程度のデータに設定して運用している場合が多い。
しかし、1つのフラグメント80に格納するメディアデータ(mdat)を1つのGOP単位のデータとすると、データ配信や再生処理における遅延が発生し、リアルタイム再生に支障が発生する可能性がある。
例えば、ライブ中継画像を配信する場合、送信装置20は、カメラから入力するライブ画像データの符号化処理を実行してメディアセグメント60を順次生成する。メディアセグメント60の各フラグメント80に格納するメディアデータ(mdat)がGOP単位の符号化データである場合、送信装置30は、GOP単位の符号化データであるメディアデータ(mdat)を生成し、その後、生成したメディアデータ(mdat)のプレゼンテーションタイム等の属性情報を記述したメタデータ(moof)を生成することになる。
従って、このシーケンスで各データの生成を行うと、各GOP単位の符号化データのデータ範囲が決定された後でないと、そのGOPのメタデータ(moof)の生成ができない。
従って、メタデータ(moof)の生成は、メディアデータ(mdat)のデータ範囲が決定後に行うことになり、各メタデータ(moof)の生成処理は、1つのGOP単位の時間(0.5〜2秒)に相当する時間を待って行わざる得ないことになる。
メディアセグメント60を構成するフラグメント80に格納するメディアデータ(mdat)をGOP単位の符号化データとした場合のフラグメント生成シーケンスについて図4を参照して説明する。
なお、図4に示す例は、メディアセグメント60に格納するメディアデータ(mdat)をMPEGにおいて規定されるMP4ファイルフォーマット(符号化形式)に従って格納する場合のシーケンス例である。
MP4ファイルフォーマットのデータ部は、基本格納単位としてのサンプル(sample)に区分される。さらに各サンプル(sample)は、1以上のNALユニットによって構成される。NALユニットは、MPEG符号化データの例えばスライス単位の細分化データである。
図4(a)に示すように複数の1つのGOPに対応する符号化データは複数のNALユニットによって構成される。
図4には、
上段に(a)GOPを構成するNALユニット
下段に(b)フラグメント生成処理シーケンス
これらを示している。
(b)フラグメント生成処理シーケンスの最下段には時間軸を示している。左から右に時間が経過し、送信装置20は、この時間軸に従って、各処理を実行してフラグメントを生成する。
なお、送信装置は、生成したフラグメントを格納したメディアセグメントを生成し、その後、メディアセグメントを格納したHTTPパケットを生成し、さらにHTTPパケットを格納したIPパケットを生成した後、IPパケットの送信を行う。
図4(b)に示すフラグメント生成処理シーケンスについて説明する。
送信装置20は、以下のシーケンスでMP4ファイルフォーマットに従った符号化データを格納したフラグメントを生成する。
時間t0〜t1:GOPを構成する複数のNALユニットを格納したサンプル1(sample1)を生成、
時間t2〜t3:GOPを構成する複数のNALユニットを格納したサンプル2(sample2)を生成、
時間t4〜t5:GOPを構成する複数のNALユニットを格納したサンプル3(sample3)を生成、
ここまでで、1GOPを構成する全てのNALユニットを格納したサンプルの生成が完了する。
これらのサンプル1〜3(sample1〜3)がメディアセグメントのフラグメント内のメディアデータ(mdat)として設定されることになる。
時間t6〜t7:サンプル1〜3(sample1〜3)に格納したGOP符号化データの属性情報であるメタデータ(moof)を生成する。
時間t8〜t9:サンプル1〜3(sample1〜3)によって構成されるメディアデータ(mdat)と、サンプル1〜3(sample1〜3)のメタデータ(moof)を組み合わせたフラグメントを生成する。
送信装置20は、その後、上述した処理に従って生成したフラグメントを含むメディアセグメントを生成し、メディアセグメントをペイロードとして含むパケットを生成して受信装置30に送信することになる。
送信装置20は、フラグメントを生成する場合、フラグメントに格納するGOP単位のメディアデータ(mdat)の再生時間等を確認し、その再生時間に応じたプレゼンテータションタイム等、GOPデータ単位の属性情報を生成して、メタデータ(moof)に記録する必要がある。
現在、データ配信される画像データは主にハイビジョン対応の画像データであるが、今後、さらに高画質化が進み、例えば4K画像等、データ量の多いデータ配信が増加すると予想される。このような大容量のデータ配信に対応するためストリームのビットレートが大きくなる可能性がある。
高画質化によるデータ量の増大に従って各GOP単位のデータ量も増大する。従って、図4を参照して説明したように1つのGOP単位のフラグメントを順次、生成して送信する構成とすると、送信側での処理間隔が長くなる。また、送信データの単位当たりデータ量も大きくなる。従って、十分な通信帯域が確保できない場合、ネットワーク送信における送信遅延の発生可能性が増加する。
また、受信装置側でのパケット受信間隔が長くなり、1パケットあたりのデータ受信量が増加し、受信装置側に要求されるデータバッファ量も増加する。また、パケットの受信エラーが発生した場合の再送処理を行なうと、遅延量が急激に大きくなり、リアルタイム再生が破たんする可能性が高くなる。
[3.送信データの細分化処理構成について]
上記の問題を解決するため、送信装置20から受信装置30に対する送信データを細分化し、1つの送信パケット、すなわち一単位あたりの送信データ量を削減した構成例について、以下説明する。
図4を参照したフラグメント生成シーケンスにおいては、フラグメントに設定するメディアデータ(mdat)を1GOP単位のデータとし、この1GOP単位のメディアデータ(mdat)に対応するメタデータ(moof)を生成する構成としていた。すなわち、各メタデータ(moof)を、1GOP単位のメディアデータ(mdat)に対応したメタデータとしていた。
図4に示すシーケンスでは、メタデータ(moof)の生成タイミングは、1つのGOPのデータ量に応じて決定されてしまう。従って1GOPに含まれるデータ量が多くなると、メタデータ(moof)の生成タイミングも遅れ、その結果、フラグメントの生成処理、メディアセグメントの生成処理、送信パケットの生成処理にも遅れが発生する。また、この結果1パケット当たりのデータ量が増加し、配信遅延の可能性を高めてしまうことになる。
このような事態を防止する構成として、フラグメント内のメディアデータ(mdat)を1GOP単位のデータではなく、1GOPを細分化したデータに設定した構成例について、図5を参照して説明する
図5には、フラグメントに格納するメディアデータ(mdat)を1つのGOPデータではなく、1つのGOPデータを細分化したデータ、具体的には1つのGOPの構成データである1つのNALユニットまたは複数のNALユニットとした例を示している。
図5(a)は、図4(a)と同様、GOPを構成するNALユニットを示している。
図5(b1)〜(b3)は、この1つのGOPの構成データであるNALユニットをメディアデータ(mdat)として分散させて格納した複数のメディアセグメントである。
図5(b1)〜(b3)に示すようにGOPデータを細分化データである1以上のNALユニットから構成されるメディアデータ(mdat)を格納したメディアセグメントを、以下、サブGOPメディアセグメントと呼ぶ。
図5には、1つのGOPデータを3つのサブGOPメディアセグメントに格納した例を示しているが、1つのGOPデータを格納するためのサブGOPメディアセグメントの数は、2以上の任意数に設定可能である。
また、図5(b1)〜(b3)のサブGOPメディアセグメントは、いずれもメディアデータ(mdat)を複数のNALユニットに設定した例としているが、メディアデータ(mdat)を1つのNALユニットのみの設定としてもよい。
送信装置20は、図5(b1)〜(b3)に示すサブGOPメディアセグメントを生成し、生成したサブGOPメディアセグメントの各々を、それぞれ個別のHTTPパケットのペイロードに設定してネットワークや放送波を介して送信する。
図5(b1)〜(b3)のサブGOPメディアセグメントに格納するメタデータ(moof)は、個々のサブGOPメディアセグメントに格納するメディアデータ(mdat)に対応した属性情報からなるメタデータとする。
このような設定とすることで、ネットワークや放送波を介して送信される1つのパケットのデータ量が小さくなり、送信装置側の1つのパケット生成処理に要する時間が短縮される。またパケット遅延の可能性も低減し、パケットロス等の際の再送処理遅延も小さくなる。結果として、受信装置30におけるエラーのないリアルタイム再生が実現される。
サブGOPメディアセグメントにHTTPヘッダを設定したHTTPパケットの構成例について、図6を参照して説明する。
図6には2つのHTTPパケット構成例を示している。
図6の(a)と(b)に示すパケットの差異は、ランダムアクセス情報等を格納する[sidx]を有するか否かである。
sidxは、先に図3を参照して説明したように、メディアセグメントに格納された複数のサブセグメント(Sub−Segment)の境界情報や、メディアセグメントに格納された符号化コンテンツであるメディアデータ(mdat)のランダムアクセスポイント等を示すアクセス情報である。DASHではアクセス情報はSAP(Stream Access Point)と呼ばれる。SAPは、例えばストリームを復号するために必要なすべての状態をリセットすることができる画像シーケンスの先頭ピクチャの先頭バイト位置を示す。具体的には、例えばMPEGデータのIピクチャ位置に相当する。
図6(b)に示すHTTPパケットは、sidxを含まないパケットである。図6(b)に示すHTTPパケットは、このパケットに格納されたメディアデータ(mdat)にアクセスポイントとなるピクチャデータを含まない。
パケット格納メディアデータ(mdat)にアクセスポイントとなるデータを含まない場合、アクセスポイントを示すデータも不要となる。従って図6(b)に示すHTTPパケットにはsidxが設定されていない。
一方、アクセスポイントとなるデータを含むメディアデータ(mdat)を格納したサブGOPメディアセグメントを有するパケットには、図6(a)に示すようにsidxが設定される。
図5〜図6を参照して説明したように、本実施例では、1つのGOP構成データを複数のパケットに分割して送信する。
受信装置30は、これらの複数のパケットを順次、受信し、各パケットに分割して格納されたGOP構成データを取得する。GOP単位の復号処理を行なう場合は、複数のパケットに格納されたGOP構成データを全て集めて、GOPの構成データ(NALユニット)を正しい順序に並べてGOPデータを再構成することが必要となる。
以下、GOP再構成処理に適用する情報等、受信装置側における処理をスムーズに実行させるための付加情報の設定例について説明する。
[4.HTTPヘッダに付加情報を記録した実施例について]
まず、GOP再構成処理に適用する情報等、受信装置側における処理をスムーズに実行させるための付加情報をHTTPパケットのHTTPヘッダに記録した実施例について説明する。
図7、図8を参照してHTTPヘッダの記録情報について説明する。
図7には、先に図5を参照して説明したと同様、1つのGOPデータを3つのサブGOPメディアセグメントに分割格納したHTTPパケットの構成例を示している。
これら3つのHTTPパケットのHTTPヘッダに、図7に示すように、
(1)セグメント識別子(Content−Location)
(2)GOP内位識別情報(X−(Start/Middle/End)ofGOP)
これらの2つの識別情報を記録する。
(1)セグメント識別子は、そのHTTPパケットに格納されたセグメントのコンテンツ位置情報と、セグメントの種類とパケットに格納されたメディアデータ(mdat)の属するGOPの識別情報を含むデータである。なお、具体的にはGOPデータの位置情報(URL等のアクセス情報)を記録すればよい。
パケットを受信する受信装置30は、同一のセグメント識別子(Content−Location)が記録されたHTTPパケットは同じGOPに属するメディアデータ(mdat)を格納したHTTPパケットであると判定することができる。
(2)GOP内位識別情報は、HTTPパケットに格納されたメディアデータ(mdat)が1つのGOPのどの位置にあるかを示すデータである。
GOP内位識別情報=X−StartofGOPであるパケットは、GOPデータの先頭領域のNALユニットをメディアデータ(mdat)として格納したパケットである。
GOP内位識別情報=X−MiddleofGOPであるパケットは、GOPデータの中間領域のNALユニットをメディアデータ(mdat)として格納したパケットである。
GOP内位識別情報=X−EndofGOPであるパケットは、GOPデータの末尾領域のNALユニットをメディアデータ(mdat)として格納したパケットである。
なお、1つのGOPデータが、4つ以上のサブGOPメディアセグメントに分割された場合、GOP内位識別情報=X−MiddleofGOPを設定した複数のパケットが生成されることになる。これらのパケットに格納されるメディアデータ(mdat)のGOPデータ内配列は、HTTPヘッダ以外のパケットヘッダ情報によって判別できる。
例えばHTTPパケットを格納するLCTパケットのLCTヘッダに記録されるパケットシーケンス番号を参照することで判別可能である。なお、具体的な送信パケットの構成、およびLCTヘッダ構成については、後述する。
従って、例えばHTTPパケットをLCTパケットに格納して送信する構成では、HTTPヘッダに設定するGOP内位置識別情報は、GOP位置が先頭領域のデータを格納したパケットのみを識別する設定としてもよい。すなわち、GOP内位識別情報=X−StartofGOPのみを記録し、この後に続くGOPデータは、LCTヘッダのシーケンス番号を参照して配列する構成としてもよい。
図8に、メディアセグメントを格納したHTTPパケットのHTTPヘッダのデータ構成例を示す。
図8に示すようにHTTPヘッダには、例えば以下のHTTPヘッダ情報が記録される。
「・・・
HTTP/1.1 206 Partial Content
Date: Fri, 04 Oct 2013 11:14:20 GMT
Content−type: application/mp4
Content−Location: http://a.com/x.mp4
X−StartOfGOP
・・・」
上記のHTTPヘッダ情報中、
セグメント識別子は、
「Content−Location:http://a.com/x.mp4」
である。
このセグメント識別子は、HTTPパケットに格納されたメディアデータ(mdat)の属するGOPの識別情報を含むものとなる。具体的にはそのGOPデータの位置情報(アクセス情報)である。
同一のセグメント識別子(Content−Location)が記録されたHTTPパケットは同じGOPに属するメディアデータ(mdat)を格納したHTTPパケットであると判定することができる。
また、上記HTTPヘッダ情報中、
GOP内位識別情報は、
「X−StartOfGOP」
である。このGOP内位識別情報は、HTTPパケットに格納されたメディアデータ(mdat)が1つのGOPのどの位置にあるかを示すデータである。
HTTPパケットに格納されたメディアデータ(mdat)が1つのGOPの、
先頭領域の場合は、「X−StartOfGOP」、
中間領域の場合は、「X−MiddleOfGOP」、
末尾領域の場合は、「X−EndOfGOP」、
HTTPヘッダにはこれらのいずれかのデータがGOP内位識別情報として記録される。
次に、初期化セグメントを格納するHTTPパケットのHTTPヘッダの記録情報について図9を参照して説明する。
初期化セグメントを格納するHTTPパケットのHTTPヘッダには、HTTPパケットが初期化セグメントを格納したパケットであることを示すセグメント識別情報を記録する。
図9に、初期化セグメントを格納したHTTPパケットのHTTPヘッダのデータ構成例を示す。
図9に示すようにHTTPヘッダには、例えば以下のHTTPヘッダ情報が記録される。
「・・・
HTTP/1.1 206 Partial Content
Date: Fri, 04 Oct 2013 11:14:20 GMT
Content−type: application/mp4
Content−Location:http://a.com/x−init.mp4」
X−InitializationSegment
・・・」
上記のHTTPヘッダ情報中、
セグメント識別子は、
「Content−Location:http://a.com/x−init.mp4」
である。
このセグメント識別子は、初期化セグメントのURL等のアクセス情報を記録すればよい。
上記のHTTPヘッダ情報中、
セグメント識別情報は、
「X−InitializationSegment」
である。
このセグメント識別情報は、HTTPパケットに格納されたセグメントが、初期化セグメントであることを示す情報である。
初期化セグメントを格納したHTTPヘッダにはこのセグメント識別情報が記録される。
[5.パケットの構成について]
次に、送信装置から受信装置に向けて送信されるパケットの構成例について説明する。
図10には以下の2つのIPパケットの構成例を示している。
(1)初期化セグメント格納IPパケット
(2)メディアセグメント格納IPパケット
(1)初期化セグメント格納IPパケットは、以下の構成を有する。
IPヘッダ
UDPヘッダ
LCTヘッダ
HTTPヘッダ
初期化セグメント構成データ[dash]
初期化セグメント構成データ[moov]
IPヘッダ、UDPヘッダ、LCTヘッダ、HTTPヘッダは、それぞれIPプロトコル、UDPプロトコル、FLUTEプロトコル、HTTPプロトコルの各通信プロトコルに従って設定されるヘッダ情報である。
一方、(2)メディアセグメント格納IPパケットは、以下の構成を有する。
IPヘッダ
UDPヘッダ
LCTヘッダ
HTTPヘッダ
メディアセグメント構成データ[msdh]
メディアセグメント構成データ[sidx]
メディアセグメント構成データ[moof]
メディアセグメント構成データ[mdat]
IPヘッダ、UDPヘッダ、LCTヘッダ、HTTPヘッダは、それぞれIPプロトコル、UDPプロトコル、FLUTEプロトコル、HTTPプロトコルの各通信プロトコルに従って設定されるヘッダ情報である。
なお、前述したようにメディアセグメント構成データ[sidx]は、ランダムアクセスに適用可能なメディアデータ(mdat)を有するパケットには設定されるが、それ以外のパケットには設定不要である。
送信装置20は、図10に示すIPパケットを生成して受信装置30に向けて送信する。
受信装置30は、受信装置20から受信する図10に示す各パケットを受信し、各ヘッダ情報を解析して、セグメントを取り出し、セグメント格納データに従って、初期設定やコンテンツ再生を実行する。
[6.送信装置と受信装置の構成と処理について]
次に、図11以下を参照して送信装置と受信装置の構成と処理について説明する。
まず、図11を参照して、送信装置20と受信装置30の構成とプロトコルスタックについて説明する。
図10を参照して説明したIPパケットを生成して送信する送信装置20は、図11に示すようにデータ処理部21と通信部22を有する。
データ処理部21は、送信パケットの生成処理を実行する。
具体的には、例えば前述したように符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータ(mdat)と、メディアデータ対応のメタデータ(moof)を格納したサブGOPメディアセグメントをパケット格納データとして生成する。さらに、サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子等のパケット付加情報を生成してHTTPヘッダに記録したパケットを生成する。
通信部22は、データ処理部21の生成したパケットを送信する。
通信部22は、データ処理部21の生成したパケットを、放送波、あるいはインターネット等のネットワークを介してブロードキャスト配信、またはマルチキャスト配信する。
データ処理部21と通信部22は、以下のレイヤからなるプロトコルスタックに従ってパケット生成処理を実行し、生成したパケットを送信する。以下、送信装置20のプロトコルスタックのレイヤ構成について説明する。送信装置20のプロトコルスタックは、上位レイヤから下位レイヤまで、以下に示すレイヤ構成を有する。
(1)DASH Server:DASH規格に従ったセグメント生成等の処理を実行するアプリケーションレイヤ
(2)Video/Audio/Subtitle etc:送信対象コンテンツの生成、取得を実行するアプリケーションレイヤ
(3)FragmentedMP4:MP4ファイルフォーマットに従った符号化データを生成しセグメントを生成するアプリケーションレイヤ
(4)HTTP:HTTPプロトコルに従ってHTTPヘッダを有するHTTPパケットを生成するレイヤ
(5)FLUTE/ALC(LCT):FLUTEプロトコルに従ってLCTヘッダを有するFLUTEパケットを生成するレイヤ
(6)UDP:UDPプロトコルに従ってUDPヘッダを有するUDPパケットを生成するレイヤ
(7)IP:IPプロトコルに従ってIPヘッダを有するIPパケットを生成するレイヤ
(8)PHY:IPパケット、またはIPパケットを格納したMACフレームを生成して送信する通信部等から構成される物理レイヤ
また、図10を参照して説明したIPパケットを受信する受信装置30は、図11に示すようにデータ処理部31と通信部32を有する。
通信部32は、送信装置20の送信するパケットを受信し、データ処理部31は通信部31の受信したパケットを入力して、データ処理を行なう。
データ処理部31と通信部32は、以下のレイヤからなるプロトコルスタックに従ってパケットの受信、解析を実行する。受信装置30のプロトコルスタックは、上位レイヤから下位レイヤまで、以下に示すレイヤ構成を有する。
(1)DASH Client:DASH規格に従ったセグメントの解析等の処理を実行するアプリケーションレイヤ
(2)Video/Audio/Subtitle etc:受信コンテンツの取得、再生処理等を実行するアプリケーションレイヤ
(3)FragmentedMP4:MP4ファイルフォーマットに従った符号化データの復号処理等を実行するアプリケーションレイヤ
(4)HTTP:HTTPプロトコルに従ってHTTPヘッダを有するHTTPパケットを解析するレイヤ
(5)FLUTE/ALC(LCT):FLUTEプロトコルに従ってLCTヘッダを有するFLUTEパケットを解析するレイヤ
(6)UDP:UDPプロトコルに従ってUDPヘッダを有するUDPパケットを解析するレイヤ
(7)IP:IPプロトコルに従ってIPヘッダを有するIPパケットを解析するレイヤ
(8)PHY:IPパケット、またはIPパケットを格納したMACフレームを受信する通信部等から構成される物理レイヤ
なお、送信装置20は、前述したようにIPパケットをブロードキャスト、あるいはマルチキャスト送信する際、ネットワークを介した送信、あるいは放送波を介した送信のいずれか、または、これらの双方の通信経路を利用して並列送信する処理を行なう。
受信装置30は、放送波と、インターネット等のネットワークのいずれかの通信経路、または両通信経路を介したパケット受信処理を行なう。
インターネット等のネットワークを介した送受信パケットの生成および解析は、図11に示すFLUTE/ALC(LCT)レイヤとUDPレイヤを、TCPレイヤに置き換えて行なうことが可能である。
放送波を介して受信するIPパケットと、インターネット等のネットワークを介して受信するIPパケットを適宜、切り替えて処理を行なう受信装置30のプロトコルスタックの例について、図12を参照して説明する。
図12に示す受信装置30のプロトコルスタックは、以下の2つの通信系に対応したプロトコルスタックのレイヤ構成を示している。
(1)放送系
(2)ネットワーク通信系
(1)放送系は、図11を参照して説明したレイヤ構成となっている。
(2)ネットワーク通信系は、放送系レイヤのFLUTE/ALC(LCT)レイヤと、UDPレイヤをTCPレイヤに置き換えた構成である。
TCPレイヤは、TCPヘッダを有するTCPパケットの解析を実行する。
シグナリング(Signaling)レイヤは、各通信系の切り替え制御を行うためのレイヤである。
受信装置30は、放送系とネットワーク通信系の各レイヤを、適宜切り替えて利用することで、放送波を介して受信するパケットと、インターネット等のネットワークを介して受信するパケットを選択的に利用してパケット格納コンテンツを取得して再生処理を実行することができる。
例えば、ネットワークからのパケット受信に遅延が発生した場合、放送系に切り替えて同一コンテンツに対応するパケットを、放送波を介して受信し、コンテンツ再生を継続することができる。
ネットワーク通信系、放送系のいずれの通信系を介した配信パケットにも、前述したセグメント識別子やGOP内位置識別子が記録されており、これらの識別情報を参照して、GOPデータの再構築が可能となり、エラーのない復号処理と、コンテンツ再生が実現される。
[7.送信装置と受信装置の処理シーケンスについて]
次に、図13、図14に示すフローチャートを参照して送信装置と受信装置の実行する処理シーケンスについて説明する。
まず、図13に示すフローチャートを参照して送信装置20の実行する処理シーケンスについて説明する。
図13に示すフローは、メディアセグメントを格納したIPパケットの生成と送信処理のシーケンスを説明するフローである。
この処理は、送信装置20のデータ処理部において実行する。データ処理部は、プログラム実行機能を有するCPUを備え、例えば記憶部に格納されたプログラムに従って、図13に示すフローに従った処理を実行する。
以下、各ステップの処理について、順次、説明する。
(ステップS101)
まず、送信装置のデータ処理部は、送信対象となるコンテンツの符号化処理を実行する。例えばMP4ファイルフォーマットに従った符号化処理を実行する。
(ステップS102)
次に、送信装置は、メディアセグメントのフラグメントに格納するメディアデータ(mdat)を生成する。この処理は、先に図5他を参照して説明したサブGOPメディアセグメントに格納するメディアデータ(mdat)を生成する処理である。MP4符号化データであるGOPデータの一部、すなわちGOPを構成する1つ以上のNALユニットを構成データとするメディアデータ(mdat)を生成する。
(ステップS103)
次に、送信装置は、ステップS102で生成したメディアデータ(mdat)に対応する属性情報であるメタデータ(moof)を生成する。
(ステップS104)
次に、送信装置は、ステップS102で生成したメディアデータ(mdat)と、ステップS103で生成したメタデータ(moof)を格納したフラグメントを生成する。
(ステップS105)
次に、送信装置は、ステップS104で生成したフラグメントを格納したメディアセグメントを生成する。これは、先に図5他を参照して説明したサブGOPメディアセグメントである。すなわち、GOPデータ全体ではなく、GOP構成データの一部のNALユニットをメディアデータ(mdat)として格納したメディアセグメントである。
(ステップS106〜S107)
次に、送信装置は、メディアセグメントに格納したメディアデータの属性情報である、
セグメント識別情報、
GOP内位置識別情報、
これらの識別情報を記録したHTTPヘッダを設定したHTTPパケットを生成する。
これらの識別情報は、先に図7、図8を参照して説明した識別情報である。
(ステップS108〜S109)
次に、送信装置は、HTTPパケットに対して、LCTヘッダ、UDPヘッダ、IPヘッダを設定してIPパケットを生成して送信する。送信処理は、インターネット等の通信ネットワークまたは放送波のいずれか、または両通信路を介して実行する。
図13に示すフローは、メディアセグメントを格納したパケットの生成と送信処理シーケンスを説明するフローである。初期化セグメントを格納したパケット生成に際しては、初期化セグメントの構成データの生成の後、HTTPヘッダに初期化セグメントであることを示すセグメント識別情報を記録する処理を行なうことになる。その他の処理は、ほぼ図13に示すフローに記載した手順に従って行われる。
次に、図14に示すフローチャートを参照して受信装置において実行するパケット受信からコンテンツ再生に至るまでの処理シーケンスについて説明する。
この処理は、受信装置30のデータ処理部において実行する。データ処理部は、プログラム実行機能を有するCPUを備え、例えば記憶部に格納されたプログラムに従って、図14に示すフローに従った処理を実行する。
以下、各ステップの処理について、順次、説明する。
(ステップS201)
まず、ステップS201において、受信装置は、ユーザによる再生コンテンツの指定情報を入力する。例えば予め送信装置から受信している番組表等のコンテンツ一覧リストを表示部に表示し、この表示情報に対するユーザ入力情報に基づいて再生コンテンツを決定する。
(ステップS202)
次に受信装置は、再生対象として選択された選択コンテンツに対応する初期化セグメントを含むパケットを受信して初期化セグメントを取得する。
なお、先に図9を参照して説明したように初期化セグメントを格納したHTTPパケットのHTTPヘッダには、セグメント識別情報が記録されており、この識別情報を参照することで初期化セグメントを格納したHTTPパケットであることが確認できる。
(ステップS203)
受信装置は、受信した初期化セグメントの格納データに従って受信装置の初期化処理を実行する。具体的には初期化セグメントに格納されたコーデック設定パラメータ等を取得し、取得パラメータに従ってコーデックの設定等を行う。
(ステップS204)
次に、受信装置は、ステップS201で選択した選択コンテンツに対応するメディアセグメントを格納したパケットを順次、受信する。先に図5他を参照して説明したように、各パケットは1つのGOPデータより小さい単位のデータを格納したサブGOPメディアセグメントをペイロードとして格納したパケットであり、受信装置は、このサブGOPメディアセグメント格納パケットを順次、受信する。
(ステップS205)
次に、受信装置は、サブGOPメディアセグメントHTTPパケットのHTTPヘッダから、
セグメント識別子、
GOP内位置識別情報、
これらの各識別情報を取得する。
先に、図7、図8を参照して説明したように、セグメント識別子は、そのHTTPパケットに格納されたセグメントのコンテンツ位置情報と、セグメントの種類とパケットに格納されたメディアデータ(mdat)の属するGOPの識別情報を含むデータである。
GOP内位識別情報は、HTTPパケットに格納されたメディアデータ(mdat)が1つのGOPのどの位置にあるかを示すデータである。例えば、GOP内位識別情報=X−StartofGOPであるパケットは、GOPデータの先頭領域のNALユニットをメディアデータ(mdat)として格納したパケットである。
(ステップS206)
次に、受信装置は、HTTPヘッダから取得した識別情報に従って、複数のサブGOPメディアセグメントHTTPパケットに格納されたNALユニットを再配列し、GOP単位データ再構築する。
(ステップS207〜S208)
次に、受信装置は、再構築したGOPデータに対する復号処理を実行し、復号データの再生処理を行なう。
(ステップS209)
次に、受信装置は、データ再生処理が終了したか否かを判定し、終了していない場合は、ステップS204に戻り、ステップS204以下の処理を繰り返し実行する。
ステップS209において再生処理終了と判定した場合は処理を終了する。
なお、例えばランダムアクセス再生等、特定の再生位置の画像のみを再生する場合には、サブGOPメディアセグメントにランダムアクセスポイント情報であるsidxデータの設定されたセグメントのみを処理対象として処理を実行してもよい。
この場合、GOP全体データを再配列する処理を行なうことなくランダムアクセスポイントのデータのみを選択して再生することが可能である。
[8.拡張ヘッダに付加情報を記録した実施例について]
上述した実施例では、GOP再構成処理に適用する情報等、受信装置側における処理をスムーズに実行させるための付加情報をHTTPパケットに設定した実施例について説明した。
しかし、付加情報の記録先はHTTPヘッダに限らず、様々な記録先とすることが可能である。
以下、拡張ヘッダに付加情報を記録した実施例について説明する。
図15を参照して、拡張ヘッダに付加情報を記録した実施例について説明する。
図15に示す例は、HTTPヘッダとサブGOPメディアセグメントの間に新たな拡張ヘッダを挿入し、この拡張ヘッダに付加情報を記録した例である。
図15には、
(1)初期化セグメントHTTPパケット、
(2)サブGOPメディアセグメントHTTPパケット、
これらの2種類のHTTPパケットの例を示している。
各パケットのHTTPヘッダの次に拡張ヘッダを設定している。
この拡張ヘッダに、
(a)セグメント識別情報、
(b)GOP内位置識別情報を格納する。
例えば(a)セグメント識別情報は、8ビットデータとし、初期化セグメントの場合は1を設定し、その他のセグメントの場合は0を設定する。
なお、メディアセグメントの場合、HTTPヘッダに記録されるコンテンツ位置情報(ContentLocation)をGOP単位データの位置情報に設定すれば、このコンテンツ位置情報を参照することで各GOPデータの区別が可能となる。
(b)GOP内位置識別情報は、8ビットデータとして、例えば、ビット値を以下の設定とする。
GOPの先頭位置のデータ(StartofGOP)=1
GOPの中間位置のデータ(MiddleofGOP)=2
GOPの末尾位置のデータ(EndofGOP)=3
送信装置は、このような拡張ヘッダを設定して受信装置に送信する。一方、受信装置は、この拡張ヘッダのセグメント識別情報を参照して、パケットに格納されたセグメントが初期化セグメントであるか、サブGOPメディアセグメントであるかを判別する。さらに、受信装置は、パケットがサブGOPメディアセグメントパケットであると識別した場合、拡張ヘッダのGOP内位置識別情報を参照することで、サブGOPメディアセグメントに格納されたメディアデータ(mdat)がGOP内のとの位置に対応するデータであるかを識別することが可能となる。
[9.LCTヘッダに付加情報を記録した実施例について]
前述したように、マルチキャストやブロードキャスト(MC/BC)型のストリーミングに適用可能なトランスポートプロトコルには、例えばRTP(Real−time Transport Protocol)やFLUTE(File Delivery over Uni−directional Transport)がある。
FLUTEプロトコルに従って設定されるパケットには、FLUTEプロトコルに従ったヘッダ情報であるLCTヘッダが設定される。
すなわち、先に図10を参照して説明したIPパケット内のLCTヘッダである。
以下、このLCTヘッダに、GOP再構成処理に適用する情報等、受信装置側における処理をスムーズに実行させるための付加情報を記録した実施例について説明する。
FLUTEプロトコルに従って設定されるLCTヘッダの構成例を図16に示す。
LCTヘッダに設定される主なデータフィールドには、例えば以下のフィールドがある。
CCI(Congestion Control Information):各フィールドの長さや輻輳制御情報等を記録するフィールドである。
TSI(Transport Session Identifier):パケット転送のセッション情報を記録するフィールドである。
TOI(Transport Object Identifier):パケット転送のシーケンス等を記録するフィールドである。
ヘッダ拡張部(Header Extensions):様々な拡張データを記録することができるフィールドである。
先に、図7を参照して説明したように、GOP内位置情報の代用として、上記のTOIを参照して、データ送信順を確認することが可能である。
前述したように、例えばHTTPヘッダ等に記録する付加情報であるGOP内位置情報について、先頭位置を示すX−StartofGOPのみを記録し、その他のGOP内データの配列順は、LCTヘッダ内のTOIを参照してパケットシーケンスを取得し、パケットシーケンスに従ってGOP内のNALユニットを正しい順に配列する構成としてもよい。
図16に示すように、LCTヘッダ内には様々なデータを記録できるヘッダ拡張部(Header Extensions)が設定される。このヘッダ拡張部にGOP再構成処理に適用する情報等、受信装置側における処理をスムーズに実行させるための付加情報を記録することが可能である。
LCTヘッダのヘッダ拡張部に対するデータ記録構成について、図17を参照して説明する。
LCTヘッダのヘッダ拡張部に、データを記録する場合のフォーマットには2つの種類がある。
図17(1)は、記録情報の長さが自由に設定可能なフォーマットである。
図17(2)は、記録情報の長さが固定されたフォーマットである。
HET(Header Extension Type)には、拡張ヘッダの種類を示す拡張ヘッダ識別情報(数値)を記録する。図17(1)のフォーマットは127までの値が利用可能であり、図17(2)のフォーマットは128以上に設定することが規定されている。
HET(Header Extension Length)には、拡張ヘッダの長さを記録する。
HEC(Neader Extension Content)は、拡張ヘッダコンテンツを記録するフィールドであり、任意の拡張情報を記録可能なフィールドである。
図17(2)に示す記録情報の長さが固定されたフォーマットを利用して、GOP再構成処理に適用する情報等、受信装置側における処理をスムーズに実行させるための付加情報を記録する場合の記録データの構成例を図18に示す。
図18に示すように、
(a)拡張ヘッダ識別情報(HET)は、8ビットデータとして、新たな情報の識別値として、例えば[200]を記録する。
さらに、拡張情報記録部(HEC)に、
(b)セグメント識別情報、
(c)GOP内位置識別情報、
これらの各識別情報を記録する。
例えば(b)セグメント識別情報は、8ビットデータとし、初期化セグメントの場合は1を設定し、その他のセグメントの場合は0を設定する。
なお、メディアセグメントの場合、HTTPヘッダに記録されるコンテンツ位置情報(ContentLocation)をGOP単位データの位置情報に設定すれば、このコンテンツ位置情報を参照することで各GOPデータの区別が可能となる。
(c)GOP内位置識別情報は、8ビットデータとして、例えば、ビット値を以下の設定とする。
GOPの先頭位置のデータ(StartofGOP)=1
GOPの中間位置のデータ(MiddleofGOP)=2
GOPの末尾位置のデータ(EndofGOP)=3
送信装置は、このような拡張ヘッダ情報を含むLCTヘッダを設定して受信装置に送信する。一方、受信装置は、このLCTヘッダ内の拡張ヘッダ情報のセグメント識別情報を参照して、パケットに格納されたセグメントが初期化セグメントであるか、サブGOPメディアセグメントであるかを判別する。さらに、受信装置は、パケットがサブGOPメディアセグメントパケットであると識別した場合、LCTヘッダの拡張ヘッダ情報に記録されたGOP内位置識別情報を参照することで、サブGOPメディアセグメントに格納されたメディアデータ(mdat)がGOP内のどの位置に対応するデータであるかを識別することが可能となる。
[10.HEVC符号化データに対する適用例について]
上述した実施例では、MPEG符号化方式に従ったMP4符号化データに対する処理例について説明したが、本開示の処理は、その他の符号化データに足しても適用可能である。例えばHEVC(High Efficiency Video Coding)に従った符号化データに適用することが可能である。
HEVC符号化データの構成について、図19を参照して説明する。
図19に示すように、HEVC符号化処理によって生成される1つのHEVCストリームは、複数のシーケンス(CVS:Coded Video Sequence)と、End of sequence NAL unit(EoB)を有する。
HEVCストリームの構成要素であるCVSは、複数のGOPと、End of sequence NAL unit(EoS)から構成される。
1つのGOPは、ランダムアクセスポイントとなるIRAP(Intra Random Access Point)アクセスユニットを先頭データとし、複数のLP(Leading Picture)アクセスユニットと、TP(Trailing Picture)アクセスユニットを有する。
LPアクセスユニットと、TPアクセスユニットは、何らかの参照ピクチャを参照して復号可能なアクセスユニットである。
ただし、IRAPアクセスユニットから復号を開始した場合には、TPAUについても正常な復号、再生が可能である。
アクセスユニット(AU)は、複数のNALユニット(Network Abstraction Layer Unit)から構成され、アクセスユニット(AU)は、必ず1つ以上のスライスセグメントNALユニットを含む。
図19に示すように、HEVC符号化処理によって生成される符号化データにも符号化処理単位としてのGOPが設定され、このGOPは、さらに複数のNALユニットに分割される。
先に図5を参照して説明したサブGOPメディアセグメントに、HEVC符号化データにおいて設定されるGOP構成データであるNALユニットを1つ、または複数、格納する構成とする。
このように、HEVC符号化データについても、GOPデータを分割したNALユニット単位のメディアデータ(mdat)を格納したフラグメントの生成が可能である。従って、図5他を参照して説明したサブGOPメディアセグメントの生成が可能であり、本開示の処理を適用することができる。
なお、MP4、HEVCに限らず、GOP相当の符号化処理単位を持ち、GOPデータを分割したユニット(NAL)が設定される符号化構成であれば、本開示の処理を適用することが可能である。
[11.各装置のハードウェア構成例について]
最後に、図20を参照して、上述した処理を実行する各装置のハードウェア構成例について説明する。
図20は、送信装置20、受信装置30として適用可能な通信装置のハードウェア構成例を示している。
CPU(Central Processing Unit)201は、ROM(Read Only Memory)202、または記憶部208に記憶されているプログラムに従って各種の処理を実行するデータ処理部として機能する。例えば、上述した実施例において説明したシーケンスに従った処理を実行する。RAM(Random Access Memory)203には、CPU201が実行するプログラムやデータなどが記憶される。これらのCPU201、ROM202、およびRAM203は、バス204により相互に接続されている。
CPU201はバス204を介して入出力インタフェース205に接続され、入出力インタフェース205には、各種スイッチ、キーボード、マウス、マイクロホンなどよりなる入力部206、ディスプレイ、スピーカなどよりなる出力部207が接続されている。CPU201は、入力部206から入力される指令に対応して各種の処理を実行し、処理結果を例えば出力部207に出力する。
入出力インタフェース205に接続されている記憶部208は、例えばハードディスク等からなり、CPU201が実行するプログラムや各種のデータを記憶する。通信部209は、インターネットやローカルエリアネットワークなどのネットワークを介したデータ通信の送受信部、さらに放送波の送受信部として機能し、外部の装置と通信する。
入出力インタフェース205に接続されているドライブ210は、磁気ディスク、光ディスク、光磁気ディスク、あるいはメモリカード等の半導体メモリなどのリムーバブルメディア211を駆動し、データの記録あるいは読み取りを実行する。
なお、データの符号化あるいは復号は、データ処理部としてのCPU201の処理として実行可能であるが、符号化処理あるいは復号処理を実行するための専用ハードウェアとしてのコーデックを備えた構成としてもよい。
[12.本開示の構成のまとめ]
以上、特定の実施例を参照しながら、本開示の実施例について詳解してきた。しかしながら、本開示の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本開示の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。
なお、本明細書において開示した技術は、以下のような構成をとることができる。
(1) 符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成し、
前記サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録したパケットを生成するデータ処理部と、
前記データ処理部の生成したパケットを送信する通信部を有する通信装置。
(2)前記データ処理部は、GOPの構成データであるNALユニットを1つ以上含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成する前記(1)に記載の通信装置。
(3)前記データ処理部は、パケット格納セグメントが、メディアデータを格納しない初期化セグメントであるか、メディアデータを格納したメディアセグメントであるかを識別可能としたセグメント識別情報をパケット付加情報として記録したパケットを生成する前記(1)または(2)に記載の通信装置。
(4)前記データ処理部は、前記サブGOPメディアセグメントの格納データであるメディアデータが、GOPの先頭位置、中間位置、末尾位置のいずれの位置の構成データであるかを識別可能としたGOP内位置識別子をパケット付加情報として生成する前記(1)〜(3)いずれかに記載の通信装置。
(5)前記データ処理部は、前記付加情報を生成パケット内のHTTPヘッダに記録する前記(1)〜(4)いずれかに記載の通信装置。
(6)前記データ処理部は、前記付加情報を生成パケット内の拡張ヘッダに記録する前記(1)〜(4)いずれかに記載の通信装置。
(7)前記データ処理部は、前記付加情報を生成パケット内のLCTヘッダに記録する前記(1)〜(4)いずれかに記載の通信装置。
(8)前記通信部は、前記データ処理部の生成したパケットを、放送波を介してブロードキャスト配信、またはマルチキャスト配信する前記(1)〜(7)いずれかに記載の通信装置。
(9)符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとし、
前記サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録したパケットを受信する通信部と、
前記通信部の受信したパケットを入力して処理を実行するデータ処理部を有する通信装置。
(10)前記データ処理部は、受信パケットに記録されたGOP内位置識別子を参照して、複数の受信パケットに分散格納されたGOP構成データの配列を実行してGOPデータを再構築する前記(9)に記載の通信装置。
(11)前記通信部は、GOPの構成データであるNALユニットを1つ以上含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントを格納したパケットを受信し、前記データ処理部は、受信パケットからNALユニットを1つ以上含むメディアデータを取得し、受信パケットに記録されたGOP内位置識別子を参照して、複数の受信パケットに分散格納されたNALユニットの配列を実行してGOPデータを再構築する前記(9)または(10)に記載の通信装置。
(12)前記通信部は、パケット格納セグメントが、メディアデータを格納しない初期化セグメントであるか、メディアデータを格納したメディアセグメントであるかを識別可能としたセグメント識別情報をパケット付加情報として記録したパケットを受信し、前記データ処理部は、受信パケットに記録された付加情報から、前記セグメント識別情報を取得し、受信パケットに格納されたセグメントの種類を判別して、判別結果に応じた処理を実行する前記(9)〜(11)いずれかに記載の通信装置。
(13)前記通信部は、前記サブGOPメディアセグメントの格納データであるメディアデータが、GOPの先頭位置、中間位置、末尾位置のいずれの位置の構成データであるかを識別可能としたGOP内位置識別子をパケット付加情報として設定したパケットを受信し、前記データ処理部は、受信パケットに記録されたGOP内位置識別子に基づいて、前記サブGOPメディアセグメントの格納データであるメディアデータが、GOPの先頭位置、中間位置、末尾位置のいずれの位置の構成データであるかを判別する前記(9)〜(12)いずれかに記載の通信装置。
(14)前記通信部は、前記パケット付加情報をHTTPヘッダに記録したパケットを受信し、前記データ処理部は、受信パケットのHTTPヘッダから前記パケット付加情報を取得する前記(9)〜(13)いずれかに記載の通信装置。
(15)前記通信部は、前記パケット付加情報を拡張ヘッダに記録したパケットを受信し、前記データ処理部は、受信パケットの拡張ヘッダから前記パケット付加情報を取得する前記(9)〜(13)いずれかに記載の通信装置。
(16)前記通信部は、前記パケット付加情報をLCTヘッダに記録したパケットを受信し、前記データ処理部は、受信パケットのLCTヘッダから前記パケット付加情報を取得する前記(9)〜(13)いずれかに記載の通信装置。
(17)前記通信部は、前記パケットを、放送波を介して受信する前記(9)〜(16)いずれかに記載の通信装置。
(18)データ送信装置において実行する通信データ生成方法であり、
データ処理部が、符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成し、
前記サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録した送信パケットを生成する通信データ生成方法。
(19)データ受信装置において実行する通信データ処理方法であり、
通信部が、符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとし、
前記サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録したパケットを受信し、
データ処理部が、前記通信部の受信したパケットを入力して処理を実行する通信データ処理方法。
また、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。例えば、プログラムは記録媒体に予め記録しておくことができる。記録媒体からコンピュータにインストールする他、LAN(Local Area Network)、インターネットといったネットワークを介してプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。
なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
以上、説明したように、本開示の一実施例の構成によれば、GOPを分割したデータ単位でコンテンツ配信を行い、受信装置側でGOP復元と再生を実行可能とした装置、方法が実現される。
具体的には、送信装置が、GOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成し、サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録したパケットを生成して送信する。受信装置は、受信パケットに設定されたGOP内位置識別子を参照して複数のパケットに分割格納されたメディアデータを配列してGOPを再構築して復号する。
本構成により、GOPを分割したデータ単位でコンテンツ配信を行い、受信装置側でGOP復元と再生を実行可能とした装置、方法が実現される。
10 通信システム
20 送信装置
21 データ処理部
22 通信部
30 受信装置
31 データ処理部
32 通信部
50 初期化セグメント
60 メディアセグメント
201 CPU
202 ROM
203 RAM
204 バス
205 入出力インタフェース
206 入力部
207 出力部
208 記憶部
209 通信部
210 ドライブ
211 リムーバブルメディア

Claims (19)

  1. 符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成し、
    前記サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録したパケットを生成するデータ処理部と、
    前記データ処理部の生成したパケットを送信する通信部を有する通信装置。
  2. 前記データ処理部は、
    GOPの構成データであるNALユニットを1つ以上含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成する請求項1に記載の通信装置。
  3. 前記データ処理部は、
    パケット格納セグメントが、メディアデータを格納しない初期化セグメントであるか、メディアデータを格納したメディアセグメントであるかを識別可能としたセグメント識別情報をパケット付加情報として記録したパケットを生成する請求項1に記載の通信装置。
  4. 前記データ処理部は、
    前記サブGOPメディアセグメントの格納データであるメディアデータが、GOPの先頭位置、中間位置、末尾位置のいずれの位置の構成データであるかを識別可能としたGOP内位置識別子をパケット付加情報として生成する請求項1に記載の通信装置。
  5. 前記データ処理部は、
    前記付加情報を生成パケット内のHTTPヘッダに記録する請求項1に記載の通信装置。
  6. 前記データ処理部は、
    前記付加情報を生成パケット内の拡張ヘッダに記録する請求項1に記載の通信装置。
  7. 前記データ処理部は、
    前記付加情報を生成パケット内のLCTヘッダに記録する請求項1に記載の通信装置。
  8. 前記通信部は、
    前記データ処理部の生成したパケットを、放送波を介してブロードキャスト配信、またはマルチキャスト配信する請求項1に記載の通信装置。
  9. 符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとし、
    前記サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録したパケットを受信する通信部と、
    前記通信部の受信したパケットを入力して処理を実行するデータ処理部を有する通信装置。
  10. 前記データ処理部は、
    受信パケットに記録されたGOP内位置識別子を参照して、複数の受信パケットに分散格納されたGOP構成データの配列を実行してGOPデータを再構築する請求項9に記載の通信装置。
  11. 前記通信部は、
    GOPの構成データであるNALユニットを1つ以上含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントを格納したパケットを受信し、
    前記データ処理部は、
    受信パケットからNALユニットを1つ以上含むメディアデータを取得し、受信パケットに記録されたGOP内位置識別子を参照して、複数の受信パケットに分散格納されたNALユニットの配列を実行してGOPデータを再構築する請求項9に記載の通信装置。
  12. 前記通信部は、
    パケット格納セグメントが、メディアデータを格納しない初期化セグメントであるか、メディアデータを格納したメディアセグメントであるかを識別可能としたセグメント識別情報をパケット付加情報として記録したパケットを受信し、
    前記データ処理部は、
    受信パケットに記録された付加情報から、前記セグメント識別情報を取得し、受信パケットに格納されたセグメントの種類を判別して、判別結果に応じた処理を実行する請求項9に記載の通信装置。
  13. 前記通信部は、
    前記サブGOPメディアセグメントの格納データであるメディアデータが、GOPの先頭位置、中間位置、末尾位置のいずれの位置の構成データであるかを識別可能としたGOP内位置識別子をパケット付加情報として設定したパケットを受信し、
    前記データ処理部は、
    受信パケットに記録されたGOP内位置識別子に基づいて、前記サブGOPメディアセグメントの格納データであるメディアデータが、GOPの先頭位置、中間位置、末尾位置のいずれの位置の構成データであるかを判別する請求項9に記載の通信装置。
  14. 前記通信部は、
    前記パケット付加情報をHTTPヘッダに記録したパケットを受信し、
    前記データ処理部は、
    受信パケットのHTTPヘッダから前記パケット付加情報を取得する請求項9に記載の通信装置。
  15. 前記通信部は、
    前記パケット付加情報を拡張ヘッダに記録したパケットを受信し、
    前記データ処理部は、
    受信パケットの拡張ヘッダから前記パケット付加情報を取得する請求項9に記載の通信装置。
  16. 前記通信部は、
    前記パケット付加情報をLCTヘッダに記録したパケットを受信し、
    前記データ処理部は、
    受信パケットのLCTヘッダから前記パケット付加情報を取得する請求項9に記載の通信装置。
  17. 前記通信部は、
    前記パケットを、放送波を介して受信する請求項9に記載の通信装置。
  18. データ送信装置において実行する通信データ生成方法であり、
    データ処理部が、符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとして生成し、
    前記サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録した送信パケットを生成する通信データ生成方法。
  19. データ受信装置において実行する通信データ処理方法であり、
    通信部が、符号化データの処理単位であるGOP(Group of Pictures)の構成データの一部のみを含むメディアデータと、該メディアデータ対応のメタデータを格納したサブGOPメディアセグメントをパケット格納データとし、
    前記サブGOPメディアセグメントの格納データであるメディアデータのGOP内位置を示すGOP内位置識別子をパケット付加情報として記録したパケットを受信し、
    データ処理部が、前記通信部の受信したパケットを入力して処理を実行する通信データ処理方法。
JP2014006879A 2014-01-17 2014-01-17 通信装置、通信データ生成方法、および通信データ処理方法 Pending JP2015136057A (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP2014006879A JP2015136057A (ja) 2014-01-17 2014-01-17 通信装置、通信データ生成方法、および通信データ処理方法
CA2904959A CA2904959A1 (en) 2014-01-17 2014-12-01 Communication devices, communication data generation method, and communication data processing method
MX2015012247A MX342827B (es) 2014-01-17 2014-12-01 Dispositivos de comunicacion, metodo de generacion de datos de comunicacion, y metodo de procesamiento de datos de comunicacion.
US14/770,150 US10924524B2 (en) 2014-01-17 2014-12-01 Communication devices, communication data generation method, and communication data processing method
EP14878449.9A EP3096524B1 (en) 2014-01-17 2014-12-01 Communication apparatus, communication data generation method, and communication data processing method
PCT/JP2014/081713 WO2015107784A1 (ja) 2014-01-17 2014-12-01 通信装置、通信データ生成方法、および通信データ処理方法
CN201480013818.5A CN105191324B (zh) 2014-01-17 2014-12-01 通信设备、通信数据生成方法、以及通信数据处理方法
KR1020157022754A KR102247976B1 (ko) 2014-01-17 2014-12-01 통신 장치, 통신 데이터 생성 방법, 및 통신 데이터 처리 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014006879A JP2015136057A (ja) 2014-01-17 2014-01-17 通信装置、通信データ生成方法、および通信データ処理方法

Publications (1)

Publication Number Publication Date
JP2015136057A true JP2015136057A (ja) 2015-07-27

Family

ID=53542688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014006879A Pending JP2015136057A (ja) 2014-01-17 2014-01-17 通信装置、通信データ生成方法、および通信データ処理方法

Country Status (8)

Country Link
US (1) US10924524B2 (ja)
EP (1) EP3096524B1 (ja)
JP (1) JP2015136057A (ja)
KR (1) KR102247976B1 (ja)
CN (1) CN105191324B (ja)
CA (1) CA2904959A1 (ja)
MX (1) MX342827B (ja)
WO (1) WO2015107784A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019506059A (ja) * 2016-01-08 2019-02-28 クアルコム,インコーポレイテッド メディア転送のためのメディア配信イベントロケーションの決定

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105451073B (zh) * 2015-11-16 2018-11-02 深圳Tcl数字技术有限公司 Mp4视频源的传送方法和装置
US10819673B2 (en) * 2016-02-23 2020-10-27 Level 3 Communications, Llc Systems and methods for content server rendezvous in a dual stack protocol network
CN107465962B (zh) * 2017-09-05 2020-06-16 成都索贝数码科技股份有限公司 一种非实时视音频文件传输的方法
US11327857B2 (en) * 2018-04-04 2022-05-10 Netapp Inc. Faster replay of metadata and data operations using inode number based dependency graph
US11509972B2 (en) * 2019-07-09 2022-11-22 Dolby International Ab Method and device for personalization of media data for playback

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3330797B2 (ja) * 1995-10-02 2002-09-30 富士通株式会社 動画像データ格納方式および動画像データ復号方式
US5724515A (en) * 1996-03-06 1998-03-03 E. F. Johnson Company Packet radio communication system
US5802051A (en) * 1996-06-10 1998-09-01 Telefonaktiebolaget Lm Ericsson Multiplexing of voice and data minicells
US6965646B1 (en) * 2000-06-28 2005-11-15 Cisco Technology, Inc. MPEG file format optimization for streaming
US20020194589A1 (en) * 2001-05-08 2002-12-19 Cristofalo Michael Technique for optimizing the delivery of advertisements and other programming segments by making bandwidth tradeoffs
US7831990B2 (en) * 2002-04-29 2010-11-09 Sony Corporation Generic adaptation layer for JVT video
US20040006575A1 (en) * 2002-04-29 2004-01-08 Visharam Mohammed Zubair Method and apparatus for supporting advanced coding formats in media files
WO2007010779A1 (ja) * 2005-07-15 2007-01-25 Matsushita Electric Industrial Co., Ltd. パケット送信装置
EP2016769A4 (en) * 2006-01-30 2010-01-06 Clearplay Inc SYNCHRONIZATION OF FILTER METADATA WITH MULTIMEDIA PRESENTATION
US9432433B2 (en) * 2006-06-09 2016-08-30 Qualcomm Incorporated Enhanced block-request streaming system using signaling or block creation
EP2044771A2 (en) * 2006-07-24 2009-04-08 NDS Limited Peer-to-peer set-top box system
JP2009135686A (ja) * 2007-11-29 2009-06-18 Mitsubishi Electric Corp 立体映像記録方法、立体映像記録媒体、立体映像再生方法、立体映像記録装置、立体映像再生装置
KR101581354B1 (ko) * 2008-03-07 2015-12-30 엘지전자 주식회사 방송 신호 수신 방법 및 방송 신호 수신 장치
KR101367886B1 (ko) * 2008-05-07 2014-02-26 디지털 파운튼, 인크. 브로드캐스트 채널 상에서의 고속 채널 재핑 및 고품질 스트리밍 보호
CN101459693A (zh) * 2008-12-29 2009-06-17 中兴通讯股份有限公司 一种流媒体下载方法及系统
EP2417772B1 (en) * 2009-04-09 2018-05-09 Telefonaktiebolaget LM Ericsson (publ) Media container file management
JP4714307B2 (ja) * 2009-05-19 2011-06-29 パナソニック株式会社 記録媒体、再生装置、符号化装置、集積回路、及び再生出力装置
KR20120104485A (ko) * 2009-07-10 2012-09-21 파나소닉 주식회사 기록매체, 재생장치 및 집적회로
US8751677B2 (en) * 2009-10-08 2014-06-10 Futurewei Technologies, Inc. System and method to support different ingest and delivery schemes for a content delivery network
JP2011087103A (ja) 2009-10-15 2011-04-28 Sony Corp コンテンツ再生システム、コンテンツ再生装置、プログラム、コンテンツ再生方法、およびコンテンツサーバを提供
KR101786051B1 (ko) * 2009-11-13 2017-10-16 삼성전자 주식회사 데이터 제공 방법 및 장치와 데이터 수신 방법 및 장치
KR101777347B1 (ko) * 2009-11-13 2017-09-11 삼성전자주식회사 부분화에 기초한 적응적인 스트리밍 방법 및 장치
KR101750049B1 (ko) * 2009-11-13 2017-06-22 삼성전자주식회사 적응적인 스트리밍 방법 및 장치
JP6029805B2 (ja) * 2010-01-15 2016-11-24 富士通株式会社 配信装置、配信プログラムおよび配信方法
US8416755B2 (en) * 2010-05-18 2013-04-09 Lg Electronics Inc. Digital broadcasting system and method for transmitting and receiving digital broadcast signal
CN102316315B (zh) * 2010-06-29 2013-01-23 中国科学院软件研究所 一种实时视频传输方法
US9049497B2 (en) * 2010-06-29 2015-06-02 Qualcomm Incorporated Signaling random access points for streaming video data
US8918533B2 (en) * 2010-07-13 2014-12-23 Qualcomm Incorporated Video switching for streaming video data
US9185439B2 (en) * 2010-07-15 2015-11-10 Qualcomm Incorporated Signaling data for multiplexing video components
EP2596633B1 (en) * 2010-07-20 2016-11-23 Nokia Technologies Oy A media streaming apparatus
US9131033B2 (en) * 2010-07-20 2015-09-08 Qualcomm Incoporated Providing sequence data sets for streaming video data
US8930562B2 (en) * 2010-07-20 2015-01-06 Qualcomm Incorporated Arranging sub-track fragments for streaming video data
US9596447B2 (en) * 2010-07-21 2017-03-14 Qualcomm Incorporated Providing frame packing type information for video coding
US9226045B2 (en) * 2010-08-05 2015-12-29 Qualcomm Incorporated Signaling attributes for network-streamed video data
US9319448B2 (en) * 2010-08-10 2016-04-19 Qualcomm Incorporated Trick modes for network streaming of coded multimedia data
US8824554B2 (en) * 2010-09-02 2014-09-02 Intersil Americas LLC Systems and methods for video content analysis
WO2012046090A1 (en) * 2010-10-04 2012-04-12 Thomson Licensing System and method for error detection and data replacement in broadcast services
WO2011100901A2 (zh) * 2011-04-07 2011-08-25 华为技术有限公司 媒体内容的传输处理方法、装置与系统
KR20120138604A (ko) * 2011-06-14 2012-12-26 삼성전자주식회사 멀티미디어 시스템에서 복합 미디어 컨텐츠를 송수신하는 방법 및 장치
JP2013038766A (ja) * 2011-07-12 2013-02-21 Sharp Corp 送信装置、送信装置の制御方法、制御プログラム、及び記録媒体
US9635355B2 (en) * 2011-07-28 2017-04-25 Qualcomm Incorporated Multiview video coding
US9674525B2 (en) * 2011-07-28 2017-06-06 Qualcomm Incorporated Multiview video coding
US9590814B2 (en) * 2011-08-01 2017-03-07 Qualcomm Incorporated Method and apparatus for transport of dynamic adaptive streaming over HTTP (DASH) initialization segment description fragments as user service description fragments
US10237565B2 (en) * 2011-08-01 2019-03-19 Qualcomm Incorporated Coding parameter sets for various dimensions in video coding
WO2013028565A1 (en) * 2011-08-19 2013-02-28 General Instrument Corporation Encoder-aided segmentation for adaptive streaming
US9445136B2 (en) * 2011-09-21 2016-09-13 Qualcomm Incorporated Signaling characteristics of segments for network streaming of media data
US9843844B2 (en) * 2011-10-05 2017-12-12 Qualcomm Incorporated Network streaming of media data
SG11201404509QA (en) * 2012-02-01 2014-08-28 Nokia Corp Method and apparatus for video coding
US10205961B2 (en) * 2012-04-23 2019-02-12 Qualcomm Incorporated View dependency in multi-view coding and 3D coding
JP6214235B2 (ja) * 2012-07-02 2017-10-18 キヤノン株式会社 ファイル生成方法、ファイル生成装置、及びプログラム
US20140019635A1 (en) * 2012-07-13 2014-01-16 Vid Scale, Inc. Operation and architecture for dash streaming clients
US9432426B2 (en) * 2013-02-04 2016-08-30 Qualcomm Incorporated Determining available media data for network streaming
US9094737B2 (en) * 2013-05-30 2015-07-28 Sonic Ip, Inc. Network video streaming with trick play based on separate trick play files
CN105230024B (zh) * 2013-07-19 2019-05-24 华为技术有限公司 一种媒体表示自适应方法、装置及计算机存储介质
WO2015065476A1 (en) * 2013-11-01 2015-05-07 Hewlett-Packard Development Company, L.P. Protocol agnostic storage access in a software defined network topology
US10097294B2 (en) * 2014-01-03 2018-10-09 Lg Electronics Inc. Apparatus for transmitting broadcast signals, apparatus for receiving broadcast signals, method for transmitting broadcast signals and method for receiving broadcast signals
CN105594219B (zh) * 2014-07-31 2019-08-20 Lg 电子株式会社 用于广播信号的发射/接收处理的设备和方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019506059A (ja) * 2016-01-08 2019-02-28 クアルコム,インコーポレイテッド メディア転送のためのメディア配信イベントロケーションの決定

Also Published As

Publication number Publication date
MX342827B (es) 2016-10-14
KR20160111016A (ko) 2016-09-23
CN105191324B (zh) 2020-05-05
CA2904959A1 (en) 2015-07-23
CN105191324A (zh) 2015-12-23
MX2015012247A (es) 2015-12-01
EP3096524A1 (en) 2016-11-23
EP3096524B1 (en) 2020-02-05
EP3096524A4 (en) 2017-07-05
WO2015107784A1 (ja) 2015-07-23
US20160315987A1 (en) 2016-10-27
KR102247976B1 (ko) 2021-05-06
US10924524B2 (en) 2021-02-16

Similar Documents

Publication Publication Date Title
KR102120525B1 (ko) 통신 장치, 통신 데이터 생성 방법, 및 통신 데이터 처리 방법
US11284135B2 (en) Communication apparatus, communication data generation method, and communication data processing method
US20160337424A1 (en) Transferring media data using a websocket subprotocol
JP5791893B2 (ja) 以前の伝送データを用いた、ビデオ・コンテンツ及びサービスのブロードキャストの受信のための方法及びデバイス
WO2015107784A1 (ja) 通信装置、通信データ生成方法、および通信データ処理方法
KR102176404B1 (ko) 통신 장치, 통신 데이터 생성 방법, 및 통신 데이터 처리 방법
KR102137858B1 (ko) 송신 장치, 송신 방법, 수신 장치, 수신 방법 및 프로그램