JP5553945B2 - ビットストリームサブセットの指示 - Google Patents

ビットストリームサブセットの指示 Download PDF

Info

Publication number
JP5553945B2
JP5553945B2 JP2013550446A JP2013550446A JP5553945B2 JP 5553945 B2 JP5553945 B2 JP 5553945B2 JP 2013550446 A JP2013550446 A JP 2013550446A JP 2013550446 A JP2013550446 A JP 2013550446A JP 5553945 B2 JP5553945 B2 JP 5553945B2
Authority
JP
Japan
Prior art keywords
subset
bitstream
video
identifier
definition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013550446A
Other languages
English (en)
Other versions
JP2014509114A (ja
Inventor
トマス ルセルト,
リカード スイェベルイ,
ツァンフェイ ウー,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2014509114A publication Critical patent/JP2014509114A/ja
Application granted granted Critical
Publication of JP5553945B2 publication Critical patent/JP5553945B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本発明は、圧縮ビデオビットストリーム内のビットストリームサブセットを示す方法及び装置、並びに圧縮ビデオビットストリームからビデオパケットを抽出する方法及び装置に関する。更に本発明は、コンピュータプログラム及びコンピュータプログラム製品に関する。
MPEG−4/高度ビデオ符号化(AVC)としても既知であるH.264は、最新のビデオ符号化規格である。これは、各ビデオフレーム内の冗長及びフレーム間の冗長の双方の除去を利用する複合コーデックである。符号化処理の出力はビデオ符号化レイヤ(VCL)データであり、これは送信又は格納前にネットワーク抽象化レイヤ(NAL)ユニットに更にカプセル化される。ビデオデータ以外にNALユニットで搬送可能な他のデータは、ビデオの解像度又は必要な復号器の性能等のVCLデータの復号化に必須のデータを搬送するシーケンスパラメータセット(SPS)及びピクチャパラメータセット(PPS)等のパラメータセット、あるいは復号器又はネットワーク要素にとって有用であるがVCLデータの復号化に必須ではない情報を搬送する補足拡張情報(SEI)を含む。
NALは、広範な種類のシステムがリアルタイム転送プロトコル(RTP)又はハイパーテキスト転送プロトコル(HTTP)を介する送信、あるいはISOファイル形式での格納等のビデオデータの転送及び格納のために単純で効果的に且つ柔軟にVCLを使用できるようにするために設計されている。NALユニットの概念は、圧縮ビットストリームを論理ユニットに分割することにより、ネットワーク、すなわち送信及び格納システムがビットストリームにアクセスし、それらをグループ化して操作する手段を提供すると考えられる。例えば1つの圧縮ピクチャに対応するユニットは、符号化ピクチャが圧縮ビデオの復号化を開始するためのランダムアクセスポイントとして使用可能であるかをネットワークに示す高度な情報で補足される。
NALは、H.264/AVCビデオの最小サイズの機能ユニットである。NALユニットは、NALユニットヘッダ及びNALユニットペイロードに細分化可能である。NALユニットヘッダは、圧縮ビットストリームを管理するためにネットワークにより使用される識別子セットから構成される。例えば帯域幅が制限される場合にビデオの送信ビットレートを減少するために、ビデオデータの破棄による品質の劣化を最小限にするように、NALユニットヘッダにおいて搬送される情報に基づいていくつかのNALユニットが破棄される。この処理を「ビットストリームの間引き」と呼ぶ。
従来のビデオサービスは単一の表現で、すなわち固定されたカメラ位置及び空間解像度を使用してビデオを提供するが、最近、多重解像度及び多視点のビデオ表現が重要度を帯びている。多重解像度表現は、異なる表示解像度を有する対象の装置で使用されるように、複数の異なる空間解像度のビデオを表現する。多視点表現は異なるカメラ視点からのコンテンツを表現する。特定の例は立体ビデオであり、シーンは人間の目と同様の距離を有する2つのカメラにより取り込まれる。適切な表示技術を使用して、奥行きの知覚が閲覧者に提供される。
多くの場合、多重解像度表現及び多視点ビデオ表現は階層表現レイヤと呼ばれる。この場合、基本レイヤはビデオの基本品質を表現し、後続の拡張レイヤはより高い品質に向けて表現を修正する。
スケーラブルビデオ符号化(SVC)及び多視点ビデオ符号化(MVC)はそれぞれ、多重解像度ビデオ表現及び多視点ビデオ表現を圧縮するために使用されるビデオ符号化規格であり、異なるレイヤ間の冗長情報を除去することにより高い圧縮効率が達成される。SVC及びMVCはAVC規格に基づき、AVCの新版の付録G及びHとして含まれる。そのため、これらはAVC構造の大部分を共有する。
SVC及びMVCのビットストリームに固有の階層依存性のため、NALユニットヘッダ内に復号化依存性及びビュー識別子等の追加情報フィールドが必要とされる。しかし、既存のAVCの実現例との互換性を維持するために、基本的なAVCのNALユニットヘッダは変更されなかった。その代わりに、NALユニットの2つの新しいタイプ、すなわちプレフィックスNALユニット(タイプ14)及び符号化スライス拡張NALユニット(タイプ20)を導入することにより、依存性及びビュー識別子等の追加情報が組み込まれた。これらは、AVCにおいて「不使用」と定義されるため、仕様の付録G又はHをサポートしないAVC復号器により無視される。
プレフィックスNALユニットは、ビットストリームにおいてプレフィックスNALユニットの直後に位置することになっているVCL AVC NALユニットと関連付けられ、基本レイヤに関する追加情報を伝達する。AVC復号器は、プレフィックスNALユニットを無視することにより基本レイヤを復号化できる。
符号化スライス拡張NALユニットは、SVC又はMVCの拡張レイヤでのみ使用される。これは、基本レイヤ又は他の拡張レイヤに関する拡張情報を表す。プレフィックスNALユニットと同様に依存性及びビュー識別子を伝達する他に、符号化スライス拡張NALユニットはSVC又はMVCのNALユニットヘッダ及び対応するVCLデータの双方から構成される。従って、これはプレフィックスNALユニットとVCL AVC NALユニットとの組み合わせである。SVC及びMVCの拡張レイヤのNALユニットは、AVC復号器により無視される。
AVCのSVC及びMVCへの拡張は同様の方法で定義される。それらの使用は相互に排他的であり、すなわち規格において定義される構文及び意味は部分的に矛盾し、SVCの要素とMVCの要素とを同時に使用できない。SVCの特徴とMVCの特徴とを組み合わせるには規格を変更する必要があり、特にNALユニットヘッダの定義を変更する必要がある。
HEVCは、現在標準化が進められている次世代ビデオ符号化規格である。HEVCは、AVCと比較して、特に高解像度ビデオシーケンスに対して符号化を実質的に向上することを目的とする。
高度な構文の設計に関して、最も単純な方法はAVCの高度な構文の概念を採用することであり、特にAVCのNALユニットの概念を採用することである。しかし、これは以下の問題を生じる。
最新の技術によると、SVC及びMVCは下位互換性を有するようにAVCから構築される。新規のNALユニットのタイプ20は、どんな拡張レイヤにも使用できるヘッダの拡張を用いて設計される。従来のAVC復号器の問題を解決するために、従来のNALユニット(タイプ1、タイプ5及び他のタイプ)は維持され、プレフィックスNALユニットを関連付ける方法が通常のAVCのVCL NALユニット(タイプ1及びタイプ5)の各々に対して使用される。この手法は原則的にHEVC及びそれ以降の拡張に対して使用されてもよいが、関連する以下の問題を有する。
−新規の特徴又は機能性を導入するには、例えば符号化スライス拡張NALユニットである新規のNALユニットのタイプの定義が必要である。これは、NALユニットのタイプの最大数が通常は例えばNALユニットのタイプフィールドの定義された長さにより制限されるため、望ましくない。
−従来の復号器を考慮するために、基本レイヤはプレフィックスNALユニットと共に従来のNALユニットのタイプを用いて作成される必要があり、その結果、第2の新規のNALユニットのタイプが設計される必要がある。従って、NALユニットのタイプ数が更に増加する。
−基本レイヤ及び拡張レイヤの信号伝送は一様でなく、レイヤ毎にネットワークを介する特別な処理が必要である。そのため、実現例が複雑になる。プレフィックスNALユニットの使用は不自然であり、必要なヘッダ情報と対応するVCLデータとの間に弱いリンクしか提供しない。このリンクは、例えばNALユニットのうちの1つが送信中に紛失した場合に容易に切れる可能性がある。
−今後拡張する場合、プレフィックスNALユニットのネスティングが複雑である。
−追加のNALユニットヘッダを介して高度なインタフェースを拡張することにより、NALユニットヘッダにおいて伝達される情報に基づいてNALユニットを処理すると考えられるネットワーク機能性は、NALユニットヘッダが拡張される度に更新される必要がある。
最新のAVCの概念に関連する更なる問題は、階層表現に関する。現在、SVC及びMVCにおいて、view_id、dependency_id及びquality_id等のレイヤのプロパティに関する全てのフラグは知的な選択又は分類を行わずに単純にNALユニットヘッダに入れられる。例えばビットストリームを受信中のクライアントがビットストリームを間引くか又は操作したい場合、クライアントはフラグの定義に関する詳細な知識を有する必要がある。基本的に、クライアントは各フラグの意味及びそれらの相互関係性を完全に理解する必要がある。例えば1つのビューが多視点ビットストリームから抽出される必要のある場合、そのビューが依存するビューが含まれない場合に誤った動作が行われやすい。あるいは、クライアントがview_idフラグのみを考慮する場合、低品質バージョンが選択される。SEI要素が何らかの補助を行う場合でも、階層ビットストリームから特定のビデオ表現を抽出するために必要な全ての情報をネットワークが見つけ且つ理解するのは非常に困難である。
更に、3Dを範囲に含むアプリケーション及び規格の増加に伴い、奥行きマップ及びオクルージョンマップ等の新規のデータ要素がテクスチャと共に送信され、受信側における出力ビューの更に柔軟なレンダリングが可能になる。そのような要素は(多視点又はスケーラブル)「テクスチャ」ビデオと共に階層表現を形成するため、全てを同一のビットストリームで送信するのが望ましい。あるいは、異なるデータ要素のそのようなバンドリングは、転送プロトコル又はファイル形式等の高いシステムレベルでの信号伝送を介して達成されてもよい。しかし、そのような高度なプロトコルのソフトウェア及びハードウェアでの実現例はビデオの伸張の実現例と切り離されることが多く、そのため、ビットストリームレベルでサポートされない場合、テクスチャと奥行きとの同期等の異なるデータ要素の正確な時間同期は非常に複雑である。尚、異なるビデオ要素はフレームを位置合わせされる必要があるため、テクスチャ及び奥行き等の異なるビデオデータ要素の同期は、ビデオとオーディオとの同期よりはるかに緊密である必要がある。更に、テクスチャ及び奥行き等のビデオ要素は、例えばそれらの間の動き情報(「動きベクトル」)を再使用することにより一緒に圧縮されてもよく、それにはビットストリームレベルでの緊密な結合が必要である。
HEVCの開発の当初の対象はビデオのみである。しかし、今後、スケーラブル符号化及び/又は多視点符号化に拡張される可能性がある。また、AVCにおけるNALユニットの概念と同様のパケット化の概念が使用される可能性がある。従って、以下において、提示される方法は主にHEVC等の将来のビデオ符号化規格に適用可能であるが、用語「NALユニット」はAVCにおいて定義されるのと同じ意味で使用される。また、SPS、PPS及びSEI等の他のAVCの概念がHEVCにおいて使用されることが予期されるため、HEVC又は他の何らかの将来のビデオ符号化規格において異なる名称で呼ばれる可能性があるが、以下においてAVC用語を使用する。
本発明の目的は、上記の技術及び従来技術の向上された技術を提供することである。
更に詳細には、本発明の目的は、階層ビデオ表現を容易にする将来のビデオ符号化規格に対する向上された汎用構文を提供することである。
本発明の上記の目的及び他の目的は、独立請求項により定義される本発明の種々態様により達成される。本発明の実施形態は、従属請求項により特徴付けられる。
本発明を説明するために、ビデオ信号は圧縮ビデオビットストリームに符号化され、例えばローカルエリアネットワーク、移動電話ネットワーク又はインターネットであるネットワークを介して送信され、例えばテレビ、コンピュータ、ビデオプレーヤ又は移動電話であるクライアントにおいて復号化されると仮定する。ネットワークは、ルータ及びスイッチ等の複数のネットワーク要素を含んでもよい。
本発明の第1の態様によると、圧縮ビデオビットストリーム内のビットストリームサブセットを示す方法が提供される。圧縮ビデオビットストリームは、複数のビットストリームサブセット、すなわち少なくとも2つのビットストリームサブセットを含む。方法は、圧縮ビデオビットストリームを受信することと、ビデオビットストリームをビデオパケットに分割することと、複数のサブセット識別子のうちの一つのサブセット識別子で各ビデオパケットにマークを付けることとを備える。各ビデオパケットは、ビデオデータ又は補足情報のいずれか一方を含む。複数のサブセット識別子の各サブセット識別子は、複数のビットストリームサブセットのうちの対応するビットストリームサブセットと関連付けられる。
本発明の第2の態様によると、コンピュータプログラムが提供される。コンピュータプログラムは、コンピュータプログラムコードを備える。コンピュータプログラムコードは、本発明の第1の態様に係る方法を実現するために実行されるように構成される。
本発明の第3の態様によると、コンピュータプログラム製品が提供される。コンピュータプログラム製品は、コンピュータ可読媒体を備える。コンピュータ可読媒体において、本発明の第2の態様に係るコンピュータプログラムが実現されている。
本発明の第4の態様によると、圧縮ビデオビットストリームからビデオパケットを抽出する方法が提供される。圧縮ビデオビットストリームはビデオパケットに分割される。圧縮ビデオビットストリームは、複数のビットストリームサブセットを含む。各ビデオパケットは、ビデオデータ又は補足情報のいずれか一方を含む。各ビデオパケットは、複数のサブセット識別子のうちの一つのサブセット識別子を更に含む。各サブセット識別子は、複数のビットストリームサブセットのうちの対応するビットストリームサブセットと関連付けられる。方法は、少なくとも1つの関係のあるサブセット識別子を提供することと、圧縮ビデオビットストリームからビデオパケットを受信することとを備える。方法は、受信したビデオパケット毎に、ビデオパケットのサブセット識別子を検査することと、圧縮ビデオビットストリームからビデオパケットを抽出することとを更に備える。ビデオパケットは、抽出されたサブセット識別子が少なくとも1つの関係のあるサブセット識別子のうちの1つと一致するという条件で、圧縮ビデオビットストリームから抽出される。
本発明の第5の態様によると、別のコンピュータプログラムが提供される。コンピュータプログラムは、コンピュータプログラムコードを備える。コンピュータプログラムコードは、本発明の第4の態様に係る方法を実現するために実行されるように構成される。
本発明の第6の態様によると、コンピュータプログラム製品が提供される。コンピュータプログラム製品はコンピュータ可読媒体を備える。コンピュータ可読媒体において、本発明の第5の態様に係るコンピュータプログラムが実現されている。
本発明の第7の態様によると、圧縮ビデオビットストリーム内のビットストリームサブセットを示すビットストリームマーカが提供される。圧縮ビデオビットストリームは、複数のビットストリームサブセットを含む。ビットストリームマーカは、受信ユニットと、パケット化ユニットと、マーク付けユニットとを備える。受信ユニットは圧縮ビデオビットストリームを受信するように構成される。パケット化ユニットは、圧縮ビデオビットストリームをビデオパケットに分割するように構成される。各ビデオパケットはビデオデータ又は補足情報のいずれか一方を含む。マーク付けユニットは、複数のサブセット識別子のうちの一つのサブセット識別子で各ビデオパケットにマークを付けるように構成される。各サブセット識別子は、複数のビットストリームサブセットのうちの対応するビットストリームサブセットと関連付けられる。
本発明の第8の態様によると、圧縮ビデオビットストリームからビデオパケットを抽出するビットストリーム抽出器が提供される。圧縮ビデオビットストリームはビデオパケットに分割される。圧縮ビデオビットストリームは複数のビットストリームサブセットを含む。各ビデオパケットはビデオデータ又は補足情報のいずれか一方を含む。各ビデオパケットは、複数のサブセット識別子のうちの一つのサブセット識別子を更に含む。各サブセット識別子は、複数のビットストリームサブセットのうちの対応するビットストリームサブセットと関連付けられる。ビットストリーム抽出器は、サブセット選択ユニットと、受信ユニットと、抽出ユニットとを備える。サブセット選択ユニットは、少なくとも1つの関係のあるサブセット識別子を提供するように構成される。受信ユニットは、圧縮ビデオビットストリームからのビデオパケットを受信するように構成される。抽出ユニットは、受信したビデオパケット毎に、ビデオパケットのサブセット識別子を検査し且つ圧縮ビデオビットストリームからビデオパケットを抽出するように構成される。ビデオパケットは、抽出されたサブセット識別子が少なくとも1つの関係のあるサブセット識別子のうちの1つと一致するという条件で、圧縮ビデオビットストリームから抽出される。
本発明は、最新のビデオ符号化規格の階層ビットストリームの概念が異なるビットストリームサブセットの識別を可能にするように一般化されてもよいという見解を利用する。この場合、各ビットストリームサブセットは、特定のプロパティが関連付けられたレイヤを表す。例えば各ビットストリームサブセットは、テクスチャ基本ビューレイヤ、奥行きマップ高品質レイヤ、時間オクルージョンマップレイヤ等のビデオデータを搬送するVCLレイヤ、あるいは非ビデオデータ、すなわち例えばパラメータセットである補足情報を搬送する非VCLレイヤのいずれかを表す。これは、各レイヤ、すなわちビットストリームサブセットとストリーム識別子(stream_id)とを関連付けることにより達成される。ストリーム識別子は、特定のビュー識別子(view_id)又は依存性識別子(dependency_id)等のレイヤのプロパティを記述するパラメータと関連付けられる。stream_idは、NALユニットヘッダにおいて信号伝送される。
特定のレイヤの異なるプロパティの全てを単一の識別子stream_idに統合することにより、ネットワーク内及びクライアント側でビデオパケットを解釈及び識別する処理が簡略化される。提案される構文により、特に階層表現に適用され、従って将来のビデオコーデック及びアプリケーションと互換性のあるネットワークフレンドリで高度なビデオビットストリームの信号伝送の簡潔で拡張可能なシステム設計が可能になる。本発明の一実施形態に係るビデオビットストリームの信号伝送は、最新のビデオ符号化規格、特に上述のAVCのNALユニットの概念に固有の問題が軽減される点で有利である。
更に詳細には、新規の機能性は、新規のNALユニットのタイプの定義もNALユニットヘッダの構文の更新も必要としない。更に、レイヤのプロパティが単一のstream_idに要約されるため、ビデオビットストリームを処理するネットワーク要素及びクライアントは、NALユニットヘッダ内で使用される全ての情報要素、すなわち識別子、標識、パラメータ又はフラグに関する詳細な知識を有する必要がない。寧ろ、関係のあるstream_idに関する知識で十分である。最後に、階層ビデオビットストリーム、すなわち1つの圧縮ビデオビットストリームに多重化された複数のビットストリームサブセットの信号伝送は、高度な信号伝送に依存する解決策より容易に正確な時間同期を達成できる点で有利である。更に、ビデオ表現の関係のあるレイヤ間の冗長がビデオ信号の圧縮において利用されてもよい。
圧縮ビデオビットストリーム内の各ビデオパケットに単一のサブセット識別子でマークを付けると述べたが、圧縮ビデオビットストリームに含まれる全てのビデオパケットのサブセットに単一のサブセット識別子でマークを付けるだけの本発明の実施形態も考えられる。
本発明の一実施形態によると、方法は、少なくとも1つのサブセットの定義を提供することを更に備える。サブセットの定義の各々は、複数のビットストリームサブセットのうちの対応するビットストリームサブセットのプロパティを記述する。関連付けられたビットストリームサブセットのプロパティを定義するためにサブセットの定義を利用することは、対応するビデオレイヤのプロパティがネットワーク要素及びクライアントに明確に提供される点で有利である。
本発明の一実施形態によると、少なくとも1つのサブセットの定義は圧縮ビデオビットストリーム内のビデオパケットとして提供される。ビデオパケットは、各々が異なるビットストリームサブセットに対応する複数のサブセットの定義を搬送してもよい。1つ又は複数のサブセットの定義を含むビデオパケットは、パラメータストリームセット(StPS)において搬送されてもよい。これは、関連付けられたビットストリームサブセット、すなわちビデオ又はパラメータレイヤのプロパティを記述するサブセットの定義がビデオ信号と共にネットワーク要素及びクライアントに提供される点で有利である。サブセットの定義の各々は、temporal_id、view_id、quality_id、priority_id又はサブセットにおいて搬送されるデータの種類のうちの少なくとも1つに関する情報を含む。1つ以上のビットストリームサブセットがサブセットの定義又は他のパラメータを信号伝送するために確保されてもよいことが理解されるだろう。そのような確保されたビットストリームサブセットは、ネットワーク要素及びクライアントに対して既知である、例えばstream_id=0である事前に定義されたstream_idと関連付けられてもよい。
本発明の一実施形態によると、複数のサブセット識別子の各サブセット識別子は数値であってもよい。各サブセット識別子の値は、それと関連付けられたビットストリームサブセットの相対的な優先順位に対応する。換言すると、各ビットストリームサブセットのサブセット識別子stream_idは、特定のビットストリームサブセットにより搬送されるビデオデータの重要度を示す。そのような情報を使用して、例えば帯域幅が制限されるためパケットを破棄する必要のあるネットワーク要素又はクライアントは、関連性が低いことを示す高いstream_idを有するパケットを破棄し、関連性が高いことを示す低いstream_idを有するパケットを保持する。
本発明の一実施形態によると、方法は、少なくとも1つのビデオ表現の定義を提供することを更に備える。ビデオ表現の定義の各々は、少なくとも1つの関係のあるサブセット識別子を含む。少なくとも1つの関係のあるサブセット識別子と関連付けられたビットストリームサブセットは、復号化可能なビデオ表現を形成する。換言すると、各ビデオ表現は、複数のstream_id及びそれらと関連付けられたビットストリームサブセットをグループ化して、復号化可能なビデオを形成する。これは、独立して復号化できない単一のビットストリームサブセットを識別するサブセットの定義と異なる。ビデオ表現は、例えば基本ビューに対する全てのテクスチャ情報、あるいはテクスチャ及び奥行きマップ情報を含む。これは、特定のビデオ表現を正常に復号化するために処理する必要のあるビットストリームサブセットに関する情報がネットワーク要素又はクライアントに提供される点で有利である。
本発明の一実施形態によると、少なくとも1つのビデオ表現の定義は、圧縮ビデオビットストリーム内のビデオパケットとして提供される。これは、ビデオ表現に関する情報、すなわち復号化可能なビデオを形成するために処理する必要のあるstream_idのリストがビデオデータと共に信号伝送され、すなわち多重化される点で有利である。ビデオパケットは複数のビデオ表現の定義を搬送してもよい。ビデオ表現の定義の各々は、特定の特徴、すなわちプロパティを有する復号化可能な異なるビデオ表現に対応する。1つ又は複数のビデオ表現の定義を含むビデオパケットは、この目的のために確保される表現パラメータセット(RPS)と呼ばれるビットストリームサブセットにおいて搬送されてもよい。RPSは、例えばstream_id=0である事前に定義されたstream_idと関連付けられてもよい。ビデオ表現は、ビデオ表現の相対的な優先順位を示す数値と関連付けられてもよいことが更に理解されるだろう。
本発明の一実施形態によると、方法は、受信したビデオパケット毎に、抽出したビデオパケットを転送又は復号化するか、あるいは受信したビデオパケットを破棄することを更に備える。受信したビデオパケットは、抽出されたサブセット識別子が少なくとも1つの関係のあるサブセット識別子のいずれとも一致しないという条件で破棄される。換言すると、受信したビデオパケットは、それと関連付けられたstream_idが関係のあるstream_idのリストと一致する場合に処理され、すなわち転送又は復号化され、一致しない場合に破棄される。これは、受信したビデオパケットが関係のあるビデオパケットであるか否かに依存してネットワーク要素又はクライアントが当該ビデオパケットを処理するという点で有利である。例えばクライアントは、例えば復号化可能なビデオ、すなわちビデオ表現を共に形成するサブセットのグループである特定のビットストリームサブセットのみを処理するように構成される。更に、ネットワーク要素は、帯域幅が制限される場合、例えば高品質拡張レイヤである関連性が低いと考えられるビットストリームサブセットを破棄するように構成されてもよい。
本発明の一実施形態によると、方法は、サブセットの定義を提供することを更に備える。サブセットの定義は、複数のビットストリームサブセットのうちの対応するビットストリームサブセットのプロパティを記述する。方法は、対応するビットストリームと関連付けられたサブセット識別子を少なくとも1つの関係のあるサブセット識別子として使用することを更に備える。サブセットの定義に含まれるstream_idを使用することは、ネットワーク要素及びクライアントがサブセットの定義により指定されたビデオパケットを処理対象として選択できるようにする点で有利である。
本発明の一実施形態によると、方法は、複数のサブセットの定義からサブセットの定義を選択することを更に備える。サブセットの定義は、対応するビットストリームサブセットの少なくとも1つのプロパティに従って選択される。これは、複数のサブセットの定義が提供される場合にネットワーク要素又はクライアントが特定のプロパティを有するビットストリームサブセットを処理するために選択する点で有利である。例えばクライアントは、例えば特定のtemporal_id、view_id、quality_id、priority_idであるか又はサブセットにおいて搬送されるデータの特定の種類を示す特定の標識を含むサブセットの定義を選択する。
本発明の一実施形態によると、方法は、圧縮ビデオビットストリーム内のビデオパケットからサブセットの定義を受信することを更に備える。これは、関連付けられたビットストリームサブセット、すなわちビデオ又はパラメータレイヤのプロパティを記述するサブセットの定義がビデオデータと共にネットワーク要素及びクライアントにより受信される点で有利である。
本発明の一実施形態によると、方法は、圧縮ビデオビットストリーム内のビデオパケットからビデオ表現の定義を受信することを更に備える。これは、復号化可能なビデオを形成するために処理する必要のあるビデオ表現に関する情報、すなわち複数のstream_idがビデオデータと共に受信される点で有利である。
本発明の第1の態様及び第4の態様に係る方法の実施形態を参照して、本発明の利点をいくつかの例において説明したが、対応する論法は本発明の第2の態様及び第5の態様に係るコンピュータプログラムの実施形態、本発明の第3の態様及び第6の態様に係るコンピュータプログラム製品、並びに本発明の第7の態様及び第8の態様に係る装置に適用される。
本発明の更なる目的、特徴及び利点は、以下の詳細な開示、図面及び添付の特許請求の範囲を検討することにより明らかになるだろう。本発明の種々の特徴は以下に説明する実施形態以外の実施形態を作成するために組み合わせ可能であることが当業者には理解される。
本発明の上記の目的、特徴及び利点、並びに追加の目的、特徴及び利点は、添付の図面を参照して以下の本発明の実施形態の例示であって限定しない詳細な説明を読むことにより更に理解されるだろう。
図1は、ビデオ信号を符号化、転送及び復号化するシステムを示す図である。 図2は、本発明の実施形態に係るビットストリームサブセット、サブセットの定義及びビデオ表現の定義の概念を示す図である。 図3は、本発明の実施形態に係る提案される構文を示す図である。 図4は、本発明の一実施形態に係る圧縮ビデオビットストリーム内のビットストリームサブセットを示す方法を示す図である。 図5は、本発明の一実施形態に係る圧縮ビデオビットストリームからビデオパケットを抽出する方法を示す図である。 図6は、本発明の一実施形態に係るビットストリームマーカを示す図である。 図7は、本発明の一実施形態に係るビットストリーム抽出器を示す図である。 図8は、本発明の一実施形態に係るコンピュータプログラムコードを実行するビデオ処理装置を示す図である。
全ての図面は概略的であり、必ずしも一定の縮尺ではなく、一般に、本発明を説明するために必要な部分のみを示す。その場合、他の部分は省略されるか又は単に提案される。
本発明を説明するために、ビデオ信号を符号化、転送及び復号化するシステム100を図1に示す。
システム100は、ビデオ符号化装置110、転送ネットワーク120及びビデオ復号化装置130を備える。通常、ビデオ符号化装置110は1つ又は複数のソースからビデオ信号を受信し、ビデオ信号を圧縮し且つ結果として得られたビットストリームを例えばNALユニットであるビデオパケットに細分化するように構成される。結果として得られたビデオパケットは、その後、転送ネットワーク120を介して復号化装置130に転送される。転送ネットワーク120は、通常、符号化装置110から復号化装置130にビデオパケットを転送するように構成される複数の相互接続ノード、すなわちネットワーク要素121〜123を備える。ネットワーク要素121〜123は、例えばスイッチ、ルータ又はビデオパケットを処理するのに適した他の何らかの種類のネットワークノードである。転送ネットワーク120は、例えばローカルエリアネットワーク、移動電話ネットワーク又はインターネットである。
復号化装置130は、転送ネットワーク120からビデオパケットを受信し且つ受信した圧縮ビデオビットストリームを復号化するように構成される。更に、復号化装置130は、復号化されたビデオを閲覧者に対して表示するように構成されてもよい。復号化装置130は、例えばビデオプレーヤ、テレビ、コンピュータ又は移動電話である。
以下、ストリーム識別子、サブセットの定義及びビデオ表現の概念を示す図2を参照して、本発明の実施形態を説明する。
図2において、圧縮ビデオビットストリーム210の一部分が示される。当該部分は6つのビデオパケット、すなわちNALユニット211〜216を含み、各ビデオパケットはビデオデータあるいはパラメータ等の補足情報を含む。更に、各NALユニット211〜216は、各NALユニット211〜216と圧縮ビデオビットストリームの対応するビットストリームサブセットとを関連付けるためのフラグstream_idを含む。例えば図2に例示するビデオビットストリームの一部分210の場合、NALユニット211、213及び216はstream_id=0でマークを付けられる。すなわち、これらは第1のビットストリームサブセットと関連付けられる。更に、NALユニット212及び214はstream_id=1でマークを付けられる。すなわち、これらは第1のビットストリームサブセットと異なる第2のビットストリームサブセットと関連付けられる。最後に、NALユニット215はstream_id=2でマークを付けられる。すなわち、これは第1のビットストリームサブセット及び第2のビットストリームサブセットと異なる第3のビットストリームサブセットと関連付けられる。
圧縮ビデオビットストリームにおいて搬送される各NALユニットに含まれる識別子stream_idにより、NALユニットが属するビットストリームサブセットがNALユニット毎に示される。圧縮ビデオビットストリームにおいて搬送される各ビットストリームサブセットが、例えばテクスチャ基本ビューレイヤ、奥行きマップ高品質レイヤ、パラメータセットレイヤ、時間レイヤ、オクルージョンマップレイヤ又は他の何らかの種類のビデオ又は補足レイヤである圧縮ビデオ信号の特定のレイヤを表すため、各NALユニットは対応するレイヤと関連付けられる。このように、例えばレイヤが表現するビュー、レイヤが含むビデオ品質又はレイヤ間の依存性を記述するパラメータである特定のレイヤと関連付けられる全てのパラメータは、単一のストリーム識別子stream_idに要約される。パラメータセットを記述するために単一の識別子を使用することにより間接指定が導入され、NALユニットが転送される際に通過するネットワーク要素又はNALユニットが復号化されるクライアントによるNALユニットの簡略な処理が可能になる。
各レイヤ、すなわちビットストリームサブセットのプロパティは事前に定義され、ビデオ信号の符号化、転送及び復号化に関係する全てのエンティティに対して既知であってもよい。例えば図1を参照すると、復号化装置130は、転送ネットワーク120を介して符号化装置110から受信した異なるビットストリームサブセット、すなわちレイヤのうちの1つ又はいくつかに属するビデオパケットのみを復号化するように構成されてもよい。これは、例えばstream_id=0が基本レイヤであり、stream_id=1及びstream_id=2が向上されたビデオ品質を提供するための拡張レイヤであって、復号化装置130が低品質のビデオ信号しか表示できない場合に当てはまる。更に、ネットワーク要素121〜123は、使用可能な帯域幅が制限される場合、3つのビットストリームサブセットのうちの1つ又は2つに属するビデオパケットのみを転送するように構成されてもよい。
更に図2を参照して、多層ビデオビットストリームに含まれるビデオレイヤの向上された処理を説明する。
本発明の一実施形態によると、各レイヤ、すなわちビットストリームサブセットのプロパティは、サブセットの定義221〜223により、ビデオ信号の符号化、転送及び復号化に関係するエンティティに提供される。レイヤ毎に、レイヤのプロパティを記述する情報、すなわちパラメータを含む対応するサブセットの定義221〜223が提供される。例えばサブセットの定義221は、stream_id=0で示される第1のビットストリームサブセットのプロパティを記述する。それに対応して、サブセットの定義222は第2のビットストリームサブセット、すなわちstream_id=1のプロパティを記述し、サブセットの定義223は第3のビットストリームサブセット、すなわちstream_id=2のプロパティを記述する。サブセットの定義221〜223の各々に含まれるパラメータ、すなわちtexture_flag、depth_flag、occlusion_flag及びview_idは、ビットストリームサブセットがテクスチャレイヤであるか、奥行きマップレイヤであるか、オクルージョンテクスチャレイヤであるか、並びにそれが属するビューを示す。図2に例示するサブセットの定義221〜223の場合、全てのレイヤはview_id=0であり、同一のビューに属する。サブセットの定義221により記述される第1のレイヤはビューのテクスチャを含み、サブセットの定義222により記述される第2のレイヤはビューの奥行きマップを含み、サブセットの定義223により記述される第3のレイヤはビューのオクルージョンテクスチャを含む。
図2を更に参照して、本発明の一実施形態に係るビデオ表現の概念を説明する。
ビデオ表現は、復号化可能なビデオを形成するために1つ以上のレイヤ、すなわちビットストリームサブセットをグループ化するために使用される。このグループ化機構は、圧縮ビデオビットストリームの処理に関係するネットワーク要素及びクライアントにビットストリームサブセットに関する情報を提供するために使用される。これは、ネットワーク要素及びクライアントにビデオ表現の定義に含まれる統合された情報を提供することにより達成される。このために、ビデオ表現は、例えばビットストリーム内の全てのテクスチャ情報を含んでもよく、あるいは基本ビューに対するテクスチャ及び奥行きマップ情報を含んでもよい。例えばビデオ信号を復号化して閲覧者に対してビデオを表示するために圧縮ビデオビットストリームから特定のビデオ表現を抽出したいネットワーク要素又はクライアントは、関係のあるビデオ表現を識別した後、ビデオ表現の一部である全てのビットストリームサブセットを抽出する。
本発明の一実施形態に係る図2に示すビデオ表現231〜233等のビデオ表現は、ネットワーク要素及びクライアントによるビデオ表現の識別を容易にするために、ビデオ表現識別子representation_idでマークを付けられる。更に、各ビデオ表現は、ビデオ信号を復号化することにより有意味なビデオをレンダリングするために必要なビットストリームセブセットを示すstream_idのリストを含む。
例えば、表現の定義231により定義される第1のビデオ表現はrepresentation_id=0でマークを付けられており、単一のビットストリームサブセット識別子stream_id=0を含む。従って、stream_id=0を有するビットストリームサブセットの定義221を与えられるため、第1の表現はモノラル2Dビデオシーケンス、すなわちテクスチャ情報の単一ビューである。更に、表現の定義232により定義される第2のビデオ表現はrepresentation_id=1でマークを付けられ、2つのビットストリームサブセット識別子stream_id=0及びstream_id=1のリストを含む。従って、サブセットの定義221及び222を与えられるため、第2のビデオ表現はstream_id=1を有するレイヤにより搬送される奥行きマップを更に含み、3Dビデオシーケンスをレンダリングできる。しかし、第2のビデオ表現がオクルージョンテクスチャ情報を含まないため、レンダリングされる3Dビデオの品質は制限される。この問題は、オクルージョンテクスチャ情報を含む3Dビデオシーケンスのレンダリングを可能にする第3のビデオ表現により解決される。この目的のために、ビデオ表現の定義233は、3つのビットストリームサブセット識別子stream_id=0、stream_id=1及びstream_id=2のリストを含む。
階層ビットストリーム、サブセットの定義及びビデオ表現の概念は上述したように1つのビューのみに限定されないことが理解されるだろう。サブセットの定義は、例えば異なるカメラアングルを有する例えばview_id=0及びview_id=1である異なるビューを表現するレイヤ、あるいは異なるビデオ品質のビデオ信号を搬送するレイヤのプロパティを記述するために使用される。
ビデオ表現の概念により、ビデオビットストリームの処理に関係するネットワーク要素及びクライアントによる多層ビデオビットストリームの簡略な処理が可能になる。特定のビデオ表現を転送したいネットワーク要素又は復号化したいクライアントは、単純に、対応する表現の定義を識別し、必要なビットストリームサブセット識別子のリストを表現の定義から読み出し、必要なビットストリームサブセットに属するビデオパケットを圧縮ビデオビットストリームから抽出する。
例えばtemporal_id、priority_id、quality_id及びdependency_id等である複数の識別子を使用するSVCのNALユニットヘッダの拡張等であるビットストリームサブセットを識別する既知の方法と比較して、提案される方法は単一の識別子のみを使用するため、ハードウェア及びソフトウェアの双方のはるかに単純な実現例が可能になる。特に、単一の識別子stream_idは、例えばdependency_idと異なり、事前に定義された意味を有さないが、その意味は、例えばサブセットの定義である二次手段を介して示される。この間接指定により、提案される概念は、新規の機能性が後の段階で導入される場合にそのような機能性に関する情報がサブセットの定義において信号伝送されるため容易に拡張可能であり、NALユニットヘッダの変更は不要である。特に、本発明の一実施形態に係るNALユニットヘッダは、拡張が使用されるか否かに関係なく固定長を有する。それにより、NALユニットヘッダの構文解析は既知の解決策よりはるかに単純になる。
図3を参照して、特に提案される構文に関して、本発明の実施形態の更に詳細な説明を以下に提示する。
サブセット識別子stream_idは、NALユニットヘッダにおいて搬送される。NALユニットヘッダは、NALユニットのタイプ又はoutput_flag等の他の識別子を含んでも含まなくてもよい。NALユニットヘッダ310の一例を図3に示す。本例において、forbidden_zero_bitは0に等しいとされ、nal_unit_typeはNALユニットに含まれるタイプデータを指定し、output_flagは現在のNALユニットの復号化されたコンテンツが画面出力を意図するかを信号伝送する。
異なるNALユニットに同一のstream_idでマークを付けることにより、それらは同一のビットストリームサブセット、すなわち同一のレイヤに属するものとしてマークを付けられる。通常、同一のビットストリームサブセットに属する全てのNALユニットは、以下に例示する特定のプロパティのうちの1つ以上を共有する。
−サブセット内の全てのNALユニットはパラメータセットである。
−サブセット内の全てのNALユニットはイントラ符号化ピクチャである。
−サブセット内の全てのNALユニットは、いわゆる「クローズドピクチャグループ(GOP)」のランダムアクセスポイントの始点を示す(AVCにおける瞬時復号器リフレッシュ(IDR)ピクチャ)。
−サブセット内の全てのNALユニットは、いわゆる「オープンGOP」のランダムアクセスポイントの始点を示す(復号化を開始できるイントラピクチャ)。
−サブセット内の全てのNALユニットは、基本品質を表現するビデオフレームを搬送する。
−サブセット内の全てのNALユニットは、時間リファイン情報を搬送する。
−サブセット内の全てのNALユニットは、空間スケーラビリティの場合の空間リファイン情報を搬送する。
−サブセット内の全てのNALユニットは、多視点符号化における特定のカメラビューに対応する情報を搬送する。
−サブセット内の全てのNALユニットは、特定のビデオストリーム又は例えば奥行きマップストリームに関する情報を搬送する。
尚、複数のそのようなプロパティは、所定のサブセットに対して同時に有効であってもよい。
いくつかのサブセットのプロパティ及び関連付けられるstream_idは事前に定義されてもよい。例えばstream_id=0は、SPS、PPS、StPS又はRPS等のパラメータセットを搬送するNALユニットのみを含むサブセットを示す。あるいは、SPS、PPS、StPS及びRPSは事前に定義された異なるstream_idを有する。
サブセットのプロパティに関する情報は、例えばサブセットの定義により明示的に提供されてもよい。サブセットの定義は、例えばtemporal_id又はquality_id等のパラメータを含んでもよい。サブセットの定義320の一例を図3に示す。
サブセットの定義320等の本発明の一実施形態に係るサブセットの定義の構文は、例えばNALユニットのタイプ又は他のプロパティに依存する条件付きフィールドを含んでもよい。サブセットの定義320は、参照するNALユニットがVCLデータを含み且つ非VCLデータを含まない場合にのみ使用される構文要素を例示する(尚、本開示において、例におけるNALユニットのタイプはAVCの仕様に従う)。
サブセットの定義320において、stream_idはビットストリームのサブセットである階層ストリームを識別し、stream_typeは指定されているストリームの種類を記述し、version_idはストリームを記述する際に従う仕様のバージョンを指定する。view_id、temporal_id、quality_id及びdependency_idのフラグの各々は、プロパティ又は対応するレイヤを識別する。更に詳細には、view_idはカメラビューを示し、temporal_idは、例えば30Hzのフレームレートを上位の60Hzにリファインする時間リファインレイヤを示し、quality_idは圧縮ビデオの信号忠実度を示し、dependency_idは空間スケーラビリティの場合の空間リファインレイヤを示す。
サブセットの定義自体は、例えば専用のNALユニット、すなわちStPSの形態でビットストリームにおいて搬送されてもよい。そのような専用のNALユニットは、専用のNALユニットのタイプにより示される。これは、パラメータセットを搬送するNALユニットのNALユニットヘッダにおいて特定のstream_idにより示されるパラメータセットのビットストリームサブセット等の専用のサブセットの一部であってもよい。そのようなストリームパラメータセットのNALユニットを搬送するサブセットは、stream_id=0等の事前に定義されたstream_idを有してもよい。
StPSは、時間拡張(temporal_id)、品質拡張(quality_id)、空間拡張(dependency_id)、優先順位(priority_id)、あるいはSVC及びMVCに対するNALユニットの拡張ヘッダにおいて搬送されるような何らかの信号伝送に関するパラメータを含んでもよい。StPSは、関連付けられたNALユニットにおいて搬送されるデータの種類に関する情報、すなわち、NALユニットがパラメータセット、SEIメッセージ、イントラピクチャ又はアンカーピクチャ等を含むかに関する情報を更に含んでもよい。StPSは、圧縮データが表現するコンテンツに関する高度な情報を更に搬送してもよく、例えば関連付けられたNALユニットがテクスチャデータ、奥行き情報又はオクルージョン情報等を表すかに関する情報を搬送してもよい。
図3に例示するサブセットの定義320等の本発明の一実施形態に係るストリームパラメータセットの構文は、拡張可能な方法で定義される。このために、それは、例えばバージョンNである仕様の特定のバージョンにより定義される構文要素を含む。例えばバージョンN+1である仕様の将来の更新において、追加の構文要素が含まれる。この場合、仕様のバージョンNに準拠する受信装置はバージョンNの構文要素しか解釈できないが、バージョンN+1に準拠する受信装置は追加の構文要素も解釈できる。この場合、StPSは可変長を有し、必要に応じて、仕様の新規バージョンにおいて拡張可能である。バージョンNの受信装置がバージョンNに準拠するパラメータ及びバージョンN+1に準拠する更なるパラメータを含むバージョンN+1のStPSを受信する場合、当該受信装置はバージョンNの構文要素を読み出し、バージョンN+1の構文要素を無視する。あるいは、バージョンNの受信装置は、バージョンNに準拠しないため解釈できない構文要素を見つけた場合、StPSと関連付けられたNALユニットを処理しないと決定する。装置の挙動、すなわち未知の構文を無視するか又は関連付けられたNALユニットを処理しないかは、例えば別個のフラグにより信号伝送される。
ストリームパラメータセットの構文は、それが準拠する仕様のバージョンを示すバージョン識別子を更に含んでもよい。バージョン識別子は例えば数値として表されてもよく、その場合、数値が大きくなるほど大きいバージョン番号を示す。バージョンNの受信装置がN以下のバージョン番号を有するStPSを受信する場合、当該受信装置は構文を解析できる。バージョンNの受信装置がNより大きいバージョン番号を有するStPSを受信する場合、当該受信装置は構文を解析できず、少なくともバージョン番号がNより大きいバージョンに特有の部分を解析できない。その場合、当該受信装置はStPSと関連付けられたNALユニットを処理しない。あるいは、当該受信装置は、StPS自体を解釈せずにStPSと関連付けられたNALユニットを復号化する。この挙動は、追加フラグにより制御されてもよい。
サブセットの定義320において示すように、ストリームパラメータセットとサブセットに含まれるNALユニットとの関連付けはパラメータstream_idにより提供され、ストリームパラメータセット、すなわちサブセットの定義を含むNALユニットと関連するNALユニットとは同一のstream_idでマークを付けられる。あるいは、StPSは、stream_idのリストを含むことにより2つ以上のstream_idとの関連を示し、例えばStPSがこれらのstream_idのうちのいずれかを有するNALユニットに対応することを示す。更に別の方法として、StPSは、M=「1111111100000000」(10進数で65280)等のビットマスクフィールド及び例えばV=「1010101000000000」(10進数で43520)である値フィールドを示し、「&」をビット単位の「and」演算とする「stream_id&M=V」等の条件に一致するstream_idを有する全てのNALユニットがStPSと関連付けられる。複数のstream_idを同一のStPSと関連付けることは、サブセットのプロパティに関するパラメータを搬送するために必要なStPSのパケット数が少ないという利点を有する。このように、複数の異なるstream_idに対応する複数のビットストリームサブセットに有効な情報が単一のStPSにおいて搬送される。これらのサブセットのうちの1つ又はいくつかに対してのみ有効な追加情報は、別個のStPSにおいて搬送可能である。
stream_idは数値であってもよく、低いstream_idを有するNALユニットがパラメータセット又はイントラフレーム等の重要度の高いデータを搬送し且つ高いstream_idを有するNALユニットがSEI又は時間拡張データ等の重要度の低いデータを搬送するように定義されてもよい。そのような優先順位情報を使用して、例えば帯域幅が制限されるためパケットを破棄する必要のあるネットワークノードは、stream_idの値が高いパケットを破棄し、stream_idの値が低いパケットを保持する。
SVC及びMVCのようにtemporal_id及びdependency_id等の複数のパラメータを使用する場合と比較して、stream_idの概念の利点は、間接指定を使用するため、新規のコーデック機能性が新たに設定される場合に新規のフィールドを導入する必要がないことである。更に、stream_idが関連付けられたビットストリームサブセットの相対的な優先順位を表す場合、いくつかの例では間接指定を分析する必要すらなく、NALユニットの構文解析及びディスパッチが更に単純になる。
ビデオ表現内にstream_idのリストを提供することにより、圧縮ビデオビットストリームの他の部分から独立して復号化可能な当該ビットストリームの一部が識別される。関連付けられたビットストリームサブセットは復号化可能なビデオを形成する。すなわち、表現外のNALユニットに対するピクチャ間又はビュー間の依存性は存在しない。これは、単一のstream_idにより識別されるが例えば時間拡張情報のみを含む場合に独立して復号化されないビットストリームサブセットと異なる。ビデオ表現は、例えばテクスチャ、奥行き又はオクルージョン情報であるコンテンツの種類等の特定のプロパティと関連付けられる。
ビデオ表現の定義、すなわち必要なstream_idのリスト及び表現の追加のプロパティは、ビットストリーム内の別個のビデオパケット、すなわちRPSにおいて提供されてもよい。表現のパラメータセットを提供する少なくとも2つの方法が存在する。1つの方法は、1つのNALユニットにおいて1つのRPSのみを提供することである。別の方法として、本発明の一実施形態に係るNALユニット330により示すような単一のNALユニットにおいて複数のRPSを提供する。
ビデオ表現の定義330において、num_representationsはこのNALユニットにおいて指定される表現の数であり、representation_idはビデオ表現を識別し、representation_priority_idは表現の優先順位を定義し、representation_typeはビデオ表現の種類である。ビデオ表現の種類は、例えば以下のうちのいずれか1つである。
−テクスチャのみを有する平面ビデオ。
−テクスチャのみ及び立体アプリケーションを有する立体ビデオ。
−テクスチャ及び奥行き情報を有し、ビューの合成を使用して何らかの裸眼立体/立体効果を生成する平面ビデオ。
−テクスチャ及び奥行き情報を有し、ビューの合成を使用して十分な裸眼立体効果を生成する立体ビデオ。
−テクスチャ、奥行き及び非オクルージョン情報を有し、ビューの合成を使用して十分な裸眼立体/立体効果を生成する平面ビデオ。
−可逆チャネルを使用して事前に帯域外でネットワーク要素及びクライアントに送信されるSPS及びPPS。
ビデオ表現の定義330を更に参照すると、num_streamsはこの表現に含まれる必要なストリームの数を信号伝送し、各stream_idは必要なストリームを指定する。オプションとして、RPS情報を搬送するNALユニットは、例えばstream_id=0である事前に定義されたstream_idでマークを付けられてもよい。
表現の定義330において示したように、RPSにより定義されるプロパティのうちの1つは、他のビデオ表現に対する現在の表現の優先順位の値を示す優先順位標識representation_priority_idであってもよい。
表現の定義であるRPS及びサブセットの定義であるStPSに基づいて、動的ストリーミングの手法が単純な方法で適用される。例えばサーバは、quality_id=0、1及び2によりそれぞれ識別される3つのビットストリームサブセット、すなわちレイヤを有するビデオビットストリームを提供する。これらのストリームは、低品質、中間品質及び高品質の3つのビデオ表現に選択的に組み合わされる。この場合、低品質の表現はquality_id=0を有するサブセットを含み、中間品質の表現はquality_id=1及びquality_id=2を有する2つのサブセットを含み、第3の表現は3つ全てのサブセットを含む。クライアントは、短いバッファ時間を得るために品質は最低であるがサイズが最小である第1のストリームのダウンロードを開始してもよい。ビデオをしばらく再生した後、ネットワークの帯域幅が利用可能であると検出した場合、クライアントは中間品質又は高品質の表現に切り替えてもよい。ネットワークにおいて輻輳が発生した場合、クライアントは低品質のレベルに引き下げてもよい。
quality_idとサブセットの定義において定義される他のパラメータとを有することで、必要なビットストリームサブセットの選択は容易になる。このために、クライアントは、SVCのNALユニットヘッダの場合のように複数の識別子を構文解析し且つ解釈するのではなく、stream_idに関する規則を用いて単純に命令される。尚、通常は帯域幅が品質と正相関を有するため、quality_idの代わりにbandwidth_idを信号伝送して必要なビットレートを示してもよい。
本発明の実施形態によると、パケットを受信又は転送するビデオパケット受信機又はビデオパケット転送機等のネットワーク要素、あるいはビデオパケットを受信及び復号化する復号化装置は、以下のようにstream_idを解釈する。受信、転送又は復号化動作に関係すると考えられるstream_idのリストがネットワーク又は復号化装置に提供されると仮定する。ビデオパケットが受信されると、stream_idが検査される。stream_idの値に従って、ビデオパケットは受信/転送/復号化される、すなわちビットストリームから抽出されるか、あるいは破棄される。すなわち、ビデオパケット内のstream_idが関係のあるstream_idのうちの1つと一致する場合、パケットは更に処理される。ビデオパケット内のstream_idが関係のあるstream_idのうちのいずれとも一致しない場合、パケットは破棄され、それ以上処理されない。
関係のあるstream_idのリストは、事前に定義されたstream_idを含んでもよい。例えばこれは、関連付けられたビットストリームサブセットがパラメータセットを含むことを示すstream_id=0を含んでもよい。このように、受信/転送/復号化装置は全てのパラメータセットを受信する。その後、装置は例えばStPS又はRPSのうちの1つ又はいくつかを解釈し、それに従って、関係のあるstream_idのリストを更新する。このために、受信装置は、全てのStPSを受信して、特定のプロパティに対してStPSの構文を検査してもよい。例えばテクスチャデータ等のビデオデータの種類である所定のプロパティを有するStPSが検出される場合、関連付けられたstream_idを有するビデオパケットがビットストリームから抽出される。このように、StPS及び関連付けられたstream_idは、StPSにおいて搬送されるtemporal_id、view_id、quality_id又はビデオデータの種類等のパラメータに基づいて選択可能である。
サブセットの関連性は、関連付けられたStPSにおいて搬送されるバージョン識別子に基づいて更に判定されてもよい。受信装置がStPSにおいて示されるバージョン識別子に準拠する場合、当該装置は関連付けられたNALユニットを抽出する。受信装置がそのようなバージョン識別子に準拠しない場合、当該装置は関連付けられたNALユニットを破棄する。
関係のあるストリーム識別子のリストは、関係があると考えられる表現の定義を検査することにより取得されてもよい。この場合、ストリーム識別子のリストは表現の定義から抽出され、関係のあるストリーム識別子として使用される。
受信装置は、全てのRPSを受信し、例えば優先順位、ビデオコンテンツの種類又はビデオの解像度である特定のプロパティに対してRPSの構文を検査する。所定のプロパティを有するRPSが検出される場合、全ての関連付けられたstream_idが関係のあるstream_idであると考えられ、ビットストリームから抽出される。
あるいは、受信/転送/復号化装置は、各NALユニットの優先順位に基づいて、パケットを抽出するか又は破棄するかを決定する。特に、stream_idがビットストリームサブセットの相対的な優先順位に従って定義される場合、受信/転送/復号化装置は、stream_idが「低い」、すなわち重要度の高いデータを含むパケットを抽出し、stream_idが「高い」、すなわち重要度の低いデータを含むパケットを破棄する。stream_idの数値が「低い」又は「高い」という決定は、閾値に基づいてもよい。この手法は、帯域幅が制限される場合のネットワーク要素におけるパッケージの非処理又はビットストリームの間引きに使用される。
本発明を更に説明するために、一例を以下に提示する。例は立体ビデオに関し、すなわち、view_id=0及びview_id=1をそれぞれ有し且つ付随する奥行きデータを有する2つのビューに関する。テクスチャ及び奥行きビデオの双方は、異なるtemporal_idにより示される何らかの時間スケーラビリティを提供すると仮定する。この場合、temporal_id=0は例えば30Hzフレームレートのビデオである時間の基本品質を示し、temporal_id=1は例えばフレームレートを30Hzから60Hzに拡張するための時間拡張情報を有する。
利用可能なビュー及び時間解像度に対するテクスチャ及び奥行きの双方に関するデータを搬送するNALユニットは、複数のビットストリームサブセットを使用して同一のビットストリームに多重化される。本発明の実施形態に係るビットストリームサブセット及びビデオ表現の概念を使用する場合、それらは一意に識別可能である。
以下の表は、サブセットの定義の一例を提供する。
Figure 0005553945
テクスチャデータ、view_id=0及びview_id=1に対応するstream_id=1〜5を有する5つのサブセット、並びに奥行きデータに対応するstream_id=6〜10を有する5つの更なるサブセットが存在する。stream_id=1及びstream_id=6を有するサブセットは、シーケンスパラメータセット(SPS)及びピクチャパラメータセット(PPS)、すなわち非VCLデータをそれぞれ搬送するサブセットを示す。残りのstream_idは、VCLデータを搬送するサブセットを示す。
更に、対応する表現の定義の一例を以下の表に示す。
Figure 0005553945
表中、representation_id=0を有する表現は、テクスチャ部分に対するSPS及びPPSのみであるstream_id=1を有するNALユニットを含む。別の例として、representation_id=3を有する表現はstream_id=1、2及び3を含み、テクスチャ情報のみを含むview_id=0の単一ビューのビデオを表現する。更なる例として、representation_id=7は完全なビットストリームに対応する。
表現の定義を受信後、受信又は転送装置は、信号伝送されたプロパティに依存して、所定のアプリケーションに対して最も適切な表現を決定し、それにより、関係のあるstream_idのリストを取得する。装置は、受信されるNALユニットのNALユニットヘッダを検査することにより、これらのstream_idと関連付けられたNALユニットを容易に抽出できる。
以下、図4を参照して、圧縮ビデオビットストリーム内のビットストリームサブセットを示す方法の実施形態を説明する。方法の一実施形態は、例えば図1を参照して説明した符号化装置110等の送出装置において実行される。特に、方法の一実施形態は、ビデオ符号器から圧縮ビデオビットストリームを受信するビットストリームマーク付け装置、すなわちビットストリームマーカにおいて実行されてもよい。このために、方法の一実施形態はビデオ符号器において実現されてもよい。ビットストリームマーカは、各々が例えばビデオフレームである圧縮ビデオデータ、補足情報又は一般にNALユニットを含むビデオパケットにビットストリームを細分化する。その後、各ビデオパケットは、本発明の一実施形態に係るNALユニットヘッダ内の構文要素stream_idを使用して、単一のサブセット識別子でマークを付けられる。オプションとして、ビデオ符号器はビットストリームマーカにパケット化されたビデオビットストリームを提供してもよく、その場合、ビットストリームマーカはビットストリームをパケットに細分化する必要がない。更に、本発明の一実施形態に係るマーク付け手順は、別個のビットストリームマーカではなくビデオ符号器により実行されてもよい。
圧縮ビデオビットストリーム内のビットストリームサブセットを示す方法の一実施形態410を図4に示す。方法410は、例えばビデオ符号器から圧縮ビデオビットストリームを受信すること(411)と、圧縮ビデオビットストリームをビデオパケットに分割すること(412)と、複数のサブセット識別子のうちの単一のサブセット識別子で各ビデオパケットにマークを付けること(413)とを備える。複数のサブセット識別子の各サブセット識別子は、複数のビットストリームサブセットのうちの対応するビットストリームサブセットと関連付けられる。
オプションとして、方法410は、少なくとも1つのサブセットの定義を提供すること(414)を更に備える。サブセットの定義の各々は、複数のビットストリームサブセットのうちの対応するビットストリームサブセットのプロパティを記述する。サブセットの定義は、圧縮ビデオビットストリーム内のビデオパケットとして提供され、ネットワーク要素及びクライアントに送信されてもよい。
ステップ414で提供されるサブセットの定義に加えて、方法410は少なくとも1つのビデオ表現の定義を提供すること(415)を更に備えてもよい。ビデオ表現の定義の各々は少なくとも1つの関係のあるサブセット識別子を含み、少なくとも1つの関係のあるサブセット識別子と関連付けられた全てのビットストリームサブセットは復号化可能なビデオ表現を形成する。少なくとも1つのビデオ表現の定義は、圧縮ビデオビットストリーム内のビデオパケットとして提供され、ネットワーク要素及びクライアントに送信されてもよい。
以下、図5を参照して、ビデオパケットに分割された圧縮ビデオビットストリームからビデオパケットを抽出する方法の実施形態を説明する。方法の一実施形態は、例えば図1を参照して説明したネットワーク要素121〜123等の受信装置又は復号化装置130において実行される。特に、本発明の一実施形態は、ビデオパケットに分割された圧縮ビデオビットストリームを受信するビットストリーム抽出装置、すなわちビットストリーム抽出器において実行されてもよい。このために、方法の一実施形態は、ビデオ復号器又はビデオパケットをルーティングするように構成されるネットワーク要素において実現されてもよい。
ビデオパケットに分割された圧縮ビデオビットストリームからビデオパケットを抽出する方法の一実施形態510を図5に示す。方法510は、少なくとも1つの関係のあるサブセット識別子を提供すること(511)と、圧縮ビデオビットストリームからビデオパケットを受信すること(512)と、受信したビデオパケット毎に(513)、ビデオパケットのサブセット識別子を検査すること(514)と、抽出したサブセット識別子が少なくとも1つの関係のあるサブセット識別子のうちの1つと一致するという条件で(515)、圧縮ビデオビットストリームからビデオパケットを抽出すること(516)とを備える。
オプションとして、方法510は、抽出したビデオパケットを転送又は復号化すること(517)と、抽出したサブセット識別子が少なくとも1つの関係のあるサブセット識別子のうちのいずれとも一致しないという条件で(515)、受信したビデオパケットを破棄すること(518)とを更に備える。
更に、方法510は、複数のビットストリームサブセットのうちの対応するビットストリームサブセットのプロパティを記述するサブセットの定義を提供すること(519)を備えてもよい。対応するビットストリームと関連付けられたサブセット識別子は、ステップ511で少なくとも1つの関係のあるサブセット識別子として使用される。
オプションとして、ステップ519において、サブセットの定義は対応するビットストリームサブセットの少なくとも1つのプロパティに従って複数のサブセットの定義から選択されてもよい。サブセットの定義は、圧縮ビデオビットストリーム内のビデオパケットから受信されてもよい。
更に、方法510は、少なくとも1つの関係のあるサブセット識別子を含むビデオ表現の定義を提供すること(520)を更に備えてもよい。少なくとも1つの関係のあるサブセット識別子と関連付けられたビットストリームサブセットは復号化可能なビデオ表現を形成する。ビデオ表現の定義は、圧縮ビデオビットストリーム内のビデオパケットから受信されてもよい。
以下、図6を参照して、本発明の一実施形態に係る圧縮ビデオビットストリーム内のビットストリームサブセットを示すビットストリームマーカを説明する。ビットストリームマーカの一実施形態は、例えば図1を参照して説明した符号化装置110内に位置する。特に、ビットストリームマーカの一実施形態はビデオ符号器において実現されてもよい。
ビットストリームマーカ620は、ビデオソース信号601を符号化するように構成されるビデオ符号器610から圧縮ビデオビットストリーム602を受信する。ビットストリームマーカ620は、各々が例えばビデオフレームである圧縮ビデオデータ、補足情報又は一般にNALユニットを含むビデオパケットにビットストリーム602を細分化する。その後、各ビデオパケットは、前述したように、NALユニットヘッダ内の構文要素stream_idを使用して単一のサブセット識別子でマークを付けられる。ビットストリームマーカ620は、パケット化され且つマークを付けられたビットストリーム603をネットワーク120等の転送ネットワークに送信し、最終的にクライアント又は図1を参照して説明した復号化装置130等のピア・トゥ・ピアネットワーク内のピアに送信する。
このために、ビットストリームマーカ620は、圧縮ビデオビットストリームを受信する受信ユニット621と、圧縮ビデオビットストリームをビデオパケットに分割するように構成されたパケット化ユニット622と、単一のサブセット識別子stream_idで各ビデオパケットにマークを付けるマーク付けユニット623とを備える。
更に、ビットストリームマーカ620は、オプションで、少なくとも1つのサブセットの定義を提供するサブセットの定義ユニット624を備えてもよい。サブセットの定義は、圧縮ビデオビットストリーム内のビデオパケットとして提供されてもよい。
更に、ビットストリームマーカ620は、オプションで、少なくとも1つのビデオ表現の定義を提供するビデオ表現の定義ユニット625を備えてもよい。ビデオ表現の定義は、圧縮ビデオビットストリーム内のビデオパケットとして提供されてもよい。
受信ユニット621、パケット化ユニット622、マーク付けユニット623、サブセットの定義ユニット624及びビデオ表現ユニット625は、回路網、集積回路(IC)、特定用途向け集積回路(ASIC)、1つ以上のプロセッサ上で実行するコンピュータプログラムモジュール、あるいはそれらの組み合わせにより実現される。ユニット621〜625は別個のユニットとして実現されてもよく、あるいは組み合わされて実現されてもよい。
ビデオ符号器610はビットストリームマーカ620にパケット化されたビデオビットストリーム602を提供してもよく、その場合、ビットストリームマーカ620はビットストリーム602をパケットに細分化する必要がないことが理解されるだろう。更に、上述の本発明の一実施形態に係るマーク付け手順は、別個のビットストリームマーカではなくビデオ符号器610により実現されてもよい。更に、コンピュータプログラムの一実施形態を用いて既存のビデオ符号器のソフトウェアを更新することにより、既存のビデオ符号器が本発明の一実施形態に係るビットストリームのマーク付けを実行するように構成されてもよい。
以下、図7を参照して、本発明の一実施形態に係る圧縮ビデオビットストリームからビデオパケットを抽出するビットストリーム抽出器を説明する。ビットストリーム抽出器の一実施形態は、例えば図1を参照して説明した復号化装置130又はネットワーク要素121〜123内に位置する。特に、ビットストリーム抽出器の一実施形態はビデオ復号器において実現されてもよく、あるいはビデオパケットをルーティングするように構成されるネットワーク要素において実現されてもよい。
ビットストリーム抽出器710は、圧縮ビデオビットストリーム701、ビデオパケット、すなわち複数のビットストリームサブセットと関連付けられたNALユニットを受信する。ビデオビットストリーム701は、例えば図1を参照して説明したネットワーク120等の転送ネットワークから受信される。ビットストリーム抽出器710は、ビットストリーム701に含まれる関係のあるNALユニットを識別し、更なる処理のためにそれらを抽出する。
このために、ビットストリーム抽出器710は、少なくとも1つの関係のあるサブセット識別子を提供するサブセット選択ユニット711と、ビデオビットストリーム701からビデオパケットを受信する受信ユニット712と、受信したビデオパケット毎にそのサブセット識別子を検査し且つ抽出したサブセット識別子が少なくとも1つの関係のあるサブセット識別子のうちの1つと一致するという条件でビデオビットストリーム701からビデオパケットを抽出する抽出ユニット713とを備える。オプションとして、抽出ユニット713は、受信したビデオパケット毎に、抽出したビデオパケットの転送又は復号化、並びにビデオパケットの破棄(704)を行うように更に構成される。ビデオパケットが転送される場合、これは例えばビデオ復号器720に送信される(702)。ビデオ復号器720はビデオ信号を復号化し、閲覧者に対する表示等の更なる処理のために復号化ビデオ信号703を出力する。受信したビデオパケットは、抽出されたサブセット識別子が少なくとも1つの関係のあるサブセット識別子のうちのいずれとも一致しないという条件で破棄される(704)。
オプションとして、ビットストリーム抽出器710は、サブセットの定義を提供するサブセットの定義ユニット714を更に備えてもよい。サブセットの定義ユニット714は、対応するビットストリームサブセットの少なくとも1つのプロパティに従って複数のサブセットの定義から1つのサブセットの定義を選択するように構成される。サブセットの定義ユニット714は、圧縮ビデオビットストリーム内のビデオパケットからサブセットの定義を受信するように更に構成されてもよい。
ビットストリーム抽出器710等のビットストリーム抽出器の一実施形態は、ビデオ表現の定義を提供するビデオ表現の定義ユニット715を更に備えてもよい。ビデオ表現の定義ユニット715は、圧縮ビデオビットストリーム内のビデオパケットからビデオ表現の定義を受信するように更に構成されてもよい。
サブセット選択ユニット711、受信ユニット712、抽出ユニット713、サブセットの定義ユニット714及びビデオ表現ユニット715は、回路網、IC、ASIC、1つ以上のプロセッサ上で実行するコンピュータプログラムモジュール、あるいはそれらの組み合わせにより実現される。ユニット711〜715は、別個のユニットとして実現されてもよく、あるいは組み合わされて実現されてもよい。
ビデオビットストリームからビットストリームサブセット、すなわちビデオパケットを抽出する手順は、別個のビットストリーム抽出器ではなくビデオ復号器720により実行されてもよいことが理解されるだろう。更に、コンピュータプログラムの一実施形態を用いて既存のビデオ復号器のソフトウェアを更新することにより、既存のビデオ復号器が本発明の一実施形態に係るビットストリームの抽出を実行するように構成されてもよい。
図8を参照して、本発明の実施形態に係るコンピュータプログラム及びコンピュータプログラム製品を示す。
図8は、ビデオビットストリーム801を処理し且つ処理されたビデオビットストリーム802を出力するビデオ処理装置800を示す。ビデオ処理装置800は、プロセッサ803及び記憶媒体804を備える。コンピュータプログラム製品は、コンピュータプログラム805を記憶した記憶媒体804を備える。あるいは、コンピュータプログラム805は、フロッピディスク又はメモリスティック等の適切なコンピュータプログラム製品により記憶媒体804に転送される。更なる方法として、コンピュータプログラム805は、ネットワークを介して記憶媒体804にダウンロードされる。プロセッサ803は、記憶媒体804からコンピュータプログラム805をロードしてコンピュータプログラム805に含まれるコンピュータプログラムコードを実行することにより本発明の第1の態様又は第4の態様に係る方法の一実施形態を実現するように構成される。例えばプロセッサ803は、コンピュータプログラム805を実行する時に、圧縮ビデオビットストリーム内のビットストリームサブセットを示す方法の一実施形態を実現するように構成される。あるいは、プロセッサ803は、コンピュータプログラム805を実行する時に、圧縮ビデオビットストリームからビデオパケットを抽出する方法の一実施形態を実現するように構成される。プロセッサ803は、汎用プロセッサ、ビデオプロセッサ、あるいはコンピュータプログラム805を実行する時に本発明の第1の態様又は第4の態様に係る方法の一実施形態を実現するように構成される他の何らかの種類の回路網である。処理装置800は、例えば移動電話、タブレット、ユーザ機器(UE)、パーソナルコンピュータ、ビデオプレーヤ/レコーダ、マルチメディアプレーヤ、メディアストリーミングサーバ、セットトップボックス、テレビ、あるいは演算機能を有する他の何らかの種類の装置に含まれてもよい。
更に、上述した本発明の全ての実施形態は、ソフトウェア、ハードウェア又はそれらの組み合わせでビデオ符号器又は復号器において実現される。符号器及び/又は復号器は、送出装置と受信装置との間の通信ネットワーク内のネットワークノードであるか又はそのようなネットワークノードに属するネットワーク装置において実現されてもよい。そのようなネットワーク装置は、例えば受信装置が送出装置から送出されたビデオ符号化規格ではない別のビデオ符号化規格のみに対応するか又はそれを優先することが確立される場合に1つのビデオ符号化規格に従うビデオを別のビデオ符号化規格に変換する装置である。上記で開示したビデオ符号器及び/又は復号器は物理的に別個の装置として開示され、1つ以上のASIC等の特定用途向け回路に含まれてもよいが、本発明は、符号器及び/又は復号器の一部が1つ以上の汎用プロセッサ上で実行するコンピュータプログラムモジュールとして実現される装置の実施形態を範囲に含む。
本発明は上述の実施形態に限定されないことが当業者には理解される。多くの変更及び変形が添付の特許請求の範囲の範囲内で可能である。例えば提案された階層ストリームの信号伝送の概念は、原則的に、オーディオ、字幕及びグラフィックス等の全ての種類のメディアに適用される。更に、クライアント又はネットワーク要素が信頼性の高い伝送チャネルによりStPS及びRPSを有利に取得できる一方で、ビデオデータを含む残りのビットストリームサブセットを送信するためにHTTP及びRTP等の伝送プロトコルが使用されてもよい。最後に、NALユニットヘッダは、単一のサブセット識別子stream_idに加えて、更なる情報要素を含んでもよいことが更に理解されるだろう。

Claims (28)

  1. 複数のビットストリームサブセットを含む圧縮ビデオビットストリーム(210)内のビットストリームサブセットを示す方法(410)であって、
    前記圧縮ビデオビットストリームを受信すること(411)と、
    各々がビデオデータ又は補足情報のいずれか一方を含むビデオパケット(211〜216)に前記圧縮ビデオビットストリームを分割すること(412)と、
    複数のサブセット識別子のうちの一つのサブセット識別子で各ビデオパケットにマークを付けること(413)と、前記複数のサブセット識別子の各サブセット識別子が前記複数のビットストリームサブセットのうちの対応するビットストリームサブセットと関連付けられ、
    各々が少なくとも1つの関係のあるサブセット識別子を含む少なくとも1つのビデオ表現の定義(231〜233、330)を提供すること(415)と、を備え、前記少なくとも1つの関係のあるサブセット識別子と関連付けられた前記ビットストリームサブセットは復号化可能なビデオ表現を形成する、ことを特徴とする方法。
  2. 各々が前記複数のビットストリームサブセットのうちの対応するビットストリームサブセットのプロパティを記述する少なくとも1つのサブセットの定義(221〜223、320)を提供すること(414)を更に備えることを特徴とする請求項1記載の方法。
  3. 前記少なくとも1つのサブセットの定義(221〜223、320)は、前記圧縮ビデオビットストリーム(210)内のビデオパケットとして提供されることを特徴とする請求項2記載の方法。
  4. 前記複数のサブセット識別子の各サブセット識別子は、関連付けられたビットストリームサブセットの相対的な優先順位に対応する数値であることを特徴とする請求項1から3のいずれか1項に記載の方法。
  5. 前記少なくとも1つのビデオ表現の定義(231〜233、330)は、前記圧縮ビデオビットストリーム(210)内のビデオパケットとして提供されることを特徴とする請求項1記載の方法。
  6. プロセッサ(803)上で実行される時に請求項1から5のいずれか1項に記載の方法を実現するように構成されたコンピュータプログラム(805)。
  7. 請求項6記載のコンピュータプログラム(805)を記憶したコンピュータ読み取り可能な記憶媒体(804)。
  8. ビデオパケット(211〜216)に分割された圧縮ビデオビットストリームからビデオパケットを抽出する方法(510)であって、前記圧縮ビデオビットストリーム(210)は複数のビットストリームサブセットを含み、各ビデオパケットがビデオデータ又は補足情報のいずれか一方と複数のサブセット識別子のうちの一つのサブセット識別子とを含み、各サブセット識別子が複数のビットストリームサブセットのうちの対応するビットストリームサブセットと関連付けられ、
    少なくとも1つの関係のあるサブセット識別子を含むビデオ表現の定義(231〜233、330)を提供すること(520)と、前記少なくとも1つの関係のあるサブセット識別子と関連付けられた前記ビットストリームサブセットは復号化可能なビデオ表現を形成し、
    前記圧縮ビデオビットストリームからビデオパケットを受信すること(512)と、
    受信したビデオパケット毎に、
    前記ビデオパケットの前記サブセット識別子を検査すること(514)と、
    前記抽出されたサブセット識別子が前記少なくとも1つの関係のあるサブセット識別子のうちの1つと一致する場合に(515)、前記圧縮ビデオビットストリームから前記ビデオパケットを抽出すること(516)と、
    を備えることを特徴とする方法。
  9. 受信したビデオパケット毎に、
    前記抽出したビデオパケットを転送又は復号化すること(517)と、
    前記抽出されたサブセット識別子が前記少なくとも1つの関係のあるサブセット識別子のいずれとも一致しない場合に(515)、前記受信したビデオパケットを破棄すること(518)と、
    を更に備えることを特徴とする請求項8記載の方法。
  10. 前記複数のビットストリームサブセットのうちの対応するビットストリームサブセットのプロパティを記述するサブセットの定義(221〜223、320)を提供すること(519)と、
    前記対応するビットストリームサブセットと関連付けられた前記サブセット識別子を前記少なくとも1つの関係のあるサブセット識別子として使用すること(511)と、
    を更に備えることを特徴とする請求項8又は9記載の方法。
  11. 前記対応するビットストリームサブセットの少なくとも1つのプロパティに従って、複数のサブセットの定義(221〜223、320)から前記サブセットの定義を選択すること(519)を更に備えることを特徴とする請求項10記載の方法。
  12. 前記圧縮ビデオビットストリーム(210)内のビデオパケットから前記サブセットの定義(221〜223、320)を受信すること(519)を更に備えることを特徴とする請求項10又は11記載の方法。
  13. 前記圧縮ビデオビットストリーム(210)内のビデオパケットから前記ビデオ表現の定義(231〜233、330)を受信すること(520)を更に備えることを特徴とする請求項8記載の方法。
  14. 前記複数のサブセット識別子の各サブセット識別子は、関連付けられたビットストリームサブセットの相対的な優先順位に対応する数値であることを特徴とする請求項8から13のいずれか1項に記載の方法。
  15. プロセッサ(803)上で実行される時に請求項8から14のいずれか1項に記載の方法を実現するように構成されたコンピュータプログラム(805)。
  16. 請求項15記載のコンピュータプログラム(805)を記憶したコンピュータ読み取り可能な記憶媒体(804)。
  17. 複数のビットストリームサブセットを含む圧縮ビデオビットストリーム(210、602)内のビットストリームサブセットを示すビットストリームマーカ(110、620)であって、
    前記圧縮ビデオビットストリームを受信するように構成された受信ユニット(621)と、
    各々がビデオデータ又は補足情報のいずれか一方を含むビデオパケット(211〜216)に前記圧縮ビデオビットストリームを分割するように構成されたパケット化ユニット(622)と、
    複数のサブセット識別子のうちの一つのサブセット識別子で各ビデオパケットにマークを付けるように構成されたマーク付けユニット(623)と、各サブセット識別子は前記複数のビットストリームサブセットのうちの対応するビットストリームサブセットと関連付けられており、
    各々が少なくとも1つの関係のあるサブセット識別子を含む少なくとも1つのビデオ表現の定義(231〜233、330)を提供するように構成されたビデオ表現の定義ユニット(625)を更に備え、前記少なくとも1つの関係のあるサブセット識別子と関連付けられた前記ビットストリームサブセットは復号化可能なビデオ表現を形成する、ことを特徴とするビットストリームマーカ。
  18. 各々が前記複数のビットストリームサブセットのうちの対応するビットストリームサブセットのプロパティを記述する少なくとも1つのサブセットの定義(221〜223、320)を提供するように構成されたサブセットの定義ユニット(624)を更に備えることを特徴とする請求項17記載のビットストリームマーカ。
  19. 前記少なくとも1つのサブセットの定義(221〜223、320)は、前記圧縮ビデオビットストリーム(210、603)内のビデオパケットとして提供されることを特徴とする請求項18記載のビットストリームマーカ。
  20. 前記複数のサブセット識別子の各サブセット識別子は、関連付けられたビットストリームサブセットの相対的な優先順位に対応する数値であることを特徴とする請求項17から19のいずれか1項に記載のビットストリームマーカ。
  21. 前記少なくとも1つのビデオ表現の定義(231〜233、330)は、前記圧縮ビデオビットストリーム(210、603)内のビデオパケットとして提供されることを特徴とする請求項17記載のビットストリームマーカ。
  22. ビデオパケット(211〜216)に分割された圧縮ビデオビットストリームからビデオパケットを抽出するビットストリーム抽出器(121〜123、130、710)であって、前記圧縮ビデオビットストリーム(210、701)は複数のビットストリームサブセットを含み、各ビデオパケットはビデオデータ又は補足情報のいずれか一方と複数のサブセット識別子のうちの一つのサブセット識別子とを含み、各サブセット識別子は複数のビットストリームサブセットのうちの対応するビットストリームサブセットと関連付けられ、前記ビットストリーム抽出器は、
    少なくとも1つの関係のあるサブセット識別子を含むビデオ表現の定義(231〜233、330)を提供するように構成されたビデオ表現の定義ユニット(715)と、前記少なくとも1つの関係のあるサブセット識別子と関連付けられた前記ビットストリームサブセットは復号化可能なビデオ表現を形成し、
    前記圧縮ビデオビットストリームからビデオパケットを受信するように構成された受信ユニット(712)と、
    受信したビデオパケット毎に、
    前記ビデオパケットの前記サブセット識別子を検査し、且つ
    前記抽出されたサブセット識別子が前記少なくとも1つの関係のあるサブセット識別子のうちの1つと一致する場合に、前記圧縮ビデオビットストリームから前記ビデオパケットを抽出するように構成された抽出ユニット(713)と、
    を備えることを特徴とするビットストリーム抽出器。
  23. 前記抽出ユニット(713)は、受信したビデオパケット毎に、
    前記抽出したビデオパケットを転送又は復号化し(702)、
    前記抽出されたサブセット識別子が前記少なくとも1つの関係のあるサブセット識別子のいずれとも一致しない場合に、前記受信したビデオパケットを破棄する(704)ように更に構成されることを特徴とする請求項22記載のビットストリーム抽出器。
  24. 前記複数のビットストリームサブセットのうちの対応するビットストリームサブセットのプロパティを記述するサブセットの定義(221〜223、320)を提供するように構成されたサブセットの定義ユニット(714)を更に備え、
    前記抽出ユニット(713)は、前記対応するビットストリームサブセットと関連付けられた前記サブセット識別子を前記少なくとも1つの関係のあるサブセット識別子として使用するように更に構成されることを特徴とする請求項22又は23記載のビットストリーム抽出器。
  25. 前記サブセットの定義ユニット(714)は、前記対応するビットストリームサブセットの少なくとも1つのプロパティに従って、複数のサブセットの定義(221〜223、320)から前記サブセットの定義を選択するように更に構成されることを特徴とする請求項24記載のビットストリーム抽出器。
  26. 前記サブセットの定義(221〜223、320)は、前記圧縮ビデオビットストリーム(210、701)内のビデオパケットから受信されることを特徴とする請求項24又は25記載のビットストリーム抽出器。
  27. 前記ビデオ表現の定義ユニット(715)は、前記圧縮ビデオビットストリーム(210、701)内のビデオパケットから前記ビデオ表現の定義(231〜233、330)を受信するように更に構成されることを特徴とする請求項22記載のビットストリーム抽出器。
  28. 前記複数のサブセット識別子の各サブセット識別子は、関連付けられるビットストリームサブセットの相対的な優先順位に対応する数値であることを特徴とする請求項22から27のいずれか1項に記載のビットストリーム抽出器。
JP2013550446A 2011-01-19 2012-01-19 ビットストリームサブセットの指示 Active JP5553945B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161434146P 2011-01-19 2011-01-19
US61/434,146 2011-01-19
PCT/SE2012/050040 WO2012099529A1 (en) 2011-01-19 2012-01-19 Indicating bit stream subsets

Publications (2)

Publication Number Publication Date
JP2014509114A JP2014509114A (ja) 2014-04-10
JP5553945B2 true JP5553945B2 (ja) 2014-07-23

Family

ID=46515960

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013550446A Active JP5553945B2 (ja) 2011-01-19 2012-01-19 ビットストリームサブセットの指示

Country Status (9)

Country Link
US (2) US9143783B2 (ja)
EP (1) EP2666296A4 (ja)
JP (1) JP5553945B2 (ja)
KR (1) KR101560956B1 (ja)
CN (1) CN103404140B (ja)
MA (1) MA34944B1 (ja)
SG (1) SG191748A1 (ja)
WO (1) WO2012099529A1 (ja)
ZA (1) ZA201304569B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10991144B2 (en) 2016-07-29 2021-04-27 Sony Corporation Image processing apparatus and image processing method

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2865177B1 (en) * 2012-06-25 2018-10-03 Huawei Technologies Co., Ltd. Method for signaling a gradual temporal layer access picture
WO2014102088A1 (en) * 2012-12-28 2014-07-03 Telefonaktiebolaget L M Ericsson (Publ) Decoder and encoder and methods therein for handling frame packing layering
US20160100230A1 (en) * 2013-05-07 2016-04-07 Vid Scale, Inc. Qoe-aware wifi enhancements for video applications
WO2015047162A1 (en) * 2013-09-26 2015-04-02 Telefonaktiebolaget L M Ericsson (Publ) Hybrid codec scalable video
US9948950B2 (en) * 2014-01-03 2018-04-17 Qualcomm Incorporated Disparity vector and/or advanced residual prediction for video coding
JP2015136059A (ja) * 2014-01-17 2015-07-27 ソニー株式会社 通信装置、通信データ生成方法、および通信データ処理方法
US9402083B2 (en) * 2014-04-24 2016-07-26 Vidyo, Inc. Signaling conformance points using profile space
US10284867B2 (en) 2014-12-18 2019-05-07 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding
US10579603B2 (en) * 2015-04-17 2020-03-03 International Business Machines Corporation Removing sets of tuples in a streaming environment
US10554992B2 (en) * 2015-06-03 2020-02-04 Avago Technologies International Sales Pte. Limited Inline codec switching
US10834444B2 (en) * 2015-08-25 2020-11-10 Sony Corporation Transmitting apparatus, transmission method, receiving apparatus, and reception method
US10553029B1 (en) 2016-09-30 2020-02-04 Amazon Technologies, Inc. Using reference-only decoding of non-viewed sections of a projected video
US10412412B1 (en) 2016-09-30 2019-09-10 Amazon Technologies, Inc. Using reference-only decoding of non-viewed sections of a projected video
US10609356B1 (en) * 2017-01-23 2020-03-31 Amazon Technologies, Inc. Using a temporal enhancement layer to encode and decode stereoscopic video content
US10674166B2 (en) * 2018-08-22 2020-06-02 Purdue Research Foundation Method and system for scalable video streaming
US11616858B2 (en) * 2020-08-06 2023-03-28 Level 3 Communications Llc Packet processing of streaming content in a communications network

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5874997A (en) * 1994-08-29 1999-02-23 Futuretel, Inc. Measuring and regulating synchronization of merged video and audio data
KR20000011109A (ko) * 1996-05-17 2000-02-25 마츠시타 덴끼 산교 가부시키가이샤 데이터 다중화 방법, 다중 데이터 재생 방법, 그 방법을 이용한다중 데이터 재생 장치, 및 그 방법을 기록한 기록 매체
JPH104539A (ja) * 1996-06-18 1998-01-06 Matsushita Electric Ind Co Ltd データ多重化方法及び多重データ再生装置
US6201834B1 (en) * 1996-12-20 2001-03-13 Intel Corporation Method and apparatus for packet loss recovery with standard-based packet video
SE521021C2 (sv) * 1998-06-18 2003-09-23 Ericsson Telefon Ab L M Förfarande och anordning vid överförande av bilder
KR100590185B1 (ko) * 1999-11-20 2006-06-14 삼성전자주식회사 부가정보를 포함하는 오디오/비디오데이터의 저장 및검색장치
US7486680B1 (en) * 2002-03-21 2009-02-03 Ji Zhang Packet schedule timestamp for a compressed bitstream
AU2003303166A1 (en) * 2002-12-20 2004-07-14 Koninklijke Philips Electronics N.V. Method and apparatus for handling layered media data
US8593932B2 (en) * 2003-05-16 2013-11-26 Qualcomm Incorporated Efficient signal transmission methods and apparatus using a shared transmission resource
JP4190357B2 (ja) * 2003-06-12 2008-12-03 シャープ株式会社 放送データ送信装置、放送データ送信方法および放送データ受信装置
EP1713276B1 (en) * 2004-02-06 2012-10-24 Sony Corporation Information processing device, information processing method, program, and data structure
BRPI0416621A (pt) * 2004-07-26 2007-01-16 Irdeto Access Bv método para embaralhar parcialmente um fluxo de dados
US20060146734A1 (en) * 2005-01-04 2006-07-06 Nokia Corporation Method and system for low-delay video mixing
KR100657322B1 (ko) * 2005-07-02 2006-12-14 삼성전자주식회사 로컬 3차원 비디오를 구현하기 위한 인코딩/디코딩 방법 및장치
US20070025441A1 (en) * 2005-07-28 2007-02-01 Nokia Corporation Method, module, device and system for rate control provision for video encoders capable of variable bit rate encoding
WO2007080223A1 (en) * 2006-01-10 2007-07-19 Nokia Corporation Buffering of decoded reference pictures
US8773494B2 (en) 2006-08-29 2014-07-08 Microsoft Corporation Techniques for managing visual compositions for a multimedia conference call
JP5143829B2 (ja) 2006-09-07 2013-02-13 エルジー エレクトロニクス インコーポレイティド スケーラブルビデオコーディングされたビットストリームのデコーディング方法及び装置
CN104093031B (zh) * 2006-10-16 2018-07-20 诺基亚技术有限公司 在多视点视频编码中实施已解码缓存器管理的系统和方法
US20080095228A1 (en) * 2006-10-20 2008-04-24 Nokia Corporation System and method for providing picture output indications in video coding
JP2008236667A (ja) * 2007-03-23 2008-10-02 Victor Co Of Japan Ltd デジタル放送受信装置
CN101690220B (zh) * 2007-04-25 2013-09-25 Lg电子株式会社 用于解码/编码视频信号的方法和装置
JP2009200567A (ja) * 2008-02-19 2009-09-03 Mitsubishi Electric Corp 映像記録再生装置
WO2009129838A1 (en) * 2008-04-25 2009-10-29 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Flexible sub-stream referencing within a transport data stream
WO2010058955A2 (ko) * 2008-11-18 2010-05-27 엘지전자 주식회사 영상 신호 처리 방법 및 장치
JP5338394B2 (ja) * 2009-03-10 2013-11-13 日本電気株式会社 映像配信システム、映像配信方法、映像配信装置及び映像配信プログラム
JP2010258997A (ja) * 2009-04-28 2010-11-11 Sharp Corp 番組データ記録再生装置及び番組データ記録再生方法
EP2425626A2 (en) 2009-05-01 2012-03-07 Thomson Licensing Inter-layer dependency information for 3dv
US8780999B2 (en) * 2009-06-12 2014-07-15 Qualcomm Incorporated Assembling multiview video coding sub-BITSTREAMS in MPEG-2 systems
WO2011004600A1 (ja) * 2009-07-10 2011-01-13 パナソニック株式会社 記録媒体、再生装置、及び集積回路
US8976871B2 (en) * 2009-09-16 2015-03-10 Qualcomm Incorporated Media extractor tracks for file format track selection

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10991144B2 (en) 2016-07-29 2021-04-27 Sony Corporation Image processing apparatus and image processing method

Also Published As

Publication number Publication date
US9143783B2 (en) 2015-09-22
EP2666296A1 (en) 2013-11-27
MA34944B1 (fr) 2014-03-01
CN103404140B (zh) 2017-06-13
US20160099988A1 (en) 2016-04-07
WO2012099529A1 (en) 2012-07-26
KR20130119479A (ko) 2013-10-31
ZA201304569B (en) 2015-11-25
EP2666296A4 (en) 2013-12-25
KR101560956B1 (ko) 2015-10-15
SG191748A1 (en) 2013-08-30
US9485287B2 (en) 2016-11-01
CN103404140A (zh) 2013-11-20
JP2014509114A (ja) 2014-04-10
US20130287123A1 (en) 2013-10-31

Similar Documents

Publication Publication Date Title
JP5553945B2 (ja) ビットストリームサブセットの指示
AU2018301314B2 (en) Region-wise packing, content coverage, and signaling frame packing for media content
JP6743059B2 (ja) カプセル化されたビットストリームからメディアデータ及びメタデータを取得するための、動作基点ディスクリプタを動的に設置可能な方法、デバイス及びコンピュータプログラム
JP5462259B2 (ja) トラックおよびトラックサブセットグループ化の方法および装置
JP6565679B2 (ja) 送信装置、送信方法、受信装置および受信方法
US11638066B2 (en) Method, device and computer program for encapsulating media data into a media file
CN110519596B (zh) 具有时域可缩放性的视频编码系统及其操作方法
US20160330255A1 (en) Method, device, and computer program for encoding inter-layer dependencies in encapsulating multi-layer partitioned timed media data
KR20190014500A (ko) Http 를 통한 동적 적응형 스트리밍에서의 가상 현실 비디오 시그널링
CN114503599A (zh) 使用gltf2场景描述中的扩展来支持视频和音频数据
CN111034203A (zh) 处理具有动态逐区封装的全向媒体
KR101345544B1 (ko) 기본시점 복호 및 시점 임의 접근을 지원하기 위한 다시점비디오 부호화 시스템, 복호화 시스템 및 비트스트림 추출시스템
US10944994B2 (en) Indicating bit stream subsets
CN106303673B (zh) 码流对齐、同步处理方法及发送、接收终端和通信系统
KR101584111B1 (ko) 클라우드 컴퓨팅을 이용한 멀티미디어 서비스 품질 향상 방법 및 이를 위한 기기
KR102654999B1 (ko) 강화된 영역별 패킹 및 뷰포트 독립적 hevc 미디어 프로파일
KR102117805B1 (ko) 전방향성 미디어 포맷을 이용한 미디어 데이터 프로세싱
WO2023274877A1 (en) Method, device, and computer program for dynamically encapsulating media content data

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140527

R150 Certificate of patent or registration of utility model

Ref document number: 5553945

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250