JP5875634B2 - マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法 - Google Patents

マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法 Download PDF

Info

Publication number
JP5875634B2
JP5875634B2 JP2014115437A JP2014115437A JP5875634B2 JP 5875634 B2 JP5875634 B2 JP 5875634B2 JP 2014115437 A JP2014115437 A JP 2014115437A JP 2014115437 A JP2014115437 A JP 2014115437A JP 5875634 B2 JP5875634 B2 JP 5875634B2
Authority
JP
Japan
Prior art keywords
enhancement layer
image
base layer
frame
enhancement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014115437A
Other languages
English (en)
Other versions
JP2014209746A (ja
Inventor
レオンタリス,アサナシオス
トゥーラピス,アレクサンドロス
ヴィ パハラワッタ,ペシャラ
ヴィ パハラワッタ,ペシャラ
ステック,ケヴィン
フサック,ウォルター
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2014209746A publication Critical patent/JP2014209746A/ja
Application granted granted Critical
Publication of JP5875634B2 publication Critical patent/JP5875634B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/139Format conversion, e.g. of frame-rate or size
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本開示は、画像処理及びビデオ圧縮に関する。より詳細には、本発明の実施形態は、マルチレイヤフレーム準拠ビデオ配信のための符号化及び復号化システム及び方法に関する。
近年、産業界において立体(3D)ビデオ配信への有意な関心及び牽引力がある。非常に多くの映画が3D立体ビデオを主流にし、一方で主要なスポーツイベントも3Dで制作されブロードキャストされている。アニメーション映画は、特に、益々、立体フォ―マットで生成され再生されている。
既に十分多くの3D能力のあるシネマスクリーンが設置されているが、消費者3Dアプリケーションはそうではない。この分野の努力は、まだ初期だが、幾つかの産業団体は、消費者3D対応ディスプレイの開発及びマーケティングに有意な努力を投じている(文献1)。
立体ディスプレイ技術及び立体コンテンツの生成は、十分に高品質の経験を保証するために適正に解決されなければならない課題である。3Dコンテンツの配信は、同様に重要である。コンテンツ配信は、圧縮を含む幾つかのコンポーネントを有する立体配信は、立体配信システムが2D配信システムの2倍も多い情報を処理するので、難しい。さらに、計算及びメモリスループットの要求も、有意に増大する。
通常、立体コンテンツが消費者へ配信される2つの主な流通経路がある。つまり、ブルーレイディスクのような固定媒体と、コンテンツが先ずセットトップボックスに配信され次にPCへ配信されるストリーミングソリューションである。
現在展開されているブルーレイプレイヤ及びセットトップボックスの大部分は、ITU-T/ISO/IECH.264/14496-10(非特許文献2)のAnnex Aのプロファイルに基づく最新技術のビデオ符号化規格(MPEG-4 Part10 AVCとしても知られる)及びSMPTE VC-1規格(非特許文献3)のようなコーデックのみに対応している。
これらのコーデックソリューションの各々は、サービスプロバイダが、単一のHD画像シーケンスを1920x1080ピクセル解像度で配信することを可能にする。しかしながら、立体コンテンツを配信することは、2つのシーケンス、左及び右のシーケンスのために情報を送信することを含む。素直なアプローチは、各ビューに1つの、2つの別個のビットストリームを符号化することである。アプローチは、サイマルキャストとしても知られている。
第一に、サイマルキャスト又は同様のアプローチは、圧縮効率が低い。これらは、許容可能な品質レベルを維持するために高帯域幅を用いる。これは、左及び右ビューのシーケンスが、相関していたとしても、独立に符号化されるためである。
第二に、2つの別個のビットストリームは、逆多重化され、2つの正しく同期をとられたデコーダで並列に復号化される。このようなデコーダを実施するために、2つの既存の市販のデコーダを用いることができる。さらに、並列復号化は、グラフィック処理ユニットのアーキテクチャに適する。
マルチレイヤに対応するコーデックは、立体ビデオに対して高い圧縮効率を提供し、同時に後方互換性を維持する。
マルチレイヤ又はスケーラブルビットストリームは、所定の依存関係により特徴付けられる複数のレイヤを有する。これらのレイヤの1又は複数は、他のレイヤの前に復号化される所謂基本レイであり、独立して復号化可能である。
他のレイヤは、通常、それらの機能が1又は複数の基本レイヤをパーシング及び復号化することにより得られるコンテンツを向上させることなので、拡張レイヤとして知られている。これらの拡張レイヤは、基本レイヤに依存する従属レイヤである。拡張レイヤはある種のレイヤ間予測を用い、1又は複数の拡張レイヤは、他の高優先度の拡張レイヤの復号化に依存していても良い。したがって、復号化は、中間レイヤのうちの1つで終了され得る。
マルチレイヤ又はスケーラブルビットストリームは、品質/信号対雑音比(SNR)、空間解像度、及び/又は時間解像度、及び/又は追加の視野の利用可能性の点でも拡張性を可能にする。例えば、H.264/MPEG-4 Part10, VC-1又はVP8のAnnex Aプロファイルに基づくコーデックを用い、時間的にスケーラブルなビットストリームを生成できる。
第1の基本レイヤは、復号化された場合、15フレーム毎秒(fps)で画像シーケンスのバージョンを提供できる。一方で、第2の拡張レイヤは、復号化された場合、既に復号化された基本レイヤと共同で、同じ画像シーケンスを30fpsで提供できる。
SNR及び空間スケーラビリティも可能である。例えば、H.264/MPEG-4 Part10 AVCビデオ符号化規格のScalable Video Coding(SVC)(Annex G)を適応するとき、Annex Aで符号化された基本レイヤは、画像シーケンスの粗品質バージョンを生成する。1又は複数の拡張レイヤは、視覚的品質の点で更なる増強を提供できる。同様に、基本レイヤは、画像シーケンスの低解像度バージョンを提供できる。解像度は、追加拡張レイヤを復号化することにより、空間的及び/又は時間的に向上できる。
スケーラブルな又はマルチレイヤビットストリームは、マルチビュースケーラビリティを提供するのにも有用である。
H.264/AVCのMulti View Coding(MVC)のStereo High Profile(Annex H)は、最近完成し、立体コンテンツを特徴とする次世代ブルーレイディスク(Blu-Ray 3D)のビデオコーデックとして適用されている。この符号化アプローチは、立体ビデオストリームの高ビットレート要件をある程度解決することを試みている。
Stereo High Profileは、H.264/AVCのAnnex AのHigh Profileに準拠する基本レイヤを利用し、基本ビューと称される1つのビュー(通常、左)を圧縮する。拡張レイヤは、次に、従属ビューと称される他のビューを圧縮する。基本レイヤはそれ自体が有効なH.264/AVCビットストリームであり、拡張レイヤとは独立して復号化できるが、拡張レイヤはそうではなく、通常真ではない。これは、拡張レイヤが動き補償予測の参照として、基本レイヤからの復号化ピクチャを用いるからである。その結果、従属ビュー(拡張レイヤ)はビュー間予測からの利益を得て、ビュー間の高い相関を有するシーンでは圧縮を有意に向上できる(つまり、ステレオ視差が小さい)。したがって、MVC拡張アプローチは、ステレオ視差を活用することにより、帯域幅の増大という問題に取り組もうとしている。
A. Tourapis, P. Pahalawatta, A. Leontaris, K. Stec, and W. Husak, "Encoding and Decoding Architecture for Format Compatible 3D Video Delivery," U.S. Provisional Patent Application No. 61/223,027, July 2009. A. Leontaris, A. Tourapis, and P. Pahalawatta, "Enhancement Methods for Sampled and Multiplexed Image and Video Data," U.S. Provisional Patent Application No. 61/365,743, July 2010. A. Tourapis, A. Leontaris, P. Pahalawatta, and K. Stec, "Directed Interpolation/Postprocessing methods for video encoded data," U.S. Provisional Patent Application No. 61/170,995, April 2009. P. Pahalawatta, A. Tourapis, W. Husak, "Systems and Methods for Multi-Layered Image and Video Delivery Using Reference Processing Signals", U.S. Provisional Patent Application No. 61/362,661, July 2010. D.C. Hutchison, "Introducing DLP 3-D TV", http://www.dlp.com/downloads/Introducing DLP 3D HDTV Whitepaper.pdf Advanced video coding for generic audiovisual services, http://www.itu.int/rec/recommendation. asp?type=folders&lang=e&parent=T-REC-H.264, March 2010. SMPTE 421M, "VC-1 Compressed Video Bitstream Format and Decoding Process", April 2006.
しかしながら、このようなアプローチは、既存の展開されているセットトップボックス及びブルーレイプレイヤ基盤との互換性を提供しない。既存のH.264デコーダは、基本ビューを復号化し表示できたとしても、従属(右)ビューを単に破棄し無視してしまう。その結果、既存のデコーダは、MVCを用いて符号化された3Dコンテンツを復号化し表示する能力を提供しない。したがって、MVCが3D互換性を保つと同時に、MVCはレガシー装置で3Dコンテンツを配信しない。後方互換性の欠如は、消費者3D立体ビデオの迅速な適用への更なる障壁である。
本開示の第1の態様によると、マルチレイヤフレームに準拠したビデオ配信のための符号化方法が提供される。当該符号化方法は、a)基本レイヤを通じて複数のデータカテゴリの画像又はビデオフレームを基本レイヤ処理するステップであって、i)前記複数のデータカテゴリの画像又はビデオフレームの基本レイヤフレーム準拠表現を供給するステップ、を含むステップ、b)1又は複数の拡張レイヤを通じて前記複数のデータカテゴリの画像又はビデオフレームを拡張レイヤ処理するステップであって、i)前記複数のデータカテゴリの画像又はビデオフレームの拡張レイヤフレーム準拠表現を供給するステップ、ii)少なくとも1つの拡張レイヤ参照ピクチャバッファを保持するステップ、iii)前記基本レイヤ又は異なる拡張レイヤへの少なくとも1つの従属関係を参照処理するステップ、iv)動き又は視差補償を実行するステップ、を含むステップ、を有し、前記1又は複数の拡張レイヤの各々は、前記複数のデータカテゴリの全てを処理する。
本開示の第2の態様によると、マルチレイヤフレーム準拠ビデオ配信のための符号化方法が提供される。当該符号化方法は、a)基本レイヤを通じて複数のデータカテゴリの画像又はビデオフレームを基本レイヤ処理するステップであって、i)前記複数のデータカテゴリの画像又はビデオフレームの基本レイヤフレーム準拠表現を供給するステップ、を含むステップ、b)1又は複数の拡張レイヤを通じて前記複数のデータカテゴリの画像又はビデオフレームを拡張レイヤ処理するステップであって、i)前記複数のデータカテゴリのうちの1つの画像又はビデオフレームの拡張レイヤ表現を供給するステップ、ii)各拡張レイヤに拡張レイヤ参照ピクチャバッファを保持するステップ、iii)前記基本レイヤ又は異なる拡張レイヤへの少なくとも1つの従属関係を参照処理するステップ、iv)動き又は視差補償を実行するステップ、を含むステップ、を有する。
本開示の第3の態様によると、マルチレイヤフレーム準拠ビデオ配信のための復号化方法が提供される。当該復号化方法は、a)基本レイヤを通じて複数の基本レイヤビットストリーム信号を基本レイヤ処理するステップであって、i)少なくとも1つのフレーム準拠基本レイヤ復号化画像を供給するステップ、を含むステップ、b)1又は複数の拡張レイヤを通じて前記複数の拡張ビットストリーム信号を拡張レイヤ処理するステップであって、i)複数のデータカテゴリの少なくとも1つの拡張レイヤ復号化画像又はビデオフレームを供給するステップ、ii)少なくとも1つの拡張レイヤ参照ピクチャバッファを保持するステップ、iii)前記基本レイヤ又は異なる拡張レイヤへの少なくとも1つの従属関係を参照処理するステップ、iv)視差補償を実行するステップ、を含むステップ、を有し、前記複数のデータカテゴリの全ては、同一の拡張レイヤで復号化され処理される。
本開示の第4の態様によると、マルチレイヤフレーム準拠ビデオ配信のための復号化方法が提供される。当ギア復号化方法は、a)基本レイヤを通じて基本レイヤを通じて複数の基本レイヤビットストリーム信号を基本レイヤ処理するステップであって、i)少なくとも1つのフレーム準拠基本レイヤ復号化画像又はビデオフレームを供給するステップ、を含むステップ、b)1又は複数の拡張レイヤを通じて複数のデータカテゴリの1又は複数の拡張レイヤを通じて前記複数の拡張ビットストリーム信号を拡張レイヤ処理するステップであって、前記複数のデータカテゴリの各々は、別個の拡張レイヤで別個に処理され、前記1又は複数の拡張レイヤの各々は、i)前記複数のデータカテゴリのうちの1つの少なくとも1つの拡張レイヤ復号化画像又はビデオフレームを供給するステップ、ii)少なくとも1つの拡張レイヤ参照ピクチャバッファを保持するステップ、iii)前記基本レイヤ又は異なる拡張レイヤへの少なくとも1つの従属関係を参照処理するステップ、iv)視差補償を実行するステップ、を含むステップ、を有し、前記複数のデータカテゴリの全ては、同一の拡張レイヤで復号化され処理される。
添付の図面は、本願明細書に組み込まれその一部を構成する。添付の図面は、例示的な実施形態の記載と共に本開示の1又は複数の実施形態を示し、本開示の原理及び実施形態を説明するために機能する。
立体素材の配信のためのチェックボードのインタリーブ配置を示す。 立体素材の配信のための水平サンプリング/列のインタリーブ配置を示す。 立体素材の配信のための垂直サンプリング/行のインタリーブ配置を示す。 立体素材の配信のための水平サンプリング/サイドバイサイド配置を示す。 立体素材の配信のための垂直サンプリング/上下配置を示す。 立体素材の配信のための5点形サンプリング/サイドバイサイド配置を示す。 レイヤ間予測のための参照処理を有する、フレーム準拠フル解像度の3D立体スケーラブルビデオ符号化システムを示す。 レイヤ間予測のための参照処理を有する、フレーム準拠フル解像度の3D立体スケーラブルビデオ復号化システムを示す。 レイヤ間予測のための参照処理ユニットを有する、スケーラブルビデオ符号化システムを示す。 フレーム準拠フル解像度の2レイヤ配信システムのための再構成モジュールを示す。 本開示の一実施形態によるマルチレイヤの解像度スケーラブル3D立体ビデオエンコーダを示し、拡張レイヤはそれぞれ拡張解像度で、(フレーム準拠)特定の低下解像度で動き/視差補償を実行する2つの参照ピクチャバッファを保持する。 本開示の一実施形態によるマルチレイヤの解像度スケーラブル3D立体ビデオデコーダを示し、拡張レイヤはそれぞれ拡張解像度で、(フレーム準拠)特定の低下解像度で動き/視差補償を実行する2つの参照ピクチャバッファを保持する。 本開示の一実施形態によるマルチレイヤの解像度スケーラブル3D立体ビデオエンコーダを示し、拡張レイヤはそれぞれ拡張解像度で、拡張解像度で動き/視差補償を実行する2つの参照ピクチャバッファを保持する。 本開示の一実施形態によるマルチレイヤ解像度スケーラブル3D立体ビデオデコーダを示し、拡張レイヤは、拡張解像度にそれぞれ1つあり拡張解像度で動き/視差補償を実行する2つの参照ピクチャバッファを保持する。 本開示の一実施形態によるマルチレイヤ解像度スケーラブル3D立体ビデオエンコーダを示し、基本レイヤはデータのフレーム準拠バージョンを符号化し、2つの拡張レイヤはそれぞれ1つの拡張解像度でデータカテゴリ(3D立体ビデオ配信のための各ビュー)を符号化する。 本開示の一実施形態によるマルチレイヤ解像度スケーラブル3D立体ビデオデコーダを示し、基本レイヤはデータのフレーム準拠バージョンを符号化し、2つの拡張レイヤはそれぞれ1つの拡張解像度でデータカテゴリ(3D立体ビデオ配信のための各ビュー)を符号化する。 本開示の一実施形態によるマルチレイヤ解像度スケーラブル3D立体ビデオエンコーダを示し、拡張レイヤは残差を符号化し、拡張解像度にそれぞれ1つあり(フレーム準拠)特定の低下解像度で動き/視差補償を実行する2つの参照ピクチャバッファを保持する。 本開示の一実施形態によるマルチレイヤ解像度スケーラブル3D立体ビデオデコーダを示し、拡張レイヤは残差を符号化し、拡張解像度にそれぞれ1つあり(フレーム準拠した)特定の低下解像度で動き/視差補償を実行する2つの参照ピクチャバッファを保持する。 本開示の一実施形態によるマルチレイヤ解像度スケーラブル3D立体ビデオエンコーダを示し、基本レイヤはデータのフレーム準拠バージョンを符号化し、2つの拡張レイヤはそれぞれ1つの拡張解像度でデータカテゴリ(3D立体ビデオ配信のための各ビュー)の残差を符号化する。 本開示の一実施形態によるマルチレイヤ解像度スケーラブル3D立体ビデオデコーダを示し、基本レイヤはデータのフレーム準拠バージョンを符号化し、2つの拡張レイヤはそれぞれ1つの拡張解像度でデータカテゴリ(3D立体ビデオ配信のための各ビュー)の残差を符号化する。
既存のコーデックの後方互換性の欠如の観点から、セットトップボックス、ブルーレイプレイヤ及び高解像度TVセットのインストールされた基礎を活用することは、消費者3Dの展開を高速化し得る。大部分のディスプレイ製造者は、3D立体ディスプレイに対応した高解像度TVセットを提供している。これらのTVセットは、全ての主要なディスプレイ技術、LCD、プラズマ及びDLPのモデルを含む(文献1)。鍵は、VC-1及びH.264/AVCのような既存の展開されているコーデックを利用しながら、両方のビューを含むが依然として単一フレームの範囲内に適合するコンテンツをディスプレイに供給することである。このようなアプローチは、所謂フレーム準拠アプローチであり、単一ピクチャ又はフレームの範囲内に適合するよう立体コンテンツをフォーマットする。フレーム準拠表現のサイズは、元のビューのフレームのサイズと同じである必要はない。
H.264のMVC extensionと同様に、Dolbyの立体3D消費者配信システム(特許文献1)は、基本及び拡張レイヤを特徴とする。MVCのアプローチとは対照的に、消費者に、2つのビューのサブサンプリングされたバージョンを伝達することによりフレーム準拠基本レイヤ、及び基本レイヤと結合されると2つのビューのフル解像度の再構成をもたらす拡張レイヤを提供するために、ビューは2つのレイヤに多重化されても良い。
後方互換性のある3Dビデオ配信システムは、既存の又はレガシー2Dビデオハードウェア及びシステムを通じて、3Dビデオを家庭又は他の場所へ配信できる。フレーム準拠3Dビデオシステムは、このような後方互換性のある配信アーキテクチャを提供する。その場合には、基本レイヤが「フレーム準拠」フォーマットに配置された左及び右目の低解像度バージョンを提供するレイヤアプローチを用いることができる。フレーム準拠フォーマットは、サイドバイサイド、上下、及び5点形/チェックボードインタリーブを含む。図1〜6は、幾つかの指標となる例を示す。さらに、追加の前処理段階は、基本レイヤ復号化フレームを拡張レイヤの予測のための動き補償された参照として用いる前に、基本レイヤ復号化フレームが与えられる場合、拡張レイヤフレームを予測するために存在しても良い。
図7、8は、それぞれ、特許文献1に開示されたシステムのエンコーダ及びデコーダを示す。
MVCのような非フレーム準拠符号化構成でさえ、基本ビューから取られる参照を従属ビューの予測のための参照として用いる前に向上させるプリプロセッサ(例えば、参照処理ユニット(reference processing unit:RPU)/予測器)で拡張できる。このアーキテクチャは、特許文献1にも開示され、図9に示される。
特許文献1のフレーム準拠技術は、フレーム準拠基本レイヤを保証する。プリプロセッサ/RPU要素の使用を通じ、これらの技術は、立体ビューのフル解像度再構成を実現する際のオーバヘッドを削減する。図10は、フル解像度再構成の処理を示す。
拡張レイヤの利用可能性に基づき、最終的な再構成ビューを得るための幾つかの方法がある。幾つかの方法は、拡張レイヤの実際のピクセルデータの符号化を考慮できるか、符号化残差データ、若しくは概して基本レイヤからの差(例えば、高周波数対低周波数)のデータであって特定の形式で結合される場合に再構成された信号の高品質/解像度表現を可能にできるデータを考慮しても良い。任意の解像度をこれらの方法に用いることができる。例えば、これらの方法の幾つかは半分の解像度であり、幾つかはフル解像度又は低い、高い若しくはその間の解像度であっても良い。本開示の実施形態は、任意の解像度に向けることができる。それらは、基本レイヤフレーム準拠出力から補間され(図10のVFC,BL(1002))、任意でV0,BL(1004)及び(1006)を生成するために後処理される。代替として、それらは、拡張レイヤの適正なサンプルと共に多重化でき、各ビューのより高い表現の再構成V0,FR,out(1008)及びV1,FR,out(1008)を生成する。両方の場合に結果として生じた再構成ビューは、同じ解像度を有しても良い。しかしながら、第2の場合には、全てのサンプルの情報を符号化するが、第1の場合には、再構成ビューの情報の半分は特許文献1に開示されたように知的アルゴリズムによる補間により得られる。図10から、基本及び拡張レイヤの復号化に続き、最終的なフル解像度の再構成ビューを引き出すために、追加の場合によってはメモリインテンシブ且つ帯域幅インテンシブな動作が用いられる。
本開示は、フレーム準拠3Dビデオシステムがフル解像度の3D配信を達成することを可能にする技術を提供する。本開示は、幾つかの高次表現/解像度サンプルドメインで動き及びステレオ視差補償を実行することにより、拡張レイヤの内部予測精度を向上させる方法も提供する。このようなドメインは、フレーム準拠表現のサンプルよりも高い空間又は周波数解像度を有し得る。幾つかの実施形態では、これらのドメインは、フル解像度に等しい解像度、つまり各カテゴリのフレームがフィルタリング、サンプリング及びフレーム準拠表現に多重化される前の元の解像度を有しても良い。これらの構成により圧縮データを処理するための追加の方法は、特許文献2に見られる。明細書を通じて、用語「データカテゴリ」又は「カテゴリ」は、データグループを表す。異なるデータカテゴリは、グループ間の関係を有しても有しなくても良い異なるデータグループを表し得る。3D又は立体画像若しくはビデオ配信に関連する本開示の実施形態では、用語「データカテゴリ」又は「カテゴリ」は、3D画像又はビデオの単一ビューを表す。
図11は、本開示の一実施形態によるマルチレイヤの解像度スケーラブル3D立体ビデオエンコーダを示し、拡張レイヤは、拡張解像度(例えば半分の水平又は垂直解像度)のそれぞれ1つ存在し特定の低下解像度で動き/視差補償を実行する2つの参照ピクチャバッファを保持する。図12は、本開示の実施形態による、図11に示したエンコーダに対応するデコーダを示す。本実施形態によると、所与の時刻で、複数のデータカテゴリに属するフレームを有するビデオシーケンスの圧縮のために、マルチレイヤコーデックが提供される。
本開示の本実施形態によると、図11の基本レイヤ(1102)は、複数のデータカテゴリのフレーム準拠表現を提供する。フレーム準拠表現は、ここでは、異なるデータカテゴリをサンプリングし単一フレームに多重化することを表す。この単一フレームは、元のカテゴリを有するフレームのサイズと同じサイズを有しても良い。本開示の更なる実施形態によると、図11の基本レイヤ(1102)は、任意の利用可能な又はH.264/AVC、VP8及びVC-1のような将来のビデオコーデックを用いて実施され符号化されても良い。
続けて図11を参照し、データを基本レイヤエンコーダ(1104)に送る前に、データは、サンプラ(1106)によりサンプリングされ、マルチプレクサ(1108)で多重化される。
更なる実施形態では、サンプリングはフィルタリングを有しても良い。さらに、フィルタリングは、異なるデータカテゴリの間で非対称であり得る。例えば、更に別の実施形態では、あるカテゴリは、半分より少ない情報(例えば、周波数成分)が保有されるように、フィルタリング及びサンプリングされても良い。また、別のカテゴリは、半分より多い情報が保有されるようにフィルタリング及びサンプリングされても良い。図1〜6は、画像データの2つのカテゴリの指標となるサンプリング及び多重化構成を示す。
図11に示した実施形態によると、追加拡張レイヤ(1152)が設けられる。他の実施形態によると、追加拡張レイヤの数は、フレームデータ及び基本レイヤ内で既にサンプリングされインタリーブされたデータのカテゴリの数に依存する。拡張レイヤでサンプリングされインタリーブされたデータは、既に基本レイヤ内にあるデータと結合されたとき、サンプリングされインタリーブされたデータが大部分のカテゴリのデータの効率的な表現及び再構成をもたらすように、選択される。図11に示した実施形態によると、2つのカテゴリのデータを含み、1つの拡張レイヤ(1152)は全ての元のデータを符号化するために用いられる。この実施形態によると、基本レイヤ(1102)は各カテゴリのサンプルの半分を伝達し、拡張レイヤ(1152)は各データカテゴリの他の失われる半分のサンプルを提供し得る。
本開示の更なる実施形態によると、基本レイヤは、1つのカテゴリのサンプルの3分の1を圧縮し、残りの3分の2は拡張レイヤに格納される。反対も可能である。同様に、基本レイヤと同様に、拡張レイヤの各カテゴリのデータ成分は、他のデータカテゴリのデータ成分と同じでなくても良い。これは、異なる種類のフィルタリング又は異なる数及び構成のサンプル(例えば、5点形と行ベースのサブサンプリング)を用いることにより実現できる。本実施形態によると、サンプリング動作は、拡張レイヤ処理のためのサンプルを引き出し、サンプリング動作はこれらのサンプルのフィルタリングを含んでも良い。
図11に示した実施形態によると、拡張レイヤ(1152)は、VC-1及びH.264/AVCのような最新のビデオコーデックに見られるハイブリッドビデオ符号化モデルを採用する。入力データは、同じピクチャ又はフレーム内の近隣サンプルから(イントラ予測を用いて)又は同じレイヤに属し動き補償予測の参照として所謂参照ピクチャバッファ内にバッファリングされた過去に復号化したフレームから(インター予測を用いて)予測される。(基本レイヤのような)低優先度のレイヤから復号化した情報が拡張レイヤに利用可能な場合、インターレイヤ予測も可能である。このような情報へのアクセスを有する方法は、低優先度のレイヤから復号化されたピクチャを動き補償のための参照として考慮することによる。予測の後、予測残差(1154)は変換(1156)及び量子化(1158)が行われ、次に量子化係数がエントロピー符号化(1160)を用いて符号化される。図12に示したデコーダの拡張レイヤ(1252)は、この処理の逆である。
過去に復号化されたピクチャ/フレームを有する単一の参照ピクチャバッファ(1110)を有する図11の基本レイヤ(1102)と異なり、拡張レイヤ(1152)は、各データカテゴリに1つある、複数の内部参照ピクチャバッファ(1162)を保持する。図11の実施形態では、これらのバッファに格納される参照ピクチャの生成は、デマルチプレクサ及びRPUプロセッサ(1164)の使用を通じて達成される。デマルチプレクサ及びRPUプロセッサ(1164)は、(イントラ又はインター予測を通じて得られた)予測残差及び予測フレームの和を処理する。
図11のデマルチプレクサ(1164)は、各カテゴリのアップサンプリング及び失われるサンプルの補間も実行する。各参照ピクチャバッファ(1162)は、同じデータカテゴリに属するフレームのみを有する。バッファ(1162)は、拡張レイヤ(1102)に入力されるサンプルの解像度より高い解像度で、又は任意で拡張解像度で画像又はフレームを格納する。さらに、各参照ピクチャバッファにフレームを格納するために用いられる解像度は、互いに異なっても良い。あるバッファはある解像度でピクチャを格納し、一方で第2のピクチャバッファは別の解像度でピクチャを格納しても良い。視差補償(つまり、動き補償又はイントラ予測)(1168)を実行する前に、各参照ピクチャバッファ(1162)から選択された参照は、サンプラ(1170)でダウンサンプリングされ、マルチプレクサ(1172)で多重化され、単一の参照ピクチャを生成する。単一の参照ピクチャは、フレーム準拠構成でフォーマットすることができる。更なる実施形態によると、フレーム準拠フォーマットへのダウンサンプリング及び多重化動作は、2つの参照の最終的なフレーム準拠参照ピクチャへの線形又は非線形結合のようなより高機能な動作を含んでも良い。更に別の実施形態によると、内部バッファ内のフレームの解像度は、拡張解像度に一致しても良い。
図11に示した実施形態によると、拡張レイヤ(1152)内のインター予測は、内部の複数の(任意で、拡張解像度の)参照ピクチャバッファから供給される参照ピクチャをサンプリング(1170)及び多重化(1172)した後に行われる。このように、インター予測は、「フレーム準拠」ドメインで行われるが、必ずしも基本レイヤと同じドメインではない。立体ビデオの更なる実施形態によると、基本レイヤフレーム準拠フォーマットは、左ビューからの偶数列及び右ビューからの奇数列を有しても良く、一方で、拡張レイヤにおいて、フレーム準拠フォーマットは、左ビューからの奇数列及び右ビューからの偶数列を有しても良い。同様の構成は、上下、サイドバイサイド等のような他のインタリーブ構成でも可能である。適正な構成の方法は、フレーム準拠基本レイヤピクチャ内で符号化されたサンプルと1又は複数の拡張レイヤ内で符号化されたサンプルとの結合が拡張解像度のデータカテゴリの再構成を生成するように、選択される。このような技術は、本開示の別の実施形態により、任意の数のレイヤ又はビューに拡張できる。さらに、インター予測処理は、符号化されデコーダに送信される各拡張レイヤの動きパラメータセットを推定することを含む。
図11に示した実施形態によると、拡張レイヤの参照ピクチャバッファ(1162)は、ピクチャを有する。このピクチャは、拡張レイヤ(1152)の逆多重化されアップサンプリングされた(1164)符号化されたピクチャに限定されない。基本レイヤ−拡張レイヤ参照処理ユニット(RPU)/プリプロセッサモジュール(BL−to−EL RPU)(1166)は、入力として、基本レイヤ(1102)の参照ピクチャバッファ(1110)からのフレーム準拠復号化ピクチャを取り込み、次に、異なるデータカテゴリに属する高次表現(任意で、拡張解像度)のフレームを推定するために、フレームデータを逆多重化しアップサンプリングする。
更なる実施形態によると、BL−to−EL RPU(1166)の処理は、フィルタリング、アップスケーリング、失われるサンプルの補間、周波数成分の回復又は推定を有しても良い。周波数成分の回復又は推定は、例えば基本レイヤが低周波数を符号化し拡張レイヤが高周波数を符号化するときに用いられる。これらのBL−to−EL RPU(1166)で処理された画像は、次に、拡張レイヤ(1152)の高次表現(任意で、拡張解像度)参照ピクチャバッファ(1162)内の追加動き補償された予測の参照として配置され用いられる。エンコーダにあるBL−to−EL RPUモジュール(1166)は、予測/アップサンプリング処理の情報を生成し、この情報(「RPUビットストリーム」)(1174)を、図12に示したデコーダに位置する図12の同一のBL−to−EL RPU(1254)へ伝達する。このように、エンコーダの予測動作は、デコーダにおいて繰り返されても良い。このRPUモジュールを用いた補間及び予測は、特許文献3に開示された技術を有しても良い。
本開示の更なる実施形態によると、内部バッファは、拡張解像度でフレームを格納し、デコーダは、データカテゴリ毎に拡張解像度のフレームを内部で再構成し、参照ピクチャバッファに格納する。その結果、本実施形態は、拡張解像度のデータを表示する目的で図10の処理モジュールを用いない。代わりに、本実施形態によると、拡張解像度の再構成フレームは、拡張レイヤの参照ピクチャバッファから抽出され直接表示できる。本開示の別の実施形態によると、各カテゴリの拡張解像度は等しくない。本実施形態では、エンコーダ及びデコーダは、拡張レイヤのバッファ内のピクチャを特定の共通拡張解像度に再スケーリングする。
更なる実施形態では、基本レイヤで符号化されたフレームは、各カテゴリに属するフレームと同じサイズを有しても良い。更なる実施形態では、拡張レイヤの参照ピクチャバッファは、元のフレームの解像度(フル解像度)でフレームを有する。
本開示の一実施形態によると、動き補償が適用されるフレーム準拠ドメインは、基本レイヤのドメインと同一であって良い。更なる実施形態では、基本レイヤは、サイドバイサイドフォーマットでインタリーブされて良く、拡張レイヤも同じサイドバイサイドフォーマットでインタリーブされたフレームを符号化する。
本開示の一実施形態によると、基本レイヤフレーム準拠フォーマットは、第1のビューからの偶数列及び第2のビューからの奇数列を有しても良く、一方で、拡張レイヤにおいて、フレーム準拠フォーマットは、第1のビューからの奇数列及び第2のビューからの偶数列を有しても良い。
本開示の一実施形態によると、レイヤは、異なる空間解像度でフレームを符号化しても良い。この場合、空間スケーラビリティを備えたシステムを構築できる。更なる実施形態によると、コーデックシステムは、1280×720のサイドバイサイドのフレーム準拠基本レイヤ、及び1920×1080の両方のビューを再構成できる拡張レイヤを有する。本実施形態では、BL−to−EL RPUは、先ず、フレーム準拠データを別個のカテゴリに逆多重化し、次に、後続の動作のうちの1つを実行しても良い。あるスキームでは、BL−to−EL RPUは、先ず、そのカテゴリの失われるサンプルを補間し、次に、拡張レイヤの対応する参照ピクチャバッファに結果として生じたフレームを格納する前に、結果として生じたフレーム(1280×720)を所望の空間解像度(1920×1080)に再スケーリングする。第2のスキームでは、利用可能な逆多重化されたサンプルは、低解像度から高解像度へ、例えば640×720から960×1080へ再スケーリングされる。次に、追加補間動作は、失われる列を決定し、任意でフル解像度のフレームを引き出すために既存のサンプルをフィルタリングする。
本開示の一実施形態によると、拡張レイヤ内の複数の参照ピクチャバッファは、非特許文献2に開示されたようなメモリ管理制御動作(memory management control operation:MMCO)を通じて制御されても良い。MMCO動作は、どのように参照ピクチャが追加されバッファから削除されるかを制御する。更なる実施形態によると、MMCO動作は、拡張レイヤに伝えられる。本実施形態では、各参照ピクチャバッファのMMCOセットは同じであるか、又は1つのMMCO動作セットがシグナリングされる。これは、両方の参照ピクチャバッファに適用される。結果として、ピクチャバッファの動作は同期したままである。更に別の実施形態は、非特許文献2に開示された方法を含むがこれに限定されない、参照ピクチャリストの変更/並べ替えのシグナリングのために同様のアプローチを用いても良い。
シグナリング情報は、バッファ内の参照ピクチャのリストの生成を制御する。これらのリストは、次に動き補償された予測で用いられる。更なる実施形態によると、変更情報は、各データカテゴリの参照ピクチャリストについて同一である。更に別の実施形態では、単一の変更情報セットが送信され、拡張レイヤの全てのリストに適用される。本開示の更なる実施形態によると、同様のアプローチは、参照ピクチャバッファの内容を制御するシグナリング並びにその参照ピクチャリストの初期化及び変更を制御するシグナリングを用いるコーデックで用いられる。
本開示の一実施形態によると、参照ピクチャバッファに格納される前に、拡張解像度で単一カテゴリのフレームを引き出すデマルチプレクサ及びアップサンプラRPUは、特許文献3に開示されたような参照処理ユニットとして実施されても良い。
本開示の別の実施形態によると、基本レイヤは、第1の範囲の周波数成分を有する表現を符号化しても良く、一方で、追加拡張レイヤは、第2の範囲の周波数成分を提供しても良い。それらの出力は、デコーダで結合され、元のデータカテゴリのより良い表現を提供しても良い。
図13は、本開示の一実施形態によるマルチレイヤ解像度スケーラブル3D立体ビデオエンコーダを示し、拡張レイヤは、拡張解像度にそれぞれ1つあり拡張解像度で動き/視差補償を実行する2つの参照ピクチャバッファを保持する。図14は、本開示の実施形態による、図13に示したエンコーダに対応するデコーダを示す。
図13及び14に示した実施形態は、図11及び12に示した実施形態と同様である。しかし、図11及び12に示した実施形態との相違は、図13に示した実施形態によると、サンプラ(1354)及びマルチプレクサ(1356)が視差補償モジュール(1358)の後に置かれる点である。
実際には、データカテゴリの存在だけ多くの視差補償モジュール(1358)が存在する。図13に示した実施形態によると、立体ビデオ配信のために、各ビューについて1つの、2つの視差補償モジュール(1358)がある。視差補償が各高次再構成の参照に実行された後、結果として生じたフレームは、サンプラ(1354)に渡される。サンプラ(1354)は、フィルタリングの後及び/又は前にダウンサンプリング処理を実行する。各データカテゴリからのダウンサンプリングされたデータは、次にマルチプレクサ(1356)へ供給される。マルチプレクサ(1356)は、フレーム準拠ピクチャ(1360)を生成する。このフレーム準拠ピクチャ(1360)は、次に、予測として用いられる。拡張レイヤのハイブリッドビデオ符号化ループ内で、この予測に予測残差(1362)が加算される。
図13に示した実施形態によると、視差補償モジュール(1358)は、利用可能なより多くのサンプル(高次表現ピクチャ)を有し、より良い予測を生成することができる。さらに、視差補償モジュールは、動き補償において、より多くの空間的に正確な区画を有しても良い。例えば、サイドバイサイドフォーマットが用いられるとき、フレーム準拠参照ピクチャ内の4x4の区画サイズは、フル解像度ピクチャの8x4の区画サイズと等価である。同様に、16×16の区画は、事実上、フル解像度ピクチャの32×16の区画である。この結果、本実施形態では、視差補償モジュール(1358)は、より大きく且つより正確な区画を有し得る。
図13に示した実施形態によると、視差推定及び補償は、拡張レイヤで複数回(例えば2回)実行され得るので、システムの複雑性を増大してしまう。さらに、動き補償の空間的精度の増大により得られる利益は、高次表現の参照ピクチャが、図13のフレーム準拠予測ピクチャVFC,PRED(1362)に予測残差を加算することにより得られたフレーム準拠ピクチャからアップサンプリングされる方法次第である。また、本実施形態によると、拡張レイヤは、動きベクトル情報量を2回圧縮する。更なる実施形態によると、参照ピクチャバッファは、拡張解像度を採用し、各データカテゴリの最終的な再構成は、拡張レイヤの参照ピクチャバッファに格納される参照の生成の一部として実行される。したがって、本実施形態は、図10に示したデコーダと異なり、基本及び拡張レイヤの出力を更に処理しない。
本開示の更なる実施形態によると、マルチレイヤコーデックは、第1の方法の追加の実施形態と同様に、空間的スケーラビリティを考慮しても良い。更に別の実施形態は、図11及び12に示した実施形態と同様に、参照ピクチャリストの変更及びデコーダにシグナリングされるMMCO動作を提供する。
本開示の更なる実施形態によると、複数の視差/畚器推定及び補償モジュールで用いられる動きパラメータ間に十分な相関があるので、これらの動きパラメータは、あるモジュールのパラメータを他のモジュールのパラメータから効率的に予測できるよう選択される。更に別の実施形態では、動きパラメータは、各拡張レイヤについて同一になるよう選択され、1つのパラメータセットのみが送信される。別の実施形態では、各モジュールのパラメータセットはシグナリングされる。動きパラメータ予測は、近隣からの情報又は高優先度視差推定/補償モジュールからシグナリングされる結び付けられたパラメータも用いても良い。
本開示の更なる実施形態では、基本レイヤで符号化されたフレームは、各カテゴリに属するフレームと同じサイズを有しても良い。別の実施形態では、拡張レイヤの参照ピクチャバッファは、元のフレームの解像度(フル解像度)でフレームを有する。更に別の実施形態によると、参照ピクチャバッファに格納される前に、拡張解像度で単一カテゴリのフレームを引き出すデマルチプレクサ及びアップサンプラは、特許文献3に開示されたような参照処理ユニットとして実施されても良い。更に別の実施形態では、基本レイヤは、第1の範囲の周波数成分を有する表現を符号化しても良く、一方で、追加拡張レイヤは、第2の範囲の周波数成分を提供しても良い。それらの出力は、デコーダで結合され、元のデータカテゴリのより良い表現を提供しても良い。
図15は、本開示の一実施形態によるマルチレイヤの解像度スケーラブル3D立体ビデオエンコーダを示す。基本レイヤ(1502)はデータのフレーム準拠バージョンを符号化する。2つの複数の拡張レイヤ(1532、1562)は、2つの拡張解像度のそれぞれでデータカテゴリ(3D立体ビデオ配信では各ビュー)を符号化する。図16は、本開示の実施形態による、対応するデコーダを示す。
図15に示した実施形態によると、基本レイヤ(1502)のアーキテクチャは、図11〜14に示した実施形態のアーキテクチャと同一である。図15に示した実施形態によると、基本レイヤ(1502)は、複数のデータカテゴリのフレーム準拠バージョンを符号化しても良い。本実施形態では、拡張レイヤ(1532、1562)は、データカテゴリ毎に設けられる。立体ビデオ配信の更なる実施形態によると、各拡張レイヤ(1532、1562)は、各データカテゴリの拡張解像度の再構成を提供する。本実施形態によると、各拡張レイヤ(1532、1562)は、単一の参照ピクチャバッファ(1534、1564)を有し、基本レイヤ(1502)と非常に似たアーキテクチャを用いる。本実施形態では、拡張レイヤ(1532、1562)は、各カテゴリの拡張(例えばフル)解像度のフレームを直接受信する。これに対し、図11〜14に示した実施形態によると、拡張レイヤへの入力は、全てのデータカテゴリのフレーム準拠表現を有する。
図15に示した実施形態によると、各レイヤ(1532、1562)の参照ピクチャバッファ(1534、1564)は、動き補償された予測(1536、1566)のために用いられる参照を格納する。これらの参照は、過去に復号化された同一レイヤのフレームを含む。更なる実施形態によると、拡張レイヤ(1532、1562)の追加の参照は、H.264のMVC extensionで行われるように、基本レイヤ(1502)から挿入されても良い。本実施形態では、挿入される前に、これらの参照は、対象参照ピクチャバッファに格納されたフレームに対応する処理済みの参照を引き出すために、RPU/プリプロセッサ(1538、1568)で処理される。立体ビデオ配信のための更なる実施形態によると、基本レイヤのフレーム準拠ピクチャは、異なるカテゴリに属するサンプルに逆多重化される。次に、サンプルは、各拡張レイヤ(1532、1562)の参照ピクチャバッファ(1534、1564)に格納される前に、RPU/プリプロセッサ(1538、1568)内で拡張(例えばフル)解像度にアップサンプリングされる。本実施形態によると、RPU/プリプロセッサ(1538、1568)内の予測、補間及びアップサンプリング処理は、特許文献3に開示された技術を採用しても良い。
図15に示した実施形態によると、別個のRPU(1538、1568)が実装され、拡張レイヤの各参照ピクチャバッファ(1534、1564)に格納される各参照を生成しても良い。別の実施形態によると、単一モジュールが設けられ、最適化、逆多重化、及び基本レイヤの符号化されたフレームに準拠するピクチャの各拡張レイヤに1つある複数のフル参照ピクチャへのアップサンプリングを一緒に行っても良い。
本開示の別の実施形態によると、基本レイヤの従属関係とは別に拡張レイヤの追加依存関係が提供される。本実施形態では、拡張レイヤは、別の拡張レイヤのパーシング及び復号化に依存し得る。続けて図15を参照すると、拡張レイヤ1(1562)の復号化処理は、基本レイヤ(1502)とは別に、拡張レイヤ0(1532)にも依存しても良い。拡張レイヤ0(1532)の参照ピクチャバッファ(1534)に格納されたピクチャ(1572)は、表示するために、追加RPU/プリプロセッサモジュール(1570)に供給される。追加RPU/プリプロセッサ(1570)は、供給された参照入力(1572)を処理して、拡張レイヤ1(1562)のフォーマットと同様になるようにする。処理結果(1574)は、次に、拡張レイヤ1(1562)の参照ピクチャバッファ(1564)に格納され、動き補償された予測(1566)に利用可能である。立体ビデオ配信の更なる実施形態によると、各拡張レイヤは1つのビューを符号化し、RPUは、別のビューに近い参照ピクチャを生成するために、動き及び空間処理を用いて1つのビューを処理する。更に別の実施形態によると、動き処理は、アフィン及び透視動きモデルのような高次動きモデルを含み得る。
更なる実施形態によると、マルチレイヤコーデックは、図11〜14に示した実施形態と同様に、空間的スケーラビリティを考慮しても良い。本実施形態では、基本レイヤから拡張レイヤの予測を実行するプリプロセッサモジュール(例えば、図15の1538及び1568)は、目標レイヤ解像度への再スケーリングも含む。1つの拡張レイヤを第2の拡張レイヤ(例えば、図15の1570)から予測するプリプロセッサモジュールは、拡張レイヤが同一の空間解像度を有しない場合には、再スケーリングを有しても良い。
図17は、本開示の一実施形態によるマルチレイヤの解像度スケーラブル3D立体ビデオエンコーダを示し、拡張レイヤは残差を符号化し、拡張解像度にそれぞれ1つある(フレーム準拠)特定の低下解像度で動き/視差補償を実行する2つの参照ピクチャバッファを保持する。図18は、本開示の実施形態による、対応するデコーダを示す。
図17に示した実施形態によると、基本レイヤ(1702)は、フレーム準拠信号を符号化する。これは、1又は複数の拡張レイヤ(1752)を復号化して、それらを基本レイヤ(1702)の出力と結合するときに、(特に、解像度又は空間周波数成分の点で)更に向上できる。本実施形態によると、拡張レイヤ(1752)は、フィルタリングされサンプリングされ多重化された残差を符号化する(1574)(文献7)。この残差は、元のフル解像度のデータカテゴリのフレームの予測(1756)を減算した結果である。
この予測(1756)は、RPUプロセッサ(1758)を用いた結果である。RPUプロセッサ(1758)は、入力としてフレーム準拠基本レイヤ(1702)からの復号化ピクチャ(1760)を有し、元の(フル)解像度で元のフレームカテゴリの予測(1756)を出力する。更なる実施形態によると、RPU(1758)は、フィルタリング、補間、再スケーリング等を含む特許文献3に開示されたような技術を用いても良い。図17に示した実施形態によると、拡張レイヤ(1752)の内部ピクチャバッファ(1762)は、RPUを介して基本レイヤバッファ(1704)から処理された参照を受信しない。
図18に示したデコーダで、同様のRPU(1854)は、入力として復号化された基本レイヤのピクチャを基本レイヤ(1802)のピクチャバッファ(1804)から取り込み、それを処理して元の(フル)解像度にし、各カテゴリのフル解像度フレーム(1856)を引き出し、次に、これらのフレーム(1856)を拡張レイヤ参照ピクチャバッファ(1860)内の既に復号化されたフレーム(1858)に加算して、各データカテゴリの最終的な再構成フレーム(1862)を生成する。
図11及び12に示した実施形態と図17及び18に示した実施形態との間の差と矛盾しない図11及び12に示した実施形態に従う全ての更なる実施形態は、図17及び18に示した実施形態に従う更なる実施形態にも適用される。更なる実施形態によると、基本レイヤの解像度及び拡張レイヤの解像度、並びに拡張レイヤの内部参照ピクチャバッファは、異なっても良い。
図17及び18に示した実施形態に従う更なる実施形態では、図13及び14に示した実施形態と同様に、拡張レイヤは、各データカテゴリの参照ピクチャバッファ毎に1つの、複数の視差補償モジュールを設ける。図13及び14に示した実施形態に従う全ての適用可能な更なる実施形態は、同様に適用される。
図19は、本開示の一実施形態によるマルチレイヤの解像度スケーラブル3D立体ビデオエンコーダを示し、基本レイヤはデータのフレーム準拠バージョンを符号化し、2つの拡張レイヤはそれぞれ1つの拡張解像度でデータカテゴリ(3D立体ビデオ配信のための各ビュー)の残差を符号化する。図20は、本開示の実施形態による、対応するデコーダを示す。
図19に示した実施形態によると、拡張レイヤ(1932、1962)は、図17及び18に示した実施形態と同様に、残差の符号化を採用する。本実施形態によると、各拡張レイヤ(1932、1962)は、各データカテゴリに対応し、残差(1934、1964)(文献7)を符号化する。この残差は、元のフル解像度のデータカテゴリのフレームの予測(1936、1966)を減算した結果である。この予測(1938)は、RPUプロセッサ(1938、1968)を用いた結果である。RPUプロセッサ(1938、1968)は、入力としてフレーム準拠基本レイヤ(1902)からの復号化ピクチャを有し、所与のレイヤの元の(フル)解像度で元のフレームカテゴリの予測(1936、1966)を出力する。更なる実施形態によると、RPU(1938、1968)は、フィルタリング、補間、再スケーリング等を含む特許文献3に開示されたような技術を用いても良い。図19に示した実施形態によると、拡張レイヤ(1932、1962)の内部ピクチャバッファ(1940、1970)は、RPUを介して基本レイヤバッファ(1904)から処理された参照を受信しない。
図20に示したデコーダで、拡張レイヤ(2032、2062)毎に、同様のRPU(2034、2064)は、入力として復号化された基本レイヤのピクチャを基本レイヤ(2002)のピクチャバッファ(2004)から取り込み、それを処理して元の(フル)解像度にし、所与のカテゴリのフル解像度フレーム(2036、2066)を引き出し、次に、このフレーム(2036、2066)を拡張レイヤ参照ピクチャバッファ(2040、2070)内の既に復号化されたフレーム(2038、2068)に加算して、所与のデータカテゴリの最終的な再構成フレーム(2042、2072)を生成する。
図15及び16に示した実施形態と図19及び20に示した実施形態との間の差と矛盾しない図15及び16に示した実施形態に従う全ての更なる実施形態は、図19及び20に示した実施形態に従う更なる実施形態にも適用される。更なる実施形態によると、基本レイヤの解像度及び拡張レイヤの解像度、並びに拡張レイヤの内部参照ピクチャバッファは、異なっても良い。また、各拡張レイヤの解像度は異なっても良い。
本開示で記載された方法及びシステムは、ハードウェア、ソフトウェア、ファームウェア又はそれらの組み合わせで実施されても良い。ブロック、モジュール又はコンポーネントとして記載された特徴は、一緒に(例えば集積論理素子のような論理素子に)又は別個に(例えば別個に接続された論理素子として)実施されても良い。本開示の方法のソフトウェア部分は、実行されると、少なくとも部分的に記載された方法を実行する命令を有するコンピュータ可読媒体を有しても良い。コンピュータ可読媒体は、例えば、ランダムアクセスメモリ(RAM)及び/又は読み出し専用メモリ(ROM)を有しても良い。命令は、プロセッサ(例えば、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)又はフィールドプログラマブル論理アレイ(FPGA))により実行されても良い。
以上に、本発明の実施形態が記載された。これらは、項として以下に列挙する1又は複数の例示的な実施形態に関連する。
したがって、本発明は、本発明の幾つかの部分の構造、特徴及び機能を記載した以下に列挙する例示的実施形態(Enumerated Example Embodiments:EEE)を含むがこれらに限定されない、本願明細書に記載された如何なる形式で実現されても良い。
(EEE1) マルチレイヤフレーム準拠ビデオ配信のための符号化方法であって、
a)基本レイヤを通じて複数のデータカテゴリの画像又はビデオフレームを基本レイヤ処理するステップであって、
i) 前記複数のデータカテゴリの画像又はビデオフレームの基本レイヤフレーム準拠表現を供給するステップ、
を含むステップ、
b)1又は複数の拡張レイヤを通じて前記複数のデータカテゴリの画像又はビデオフレームを拡張レイヤ処理するステップであって、
i) 前記複数のデータカテゴリの画像又はビデオフレームの拡張レイヤフレーム準拠表現を供給するステップ、
ii)少なくとも1つの拡張レイヤ参照ピクチャバッファを保持するステップ、
iii) 前記基本レイヤ又は異なる拡張レイヤへの少なくとも1つの従属関係を参照処理するステップ、
iv)動き又は視差補償を実行するステップ、
を含むステップ、
を有し、前記1又は複数の拡張レイヤの各々は、前記複数のデータカテゴリの全てを処理する、符号化方法。
(EEE2) 前記複数のデータカテゴリは、立体画像又はビデオの複数のビューを有する、EEE1に記載の符号化方法。
(EEE3) 前記複数のデータカテゴリの画像又はビデオフレームの基本レイヤフレーム準拠表現を供給するステップは、
前記複数のデータカテゴリの画像又はビデオフレームを基本レイヤサンプリングし単一フレームに基本レイヤ多重化するステップ、
を有する、EEE1又は2に記載の符号化方法。
(EEE4) 前記基本レイヤ処理するステップは、複数の既存のビデオコーデックのうちの1つに従う、EEE1〜3のいずれか一項に記載の符号化方法。
(EEE5) 前記複数の既存のビデオコーデックは、H.264/AVC、VP8及びVC-1を有する、EEE4に記載の符号化方法。
(EEE6) 前記基本レイヤ処理のサンプリングは、前記複数のデータカテゴリの画像又はビデオフレームの対称又は非対称フィルタリングを含む、EEE3〜5のいずれか一項に記載の符号化方法。
(EEE7) 前記基本レイヤサンプリングするステップは、水平サンプリング、垂直サンプリング又は5点形サンプリングを有する、EEE3〜6のいずれか一項に記載の符号化方法。
(EEE8) 前記基本レイヤ多重化するステップは、チェックボードインタリーブ配置、列インタリーブ配置、行インタリーブ配置、サイドバイサイドインタリーブ配置、及び上下インタリーブ配置のうちのいずれか1つのフレーム準拠パッキング配置を用いる、EEE3〜7のいずれか一項に記載の符号化方法。
(EEE9) 前記基本レイヤ処理は、前記複数のビューの画像又はビデオフレームの等しい又は等しくない量のサンプルを処理するステップを更に含む、EEE2〜8のいずれか一項に記載の符号化方法。
(EEE10) 前記拡張レイヤ処理するステップは、ハイブリッドビデオ符号化モデルを採用し、前記ハイブリッドビデオ符号化モデルは、複数の既存のコーデックのうちのいずれか1つに従う、EEE2〜9のいずれか一項に記載の符号化方法。
(EEE11) 前記複数の既存のコーデックは、VC-1及びH.264/AVCを有する、EEE10に記載の符号化方法。
(EEE12) 前記拡張レイヤ処理するステップは、
同一の画像若しくはフレーム内のサンプルから、又は同一の拡張レイヤの過去の復号化フレームからのサンプルから、少なくとも1つの予測画像を予測することにより、少なくとも1つの参照画像又はビデオフレームを生成するステップ、
前記少なくとも1つの予測画像又はビデオフレームを前記少なくとも1つの拡張レイヤ参照ピクチャバッファに格納するステップ、
を含む、EEE2〜11のいずれか一項に記載の符号化方法。
(EEE13) 前記少なくとも1つの参照画像又はビデオフレームの生成は、少なくとも1つの予測残差画像と前記少なくとも1つの予測画像との和を逆多重化し参照処理するステップを更に含む、EEE12に記載の符号化方法。
(EEE14) 前記逆多重化は、少なくとも1つの予測残差画像と前記少なくとも1つの予測画像との和をアップサンプリングし補間するステップを更に含む、EEE13に記載の符号化方法。
(EEE15) 前記少なくとも1つの拡張レイヤ参照ピクチャバッファのうちの1つは、他の前記少なくとも1つの拡張レイヤ参照ピクチャバッファと異なる解像度で画像又はビデオフレームを格納する、EEE2〜14のいずれか一項に記載の符号化方法。
(EEE16) 前記拡張レイヤ処理するステップは、
前記複数のデータカテゴリの各々に対し、前記少なくとも1つの拡張レイヤ参照ピクチャバッファから少なくとも1つの参照画像を選択するステップ、
前記の選択された少なくとも1つの参照画像を拡張レイヤサンプリングし、少なくとも1つのフレーム準拠画像に拡張レイヤ多重化するステップ、
前記少なくとも1つのフレーム準拠画像に基づき、視差補償又はインター予測を実行するステップ、
を更に含む、EEE1〜15のいずれか一項に記載の符号化方法。
(EEE17) 前記選択された少なくとも1つの参照画像の拡張レイヤサンプリングは、水平サンプリング、垂直サンプリング又は5点形サンプリングのうちのいずれか1つを有し、
前記選択された少なくとも1つの参照画像の拡張レイヤ多重化は、チェックボードインタリーブ配置、列インタリーブ配置、行インタリーブ配置、サイドバイサイドインタリーブ配置、及び上下インタリーブ配置のうちのいずれか1つのフレーム準拠パッキング配置を用いる、EEE16に記載の符号化方法。
(EEE18) 前記拡張レイヤ処理は、
前記基本レイヤの参照バッファからの少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を基本レイヤ−拡張レイヤ(BL−to−EL)処理するステップ、
前記のBL−to−EL処理された少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を、前記少なくとも1つの拡張レイヤ参照ピクチャバッファに格納するステップ、
を更に含む、EEE16又は17に記載の符号化方法。
(EEE19) 前記BL−to−EL処理は、前記少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を参照処理し、逆多重化し、アップサンプリングするステップを含む、EEE18に記載の符号化方法。
(EEE20) 前記BL−to−EL処理は、前記少なくとも1つの基本レイヤ復号化されたフレーム準拠画像をフィルタリングし、アップスケーリングし、補間するステップを更に含む、EEE19に記載の符号化方法。
(EEE21) 前記拡張レイヤ処理するステップは、前記BL−to−EL処理に関する情報を対応するデコーダに供給するステップを更に含む、EEE18〜20のいずれか一項に記載の符号化方法。
(EEE22) 前記少なくとも1つの拡張レイヤ参照ピクチャバッファは、前記複数のデータカテゴリのうちの各々1つに対して、同一の又は異なる拡張解像度で、画像を格納する、EEE1〜21のいずれか一項に記載の符号化方法。
(EEE23) 前記少なくとも1つの拡張レイヤ参照ピクチャバッファは、元の入力画像と同じ解像度で、画像を格納する、EEE1〜22のいずれか一項に記載の符号化方法。
(EEE24) 前記基本レイヤ多重化するステップ及び前記拡張レイヤ多重化するステップは、同一のフレーム準拠パッキング配置を用いる、EEE1〜23のいずれか一項に記載の符号化方法。
(EEE25) 前記基本レイヤ処理するステップ及び前記拡張レイヤ処理するステップは、異なる空間解像度で画像を処理する、EEE18〜24のいずれか一項に記載の符号化方法。
(EEE26) 前記BL−to−EL処理するステップは、
前記少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を逆多重化するステップ、
前記の逆多重化された少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を補間するステップ、
前記補完された逆多重化された少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を目標空間解像度に再スケーリングするステップ、
を有する、EEE25に記載の符号化方法。
(EEE27) 前記BL−to−EL処理するステップは、
前記少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を逆多重化するステップ、
前記の逆多重化された少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を異なる空間解像度に再スケーリングするステップ、
前記の逆多重化された再スケーリングされた少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を目標空間解像度に補間するステップ、
を有する、EEE25に記載の符号化方法。
(EEE28) 逆多重化された再スケーリングされた少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を目標空間解像度にフィルタリングするステップを更に含む、EEE27に記載の符号化方法。
(EEE29) 前記拡張レイヤ処理するステップは、メモリ管理制御動作(memory management control operation:MMCO)を通じて前記少なくとも1つの拡張レイヤ参照ピクチャバッファを制御するステップを更に含む、EEE1〜28のいずれか一項に記載の符号化方法。
(EEE30) 前記少なくとも1つの拡張レイヤ参照ピクチャバッファは、1又は複数のMMCOセットに従い同期化される、EEE1〜29のいずれか一項に記載の符号化方法。
(EEE31) 前記拡張レイヤ処理するステップは、前記MMCOに関する情報を対応するデコーダに供給するステップを更に含む、EEE29又は30に記載の符号化方法。
(EEE32) 前記基本レイヤ処理するステップは、第1の周波数範囲の画像成分を符号化し、前記拡張レイヤ処理するステップは、第2の周波数範囲の画像成分を符号化する、EEE1〜31のいずれか一項に記載の符号化方法。
(EEE33) 前記拡張レイヤ処理するステップは、
前記複数のデータカテゴリの各々に対し、前記少なくとも1つの拡張レイヤ参照ピクチャバッファから少なくとも1つの参照画像を選択するステップ、
前記少なくとも1つの参照画像に基づき視差補償又はインター予測を実行することにより、前記複数のデータカテゴリの各々に対し、少なくとも1つの補償画像を得るステップ、
前記少なくとも1つの補償画像を拡張レイヤサンプリングし、少なくとも1つのフレーム準拠画像に拡張レイヤ多重化するステップ、
を更に含む、EEE1〜15のいずれか一項に記載の符号化方法。
(EEE34) 前記拡張レイヤ処理するステップは、メモリ管理制御動作(memory management control operation:MMCO)を通じて前記少なくとも1つの拡張レイヤ参照ピクチャバッファを制御するステップを更に含む、EEE33に記載の符号化方法。
(EEE35) 前記拡張レイヤ処理するステップは、前記MMCOに関する情報を対応するデコーダに供給するステップを更に含む、EEE34に記載の符号化方法。
(EEE36) 前記少なくとも1つの拡張レイヤ参照ピクチャバッファは、前記複数のデータカテゴリの各々に対して、同一の又は異なる拡張解像度で、画像を格納する、EEE33〜35のいずれか一項に記載の符号化方法。
(EEE37) 前記少なくとも1つの拡張レイヤ参照ピクチャバッファは、元の入力画像と同じ解像度で、画像を格納する、EEE33〜36のいずれか一項に記載の符号化方法。
(EEE38) 前記基本レイヤ処理するステップは、第1の周波数範囲の画像成分を符号化し、前記拡張レイヤ処理するステップは、第2の周波数範囲の画像成分を符号化する、EEE33〜37のいずれか一項に記載の符号化方法。
(EEE39) マルチレイヤフレーム準拠ビデオ配信のための符号化方法であって、
a)基本レイヤを通じて複数のデータカテゴリの画像又はビデオフレームを基本レイヤ処理するステップであって、
i) 前記複数のデータカテゴリの画像又はビデオフレームの基本レイヤフレーム準拠表現を供給するステップ、
を含むステップ、
b)1又は複数の拡張レイヤを通じて前記複数のデータカテゴリの画像又はビデオフレームを拡張レイヤ処理するステップであって、
i) 前記複数のデータカテゴリのうちの1つの画像又はビデオフレームの拡張レイヤ表現を供給するステップ、
ii)各拡張レイヤに拡張レイヤ参照ピクチャバッファを保持するステップ、
iii) 前記基本レイヤ又は異なる拡張レイヤへの少なくとも1つの従属関係を参照処理するステップ、
iv)動き又は視差補償を実行するステップ、
を含むステップ、
を有する、符号化方法。
(EEE40) 前記複数のデータカテゴリは、立体画像又はビデオの複数のビューを有する、EEE39に記載の符号化方法。
(EEE41) 前記複数のデータカテゴリの画像又はビデオフレームの基本レイヤフレーム準拠表現を供給するステップは、前記複数のデータカテゴリの画像又はビデオフレームを基本レイヤサンプリングし単一フレームに基本レイヤ多重化するステップ、
を有する、EEE39又は40に記載の符号化方法。
(EEE42) 前記基本レイヤ処理するステップは、複数の既存のビデオコーデックのうちの1つに従う、EEE39〜41のいずれか一項に記載の符号化方法。
(EEE43) 前記複数の既存のビデオコーデックは、H.264/AVC、VP8及びVC-1を有する、EEE42に記載の符号化方法。
(EEE44) 前記基本レイヤ処理のサンプリングは、前記複数のデータカテゴリの画像又はビデオフレームの対称又は非対称フィルタリングを含む、EEE41〜43のいずれか一項に記載の符号化方法。
(EEE45) 前記基本レイヤサンプリングするステップは、水平サンプリング、垂直サンプリング又は5点形サンプリングを有する、EEE41〜44のいずれか一項に記載の符号化方法。
(EEE46) 前記基本レイヤ多重化するステップは、チェックボードインタリーブ配置、列インタリーブ配置、行インタリーブ配置、サイドバイサイドインタリーブ配置、及び上下インタリーブ配置のうちのいずれか1つのフレームに準拠したパッキング配置を用いる、EEE41〜45のいずれか一項に記載の符号化方法。
(EEE47) 前記基本レイヤ処理は、前記複数のビューの画像又はビデオフレームの等しい又は等しくない量のサンプルを処理するステップを更に含む、EEE40〜46のいずれか一項に記載の符号化方法。
(EEE48) 前記符号化レイヤ処理するステップは、ハイブリッドビデオ符号化モデルを採用し、前記ハイブリッドビデオ符号化モデルは、複数の既存のコーデックのうちのいずれか1つに従う、EEE40〜47のいずれか一項に記載の符号化方法。
(EEE49) 前記複数の既存のコーデックは、VC-1及びH.264/AVCを有する、EEE48に記載の符号化方法。
(EEE50) 前記動き又は視差補償を実行するステップは、前記拡張レイヤ参照ピクチャバッファに格納された少なくとも1つの画像に基づく、EEE39〜49のいずれか一項に記載の符号化方法。
(EEE51) 前記拡張レイヤ処理するステップは、
前記基本レイヤの参照バッファからの少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を基本レイヤ−拡張レイヤ(BL−to−EL)処理するステップ、
前記のBL−to−EL処理された少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を、前記少なくとも1つの拡張レイヤ参照ピクチャバッファに格納するステップ、
を更に含む、EEE39〜49のいずれか一項に記載の符号化方法。
(EEE52) 前記BL−to−EL処理は、前記少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を参照処理し、逆多重化しアップサンプリングするステップを含む、EEE51に記載の符号化方法。
(EEE53) 前記1又は複数の拡張レイヤの各々の前記BL−to−EL処理は、前記少なくとも1つの基本レイヤ復号化されたフレーム準拠画像の参照処理、逆多重化、アップサンプリングを一緒に実行し最適化する単一の処理ユニットにより処理される、EEE52に記載の符号化方法。
(EEE54) 前記拡張レイヤ処理するステップは、
異なる拡張レイヤの拡張レイヤ参照ピクチャバッファに格納された少なくとも1つの参照画像を拡張レイヤ−拡張レイヤ(EL−to−EL)処理するステップ、
前記のEL−to−EL処理された少なくとも1つの拡張レイヤの参照画像を該拡張レイヤの前記少なくとも1つの拡張レイヤ参照ピクチャバッファに格納するステップ、
を更に含む、EEE39〜53に記載の符号化方法。
(EEE55) 前記BL−to−EL処理するステップは、前記のBL−to−EL処理された少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を目標空間解像度に再スケーリングするステップを更に含む、EEE51〜54に記載の符号化方法。
(EEE56) 前記EL−to−EL処理するステップは、前記のEL−to−EL処理された少なくとも1つの拡張レイヤ参照画像を目標空間解像度に再スケーリングするステップを更に含む、EEE54又は55に記載の符号化方法。
(EEE57) 前記複数のデータカテゴリの画像又はビデオフレームの拡張レイヤフレーム準拠表現を供給するステップは、
前記複数のデータカテゴリの元のフル解像度画像と少なくとも1つの基本レイヤ−拡張レイヤ(BL−to−EL)予測との差分画像をフィルタリングし、サンプリングし、多重化するステップ、
を有する、EEE1に記載の符号化方法。
(EEE58) 前記少なくとも1つのBL−to−EL予測は、前記基本レイヤからの少なくとも1つのフレーム準拠復号化ピクチャを逆多重化し参照処理することにより得られる、EEE57に記載の符号化方法。
(EEE59) 前記逆多重化及び参照処理は、フィルタリング、補間又は再スケーリングを更に有する、EEE58に記載の符号化方法。
(EEE60) 前記動き又は視差補償は、前記複数のデータカテゴリの各々に対して実行される、EEE57に記載の符号化方法。
(EEE61) 前記複数のデータカテゴリのうちの1つの画像又はビデオの拡張レイヤ表現を供給するステップは、
前記複数のデータカテゴリのうちの1つの少なくとも1つの元のフル解像度画像と少なくとも1つの基本レイヤ−拡張レイヤ(BL−to−EL)予測との少なくとも1つの差分画像を得るステップ、
を有する、EEE39に記載の符号化方法。
(EEE62) 前記少なくとも1つのBL−to−EL予測は、前記基本レイヤからの少なくとも1つのフレーム準拠復号化ピクチャを逆多重化し参照処理することにより得られる、EEE61に記載の符号化方法。
(EEE63) 前記逆多重化及び参照処理は、フィルタリング、補間又は再スケーリングを更に有する、EEE62に記載の符号化方法。
(EEE64) マルチレイヤフレーム準拠ビデオ配信のための復号化方法であって、
a)基本レイヤを通じて複数の基本レイヤビットストリーム信号を基本レイヤ処理するステップであって、
i)少なくとも1つのフレーム準拠基本レイヤ復号化画像又はビデオフレームを供給するステップ、
を含むステップ、
b)1又は複数の拡張レイヤを通じて前記複数の拡張ビットストリーム信号を拡張レイヤ処理するステップであって、
i)複数のデータカテゴリの少なくとも1つの拡張レイヤ復号化画像又はビデオフレームを供給するステップ、
ii)少なくとも1つの拡張レイヤ参照ピクチャバッファを保持するステップ、
iii) 前記基本レイヤ又は異なる拡張レイヤへの少なくとも1つの従属関係を参照処理するステップ、
iv)視差補償を実行するステップ、
を含むステップ、
を有し、
前記複数のデータカテゴリの全ては、同一の拡張レイヤで復号化され処理される、復号化方法。
(EEE65) 前記複数のデータカテゴリは、立体画像又はビデオの複数のビューを有する、EEE64に記載の復号化方法。
(EEE66) 前記基本レイヤ処理するステップは、複数の既存のビデオコーデックのうちの1つに従う、EEE64又は65に記載の符号化方法。
(EEE67) 前記複数の既存のビデオコーデックは、H.264/AVC、VP8及びVC-1を有する、EEE66に記載の符号化方法。
(EEE68) 前記拡張レイヤ処理するステップは、ハイブリッドビデオ符号化モデルを採用し、前記ハイブリッドビデオ符号化モデルは、複数の既存のコーデックのうちのいずれか1つに従う、EEE64〜67のいずれか一項に記載の復号化方法。
(EEE69) 前記複数の既存のコーデックは、VC-1及びH.264/AVCを有する、EEE68に記載の復号化方法。
(EEE70) 前記拡張レイヤ処理するステップは、同一の画像若しくはフレーム内のサンプルから、又は同一の拡張レイヤの過去の復号化フレームからのサンプルから、少なくとも1つの予測画像を予測することにより、少なくとも1つの参照画像又はビデオフレームを生成するステップ、前記少なくとも1つの予測画像又はビデオフレームを前記少なくとも1つの拡張レイヤ参照ピクチャバッファに格納するステップ、を含む、EEE64〜69のいずれか一項に記載の復号化方法。
(EEE71) 前記少なくとも1つの参照画像又はビデオフレームの生成は、前記複数の拡張レイヤビットストリーム信号から復号化された少なくとも1つの画像と前記少なくとも1つの予測残差画像との和を逆多重化し参照処理するステップを更に含む、EEE70に記載の復号化方法。
(EEE72) 前記逆多重化は、少なくとも1つの予測残差画像と前記少なくとも1つの予測画像との和をアップサンプリングし補間するステップを更に含む、EEE71に記載の復号化方法。
(EEE73) 前記少なくとも1つの拡張レイヤ参照ピクチャバッファのうちの1つは、他の前記少なくとも1つの拡張レイヤ参照ピクチャバッファと異なる解像度で画像又はビデオフレームを格納する、EEE65〜72のいずれか一項に記載の復号化方法。
(EEE74) 前記拡張レイヤ処理するステップは、
前記複数のデータカテゴリの各々に対し、前記少なくとも1つの拡張レイヤ参照ピクチャバッファから少なくとも1つの参照画像を選択するステップ、
前記の選択された少なくとも1つの参照画像を拡張レイヤサンプリングし、少なくとも1つのフレーム準拠画像に拡張レイヤ多重化するステップ、
前記少なくとも1つのフレーム準拠画像に基づき、視差補償又はインター予測を実行するステップ、
を更に含む、EEE64〜73のいずれか一項に記載の復号化方法。
(EEE75) 前記拡張レイヤ処理は、
前記基本レイヤの参照バッファからの少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を基本レイヤ−拡張レイヤ(BL−to−EL)処理するステップ、
前記のBL−to−EL処理された少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を、前記少なくとも1つの拡張レイヤ参照ピクチャバッファに格納するステップ、
を更に含む、EEE73又は74に記載の復号化方法。
(EEE76) 前記BL−to−EL処理は、前記少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を参照処理し、逆多重化し、アップサンプリングするステップを含む、EEE75に記載の復号化方法。
(EEE77) 前記BL−to−EL処理は、前記少なくとも1つの基本レイヤ復号化されたフレーム準拠画像をフィルタリングし、アップスケーリングし、補間するステップを更に含む、EEE76に記載の復号化方法。
(EEE78) 前記拡張レイヤ処理するステップは、前記BL−to−EL処理に関する情報を対応するエンコーダから受信するステップを更に含む、EEE75〜77のいずれか一項に記載の復号化方法。
(EEE79) 前記基本レイヤ処理するステップ及び前記拡張レイヤ処理するステップは、異なる空間解像度で画像を処理する、EEE75〜78のいずれか一項に記載の復号化方法。
(EEE80) 前記BL−to−EL処理するステップは、
前記少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を逆多重化するステップ、
前記の逆多重化された少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を補間するステップ、
前記補完された逆多重化された少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を目標空間解像度に再スケーリングするステップ、
を有する、EEE79に記載の復号化方法。
(EEE81) 前記BL−to−EL処理するステップは、
前記少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を逆多重化するステップ、
前記の逆多重化された少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を異なる空間解像度に再スケーリングするステップ、
前記の逆多重化された再スケーリングされた少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を目標空間解像度に補間するステップ、
を有する、EEE79に記載の復号化方法。
(EEE82) 逆多重化された再スケーリングされた少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を目標空間解像度にフィルタリングするステップを更に含む、EEE81に記載の復号化方法。
(EEE83) 前記拡張レイヤ処理するステップは、メモリ管理制御動作(memory management control operation:MMCO)を通じて前記少なくとも1つの拡張レイヤ参照ピクチャバッファを制御するステップを更に含む、EEE64〜82のいずれか一項に記載の復号化方法。
(EEE84) 前記少なくとも1つの拡張レイヤ参照ピクチャバッファは、1又は複数のMMCOセットに従い同期化される、EEE83に記載の復号化方法。
(EEE85) 前記拡張レイヤ処理するステップは、前記MMCOに関する情報を対応するエンコーダから受信するステップを更に含む、EEE83又は84に記載の復号化方法。
(EEE86) 前記拡張レイヤ処理するステップは、
前記複数のデータカテゴリの各々に対し、前記少なくとも1つの拡張レイヤ参照ピクチャバッファから少なくとも1つの参照画像を選択するステップ、
前記少なくとも1つの参照画像に基づき視差補償又はインター予測を実行することにより、前記複数のデータカテゴリの各々に対し、少なくとも1つの補償画像を得るステップ、
前記少なくとも1つの補償画像を拡張レイヤサンプリングし、少なくとも1つのフレーム準拠画像に拡張レイヤ多重化するステップ、
を更に含む、EEE64〜67のいずれか一項に記載の復号化方法。
(EEE87) 前記拡張レイヤ処理するステップは、メモリ管理制御動作(memory management control operation:MMCO)を通じて前記少なくとも1つの拡張レイヤ参照ピクチャバッファを制御するステップを更に含む、EEE86に記載の復号化方法。
(EEE88) 前記拡張レイヤ処理するステップは、前記MMCOに関する情報を対応するエンコーダから受信するステップを更に含む、EEE87に記載の復号化方法。
(EEE89) マルチレイヤフレーム準拠ビデオ配信のための復号化方法であって、
a)基本レイヤを通じて基本レイヤを通じて複数の基本レイヤビットストリーム信号を基本レイヤ処理するステップであって、
i)少なくとも1つのフレーム準拠基本レイヤ復号化画像又はビデオフレームを供給するステップ、
を含むステップ、
b)1又は複数の拡張レイヤを通じて複数のデータカテゴリの1又は複数の拡張レイヤを通じて前記複数の拡張ビットストリーム信号を拡張レイヤ処理するステップであって、前記複数のデータカテゴリの各々は、別個の拡張レイヤで別個に処理され、前記1又は複数の拡張レイヤの各々は、
i) 前記複数のデータカテゴリのうちの1つの少なくとも1つの拡張レイヤ復号化画像又はビデオフレームを供給するステップ、
ii)少なくとも1つの拡張レイヤ参照ピクチャバッファを保持するステップ、
iii) 前記基本レイヤ又は異なる拡張レイヤへの少なくとも1つの従属関係を参照処理するステップ、
iv)視差補償を実行するステップ、
を含むステップ、
を有し、
前記複数のデータカテゴリの全ては、同一の拡張レイヤで復号化され処理される、復号化方法。
(EEE90) 前記複数のデータカテゴリは、立体画像又はビデオの複数のビューを有する、EEE89に記載の復号化方法。
(EEE91) 前記基本レイヤ処理するステップは、複数の既存のビデオコーデックのうちの1つに従う、EEE89又は90に記載の復号化方法。
(EEE92) 前記複数の既存のビデオコーデックは、H.264/AVC、VP8及びVC-1を有する、EEE91に記載の復号化方法。
(EEE93) 前記符号化レイヤ処理するステップは、ハイブリッドビデオ符号化モデルを採用し、前記ハイブリッドビデオ符号化モデルは、複数の既存のコーデックのうちのいずれか1つに従う、EEE89〜92のいずれか一項に記載の復号化方法。
(EEE94) 前記複数の既存のコーデックは、VC-1及びH.264/AVCを有する、EEE93に記載の復号化方法。
(EEE95) 前記動き又は視差補償を実行するステップは、前記拡張レイヤ参照ピクチャバッファに格納された少なくとも1つの画像に基づく、EEE89〜94のいずれか一項に記載の復号化方法。
(EEE96) 前記拡張レイヤ処理するステップは、
前記基本レイヤの参照バッファからの少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を基本レイヤ−拡張レイヤ(BL−to−EL)処理するステップ、
前記のBL−to−EL処理された少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を、前記少なくとも1つの拡張レイヤ参照ピクチャバッファに格納するステップ、
を更に含む、EEE89〜95のいずれか一項に記載の復号化方法。
(EEE97) 前記BL−to−EL処理は、前記少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を参照処理し、逆多重化し、アップサンプリングするステップを含む、EEE96に記載の復号化方法。
(EEE98) 前記1又は複数の拡張レイヤの各々の前記BL−to−EL処理は、前記少なくとも1つの基本レイヤ復号化されたフレーム準拠画像の参照処理、逆多重化、アップサンプリングを一緒に実行し最適化する単一の処理ユニットにより処理される、EEE97に記載の復号化方法。
(EEE99) 前記拡張レイヤ処理するステップは、
異なる拡張レイヤの拡張レイヤ参照ピクチャバッファに格納された少なくとも1つの参照画像を拡張レイヤ−拡張レイヤ(EL−to−EL)処理するステップ、
前記のEL−to−EL処理された少なくとも1つの拡張レイヤの参照画像を該拡張レイヤの前記少なくとも1つの拡張レイヤ参照ピクチャバッファに格納するステップ、
を更に含む、EEE89〜98に記載の復号化方法。
(EEE100) 前記BL−to−EL処理するステップは、前記のBL−to−EL処理された少なくとも1つの基本レイヤ復号化されたフレーム準拠画像を目標空間解像度に再スケーリングするステップを更に含む、EEE89〜99に記載の復号化方法。
(EEE101) 前記EL−to−EL処理するステップは、前記のEL−to−EL処理された少なくとも1つの拡張レイヤ参照画像を目標空間解像度に再スケーリングするステップを更に含む、EEE99又は100に記載の復号化方法。
(EEE102) 前記複数のデータカテゴリの前記少なくとも1つの拡張レイヤ復号化画像又はビデオフレームを供給するステップは、
前記少なくとも1つの拡張レイヤ参照ピクチャバッファに格納された参照画像を少なくとも1つの基本レイヤ−拡張レイヤ(BL−to−EL)予測に加算するステップ、
を有する、EEE89に記載の復号化方法。
(EEE103) 前記少なくとも1つのBL−to−EL予測は、前記基本レイヤの参照ピクチャバッファに格納された少なくとも1つのフレーム準拠復号化ピクチャを逆多重化し参照処理することにより得られる、EEE102に記載の復号化方法。
(EEE104) 前記視差補償は、前記複数のデータカテゴリの各々に対して実行される、EEE102に記載の復号化方法。
(EEE105) 前記複数のデータカテゴリのうちの1つの前記少なくとも1つの拡張レイヤ復号化画像又はビデオフレームを供給するステップは、
前記少なくとも1つの拡張レイヤ参照ピクチャバッファに格納された参照画像を少なくとも1つの基本レイヤ−拡張レイヤ(BL−to−EL)予測に加算するステップ、
を有する、EEE89に記載の復号化方法。
(EEE106) 前記少なくとも1つのBL−to−EL予測は、前記基本レイヤの参照ピクチャバッファに格納された少なくとも1つのフレーム準拠復号化ピクチャを逆多重化し参照処理することにより得られる、EEE105に記載の復号化方法。
(EEE107) 前記逆多重化及び参照処理は、フィルタリング、補間又は再スケーリングを更に有する、EEE106に記載の復号化方法。
(EEE108)EEE1〜63、117の1又は複数項に記載された方法に従って、少なくとも1つの画像又はビデオフレームを符号化するエンコーダ。
(EEE109)EEE1〜63、117の1又は複数項に記載された方法に従って、少なくとも1つの画像又はビデオフレームを符号化する装置。
(EEE110)EEE1〜63、117の1又は複数項に記載された方法に従って、少なくとも1つの画像又はビデオフレームを符号化するシステム。
(EEE111)EEE64〜107、118の1又は複数項に記載された方法に従って、少なくとも1つの画像又はビデオフレームを復号化するデコーダ。
(EEE112)EEE64〜107、118の1又は複数項に記載された方法に従って、少なくとも1つの画像又はビデオフレームを復号化する装置。
(EEE113)EEE64〜107、118の1又は複数項に記載された方法に従って、少なくとも1つの画像又はビデオフレームを復号化するシステム。
(EEE114)命令セットを有するコンピュータ可読媒体であって、前記命令セットは、コンピュータにEEE1〜107、117、118の1又は複数項に記載された方法を実行させる、コンピュータ可読媒体。
(EEE115)少なくとも1つの画像又はビデオフレームを符号化するための、EEE1〜63、117の1又は複数項に記載された方法の使用。
(EEE116)少なくとも1つの画像又はビデオフレームを復号化するための、EEE64〜107、118の1又は複数項に記載された方法の使用。
(EEE117) 前記少なくとも1つの拡張レイヤ参照ピクチャバッファは、少なくとも2つの拡張レイヤ参照バッファを有する、EEE1〜38のいずれか一項に記載の符号化方法。
(EEE118) 前記少なくとも1つの拡張レイヤ参照ピクチャバッファは、少なくとも2つの拡張レイヤ参照バッファを有する、EEE64〜68のいずれか一項に記載の復号化方法。
本願明細書で言及された全ての特許文献及び刊行物は、本開示の関連する分野の当業者の水準を示し得る。本開示で引用された全ての参考文献は、参照されることにより、各文献の全体が個々に参照により組み込まれているのと同程度に本願明細書に組み込まれる。
上述の例は、当業者に本開示のマルチレイヤフレーム準拠ビデオ配信のシステム及び方法の実施形態をどのように作り使用するかの完全な開示及び説明を与えるために提供され、発明者等が彼らの開示として見なす範囲を限定するものではない。本開示を実施するための上述のモードの変更が、当業者により用いられ、以下の請求の範囲の範囲内にあると見なされる。本願明細書で言及された全ての特許文献及び刊行物は、本開示の関連する分野の当業者の水準を示し得る。本開示で引用された全ての参考文献は、参照されることにより、各文献の全体が個々に参照により組み込まれているのと同程度に本願明細書に組み込まれる。
本開示は特定の方法又はシステムに限定されるものではないことが理解されるべきである。これらの方法又はシステムは、勿論、変更できる。本願明細書で用いられた用語は、特定の実施形態を説明することのみを目的としており、限定を目的としていないことが理解されるべきである。明細書及び請求の範囲で用いられるように、単数を表す語(「a」、「an」及び「the」)は、特に文脈上明示されない限り、複数への参照も含む。用語「複数」は、特に明示されない限り、2以上の指示対象を含む。特に定められない限り、本願明細書で用いられた全ての技術的及び科学的用語は、本開示の関連する分野の当業者により通常理解されるものと同じ意味を有する。
本開示の多くの実施形態が記載された。しかしながら、本開示の精神及び範囲から逸脱することなく種々の変更を行うことができることが理解されるだろう。したがって、他の実施形態も添付の請求の範囲に包含される。
[関連出願の参照]
本願は、米国仮特許出願番号61/366,512、出願日2010年7月21日の優先権を主張する。該米国仮特許出願は参照されることにより本願明細書に組み込まれる。
1102 基本レイヤ
1104 基本レイヤエンコーダ
1106 サンプラ
1108 マルチプレクサ
1152 追加拡張レイヤ
1154 予測残差
1156 変換
1158 量子化
1160 エントロピー符号化
1162 内部参照ピクチャバッファ
1164 デマルチプレクサ及びRPUプロセッサ
1168 視差補償
1170 サンプラ
1172 マルチプレクサ

Claims (7)

  1. マルチレイヤの後方互換性ビデオ配信のための符号化方法であって、ビデオエンコーダが、
    a)基本レイヤを通じて画像又はビデオフレームを基本レイヤ処理するステップであって、
    i)第1の装置による使用のために前記画像又はビデオフレームの基本レイヤ後方互換性表現を提供するステップと、
    ii)基本レイヤ参照ピクチャを格納する少なくとも1つの基本レイヤ参照ピクチャバッファを維持するステップと、を含むステップと、
    b)1又は複数の拡張レイヤを通じて前記画像又はビデオフレームを拡張レイヤ処理するステップであって、
    iii)第2の装置による使用のために前記画像又はビデオフレームの拡
    張レイヤ表現を提供するステップと、
    iv)前記基本レイヤ参照ピクチャを逆多重化しアップサンプリングすることにより、拡張レイヤ参照ピクチャと、予測及びアップサンプリング処理の情報を生成するステップと、
    前記拡張レイヤ参照ピクチャを格納する少なくとも1つの拡張レイヤ参照ピクチャバッファを維持するステップと、
    vi)動き補償を実行するステップと、を含むステップと、
    vii)前記第2の装置による使用のために前記予測及びアップサンプリング処理の情報を提供するステップ、を含むステップと、
    を有する方法。
  2. 前記基本レイヤ後方互換性表現は、立体画像又はビデオを有する、請求項1に記載の方法。
  3. 前記拡張レイヤ処理するステップは、
    同一の画像若しくはフレーム内のサンプルから、又は同一の拡張レイヤの過去の復号化フレームからのサンプルから、少なくとも1つの予測画像を予測することにより、少なくとも1つの参照画像又はビデオフレームを生成するステップと、
    前記少なくとも1つの予測画像又はビデオフレームを前記少なくとも1つの拡張レイヤ参照ピクチャバッファに格納するステップと、
    を更に含む請求項1に記載の方法。
  4. 前記少なくとも1つの参照画像又はビデオフレームの生成は、少なくとも1つの予測残差画像と前記少なくとも1つの予測画像との和を逆多重化し参照処理するステップを更に含む、請求項3に記載の方法。
  5. 前記逆多重化は、少なくとも1つの予測残差画像と前記少なくとも1つの予測画像との和をアップサンプリングし補間するステップを更に含む、請求項4に記載の方法。
  6. 前記少なくとも1つの拡張レイヤ参照ピクチャバッファのうちの1つは、他の前記少なくとも1つの拡張レイヤ参照ピクチャバッファと異なる解像度で画像又はビデオフレームを格納する、請求項5に記載の方法。
  7. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサにより実行されると、前記プロセッサに請求項1に記載の方法を実行させ、実行するようプログラムし、設定し、構成し又は制御する有形に格納された命令を有するコンピュータ可読記憶媒体と、
    を有するビデオエンコーダ。
JP2014115437A 2010-07-21 2014-06-04 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法 Expired - Fee Related JP5875634B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US36651210P 2010-07-21 2010-07-21
US61/366,512 2010-07-21

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013520851A Division JP5749340B2 (ja) 2010-07-21 2011-07-20 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2015220361A Division JP6175473B2 (ja) 2010-07-21 2015-11-10 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法

Publications (2)

Publication Number Publication Date
JP2014209746A JP2014209746A (ja) 2014-11-06
JP5875634B2 true JP5875634B2 (ja) 2016-03-02

Family

ID=44629252

Family Applications (6)

Application Number Title Priority Date Filing Date
JP2013520851A Active JP5749340B2 (ja) 2010-07-21 2011-07-20 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法
JP2014115437A Expired - Fee Related JP5875634B2 (ja) 2010-07-21 2014-06-04 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法
JP2015098198A Active JP6113782B2 (ja) 2010-07-21 2015-05-13 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法
JP2015220361A Active JP6175473B2 (ja) 2010-07-21 2015-11-10 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法
JP2016081931A Active JP6175534B2 (ja) 2010-07-21 2016-04-15 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法
JP2016081932A Active JP6175535B2 (ja) 2010-07-21 2016-04-15 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013520851A Active JP5749340B2 (ja) 2010-07-21 2011-07-20 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法

Family Applications After (4)

Application Number Title Priority Date Filing Date
JP2015098198A Active JP6113782B2 (ja) 2010-07-21 2015-05-13 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法
JP2015220361A Active JP6175473B2 (ja) 2010-07-21 2015-11-10 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法
JP2016081931A Active JP6175534B2 (ja) 2010-07-21 2016-04-15 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法
JP2016081932A Active JP6175535B2 (ja) 2010-07-21 2016-04-15 マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法

Country Status (9)

Country Link
US (4) US8619852B2 (ja)
EP (2) EP2596637B1 (ja)
JP (6) JP5749340B2 (ja)
CN (5) CN105847781B (ja)
ES (1) ES2885250T3 (ja)
HK (2) HK1226568A1 (ja)
HU (1) HUE055506T2 (ja)
PL (1) PL2596637T3 (ja)
WO (1) WO2012012584A1 (ja)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4962525B2 (ja) * 2009-04-08 2012-06-27 ソニー株式会社 再生装置、再生方法、およびプログラム
CN105847781B (zh) * 2010-07-21 2018-03-20 杜比实验室特许公司 用于多层帧兼容视频传输的解码方法
US9762884B2 (en) * 2010-09-03 2017-09-12 Sony Corporation Encoding device, encoding method, decoding device, and decoding method for encoding multiple viewpoints for compatibility with existing mode allowing fewer viewpoints
MX2013002135A (es) * 2010-09-03 2013-04-03 Sony Corp Dispositivo de codificacion y metodo de codificacion, asi como dispositivo de decodificacion y metodo de decodificacion.
EP2622857A1 (en) * 2010-10-01 2013-08-07 Dolby Laboratories Licensing Corporation Optimized filter selection for reference picture processing
WO2013009716A2 (en) 2011-07-08 2013-01-17 Dolby Laboratories Licensing Corporation Hybrid encoding and decoding methods for single and multiple layered video coding systems
EP2752000B1 (en) 2011-08-31 2021-03-17 Dolby Laboratories Licensing Corporation Multiview and bitdepth scalable video delivery
WO2013040170A1 (en) 2011-09-16 2013-03-21 Dolby Laboratories Licensing Corporation Frame-compatible full resolution stereoscopic 3d compression and decompression
EP2761877B8 (en) 2011-09-29 2016-07-13 Dolby Laboratories Licensing Corporation Dual-layer frame-compatible full-resolution stereoscopic 3d video delivery
TWI595770B (zh) 2011-09-29 2017-08-11 杜比實驗室特許公司 具有對稱圖像解析度與品質之圖框相容全解析度立體三維視訊傳達技術
CN107241606B (zh) 2011-12-17 2020-02-21 杜比实验室特许公司 解码系统、方法和设备以及计算机可读介质
EP2805512B1 (en) * 2012-01-19 2018-06-27 VID SCALE, Inc. Method and apparatus for signaling and construction of video coding reference picture lists
JP5905610B2 (ja) 2012-03-12 2016-04-20 ドルビー ラボラトリーズ ライセンシング コーポレイション 3d視覚的ダイナミックレンジ符号化
US9357197B2 (en) * 2012-05-24 2016-05-31 Dolby Laboratories Licensing Corporation Multi-layer backwards-compatible video delivery for enhanced dynamic range and enhanced resolution formats
TWI630815B (zh) * 2012-06-14 2018-07-21 杜比實驗室特許公司 用於立體及自動立體顯示器之深度圖傳遞格式
US9838688B2 (en) 2012-06-22 2017-12-05 Mediatek Inc. Method and apparatus of adaptive intra prediction for inter-layer and inter-view coding
CN102883120B (zh) * 2012-07-24 2016-07-20 冠捷显示科技(厦门)有限公司 一种双画面图像显示装置及控制方法
US20140092972A1 (en) * 2012-09-29 2014-04-03 Kiran Mukesh Misra Picture processing in scalable video systems
JP2014082541A (ja) * 2012-10-12 2014-05-08 National Institute Of Information & Communication Technology 互いに類似した情報を含む複数画像のデータサイズを低減する方法、プログラムおよび装置
US20150312579A1 (en) * 2012-12-04 2015-10-29 Intellectual Discovery Co., Ltd. Video encoding and decoding method and device using said method
US10116931B2 (en) * 2013-01-03 2018-10-30 Texas Instruments Incorporated Hierarchical inter-layer prediction in multi-loop scalable video coding
EP2965524B1 (en) 2013-04-08 2021-11-24 ARRIS Enterprises LLC Individual buffer management in video coding
EP2987325B1 (en) * 2013-04-15 2018-08-29 V-Nova International Ltd Hybrid backward-compatible signal encoding and decoding
US9509999B2 (en) * 2013-06-11 2016-11-29 Qualcomm Incorporated Inter-layer prediction types in multi-layer video coding
US9756335B2 (en) * 2013-07-02 2017-09-05 Qualcomm Incorporated Optimizations on inter-layer prediction signalling for multi-layer video coding
US9813736B2 (en) * 2013-09-27 2017-11-07 Qualcomm Incorporated Inter-view dependency type in MV-HEVC
US9710881B2 (en) 2014-04-05 2017-07-18 Sony Interactive Entertainment America Llc Varying effective resolution by screen location by altering rasterization parameters
US10783696B2 (en) 2014-04-05 2020-09-22 Sony Interactive Entertainment LLC Gradient adjustment for texture mapping to non-orthonormal grid
US9865074B2 (en) 2014-04-05 2018-01-09 Sony Interactive Entertainment America Llc Method for efficient construction of high resolution display buffers
US9710957B2 (en) 2014-04-05 2017-07-18 Sony Interactive Entertainment America Llc Graphics processing enhancement by tracking object and/or primitive identifiers
US11302054B2 (en) 2014-04-05 2022-04-12 Sony Interactive Entertainment Europe Limited Varying effective resolution by screen location by changing active color sample count within multiple render targets
US10068311B2 (en) 2014-04-05 2018-09-04 Sony Interacive Entertainment LLC Varying effective resolution by screen location by changing active color sample count within multiple render targets
US9652882B2 (en) 2014-04-05 2017-05-16 Sony Interactive Entertainment America Llc Gradient adjustment for texture mapping for multiple render targets with resolution that varies by screen location
US9836816B2 (en) 2014-04-05 2017-12-05 Sony Interactive Entertainment America Llc Varying effective resolution by screen location in graphics processing by approximating projection of vertices onto curved viewport
US9495790B2 (en) * 2014-04-05 2016-11-15 Sony Interactive Entertainment America Llc Gradient adjustment for texture mapping to non-orthonormal grid
US10438312B2 (en) 2014-04-05 2019-10-08 Sony Interactive Entertainment LLC Method for efficient re-rendering objects to vary viewports and under varying rendering and rasterization parameters
WO2015170819A1 (ko) * 2014-05-09 2015-11-12 한국전자통신연구원 레이어드 디비전 멀티플렉싱을 이용한 신호 멀티플렉싱 장치 및 신호 멀티플렉싱 방법
MX2018008368A (es) 2014-05-09 2022-01-27 Electronics & Telecommunications Res Inst Aparato de multiplexion de señal usando multiplexion por division en capas y metodo de multiplexion de señal.
CA3083172C (en) 2014-05-21 2022-01-25 Arris Enterprises Llc Individual buffer management in transport of scalable video
US10205949B2 (en) 2014-05-21 2019-02-12 Arris Enterprises Llc Signaling for addition or removal of layers in scalable video
US20170230612A1 (en) * 2016-02-04 2017-08-10 Shane Ray Thielen Adaptive resolution encoding for streaming data
FI20165547A (fi) * 2016-06-30 2017-12-31 Nokia Technologies Oy Laitteisto, menetelmä ja tietokoneohjelma videokoodausta ja videokoodauksen purkua varten
US10951874B2 (en) * 2016-09-02 2021-03-16 Mediatek Inc. Incremental quality delivery and compositing processing
CN106803958B (zh) * 2017-01-12 2019-12-27 同济大学 一种基于叠加调制编码的数模混合视频传输方法
US10999583B2 (en) * 2018-09-14 2021-05-04 Apple Inc. Scalability of multi-directional video streaming
JP7405861B2 (ja) 2019-03-01 2023-12-26 北京字節跳動網絡技術有限公司 映像符号化におけるイントラブロックコピーのための方向に基づく予測
JP7284284B2 (ja) 2019-03-04 2023-05-30 北京字節跳動網絡技術有限公司 映像符号化におけるイントラブロックコピーの実装形態の態様
WO2020181088A1 (en) 2019-03-07 2020-09-10 Alibaba Group Holding Limited Method, apparatus, medium, and device for generating multi-angle free-respective image data
KR102635519B1 (ko) * 2019-07-10 2024-02-07 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 코딩에서 인트라 블록 카피를 위한 샘플 식별
US11928452B2 (en) * 2022-02-03 2024-03-12 Red Hat, Inc. Reducing the size of image files usable for deploying software in computing environments

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE68910848T2 (de) 1988-02-23 1994-05-19 Philips Nv Einrichtung zur raumzeitlichen Unterabtastung von digitalen Videosignalen, die eine Folge verschachtelter oder sequentieller Bilder darstellen, Übertragungssystem von Fernsehbildern mit hoher Auflösung mit einer solchen Einrichtung und Stufen zum Senden und Empfangen in einem solchen System.
JPH042276A (ja) 1990-04-19 1992-01-07 Fuji Photo Film Co Ltd 画像信号圧縮符号化装置
JP3517455B2 (ja) 1994-09-30 2004-04-12 キヤノン株式会社 画像符号化方法及び装置
US5612735A (en) * 1995-05-26 1997-03-18 Luncent Technologies Inc. Digital 3D/stereoscopic video compression technique utilizing two disparity estimates
US6111596A (en) * 1995-12-29 2000-08-29 Lucent Technologies Inc. Gain and offset correction for efficient stereoscopic coding and improved display
US6055012A (en) * 1995-12-29 2000-04-25 Lucent Technologies Inc. Digital multi-view video compression with complexity and compatibility constraints
EP1065881B1 (en) 1998-03-05 2008-07-09 Matsushita Electric Industrial Co., Ltd. Image coding method, image coding / decoding method, image coder, or image recording/reproducing apparatus
US6925120B2 (en) * 2001-09-24 2005-08-02 Mitsubishi Electric Research Labs, Inc. Transcoder for scalable multi-layer constant quality video bitstreams
KR100481732B1 (ko) * 2002-04-20 2005-04-11 전자부품연구원 다 시점 동영상 부호화 장치
JP4104895B2 (ja) * 2002-04-25 2008-06-18 シャープ株式会社 立体画像符号化装置および立体画像復号装置
US20060023782A1 (en) * 2004-07-27 2006-02-02 Microsoft Corporation System and method for off-line multi-view video compression
US7671894B2 (en) * 2004-12-17 2010-03-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for processing multiview videos for view synthesis using skip and direct modes
JP5587552B2 (ja) * 2005-10-19 2014-09-10 トムソン ライセンシング スケーラブル映像符号化を用いた多視点映像符号化
KR100667830B1 (ko) * 2005-11-05 2007-01-11 삼성전자주식회사 다시점 동영상을 부호화하는 방법 및 장치
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
KR101378185B1 (ko) 2006-07-11 2014-03-26 톰슨 라이센싱 가상 참조 픽처를 사용하는 방법 및 장치
EP2632163A3 (en) * 2006-07-20 2013-11-27 Thomson Licensing Method and apparatus for signaling view scalability in multi-view video coding
WO2008051041A1 (en) * 2006-10-25 2008-05-02 Electronics And Telecommunications Research Institute Multi-view video scalable coding and decoding
BR122018004903B1 (pt) 2007-04-12 2019-10-29 Dolby Int Ab ladrilhamento em codificação e decodificação de vídeo
EP2432015A1 (en) * 2007-04-18 2012-03-21 Invisage Technologies, Inc. Materials, systems and methods for optoelectronic devices
KR100962696B1 (ko) * 2007-06-07 2010-06-11 주식회사 이시티 부호화된 스테레오스코픽 영상 데이터 파일의 구성방법
US8487982B2 (en) 2007-06-07 2013-07-16 Reald Inc. Stereoplexing for film and video applications
US8373744B2 (en) 2007-06-07 2013-02-12 Reald Inc. Stereoplexing for video and film applications
KR101094441B1 (ko) * 2007-06-20 2011-12-20 한국전자통신연구원 디지털 방송 신호의 전송 방법, 전송 장치, 수신 방법 및수신 장치
KR20090004659A (ko) * 2007-07-02 2009-01-12 엘지전자 주식회사 디지털 방송 시스템 및 데이터 처리 방법
KR101147943B1 (ko) * 2007-10-15 2012-05-23 퀄컴 인코포레이티드 스케일러블 비디오 코딩을 위한 개선된 향상 계층 코딩
JP5231563B2 (ja) * 2007-10-19 2013-07-10 サムスン エレクトロニクス カンパニー リミテッド 立体映像データを記録する方法
CN101420609B (zh) * 2007-10-24 2010-08-25 华为终端有限公司 视频编码、解码方法及视频编码器、解码器
KR101506217B1 (ko) * 2008-01-31 2015-03-26 삼성전자주식회사 스테레오스코픽 영상의 부분 데이터 구간 재생을 위한스테레오스코픽 영상 데이터스트림 생성 방법과 장치, 및스테레오스코픽 영상의 부분 데이터 구간 재생 방법과 장치
CN103297771B (zh) * 2008-04-25 2017-03-01 汤姆森许可贸易公司 使用基于深度信息的视差估计的多视点视频编码
EP2308232B1 (en) * 2008-07-20 2017-03-29 Dolby Laboratories Licensing Corp. Encoder optimization of stereoscopic video delivery systems
JP5235035B2 (ja) * 2008-09-23 2013-07-10 ドルビー ラボラトリーズ ライセンシング コーポレイション チェッカーボード多重化したイメージデータのエンコーディング構造及びデコーディング構造
ES2395363T3 (es) * 2008-12-25 2013-02-12 Dolby Laboratories Licensing Corporation Reconstrucción de vistas desentrelazadas, utilizando interpolación adaptativa basada en disparidades entre las vistas para un muestro ascendente
EP2389764A2 (en) * 2009-01-26 2011-11-30 Thomson Licensing Frame packing for video coding
US20100260268A1 (en) * 2009-04-13 2010-10-14 Reald Inc. Encoding, decoding, and distributing enhanced resolution stereoscopic video
CN102450010A (zh) 2009-04-20 2012-05-09 杜比实验室特许公司 定向内插和数据后处理
JP5416271B2 (ja) * 2009-04-20 2014-02-12 ドルビー ラボラトリーズ ライセンシング コーポレイション 多層映像配信のための適応補間フィルタ
EP2425631B1 (en) * 2009-04-27 2015-05-20 LG Electronics Inc. Broadcast receiver and 3d video data processing method thereof
US9774882B2 (en) 2009-07-04 2017-09-26 Dolby Laboratories Licensing Corporation Encoding and decoding architectures for format compatible 3D video delivery
WO2012006299A1 (en) 2010-07-08 2012-01-12 Dolby Laboratories Licensing Corporation Systems and methods for multi-layered image and video delivery using reference processing signals
US9438881B2 (en) * 2010-07-19 2016-09-06 Dolby Laboratories Licensing Corporation Enhancement methods for sampled and multiplexed image and video data
CN105847781B (zh) * 2010-07-21 2018-03-20 杜比实验室特许公司 用于多层帧兼容视频传输的解码方法
US9674519B2 (en) * 2012-11-09 2017-06-06 Qualcomm Incorporated MPEG frame compatible video coding

Also Published As

Publication number Publication date
CN105812828A (zh) 2016-07-27
CN105812827B (zh) 2019-04-16
US20190068947A1 (en) 2019-02-28
CN105812827A (zh) 2016-07-27
EP2596637B1 (en) 2021-08-04
US20130114680A1 (en) 2013-05-09
JP6175534B2 (ja) 2017-08-02
HK1226569B (zh) 2017-09-29
CN105847781A (zh) 2016-08-10
CN105847780A (zh) 2016-08-10
JP5749340B2 (ja) 2015-07-15
EP3923571B1 (en) 2023-07-19
US10142611B2 (en) 2018-11-27
JP6113782B2 (ja) 2017-04-12
PL2596637T3 (pl) 2021-12-13
CN103026706A (zh) 2013-04-03
CN105847780B (zh) 2018-01-09
HUE055506T2 (hu) 2021-11-29
US9479772B2 (en) 2016-10-25
JP2013538487A (ja) 2013-10-10
US11044454B2 (en) 2021-06-22
JP2014209746A (ja) 2014-11-06
HK1226568A1 (zh) 2017-09-29
EP3923571A1 (en) 2021-12-15
CN105812828B (zh) 2018-09-18
JP2016036177A (ja) 2016-03-17
JP2016149801A (ja) 2016-08-18
JP2015167394A (ja) 2015-09-24
WO2012012584A1 (en) 2012-01-26
CN103026706B (zh) 2016-04-20
EP2596637A1 (en) 2013-05-29
US8619852B2 (en) 2013-12-31
US20140111614A1 (en) 2014-04-24
ES2885250T3 (es) 2021-12-13
JP6175535B2 (ja) 2017-08-02
JP2016149800A (ja) 2016-08-18
CN105847781B (zh) 2018-03-20
US20160381343A1 (en) 2016-12-29
JP6175473B2 (ja) 2017-08-02

Similar Documents

Publication Publication Date Title
JP6175534B2 (ja) マルチレイヤフレーム準拠ビデオ配信のためのシステム及び方法
CN107241606B (zh) 解码系统、方法和设备以及计算机可读介质
EP2752000B1 (en) Multiview and bitdepth scalable video delivery
US20120268558A1 (en) Method and apparatus for video encoding using inter layer prediction with pre-filtering, and method and apparatus for video decoding using inter layer prediction with post-filtering
TWI540878B (zh) 編碼器、解碼器、位元串流、以及編碼與解碼對應於多重視圖信號之兩個視圖之影像對之方法及相關聯電腦程式產品
KR101144752B1 (ko) 비디오 인코딩/디코딩 방법 및 그 장치
KR20080027190A (ko) 다 해상도 스테레오 및 다중 뷰 비디오 압축 방법 및 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150703

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150811

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160119

R150 Certificate of patent or registration of utility model

Ref document number: 5875634

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees