JP2015520567A - 係数サンプリングに基づいたスケーラブルビデオ符号化のためのシステム、方法及びコンピュータプログラム製品 - Google Patents

係数サンプリングに基づいたスケーラブルビデオ符号化のためのシステム、方法及びコンピュータプログラム製品 Download PDF

Info

Publication number
JP2015520567A
JP2015520567A JP2015511882A JP2015511882A JP2015520567A JP 2015520567 A JP2015520567 A JP 2015520567A JP 2015511882 A JP2015511882 A JP 2015511882A JP 2015511882 A JP2015511882 A JP 2015511882A JP 2015520567 A JP2015520567 A JP 2015520567A
Authority
JP
Japan
Prior art keywords
layer
coefficients
sampling
processor
causing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015511882A
Other languages
English (en)
Other versions
JP6141417B2 (ja
Inventor
ジャーン,ウエンハオ
チウ,イー−ジェン
シュイ,リードーン
ハン,ユイ
ジアーン,ホーン
Original Assignee
インテル コーポレイション
インテル コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インテル コーポレイション, インテル コーポレイション filed Critical インテル コーポレイション
Publication of JP2015520567A publication Critical patent/JP2015520567A/ja
Application granted granted Critical
Publication of JP6141417B2 publication Critical patent/JP6141417B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

HEVC標準と互換性があるスケール変更されエンコードされたビデオデータの複数レイヤの生成のための方法、システム及びコンピュータプログラム製品である。予測処理からの残差が、周波数ドメイン内で係数に変換されることができる。それから、この係数をサンプリングして、エンコードされたデータのレイヤを作成することができる。この係数を種々の方法でサンプリングして、複数のそれぞれのレイヤを作成することができる。それから、これらレイヤを多重化し、デコーダに送信することができる。そこでは、上記レイヤのうち1又は複数を選ぶことができる。特定の(1又は複数の)レイヤの選択は、結果的に生じるビデオの所望される特性に依存してよい。例えば、或るレベルのビデオ品質、フレームレート、解像度及び/又はビット深度が所望され得る。それから、選択されたレイヤ内の係数を組み立てて、ビデオデコーディングにおいて使用すべき残差のバージョンを作成することができる。

Description

本発明は、HEVC標準と互換性があるビデオデータの複数レイヤの生成のための方法、システム及びコンピュータプログラム製品に関する。
高効率ビデオ符号化(High Efficiency Video Coding;HEVC)は、発展中のビデオ圧縮標準である。HEVCは、ISO/IEC動画像符号化専門家グループ(Moving Picture Experts Group;MPEG)とITU−Tビデオ符号化専門家グループ(Video Coding Experts Group;VCEG)とによって結成されたビデオ符号化に関する共同チーム(Joint Collaborative Team on Video Coding;JCT−VC)による開発下にある。HEVCは、イントラ/インター予測モジュール、変換モジュール、量子化及びループ内フィルタリングモジュール並びにエントロピー符号化モジュールなどのいくつかのモジュールを採用することができる。
HEVCの標準化が完了に近づいている折、JCT−VCは、スケーラブルビデオ符号化(Scalable Video Coding;SVC)拡張をHEVC標準に追加することを計画し始めた。SVCは、現代のビデオサービス環境におけるネットワーク及び装置の不均一性を踏まえてコピーを行う方法である。SVCビットストリームは、デコードされることができるいくつかのサブセットビットストリームを包含することができ、これらのサブストリームは、例えば、種々のそれぞれの解像度、フレームレート、品質及び/又はビット深度を用いて、ソースビデオコンテンツを各々表すことができる。デコーディング側では、特定のサブセットストリームをデコーディングのために選択することができ、この選択は、所望される解像度、フレームレート、品質及び/又はビット深度などに基づくことができる。
このスケーラビリティは、マルチレイヤ符号化構造を使用することによって達成される。一般に、SVCシステムには、1つのベースレイヤ(BL)といくつかの拡張レイヤ(EL)とが存在し得る。BLは、HEVC標準と互換性がある方法でエンコードすることができ、レイヤ0として識別することができる。ELは、レイヤ1、2、…などとして識別することができる。Nに等しいレイヤ識別子を有するELを符号化するとき、Nより小さいレイヤ識別子を有するすべてのレイヤが利用可能である。このことは、ELに対応するピクチャを、より低いレイヤのピクチャ(すなわち、より小さい数を有するレイヤ)から、又は同一レイヤ内で事前に符号化されたピクチャから予測できることを意味する。すべてのレイヤはデコーディング側に送信することができ、デコーディング側において、特定のレイヤをデコーディングのために選択することができる。
各レイヤがソースビデオコンテンツを表すため、複数レイヤの送信及び記憶は、かなりの量のデータを示す。エンドユーザは、どの表現(すなわち、レイヤ)をデコードするかに関していくつかの選択肢を提供されるが、かなりの帯域と処理パワーとが、これらのレイヤのエンコーディング、送信及び記憶において消費される可能性がある。
一実施形態において、スケーラブルビデオエンコーディングの方法が、処理の予測残差の変換から生じる係数をサンプリングするステップであり、上記サンプリングするステップはそれぞれの複数のサンプルをもたらすように複数回行われる、ステップと、各サンプルを用いて、エンコードされたデータのそれぞれのレイヤを生成するステップと、上記それぞれのレイヤを多重化するステップと、を含むことができる。
図面において、参照番号の最も左の(1又は複数の)桁は、その参照番号が最初に表れた図面を識別する。
一実施形態の処理を例示するフローチャートである。 一実施形態に従う、スケーラブルビデオエンコーディング及びデコーディングのためのシステムのブロック図である。 一実施形態に従う、係数サンプリングを例示するフローチャートである。 一実施形態に従う、1次元係数サンプリングのグラフィカルな例示である。 一実施形態に従う、係数サンプリングのための代替的な処理を例示するフローチャートである。 一実施形態に従う、2次元係数サンプリングのグラフィカルな例示である。 一実施形態に従う、レイヤ生成を例示するフローチャートである。 一実施形態に従う、受信したレイヤからの係数の回復を例示するフローチャートである。 一実施形態に従う、スケーラブルビデオエンコーディングのソフトウェア又はファームウェア実施形態のためのコンピューティング環境のブロック図である。 一実施形態に従う、スケーラブルビデオエンコーディングのソフトウェア又はファームウェア実施形態のためのコンピューティング環境のブロック図である。 一実施形態に従う、本明細書に説明される機能性を実施することができるプラットフォームを例示するブロック図である。 一実施形態に従う、本明細書に説明される機能性を実施することができる例示的な装置の図である。
次に、図面を参照して一実施形態が説明され、図面において、同様の参照番号が同一の又は機能的に類似する要素を示す。特定の構成及び配置が論じられるが、上記は単に例示目的のために行われていることを理解されたい。本説明の主旨及び範囲から逸脱することなしに他の構成及び配置を使用できることを、当業者は認識するであろう。さらに、上記は本明細書に説明されるシステム及び応用以外の様々な他のシステム及び応用に採用できることも、当業者に明らかになるであろう。
本明細書に開示されるのは、HEVC標準と互換性があるビデオデータの複数レイヤの生成のための方法、システム及びコンピュータプログラム製品である。処理からの残差が、周波数ドメイン内で係数に変換されることができる。それから、この係数をサンプリングして、ビデオデータのレイヤを作成することができる。この係数を種々の方法でサンプリングして、種々のそれぞれのレイヤを作成することができる。それから、レイヤを多重化し、デコーダに送信することができる。そこでは、レイヤのうち1又は複数を選択することができる。特定の(1又は複数の)レイヤの選択は、結果的に生じるビデオの所望される特性に依存してよい。例えば、或るレベルのビデオ品質、フレームレート、解像度及び/又はビット深度が所望され得る。それから、選択されたレイヤ内の係数を組み立てて、ビデオデコーディングにおいて使用すべき残差のバージョン(version)を作成することができる。
図1は、一実施形態に従う、スケーラブルな符号化されたビデオの処理を例示する。105において、ビデオ圧縮の間に実行される予測的ビデオ圧縮処理からの残差が、周波数ドメイン内で係数に変換されることができる。110において、この係数を、1次元の形式又はデータ構造へとスキャンすることができる。115において、この係数をサンプリングすることができる。代替的な実施形態において、サンプリングは、以下でより詳細に説明されるとおり、スキャニングの前に行うことができる。複数サンプリングを行うことができ、これにおいて、各サンプリングは係数のサブセットをもたらす。一実施形態において、サンプリングは、輝度コンポーネントに対応する係数に対して、又はビデオの色差コンポーネントに対して行うことができる。120において、エンコードされたデータの複数レイヤを生成することができ、これにおいて、1つのレイヤは、係数の各サンプリングに対して生成される。125において、上記レイヤを多重化することができる。
130において、デコーダにおいて、多重化されたデータを、別個のレイヤを導出できるように多重分離する(demultiplexed)ことができる。135において、レイヤのサブセットを、ユーザ又はユーザのビデオ処理システムの要件に合致するように選択することができる。上記で述べられたとおり、レイヤの特定サブセットの選択は、上記のような要件に依存してよく、スケーラビリティを可能にすることができる。140において、これらの選択されたレイヤからの係数を決定することができ、145において、係数を組み立てることができる。それから、150において、逆変換を、結果的に生じた係数に対して行うことができる。これにより、受け入れ可能な形式でビデオをデコードするためにその後使用できる、元の残差のバージョンを作成することができる。
図2に、スケーラブルな方法でビデオをエンコード及びデコードするためのシステムが、一実施形態に従って例示される。予測的ビデオ圧縮処理からの残差205が、エンコーダにおいて受信され、変換モジュール210に入力される。この変換は、周波数ドメインにおける残差205の表現をもたらすことができ、これにおいて、変換モジュール210の出力は、この表現のための係数とすることができる。変換は、例えば、正方形4分木変換であってよく、あるいは別法として、非正方形4分木変換であってもよい。それから、係数は、係数サンプリングモジュール215に出力されることができる。ここで、係数は複数回サンプリングされることができ、各回が元の係数の異なるサブセットをもたらす。
各サブセット、又はそれぞれのサンプリングが、ビデオデータの各サブセット自体のレイヤ又はそれぞれのサンプリング自体のレイヤを生成するために、別個に処理される。各レイヤについて、係数は、量子化モジュールに渡されることができる。レイヤ0を作成するために、係数は、量子化モジュール220に渡され、量子化モジュール220の出力が、エントロピーエンコーダ230に渡されることができる。このエントロピーエンコーディングの結果は、レイヤ0とすることができる。別のサンプリングが、量子化モジュール221に送信され得る係数のサブセットをもたらすことができ、量子化モジュール221の出力は、エントロピーエンコーダ231に送信されることができる。エントロピーエンコーダ231の出力は、レイヤ1とすることができる。このことは、サンプリングの数に対して繰り返すことができ、対応する数のレイヤをもたらすことができる。最後は、レイヤnとして例示されたレイヤである。それから、これらレイヤを、ビットストリーム多重化部(mux)240が結合することができる。
デコーダにおいて、多重化されたビットストリームは、サブストリーム抽出モジュール245において処理されることができる。ここで、レイヤ0…nからの選択を表すサブストリームが抽出される。これらの選択されたレイヤの多重分離が、ビットストリーム多重分離部(demux)250において行われることができ、例示されたレイヤ0、1、…mをもたらすことができる。様々な実施形態において、元のレイヤ0…nのうち任意のサブセットを選択し、多重分離することができる。それから、各レイヤは、関連する係数を回復するための処理を受けることができる。レイヤ0は、エントロピーデコーダ260と逆量子化モジュール270とによって処理されることができる。各々の選択されたレイヤは、同様に処理されることができる。係数は、係数組み立てモジュール275において統合されることができる。それから、逆変換280を、組み立てられた係数に対して行うことができる。その結果が、残差285である。残差285は、残差205と同一ではない可能性があり、むしろ、元のレイヤ0…nのすべてが抽出モジュール245により抽出されてはいない可能性があることを考えると、残差285は、残差205の近似として見られ得ることに留意されたい。それから、残差285は、エンコードされたソースビデオ(図示せず)の最終的なデコーディングにおいて使用されることができる。
図3には、係数サンプリング(図1の115)の処理が一実施形態に従って例示される。残差の変換から生じる係数は、HEVC標準に従って処理されたとおり、2次元形式で体系化されてよい。310において、係数をスキャンすることができ、係数の1次元体系をもたらすことができる。このスキャニング動作は、水平のスキャン順序、垂直のスキャン順序又は斜めのスキャン順序を使用することができる。
いったんスキャニングが完了すると、サンプリングを行うことができる。サンプリング処理は、いくつかの予め定義されたサンプリングパラメータによって制御することができる。これらには、サンプリングの開始位置と終了位置とを含むことができる。さらに、サンプリングパターンを定義することができる。サンプリングパターンには、サンプリング比率又は周期Rを含むことができる。この値は、サンプリング処理の周期性を表す。元の変換コアが2次元であり、かつサイズN×Mを有する場合、係数の合計数はN×Mであり、Rは、(1,(N×M)−1]の範囲に入り得る。サンプリングパターンはさらに、位相の定義を含むことができ、この定義は、各周期においてどの係数がサンプリングされるかを規定する。ゆえに、周期R=4であり、かつ位相が(0,1,3)として定義される場合、係数は、4つからなる連続した非オーバーラップのグループで考えることができる。4つからなる各グループにおいて、係数は、係数0、係数1、係数2及び係数3として識別することができる。位相が(0,1,3)である場合、0、1及び3と番号付けされた係数をサンプリングすることができ、すなわち、第1、第2及び第4の係数とすることができる。
一実施形態において、サンプリングパラメータは、量子化パラメータ(QP)値に基づいて適応的に決定されることができる。サンプリングパラメータはさらに、現在のピクチャ及び/又は事前にエンコードされたピクチャの特徴を使用することによってエンコーダにおいて生成されることもできる。こうしたパラメータが、デコーディングの間に使用するためにデコーダに送信されることができる。別法として、サンプリングパラメータは、事前に符号化された近隣のピクチャの特徴を使用することによってデコーダにおいて生成されることができる。別法として、サンプリングパラメータは、変換処理において使用された変換コアに依存することができる。ここで、種々のサイズの変換コアが種々のサンプリングパラメータの使用を引き起こしてよく、さらに、正方形4分木変換コアが非正方形4分木変換コアとは異なるサンプリングパラメータを使用してもよい。また、種々のチャネル(例えば、色差及び輝度)が、種々のサンプリングパラメータを使用してよい。
320において、サンプリングは、定義された開始位置において始まることができる。330において、サンプリングは、予め定義された周期及び位相に従って進むことができる。340において、サンプリングは、予め定義された終了位置において停止することができる。
一実施形態において、係数サンプリングは、特定の符号化若しくは予測モードに対して、及び/又は符号化ユニット、予測ユニット若しくは変換ユニットに対して、適応的に適用されることができる。係数サンプリングは、例えば、予測モードに対して必須とすることができる。
図4に、一例示的なサンプリング処理をグラフィカルに例示する。図示される4つのグラフの各々において、X軸が周波数を表すと同時に、Y軸が係数値を表す。各矢印の高さは、対応する係数の大きさを表し、X軸上の小さい中空の四角形は、大きさ0を有する係数を表す。最上部のグラフは、変換及びスキャニング処理から生じる係数の完全なセットを表す。破線は、サンプル範囲の広がりを表し、このサンプル範囲内に、サンプリング処理の開始位置と終了位置とが図示されるとおり定義される。
最上部から2番目のグラフは、ベースレイヤ(BL)としても知られるレイヤ0を示す。ここで、サンプル範囲の中のすべての係数はゼロに設定される。その次のグラフは、拡張レイヤ(EL)であるレイヤ1を示す。ここで、周期は3に設定され、位相は(0,1)である。結果として、サンプル範囲の中の係数は、3つからなる連続した非オーバーラップのグループで考えられる。各グループにおいて、第1及び第2の係数はサンプリングされ、第3の係数は無視される。
4番目のグラフ(図4の最下部)は、別のELであるレイヤ2を示す。ここで、周期は3に設定され、位相は(2)である。結果として、サンプル範囲の中の係数は、再び、3つからなる連続した非オーバーラップのグループで考えられる。各グループにおいて、第1及び第2の係数は無視され、第3の係数はサンプリングされる。この示された係数は、結果的に生じるレイヤ2を表す。示されたとおり、3つからなる各グループ内の第1及び第2の係数、すなわち0又は1の位相に対応する係数は、取り除かれる。
代替的な実施形態において、スキャニングは、サンプリングの後に行うことができる。ここで、サンプリングは、変換処理から出力された2次元形式で体系化された係数に関して行うことができる。図5に、こうした一実施形態を例示する。510において、サンプリングが、係数の2次元(2D)配列内の定義された開始位置で始まることができる。520において、サンプリングは、予め定義された位相及び周期に従って進むことができる。530において、サンプリングは、予め定義された終了ポイントにおいて終了することができる。540において、スキャニングが、サンプリングされた係数に対して行われることができる。
図6に、こうした一実施形態をグラフィカルに例示する。左上の配列は、係数を、変換処理による出力として表し得る。この配列の右半分が、サンプル範囲を表す。係数の値は、a、…z、0、1、…5としてシンボルで図示される。サンプリングを目的として、予め定義された開始位置と終了位置とが示される。さらに、図示されるとおり、垂直周期が4に設定され、水平周期が2に設定される。右上の配列は、BL、レイヤ0を表し、これにおいて、サンプル範囲の中のすべての係数値は0に設定される。
左下の配列は、EL、レイヤ1を表す。サンプリングの位相は、(0,0)(開始点と一致する)、(1,1)、(2,0)及び(3,1)として示される。位置(0,0)においてサンプリングされた係数は値aを有し、位置(1,1)においてサンプリングされた係数は値dを有し、位置(2,0)においてサンプリングされた係数は値eを有し、位置(3,1)においてサンプリングされた係数は値hを有する。各周期において、図示されるとおり、上記の位相は継続される。右下の配列は、別のEL、レイヤ2を表す。ここで、異なるサンプリングが行われる。具体的には、位相が別様に定義される。このレイヤ内の位相は、(0,1)、(1,0)、(2,1)及び(3,0)である。サンプリングされる係数は、図示されるとおりである。
サンプリングがこうした一実施形態において完了した後、サンプリングされた係数のスキャニングを行うことができる。以前のとおり、スキャニングは、水平に、垂直に、あるいは斜めに進めることができる。この結果は、これらのスキャンされた係数の一次元体系とすることができる。
図7に、レイヤ生成(図1の120)を一実施形態に従って例示する。710において、レイヤの係数を受信することができる。720において、係数の量子化を行うことができる。730において、エントロピーエンコーディングを行うことができる。エントロピーエンコーディングの出力は、ビデオデータのレイヤを表すことができる。
図8に、こうしたエンコードされたデータから係数を導出する逆演算(図1の140)を一実施形態に従って例示する。810において、選択されたレイヤを受信することができる。820において、エントロピーデコーディングを行うことができる。830において、逆量子化を行うことができ、選択されたレイヤの係数をもたらすことができる。
様々な実施形態を、ハードウェア要素、ソフトウェア要素又は双方の組み合わせを用いて実施することができる。ハードウェア要素の例には、プロセッサ、マイクロプロセッサ、回路、回路素子(例えば、トランジスタ、レジスタ、キャパシタ、インダクタなど)、集積回路、特定用途向け集積回路(ASIC)、プログラム可能論理装置(PLD)、デジタルシグナルプロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、論理ゲート、レジスタ、半導体装置、チップ、マイクロチップ、チップセットなどを含むことができる。ソフトウェアの例には、ソフトウェアコンポーネント、プログラム、アプリケーション、コンピュータプログラム、アプリケーションプログラム、システムプログラム、マシンプログラム、オペレーティングシステムソフトウェア、ミドルウェア、ファームウェア、ソフトウェアモジュール、ルーチン、サブルーチン、ファンクション、メソッド、プロシージャ、ソフトウェアインタフェース、アプリケーションプログラムインタフェース(API)、命令セット、コンピューティングコード、コンピュータコード、コードセグメント、コンピュータコードセグメント、単語、値、シンボル、又はこれらの任意の組み合わせを含むことができる。実施形態をハードウェア要素を用いて実施するか及び/又はソフトウェア要素を用いて実施するかの判定は、所望される計算レート、パワーレベル、熱耐性、処理サイクル量、入力データレート、出力データレート、メモリリソース、データバススピード、及び他の設計又は性能制約などの、任意の数のファクタに従って変化し得る。
本明細書において、ソフトウェアという用語は、コンピュータプログラムロジックを記憶したコンピュータ読取可能媒体を含むコンピュータプログラム製品を示すことができ、このコンピュータプログラムロジックは、コンピュータシステムに、本明細書に開示される1若しくは複数の特徴及び/又は特徴の組み合わせを実行させる。コンピュータ読取可能媒体は、一時的又は非一時的であってよい。一時的なコンピュータ読取可能媒体の一例は、ローカルエリアネットワーク若しくはワイドエリアネットワークを通じて又はインターネットなどのネットワークを通じて、無線周波数を介して又は導電体を介して送信されるデジタル信号とすることができる。非一時的コンピュータ読取可能媒体の一例は、コンパクトディスク、フラッシュメモリ、ランダムアクセスメモリ、読取専用メモリ、又は他のデータ記憶装置とすることができる。
図9に、上記のようなソフトウェア/ファームウェアを実行するコンピューティングシステムを一実施形態に従って例示する。例示されるシステム900は、ビデオエンコーダの一部として、又はビデオエンコーダの支援に使用することができる。システム900は、1又は複数のプロセッサ920を含むことができ、さらに、メモリ910部を含むことができる。(1又は複数の)プロセッサ920は、1若しくは複数の中央処理ユニットコア、及び/又は1若しくは複数のGPUコアを有するグラフィクス処理ユニットを含むことができる。メモリ910は、コンピュータプログラムロジック940を記憶できる1又は複数のコンピュータ読取可能媒体を含むことができる。メモリ910は、例えば、ハードディスク及びドライブ、コンパクトディスクなどの取外し可能媒体、読取専用メモリ(ROM)若しくはランダムアクセスメモリ(RAM)装置、又はこれらのいくつかの組み合わせとして実装することができる。(1又は複数の)プロセッサ920とメモリ910とは、バスなどの、当業者に知られるいくつかのテクノロジーのうち任意のものを用いて通信することができる。メモリ910に包含されるコンピュータプログラムロジック940は、(1又は複数の)プロセッサ920によって読み出され、実行されることができる。さらに、集合的にI/O930として図示された1若しくは複数のI/Oポート及び/又はI/O装置が、(1又は複数の)プロセッサ920とメモリ910とに接続されることができる。
コンピュータプログラムロジック940には、ビデオデータのレイヤの作成に関して上記で説明された処理を具現化するロジックを含むことができる。例示される実施形態において、コンピュータプログラムロジック940は、変換モジュール950を含むことができ、変換モジュール950は、残差を、周波数ドメインにおける係数のセットに変換する役割を果たすことができる。ロジック940はさらに、スキャニングモジュール960を含むことができ、スキャニングモジュール960は、2次元形式の係数を1次元形式に変換する役割を果たすことができる。ロジック940はさらに、サンプリングモジュール970を含むことができる。このモジュールは、予め定義されたサンプリングパターンと所与の規定された開始位置及び終了位置とに従って、上記で説明されたように係数をサンプリングする役割を果たすことができる。ロジック940はさらに、後続処理を容易にするために係数を量子化する役割を果たす量子化モジュール980を含むことができる。ロジック940はさらに、エントロピーエンコーディングのためのモジュール990を含むことができる。
図10に、デコーディングシステムにおいて(又は、こうしたデコーディングシステムの支援において)ソフトウェア/ファームウェアを実行するコンピューティングシステムを一実施形態に従って図示する。図示されるシステム1000は、デコーダの一部として、又はデコーダの支援に使用することができる。システム1000は、1又は複数のプロセッサ1020を含むことができ、さらに、メモリ1010部を含むことができる。(1又は複数の)プロセッサ1020は、1若しくは複数の中央処理ユニットコア、及び/又は1若しくは複数のGPUコアを有するグラフィクス処理ユニットを含むことができる。メモリ1010は、コンピュータプログラムロジック1040を記憶できる1又は複数のコンピュータ読取可能媒体を含むことができる。メモリ1010は、例えば、ハードディスク及びドライブ、コンパクトディスクなどの取外し可能媒体、読取専用メモリ(ROM)若しくはランダムアクセスメモリ(RAM)装置、又はこれらのいくつかの組み合わせとして実装することができる。(1又は複数の)プロセッサ1020とメモリ1010とは、バスなどの、当業者に知られるいくつかのテクノロジーのうち任意のものを用いて通信することができる。メモリ1010に包含されるコンピュータプログラムロジック1040は、(1又は複数の)プロセッサ1020によって読み出され、実行されることができる。さらに、集合的にI/O1030として図示された1若しくは複数のI/Oポート及び/又はI/O装置が、(1又は複数の)プロセッサ1020とメモリ1010とに接続されることができる。
コンピュータプログラムロジック1040は、デコーダにおける処理に関して上記で説明された処理を具現化するロジックを含むことができる。例示される実施形態において、コンピュータプログラムロジック1040は、レイヤ選択モジュール1050を含むことができ、レイヤ選択モジュール1050は、デコーディングを目的として特定のレイヤを選択する役割を果たすことができる。コンピュータプログラムロジック1040はさらに、エントロピーデコーディングの役割を果たすモジュール1060を含むことができる。コンピュータプログラムロジック1040はさらに、逆量子化モジュール1070を含むことができ、逆量子化モジュール1070は、量子化された係数を、さらなる処理を可能にする形式に適合させる役割を果たすことができる。ロジック1040はさらに、選択されたレイヤから係数を統合する役割を果たすことができる係数組み立てモジュール1080を含むことができる。ロジック1040はさらに、逆変換モジュール1090を含むことができ、逆変換モジュール1090は、係数を、展開に使用できる形式の残差に変換する役割を果たすことができる。
図2、図9及び図10に例示されるシステムなどのスケーラブルなビデオ符号化及び/又はデコーディングのためのシステムは、より大きな情報システムの一部とすることができる。図11は、こうした一実施形態を例示する。実施形態において、システム1100はメディアシステムとすることができるが、システム1100はこの文脈に限定されない。例えば、システム1100は、パーソナルコンピュータ(PC)、ラップトップコンピュータ、ウルトララップトップコンピュータ、タブレット、タッチパッド、ポータブルコンピュータ、ハンドヘルドコンピュータ、パームトップコンピュータ、パーソナルデジタルアシスタント(PDA)、セルラー電話、セルラー電話/PDA組み合わせ、テレビ受像機、スマートデバイス(例えば、スマートフォン、スマートタブレット又はスマートテレビ)、モバイルインターネットデバイス(MID)、メッセージングデバイス、データ通信装置などに組み込むことができる。
実施形態において、システム1100は、ディスプレイ1120に結合されたプラットフォーム1102を含む。プラットフォーム1102は、(1又は複数の)コンテンツサービス装置1130又は(1又は複数の)コンテンツ配信装置1140又は他の同様のコンテンツソースなどのコンテンツ装置からコンテンツを受信することができる。1又は複数のナビゲーション機構を含むナビゲーション制御部1150を使用して、例えば、プラットフォーム1102及び/又はディスプレイ1120とやりとりすることができる。これらのコンポーネントの各々を、以下でより詳細に説明する。
実施形態において、プラットフォーム1102は、チップセット1105、プロセッサ1110、メモリ1112、記憶装置1114、グラフィクスサブシステム1115、アプリケーション1116及び/又は無線部1118のうち任意の組み合わせを含むことができる。チップセット1105は、プロセッサ1110、メモリ1112、記憶装置1114、グラフィクスサブシステム1115、アプリケーション1116及び/又は無線部1118における相互通信を提供することができる。例えば、チップセット1105には、記憶装置1114との相互通信を提供する能力がある記憶装置アダプタ(図示せず)を含むことができる。
プロセッサ1110は、複合命令セットコンピュータ(CISC)若しくは縮小命令セットコンピュータ(RISC)プロセッサ、x86命令セット互換プロセッサ、マルチコア、又は任意の他のマイクロプロセッサ若しくは中央処理ユニット(CPU)として実装することができる。実施形態において、プロセッサ1110は、(1又は複数の)マルチコアプロセッサ、(1又は複数の)マルチコアモバイルプロセッサなどを含むことができる。一実施形態において、プロセッサ1110は、図9及び図10の(1又は複数の)プロセッサ920及び/又はプロセッサ1020にそれぞれ対応することができる。
メモリ1112は、これらに限定されないが、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)又はスタティックRAM(SRAM)などの揮発性メモリ装置として実装されることができる。
記憶装置1114は、これらに限定されないが、磁気ディスクドライブ、光学ディスクドライブ、テープドライブ、内部記憶装置、接続型記憶装置、フラッシュメモリ、バッテリバックアップSDRAM(同期型DRAM)、及び/又はネットワークアクセス可能記憶装置などの不揮発性記憶装置として実装されることができる。実施形態において、記憶装置1114は、例えば、複数ハードドライブが含まれるとき、価値のあるデジタルメディアのための記憶性能により強化された保護を向上させるテクノロジーを含むことができる。
グラフィクスサブシステム1115は、表示のための、静止画又はビデオなどの画像の処理を行うことができる。グラフィクスサブシステム1115は、例えば、グラフィクス処理ユニット(GPU)又はビジュアル処理ユニット(VPU)とすることができる。アナログ又はデジタルインタフェースが使用されて、グラフィクスサブシステム1115とディスプレイ1120とを通信可能に結合することができる。例えば、インタフェースは、高精細マルチメディアインタフェース、ディスプレイポート、ワイヤレスHDMI(登録商標)及び/又はワイヤレスHDに準拠した手法のうち任意のものとすることができる。グラフィクスサブシステム1115は、プロセッサ1110又はチップセット1105に一体化されてもよい。グラフィクスサブシステム1115は、チップセット1105に通信可能に結合されるスタンドアロンカードとすることができる。
本明細書に説明されるグラフィクス及び/又はビデオ処理手法は、様々なハードウェアアーキテクチャにおいて実施されることができる。例えば、グラフィクス及び/又はビデオ機能性が、チップセット内に一体化されてよい。別法として、別々のグラフィクス及び/又はビデオプロセッサが使用されてよい。さらに別の実施形態として、グラフィクス及び/又はビデオ機能は、マルチコアプロセッサを含む汎用目的プロセッサにより実施されてよい。さらなる実施形態において、上記機能は、家庭用電子機器において実施されてよい。
無線部1118は、様々な適切なワイヤレス通信手法を用いて信号を送信及び受信する能力がある1又は複数の無線部を含むことができる。上記の手法は、1又は複数のワイヤレスネットワークにわたる通信を伴うことができる。例示的なワイヤレスネットワークには、(これらに限定されないが、)ワイヤレスローカルエリアネットワーク(WLAN)、ワイヤレスパーソナルエリアネットワーク(WPAN)、ワイヤレスメトロポリタンエリアネットワーク(WMAN)、セルラーネットワーク及び衛星ネットワークを含む。こうしたネットワークにわたる通信において、無線部1118は、1又は複数の適用可能な標準の任意のバージョンに従って動作することができる。
実施形態において、ディスプレイ1120は、任意のモニタ又はディスプレイを含むことができる。ディスプレイ1120には、例えば、コンピュータディスプレイスクリーン、タッチスクリーンディスプレイ、ビデオモニタ、テレビ受像機のような装置、及び/又はテレビ受像機を含んでよい。ディスプレイ1120は、デジタル及び/又はアナログであってよい。実施形態において、ディスプレイ1120は、ホログラフィックディスプレイであってよい。また、ディスプレイ1120は、視覚投影を受信できる透過的サーフェスであってよい。こうした投影は、様々な形式の情報、画像及び/又は物体を伝えることができる。例えば、こうした投影は、モバイル拡張現実(MAR)アプリケーションのための視覚的オーバレイであってよい。1又は複数のソフトウェアアプリケーション1116の制御下で、プラットフォーム1102は、ディスプレイ1120上にユーザインタフェース1122を表示することができる。
実施形態において、(1又は複数の)コンテンツサービス装置1130は、任意の全国的な、国際的な、及び/又は独立したサービスにより提供されてよく、したがって、例えば、インターネットを介してプラットフォーム1102からアクセスすることができる。(1又は複数の)コンテンツサービス装置1130は、プラットフォーム1102に、及び/又はディスプレイ1120に結合されることができる。プラットフォーム1102及び/又は(1又は複数の)コンテンツサービス装置1130は、ネットワーク1160に結合されてネットワーク1160とメディア情報をやりとりする(例えば、送信及び/又は受信する)ことができる。(1又は複数の)コンテンツ配信装置1140もまた、プラットフォーム1102に、及び/又はディスプレイ1120に結合されることができる。
実施形態において、(1又は複数の)コンテンツサービス装置1130は、ケーブルテレビボックス、パーソナルコンピュータ、ネットワーク、電話機、デジタル情報及び/又はコンテンツを配信する能力があるインターネット可能な装置又は電化製品、並びに、ネットワーク1160を介して又は直接的にコンテンツプロバイダとプラットフォーム1102及び/ディスプレイ1120との間でコンテンツを単方向又は双方向に伝達する能力がある任意の他の同様の装置を含むことができる。コンテンツは、ネットワーク1160を介して、システム1100内のコンポーネントのうち任意の1つからコンテンツプロバイダへ、及びコンテンツプロバイダからシステム1100内のコンポーネントのうち任意の1つへ、単方向及び/又は双方向に伝達されることができることを十分理解されたい。コンテンツの例には、例えば、ビデオ、音楽、医療及びゲーム用情報などを含む任意のメディア情報を含むことができる。
(1又は複数の)コンテンツサービス装置1130は、メディア情報、デジタル情報及び/又は他のコンテンツを含むケーブルテレビプログラムなどのコンテンツを受信する。コンテンツプロバイダの例には、任意のケーブル若しくは衛星テレビ又は無線若しくはインターネットコンテンツプロバイダを含むことができる。提供された例は、本発明の実施形態を限定することが意図されるものではない。
実施形態において、プラットフォーム1102は、1又は複数のナビゲーション機構を有するナビゲーション制御部1150から制御信号を受信することができる。制御部1150のナビゲーション機構を使用して、例えば、ユーザインタフェース1122と対話することができる。実施形態において、ナビゲーション制御部1150は、ポインティング装置とすることができ、このポインティング装置は、ユーザがコンピュータに空間的(例えば、連続的なマルチ次元の)データを入力することを可能にするコンピュータハードウェアコンポーネント(具体的に、ヒューマンインタフェース装置)とすることができる。グラフィカルユーザインタフェース(GUI)とテレビ受像機及びモニタとなどの多くのシステムが、ユーザが身体的ジェスチャを用いてコンピュータ又はテレビ受像機を制御し、コンピュータ又はテレビ受像機にデータを提供することを可能にする。
制御部1150のナビゲーション機構の動きは、ポインタ、カーソル、焦点リング、又はディスプレイ上に表示される他の視覚的インジケータの動きによって、ディスプレイ(例えば、ディスプレイ1120)上にエコーされることができる。例えば、ソフトウェアアプリケーション1116の制御下で、ナビゲーション制御部1150上に位置するナビゲーション機構は、ユーザインタフェース1122上に表示される仮想のナビゲーション機構にマップされることができる。実施形態において、制御部1150は、別個のコンポーネントでなく、しかしプラットフォーム1102及び/又はディスプレイ1120に一体化される場合がある。しかしながら、実施形態は、本明細書に図示され又は説明される要素又は文脈に限定されない。
実施形態において、ドライバ(図示せず)は、例えば、有効である場合、ユーザが、テレビ受像機のようなプラットフォーム1102を、最初の起動後、ボタンのタッチで即時にオン及びオフすることを可能にするテクノロジーを含むことができる。プラットフォーム1102が「オフ」にされるとき、プログラムロジックが、プラットフォームがメディアアダプタ又は(1又は複数の)他のコンテンツサービス装置1130又は(1又は複数の)コンテンツ配信装置1140にコンテンツをストリームすることを可能にする。さらに、チップセット1105は、例えば、5.1サラウンドサウンドオーディオ及び/又は高精細7.1サラウンドサウンドオーディオのためのハードウェア及び/又はソフトウェアサポートを含んでよい。ドライバは、統合されたグラフィクスプラットフォームのためのグラフィクスドライバを含んでよい。実施形態において、グラフィクスドライバは、ペリフェラルコンポーネントインターコネクト(PCI)エクスプレスグラフィクスカードを含んでよい。
様々な実施形態において、システム1100に示されるコンポーネントのうち任意の1又は複数がまとめられてよい。例えば、プラットフォーム1102と(1又は複数の)コンテンツサービス装置1130とが一体化されてよく、あるいは、プラットフォーム1102と(1又は複数の)コンテンツ配信サービス1140とが一体化されてよく、あるいは、例えば、プラットフォーム1102と(1又は複数の)コンテンツサービス装置1130と(1又は複数の)コンテンツ配信装置1140とが一体化されてよい。様々な実施形態において、プラットフォーム1102とディスプレイ1120とが、一体化されたユニットであってよい。例えば、ディスプレイ1120と(1又は複数の)コンテンツサービス装置1130とが一体化されてよく、あるいは、ディスプレイ1120と(1又は複数の)コンテンツ配信装置1140とが一体化されてよい。これらの例は、本発明を限定することを意図するものではない。
様々な実施形態において、システム1100は、ワイヤレスシステム、有線システム又は双方の組み合わせとして実装されることができる。ワイヤレスシステムとして実装されるとき、システム1100は、1又は複数のアンテナ、送信部、受信部、トランシーバ、増幅部、フィルタ、制御ロジックなどの、ワイヤレス共有媒体を介して通信することに適したコンポーネント及びインタフェースを含むことができる。ワイヤレス共有媒体の一例には、RFスペクトラムなどのワイヤレススペクトラムの部分を含むことができる。有線システムとして実装される場合、システム1100は、入力/出力(I/O)アダプタ、I/Oアダプタを対応する有線通信媒体に接続する物理コネクタ、ネットワークインタフェースカード(NIC)、ディスクコントローラ、ビデオコントローラ、オーディオコントローラなどの、有線通信媒体を介して通信することに適したコンポーネント及びインタフェースを含むことができる。有線通信媒体の例には、ワイヤ、ケーブル、メタルリード線、プリント回路板(PCB)、バックプレーン、スイッチ構成、半導体物質、ツイストペアワイヤ、同軸ケーブル、光ファイバなどを含むことができる。
プラットフォーム1102は、1又は複数の論理的又は物理的チャネルを確立して情報を通信することができる。この情報には、メディア情報及び制御情報を含むことができる。メディア情報は、ユーザに向けられたコンテンツを表す任意のデータを指すことができる。コンテンツの例には、例えば、音声会話、ビデオ会議、ストリーミングビデオ、電子メール(「Eメール」)メッセージ、ボイスメールメッセージ、英数字シンボル、グラフィクス、画像、ビデオ、テキストなどからのデータを含むことができる。音声会話からのデータは、例えば、発話情報、沈黙期間、背景雑音、快適雑音、トーンなどであり得る。制御情報は、自動化されたシステムに向けられたコマンド、命令又は制御ワードを表す任意のデータを指すことができる。例えば、制御情報を使用して、システムを通るメディア情報のルートを決定することができ、あるいは所定の方法でメディア情報を処理するようにノードに指示することができる。しかしながら、実施形態は、図11に図示又は説明される要素又は文脈に限定されない。
上記で説明されたとおり、システム1100は、様々な物理的スタイル又はフォームファクタにおいて具現化されることができる。図12は、システム1100を具現化できる小さいフォームファクタ装置1200の実施形態を例示する。実施形態において、例えば、装置1200は、ワイヤレス能力を有するモバイルコンピューティング装置として実装されることができる。モバイルコンピューティング装置は、例えば、処理システムと1又は複数のバッテリなどのモバイル電源又は電力供給とを有する任意の装置を指すことができる。
上記で説明されたとおり、モバイルコンピューティング装置の例には、パーソナルコンピュータ(PC)、ラップトップコンピュータ、ウルトララップトップコンピュータ、タブレット、タッチパッド、ポータブルコンピュータ、ハンドヘルドコンピュータ、パームトップコンピュータ、パーソナルデジタルアシスタント(PDA)、セルラー電話、セルラー電話/PDA組み合わせ、テレビ受像機、スマートデバイス(例えば、スマートフォン、スマートタブレット又はスマートテレビ)、モバイルインターネットデバイス(MID)、メッセージングデバイス、データ通信装置などを含むことができる。
モバイルコンピューティング装置の例には、人間が身に着けるように構成されたコンピュータも含むことができる。実施形態において、例えば、モバイルコンピューティング装置は、コンピュータアプリケーションと音声通信及び/又はデータ通信とを実行する能力があるスマートフォンとして実装されてよい。いくつかの実施形態が、例としてスマートフォンとして実装されるモバイルコンピューティング装置を用いて説明され得るが、他の実施形態が、他のワイヤレスモバイルコンピューティング装置を同様に用いて実施され得ることを十分理解されたい。実施形態は、この文脈に限定されない。
図12に示されるとおり、装置1200は、ハウジング1202、ディスプレイ1204、入力/出力(I/O)装置1206及びアンテナ1208を含むことができる。装置1200は、ナビゲーション機構1212も含むことができる。ディスプレイ1204は、モバイルコンピューティング装置に適した情報を表示する任意の適切なディスプレイユニットを含むことができる。I/O装置1206は、モバイルコンピューティング装置に情報を入力するための任意の適切なI/O装置を含むことができる。I/O装置1206の例には、英数字キーボード、数字キーパッド、タッチパッド、入力キー、ボタン、スイッチ、ロッカースイッチ、マイクロフォン、スピーカ、音声認識装置及びソフトウェアなどを含むことができる。情報は、マイクロフォンによって装置1200に入力されてもよい。こうした情報は、音声認識装置によってデジタル化されることができる。実施形態は、この文脈に限定されない。
少なくとも1つの実施形態の1又は複数の態様が、プロセッサ内の様々なロジックを表すマシン読取可能媒体上に記憶された代表的な命令により実施されることができ、この代表的な命令は、マシンにより読み出されると、本明細書に説明される手法を行うロジックをマシンに製作させる。こうした表現は、「IPコア」として知られ、有形のマシン読取可能媒体上に記憶され、様々な取引先又は製造施設に供給されて、ロジック又はプロセッサを実際に作る製作マシンにロードされることができる。
方法及びシステムが、機能、機構及びこれらの関係を例示する機能的な構成要素を用いて本明細書に開示されている。これらの機能的な構成ブロックの境界の少なくともいくつかは、説明を簡便にするために本明細書において任意に定義されている。指定された機能とこれらの関連とが適切に果たされるかぎり、代替的な境界が定義されてよい。
様々な実施形態が本明細書に開示されているが、実施形態は、限定ではなく単に例として提示されていることを十分理解されたい。本明細書に開示される方法及びシステムの主旨及び範囲から逸脱することなしに、形式及び詳細における様々な変更が実施形態においてなされ得ることが、当業者には明らかであろう。したがって、請求項の広さ及び範囲は、本明細書に開示される例示的な実施形態のいずれにも限定されるべきではない。
一実施形態において、スケーラブルビデオエンコーディングの方法が、処理の予測残差の変換から生じる係数をサンプリングするステップであり、上記サンプリングするステップはそれぞれの複数のサンプルをもたらすように複数回行われる、ステップと、各サンプルを用いて、エンコードされたデータのそれぞれのレイヤを生成するステップと、上記それぞれのレイヤを多重化するステップと、を含むことができる。
一実施形態において、上記方法は、上記サンプリングするステップの後、かつ上記生成の前に行われる、各サンプルを1次元形式へとスキャンするステップ、をさらに含むことができる。代替的な実施形態において、上記方法は、上記サンプリングするステップの前に行われる、変換から生じる係数を1次元形式へとスキャンするステップ、をさらに含むことができる。
エンコードされたデータのレイヤの生成には、サンプルの量子化と、量子化されたサンプルをエントロピーエンコードするステップとを含むことができる。上記サンプリングするステップは、予め定義されたサンプリングパターンと開始位置と終了位置とに従って行われることができる。
一実施形態において、スケーラブルビデオデコーディングの方法が、エンコードされたデータの複数のレイヤを含む多重化されたビットストリームを受信するステップと、上記多重化されたビットストリームから上記複数のレイヤのサブセットを選択するステップと、上記サブセット内の各レイヤについて、処理の残差を少なくとも部分的に表す係数のサンプルを導出するステップと、上記レイヤの上記係数を組み立てるステップと、上記残差のバージョンを作成するように、上記係数に対して逆変換を行うステップと、を含むことができる。上記方法は、ビデオ品質のレベルを決定するステップであり、上記複数のレイヤの上記サブセットは上記ビデオ品質を達成するように選択される、ステップ、をさらに含むことができる。レイヤについて、係数の上記サンプルを導出するステップは、上記レイヤをエントロピーデコードするステップと、上記のエントロピーデコードされたレイヤの逆量子化を行うステップと、を含むことができる。
上記で説明された処理は、スケーラブルビデオエンコーディングのための装置によって実施されることができ、上記装置は、プロセッサに、処理の予測残差の変換から生じる係数をサンプリングさせる手段であり、上記サンプリングはそれぞれの複数のサンプルをもたらすように複数回行われる、手段と、上記プロセッサに、各サンプルを用いて、エンコードされたデータのそれぞれのレイヤを生成させる手段と、上記プロセッサに、上記それぞれのレイヤを多重化させる手段と、を含むことができる。上記装置は、上記プロセッサに、上記サンプリングの後、かつ上記生成の前に行われる、各サンプルを1次元形式へとスキャンさせる手段をさらに含むことができ、あるいは上記プロセッサに、上記サンプリングの前に行われる、上記変換から生じる上記係数を1次元形式へとスキャンさせる手段を含むことができる。
上記プロセッサにエンコードされたデータのレイヤを生成させる上記手段は、上記プロセッサにサンプルを量子化させる手段と、上記プロセッサに上記の量子化されたサンプルをエントロピーエンコードさせる手段と、をさらに含むことができる。
上記サンプリングは、予め定義されたサンプリングパターンと開始位置と終了位置とに従って行われることができる。
スケーラブルビデオデコーディングのための装置が、プロセッサに、エンコードされたデータの複数のレイヤを含む多重化されたビットストリームを受信させる手段と、上記プロセッサに、上記多重化されたビットストリームから上記複数のレイヤのサブセットを選択させる手段と、上記プロセッサに、上記サブセット内の各レイヤについて、処理の残差を少なくとも部分的に表す係数のサンプルを導出させる手段と、上記プロセッサに、上記レイヤの上記係数を組み立てさせる手段と、上記プロセッサに、上記残差のバージョンを作成するように、上記係数に対して逆変換を行わせる手段と、を含むことができる。上記プロセッサに、レイヤについて、係数の上記サンプルを導出させる上記手段は、上記プロセッサに、上記レイヤをエントロピーデコードさせる手段と、上記プロセッサに、上記のエントロピーデコードされたレイヤの逆量子化を行わせる手段と、をさらに含むことができる。上記装置は、上記プロセッサに、ビデオ品質のレベルを決定させる手段であり、上記複数のレイヤの上記サブセットは特定のビデオ品質を達成するように選択される、手段、をさらに含むことができる。
スケーラブルビデオエンコーディングのための装置が、処理の予測残差の変換から生じる係数をサンプリングする係数サンプリングモジュールであり、上記サンプリングはそれぞれの複数のサンプルをもたらすように複数回行われる、モジュールと、各サンプルを用いて、エンコードされたデータのそれぞれのレイヤを生成する手段と、上記それぞれのレイヤを多重化する多重化部と、を含むことができる。
上記装置は、上記サンプリングの後、かつ上記生成の前に行われる、各サンプルを1次元形式へとスキャンする手段をさらに含むことができ、あるいは、上記サンプリングの前に行われる、上記変換から生じる上記係数を1次元形式へとスキャンする手段を含むことができる。
上記生成する手段は、サンプルの量子化のための量子化モジュールと、上記の量子化されたサンプルをエントロピーエンコードするエントロピーエンコーダと、を含むことができる。
上記装置において、上記サンプリングは、予め定義されたサンプリングパターンと開始位置と終了位置とに従って行われることができる。
スケーラブルビデオデコーディングのための装置が、エンコードされたデータの複数のレイヤを含む多重化されたビットストリームを受信する手段と、上記多重化されたビットストリームから上記複数のレイヤのサブセットを選択するサブストリーム選択モジュールと、上記サブセット内の各レイヤについて、処理の残差を少なくとも部分的に表す係数のサンプルを導出する手段と、上記レイヤの上記係数を組み立てる係数組み立てモジュールと、上記残差のバージョンを作成するように、上記係数に対して逆変換を行う逆変換モジュールと、を含むことができる。レイヤについて、係数の上記サンプルを導出する上記手段は、上記レイヤをエントロピーデコードするエントロピーデコーダと、上記のエントロピーデコードされたレイヤの逆量子化を行う逆量子化モジュールと、を含むことができる。上記装置は、ビデオ品質のレベルを決定する手段であり、上記複数のレイヤの上記サブセットが上記ビデオ品質を達成するように選択される、手段、をさらに含むことができる。

Claims (24)

  1. スケーラブルビデオエンコーディングの方法であって、
    ビデオ圧縮処理の残差の変換から生じる係数をサンプリングするステップであり、該サンプリングするステップはそれぞれの複数のサンプルをもたらすように複数回行われる、ステップと、
    各サンプルを用いて、ビデオデータのそれぞれのレイヤを生成するステップと、
    前記それぞれのレイヤを多重化するステップと、
    を含む方法。
  2. 前記サンプリングするステップの後、かつ前記生成するステップの前に行われる、各サンプルを1次元形式へとスキャンするステップ、
    をさらに含む請求項1の方法。
  3. 前記サンプリングするステップの前に行われる、前記変換から生じる前記係数を1次元形式へとスキャンするステップ、
    をさらに含む請求項1の方法。
  4. 前記のエンコードされたデータのレイヤを生成するステップは、
    サンプルを量子化するステップと、
    前記の量子化されたサンプルをエントロピーエンコードするステップと、
    を含む、請求項1の方法。
  5. 前記サンプリングするステップは、予め定義されたサンプリングパターンと開始位置と終了位置とに従って行われる、請求項1の方法。
  6. スケーラブルビデオデコーディングの方法であって、
    ビデオデータの複数のレイヤを含む多重化されたビットストリームを受信するステップと、
    前記多重化されたビットストリームから前記複数のレイヤのサブセットを選択するステップと、
    前記サブセット内の各々の選択されたレイヤについて、ビデオ圧縮処理の残差を少なくとも部分的に表す係数のサンプルを導出するステップと、
    前記の選択されたレイヤの前記係数を組み立てるステップと、
    前記残差のバージョンを作成するように、前記係数に対して逆変換を行うステップと、
    を含む方法。
  7. レイヤについて、係数の前記サンプルを導出するステップは、
    前記レイヤをエントロピーデコードするステップと、
    前記のエントロピーデコードされたレイヤの逆量子化を行うステップと、
    を含む、請求項6の方法。
  8. ビデオ品質を決定するステップであり、前記の選択されたレイヤは前記ビデオ品質を達成するように選ばれる、ステップ、をさらに含む請求項6の方法。
  9. スケーラブルビデオエンコーディングのための装置であって、
    プロセッサに、ビデオ圧縮処理の残差の変換から生じる係数をサンプリングさせる手段であり、前記サンプリングはそれぞれの複数のサンプルをもたらすように複数回行われる、手段と、
    前記プロセッサに、各サンプルを用いて、ビデオデータのそれぞれのレイヤを生成させる手段と、
    前記プロセッサに、前記それぞれのレイヤを多重化させる手段と、
    を含む装置。
  10. 前記サンプリングの後、かつ前記生成の前に行われる、前記プロセッサに、各サンプルを1次元形式へとスキャンさせる手段、
    をさらに含む請求項9の装置。
  11. 前記サンプリングの前に行われる、前記プロセッサに、前記変換から生じる前記係数を1次元形式へとスキャンさせる手段、
    をさらに含む請求項9の装置。
  12. 前記プロセッサに、エンコードされたデータのレイヤを生成させる前記手段は、
    前記プロセッサに、サンプルを量子化させる手段と、
    前記プロセッサに、前記の量子化されたサンプルをエントロピーエンコードさせる手段と、
    を含む、請求項9の装置。
  13. 前記サンプリングは、予め定義されたサンプリングパターンと開始位置と終了位置とに従って行われる、請求項9の装置。
  14. スケーラブルビデオデコーディングのための装置であって、
    プロセッサに、ビデオデータの複数のレイヤを含む多重化されたビットストリームを受信させる手段と、
    前記プロセッサに、前記多重化されたビットストリームから前記複数のレイヤのサブセットを選択させる手段と、
    前記プロセッサに、前記サブセット内の各々の選択されたレイヤについて、ビデオ圧縮処理の残差を少なくとも部分的に表す係数のサンプルを導出させる手段と、
    前記プロセッサに、前記の選択されたレイヤの前記係数を組み立てさせる手段と、
    前記残差のバージョンを作成するように、前記プロセッサに、前記係数に対して逆変換を行わせる手段と、
    を含む装置。
  15. 前記プロセッサに、レイヤについて、係数の前記サンプルを導出させる前記手段は、
    前記プロセッサに、前記レイヤをエントロピーデコードさせる手段と、
    前記プロセッサに、前記のエントロピーデコードされたレイヤの逆量子化を行わせる手段と、
    を含む、請求項14の装置。
  16. 前記プロセッサに、ビデオ品質を決定させる手段であり、前記の選択されたレイヤは前記ビデオ品質を達成するように選ばれる、手段、
    をさらに含む請求項14の装置。
  17. スケーラブルビデオエンコーディングのための装置であって、
    ビデオ圧縮処理の残差の変換から生じる係数をサンプリングする係数サンプリングモジュールであり、前記サンプリングはそれぞれの複数のサンプルをもたらすように複数回行われる、モジュールと、
    各サンプルを用いて、エンコードされたデータのそれぞれのレイヤを生成する手段と、
    前記それぞれのレイヤを多重化する多重化部と、
    を含む装置。
  18. 前記サンプリングの後、かつ前記生成の前に行われる、各サンプルを1次元形式へとスキャンする手段、
    をさらに含む請求項17の装置。
  19. 前記サンプリングの前に行われる、前記変換から生じる前記係数を1次元形式へとスキャンする手段、
    をさらに含む請求項17の装置。
  20. エンコードされたデータのレイヤを生成する前記手段は、
    サンプルの量子化のための量子化モジュールと、
    前記の量子化されたサンプルをエントロピーエンコードするエントロピーエンコーダと、
    を含む、請求項17の装置。
  21. 前記サンプリングは、予め定義されたサンプリングパターンと開始位置と終了位置とに従って行われる、請求項17の装置。
  22. スケーラブルビデオデコーディングのための装置であって、
    ビデオデータの複数のレイヤを含む多重化されたビットストリームを受信する手段と、
    前記多重化されたビットストリームから前記複数のレイヤのサブセットを選択するサブストリーム抽出モジュールと、
    前記サブセット内の各々の選択されたレイヤについて、ビデオ圧縮処理の残差を少なくとも部分的に表す係数のサンプルを導出する手段と、
    前記の選択されたレイヤの前記係数を組み立てる係数組み立てモジュールと、
    前記残差のバージョンを作成するように、前記係数に対して逆変換を行う逆変換モジュールと、
    を含む装置。
  23. レイヤについて、係数の前記サンプルを導出する前記手段は、
    前記レイヤをエントロピーデコードするエントロピーデコーダと、
    前記のエントロピーデコードされたレイヤの逆量子化を行う逆量子化モジュールと、
    を含む、請求項22の装置。
  24. ビデオ品質のレベルを決定する手段であり、前記の選択されたレイヤはビデオ品質を達成するように選ばれる、手段、
    をさらに含む請求項22の装置。
JP2015511882A 2012-06-29 2012-06-29 係数サンプリングに基づいたスケーラブルビデオ符号化のためのシステム、方法及びコンピュータプログラム製品 Expired - Fee Related JP6141417B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2012/000890 WO2014000125A1 (en) 2012-06-29 2012-06-29 Systems, methods,and computer program products for scalable video coding based on coefficient sampling

Publications (2)

Publication Number Publication Date
JP2015520567A true JP2015520567A (ja) 2015-07-16
JP6141417B2 JP6141417B2 (ja) 2017-06-07

Family

ID=49782005

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015511882A Expired - Fee Related JP6141417B2 (ja) 2012-06-29 2012-06-29 係数サンプリングに基づいたスケーラブルビデオ符号化のためのシステム、方法及びコンピュータプログラム製品

Country Status (5)

Country Link
US (1) US9955154B2 (ja)
EP (1) EP2875641B1 (ja)
JP (1) JP6141417B2 (ja)
CN (1) CN104335584B (ja)
WO (1) WO2014000125A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106170089B (zh) * 2016-08-25 2020-05-22 上海交通大学 基于h.265的多路编码方法
WO2019146811A1 (en) * 2018-01-25 2019-08-01 Lg Electronics Inc. Video decoder and controlling method thereof
US10735757B2 (en) 2018-01-30 2020-08-04 Lg Electronics Inc. Video decoder and controlling method thereof

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02113748A (ja) * 1988-10-24 1990-04-25 Nippon Telegr & Teleph Corp <Ntt> 可変レート画像符号化装置および可変レート画像復号化装置
US5253055A (en) * 1992-07-02 1993-10-12 At&T Bell Laboratories Efficient frequency scalable video encoding with coefficient selection

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6098308A (ja) 1983-11-04 1985-06-01 Hitachi Ltd 磁気ドラム
US6134269A (en) 1996-09-25 2000-10-17 At&T Corp Fixed or adaptive deinterleaved transform coding for image coding and intra coding of video
CA2291236A1 (en) 1998-03-25 1999-09-30 Kabusikigaisha Dentu Digital broadcasting selective receiving device and method thereof
SG77650A1 (en) 1998-09-07 2001-01-16 Victor Company Of Japan A scalable delivery scheme of compressed video
US6639942B1 (en) * 1999-10-21 2003-10-28 Toshiba America Electronic Components, Inc. Method and apparatus for estimating and controlling the number of bits
US6873655B2 (en) * 2001-01-09 2005-03-29 Thomson Licensing A.A. Codec system and method for spatially scalable video data
US7203635B2 (en) * 2002-06-27 2007-04-10 Microsoft Corporation Layered models for context awareness
US8213508B2 (en) 2004-04-02 2012-07-03 Thomson Licensing Complexity scalable video encoding
US20090274381A1 (en) * 2004-12-22 2009-11-05 Koninklijke Philips Electronics, N.V. Scalable coding
WO2006091041A1 (en) 2005-02-24 2006-08-31 Lg Electronics Inc. Method for up-sampling/down-sampling data of a video block
KR101326610B1 (ko) * 2005-07-11 2013-11-08 톰슨 라이센싱 매크로블록 적응적 인터-층 인트라 텍스쳐 예측을 위한 방법 및 장치
KR100736080B1 (ko) * 2005-10-27 2007-07-06 삼성전자주식회사 다 계층으로 구성된 멀티미디어 스트림의 저작권을 계층별로 관리하는 방법 및 장치
US8315308B2 (en) * 2006-01-11 2012-11-20 Qualcomm Incorporated Video coding with fine granularity spatial scalability
WO2008014384A2 (en) * 2006-07-26 2008-01-31 Soundspectrum, Inc. Real-time scenery and animation
WO2008086828A1 (en) * 2007-01-18 2008-07-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Quality scalable video data stream
US8208560B2 (en) 2007-10-15 2012-06-26 Intel Corporation Bit depth enhancement for scalable video coding
KR101679094B1 (ko) * 2009-03-02 2016-11-23 톰슨 라이센싱 픽처 시퀀스를 표시하는 방법 및 장치
CN102065302B (zh) 2011-02-09 2014-07-09 复旦大学 一种基于h.264的可伸缩视频编码方法
US9313497B2 (en) 2012-01-25 2016-04-12 Intel Corporation Systems, methods, and computer program products for transform coefficient sub-sampling

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02113748A (ja) * 1988-10-24 1990-04-25 Nippon Telegr & Teleph Corp <Ntt> 可変レート画像符号化装置および可変レート画像復号化装置
US5253055A (en) * 1992-07-02 1993-10-12 At&T Bell Laboratories Efficient frequency scalable video encoding with coefficient selection
JPH0698308A (ja) * 1992-07-02 1994-04-08 American Teleph & Telegr Co <Att> 係数選択による周波数スケーリング可能な効率的ビデオ符号化方法及び装置

Also Published As

Publication number Publication date
EP2875641A4 (en) 2016-03-16
EP2875641A1 (en) 2015-05-27
JP6141417B2 (ja) 2017-06-07
CN104335584A (zh) 2015-02-04
US9955154B2 (en) 2018-04-24
CN104335584B (zh) 2019-06-18
WO2014000125A1 (en) 2014-01-03
US20140140410A1 (en) 2014-05-22
EP2875641B1 (en) 2018-07-25

Similar Documents

Publication Publication Date Title
TWI538479B (zh) 交叉頻道殘差預測之技術
KR101653511B1 (ko) 인터-레이어 잔차 예측
JP2015530805A (ja) レイヤ間画素サンプル予測
KR101650742B1 (ko) 인터-레이어 인트라 모드 예측
KR20150024398A (ko) 크기 기반 변환 유닛 컨텍스트 도출
KR20140089482A (ko) 스케일러블 비디오 코딩의 층 간 예측을 위한 리파이닝 필터
JP6060394B2 (ja) クロスレイヤー・クロスチャネル残差予測
KR20150070313A (ko) 다수의 독립 코딩 스트림들 사이에서 공유된 모션 추정을 포함하는 비디오 코딩
JP2016506165A (ja) インターレイヤの動きデータ継承
JP6141417B2 (ja) 係数サンプリングに基づいたスケーラブルビデオ符号化のためのシステム、方法及びコンピュータプログラム製品
JP6005847B2 (ja) スケーラブルなビデオコーディングのためのアダプティブフィルタリング
EP2865185A1 (en) Cross-layer cross-channel sample prediction
US10516898B2 (en) Systems, methods, and computer program products for scalable video coding based on coefficient sampling
JP2014209757A (ja) クロスチャネル残差予測
KR101777487B1 (ko) 코딩 단위 비트 수 제한
JP6177966B2 (ja) クロスチャネル残差予測
JP6227698B2 (ja) クロスチャネル残差予測
TWI578763B (zh) 編碼單元位元數限制
JP2015146599A (ja) レイヤ間画素サンプル予測

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160901

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20161018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170112

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170502

R150 Certificate of patent or registration of utility model

Ref document number: 6141417

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees