JP6352391B2 - Shvcのための複数のベースレイヤ参照ピクチャ - Google Patents

Shvcのための複数のベースレイヤ参照ピクチャ Download PDF

Info

Publication number
JP6352391B2
JP6352391B2 JP2016506616A JP2016506616A JP6352391B2 JP 6352391 B2 JP6352391 B2 JP 6352391B2 JP 2016506616 A JP2016506616 A JP 2016506616A JP 2016506616 A JP2016506616 A JP 2016506616A JP 6352391 B2 JP6352391 B2 JP 6352391B2
Authority
JP
Japan
Prior art keywords
inter
layer
picture
video
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016506616A
Other languages
English (en)
Other versions
JP2016518769A (ja
JP2016518769A5 (ja
Inventor
プ、ウェイ
チェン、ジャンレ
リ、シャン
カークゼウィックズ、マルタ
セレジン、バディム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2016518769A publication Critical patent/JP2016518769A/ja
Publication of JP2016518769A5 publication Critical patent/JP2016518769A5/ja
Application granted granted Critical
Publication of JP6352391B2 publication Critical patent/JP6352391B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Laminated Bodies (AREA)

Description

[0001]本開示は、一般に、ビデオコーディングおよび圧縮に関し、特に、スケーラブルHEVC(SHVC)と呼ばれることがある、高効率ビデオコーディング(HEVC)のためのSVCを含む、スケーラブルビデオコーディング(SVC)に関する。
[0002]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、携帯電話または衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4、Part 10、アドバンストビデオコーディング(AVC)、現在開発中の高効率ビデオコーディング(HEVC)規格によって定義された規格、およびそのような規格の拡張に記載されているビデオコーディング技法など、ビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報を送信、受信、符号化、復号、および/または記憶することができる。
[0003]ビデオコーディング技法は、ビデオシーケンスにおいて固有の冗長性を低減または除去するために、空間的(イントラピクチャ)予測および/または時間的(インターピクチャ)予測を含む。ブロックベースのビデオコーディングでは、ビデオスライス(たとえば、ビデオフレームまたはビデオフレームの一部分)は、ツリーブロック、コーディングユニット(CU)、および/またはコーディングノードと呼ばれることもある、ビデオブロックに区分され得る。ピクチャのイントラコード化(I)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化(PまたはB)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれる場合があり、参照ピクチャは参照フレームと呼ばれる場合がある。
[0004]空間的または時間的予測は、コーディングされるべきブロックに関する予測ブロックを生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコーディングされたブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコード化ブロックは、イントラコーディングモードおよび残差データに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて、残差変換係数が得られ得、その残差変換係数は、量子化され得る。量子化変換係数は、最初は2次元アレイで構成され、変換係数の1次元ベクトルを生成するために走査され得、なお一層の圧縮を達成するために、エントロピーコーディングが適用され得る。
[0005]いくつかの実施形態によれば、ビデオ情報をコーディングするように構成される装置は、プロセッサとメモリとを含む。メモリは、参照レイヤ、エンハンスメントレイヤ、またはそれらの両方と関連したビデオ情報を記憶するように構成される。プロセッサは、メモリと通信する。プロセッサは、複数のレイヤ間フィルタと1つまたは複数の参照レイヤのピクチャとを使用して、複数のレイヤ間参照ピクチャを生成するように構成される。
[0006]いくつかの実施形態では、プロセッサは、複数のレイヤ間参照ピクチャを参照ピクチャリストに挿入するように、さらに構成される。プロセッサは、参照ピクチャリストを使用して、エンハンスメントレイヤ内の現在のピクチャをコーディングするように、さらに構成され得る。
[0007]いくつかの実施形態では、レイヤ間フィルタは、アップサンプリングフィルタを備える。レイヤ間フィルタのうちのいくつかまたはすべては、事前定義され得る。レイヤ間フィルタは、シーケンスパラメータセットまたはビデオパラメータセットの中でシグナリングされ得る。レイヤ間フィルタは、スライスヘッダの中でシグナリングされ得る。
[0008]いくつかの実施形態では、レイヤ間フィルタは、少なくとも1つのデフォルトのレイヤ間フィルタと、シーケンスパラメータセット、ビデオパラメータセット、またはスライスヘッダの中でシグナリングされる少なくとも1つの代替のレイヤ間フィルタとを備える。プロセッサは、複数のレイヤ間参照ピクチャのうちのせいぜい1つが、使用されるために利用できるという制限を適用するように、さらに構成され得る。
[0009]いくつかの実施形態では、レイヤ間フィルタは、1つまたは複数のデフォルトのレイヤ間フィルタと、1つまたは複数の代替のレイヤ間フィルタとを備える。プロセッサは、1つまたは複数の代替のレイヤ間フィルタを使用して生成されるレイヤ間参照ピクチャをレイヤ間参照ピクチャセットに加える前に、1つまたは複数のデフォルトのレイヤ間フィルタを使用して生成されるレイヤ間参照ピクチャをレイヤ間参照ピクチャセットに加えるように、さらに構成され得る。あるいは、プロセッサは、1つまたは複数の代替のレイヤ間フィルタを使用して生成されるレイヤ間参照ピクチャをレイヤ間参照ピクチャセットに加えた後、1つまたは複数のデフォルトのレイヤ間フィルタを使用して生成されるレイヤ間参照ピクチャをレイヤ間参照ピクチャセットに加えるように、さらに構成され得る。
[0010]いくつかの実施形態では、装置は、エンコーダを備え、プロセッサは、レイヤ間フィルタと関連したシンタックス要素を生成するように、さらに構成される。いくつかの実施形態では、装置は、デコーダを備え、プロセッサは、レイヤ間フィルタと関連したシンタックス要素を処理するように、さらに構成される。装置は、メモリとプロセッサとを備える、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップコンピュータまたはデスクトップコンピュータ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、携帯電話または衛星無線電話、およびビデオ遠隔会議デバイスのうちの少なくとも1つを備え得る。
[0011]別の実施形態では、ビデオ情報をコーディングする方法は、参照レイヤ、エンハンスメントレイヤ、またはそれらの両方と関連したビデオ情報を受信することと、複数のレイヤ間フィルタと1つまたは複数の参照レイヤのピクチャとを使用して、複数のレイヤ間参照ピクチャを生成することと、を含む。
[0012]別の実施形態では、ビデオコーディング装置は、参照レイヤ、エンハンスメントレイヤ、またはそれらの両方と関連したビデオ情報を受信するための手段と、複数のレイヤ間フィルタと1つまたは複数の参照レイヤのピクチャとを使用して、複数のレイヤ間参照ピクチャを生成するための手段と、を含む。
[0013]別の実施形態では、非一時的なコンピュータ可読媒体は、実行されるとき、装置に、参照レイヤ、エンハンスメントレイヤ、またはそれらの両方と関連したビデオ情報を受信することと、複数のレイヤ間フィルタと1つまたは複数の参照レイヤのピクチャとを使用して、複数のレイヤ間参照ピクチャを生成することと、を行わせるコードをそこに記憶している。
[0014]本開示で説明する態様による技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0015]本開示で説明する態様による技法を実装し得るビデオエンコーダの例を示すブロック図。 [0016]本開示で説明する態様による技法を実装し得るビデオデコーダの例を示すブロック図。 [0017]本開示の態様による3つの異なる寸法でのスケーラビリティを示すブロック図。 [0018]本開示の態様によるスケーラブルビデオコーディング(SVC)のビットストリームの例示的な構造を示すブロック図。 [0019]本開示の態様によるビットストリーム中の例示的なSVCアクセスユニットを示すブロック図。 [0020]一実施形態による参照レイヤのピクチャをアップサンプルすることの例を示す概念図。 [0021]一実施形態によるビデオデータをコーディングするための例示的な方法を示す図。
[0022]本開示に記載される技法は、一般に、スケーラブルビデオコーディング(SVC)および/またはマルチビュー/3次元ビデオコーディングに関する。たとえば、技法は、高効率ビデオコーディング(HEVC)のスケーラブルビデオコーディング(SVC)の拡張に関してよく、それを伴って、またはそれの中で使用されてもよい。SVCでは、ビデオ情報の複数のレイヤが存在し得る。ビデオ情報の最下部のレベルすなわち最も低いレベルのレイヤは、ベースレイヤ(BL)または参照レイヤ(RL)として働き得、ビデオ情報の最上部のレベルすなわち最も高いレベルのレイヤは、エンハンストレイヤ(EL)として働き得る。「エンハンストレイヤ」は、「エンハンスメントレイヤ」と同義であると考えられ得るし、これらの用語は互換的に使用される場合がある。BLとELとの間のレイヤは、ELおよび/またはRLとして働き得る。たとえば、所与のレイヤは、ベースレイヤまたは間に入る任意のエンハンスメントレイヤなどの、所与のレイヤよりも下の(たとえば、先行する)レイヤのためのELであり得る。さらに、所与のレイヤは、また、所与のレイヤよりも上の(たとえば、後続の)エンハンスメントレイヤのための参照レイヤとして働き得る。ベースレイヤ(たとえば、最も低いレイヤ)とトップレイヤ(すなわち、最も高いレイヤ)との間にある任意の所与のレイヤは、所与のレイヤに比べて高いレイヤによるレイヤ間予測のための参照として使用され得、所与のレイヤよりも低いレイヤをレイヤ間予測のための参照として使用して、決定され得る。
[0023]例示のみを目的として、本開示に記載される技法は、2つのレイヤ(たとえば、参照レイヤのような低いレベルのレイヤ、およびエンハンストレイヤのような高いレベルのレイヤ)のみを含む例とともに説明される。本開示に記載される例は、複数の参照レイヤおよびエンハンスメントレイヤを伴う例に、同様に拡張され得ることを理解されたい。加えて、説明を簡単にするため、以下の開示は、主に「ピクチャ」という用語を使用する。しかしながら、これらの用語は、限定的であることを意味しない。たとえば、以下に記載される技法は、ブロック(たとえば、CU、PU、TU、マクロブロックなど)、スライス、フレーム、ブロックなどのような、ビデオユニットと関連した他の用語とともに使用され得る。
[0024]SHVCでは、ベースレイヤピクチャなどの参照レイヤのピクチャは、フィルタされ得、参照ピクチャリストに挿入され得る。たとえば、アップサンプリングフィルタは、レイヤ間参照ピクチャを生成するために、参照レイヤのピクチャに適用され得る。限られた計算リソースの結果、アップサンプリングフィルタのいくつかのフィルタタップは限られる。たとえば、実際には、アップサンプリングフィルタに設けられるフィルタタップの数は、3と同じくらい少ない場合があり、通常は8を越えない。
[0025]参照レイヤのピクチャとエンハンスメントレイヤのピクチャとの間の周波数特性に応じて、限られた数のフィルタタップを有する単一のフィルタは、参照レイヤとエンハンスメントレイヤのピクチャとの間の差を、すべての周波数において正確に明らかにする(account for)ことができない場合がある。たとえば、滑らかなピクチャは、低い周波数に集中される場合があり、一方、鋭いエッジを有するピクチャは、より高い周波数成分を有し得る。しかしながら、低い周波数と高い周波数の両方の成分を有するピクチャにとって、限られた数のフィルタタップを有する単一のフィルタは、低い周波数と高い周波数の両方に対して十分な周波数応答を提供することができない場合がある。
[0026]計算の効率を改善するために、いくつかの実施形態では、参照レイヤ、エンハンスメントレイヤ、またはそれらの両方と関連したビデオ情報を受信するように構成されるビデオコーダまたはデコーダは、複数のレイヤ間フィルタと1つまたは複数の参照レイヤのピクチャとを使用して、複数のレイヤ間参照ピクチャを生成するように構成され得る。たとえば、少なくとも2つのレイヤ間フィルタは、少なくとも2つのレイヤ間参照ピクチャを生成するために、参照レイヤのピクチャに適用され得る。詳細には、少なくとも2つのレイヤ間フィルタのうちの1つは、低い周波数に対して十分な周波数応答を提供するように設計されたアップサンプリングフィルタであり得、一方、少なくとも2つのレイヤ間フィルタのうちの別のものは、高い周波数に対して十分な周波数応答を提供するように設計されたアップサンプリングフィルタであり得る。少なくとも2つのレイヤ間フィルタの各々は、限られた数のフィルタタップで設計され得る。したがって、少なくとも2つのレイヤ間参照ピクチャは、すべての周波数にわたって十分な周波数応答を一緒に提供す、少なくとも2つのレイヤ間フィルタの各々での限られた数のフィルタタップは、計算効率を改善する。
ビデオコーディング規格
[0027]本明細書に記載されるいくつかの実施形態は、HEVC(高効率ビデオコーディング)などの改良型のビデオコーデックのコンテキストにおいて、スケーラブルビデオコーディングのためのレイヤ間予測に関する。より詳細には、本開示は、HEVCのスケーラブルビデオコーディング(SVC)拡張におけるレイヤ間予測の実行を改善するためのシステムおよび方法に関する。以下の説明では、いくつかの実施形態に関係するH.264/AVC技法が記載され、HEVC規格および関係する技法も説明される。HEVC規格および/またはH.264規格のコンテキストにおいて、いくつかの実施形態が本明細書に記載されるが、本明細書で開示されるシステムおよび方法が任意の適切なビデオコーディング規格に適用可能であり得ることを、当業者なら諒解されよう。たとえば、本明細書で開示される実施形態は、以下の規格、すなわち、ITU−T H.261、ISO/IEC MPEG−1ビジュアル、ITU−T H.262もしくはISO/IEC MPEG−2ビジュアル、ITU−T H.263、ISO/IEC MPEG−4ビジュアル、およびそのスケーラブルビデオコーディング(SVC)およびマルチビュービデオコーディング(MVC)拡張を含むITU−T H.264(ISO/IEC MPEG−4 AVCとしても知られる)のうちの、1つまたは複数に適用可能であり得る。
[0028]スケーラブルビデオコーディング(SVC)は、(信号対雑音比(SNR)とも呼ばれる)品質スケーラビリティ、空間的スケーラビリティ、および/または時間的スケーラビリティを提供するために使用され得る。たとえば、一実施形態では、参照レイヤ(たとえば、基本レイヤ)は、第1の品質レベルでビデオを表示するのに十分なビデオ情報を含み、エンハンスメントレイヤは、参照レイヤと比べてさらなるビデオ情報を含み、その結果、参照レイヤおよびエンハンスメントレイヤは一緒に、第1のレベルよりも高い第2の品質レベル(たとえば、少ない雑音、大きい解像度、より良いフレームレートなど)でビデオを表示するのに十分なビデオ情報を含む。エンハンストレイヤは、ベースレイヤと異なる空間解像度を有し得る。たとえば、ELとBLとの間の空間的なアスペクト比は(spatial aspect ratio)、1.0、1.5、2.0または他の異なる比であり得る。言い換えれば、ELの空間的なアスペクトは、BLの空間的なアスペクトの1.0、1.5、または2.0倍に等しくてよい。いくつかの例では、ELのスケーリングファクタは、BLよりも大きくてよい。たとえば、ELでのピクチャのサイズは、BLでのピクチャのサイズよりも大きくてよい。このようにして、限定でないけれども、ELの空間解像度は、BLの空間解像度よりも大きいことが起こり得る。
[0029]H.264用のSVC拡張では、現在のブロックの予測は、SVC用に提供された様々なレイヤを使用して実施され得る。そのような予測は、レイヤ間予測と呼ばれる場合がある。レイヤ間予測方法は、レイヤ間の冗長性を低減するためにSVC内で利用され得る。レイヤ間予測のいくつかの例は、レイヤ間イントラ予測と、レイヤ間動き予測と、レイヤ間モード予測と、レイヤ間残差予測とを含み得る。レイヤ間イントラ予測は、エンハンスメントレイヤでの現在のブロックを予測するために、ベースレイヤで並べられた(collocated)ブロックの再構成を使用する。レイヤ間動き予測は、エンハンスメントレイヤでの動きを予測するために、ベースレイヤの動きを使用する。レイヤ間モード予測は、ベースレイヤでのモードに基づいて、エンハンスメントレイヤでのモードを予測する。レイヤ間残差予測は、エンハンスメントレイヤの残差を予測するために、ベースレイヤの残差を使用する。
[0030]新規のシステム、装置、および方法の様々な態様は、これ以降、添付図面を参照して、より十分に説明される。しかしながら、本開示は、多くの異なる形態で実施可能であり、本開示の全体を通して示される任意の特定の構造または機能に限定されるものと解釈されるべきでない。むしろ、本開示が、入念で完全であり、本開示の範囲を当業者に十分に伝達するように、これらの態様が提供される。本明細書での教示に基づいて、当業者は、本発明の任意の他の態様から独立して実施されるか、または、本発明の任意の他の態様と組み合わされて実施されるかにかかわらず、本開示の範囲が、本明細書で開示される新規のシステム、装置、および方法の任意の態様を包含することを意図することを諒解するべきである。たとえば、本明細書で述べられる任意の数の態様を使用して装置が実施されてよく、または方法が実施されてもよい。加えて、本発明の範囲は、本明細書で述べられる本発明の様々な態様に加えて、またはそれ以外の、他の構造、機能性、または構造および機能性を使用して実施されるそのような装置または方法を包含することを意図する。本明細書で開示する任意の態様は、特許請求の範囲の1つまたは複数の要素により実施されてもよいことを理解されたい。
[0031]特定の態様が本明細書で説明されるけれども、これらの態様の多くの変形および置換は、本開示の範囲内に属する。好ましい態様のいくつかの利益および利点が述べられるけれども、本開示の範囲は、特定の利点、使用、または目的に限定されることを意図しない。むしろ、本開示の態様は、異なるワイヤレス技術、システム構成、ネットワーク、および伝送プロトコルに、広範囲に適用できることが意図され、これらのうちのいくつかは、各図面および好ましい態様の以下の説明で、例として示される。発明を実施するための形態および各図面は、限定的でなく、本開示の単に例示であり、本開示の範囲は、添付の特許請求の範囲およびその均等物によって定義される。
[0032]図1は、本開示で説明する態様による技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図である。図1に示すように、システム10は、宛先デバイス14によって後で復号されるべき符号化ビデオデータを与えるソースデバイス12を含む。特に、ソースデバイス12は、コンピュータ可読媒体16を介してビデオデータを宛先デバイス14に与える。ソースデバイス12および宛先デバイス14は、デスクトップコンピュータ、ノートブック(たとえば、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどのテレフォンハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲーム機、ビデオストリーミングデバイスなどを含む、広範囲のデバイスのいずれかを備え得る。加えて、いくつかの実施形態では、システム10は、単一のデバイス内に実装され得る。たとえば、テレフォンハンドセットを含む、いかなるそのような単一のデバイスも、ソースデバイス12と宛先デバイス14の両方、ならびにコンピュータ可読媒体16を備える場合がある。場合によっては、ソースデバイス12および宛先デバイス14は、ワイヤレス通信のために装備され得る。
[0033]宛先デバイス14は、コンピュータ可読媒体16を介して、復号されるべき符号化ビデオデータを受信し得る。コンピュータ可読媒体16は、符号化ビデオデータをソースデバイス12から宛先デバイス14に移動することが可能な、任意のタイプの媒体またはデバイスを備え得る。一例では、コンピュータ可読媒体16は、ソースデバイス12が符号化ビデオデータを宛先デバイス14にリアルタイムで直接送信することを可能にするための、通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス14に送信され得る。通信媒体は、無線周波数(RF)スペクトルまたは1つもしくは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワークなどのパケットベースのネットワーク、またはインターネットなどのグローバルネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイス12から宛先デバイス14への通信を促進するために有用であり得る、任意の他の機器を含み得る。
[0034]いくつかの例では、符号化されるデータは、出力インターフェース22から記憶デバイスへ出力され得る。同様に、符号化されるデータは、記憶デバイスから入力インターフェースによってアクセスされ得る。記憶デバイスは、ハードドライブ、Blu−ray(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、揮発性もしくは不揮発性のメモリ、または符号化ビデオデータを記憶するための任意の他の適当なデジタル記憶媒体などの、様々な分散された、または局所的にアクセスされるデータ記憶媒体のうちの任意のものを含み得る。さらなる例では、記憶デバイスは、ソースデバイス12によって生成される符号化されたビデオを記憶し得る、ファイルサーバまたは別の中間的な記憶デバイスに相当し得る。宛先デバイス14は、記憶されているビデオデータに、記憶デバイスからストリーミングまたはダウンロードによりアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス14へ送信することができる、任意のタイプのサーバであり得る。例示的なファイルサーバは、ウェブサーバ(たとえば、ウェブサイトのための)、FTPサーバ、ネットワーク接続記憶(NAS)デバイス、またはローカルディスクドライブを含む。宛先デバイス14は、インターネット接続を含む任意の標準的なデータ接続を通じて、符号化ビデオデータにアクセスし得る。これは、ワイヤレスチャネル(たとえば、Wi−Fi(登録商標)接続)、ワイヤード接続(たとえば、DSL、ケーブルモデムなど)、または、ファイルサーバ上に記憶されている符号化ビデオデータにアクセスするために適当な、それらの両方の組合せを含み得る。符号化ビデオデータの記憶デバイスからの伝送は、ストリーミング伝送、ダウンロード伝送、またはそれらの組合せであり得る。
[0035]本開示の技法は、ワイヤレスのアプリケーションまたはセッティングに、必ずしも限定されるとは限らない。技法は、無線によるテレビジョン放送、ケーブルテレビジョン伝送、衛星テレビジョン伝送、動的適応型HTTPストリーミング(DASH:dynamic adaptive streaming over HTTP)などのインターネットストリーミングビデオ伝送、データ記憶媒体上へと符号化されるデジタルビデオ、データ記憶媒体上に記憶されるデジタルビデオの復号、または他の適用例などの、様々なマルチメディアの適用例のうちの任意のものを支援して、ビデオコーディングに適用され得る。いくつかの例では、システム10は、ビデオストリーミング、ビデオプレイバック、ビデオブロードキャスティングおよび/またはビデオ電話通信などの適用例をサポートするために、一方向または二方向のビデオ伝送をサポートするように構成され得る。
[0036]図1の例では、ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、出力インターフェース22とを含む。いくつかの実施形態では、携帯電話などのワイヤレス通信デバイスは、ビデオソース18と、ビデオエンコーダ20と、出力インターフェース22とを含む、ソースデバイス12を備えることができる。宛先デバイス14は、入力インターフェース28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む。いくつかの実施形態では、携帯電話などのワイヤレス通信デバイスは、入力インターフェース28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む、宛先デバイス14を備えることができる。たとえば、場合によっては、単一のワイヤレス通信デバイスは、ソースデバイス12と宛先デバイス14の両方を備えることができる。本開示によれば、ソースデバイス12のビデオエンコーダ20は、複数の規格または規格拡張に準拠するビデオデータを含む、ビットストリームをコーディングするための技法を適用するように構成され得る。他の例では、ソースデバイスおよび宛先デバイスは、他の構成要素または構成を含んでもよい。たとえば、ソースデバイス12は、ビデオデータを外部のカメラなどの外部のビデオソース18から受信し得る。同様に、宛先デバイス14は、統合されたディスプレイデバイスを含むのではなく、外部のディスプレイデバイスとインターフェースしてもよい。
[0037]図1の例示されたシステム10は、単に一例である。現在のブロックに対する動きベクトル予測子の候補リストのための、候補を決定するための技法は、任意のデジタルビデオ符号化および/または復号デバイスによって実行され得る。一般に、本開示の技法は、ビデオ符号化デバイスによって実行されるけれども、技法は、また、通常「コーデック」と呼ばれるビデオエンコーダ/デコーダによって実行され得る。その上、本開示の技法は、また、ビデオプリプロセッサによって実行されてもよい。ソースデバイス12および宛先デバイス14は、ソースデバイス12が、コーディングされたビデオデータを宛先デバイス14への伝送のためにその中で生成する、そのようなコーディングデバイスの単に例である。いくつかの例では、デバイス12、14は、デバイス12、14の各々がビデオ符号化構成要素と、復号構成要素とを含むように、実質的に相称的な方式で動作し得る。したがって、システム10は、たとえば、ビデオストリーミング、ビデオプレイバック、ビデオブロードキャスティング、またはビデオ電話通信のための、ビデオデバイス12と14との間での一方向または二方向のビデオ伝送をサポートし得る。
[0038]ソースデバイス12のビデオソース18は、ビデオカメラ、あらかじめキャプチャされたビデオを含むビデオアーカイブ、および/またはビデオコンテンツプロバイダからビデオを受信するためのビデオ供給インターフェースなどの、ビデオキャプチャデバイスを含み得る。さらなる代わりとして、ビデオソース18は、ソースビデオとしてコンピュータグラフィックスベースのデータ、または、ライブビデオ、アーカイブされたビデオ、およびコンピュータ生成のビデオの組合せを生成し得る。場合によっては、ビデオソース18がビデオカメラである場合、ソースデバイス12および宛先デバイス14は、いわゆるカメラ付き携帯電話またはテレビ電話を形成し得る。しかしながら、先に述べたように、本開示に記載される技法は、一般にビデオコーディングに適用可能であり得、ワイヤレスおよび/またはワイヤードの応用例に適用され得る。各ケースでは、キャプチャされ、事前にキャプチャされ、またはコンピュータで生成されるビデオは、ビデオエンコーダ20によって符号化され得る。符号化されたビデオ情報は、次いで、出力インターフェース22によってコンピュータ可読媒体16上へ出力され得る。
[0039]コンピュータ可読媒体16は、ワイヤレスブロードキャストまたはワイヤードネットワーク伝送などの一時的な媒体、または、ハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、Blu−rayディスク、または他のコンピュータ可読媒体などの記憶媒体(すなわち、非一時的な記憶媒体)を含み得る。たとえば、ソースデバイス12および宛先デバイス14がワイヤレスハンドセットなどの単一のデバイスとして実装されるいくつかの実施形態では、コンピュータ可読媒体16は任意の記憶媒体を含むことができる。いくつかの例では、ネットワークサーバ(図示せず)は、ソースデバイス12から符号化ビデオデータを受信し、たとえば、ネットワーク伝送、直接ワイヤード通信などを介して、その符号化ビデオデータを宛先デバイス14に与え得る。同様に、ディスクプレス加工施設などの媒体生産施設のコンピューティングデバイスは、符号化ビデオデータをソースデバイス12から受信し、符号化ビデオデータを含むディスクを生産し得る。したがって、コンピュータ可読媒体16は、様々な例で、様々な形態の1つまたは複数のコンピュータ可読媒体を含むと理解され得る。
[0040]宛先デバイス14の入力インターフェース28は、情報をコンピュータ可読媒体16から受信する。コンピュータ可読媒体16の情報は、ビデオエンコーダ20により定義された、ブロックの特性および/または処理ならびに他のコーディングされたユニット、たとえば、GOPを記述するシンタックス要素を含むシンタックス情報を含み得、シンタックス情報は、また、ビデオデコーダ30によって使用される。ディスプレイデバイス32は、復号されたビデオデータをユーザに表示し、陰極線管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなどの様々なディスプレイデバイスのうちの任意のものを備え得る。
[0041]ビデオエンコーダ20およびビデオデコーダ30は、現在開発中の高効率ビデオコーディング(HEVC)規格などの、ビデオコーディング規格に従って動作し得、HEVCテストモデル(HM)に準拠し得る。あるいは、ビデオエンコーダ20およびビデオデコーダ30は、あるいはMPEG−4、Part 10と呼ばれるITU−T H.264規格、アドバンストビデオコーディング(AVC)、またはそのような規格の拡張などの、他の独自の規格または業界規格に従って動作し得る。しかしながら、本開示の技法は、いかなる特定のコーディング規格にも限定されず、それだけには限らないが、先に列挙した規格の任意のものを含む。ビデオコーディング規格の他の例は、MPEG−2と、ITU−T H.263とを含む。いくつかの態様では、ビデオエンコーダ20およびビデオデコーダ30は、それぞれ、オーディオのエンコーダおよびデコーダとともに統合され得、オーディオとビデオの両方の、共通のデータストリームまたは別個のデータストリームでの符号化を扱うための、適切なMUX−DEMUXユニット、または他のハードウェアおよびソフトウェアを含み得る。適用可能であれば、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠し得る。
[0042]ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアまたはそれらの任意の組合せなど、様々な好適なエンコーダ回路のいずれかとして実装され得る。技法が部分的にソフトウェアで実施される場合、デバイスは、ソフトウェアのための命令を、適当な、非一時的なコンピュータ可読媒体に記憶し、本開示の技法を実行するための1つまたは複数のプロセッサを使用して、ハードウェアで命令を実行し得る。ビデオエンコーダ20およびビデオデコーダ30の各々は、1つまたは複数のエンコーダまたはデコーダに含まれ得、そのいずれかは、組み合わされたエンコーダ/デコーダ(コーデック)の一部として、それぞれのデバイスに統合され得る。ビデオエンコーダ20および/またはビデオデコーダ30を含むデバイスは、集積回路、マイクロプロセッサ、および/または携帯電話などのワイヤレス通信デバイスを備え得る。
[0043]JCT−VCは、HEVC規格の開発に取り組んでいる。HEVCの標準化の取組みは、HEVCテストモード(HM)と呼ばれるビデオコーディングデバイスの進展モデルに基づく。HMは、たとえば、ITU−T H.264/AVCに従う既存のデバイスに対して、ビデオコーディングデバイスのいくつかの付加された機能を想定する。たとえば、H.264は、9つのイントラ予測符号化モードを提供するが、HMは、33ものイントラ予測符号化モードを提供し得る。
[0044]一般に、HMの作業モデルは、ビデオフレームまたはピクチャが、ルーマサンプルとクロマサンプルの両方を含むツリーブロックまたは最大コーディングユニット(LCU)のシーケンスに分割され得ることを記載している。ビットストリーム内のシンタックスデータは、LCUにとってのサイズを定義し得、LCUは、ピクセルの数の点で最大のコーディングユニットである。スライスは、いくつかの連続したツリーブロックを、コーディングの順序で含む。ビデオフレームまたはピクチャは、1つまたは複数のスライスに区分され得る。各ツリーブロックは、4分木に従って、コーディングユニット(CU)に分割され得る。一般に、4分木データ構造は、CUあたり1つのノードを、ツリーブロックに対応するルートノードとともに含む。CUが4つのサブCUに分割される場合、CUに対応するノードは、4つのリーフノードを含み、その各々は、サブCUのうちの1つに対応する。
[0045]4分木データ構造の各ノードは、対応するCUにシンタックスデータを提供することができる。たとえば、4分木におけるノードは、そのノードに対応するCUがサブCUに分割されるかどうかを示す分割フラグを含み得る。CUに関するシンタックス要素は、再帰的に定義されてよく、CUがサブCUに分割されるかどうかに依存し得る。CUがさらに分割されない場合、CUは、リーフCUとして参照させられる。本開示では、たとえ元のリーフCUの明白な分割がなくても、リーフCUの4つのサブCUも、リーフCUと呼ばれる。たとえば、16×16サイズのCUがさらに分割されない場合、4つの8×8サブCUも、16×16CUが分割されなかったけれどもリーフCUと呼ばれる。
[0046]CUは、CUがサイズの特異性を有しないことを別にすれば、H.264規格のマクロブロックと類似の目的を有する。たとえば、ツリーブロックは、4つの子ノード(サブCUとも呼ばれる)に分割され得、各子ノードは、次に、親ノードであり得、別の4つの子ノードに分割され得る。4分木のリーフノードと呼ばれる、最終の、分割されていない子ノードは、リーフCUとも呼ばれるコーディングノードを備える。コーディングされたビットストリームと関連したシンタックスデータは、最大CU深度(CU depth)と呼ばれる、ツリーブロックが分割され得る回数の最大数を定義し得、また、コーディングノードの最小サイズを定義し得る。したがって、ビットストリームは、また、最小コーディングユニット(SCU)を定義し得る。本開示は、「ブロック」という用語を、HEVCのコンテキストにおいてCU、PU、またはTUのうちのいずれか、または他の規格のコンテキストにおいて類似のデータ構造(たとえば、H.264/AVCのマクロブロックおよびそのサブブロック)を参照するために使用する。
[0047]CUは、コーディングノードと、コーディングノードに関連する予測ユニット(PU)および変換ユニット(TU)とを含む。CUのサイズは、コーディングノードのサイズに対応し、形状において正方形でなければならない。CUのサイズは、8×8ピクセルから、最大で64×64ピクセルまたはそれを越えるツリーブロックのサイズまで変動し得る。各CUは、1つまたは複数のPUと、1つまたは複数のTUとを含み得る。CUと関連したシンタックスデータは、たとえば、CUを1つまたは複数のPUに区分することを記述し得る。区分モードは、CUがスキップであるか、または、ダイレクトモードで符号化されるか、イントラ予測モードで符号化されるか、もしくはインター予測モードで符号化されるかの間で、異なり得る。PUは、形状において非正方形に区分されてもよい。CUと関連したシンタックスデータは、また、たとえば、CUを1つまたは複数のTUに、4分木に従って区分することを記述し得る。TUは、形状において正方形または非正方形(たとえば、長方形)であってもよい。
[0048]HEVC規格は、異なるCUに対して異なり得る、TUに従う変換を可能にする。TUは、通常、区分されたLCUのために定義された、所与のCU内のPUのサイズに基づいてサイズ変更されるが、これは常にそうであるとは限らない。TUは、通常、PUと同じサイズであるか、またはPUよりも小さい。いくつかの例では、CUに対応する残差サンプルは、「残差4分木」(RQT)として知られる4分木構造を使用して、より小さいユニットにさらに分割され得る。RQTのリーフノードは、変換ユニット(TU)と呼ばれる場合がある。TUと関連したピクセル差分の値は、変換係数を生成するために変換され得、変換係数は量子化され得る。
[0049]リーフCUは、1つまたは複数の予測ユニット(PU)を含み得る。一般に、PUは、対応するCUのすべてまたは一部分に対応する空間的なエリアを表現し、PUのための参照サンプルを取り出すためのデータを含み得る。その上、PUは、予測に関係するデータを含む。たとえば、PUがイントラモードで符号化される場合、PUに対するデータは、残差4分木(RQT)に含まれ得、残差4分木は、PUに対応するTUのためのイントラ予測モードを記述するデータを含み得る。別の例では、PUがインターモードで符号化される場合、PUは、PUに対する1つまたは複数の動きベクトルを定義するデータを含み得る。PUに対する動きベクトルを定義するデータは、たとえば、動きベクトルの水平の構成要素、動きベクトルの垂直の構成要素、動きベクトルのための解像度(たとえば、4分の1ピクセルの精度または8分の1ピクセルの精度)、動きベクトルが指す先の参照ピクチャ、および/または動きベクトルのための参照ピクチャリスト(たとえば、リスト0、リスト1、またはリストC)を記述し得る。
[0050]1つまたは複数のPUを有するリーフCUは、また、1つまたは複数の変換ユニット(TU)を含み得る。変換ユニットは、上述するように、RQT(TUの4分木構造とも呼ばれる)を使用して規定され得る。たとえば、分割フラグは、リーフCUが4つの変換ユニットに分割されるかどうかを、示し得る。次いで、各変換ユニットは、さらなるサブTUに、さらに分割され得る。TUがさらに分割されない場合、TUは、リーフTUと呼ばれる場合がある。一般に、イントラコーディングのために、リーフCUに属しているすべてのリーフTUは、同じイントラ予測モードを共有する。すなわち、同じイントラ予測モードが、一般に、リーフCUのすべてのTUに対して予測される値を計算するために適用される。イントラコーディングのために、ビデオエンコーダは、イントラ予測モードを使用して、TUに対応するCUの部分と元のブロックとの間の差分として、各リーフTUに対する残差値を計算し得る。TUは、必ずしも、PUのサイズに限定されるとは限らない。したがって、TUは、PUよりも大きくてもまたは小さくてもよい。イントラコーディングのために、PUは、同じCUに対して対応するリーフTUと並べられ得る。いくつかの例では、リーフTUの最大サイズは、対応するリーフCUのサイズに対応し得る。
[0051]その上、リーフCUのTUはまた、残差4分木(RQT)と呼ばれる、それぞれの4分木データ構造に関連付けられ得る。すなわち、リーフCUは、リーフCUがどのようにTUに区分されるかを示す4分木を含み得る。TU4分木のルートノードは一般にリーフCUに対応し、CU4分木のルートノードは一般にツリーブロック(またはLCU)に対応する。分割されないRQTのTUはリーフTUと呼ばれる。一般に、本開示は、別段の注記がない限り、CUおよびTUという用語を、それぞれ、リーフCUおよびリーフTUを参照するために使用する。
[0052]ビデオシーケンスは、通常、一連のビデオフレームまたはピクチャを含む。ピクチャのグループ(GOP)は、一般に、一連の1つまたは複数のビデオピクチャを備える。GOPは、GOPのヘッダの中、1つまたは複数のピクチャのヘッダの中、またはその他の所にシンタックスデータを含み得、シンタックスデータは、GOPに含まれるいくつかのピクチャを記述する。ピクチャの各スライスは、それぞれのスライスのための符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ20は、通常、ビデオデータを符号化するために、個々のビデオスライス内のビデオブロックに作用する。ビデオブロックは、CU内のコーディングノードに対応し得る。ビデオブロックは、固定のまたは変化するサイズを有し得、規定されたコーディング規格に従って、サイズは異なり得る。
[0053]例として、HMは、様々なPUサイズでの予測をサポートする。特定のCUのサイズが2N×2Nとすれば、HMは、2N×2NまたはN×NのPUサイズでのイントラ予測、および2N×2N、2N×N、N×2N、またはN×Nの対称なPUサイズでのインター予測をサポートする。HMは、また、2N×nU、2N×nD、nL×2N、およびnR×2NのPUサイズでのインター予測のための、非対称な区分をサポートする。非対称な区分では、CUの一方向は区分されず、他の方向は25%および75%に区分される。CUの25%パーティションに対応する部分は、「n」、ならびにそれに続く「Up」、「Down」、「Left」、または「Right」の表示によって示される。したがって、たとえば、「2N×nU」は、上部で2N×0.5NのPU、および下部で2N×1.5NのPUに水平に区分される2N×2NのCUを参照する。
[0054]本開示では、「N×N」および「N by N」は、垂直および水平の寸法の観点からビデオブロックのピクセル寸法を参照するために、たとえば、16×16ピクセルまたは16by16ピクセルのように、互換的に使用され得る。一般に、16×16ブロックは、垂直方向に16ピクセル(y=16)、および水平方向に16ピクセル(x=16)を有する。同様に、N×Nブロックは、一般に、垂直方向にNピクセル、および水平方向にNピクセルを有し、ここでNは、非負の整数値を表す。ブロックにおけるピクセルは、行および列に配列され得る。その上、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有するとは限らない。たとえば、ブロックは、N×Mピクセルを備え得、ただし、Mは必ずしもNに等しいとは限らない。
[0055]CUのPUを使用するイントラ予測またはインター予測のコーディングの後で、ビデオエンコーダ20は、CUのTUに対する残差データを計算し得る。PUは、空間領域(ピクセル領域とも呼ばれる)での予測ピクセルデータを生成する方法、すなわちモードを記述するシンタックスデータを備え得、TUは、変換、たとえば、離散コサイン変換(DCT)、整数変換、ウェーブレット変換、または残差ビデオデータへの概念的には類似の変換を適用した後の、変換領域での係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、PUに対応する予測値との間のピクセル差分に対応し得る。ビデオエンコーダ20は、CUに対する残差データを含むTUを形成し、次いで、CUのための変換係数を生成するためにTUを変換し得る。
[0056]変換係数を生成するための任意の変換の後で、ビデオエンコーダ20は、変換係数の量子化を実行し得る。量子化は、その最も広範な通常の意味を有することを意図する、広範な用語である。一実施形態では、量子化は、変換係数が量子化されて、場合によっては、係数を表現するために使用されるデータの量を低減し、さらに圧縮をもたらす処理に言及する。量子化処理は、係数の一部または全部と関連したビット深度を低減し得る。たとえば、nビットの値は、量子化中にmビットの値に端数を丸められてよく、ここで、nはmよりも大きい。
[0057]量子化の後で、ビデオエンコーダは、変換係数を走査し得、量子化変換係数を含む2次元の行列から1次元のベクトルを生成する。走査は、より高いエネルギー(したがってより低い周波数)の係数をアレイの前方に配置し、より低いエネルギー(したがってより高い周波数)の係数をアレイの後方に配置するように意図され得る。いくつかの例では、ビデオエンコーダ20は、エントロピー符号化され得るシリアル化されたベクトルを生成するために、量子化変換係数を走査するための規定の走査順序を利用し得る。他の例では、ビデオエンコーダ20は、適応走査を実行し得る。量子化変換係数を走査して1次元のベクトルを形成した後、ビデオエンコーダ20は、たとえば、コンテキスト適応型可変長コーディング(CAVLC:context-adaptive variable length coding)、コンテキスト適応型2値算術コーディング(CABAC:context-adaptive binary arithmetic coding)、シンタックスベースコンテキスト適応型2値算術コーディング(SBAC:syntax-based context-adaptive binary arithmetic coding)、確率間隔区分エントロピー(PIPE:Probability Interval Partitioning Entropy)コーディングまたは別のエントロピー符号化の方法に従って、1次元のベクトルをエントロピー符号化し得る。ビデオエンコーダ20は、また、ビデオデコーダ30によるビデオデータの復号での使用のために、符号化ビデオデータと関連したシンタックス要素をエントロピー符号化する。
[0058]CABACを実行するために、ビデオエンコーダ20は、コンテキストモデル内のコンテキストを、送信されるべきシンボルに割り当て得る。コンテキストは、たとえば、シンボルの隣接する値がゼロ以外であるか否かに関係し得る。CAVLCを実行するために、ビデオエンコーダ20は、送信されるべきシンボルに対する可変長符号を選択し得る。VLCの中のコードワードは、比較的に短いコードが、より起こりそうなシンボルに対応し、より長いコードが、より起こりそうでないシンボルに対応するように、再構成され得る。このようにして、VLCの使用により、たとえば、送信されるべき各シンボルに対して等長のコードワードを使用することを越える、ビットの節約が達成され得る。起こりそうなことの決定は、シンボルに割り当てられたコンテキストに基づき得る。
[0059]ビデオエンコーダ20は、さらに、ブロックベースのシンタックスデータ、フレームベースのシンタックスデータ、およびGOPベースのシンタックスデータなどのシンタックスデータを、たとえば、フレームヘッダ、ブロックヘッダ、スライスヘッダ、またはGOPヘッダの中で、ビデオデコーダ30へ送り得る。GOPシンタックスデータは、それぞれのGOPの中のいくつかのフレームを記述し得、フレームシンタックスデータは、対応するフレームを符号化するために使用された符号化/予測モードを示し得る。
[0060]図2は、本開示で説明する態様による技法を実装し得るビデオエンコーダの例を示すブロック図である。ビデオエンコーダ20は、本開示の技法のうちの、任意のものまたはすべてを実行するように構成され得る。一例として、モード選択ユニット40は、本開示に記載された技法のうちの、いずれかまたはすべてを実施するように構成され得る。しかしながら、本開示の態様はそのようには限定されない。いくつかの例では、本開示に記載される技法は、図7〜図8に関して以下に記載される方法を含み、ビデオエンコーダ20の様々な構成要素の間で共有され得る。いくつかの例では、それに加えて、またはそれの代わりに、プロセッサ(図示せず)は、本開示に記載される技法のうちの任意のものまたはすべてを実行するように構成され得る。
[0061]ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを実行し得る。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオにおける空間的冗長性を低減または除去するために空間的予測に依拠する。インターコーディングは、ビデオシーケンスの隣接するフレーム内またはピクチャ内のビデオにおける、時間的な冗長性を低減または除去するために、時間的予測に依拠する。イントラモード(Iモード)は、いくつかの空間ベースのコーディングモードのうちの任意のものを参照し得る。一方向予測(Pモード)または双方向予測(Bモード)などのインターモードは、いくつかの時間ベースのコーディングモードのうちの任意のものを参照し得る。
[0062]図2に示すように、ビデオエンコーダ20は、符号化されるべきビデオフレーム内の現在のビデオブロックを受信する。図1の例では、ビデオエンコーダ20は、モード選択ユニット40と、参照フレームメモリ64と、加算器50と、変換処理ユニット52と、量子化ユニット54と、エントロピー符号化ユニット56とを含む。モード選択ユニット40は、動き補償ユニット44と、動き推定ユニット42と、イントラ予測ユニット46と、分割ユニット48とを含む。ビデオブロックの再構成のために、ビデオエンコーダ20は、また、逆量子化ユニット58と、逆変換ユニット60と、加算器62とを含む。デブロッキングフィルタ(図2に示さず)も、ブロック境界をフィルタして、再構成されたビデオからブロッキネスアーチファクトを除去するために、含まれ得る。所望であれば、デブロッキングフィルタは、通常、加算器62の出力をフィルタするはずである。さらなるフィルタ(インループまたはポストループ)も、デブロッキングフィルタに加えて使用され得る。そのようなフィルタは、簡約のために図示されないが、所望であれば、加算器50の出力を(インループフィルタとして)フィルタし得る。
[0063]符号化プロセス中に、ビデオエンコーダ20は、コーディングされるべきビデオフレームまたはスライスを受信する。フレームまたはスライスは、複数のビデオブロックに分割され得る。動き推定ユニット42および動き補償ユニット44は、時間的予測をもたらすために、1つまたは複数の参照フレームの中の1つまたは複数のブロックに対して受信されたビデオブロックのインター予測のコーディングを実行する。イントラ予測ユニット46は、あるいは、空間的予測をもたらすために、コーディングされるべきブロックと同じフレームまたはスライスの中の、1つまたは複数の隣接ブロックに対して受信されたビデオブロックのイントラ予測のコーディングを実行し得る。ビデオエンコーダ20は、たとえば、ビデオデータの各ブロックに対する適切なコーディングモードを選択するために、複数のコーディングパスを実行し得る。
[0064]その上、分割ユニット48は、前のコーディングパスでの前の区分化方式の評価に基づいて、ビデオデータのブロックを、サブブロックに区分し得る。たとえば、分割ユニット48は、最初は、レート歪み分析(たとえば、レート歪み最適化)に基づいて、フレームまたはスライスをLCUに区分し、LCUの各々をサブCUに区分し得る。モード選択ユニット40は、さらにLCUをサブCUに区分することを示す4分木データ構造を生成し得る。4分木のリーフノードCUは、1つまたは複数のPUと、1つまたは複数のTUとを含み得る。
[0065]モード選択ユニット40は、たとえば、エラー結果に基づいて、コーディングモードのうちの1つ、イントラまたはインターを選択し、得られたイントラまたはインターコード化ブロックを、残差ブロックデータを生成するために加算器50に提供し、参照フレームとして使用するための符号化されたブロックを再構成するために加算器62に提供し得る。モード選択ユニット40はまた、動きベクトル、イントラモードインジケータ、パーティション情報、および他のそのようなシンタックス情報などのシンタックス要素をエントロピー符号化ユニット56に与える。
[0066]動き推定ユニット42および動き補償ユニット44は、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定は、動き推定ユニット42によって実行され、動きベクトルを生成する処理であり、ビデオブロックに対する動きを推定する。動きベクトルは、たとえば、現在のフレーム内でコーディングされている現在のブロック(または、他のコーディングユニット)に対する、参照フレーム内の予測ブロック(または、他のコーディングユニット)に対する、現在のビデオフレーム内またはピクチャ内のビデオブロックのPUの移動を示し得る。予測ブロックは、ピクセル差分の観点で、コーディングされるべきブロックと密に適合すると見出されたブロックであり、ピクセル差分は、絶対値差分の合計(SAD)、二乗差分の合計(SSD)、または他の差分の測定規準によって決定され得る。いくつかの例では、ビデオエンコーダ20は、参照フレームメモリ64に記憶されている参照ピクチャの、サブ整数ピクセル位置に対する値を計算し得る。たとえば、ビデオエンコーダ20は、参照ピクチャの、4分の1ピクセル位置、8分の1ピクセル位置、または他の分数のピクセル位置の値を補間し得る。したがって、動き推定ユニット42は、完全なピクセル位置および分数のピクセル位置に対して動き探索を実行し、動きベクトルを分数のピクセル精度で出力し得る。
[0067]動き推定ユニット42は、PUの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライスの中のビデオブロックのPUに対する動きベクトルを計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)または第2の参照ピクチャリスト(リスト1)から選択され得、それらの各々は、参照フレームメモリ64に記憶されている1つまたは複数の参照ピクチャを特定する。動き推定ユニット42は、計算された動きベクトルを、エントロピー符号化ユニット56と、動き補償ユニット44とへ送る。
[0068]動き補償は、動き補償ユニット44によって実行され、動き推定ユニット42により決定された動きベクトルに基づいて、予測ブロックをフェッチまたは生成することを伴う。やはり、動き推定ユニット42および動き補償ユニット44は、いくつかの例では、機能的に統合され得る。現在のビデオブロックのPUに対する動きベクトルを受信すると、動き補償ユニット44は、予測ブロックを、動きベクトルが参照ピクチャリストのうちの1つで指す所へ位置決めし得る。加算器50は、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算することによって残差ビデオブロックを形成し、以下で説明するようにピクセル差分の値を形成する。一般に、動き推定ユニット42は、ルーマ構成要素に対して動き推定を実行し、動き補償ユニット44は、クロマ構成要素とルーマ構成要素の両方のために、ルーマ構成要素に基づいて計算された動きベクトルを使用する。モード選択ユニット40は、また、ビデオデコーダ30によるビデオスライスのビデオブロックの復号での使用のために、ビデオブロックおよびビデオスライスと関連したシンタックス要素を生成する。
[0069]イントラ予測ユニット46は、上述されるように、動き推定ユニット42および動き補償ユニット44によって実行されるインター予測に代わるものとして、現在のブロックをイントラ予測または計算し得る。特に、イントラ予測ユニット46は、現在のブロックを符号化するために使用するイントラ予測モードを決定することができる。いくつかの例では、イントラ予測ユニット46は、たとえば、別個の符号化パス中に様々なイントラ予測モードを使用して現在のブロックを符号化し得、イントラ予測ユニット46(または、いくつかの例では、モード選択ユニット40)は、使用するために適切なイントラ予測モードを、テストされたモードから選択し得る。
[0070]たとえば、イントラ予測ユニット46は、様々なテストされたイントラ予測モードに対して、レート歪み分析を使用してレート歪みの値を計算し、テストされたモードの中から最良のレート歪み特性を有するイントラ予測モードを選択し得る。レート歪み分析は、一般に、符号化されたブロックと、符号化ブロックを生成するために符号化される、元の符号化されていないブロックとの間のある量の歪み(すなわち、エラー)、および、符号化ブロックを生成するために使用されるビットレート(すなわち、いくつかのビット)を決定する。イントラ予測ユニット46は、様々な符号化ブロックに対する歪みおよびレートから比を計算し、どのイントラ予測モードがブロックに対して最良のレート歪みの値を示すかを決定し得る。
[0071]ブロックに対するイントラ予測モードを選択した後、イントラ予測ユニット46は、ブロックに対して選択されたイントラ予測モードを示す情報を、エントロピー符号化ユニット56に提供し得る。エントロピー符号化ユニット56は、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ20は、送信されるビットストリームの中に構成データを含み得、構成データは、コンテキストの各々のために使用する、複数のイントラ予測モードのインデックステーブルおよび複数の修正されたイントラ予測モードのインデックステーブル(コードワードマッピングテーブルとも呼ばれる)、様々なブロックに対する符号化コンテキストの定義、ならびに、最も起こりそうなイントラ予測モードの表示、イントラ予測モードのインデックステーブル、および修正されたイントラ予測モードのインデックステーブルを含み得る。
[0072]ビデオエンコーダ20は、モード選択ユニット40からの予測データを、コーディングされている元のビデオブロックから減算することによって、残差ビデオブロックを形成する。加算器50は、この減算操作を実行する1つの構成要素または複数の構成要素を表現する。変換処理ユニット52は、離散コサイン変換(DCT)または概念的には類似の変換などの変換を残差ブロックに適用し、残差変換係数の値を備えるビデオブロックを生成する。変換処理ユニット52は、概念的にはDCTに類似の他の変換を実行し得る。ウェーブレット変換、整数変換、サブバンド変換または他のタイプ変換も使用され得る。いかなる場合でも、変換処理ユニット52は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換は、ピクセル値領域からの残差情報を、周波数領域などの変換領域に転換し得る。変換処理ユニット52は、得られた変換係数を量子化ユニット54へ送り得る。量子化ユニット54は、ビットレートをさらに低減するために、変換係数を量子化する。量子化処理は、係数の一部または全部と関連したビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって、修正され得る。いくつかの例では、量子化ユニット54は、次いで、量子化変換係数を含む行列の走査を実行し得る。あるいは、エントロピー符号化ユニット56が、走査を実行し得る。
[0073]量子化の後で、エントロピー符号化ユニット56は、量子化変換係数をエントロピーコーディングする。たとえば、エントロピー符号化ユニット56は、コンテキスト適応型可変長コーディング(CAVLC)、コンテキスト適応型2値算術コーディング(CABAC)、シンタックスベースコンテキスト適応型2値算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コーディングまたは別のエントロピーコーディング技法を、実行し得る。コンテキストベースのエントロピーコーディングの場合、コンテキストは、隣接ブロックに基づいてよい。エントロピー符号化ユニット56によるエントロピーコーディングの後で、符号化ビットストリームは、別のデバイス(たとえば、ビデオデコーダ30)へ送信され得、後から伝送または取り出すために、アーカイブされ得る。
[0074]逆量子化ユニット58および逆変換ユニット60は、たとえば、参照ブロックとして後で使用できるように、ピクセル領域で残差ブロックを再構成するために、それぞれ、逆量子化と、逆変換とを適用する。動き補償ユニット44は、残差ブロックを、参照フレームメモリ64のフレームのうちの1つの予測ブロックに加算することによって、参照ブロックを計算し得る。動き補償ユニット44は、また、動き推定での使用のためにサブ整数ピクセル値を計算するために、1つまたは複数の補間フィルタを再構成された残差ブロックに適用し得る。加算器62は、参照フレームメモリ64での記憶のための再構成されたビデオブロックを生成するために、再構成された残差ブロックを、動き補償ユニット44によって生成される動き補償された予測ブロックに加算する。再構成されたビデオブロックは、動き推定ユニット42および動き補償ユニット44によって、後続のビデオフレームにおけるブロックをインターコード化するための参照ブロックとして使用され得る。
[0075]図3は、本開示で説明する態様による技法を実装し得るビデオデコーダの例を示すブロック図である。ビデオデコーダ30は、図7〜図8に関して以下に記載される方法を含む、本開示の技法のうちの任意のものまたはすべてを実行するように構成され得る。一例として、動き補償ユニット72および/またはイントラ予測ユニット74は、本開示に記載される技法のうちの任意のものまたはすべてを実行するように構成され得る。しかしながら、本開示の態様はそのようには限定されない。いくつかの例では、本開示に記載される技法は、ビデオデコーダ30の様々な構成要素の中で、共有され得る。いくつかの例では、それに加えて、またはそれの代わりに、プロセッサ(図示せず)は、本開示に記載される技法のうちの任意のものまたはすべてを実行するように構成され得る。
[0076]図3の例では、ビデオデコーダ30は、エントロピー復号ユニット70と、動き補償ユニット72と、イントラ予測ユニット74と、逆量子化ユニット76と、逆変換ユニット78と、参照フレームメモリ82と、加算器80とを含む。ビデオデコーダ30は、いくつかの例では、ビデオエンコーダ20(図2)に関して記載される符号化パスに対して概ね逆の復号パスを実行し得る。動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルに基づいて、予測データを生成し得、イントラ予測ユニット74は、エントロピー復号ユニット70から受信されたイントラ予測モードインジケータに基づいて、予測データを生成し得る。
[0077]復号プロセス中に、ビデオデコーダ30は、符号化されたビデオスライスのビデオブロックおよび関連するシンタックス要素を表現する符号化されたビデオビットストリームを、ビデオエンコーダ20から受信する。ビデオデコーダ30のエントロピー復号ユニット70は、量子化係数、動きベクトルまたはイントラ予測モードインジケータ、および他のシンタックス要素を生成するために、ビットストリームをエントロピー復号する。エントロピー復号ユニット70は、動きベクトルと、他のシンタックス要素とを、動き補償ユニット72へ転送する。ビデオデコーダ30は、ビデオスライスレベルおよび/またはビデオブロックレベルでのシンタックス要素を受信し得る。
[0078]ビデオスライスが、イントラコード化(I)スライスとしてコーディングされるとき、イントラ予測ユニット74は、現在のフレームまたはピクチャの以前に復号されたブロックから、シグナリングされたイントラ予測モードおよびデータに基づいて、現在のビデオスライスのビデオブロックに対する予測データを生成し得る。ビデオフレームがインターコード化(たとえば、B、PまたはGPB)スライスとしてコーディングされるとき、動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルおよび他のシンタックス要素に基づいて、現在ビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの1つの中の、参照ピクチャのうちの1つから生成され得る。ビデオデコーダ30は、参照フレームメモリ92に記憶された参照ピクチャに基づいて、デフォルトの構成技法を使用して、参照フレームリスト、すなわち、リスト0とリスト1とを構成し得る。動き補償ユニット72は、動きベクトルと他のシンタックス要素とを解析することによって現在のビデオスライスのビデオブロックのための予測情報を決定するとともに、復号されている現在のビデオブロックに関する予測ブロックを生成するために、その予測情報を使用する。たとえば、動き補償ユニット72は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード(たとえば、イントラまたはインター予測)と、インター予測スライスタイプ(たとえば、Bスライス、Pスライス、またはGPBスライス)と、スライスに関する参照ピクチャリストのうちの1つまたは複数に関する構成情報と、スライスの各々のインター符号化されたビデオブロックに関する動きベクトルと、スライスの各々のインターコーディングされたビデオブロックに関するインター予測ステータスと、現在のビデオスライス中のビデオブロックを復号するための他の情報とを決定するために、受信されたシンタックス要素のいくつかを使用する。
[0079]動き補償ユニット72は、また、補間フィルタに基づいて、補間を実行し得る。動き補償ユニット72は、参照ブロックのサブ整数ピクセルに対して補間された値を計算するために、ビデオブロックの符号化中にビデオエンコーダ20によって使用されたように、補間フィルタを使用し得る。このケースでは、動き補償ユニット72は、受信したシンタックス要素からビデオエンコーダ20によって使用された補間フィルタを決定し、補間フィルタを使用して予測ブロックを生成し得る。
[0080]逆量子化ユニット76は、ビットストリームの中で提供され、エントロピー復号ユニット80によって復号された量子化変換係数を、逆量子化(inverse quantize)、たとえば、逆量子化(de-quantize)する。逆量子化処理は、量子化の程度、および同様に、適用されるべき逆量子化の程度を決定するために、ビデオスライスの中の各ビデオブロックに対してビデオデコーダ30によって計算された量子化パラメータQPYの使用を含み得る。
[0081]逆変換ユニット78は、ピクセル領域内の残差ブロックを生成するために、逆変換、たとえば、逆DCT、逆整数変換、または概念的には類似の逆変換処理を、変換係数に適用する。
[0082]動きベクトルおよび他のシンタックス要素に基づいて、動き補償ユニット82が現在のビデオブロックに対する予測ブロックを生成した後、ビデオデコーダ30は、逆変換ユニット78からの残差ブロックに動き補償ユニット72によって生成された対応する予測ブロックを合計することによって、復号ビデオブロックを形成する。加算器90は、この加算操作を実行する1つの構成要素または複数の構成要素を表現する。所望であれば、デブロッキングフィルタも、ブロッキネスアーチファクトを除去するため、復号ブロックをフィルタするために適用され得る。他のループフィルタ(コーディングループの中、またはコーディングループの後のいずれか)も、ピクセルの変化を平滑化し、または他の方法でビデオ品質を改善するために使用され得る。所与のフレームまたはピクチャにおける復号ビデオブロックは、次いで、参照ピクチャメモリ92に記憶され、これは後続の動き補償のために使用される参照ピクチャを記憶する。参照フレームメモリ82は、また、図1のディスプレイデバイス32などのディスプレイデバイス上で後で提示できるように、復号ビデオを記憶する。
HEVCにおける動き補償
[0083]上述されたように、HEVCは次世代のビデオコーディング規格である。概して、HEVCは以前のビデオコーディング規格の枠組に追従する。HEVCの動き補償ループは、H.264/AVCのものと同じものを維持され得、すなわち、現在のフレームの再構成
Figure 0006352391
は、以下のように、逆量子化された係数rに時間的予測Pを加えたものに等しい。
Figure 0006352391
ここで、Pは、Pフレームもしくはスライスに対する一方向予測、またはBフレームもしくはスライスに対する双方向予測を示す。
[0084]HEVCにおける動き補償の単位は、以前のビデオコーディング規格のものと異なり得る。実際、以前のビデオコーディング規格におけるマクロブロックの概念は、HEVCでは存在しない。代わりに、マクロブロックの概念は、包括的な4分木方式に基づく極めてフレキシブルな階層構造によって取り替えられる。この方式内で、3つのタイプのブロック、すなわち、コーディングユニット(CU)、予測ユニット(PU)、および変換ユニット(TU)が定義される。CUは領域分割の基本単位である。CUは、マクロブロックの概念と類似しているが、CUは、最大サイズを制限せず、CUは、内容の適合性を改善するために、4つの等しいサイズのCUへの再帰的な分割を可能にする。PUは、インター/イントラ予測の基本的な単位であり、PUは、不規則な画像パターンを効果的にコーディングするために、単一のPUの中に複数の任意の形状のパーティションを含み得る。TUは変換の基本単位である。TUは、PUから独立に定義され得るが、ただし、TUのサイズは、TUが属するCUに限定される。ブロック構造の3つの異なるコンセプトへのこの分離によって、それぞれがその役割に従って最適化され得、その結果、コーディングの効率性が改善される。
スケーラブルビデオコーディング
[0085]異なる寸法でのスケーラビリティ400の例が、図4に示される。この例では、スケーラビリティは、3つの寸法402、404、406で可能である。時間ディメンション402では、たとえば、7.5Hz、15Hzまたは30Hzのフレームレートが、時間的なスケーラビリティ(T)によってサポートされ得る。空間的なスケーラビリティ(S)404がサポートされる場合、異なる解像度、たとえば、QCIF、CIFおよび4CIFなどが可能である。各特定の空間解像度およびフレームレートのために、SNR(Q)レイヤ406が、ピクチャ品質を改善するために追加され得る。各レイヤ402、404、406からのビットストリームは、単一のビットストリームの中に一緒に多重化され得る。いったんビデオコンテンツがそのような拡張性のある方法で符号化されると、エクストラクタツールが、たとえば、クライアントまたは伝送チャネルに依存するアプリケーションの要件に従って、実際に配送されるコンテンツを適応させるために使用され得る。図4に示す例では、各立方体408は、同じフレームレート(時間的なレベル)、空間解像度、およびSNRレイヤを有するピクチャを含む。これらの立方体408(ピクチャ)を任意の寸法402、404、406に追加することによって、より良い表現が達成され得る。組み合わされたスケーラビリティは、2つ、3つ、またはさらに多くのスケーラビリティが可能である場合に、サポートされる。
[0086]SVC仕様によれば、最も低い空間的410および品質412レイヤを有するピクチャは、H.264/AVCと互換性があり、最も低い時間的レベル414でのピクチャは、時間的なベースレイヤを形成し、これは、より高い時間的レベルでのピクチャを伴って拡張され得る。H.264/AVCと互換性のあるレイヤに加えて、いくつかの空間的および/またはSNRエンハンスメントレイヤが、空間的および/または品質のスケーラビリティをもたらすために、追加され得る。SNRスケーラビリティ406は、品質スケーラビリティとしても参照させられる。各空間的404またはSNR406エンハンスメントレイヤは、それ自体、H.264/AVCと互換性のあるレイヤと同じ時間的スケーラビリティ構造とともに、時間的にスケーラブルであり得る。1つの空間的またはSNRエンハンスメントレイヤに対して、空間的またはSNRエンハンスメントレイヤが依存するより低いレイヤは、その特定の空間的またはSNRエンハンスメントレイヤのベースレイヤとしても参照させられる。
[0087]SVCコーディング構造500の例が、図5に示される。最も低い空間的および品質レイヤを有するピクチャ(レイヤ0 502およびレイヤ1 504の、QCIF解像度のピクチャ)は、H.264/AVCと互換性がある。これらの中で、最も低い時間的レベルのこれらのピクチャは、図5のレイヤ0 502に示されるように、時間的なベースレイヤを形成する。この時間的なベースレイヤ(レイヤ0)502は、より高い時間的レベル(レイヤ1)504のピクチャを伴って拡張され得る。H.264/AVCと互換性のあるレイヤ504に加えて、いくつかの空間的および/またはSNRエンハンスメントレイヤ506、508、510は、空間的および/または品質スケーラビリティをもたらすために、追加され得る。たとえば、エンハンスメントレイヤは、レイヤ2 506と同じ解像度を有するCIF表現であり得る。この例では、レイヤ3 508は、SNRエンハンスメントレイヤである。この例に示されるように、各空間的またはSNRエンハンスメントレイヤは、それ自体、H.264/AVCと互換性のあるレイヤと同じ時間的スケーラビリティ構造とともに、時間的にスケーラブルであり得る。また、エンハンスメントレイヤは、空間解像度とフレームレートの両方を拡張することができる。たとえば、レイヤ4 510は、さらに、フレームレートを15Hzから30Hzに増大させる、4CIFエンハンスメントレイヤを提供する。
[0088]図6に示すように、同じ時間のインスタンスでコーディングされるスライスは、ビットストリームの順序の中で連続であり、SVCのコンテキストの中で1つのアクセスユニット600を形成する。それらのSVCアクセスユニット600は、次いで、表示の順序と異なるかもしれない復号の順序に従い、たとえば、時間的予測の関係によって決定される。
[0089]図7は、一実施形態による参照レイヤのピクチャをアップサンプルすることの例を示す概念図700を示す。いくつかの実施形態では、参照レイヤ、エンハンスメントレイヤ、またはそれらの両方と関連したビデオ情報を受信するように構成されるビデオコーダまたはデコーダは、複数のレイヤ間フィルタと1つまたは複数の参照レイヤのピクチャとを使用して、複数のレイヤ間参照ピクチャを生成するように構成され得る。図示のように、第1のアップサンプリングフィルタ722は、第1のレイヤ間参照ピクチャ720を生成するために、参照レイヤのピクチャ710に適用され得る。加えて、第2のアップサンプリングフィルタ732は、第2のレイヤ間参照ピクチャ730を生成するために、参照レイヤのピクチャ710に適用され得る。いくつかの実施形態では、第1のアップサンプリングフィルタ722は、低い周波数を十分に再生するように設計され得、一方、第2のアップサンプリングフィルタ732は、高い周波数を十分に再生するように設計され得る。加えて、第3のアップサンプリングフィルタ742は、第3のレイヤ間参照ピクチャ740を生成するために、任意選択で、参照レイヤのピクチャ710に適用され得る。たとえば、第3のアップサンプリングフィルタ742は、第1のアップサンプリングフィルタ722または第2のアップサンプリングフィルタ732によって十分に再生されない任意の周波数を、十分に再生するように設計され得る。第1、第2、および第3のアップサンプリングフィルタ722、732、および742の各々は、限られた数のフィルタタップを使用して実現され得る。いくつかの実施形態では、第1、第2、および第3のアップサンプリングフィルタ722、732、および742の各々は、わずか8個のフィルタタップを使用して実現され得る。
[0090]いくつかの実施形態では、第1のレイヤ間参照ピクチャ720、第2のレイヤ間参照ピクチャ730、および第3のレイヤ間参照ピクチャ740は、参照ピクチャリストに挿入され得る。詳細には、エンハンスメントレイヤ内の現在のピクチャは、参照ピクチャリストを使用してコーディングされ得る。
[0091]いくつかの実施形態では、第1のアップサンプリングフィルタ722、第2のアップサンプリングフィルタ732、および第3のアップサンプリングフィルタ742は、事前定義され得る。あるいは、第1のアップサンプリングフィルタ722、第2のアップサンプリングフィルタ732、および第3のアップサンプリングフィルタ742のうちの少なくとも1つは、事前定義され得、一方、他のものは、シーケンスパラメータセット、ビデオパラメータセット、またはスライスヘッダの中でシグナリングされ得る。あるいは、第1のアップサンプリングフィルタ722、第2のアップサンプリングフィルタ732、および第3のアップサンプリングフィルタ742の各々は、シーケンスパラメータセット、ビデオパラメータセット、またはスライスヘッダの中でシグナリングされ得る。
[0092]SHVCでは、ベースレイヤの参照ピクチャは、ロングターム参照ピクチャとしてフラグを使用してマークされ得る。たとえば、表1に示すシーケンスパラメータセット(SPS)内のシンタックスは、ロングタームピクチャをシグナリングするために使用され得る。
Figure 0006352391
[0093]表1の変数は、次のように記述され得る。
0に等しいlong_term_ref_pics_present_flagは、CVS内でコーディングされている任意のピクチャのインター予測のために、ロングターム参照ピクチャが使用されないことを規定し得、一方、1に等しいlong_term_ref_pics_present_flagは、CVS内でコーディングされている1つまたは複数のピクチャのインター予測のために、ロングターム参照ピクチャが使用され得ることを規定し得る。
num_long_term_ref_pics_spsは、SPS(シーケンスパラメータセット)内で規定される候補のロングターム参照ピクチャの数を規定し得る。num_long_term_ref_pics_spsの値は、0から32(それらを含む)の範囲にある。
lt_ref_pic_poc_lsb_sps[i]は、SPS内で規定されるi番目の候補のロングターム参照ピクチャの、MaxPicOrderCntLsbを法とするピクチャ順序のカウント(the picture order count modulo MaxPicOrderCntLsb of the i-th candidate long-term reference picture specified in the SPS)を規定し得る。lt_ref_pic_poc_lsb_sps[i]を表現するために使用されるビットの数は、log2_max_pic_order_cnt_lsb_minus4+4に等しくてよい。
0に等しいused_by_curr_pic_lt_sps_flag[i]は、SPS内で規定されるi番目の候補のロングターム参照ピクチャが、SPS内で規定されるi番目の候補のロングターム参照ピクチャをそのロングタームRPSの中に含むピクチャによる参照のために使用されないことを、規定し得る。
[0094]スライスヘッダの中では、表2に示す以下のシンタックス要素は、現在のピクチャのロングターム参照ピクチャセット(RPS)をシグナリングするために使用され得る。
Figure 0006352391
[0095]表2の変数は、次のように記述され得る。
num_long_term_spsは、アクティブなSPS内で規定される候補ロングターム参照ピクチャに基づいて導き出された、現在のピクチャのロングタームRPS内のエントリの数を規定し得る。num_long_term_spsの値は、0からnum_long_term_ref_pics_sps(それらを含む)の範囲にあり得る。存在しない場合、num_long_term_spsの値は、0に等しいと推論され得る。
num_long_term_picsは、スライスヘッダの中で、直接シグナリングされる現在のピクチャのロングタームRPS内のエントリの数を規定し得る。存在しない場合、num_long_term_picsの値は、0に等しいと推論され得る。
lt_idx_sps[i]は、現在のピクチャのロングタームRPS内のi番目のエントリの、アクティブなSPS内で規定される候補のロングターム参照ピクチャのリストへのインデックスを規定し得る。lt_idx_sps[i]を表現するために使用されるビットの数は、Ceil(Log2(num_long_term_ref_pics_sps))に等しくてよい。存在しない場合、lt_idx_sps[i]の値は、0に等しいと推論され得る。lt_idx_sps[i]の値は、0からnum_long_term_ref_pics_sps−1(それらを含む)の範囲にあり得る。
poc_lsb_lt[i]は、現在のピクチャのロングタームRPS内のi番目のエントリの、MaxPicOrderCntLsbを法とするピクチャ順序のカウント数を規定し得る。poc_lsb_lt[i]シンタックス要素の長さは、log2_max_pic_order_cnt_lsb_minus4+4ビットであり得る。
0に等しいused_by_curr_pic_lt_flag[i]は、現在のピクチャのロングタームRPS内のi番目のエントリが、現在のピクチャによる参照のために使用されないことを規定し得る。
1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在することを規定し得る。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt[i]が存在しないことを規定し得る。
delta_poc_msb_cycle_lt[i]は、現在のピクチャのロングタームRPS内のi番目のエントリの、ピクチャ順序のカウント値の最上位ビットの値を決定するために使用され得る。delta_poc_msb_cycle_lt[i]が存在しない場合、それは0に等しいと推論され得る。
[0096]本明細書に記載される様々な実施形態では、複数のアップサンプリングフィルタは、複数のレイヤ間参照ピクチャを生成するために利用され得る。相異なるアップサンプリングフィルタは、相異なる周波数応答を表すように設計され得る。これらのピクチャは、参照ピクチャリストに挿入され得、現在のピクチャをコーディングするためのレイヤ間参照ピクチャとして使用され得る。そのようなアップサンプリングフィルタとは関係なく、本明細書に記載される技法、方法、および実施形態は、また、任意の他の種類のレイヤ間フィルタに適用できる。
SPSまたはVPSの中で代替のフィルタセットをシグナリングすること
[0097]代替のレイヤ間フィルタは、事前定義され得るか、またはSPSもしくはVPSの中で明示的にシグナリングされ得る。たとえば、いくつかの実施形態では、レイヤ間フィルタのうちのいくつかまたはすべては、事前定義され得る。レイヤ間フィルタは、また、シーケンスパラメータセットまたはビデオパラメータセットの中でシグナリングされ得る。いくつかの実施形態では、レイヤ間フィルタは、少なくとも1つのデフォルトのレイヤ間フィルタと、シーケンスパラメータセット、ビデオパラメータセット、またはスライスヘッダの中でシグナリングされる少なくとも1つの代替のレイヤ間フィルタとを備える。レイヤ間フィルタのうちの任意のものが、SPSの中で明示的にシグナリングされる場合、表3に示されるシンタックスが使用され得る。
[0098]表3の変数は、次のように記述され得る。
num_alt_filter_spsは、代替のフィルタの数を規定し得る。
num_alt_filter_tap_minus3_lumaおよびnum_alt_filter_tap_minus3_chromaは、それぞれ、ルーマフィルタタップおよびクロマフィルタタップから3を差し引いて規定し得る。
luma_phase_flag[i][k]およびchroma_phase_flag[i][k]は、i番目のフィルタのフェーズkが存在することを示し得る。1は、存在することを意味し得る。0は、存在しないことを意味し得る。
filter_tap_luma[i][k][j]およびfilter_tap_chroma[i][k][j]は、ビットを削減するために差分コーディングされ得る、フィルタタップの値を表現し得る。これらのフィルタは、異なるベースレイヤの参照ピクチャを生成するために使用され得る。シンタックスが存在しない場合、値は、事前定義されたデフォルトのフィルタの値に等しく設定され得る。
Figure 0006352391
[0099]別の実施形態では、ルーマフィルタおよびクロマフィルタは、一対であり得る。この実施形態では、表4に示すシンタックスが使用され得る。暗に事前定義されたフィルタおよび明示的にシグナリングされるフィルタは、2つのリストを形成するために順序付けられ得る。リスト内でのフィルタの相対位置は、特定の規則に従い得る。
Figure 0006352391
スライスヘッダの中で代替のフィルタセットをシグナリングすること
[0100]代替のレイヤ間フィルタは、また、スライスヘッダの中でシグナリングされ得る。レイヤ間フィルタのうちの任意のものがスライスヘッダの中でシグナリングされる場合、表5に示すシンタックスが使用され得る。
[0101]表5の変数は、次のように記述され得る。
num_ilr_picture_minus1は、レイヤ間参照ピクチャの数から1を差し引いた数を規定し得る。
alt_filter_idx_luma[i]およびalt_filter_idx_chroma[i]は、i番目の代替のルーマフィルタおよびクロマフィルタのインデックスをそれぞれ規定し得る。
default_filter_idx[i]は、i番目のデフォルトのフィルタのインデックスを規定し得る。
num_default_filter_usedは、シグナリングされない、使用される事前定義されたフィルタの数を規定し得る。規定されない場合、値は1に設定され得る。
num_alt_filterは、num_ilr_picture_minus1+1−num_default_filter_usedに等しくてよい。
Figure 0006352391
[0102]一般に、通常は少なくとも1つの、利用できるデフォルトのフィルタが存在する。特定のiについてalt_filter_idx_luma[i]およびalt_filter_idx_chroma[i]の一方が利用できない場合、第1のデフォルトのフィルタは、表6に示すように、利用できないもののために使用され得る。表6における値alt_filter_idx[i]は、シグナリングされる代替のフィルタのフィルタインデックスを規定し得る。
Figure 0006352391
[0103]別の実施形態では、1つのデフォルトのレイヤ間フィルタおよび1つの事前定義された(または、シグナリングされた)代替のレイヤ間フィルタが、使用され得る。たとえば、SPS内で、フラグsps_alt_filter_enable_flagは、選択されたレイヤ間フィルタの表示に対するスライスレベルのシンタックスの存在を制御するためにシグナリングされ得る。このフラグが1に等しい場合、関係するシンタックスは、スライスヘッドの中でシグナリングされ得る。このフラグは、また、VPS(ビデオパラメータセット)においてシグナリングされ得る。
[0104]スライスヘッダの中で、一例として、以下のシンタックスがシグナリングされ得る。
Figure 0006352391
[0105]alternative_filter_used_flagが0に等しい場合、デフォルトのフィルタが使用され得る。alternative_filter_used_flagが1に等しい場合、代替のフィルタが使用され得る。加えて、コーディングされるピクチャに対するすべてのスライスのalternative_filter_used_flagは、同じ値を有し得る。
[0106]別の実施形態では、以下のシンタックスが、スライスヘッダの中でシグナリングされ得る。
Figure 0006352391
同じピクチャ内の第1のスライスの後のスライスは、第1のスライスと同じフィルタを共有し得る。
[0107]別の例では、以下のシンタックスが、スライスヘッダの中でシグナリングされ得る。
Figure 0006352391
alternative_filter_used_idcが0に等しい場合、デフォルトのフィルタのみが使用され得、一方、alternative_filter_used_idcが1に等しい場合、代替のフィルタのみが使用され得る。alternative_filter_usedが2に等しい場合、2つのフィルタの両方が使用され得る。2つのフィルタが使用される場合、2つのレイヤ間参照ピクチャが2つのフィルタを用いて生成され得る。加えて、コーディングされるピクチャに対するすべてのスライスのalternative_filter_used_idcは、同じ値を有し得る。
[0108]どのフィルタが使用されるかにかかわらず、これらのフィルタによって導き出される参照ピクチャは、同じ動きフィールド(予測モード、動きベクトル、参照idx他を含む)の情報(空間的スケーラビリティの場合はアップサンプルされる)と、同じPOCとを共有し得る。いくつかの実施形態では、これらのレイヤ間参照ピクチャのすべては、それらがレイヤ間参照ピクチャセットに加えられるとき、ロング参照ピクチャとしてマークされ得る。
双方向予測を制限すること
[0109]アップサンプリングの複雑さを低減するために、特定のPUに対して双方向予測が使用される場合、利用できる複数のフィルタされた参照ピクチャのうちのせいぜい1つが使用されることを許されるという、適合する制限が、適用され得る。たとえば、複数のレイヤ間参照ピクチャのうちのせいぜい1つが、現在のピクチャをコーディングするために使用されるために利用できるという制限が、適用され得る。
レイヤ間参照ピクチャセットの構成および参照ピクチャリストの初期化
[0110]エンハンスメントレイヤのピクチャを符号化および/または復号するためにsmレイヤ間参照ピクチャセットを構成する場合、代替のフィルタを用いて生成されるレイヤ間参照ピクチャは、デフォルトのフィルタによって生成されるレイヤ間参照ピクチャの後に(または、前に)、加えられ得る。一般に、レイヤ間参照ピクチャは、上述のフィルタインデックスの順序で、レイヤ間参照ピクチャセットに加えられ得る。たとえば、レイヤ間フィルタが、1つまたは複数のデフォルトのレイヤ間フィルタと、1つまたは複数の代替のレイヤ間フィルタとを備える場合、1つまたは複数の代替のレイヤ間フィルタを使用して生成されるレイヤ間参照ピクチャをレイヤ間参照ピクチャセットに加える前に、1つまたは複数のデフォルトのレイヤ間フィルタを使用して生成されるレイヤ間参照ピクチャは、レイヤ間参照ピクチャセットに加えられ得る。
[0111]スライスのための参照ピクチャリストを初期化するとき、レイヤ間参照ピクチャセットからの参照ピクチャは、リスト0およびリスト1に同じ順序で加えられ得る。代替的に、スライスに対する参照ピクチャリストを初期化するとき、レイヤ間参照ピクチャセットからの参照ピクチャは、リスト0に昇順で加えられ得、リスト1に逆の順序で加えられる。
シグナリングされる係数における制約
[0112]レイヤ間フィルタの正および負の係数の合計は、フィルタする処理における最悪のケースの内部ピクセル値のビット深度を決定する。固定のレイヤ間フィルタにとって、中間データのダイナミックレンジは、事前定義されたフィルタ係数に従って導き出され得る。しかしながら、適応的にシグナリングされるフィルタにとって、この情報は知られていないことがある。中間データのダイナミックレンジを制限するために、フィルタする処理において、制約は、レイヤ間フィルタの正および負の係数の合計に課せられ得る。変数positive_sum_boundおよびnegative_sum_boundのしきい値は、コーデック内で事前定義され、ハードコーディングされ得る。この値は、また、SPSまたはVPSなどの中のビットストリーム内でシグナリングされ得る。
Figure 0006352391
[0113]シグナリングされるレイヤ間フィルタの正の係数の合計は、positive_sum_boundよりも大きくてはならず、シグナリングされるレイヤ間フィルタの負の係数の合計は、negative_sum_boundよりも小さくてはならないという、ビットストリームの制約を有することを求められるかもしれない。
[0114]一実施形態では、1つのフィルタの係数の合計は、(1<<N)となるように制限され得、ここで、Nは、フィルタ係数のダイナミックレンジを示す。Nの典型的な値は、6であり得、これはSHVCで使用される現在の固定のフィルタと同じである。フィルタ係数の合計の制限が(1<<N)に等しいことを考慮すると、negative_sum_boundは、positive_sum_bound−(1<<N)としてから導き出され(be derived from as positive_sum_bound - (1<<N))得る。したがって、本実施形態にとってのフィルタの正の係数の合計を制約することは十分であり得る。
[0115]別の実施形態では、別の制約が使用され得る。たとえば、ある特定のフィルタ係数の絶対値は、ある種のしきい値よりも大きくてはならないように制約され得る。このしきい値は、前述のpositive_sum_boundの値の値よりも小さいかもしれない。本明細書に記載されるこの規範的な制約の機構は、また、フィルタ係数がビットストリームの中でシグナリングされる任意の他の種類の適応フィルタに適用され得る。
ビデオデータをコーディングする方法
[0116]図8は、実施形態によるビデオデータをコーディングするための例示的な方法を示す。方法800は、たとえば、ビデオエンコーダ20またはビデオデコーダ30の1つまたは複数の構成要素によって実行され得る。いくつかの実施形態では、本明細書に記載されるステップのうちの1つまたは複数を実施するために、他の構成要素が使用される場合がある。
[0117]ブロック802では、参照レイヤ、エンハンスメントレイヤ、またはそれらの両方と関連したビデオ情報が受信され得る。たとえば、ビデオ情報は、メモリから受信され得る。
[0118]ブロック804では、複数のレイヤ間参照ピクチャが、複数のレイヤ間フィルタと1つまたは複数の参照レイヤのピクチャとを使用して、生成され得る。たとえば、少なくとも2つのレイヤ間フィルタは、少なくとも2つのレイヤ間参照ピクチャを生成するために、参照レイヤのピクチャに適用され得る。詳細には、少なくとも2つのレイヤ間フィルタのうちの1つは、より低い周波数に対して十分な周波数応答を提供するように設計されたアップサンプリングフィルタであり得、一方、少なくとも2つのレイヤ間フィルタのうちの別のものは、より高い周波数に対して十分な周波数応答を提供するように設計されたアップサンプリングフィルタであり得る。
[0119]例に応じて、本明細書に記載される技法のうちの任意のもののいくつかの振る舞いまたは事象は、異なるシーケンスで実行され得、全体的に追加さら、マージされ、または除外され得ることが、認識されるべきである(たとえば、記載される振る舞いまたは事象のすべてが、この技法の実施のために必要であるとは限らない)。その上、いくつかの例では、振る舞いまたは事象は、たとえば、マルチスレッドの処理、割込み処理、または多数のプロセッサを用いて、連続的ではなく同時に実行され得る。
[0120]1つまたは複数の例では、述べられた機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで、実施されてもよい。ソフトウェアで実施される場合、諸機能は、1つまたは複数の命令またはコードとして、コンピュータ可読媒体上に記憶されまたはコンピュータ可読媒体を介して伝送され得、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの、有形の媒体に相当するコンピュータ可読記憶媒体、またはコンピュータプログラムの、ある場所から別の場所への、たとえば、通信プロトコルによる転送を促進する任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、一般に、(1)非一時的である有形のコンピュータ可読記憶媒体または(2)信号または搬送波などの通信媒体に相当し得る。データ記憶媒体は、本開示に記載される技法の実施のために、1つもしくは複数のコンピュータまたは1つもしくは複数のプロセッサによって、命令、コードおよび/またはデータ構造を取り出すためにアクセスされ得る、任意の利用できる媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含んでもよい。
[0121]例として、それに限定されず、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROMもしくは他の光ディスク記憶装置、磁気ディスク記憶装置もしくは他の磁気記憶デバイス、フラッシュメモリ、または命令またはデータ構造の形態で所望のプログラムコードを記憶するために使用可能であり、コンピュータによってアクセス可能な他の任意の媒体を備えることができる。同様に、いかなる接続も、コンピュータ可読媒体と当然のことながら呼ばれる。たとえば、命令が、ウェブサイト、サーバ、または他の遠隔ソースから、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して伝送される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、または赤外線、無線、マイクロ波などのワイヤレス技術は、媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的な媒体を含まないが、代わりに、非一時的な、有形の記憶媒体を対象とすることを理解されたい。本明細書において、ディスク(disk)およびディスク(disc)は、コンパクトディスク(CD)、レーザーディスク(登録商標)、光ディスク、デジタルバーサタイルディスク(DVD)、フロッピー(登録商標)ディスクおよびBlu−rayディスクを含み、この場合、ディスク(disk)は、通常、磁気的にデータを再生し、ディスク(disc)は、レーザーを用いてデータを光学的に再生する。上述したものの組合せも、コンピュータ可読媒体の範囲の中に含められるべきである。
[0122]命令は、1つまたは複数のデジタルシグナルプロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルロジックアレイ(FPGA)、または他の同等の統合された、もしくは個別の論理回路などの、1つまたは複数のプロセッサによって実行され得る。したがって、「プロセッサ」という用語は、本明細書において、前述の構造のうちの任意のものまたは本明細書に記載される技法の実施のために適当な任意の他の構造を参照し得る。加えて、いくつかの態様では、本明細書に記載される機能性は、符号化および復号のために構成され、または組み合わされたコーデックに組み込まれる、専用のハードウェア内および/またはソフトウェアモジュール内で提供され得る。また、この技法は、1つまたは複数の回路または論理要素で、完全に実施され得る。
[0123]本開示の技法は、ワイヤレスハンドセット、集積回路(IC)またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置に実装され得る。様々な構成要素、モジュール、またはユニットは、開示された技法を実行するように構成されるデバイスの機能上の態様を強調するために、本開示に記載されるが、必ずしも異なるハードウェアユニットによる実現を求めるとは限らない。むしろ、上述したように、様々なユニットは、コーデックハードウェアユニットの中で組み合わされ、または、上述される1つまたは複数のプロセッサを含む、適当なソフトウェアおよび/またはファームウェアと一緒に相互作用するハードウェアユニットが集まったものによって提供され得る。様々な例が、述べられた。これらおよび他の例は、以下の特許請求の範囲の範囲内にある。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1] ビデオ情報をコーディングするように構成される装置であって、
参照レイヤ、エンハンスメントレイヤ、またはそれらの両方と関連したビデオ情報を記憶するように構成されるメモリと、
前記メモリと通信するプロセッサと、前記プロセッサは、複数のレイヤ間フィルタと1つまたは複数の参照レイヤのピクチャとを使用して、複数のレイヤ間参照ピクチャを生成するように構成され、
を備える、装置。
[C2] 前記プロセッサは、前記複数のレイヤ間参照ピクチャを参照ピクチャリストに挿入するように、さらに構成される、C1に記載の装置。
[C3] 前記プロセッサは、前記参照ピクチャリストを使用して、前記エンハンスメントレイヤ内の現在のピクチャをコーディングするように、さらに構成される、C2に記載の装置。
[C4] 前記レイヤ間フィルタは、アップサンプリングフィルタを備える、C1に記載の装置。
[C5] 前記レイヤ間フィルタは、事前定義される、C1に記載の装置。
[C6] 前記レイヤ間フィルタは、シーケンスパラメータセットまたはビデオパラメータセットの中でシグナリングされる、C1に記載の装置。
[C7] 前記レイヤ間フィルタは、スライスヘッダの中でシグナリングされる、C1に記載の装置。
[C8] 前記レイヤ間フィルタは、少なくとも1つのデフォルトのレイヤ間フィルタと、シーケンスパラメータセット、ビデオパラメータセット、またはスライスヘッダの中で、シグナリングされる少なくとも1つの代替のレイヤ間フィルタとを備える、C1に記載の装置。
[C9] 前記プロセッサは、前記複数のレイヤ間参照ピクチャのうちのせいぜい1つが、現在のピクチャをコーディングするために使用されるように利用できるという制限を適用するように、さらに構成される、C1に記載の装置。
[C10] 前記レイヤ間フィルタは、1つまたは複数のデフォルトのレイヤ間フィルタと、1つまたは複数の代替のレイヤ間フィルタとを備え、
前記プロセッサは、前記1つまたは複数の代替のレイヤ間フィルタを使用して生成されるレイヤ間参照ピクチャをレイヤ間参照ピクチャセットに加える前に、前記1つまたは複数のデフォルトのレイヤ間フィルタを使用して生成されるレイヤ間参照ピクチャを前記レイヤ間参照ピクチャセットに加えるように、さらに構成される、C1に記載の装置。
[C11] 前記装置は、エンコーダを備え、前記プロセッサは、前記レイヤ間フィルタと関連したシンタックス要素を生成するように、さらに構成される、C1に記載の装置。
[C12] 前記装置は、デコーダを備え、前記プロセッサは、前記レイヤ間フィルタと関連したシンタックス要素を処理するように、さらに構成される、C1に記載の装置。
[C13] 前記装置が、前記メモリと前記プロセッサとを備える、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップコンピュータまたはデスクトップコンピュータ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、携帯電話または衛星無線電話、およびビデオ遠隔会議デバイス、ならびにそれらの組合せの中から選択された、少なくとも1つのメンバをさらに備える、C1に記載の装置。
[C14] ビデオ情報をコーディングする方法であって、
参照レイヤ、エンハンスメントレイヤ、またはそれらの両方と関連したビデオ情報を受信することと、
複数のレイヤ間フィルタと1つまたは複数の参照レイヤのピクチャとを使用して、複数のレイヤ間参照ピクチャを生成することと
を備える、方法。
[C15] 前記複数のレイヤ間参照ピクチャを参照ピクチャリストに挿入することをさらに備える、C14に記載の方法。
[C16] 前記参照ピクチャリストを使用して、前記エンハンスメントレイヤ内の現在のピクチャをコーディングすることをさらに備える、C15に記載の方法。
[C17] 前記レイヤ間フィルタは、アップサンプリングフィルタを備える、C14に記載の方法。
[C18] 前記レイヤ間フィルタのうちの少なくとも1つは、事前定義される、C14に記載の方法。
[C19] 前記レイヤ間フィルタは、シーケンスパラメータセットまたはビデオパラメータセットの中でシグナリングされる、C14に記載の方法。
[C20] 前記レイヤ間フィルタは、スライスヘッダの中でシグナリングされる、C14に記載の方法。
[C21] 前記レイヤ間フィルタは、少なくとも1つのデフォルトのレイヤ間フィルタと、シーケンスパラメータセット、ビデオパラメータセット、またはスライスヘッダの中でシグナリングされる少なくとも1つの代替のレイヤ間フィルタとを備える、C14に記載の方法。
[C22] 前記複数のレイヤ間参照ピクチャのうちのせいぜい1つが、現在のピクチャをコーディングするために使用されるように利用できるという制限を適用することを、さらに備える、C14に記載の方法。
[C23] 前記レイヤ間フィルタは、1つまたは複数のデフォルトのレイヤ間フィルタと、1つまたは複数の代替のレイヤ間フィルタとを備え、前記方法は、前記1つまたは複数の代替のレイヤ間フィルタを使用して生成されるレイヤ間参照ピクチャをレイヤ間参照ピクチャセットに加える前に、前記1つまたは複数のデフォルトのレイヤ間フィルタを使用して生成されるレイヤ間参照ピクチャを前記レイヤ間参照ピクチャセットに加えることを、さらに備える、C14に記載の方法。
[C24] 前記レイヤ間フィルタは、1つまたは複数のデフォルトのレイヤ間フィルタと、1つまたは複数の代替のレイヤ間フィルタとを備え、前記方法は、前記1つまたは複数のデフォルトのレイヤ間フィルタか、それとも前記1つまたは複数の代替のレイヤ間フィルタが、前記複数のレイヤ間参照ピクチャを生成するために使用されるかどうかを示すフラグを受信することを、さらに備える、C14に記載の方法。
[C25] コーディングすることは、符号化することを備え、前記方法は、前記レイヤ間フィルタと関連したシンタックス要素を生成することを、さらに備える、C14に記載の方法。
[C26] コーディングすることは、復号することを備え、前記方法は、前記レイヤ間フィルタと関連したシンタックス要素を処理することを、さらに備える、C14に記載の方法。
[C27] 参照レイヤ、エンハンスメントレイヤ、またはそれらの両方と関連したビデオ情報を受信するための手段と、
複数のレイヤ間フィルタと1つまたは複数の参照レイヤのピクチャとを使用して、複数のレイヤ間参照ピクチャを生成するための手段と
を備える、ビデオコーディング装置。
[C28] 前記レイヤ間フィルタは、少なくとも1つのデフォルトのレイヤ間フィルタと、シーケンスパラメータセット、ビデオパラメータセット、またはスライスヘッダの中でシグナリングされる少なくとも1つの代替のレイヤ間フィルタとを備える、C27に記載のビデオコーディング装置。
[C29] 実行されるとき、装置に、
参照レイヤ、エンハンスメントレイヤ、またはそれらの両方と関連したビデオ情報を受信することと、
複数のレイヤ間フィルタと1つまたは複数の参照レイヤのピクチャとを使用して、複数のレイヤ間参照ピクチャを生成することと、
を行わせるコードをそこに記憶した、非一時的なコンピュータ可読媒体。
[C30] 前記レイヤ間フィルタは、少なくとも1つのデフォルトのレイヤ間フィルタと、シーケンスパラメータセット、ビデオパラメータセット、またはスライスヘッダの中でシグナリングされる少なくとも1つの代替のレイヤ間フィルタとを備える、C29に記載の非一時的なコンピュータ可読媒体。

Claims (14)

  1. ビデオ情報を復号する方法であって、
    参照レイヤ(RL)およびエンハンスメントレイヤ(EL)と関連したビデオ情報を受信することと、前記RLは、RLピクチャを含み、前記ELは、前記RLピクチャに対応する現在のピクチャを含み、
    前記RLピクチャ上に複数の対応するレイヤ間フィルタを適用することによって、前記RLピクチャに基づいて複数のレイヤ間参照ピクチャを生成することと、前記複数の対応するレイヤ間フィルタは、異なる周波数応答を提供するように設計され、
    前記現在のピクチャと関連した参照ピクチャリストに、前記RLピクチャに基づいて生成された前記複数のレイヤ間参照ピクチャを追加することと、
    前記現在のピクチャを復号することと
    を備え、前記現在のピクチャを前記復号することは、
    前記現在のピクチャのビデオブロックに対する動きベクトルを決定することと、前記動きベクトルは、前記参照ピクチャリスト内のレイヤ間参照ピクチャを示し、
    前記参照ピクチャリスト内の前記示されたレイヤ間参照ピクチャおよび前記動きベクトルに基づいて前記現在のピクチャの復号されたビデオブロックを決定することと
    を備え、前記方法は、前記複数のレイヤ間参照ピクチャのうちのせいぜい1つが、現在のピクチャをコーディングするために使用されるように利用できるという制限を適用することを、さらに備える、方法。
  2. 前記レイヤ間フィルタは、
    (i)より低い周波数に対して周波数応答を提供するように構成された第1のレイヤ間フィルタと、
    (ii)より高い周波数に対して周波数応答を提供するように構成された第2のレイヤ間フィルタと
    を備える、請求項1に記載の方法。
  3. 前記レイヤ間フィルタは、アップサンプリングフィルタを備える、請求項1に記載の方法。
  4. 前記レイヤ間フィルタのうちの少なくとも1つは、事前定義される、請求項1に記載の方法。
  5. 前記レイヤ間フィルタは、シーケンスパラメータセットまたはビデオパラメータセットの中でシグナリングされる、請求項1に記載の方法。
  6. 前記レイヤ間フィルタは、スライスヘッダの中でシグナリングされる、請求項1に記載の方法。
  7. 前記レイヤ間フィルタは、少なくとも1つのデフォルトのレイヤ間フィルタと、シーケンスパラメータセット、ビデオパラメータセット、またはスライスヘッダの中でシグナリングされる少なくとも1つの代替のレイヤ間フィルタとを備える、請求項1に記載の方法。
  8. 前記レイヤ間フィルタは、1つまたは複数のデフォルトのレイヤ間フィルタと、1つまたは複数の代替のレイヤ間フィルタとを備え、前記方法は、前記1つまたは複数の代替のレイヤ間フィルタを使用して生成されるレイヤ間参照ピクチャをレイヤ間参照ピクチャセットに加える前に、前記1つまたは複数のデフォルトのレイヤ間フィルタを使用して生成されるレイヤ間参照ピクチャを前記レイヤ間参照ピクチャセットに加えることを、さらに備える、請求項1に記載の方法。
  9. ビデオ情報を復号する方法であって、
    参照レイヤ(RL)およびエンハンスメントレイヤ(EL)と関連したビデオ情報を受信することと、前記RLは、RLピクチャを含み、前記ELは、前記RLピクチャに対応する現在のピクチャを含み、
    前記RLピクチャ上に複数の対応するレイヤ間フィルタを適用することによって、前記RLピクチャに基づいて複数のレイヤ間参照ピクチャを生成することと、前記複数の対応するレイヤ間フィルタは、異なる周波数応答を提供するように設計され、
    前記現在のピクチャと関連した参照ピクチャリストに、前記RLピクチャに基づいて生成された前記複数のレイヤ間参照ピクチャを追加することと、
    前記現在のピクチャを復号することと
    を備え、前記現在のピクチャを前記復号することは、
    前記現在のピクチャのビデオブロックに対する動きベクトルを決定することと、前記動きベクトルは、前記参照ピクチャリスト内のレイヤ間参照ピクチャを示し、
    前記参照ピクチャリスト内の前記示されたレイヤ間参照ピクチャおよび前記動きベクトルに基づいて前記現在のピクチャの復号されたビデオブロックを決定することと
    を備え、
    前記レイヤ間フィルタは、1つまたは複数のデフォルトのレイヤ間フィルタと、1つまたは複数の代替のレイヤ間フィルタとを備え、前記方法は、前記1つまたは複数のデフォルトのレイヤ間フィルタか、それとも前記1つまたは複数の代替のレイヤ間フィルタが、前記複数のレイヤ間参照ピクチャを生成するために使用されるかどうかを示すフラグを受信することを、さらに備える、方法。
  10. 前記方法は、ビットストリーム内で前記レイヤ間フィルタと関連したシンタックス要素を処理することを、さらに備える、請求項1に記載の方法。
  11. ビデオ復号装置であって、
    参照レイヤ(RL)およびエンハンスメントレイヤ(EL)と関連したビデオ情報を受信するための手段と、前記RLは、RLピクチャを含み、前記ELは、前記RLピクチャに対応する現在のピクチャを含み、
    前記RLピクチャ上に複数の対応するレイヤ間フィルタを適用することによって、前記RLピクチャに基づいて複数のレイヤ間参照ピクチャを生成するための手段と、前記複数の対応するレイヤ間フィルタは、異なる周波数応答を提供するように設計され、
    前記現在のピクチャと関連した参照ピクチャリストに、前記RLピクチャに基づいて生成された前記複数のレイヤ間参照ピクチャを追加するための手段と、
    前記現在のピクチャを復号するための手段と
    を備え、前記現在のピクチャを前記復号するための手段は、
    前記現在のピクチャのビデオブロックに対する動きベクトルを決定するための手段と、前記動きベクトルは、前記参照ピクチャリスト内のレイヤ間参照ピクチャを示し、
    前記参照ピクチャリスト内の前記示されたレイヤ間参照ピクチャおよび前記動きベクトルに基づいて前記現在のピクチャの復号されたビデオブロックを決定するための手段と
    を備え、前記装置は、前記複数のレイヤ間参照ピクチャのうちのせいぜい1つが、現在のピクチャをコーディングするために使用されるように利用できるという制限を適用するための手段を、さらに備える、ビデオ復号装置。
  12. 前記レイヤ間フィルタは、
    (i)より低い周波数に対して周波数応答を提供するように構成された第1のレイヤ間フィルタと、
    (ii)より高い周波数に対して周波数応答を提供するように構成された第2のレイヤ間フィルタと
    を備える、請求項11に記載のビデオ復号装置。
  13. 前記レイヤ間フィルタは、少なくとも1つのデフォルトのレイヤ間フィルタと、シーケンスパラメータセット、ビデオパラメータセット、またはスライスヘッダの中でシグナリングされる少なくとも1つの代替のレイヤ間フィルタとを備える、請求項11に記載のビデオ復号装置。
  14. 実行されるとき、装置に、請求項1乃至10のうちのいずれか一項に従った方法を実施させるコードをそこに記憶した、非一時的なコンピュータ可読媒体。
JP2016506616A 2013-04-04 2014-04-03 Shvcのための複数のベースレイヤ参照ピクチャ Expired - Fee Related JP6352391B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361808590P 2013-04-04 2013-04-04
US61/808,590 2013-04-04
US14/243,310 US9648353B2 (en) 2013-04-04 2014-04-02 Multiple base layer reference pictures for SHVC
US14/243,310 2014-04-02
PCT/US2014/032820 WO2014165671A2 (en) 2013-04-04 2014-04-03 Multiple base layer reference pictures for shvc

Publications (3)

Publication Number Publication Date
JP2016518769A JP2016518769A (ja) 2016-06-23
JP2016518769A5 JP2016518769A5 (ja) 2017-04-06
JP6352391B2 true JP6352391B2 (ja) 2018-07-04

Family

ID=51654442

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016506616A Expired - Fee Related JP6352391B2 (ja) 2013-04-04 2014-04-03 Shvcのための複数のベースレイヤ参照ピクチャ

Country Status (6)

Country Link
US (1) US9648353B2 (ja)
EP (1) EP2982109A2 (ja)
JP (1) JP6352391B2 (ja)
KR (1) KR20150138308A (ja)
CN (1) CN105052139B (ja)
WO (1) WO2014165671A2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110035286B (zh) * 2012-07-09 2021-11-12 Vid拓展公司 用于多层视频编码的编解码器架构
JP2014082541A (ja) * 2012-10-12 2014-05-08 National Institute Of Information & Communication Technology 互いに類似した情報を含む複数画像のデータサイズを低減する方法、プログラムおよび装置
US9510001B2 (en) * 2013-07-09 2016-11-29 Electronics And Telecommunications Research Institute Video decoding method and apparatus using the same
KR20150075041A (ko) 2013-12-24 2015-07-02 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
WO2015147427A1 (ko) * 2014-03-24 2015-10-01 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
US9591254B2 (en) * 2015-03-26 2017-03-07 Qualcomm Incorporated Device and method for processing video data
CN104954785A (zh) * 2015-06-16 2015-09-30 哈尔滨工业大学 一种用于可伸缩视频编码的分层式模式决策方法
US10440401B2 (en) 2016-04-07 2019-10-08 Dolby Laboratories Licensing Corporation Backward-compatible HDR codecs with temporal scalability
CN111770332B (zh) * 2020-06-04 2022-08-09 Oppo广东移动通信有限公司 插帧处理方法、插帧处理装置、存储介质与电子设备

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7227901B2 (en) * 2002-11-21 2007-06-05 Ub Video Inc. Low-complexity deblocking filter
US7876833B2 (en) 2005-04-11 2011-01-25 Sharp Laboratories Of America, Inc. Method and apparatus for adaptive up-scaling for spatially scalable coding
US8208564B2 (en) * 2005-06-24 2012-06-26 Ntt Docomo, Inc. Method and apparatus for video encoding and decoding using adaptive interpolation
CN1859576A (zh) * 2005-10-11 2006-11-08 华为技术有限公司 对空间分层编码视频图象的上采样方法及其系统
US8120660B2 (en) * 2006-07-10 2012-02-21 Freescale Semiconductor, Inc. Image data up sampling
US9014280B2 (en) * 2006-10-13 2015-04-21 Qualcomm Incorporated Video coding with adaptive filtering for motion compensated prediction
CN101321284B (zh) * 2007-06-10 2012-01-04 华为技术有限公司 一种编解码方法、设备及系统
US20100232520A1 (en) * 2007-11-05 2010-09-16 Zhenyu Wu Scalable video coding method for fast channel change and increased error relilience
CN102106156B (zh) * 2008-07-26 2013-06-19 汤姆逊许可证公司 使用可分级视频编码(svc)的用于快速信道改变的实时传输协议(rtp)打包方法
US9078007B2 (en) * 2008-10-03 2015-07-07 Qualcomm Incorporated Digital video coding with interpolation filters and offsets
TW201032597A (en) * 2009-01-28 2010-09-01 Nokia Corp Method and apparatus for video coding and decoding
US9270871B2 (en) 2009-04-20 2016-02-23 Dolby Laboratories Licensing Corporation Optimized filter selection for reference picture processing
CN101674475B (zh) * 2009-05-12 2011-06-22 北京合讯数通科技有限公司 一种h.264/svc的自适应层间纹理预测方法
EP2262267A1 (en) * 2009-06-10 2010-12-15 Panasonic Corporation Filter coefficient coding scheme for video coding
IT1398195B1 (it) * 2009-06-25 2013-02-14 St Microelectronics Srl "procedimento e sistema per la distribuzione di contenuti informativi, relativo prodotto informatico"
CN102714727B (zh) * 2010-01-14 2016-09-28 杜比实验室特许公司 缓冲的自适应滤波器
US20130142251A1 (en) * 2011-12-06 2013-06-06 Sony Corporation Syntax extension of adaptive loop filter in hevc
PL2822276T3 (pl) * 2012-02-29 2019-04-30 Lg Electronics Inc Sposób predykcji międzywarstwowej i stosujące go urządzenie
US10136144B2 (en) * 2012-05-21 2018-11-20 Mediatek Singapore Pte. Ltd. Method and apparatus of inter-layer filtering for scalable video coding
WO2014008402A1 (en) * 2012-07-05 2014-01-09 Vid Scale, Inc. Layer dependency and priority signaling design for scalable video coding
TWI625052B (zh) * 2012-08-16 2018-05-21 Vid衡器股份有限公司 多層視訊編碼以片段為基礎之跨越模式傳訊
US20140086328A1 (en) 2012-09-25 2014-03-27 Qualcomm Incorporated Scalable video coding in hevc
US9491461B2 (en) 2012-09-27 2016-11-08 Qualcomm Incorporated Scalable extensions to HEVC and temporal motion vector prediction
US20140085415A1 (en) * 2012-09-27 2014-03-27 Nokia Corporation Method and apparatus for video coding
WO2014052740A1 (en) * 2012-09-28 2014-04-03 Vid Scale, Inc. Adaptive upsampling for multi-layer video coding
EP3661215A1 (en) 2012-09-28 2020-06-03 Vid Scale, Inc. Cross-plane filtering for chroma signal enhancement in video coding
US9648318B2 (en) 2012-09-30 2017-05-09 Qualcomm Incorporated Performing residual prediction in video coding
US9674519B2 (en) 2012-11-09 2017-06-06 Qualcomm Incorporated MPEG frame compatible video coding

Also Published As

Publication number Publication date
US20140301457A1 (en) 2014-10-09
CN105052139B (zh) 2018-06-26
WO2014165671A3 (en) 2015-01-08
JP2016518769A (ja) 2016-06-23
US9648353B2 (en) 2017-05-09
CN105052139A (zh) 2015-11-11
WO2014165671A2 (en) 2014-10-09
KR20150138308A (ko) 2015-12-09
EP2982109A2 (en) 2016-02-10

Similar Documents

Publication Publication Date Title
JP6285024B2 (ja) マルチレイヤビデオコーディングのためのレイヤ間予測シグナリングに対する最適化
CN113612997B (zh) 针对视频译码使用与位置相关的预测组合的改进视频帧内预测
JP6352314B2 (ja) 異なるアスペクト比を伴う空間スケーラビリティのためのレイヤ間の参照ピクチャの構築
JP6297670B2 (ja) ハイレベルシンタックスのみのスケーラブルビデオコーディングのための、レイヤ間参照ピクチャ制限
JP6129969B2 (ja) スケーラブルビデオコード化における代替変換
JP6352390B2 (ja) 高レベルシンタックス専用shvcにおける一般化残差予測ならびにそのシグナリングおよび管理
JP6352391B2 (ja) Shvcのための複数のベースレイヤ参照ピクチャ
JP6293756B2 (ja) スケーラブルビデオ符号化における変換基準の調整
JP6716253B2 (ja) ビデオコーディングにおけるhevc拡張用の多重レイヤの低複雑度サポート
JP2017525231A (ja) ビットストリームパーティションのためのhrdパラメータを信号伝達すること
JP2017523685A (ja) イントラブロックコピーイングのためのブロックベクトルコーディング
JP6199371B2 (ja) ビデオ・コーディングのためのインタ・レイヤ・テクスチャ予測
JP6495268B2 (ja) パラメータセット内のビューidビット深度のシグナリング
JP2016518776A (ja) アラインされていないirapピクチャを含み得るマルチレイヤビットストリームのクロスレイヤpocアラインメント
JP2016518764A (ja) マルチレイヤビデオコーディングにおけるクロスレイヤ位置合わせ
JP2016509436A (ja) レイヤ間シンタックス予測制御
JP6466349B2 (ja) スケーラブルビデオコーディングのための空間動きベクトルスケーリング
JP6479776B2 (ja) リサンプリングプロセスにおける中間データのダイナミックレンジ制御
JP2017514353A (ja) メッシュベースの計算を使用した低複雑な順変換のためのシステムおよび方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170306

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180508

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180606

R150 Certificate of patent or registration of utility model

Ref document number: 6352391

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees