JP6342402B2 - スケーラブルビデオコード化におけるダウンサンプリング位相情報の信号伝達 - Google Patents

スケーラブルビデオコード化におけるダウンサンプリング位相情報の信号伝達 Download PDF

Info

Publication number
JP6342402B2
JP6342402B2 JP2015530151A JP2015530151A JP6342402B2 JP 6342402 B2 JP6342402 B2 JP 6342402B2 JP 2015530151 A JP2015530151 A JP 2015530151A JP 2015530151 A JP2015530151 A JP 2015530151A JP 6342402 B2 JP6342402 B2 JP 6342402B2
Authority
JP
Japan
Prior art keywords
phase
layer
information
video
phase shift
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015530151A
Other languages
English (en)
Other versions
JP2015527028A (ja
Inventor
チェン、ジャンレ
グオ、リウェイ
リ、シャン
カークゼウィックズ、マルタ
プ、ウェイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2015527028A publication Critical patent/JP2015527028A/ja
Application granted granted Critical
Publication of JP6342402B2 publication Critical patent/JP6342402B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

[0001]本開示は、ビデオコンテンツの符号化と復号とを含むビデオコード化に関し、より具体的には、イントラ予測とインター予測とに関する。
[0002]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップ又はデスクトップコンピュータ、デジタルカメラ、デジタル記録機器、デジタルメディアプレーヤ、ビデオゲーム機器、ビデオゲームコンソール、セルラー電話又は衛星無線電話、ビデオ遠隔会議機器などを含む、広範囲にわたる機器に組み込まれ得る。デジタルビデオ機器は、デジタルビデオ情報をより効率的に送信、受信及び記憶するための、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4,Part 10,Advanced Video Coding(AVC)によって定義された規格、現在開発中のHigh Efficiency Video Coding(HEVC)規格、及びそのような規格の拡張に記載されているビデオ圧縮技法のような、ビデオ圧縮技法を実装し得る。
[0003]ビデオコード化技法は、ビデオシーケンスに固有の冗長性を低減又は除去するために、空間的(イントラピクチャ)予測及び/又は時間的(インターピクチャ)予測を含む。ブロックベースのビデオコード化では、ビデオスライス(例えば、ビデオフレーム又はビデオフレームの一部分)が、ツリーブロック、コード化単位(CU:coding unit)及び/又はコード化ノードと呼ばれることもある、ビデオブロックに区分され得る。High Efficiency Video Coding(HVEC)は、コード化単位(CU)、予測単位(PU)、及び変換単位(TU)という3つのブロック概念を含む情報のユニット表現を含む。ピクチャのイントラコード化された(I)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化された(P又はB)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測、又は他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームに言及されることがある。
[0004]空間的予測又は時間的予測は、コード化されるべきブロックの予測ブロックをもたらす。残差データは、コード化されるべき元のブロックと予測ブロックとの間の画素差分を表す。インターコード化されたブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、及びコード化されたブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコード化されたブロックは、イントラコード化モード及び残差データに従って符号化される。更なる圧縮のために、残差データは、画素領域から変換領域に変換されて残差変換係数をもたらすことができ、その残差変換係数は、次いで量子化され得る。最初は2次元アレイで構成される、量子化された変換係数は、変換係数の1次元ベクトルを生成するために走査されてよく、なお一層の圧縮を達成するために、エントロピーコード化が適用されてよい。
[0005]本開示を要約する目的で、幾つかの態様、利点及び新規の特徴が、本明細書で説明されている。必ずしも全てのそのような利点が本明細書で開示される任意の特定の実施形態に従って達成され得るとは限らないことを理解されたい。従って、本明細書で開示される特徴は、必ずしも、本明細書で教示されるか、又は示唆され得る他の利点を必ずしも達成することなく、本明細書で教示される1つの利点又は利点のグループを達成し、又は最適化する方式で、具現化又は実行され得る。
[0006]幾つかの実施形態によれば、ビデオ情報をコード化するための機器は、プロセッサとメモリとを含む。メモリは、ビデオデータを記憶するように構成されてよく、ビデオデータは、ビデオ情報の第1のレイヤを備えてよい。プロセッサは、第1のレイヤに対するビデオ情報の第2のレイヤの位相変位情報を決定し、位相変位情報に少なくとも一部に基づいて画像フィルタセットを選択し、第1のレイヤと特定された画像フィルタセットとを使用して第1のレイヤの修正されたバージョンを生成するように構成され得る。
[0007]前の段落のビデオ情報をコード化するための機器は、次の特徴の1つ又は複数を含み得る。即ち、第1のレイヤはベースレイヤを備えてよく、第2のレイヤは拡張レイヤを備えてよく、選択された画像フィルタセットはアップサンプリング画像フィルタを備えてよく、プロセッサは更に、位相変位情報を信号伝達する符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取るように構成されてよい。代替的に、第1のレイヤは拡張レイヤを備えてよく、第2のレイヤはベースレイヤを備えてよく、選択された画像フィルタセットはダウンサンプリング画像フィルタを備えてよく、プロセッサは更に、符号化されたビデオビットストリームに対するシンタクス要素を生成して、位相変位情報を信号伝達するように構成されてよい。
[0008]位相変位情報は、第1のレイヤにおける画素の位置と第2のレイヤにおける画素の対応する位置との差を備え得る。位相変位情報は、第1のレイヤと第2のレイヤとの間の、0位相の関係又は対称的な位相の関係のいずれか1つを示す、バイナリ値を備え得る。位相変位情報は、水平方向の位相変位情報を示すための第1のシンタクス要素と、垂直方向の位相変位情報を示すための第2のシンタクス要素とを備え得る。加えて、第1のシンタクス要素及び第2のシンタクス要素の少なくとも1つは、非バイナリ値を備え得る。プロセッサは更に、位相変位情報がビットストリームの中で信号伝達されない場合、デフォルトの画像フィルタセットを選択し、位相変位情報がビットストリームの中で信号伝達される場合、位相変位情報に基づいて画像フィルタセットを選択するように構成され得る。デフォルトの画像フィルタセットは、第1のレイヤと第2のレイヤとの間の対称的な位相の関係に少なくとも一部基づき得る。代替的に、デフォルトの画像フィルタセットは、第1のレイヤと第2のレイヤとの間の0位相の関係に少なくとも一部基づき得る。位相変位情報は、整列情報を備え得る。例えば、整列情報は、x画素座標とy画素座標とを位相オフセットにマッピングする関数としてモデル化され得る。位相変位情報は、クロマ位相変位情報を示すビデオパラメータセット(VPS)シンタクス要素を備え得る。選択された画像フィルタセットは、ビットストリームの一部として信号伝達される係数を備え得る。機器は更に、メモリとプロセッサとを備える、デスクトップコンピュータ、ノートブックコンピュータ、タブレットコンピュータ、セットトップボックス、電話ハンドセット、テレビジョン、カメラ、表示装置、デジタルメディアプレーヤ、ビデオゲームコンソール、及びビデオストリーミング機器の少なくとも1つを備え得る。
[0009]選択された画像フィルタセットは、0という位相シフトに対して係数{0,0,0,64,0,0,0,0}、1という位相シフトに対して{0,1,−3,63,4,−2,1,0}、2という位相シフトに対して{0,2,−6,61,9,−3,1,0}、3という位相シフトに対して{−1,3,−8,60,13,−4,1,0}、4という位相シフトに対して{−1,4,−10,58,17,−5,1,0}、5という位相シフトに対して{−1,4,−11,53,25,−8,3,−1}、6という位相シフトに対して{−1,4,−11,50,29,−9,3,−1}、7という位相シフトに対して{−1,4,−11,45,34,−10,4,−1}、8という位相シフトに対して{−1,4,−11,40,40,−11,4,−1}、9という位相シフトに対して{−1,4,−10,34,45,−11,4,−1}、10という位相シフトに対して{−1,3,−9,29,50,−11,4,−1}、11という位相シフトに対して{−1,3,−8,25,53,−11,4,−1}、12という位相シフトに対して{0,1,−5,17,58,−10,4,−1}、13という位相シフトに対して{0,1,−4,13,60,−8,3,−1}、14という位相シフトに対して{0,1,−3,8,62,−6,2,0}、15という位相シフトに対して{0,1,−2,4,63,−3,1,0}を備え得る。選択された画像フィルタセットは、0という位相シフトに対して係数{0,64,0,0}、1という位相シフトに対して{−2,62,4,0}、2という位相シフトに対して{−2,58,10,−2}、3という位相シフトに対して{−4,56,14,−2}、4という位相シフトに対して{−4,54,16,−2}、5という位相シフトに対して{−6,52,20,−2}、6という位相シフトに対して{−6,48,26,−4}、7という位相シフトに対して{−4,42,30,−4}、8という位相シフトに対して{−4,36,36,−4}、9という位相シフトに対して{−4,30,42,−4}、10という位相シフトに対して{−4,26,48,−6}、11という位相シフトに対して{−2,20,52,−6}、12という位相シフトに対して{−2,16,54,−4}、13という位相シフトに対して{−2,14,56,−4}、14という位相シフトに対して{−2,10,58,−2}、15という位相シフトに対して{0,4,62,−2}を備え得る。
[0010]幾つかの実施形態によれば、ビデオ情報を復号する方法は、ビデオ情報のベースレイヤを取得することと、符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取ることと、シンタクス要素が拡張レイヤに対するビデオ情報のベースレイヤの位相変位情報を備える、位相変位情報の少なくとも一部に基づいて画像フィルタセットを選択することと、ベースレイヤと特定された画像フィルタセットとを使用して拡張レイヤ(enhancement layer)のアップサンプリングされたバージョンを生成することとを含み得る。
[0011]幾つかの実施形態によれば、ビデオ情報を符号化する方法は、ビデオ情報の拡張レイヤを取得することと、ダウンサンプリング画像フィルタセットを選択することと、拡張レイヤと選択された画像フィルタセットとを使用してベースレイヤを生成することと、拡張レイヤに対するベースレイヤの位相変位情報を備えるシンタクス要素を生成することとを含み得る。
[0012]幾つかの実施形態によれば、ビデオビットストリームをコード化するための装置は、ビデオ情報の拡張レイヤを取得するための手段と、拡張レイヤに対するビデオ情報のベースレイヤの位相変位情報を備えるシンタクス要素を生成するための手段と、位相変位情報に少なくとも一部に基づいて画像フィルタセットを選択するための手段と、拡張レイヤと特定された画像フィルタセットとを使用して拡張レイヤのダウンサンプリングされたバージョンを生成するための手段と、拡張レイヤのダウンサンプリングされたバージョンを記憶するための手段とを含み得る。
[0013]幾つかの実施形態によれば、非一時的コンピュータ可読媒体は、プロセッサによって実行されると、プロセッサに、ビデオ情報のベースレイヤを取得させ、符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取らせ、このとき、シンタクス要素が拡張レイヤに対するビデオ情報のベースレイヤの位相変位情報を備え、位相変位報の少なくとも一部に基づいて画像フィルタセットを選択させ、拡張レイヤと特定された画像フィルタセットとを使用して拡張レイヤのアップサンプリングされたバージョンを生成させる、命令を記憶していてよい。
[0014]本開示の技法を利用し得る、例示的なビデオコード化システムを示すブロック図。 [0015]本開示の技法を実装するように構成され得る、例示的なビデオエンコーダを示すブロック図。 [0016]本開示の技法を実装するように構成され得る、例示的なビデオデコーダを示すブロック図。 [0017]3つの異なる次元におけるスケーラビリティを示すグラフ。 [0018]SVCビットストリームの例示的な構造の概略を示す図。 [0019]ビットストリーム中のSVCアクセス単位の例の概略を示す図。 [0020]イントラBLモード予測の例の概略を示す図。 [0021]元のビデオ及び2倍ダウンサンプリングされたビデオの相対的なルーマサンプリンググリッドを示す図。 [0022]元のビデオ及び1.5倍ダウンサンプリングされたビデオの相対的なルーマサンプリンググリッドを示す図。 [0023]ビデオ情報をコード化するための処理700の実施形態を示すフローチャート。 [0024]画素情報の不整列の例の概略を示す図。 [0025]画素情報の不整列の例の別の概略を示す図。 [0026]クロマサンプル位置の例の概略を示す図。
[0027]スケーラブルビデオコード化(SVC)は、参照レイヤと呼ばれることもあるベースレイヤと1つ又は複数のスケーラブル拡張レイヤとが使用される、ビデオコード化を指す。SVCでは、ベースレイヤは、基本レベルの品質でビデオデータを搬送することができる。1つ又は複数の拡張レイヤは追加のビデオデータを搬送して、より高い空間レベル、時間レベル及び/又は信号対雑音SNRレベルをサポートすることができる。拡張レイヤは、以前符号化されたレイヤに対して定義され得る。
[0024]ベースレイヤ及び拡張レイヤは、異なる解像度を有し得る。例えば、リサンプルフィルタリングと呼ばれることもあるアップサンプルフィルタリングが、拡張レイヤの空間アスペクト比と一致させるために、ベースレイヤに適用され得る。この処理は、空間スケーラビリティと呼ばれ得る。アップサンプリングフィルタセットがベースレイヤに適用されてよく、1つのフィルタが位相(分数画素シフトと呼ばれることもある)に基づいてセットから選ばれてよい。位相は、ベースレイヤピクチャと拡張レイヤピクチャとの間の空間アスペクト比に基づいて計算され得る。
[0028]幾つかのシステムでは、単一の固定されたアップサンプリングフィルタセットが、レイヤ間予測のためのスケーリングされたコンテンツを生成するために、ベースレイヤに適用される。固定されたアップサンプリングは、全てのレイヤ間予測のタイプに対しては十分効率的ではないことがある。例えば、幾つかのシステムでは、アップサンプリングフィルタにおいて使用される位相及び参照画素は、空間スケーラブル比のみによって決定され、このことは、ダウンサンプリング処理において生成されるベースレイヤが常に同じ位相であると仮定する。残念ながら、そのようなシステムは、ベースレイヤをアップサンプリングするときの柔軟性の欠如に悩まされる。加えて、幾つかのシステムでは、ダウンサンプリングフィルタ(例えば、ダウンサンプリング位置)の位相は、ビットストリームで信号伝達されない。そのようなシステムでは、ダウンサンプリングが正確な位相(例えば、アップサンプリングの位相と一致する位相)で実行されたと仮定される。アップサンプリングとダウンサンプリングの間に位相の不一致がある場合、20%又はそれを超えるコード化効率の損失があり得る。
[0029]本開示の幾つかの実施形態では、本開示の技法は、アップサンプリングビデオデータ及びダウンサンプリングビデオデータにおける柔軟性と性能とを向上させる。アップサンプリング処理及びダウンサンプリング処理は、有利には、例えば、拡張レイヤのような第1のレイヤに対する、ダウンサンプリングされたベースレイヤのようなビデオ情報の第2のレイヤの位相変位情報に少なくとも一部に基づいて、ビデオデータをコード化するために使用されるフィルタを制御又は変更することによって、適応的な方式で実行され得る。位相変位情報は、シンタクス要素としてビデオビットストリームにおいて具現化され得る。従って、本明細書で説明される実施形態は、ダウンサンプリングフィルタのための位相情報を効率的に通信することができ、これによって、不正確な位相を有するダウンサンプリングフィルタが選択されるときに発生し得る、あらゆるコード化効率の損失を取り除く。
[0030]本明細書で説明される幾つかの実施形態は、HEVC(High Efficiency Video Coding)のような進化したビデオコーデックの文脈における、スケーラブルビデオコード化のためのレイヤ間予測に関する。より具体的には、本開示は、HEVCのスケーラブルビデオコード化(SVC)拡張(scalable video coding (SVC) extension)におけるレイヤ間予測の性能の改善のための、システムと方法とに関する。下の説明では、幾つかの実施形態に関するH.264/AVC技法が説明される。HEVC規格及び関連する技法も論じられる。本明細書では幾つかの実施形態がHEVC及び/又はH.264規格の文脈で説明されるが、当業者は、本明細書で開示されるシステム及び方法は、任意の適切なビデオコード化規格に適用可能であり得ることを理解し得る。例えば、本明細書で開示される実施形態は、次の規格、即ち、ITU−T H.261、ISO/IEC MPEG−1 Visual、ITU−T H.262又はISO/IEC MPEG−2 Visual、ITU−T H.263、ISO/IEC MPEG−4 Visual、及び、スケーラブルビデオコード化(SVC)拡張とマルチビュービデオコード化(MVC)拡張(Multiview Video Coding (MVC) extension)とを含む(ISO/IEC MPEG−4 AVCとしても知られる)ITU−T H.264の1つ又は複数に適用可能であり得る。
[0031]SVC拡張は、ビデオ情報の複数のレイヤを含み得る。例えば、最下位のレイヤはベースレイヤ(BL)として機能することができ、一方、最上位のレイヤは拡張されたレイヤ(enhanced layer)(EL)として機能することができる。「拡張されたレイヤ」という用語は、その広範及び通常の意味に従って本明細書で使用され、「拡張レイヤ」という用語と交換可能に使用され得る。中間のレイヤは、EL又は参照レイヤ(RL)のいずれかとして、又は両方として機能し得る。例えば、中間にあるレイヤは、ベースレイヤ又は任意の介在する拡張レイヤのような、その下のレイヤのためのELであってよく、同時にその上の1つ又は複数の拡張レイヤのためのRLとして機能してよい。
[0032]説明のみのために、本明細書で開示される幾つかの実施形態は、2つだけのレイヤ(例えば、ベースレイヤのような下位のレベルのレイヤと、拡張されたレイヤのような上位のレベルのレイヤ)を含む例により説明される。そのような例は、複数のベースレイヤ及び/又は拡張レイヤを含む構成に適用可能であり得ることを理解されたい。加えて、説明の容易さのために、以下の開示は、幾つかの実施形態に関して「フレーム」又は「ブロック」という用語を含む。しかしながら、これらの用語は限定的であることを意図されない。例えば、下で説明される技法は、ブロック(例えば、CU、PU、TU、マクロブロックなど)、スライス、フレームなどのような、任意の適切なビデオ単位とともに使用され得る。
[0033]HEVCは一般に、多くの面で、以前のビデオコード化規格の枠組みに従う。HEVCにおける予測の単位は、以前のビデオコード化規格におけるそれ(例えば、マク6ロブロック)とは異なる。実際には、幾つかの以前のビデオコード化規格において理解されているような、マクロブロックという概念は、HEVCでは存在しない。マクロブロックは、4分木方式に基づく階層的な構造によって置き換えられ、これは、あり得る利点の中でもとりわけ、高い柔軟性を実現し得る。例えば、HEVC方式では、3つのタイプのブロック、例えば、コード化単位(CU)、予測単位(PU)、及び変換単位(TU)が定義される。CUは、領域分割の基本単位を指し得る。CUは、マクロブロックの概念と類似していると考えられ得るが、最大のサイズを制限せず、4つの等しいサイズのCUへの反復的な分割を可能にして、コンテンツの適応性を向上させることができる。PUは、インター/イントラ予測の基本単位であると考えられてよく、不規則な画像パターンを効率的にコード化するための、複数の任意の形状の区分を単一のPUの中に含み得る。TUは、変換の基本単位であると考えられ得る。TUは、PUとは独立に定義され得るが、そのサイズは、TUが属するCUに制限され得る。3つの異なる概念へのブロック構造のこの分離は、各々がその役割に従って最適化されることを可能にでき、これは、コード化効率の改善をもたらし得る。[0059]図1は、本開示の技法を利用することができる例示的なビデオコード化システム10を示すブロック図である。本明細書で使用され説明される場合、「ビデオコーダ」は総称的に、ビデオエンコーダとビデオデコーダの両方を指す。本開示では、「ビデオコード化」又は「コード化」という用語は総称的に、ビデオ符号化とビデオ復号とを指し得る。
[0034]図1に示されるように、ビデオコード化システム10は、発信源機器12と宛先機器14とを含む。発信源機器12は、符号化されたビデオデータを生成する。従って、発信源機器12はビデオ符号化機器と呼ばれ得る。宛先機器14は、発信源機器12によって生成された、符号化されたビデオデータを復号することができる。従って、宛先機器14はビデオ復号機器と呼ばれ得る。発信源機器12及び宛先機器14はビデオコード化機器の例であり得る。
[0035]発信源機器12及び宛先機器14は、デスクトップコンピュータ、モバイルコンピューティング機器、ノートブック(例えば、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、テレビジョン、カメラ、表示装置、デジタルメディアプレーヤ、ビデオゲームコンソール、車内コンピュータなどを含む、広範囲にわたる機器を備え得る。幾つかの例では、発信源機器12及び宛先機器14は、ワイヤレス通信のために装備され得る。
[0036]宛先機器14は、チャネル16を介して発信源機器12から符号化されたビデオデータを受信することができる。チャネル16は、発信源機器12から宛先機器14に符号化されたビデオデータを移動することが可能な、あるタイプの媒体又は機器を備え得る。一例では、チャネル16は、発信源機器12が符号化されたビデオデータを宛先機器14にリアルタイムで直接送信することを可能にする通信媒体を備え得る。この例では、発信源機器12は、ワイヤレス通信プロトコルのような通信規格に従って、符号化されたビデオデータを変調することができ、変調されたビデオデータを宛先機器14に送信することができる。通信媒体は、高周波(RF)スペクトル又は1つ又は複数の物理伝送線路のような、ワイヤレス通信媒体又は有線通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、又はインターネットなどのグローバルネットワークのような、パケットベースネットワークの一部を形成し得る。通信媒体は、発信源機器12から宛先機器14への通信を支援する、ルータ、スイッチ、基地局、又は他の機器を含み得る。
[0037]別の例では、チャネル16は、発信源機器12によって生成された符号化されたビデオデータを記憶する、記憶媒体に対応し得る。この例では、宛先機器14は、ディスクアクセス又はカードアクセスを介して、記憶媒体にアクセスすることができる。記憶媒体は、ブルーレイ(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、又は符号化されたビデオデータを記憶するための他の適切なデジタル記憶媒体など、種々のローカルにアクセスされるデータ記憶媒体を含み得る。更なる例では、チャネル16は、発信源機器12によって生成された符号化されたビデオを記憶する、ファイルサーバ又は別の中間記憶装置を含み得る。この例では、宛先機器14は、ストリーミング又はダウンロードを介して、ファイルサーバ又は他の中間記憶装置に記憶された、符号化されたビデオデータにアクセスすることができる。ファイルサーバは、符号化されたビデオデータを記憶することと、符号化されたビデオデータを宛先機器14に送信することとが可能な、あるタイプのサーバであり得る。例示的なファイルサーバには、(例えば、ウェブサイト用の)ウェブサーバ、ファイル転送プロトコル(FTP)サーバ、ネットワーク接続記憶(NAS)機器、及びローカルディスクドライブがある。宛先機器14は、インターネット接続を含む標準のデータ接続を通じて、符号化されたビデオデータにアクセスし得る。データ接続の例示的なタイプは、ファイルサーバに記憶された符号化されたビデオデータにアクセスするのに適切な、ワイヤレスチャネル(例えば、Wi−Fi接続)、有線接続(例えば、DSL、ケーブルモデムなど)、又は両方の組合せを含み得る。ファイルサーバからの符号化されたビデオデータの送信は、ストリーミング送信、ダウンロード送信、又はその両方の組合せであり得る。
[0038]本開示の技法は、ワイヤレスの用途又は設定には限定されない。本技法は、無線を通じたテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、例えばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、又は他の用途など、種々のマルチメディア用途のいずれかをサポートするビデオコード化に適用され得る。幾つかの例では、ビデオコード化システム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、及び/又はビデオ電話などの用途をサポートするために、単方向又は双方向のビデオ送信をサポートするように構成され得る。
[0039]図1の例では、発信源機器12は、ビデオ発信源18と、ビデオエンコーダ20と、出力インターフェース22とを含む。場合によっては、出力インターフェース22は、変調器/復調器(モデム)及び/又は送信機を含み得る。発信源機器12において、ビデオ発信源18は、撮像装置、例えばビデオカメラ、以前に撮影されたビデオデータを含むビデオアーカイブ、ビデオコンテンツプロバイダからビデオデータを受信するためのビデオフィードインターフェース、及び/又は、ビデオデータを生成するためのコンピュータグラフィックスシステムのような発信源、或いはそのような発信源の組合せを含み得る。
[0040]ビデオエンコーダ20は、撮影されたビデオデータ、以前に撮影されたビデオデータ、又はコンピュータにより生成されたビデオデータを符号化し得る。符号化されたビデオデータは、発信源機器12の出力インターフェース22を介して宛先機器14に直接送信され得る。符号化されたビデオデータはまた、復号及び/又は再生のための宛先機器14によるその後のアクセスのために、記憶媒体又はファイルサーバ上に記憶され得る。
[0041]図1の例において、宛先機器14は、入力インターフェース28と、ビデオデコーダ30と、表示装置32とを含む。幾つかの例では、入力インターフェース28は、受信機及び/又はモデムを含み得る。宛先機器14の入力インターフェース28は、チャネル16を通じて符号化されたビデオデータを受信する。符号化されたビデオデータは、ビデオデータを表すビデオエンコーダ20によって生成される種々のシンタクス要素を含み得る。そのようなシンタクス要素は、通信媒体上で送信される、記憶媒体上に記憶される、又はファイルサーバ上に記憶される、符号化されたビデオデータとともに含まれ得る。
[0042]表示装置32は、宛先機器14と一体であってよく、又はその外部にあってよい。幾つかの例では、宛先機器14は、一体型表示装置を含んでよく、また、外部表示装置とインターフェースするように構成され得る。他の例では、宛先機器14は表示装置であり得る。一般に、表示装置32は、復号されたビデオデータをユーザに表示する。表示装置32は、液晶表示器(LCD)、プラズマ表示器、有機発光ダイオード(OLED)表示器、又は別のタイプの表示装置など、種々の表示装置のいずれかを備え得る。
[0043]ビデオエンコーダ20及びビデオデコーダ30は、現在開発中の高効率ビデオコード化(HEVC)規格などのビデオ圧縮規格に従って動作することができ、HEVCテストモデル(HM)に準拠することができる。
[0044]或いは、ビデオエンコーダ20及びビデオデコーダ30は、代替的にMPEG−4、Part 10、Advanced Video Coding(AVC)と呼ばれるITU−T H.264規格、又はそのような規格の拡張版のような、他のプロプライエタリ規格又は業界規格に従って動作し得る。しかしながら、本開示の技法は、いかなる特定のコード化規格又は技法にも限定されない。ビデオ圧縮の規格及び技法の他の例には、MPEG−2、ITU−T H.263、及びVP8及び関連するフォーマットのようなプロプライエタリ又はオープン発信源の圧縮フォーマットがある。
[0045]図1の例には示されていないが、ビデオエンコーダ20及びビデオデコーダ30は各々、オーディオエンコーダ及びオーディオデコーダと統合されてよく、共通のデータストリーム又は別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するための適切なMUX−DEMUXユニット、又は他のハードウェア及びソフトウェアを含み得る。適用可能な場合、幾つかの例では、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、又はユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠し得る。
[0046]この場合も、図1は例にすぎず、本開示の技法は、符号化機器と復号機器との間のデータ通信を必ずしも含むとは限らないビデオコード化設定(例えば、ビデオ符号化又はビデオ復号)に適用され得る。他の例では、データがローカルメモリから取り出されること、ネットワークを介してストリーミングされることなどが行われ得る。符号化機器はデータを符号化してメモリに記憶することができ、及び/又は、復号機器はメモリからデータを取り出して復号することができる。多くの例では、符号化及び復号は、互いに通信しないが、メモリにデータを符号化し、及び/又はメモリからデータを取り出して復号するだけである機器によって実行される。
[0047]ビデオエンコーダ20及びビデオデコーダ30は各々、1つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ハードウェアのような、種々の好適な回路のいずれか、又はそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、機器は、好適な非一時的コンピュータ可読記憶媒体にソフトウェアの命令を記憶することができ、1つ又は複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実行することができる。ビデオエンコーダ20及びビデオデコーダ30の各々は1つ又は複数のエンコーダ又はデコーダ中に含まれてよく、そのいずれも、それぞれの機器において複合エンコーダ/デコーダ(コーデック)の一部として統合され得る。
[0048]上で手短に述べられたように、ビデオエンコーダ20は、ビデオデータを符号化する。ビデオデータは、1つ又は複数のピクチャを備え得る。ピクチャの各々は、ビデオの一部を形成する静止画像である。幾つかの例では、ピクチャは、ビデオ「フレーム」と呼ばれ得る。ビデオエンコーダ20がビデオデータを符号化するとき、ビデオエンコーダ20は、ビットストリームを生成し得る。ビットストリームは、ビデオデータのコード化された表現を形成する、ビットのシーケンスを含み得る。ビットストリームは、コード化されたピクチャと、関連するデータとを含み得る。コード化されたピクチャとは、ピクチャのコード化された表現である。
[0049]ビットストリームを生成するために、ビデオエンコーダ20は、ビデオデータ中の各ピクチャに対して符号化動作を実行することができる。ビデオエンコーダ20がピクチャに対して符号化動作を実行するとき、ビデオエンコーダ20は、一連のコード化されたピクチャと、関連するデータとを生成することができる。関連するデータは、シーケンスパラメータセットと、ピクチャパラメータセットと、適応パラメータセットと、他のシンタクス構造とを含み得る。シーケンスパラメータセット(SPS)は、ピクチャの0個以上のシーケンスに適用可能なパラメータを含み得る。ピクチャパラメータセット(PPS)は、0個以上のピクチャに適用可能なパラメータを含み得る。適応パラメータセット(APS)は、0個以上のピクチャに適用可能なパラメータを含み得る。APS内のパラメータは、PPS内のパラメータよりも変化する可能性が高いパラメータであり得る。
[0050]コード化されたピクチャを生成するために、ビデオエンコーダ20は、ピクチャを等しいサイズのビデオブロックに区分することができる。ビデオブロックはサンプルの2次元アレイであり得る。ビデオブロックの各々は、ツリーブロックと関連付けられる。幾つかの例では、ツリーブロックは、最大コード化単位(LCU)と呼ばれ得る。HEVCのツリーブロックは、H.264/AVCのような従来の規格のマクロブロックに広い意味で類似し得る。しかしながら、ツリーブロックは、特定のサイズに必ずしも限定されるものではなく、1つ又は複数のコード化単位(CU)を含み得る。ビデオエンコーダ20は、4分木区分を使用して、ツリーブロックのビデオブロックを、CUと関連付けられるビデオブロックへと区分することができるので、「ツリーブロック」という名前である。
[0051]幾つかの例では、ビデオエンコーダ20は、ピクチャを複数のスライスに区分することができる。スライスの各々は、整数個のCUを含み得る。幾つかの例では、スライスは、整数個のツリーブロックを備える。他の例では、スライスの境界は、ツリーブロック内にあり得る。
[0052]ピクチャに対して符号化動作を実行することの一部として、ビデオエンコーダ20は、ピクチャの各スライスに対して符号化動作を実行することができる。ビデオエンコーダ20がスライスに対して符号化動作を実行すると、ビデオエンコーダ20は、スライスと関連付けられた符号化されたデータを生成することができる。スライスと関連付けられた符号化されたデータは、「コード化されたスライス」と呼ばれ得る。
[0053]コード化されたスライスを生成するために、ビデオエンコーダ20は、スライス中の各ツリーブロックに対して符号化動作を実行することができる。ビデオエンコーダ20がツリーブロックに対して符号化動作を実行すると、ビデオエンコーダ20は、コード化されたツリーブロックを生成することができる。コード化されたツリーブロックは、ツリーブロックの符号化されたバージョンを表すデータを備え得る。
[0054]ビデオエンコーダ20がコード化されたスライスを生成するとき、ビデオエンコーダ20は、ラスタ走査順序に従ってスライス中のツリーブロックに対して符号化演算を実行し得る(例えば、そのツリーブロックを符号化し得る)。言い換えると、ビデオエンコーダ20は、スライス中のツリーブロックの一番上の行にわたって左から右に進み、次いでツリーブロックの次の下の行にわたって左から右に進み、以下同様に進む、順序で、ビデオエンコーダ20がスライス中のツリーブロックの各々を符号化するまで、スライスのツリーブロックを符号化し得る。
[0055]ラスタ走査順序に従ってツリーブロックを符号化した結果として、所与のツリーブロックの上及び左のツリーブロックは符号化されていることがあるが、所与のツリーブロックの下及び右のツリーブロックはまだ符号化されていない。その結果、ビデオエンコーダ20は、所与のツリーブロックを符号化するとき、所与のツリーブロックの上及び左のツリーブロックを符号化することによって生成された情報にアクセスすることが可能であり得る。しかしながら、ビデオエンコーダ20は、所与のツリーブロックを符号化するとき、所与のツリーブロックの下及び右のツリーブロックを符号化することによって生成された情報にアクセスすることが不可能であり得る。
[0056]コード化されたツリーブロックを生成するために、ビデオエンコーダ20は、ツリーブロックのビデオブロック上で4分木区分を再帰的に実行して、ビデオブロックを徐々により小さいビデオブロックへと分けることができる。より小さいビデオブロックの各々は、異なるCUと関連付けられ得る。例えば、ビデオエンコーダ20は、ツリーブロックのビデオブロックを4つの等しいサイズのサブブロックに区分し、サブブロックの1つ又は複数を、4つの等しいサイズのサブサブブロックに区分することができ、以下同様である。区分されたCUは、そのビデオブロックが、他のCUと関連付けられたビデオブロックに区分された、CUであり得る。区分されていないCUは、そのビデオブロックが、他のCUと関連付けられたビデオブロックに区分されていない、CUであり得る。
[0057]ビットストリーム中の1つ又は複数のシンタクス要素は、ビデオエンコーダ20がツリーブロックのビデオブロックを区分できる最大の回数を示し得る。CUのビデオブロックは、正方形の形状であり得る。CUのビデオブロックのサイズ(例えば、CUのサイズ)は、8×8の画素から、最大で64×64以上の画素を有するツリーブロックのビデオブロックのサイズ(例えば、ツリーブロックのサイズ)にまでわたり得る。
[0058]ビデオエンコーダ20は、z走査順序に従って、ツリーブロックの各CUに対して符号化演算を実行し得る(例えば、各CUを符号化し得る)。言い換えると、ビデオエンコーダ20は、左上のCUと、右上のCUと、左下のCUと、次いで右下のCUとを、その順序で符号化することができる。ビデオエンコーダ20が区分されたCUに対して符号化演算を実行するとき、ビデオエンコーダ20は、z走査順序に従って、区分されたCUのビデオブロックのサブブロックと関連付けられたCUを符号化し得る。言い換えると、ビデオエンコーダ20は、左上のサブブロックと関連付けられるCUと、右上のサブブロックと関連付けられるCUと、左下のサブブロックと関連付けられるCUと、次いで右下のサブブロックと関連付けられるCUとを、その順序で符号化し得る。
[0059]z走査順序に従ってツリーブロックのCUを符号化した結果として、所与のCUの上、左上、右上、左、及び左下のCUは符号化されていることがある。所与のCUの下及び右のCUはまだ符号化されていない。その結果、ビデオエンコーダ20は、所与のCUを符号化するとき、所与のCUに隣接する幾つかのCUを符号化することによって生成された情報にアクセスすることが可能であり得る。しかしながら、ビデオエンコーダ20は、所与のCUを符号化するとき、所与のCUに隣接する他のCUを符号化することによって生成された情報にアクセスすることが不可能であり得る。
[0060]ビデオエンコーダ20が区分されていないCUを符号化する場合、ビデオエンコーダ20は、CUのために1つ又は複数の予測単位(PU)を生成することができる。CUのPUの各々は、CUのビデオブロック内の異なるビデオブロックと関連付けられ得る。ビデオエンコーダ20は、CUの各PUの、予測されたビデオブロックを生成することができる。PUの予測されたビデオブロックは、サンプルのブロックであってよい。ビデオエンコーダ20は、イントラ予測又はインター予測を使用して、PUの予測されたビデオブロックを生成することができる。
[0061]ビデオエンコーダ20がイントラ予測を使用してPUの予測されたビデオブロックを生成する場合、ビデオエンコーダ20は、PUと関連付けられるピクチャの復号されたサンプルに基づいて、PUの予測されたビデオブロックを生成することができる。ビデオエンコーダ20がイントラ予測を使用してCUのPUの予測されたビデオブロックを生成する場合、CUはイントラ予測されたCUである。ビデオエンコーダ20がインター予測を使用してPUの予測されたビデオブロックを生成するとき、ビデオエンコーダ20は、PUと関連付けられたピクチャ以外の1つ又は複数のピクチャの復号されたサンプルに基づいて、PUの予測されたビデオブロックを生成し得る。ビデオエンコーダ20がインター予測を使用してCUのPUの予測されたビデオブロックを生成する場合、CUはインター予測されたCUである。
[0062]更に、ビデオエンコーダ20がインター予測を使用してPUの予測されたビデオブロックを生成する場合、ビデオエンコーダ20は、PUの動き情報を生成することができる。PUの動き情報は、PUの1つ又は複数の参照ブロックを示し得る。PUの各参照ブロックは参照ピクチャ内のビデオブロックであり得る。参照ピクチャはPUと関連付けられたピクチャ以外のピクチャであり得る。幾つかの事例では、PUの参照ブロックはPUの「参照サンプル」と呼ばれることもある。ビデオエンコーダ20は、PUの参照ブロックに基づいてPUの予測されたビデオブロックを生成し得る。
[0063]ビデオエンコーダ20がCUの1つ又は複数のPUの予測されたビデオブロックを生成した後、ビデオエンコーダ20は、CUのPUの予測されたビデオブロックに基づいて、CUの残差データを生成することができる。CUの残差データは、CUのPUの予測されたビデオブロック中のサンプルと、CUの元のビデオブロック中のサンプルとの差を示し得る。
[0064]更に、区分されていないCUに対して符号化動作を実行することの一部として、ビデオエンコーダ20は、CUの残差データに対して再帰的な4分木区分を実行して、CUの残差データを、CUの変換単位(TU)と関連付けられる残差データの1つ又は複数のブロック(例えば、残差ビデオブロック)へと区分することができる。CUの各TUは、異なる残差ビデオブロックと関連付けられ得る。
[0065]ビデオコーダ20は、TUと関連付けられる残差ビデオブロックに対して1つ又は複数の変換を適用して、TUと関連付けられる変換係数ブロック(例えば、変換係数のブロック)を生成することができる。概念的には、変換係数ブロックは、変換係数の2次元(2D)行列であってよい。
[0066]変換係数ブロックを生成した後、ビデオエンコーダ20は、変換係数ブロックに対して量子化処理を実行することができる。量子化は、一般に、変換係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、更なる圧縮を実現する処理を指す。量子化処理は、変換係数の一部又は全部と関連付けられるビット深度を低減することができる。例えば、量子化中にnビットの変換係数がmビットの変換係数に切り捨てられてよく、ただし、nはmよりも大きい。
[0067]ビデオエンコーダ20は、各CUを、量子化パラメータ(QP)値と関連付けることができる。CUと関連付けられるQP値は、ビデオエンコーダ20が、CUと関連付けられる変換係数ブロックをどのように量子化するかを、決定し得る。ビデオエンコーダ20は、CUと関連付けられるQP値を調整することによって、CUと関連付けられる変換係数ブロックに適用される量子化の程度を調整することができる。
[0068]ビデオエンコーダ20が変換係数ブロックを量子化した後、ビデオエンコーダ20は、量子化された変換係数ブロック内で変換係数を表すシンタクス要素のセットを生成し得る。ビデオエンコーダ20は、これらのシンタクス要素のうちの幾つかに、コンテキスト適応バイナリ算術コード化(CABAC:Context Adaptive Binary Arithmetic Coding)演算のようなエントロピー符号化演算を適用し得る。コンテンツ適応可変長コード化(CALVC:content adaptive variable length coding)のような他のエントロピーコード化技法、確率間隔区分化エントロピー(PIPE:probability interval partitioning entropy)コード化、又は他のバイナリ算術コード化も使用され得る。
[0069]ビデオエンコーダ20によって生成されるビットストリームは、一連のネットワーク抽象化レイヤ(NAL)単位を含み得る。NAL単位の各々は、NAL単位中のデータのタイプの指示と、データを含むバイトとを含むシンタクス構造であり得る。例えば、NAL単位は、シーケンスパラメータセット、ピクチャパラメータセット、コード化されたスライス、補助拡張情報(supplemental enhancement information)(SEI)、アクセス単位区切り文字、フィラーデータ(filler data)、又は別のタイプのデータを表すデータを含み得る。NAL単位中のデータは、様々なシンタクス構造を含み得る。
[0070]ビデオデコーダ30は、ビデオエンコーダ20によって生成されるビットストリームを受け取ることができる。ビットストリームは、ビデオエンコーダ20によって符号化されるビデオデータのコード化された表現を含み得る。ビデオデコーダ30がビットストリームを受け取ると、ビデオデコーダ30は、ビットストリームに対して解析動作を実行することができる。ビデオデコーダ30が解析動作を実行すると、ビデオデコーダ30は、ビットストリームからシンタクス要素を抽出することができる。ビデオデコーダ30は、ビットストリームから抽出されたシンタクス要素に基づいて、ビデオデータのピクチャを復元することができる。シンタクス要素に基づいてビデオデータを復元するための処理は、一般に、シンタクス要素を生成するためにビデオエンコーダ20によって実行される処理の逆であり得る。
[0071]ビデオデコーダ30がCUと関連付けられるシンタクス要素を抽出した後、ビデオデコーダ30は、シンタクス要素に基づいて、CUのPUの予測されたビデオブロックを生成することができる。加えて、ビデオデコーダ30は、CUのTUと関連付けられる変換係数ブロックを逆量子化することができる。ビデオデコーダ30は、変換係数ブロックに対して逆変換を実行して、CUのTUと関連付けられる残差ビデオブロックを復元することができる。予測されたビデオブロックを生成し、残差ビデオブロックを復元した後、ビデオデコーダ30は、予測されたビデオブロック及び残差ビデオブロックに基づいて、CUのビデオブロックを復元することができる。このようにして、ビデオデコーダ30は、ビットストリーム中のシンタクス要素に基づいて、CUのビデオブロックを復元することができる。
[0072]本開示の実施形態によれば、ビデオエンコーダ20は、アップサンプリングモジュール130を含み得るは、少なくとも1つのベースレイヤと少なくとも1つの拡張レイヤとを定義するスケーラブルビデオコード化方式で、ビデオデータをコード化(例えば、符号化)するように構成され得る。アップサンプリングモジュール130は、符号化処理の一部として少なくとも幾つかのビデオデータをアップサンプリングすることができ、アップサンプリングは、例えば、図4〜図7に関して下で説明されるように、例えば、第1のレイヤに対するビデオ情報の第2のレイヤの位相変位情報に少なくとも一部に基づいて選択された画像フィルタセットを使用することによって、適応的な方式で実行される。
[0073]図2は、本開示の技法を実装するように構成され得る例示的なビデオエンコーダ20を示すブロック図である。図2は、説明を目的に与えられており、本開示において広く例示され説明される技法を限定するものと見なされるべきではない。説明のために、本開示は、HEVCコード化の状況において、ビデオエンコーダ20について説明する。しかしながら、本開示の技法は、他のコード化規格又は方法にも適用可能であり得る。
[0074]図2の例において、ビデオエンコーダ20は、複数の機能コンポーネントを含む。ビデオエンコーダ20の機能コンポーネントは、予測モジュール100と、残差生成モジュール102と、変換モジュール104と、量子化モジュール106と、逆量子化モジュール108と、逆変換モジュール110と、復元モジュール112と、フィルタモジュール113と、復号ピクチャバッファ114と、エントロピー符号化モジュール116とを含む。予測モジュール100は、インター予測モジュール121と、動き推定モジュール122と、動き補償モジュール124と、イントラ予測モジュール126とを含む。他の例では、ビデオエンコーダ20は、より多数の、より少数の、又は異なる機能コンポーネントを含んでよい。更に、動き推定モジュール122と動き補償モジュール124は、高度に統合され得るが、図2の例では、説明のために別々に表されている。
[0075]ビデオエンコーダ20は、ビデオデータを受信することができる。ビデオエンコーダ20は、様々な発信源からビデオデータを受信することができる。例えば、ビデオエンコーダ20は、ビデオ発信源18(図1)又は別の発信源からビデオデータを受信することができる。ビデオデータは、一連のピクチャを表し得る。ビデオデータを符号化するために、ビデオエンコーダ20は、ピクチャの各々に対して符号化動作を実行することができる。ピクチャに対して符号化動作を実行することの一部として、ビデオエンコーダ20は、ピクチャの各スライスに対して符号化動作を実行することができる。スライスに対する符号化動作を実行することの一部として、ビデオエンコーダ20は、スライス中のツリーブロックに対して符号化動作を実行することができる。
[0076]ツリーブロックに対して符号化動作を実行することの一部として、予測モジュール100は、ツリーブロックのビデオブロックに対して4分木区分を実行して、ビデオブロックを徐々により小さいビデオブロックへと分けることができる。より小さいビデオブロックの各々は、異なるCUと関連付けられ得る。例えば、予測モジュール100は、ツリーブロックのビデオブロックを4つの等しいサイズのサブブロックに区分し、サブブロックの1つ又は複数を、4つの等しいサイズのサブサブブロックに区分することができ、以下同様である。
[0077]CUと関連付けられるビデオブロックのサイズは、8×8サンプルから、最大で64×64サンプル以上のツリーブロックのサイズにまで、わたり得る。本開示では、「N×N(NxN)」及び「N×N(N by N)」は、垂直方向の寸法及び水平方向の寸法に関するビデオブロックのサンプルの寸法、例えば、16×16(16x16)サンプル又は16×16(16 by 16)サンプルを指すために交換可能に使用され得る。一般に、16×16のビデオブロックは、垂直方向に16個のサンプルを有し(y=16)、水平方向に16個のサンプルを有する(x=16)。同様に、N×Nのブロックは、一般に、垂直方向にN個のサンプルを有し、水平方向にN個のサンプルを有し、Nは非負整数値を表す。
[0078]更に、ツリーブロックに対して符号化動作を実行することの一部として、予測モジュール100は、ツリーブロック用の階層的な4分木データ構造を生成することができる。例えば、ツリーブロックは、4分木データ構造のルートノードに対応し得る。予測モジュール100が、ツリーブロックのビデオブロックを4つのサブブロックに区分する場合、ルートノードは、4分木データ構造中に4つの子ノードを有する。子ノードの各々は、サブブロックの1つと関連付けられるCUに対応する。予測モジュール100が、サブブロックの1つを4つのサブサブブロックに区分する場合、サブブロックと関連付けられるCUに対応するノードは、サブサブブロックの1つと関連付けられるCUに各々が対応する、4つの子ノードを有し得る。
[0079]4分木データ構造の各ノードは、対応するツリーブロック又はCUのシンタクスデータ(例えば、シンタクス要素)を含み得る。例えば、4分木の中のノードは、そのノードに対応するCUのビデオブロックが4つのサブブロックに区分される(例えば、分割される)かどうかを示す分割フラグを含み得る。CUのシンタクス要素は、再帰的に定義されてよく、CUのビデオブロックがサブブロックに分割されるかどうかに依存してよい。ビデオブロックが区分されていないCUは、4分木データ構造におけるリーフノードに対応し得る。コード化されたツリーブロックは、対応するツリーブロック用の4分木データ構造に基づくデータを含み得る。
[0080]ビデオエンコーダ20は、ツリーブロックの各々の区分されていないCUに対して符号化動作を実行することができる。ビデオエンコーダ20が区分されていないCUに対して符号化動作を実行すると、ビデオエンコーダ20は、区分されていないCUの符号化された表現を表すデータを生成する。
[0081]CUに対して符号化動作を実行することの一部として、予測モジュール100は、CUの1つ又は複数のPUの中で、CUのビデオブロックを区分することができる。ビデオエンコーダ20及びビデオデコーダ30は、様々なPUサイズをサポートすることができる。特定のCUのサイズが2N×2Nであると仮定すると、ビデオエンコーダ20及びビデオデコーダ30は、2N×2N又はN×NというPUサイズと、2N×2N、2N×N、N×2N、N×N、2N×nU、nL×2N、nR×2N又は同様の対称的なPUサイズでのインター予測とをサポートすることができる。ビデオエンコーダ20及びビデオデコーダ30は、2N×nU、2N×nD、nL×2N、及びnR×2NというPUサイズに対する非対称区分もサポートすることができる。幾つかの例では、予測モジュール100は、CUのビデオブロックの辺に直角に接触しない境界に沿って、CUのPUの間でCUのビデオブロックを区分化するように、幾何学的な区分化を実行することができる。
[0082]インター予測モジュール121は、CUの各PUに対してインター予測を実行することができる。インター予測は、時間圧縮を実現し得る。PUに対してインター予測を実行するために、動き推定モジュール122はPUの動き情報を生成し得る。動き補償モジュール124は、動き情報、及びCUと関連付けられたピクチャ以外のピクチャ(例えば、参照ピクチャ)の復号されたサンプルに基づいて、PUの予測されたビデオブロックを生成し得る。本開示では、動き補償モジュール124によって生成された予測されたビデオブロックは、インター予測されたビデオブロックと呼ばれることがある。
[0083]スライスは、Iスライス、Pスライス、又はBスライスであり得る。動き推定モジュール122及び動き補償モジュール124は、PUがIスライス中にあるか、Pスライス中にあるか、Bスライス中にあるかに応じて、CUのPUに対して様々な動作を実行することができる。Iスライス中では、全てのPUがイントラ予測される。従って、PUがIスライス中にある場合、動き推定モジュール122及び動き補償モジュール124は、PUに対してインター予測を実行しない。
[0084]PUがPスライス中にある場合、PUを含むピクチャは、「リスト0」と呼ばれる参照ピクチャのリストと関連付けられる。リスト0中の参照ピクチャの各々は、他のピクチャのインター予測に使用され得るサンプルを含む。動き推定モジュール122が、Pスライス中のPUに関して動き推定動作を実行するとき、動き推定モジュール122は、PUの参照ブロックについて、リスト0中の参照ピクチャを検索することができる。PUの参照ブロックは、PUのビデオブロック中のサンプルに最も密接に対応するサンプルのセット、例えば、サンプルのブロックであり得る。動き推定モジュール122は、種々の評価基準を使用して、参照ピクチャ中のサンプルのセットがどの程度密接にPUのビデオブロック中のサンプルに対応するかを決定することができる。例えば、動き推定モジュール122は、絶対値差分和(SAD)、2乗差分和(SSD)、又は他の差分による評価基準によって、参照ピクチャ中のサンプルのセットがどの程度密接に、PUのビデオブロック中のサンプルに対応するかを、決定することができる。
[0085]Pスライス中のPUの参照ブロックを識別した後、動き推定モジュール122は、参照ブロックを含む、リスト0中の参照ピクチャを示す参照インデックスと、PUと参照ブロックの間の空間変位を示す動きベクトルとを生成することができる。様々な例において、動き推定モジュール122は、動きベクトルを可変の精度で生成することができる。例えば、動き推定モジュール122は、1/4サンプル精度、1/8サンプル精度、又は他の分数のサンプル精度で、動きベクトルを生成することができる。分数のサンプル精度の場合、参照ブロック値は、参照ピクチャ中の整数位置のサンプル値から補間され得る。動き推定モジュール122は、PUの動き情報として、参照インデックスと動きベクトルとを出力することができる。動き補償モジュール124は、PUの動き情報によって特定される参照ブロックに基づいてPUの予測されたビデオブロックを生成し得る。
[0086]PUがBスライス中にある場合、PUを含むピクチャは、「リスト0」及び「リスト1」と呼ばれる参照ピクチャの2つのリストと関連付けられ得る。幾つかの例では、Bスライスを含むピクチャは、リスト0とリスト1の組合せである、リストの組合せと関連付けられ得る。
[0087]更に、PUがBスライス中にある場合、動き推定モジュール122は、PUについての単方向予測又は双方向予測を実行することができる。動き推定モジュール122が、PUについての単方向予測を実行するとき、動き推定モジュール122は、PUの参照ブロックについて、リスト0又はリスト1の参照ピクチャを検索することができる。動き推定モジュール122は次いで、参照ブロックを含む、リスト0又はリスト1中の参照ピクチャを示す参照インデックスと、PUと参照ブロックとの間の空間変位を示す動きベクトルとを生成することができる。動き推定モジュール122は、PUの動き情報として、参照インデックスと、予測方向インジケータと、動きベクトルとを出力することができる。予測方向インジケータは、参照インデックスが、リスト0中の参照ピクチャを示すか、リスト1中の参照ピクチャを示すかを示し得る。動き補償モジュール124は、PUの動き情報によって示される参照ブロックに基づいてPUの予測されたビデオブロックを生成し得る。
[0088]動き推定モジュール122が、PUについての双方向予測を実行するとき、動き推定モジュール122は、PUの参照ブロックについて、リスト0中の参照ピクチャを検索することができ、また、PUの別の参照ブロックについて、リスト1中の参照ピクチャを検索することができる。動き推定モジュール122は次いで、参照ブロックを含む、リスト0及びリスト1中の参照ピクチャを示す参照インデックスと、参照ブロックとPUとの間の空間変位を示す動きベクトルとを生成することができる。動き推定モジュール122は、PUの動き情報としてPUの参照インデックスと動きベクトルとを出力し得る。動き補償モジュール124は、PUの動き情報によって示される参照ブロックに基づいてPUの予測されたビデオブロックを生成し得る。
[0089]幾つかの例では、動き推定モジュール122は、PUの動き情報のフルセットをエントロピー符号化モジュール116に出力しない。そうではなく、動き推定モジュール122は、別のPUの動き情報を参照して、PUの動き情報を信号伝達し得る。例えば、動き推定モジュール122は、PUの動き情報が、隣接するPUの動き情報と十分に類似していると決定することができる。この例では、動き推定モジュール122は、PUと関連付けられるシンタクス構造において、PUが隣接するPUと同じ動き情報を有することを、ビデオデコーダ30に対して示す値を示し得る。別の例では、動き推定モジュール122は、PUと関連付けられるシンタクス構造において、隣接するPUと動きベクトル差(MVD)とを特定し得る。動きベクトル差は、PUの動きベクトルと、示される隣接するPUの動きベクトルとの差を示す。ビデオデコーダ30は、示される隣接するPUの動きベクトルと、動きベクトル差とを使用して、PUの動きベクトルを決定することができる。第2のPUの動き情報を信号伝達するときに第1のPUの動き情報を参照することによって、ビデオエンコーダ20は、より少数のビットを使用して、第2のPUの動き情報を信号伝達することが可能であり得る。
[0090]CUに対して符号化動作を実行することの一部として、イントラ予測モジュール126は、CUのPUに対してイントラ予測を実行することができる。イントラ予測は、空間圧縮を実現し得る。イントラ予測モジュール126がPUに対してイントラ予測を実行するとき、イントラ予測モジュール126は、同じピクチャ中の他のPUの復号されたサンプルに基づいて、PUの予測データを生成することができる。PUの予測データは、予測されたビデオブロックと様々なシンタクス要素とを含み得る。イントラ予測モジュール126は、Iスライス、Pスライス、及びBスライスの中のPUに対して、イントラ予測を実行することができる。
[0091]PUに対してイントラ予測を実行するために、イントラ予測モジュール126は、複数のイントラ予測モードを使用して、PUの予測データの複数のセットを生成することができる。イントラ予測モジュール126が、イントラ予測モードを使用して、PUの予測データのセットを生成するとき、イントラ予測モジュール126は、イントラ予測モードと関連付けられる方向及び/又は傾きに、隣接するPUのビデオブロックからPUのビデオブロックにわたって、サンプルを延ばすことができる。隣接するPUは、PU、CU及びツリーブロックに対して左から右、上から下の符号化順序を仮定すると、PUの上、上と右、上と左、又は左にあり得る。イントラ予測モジュール126は、PUのサイズに応じて、様々な数のイントラ予測モード、例えば、33個の方向性イントラ予測モードを使用することができる。
[0092]予測モジュール100は、PUについての、動き補償モジュール124によって生成された予測データ、又はPUについての、イントラ予測モジュール126によって生成された予測データの中から、PUの予測データを選択することができる。幾つかの例では、予測モジュール100は、予測データのセットのレート/歪みの評価基準に基づいて、PUの予測データを選択する。
[0093]予測モジュール100が、イントラ予測モジュール126によって生成された予測データを選択する場合、予測モジュール100は、PUの予測データを生成するのに使用されたイントラ予測モード、例えば、選択されたイントラ予測モードを信号伝達することができる。予測モジュール100は、選択されたイントラ予測モードを様々な方法で信号伝達することができる。例えば、選択されたイントラ予測モードは、隣接するPUのイントラ予測モードと同じであることがあり得る。言い換えれば、隣接するPUのイントラ予測モードは、現在のPUに対して最もあり得るモードであり得る。従って、予測モジュール100は、選択されたイントラ予測モードが隣接するPUのイントラ予測モードと同じであることを示すための、シンタクス要素を生成することができる。
[0094]予測モジュール100がCUのPUの予測データを選択した後、残差生成モジュール102は、CUのビデオブロックからCUのPUの予測されたビデオブロックを差し引くことによって、CUの残差データを生成することができる。CUの残差データは、CUのビデオブロック中のサンプルの様々なサンプル成分に対応する、2D残差ビデオブロックを含み得る。例えば、残差データは、CUのPUの予測されたビデオブロック中のサンプルの輝度成分と、CUの元のビデオブロック中のサンプルの輝度成分との差に対応する、残差ビデオブロックを含み得る。加えて、CUの残差データは、CUのPUの予測されたビデオブロック中のサンプルのクロミナンス成分と、CUの元のビデオブロック中のサンプルのクロミナンス成分との差に対応する、残差ビデオブロックを含み得る。
[0095]予測モジュール100は、4分木区分を実行して、CUの残差ビデオブロックをサブブロックへと区分することができる。各々の分割されていない残差ビデオブロックは、CUの異なるTUと関連付けられ得る。CUのTUと関連付けられる残差ビデオブロックのサイズ及び位置は、CUのPUと関連付けられるビデオブロックのサイズ及び位置に基づいてよく、又は基づかなくてよい。「残差4分木」(RQT)として知られる4分木構造は、残差ビデオブロックの各々と関連付けられるノードを含み得る。CUのTUは、RQTのリーフノードに対応し得る。
[0096]変換モジュール104は、TUと関連付けられる残差ビデオブロックに1つ又は複数の変換を適用することによって、CUの各TUのための1つ又は複数の変換係数ブロックを生成することができる。変換係数ブロックの各々は、変換係数の2D行列であり得る。変換モジュール104は、TUと関連付けられる残差ビデオブロックに様々な変換を適用することができる。例えば、変換モジュール104は、離散コサイン変換(DCT)、方向変換、又は概念的に同様の変換を、TUと関連付けられる残差ビデオブロックに適用することができる。
[0097]変換モジュール104が、TUと関連付けられる変換係数ブロックを生成した後、量子化モジュール106は、変換係数ブロック中の変換係数を量子化することができる。量子化モジュール106は、CUと関連付けられるQP値に基づいて、CUのTUと関連付けられる変換係数ブロックを量子化することができる。
[0098]ビデオエンコーダ20は、様々な方法でQP値をCUと関連付けることができる。例えば、ビデオエンコーダ20は、CUと関連付けられるツリーブロックに対して、レート歪み分析を実行することができる。レート歪み分析では、ビデオエンコーダ20は、ツリーブロックに対して符号化動作を複数回実行することによって、ツリーブロックの複数のコード化された表現を生成することができる。ビデオエンコーダ20がツリーブロックの異なる符号化された表現を生成するとき、ビデオエンコーダ20は、異なるQP値をCUと関連付けることができる。所与のQP値が、ビットレート及び歪みの評価基準が最小であるツリーブロックのコード化された表現においてCUと関連付けられるとき、ビデオエンコーダ20は、その所与のQP値がCUと関連付けられることを信号伝達することができる。
[0099]逆量子化モジュール108及び逆変換モジュール110は、それぞれ、変換係数ブロックに逆量子化と逆変換とを適用して、変換係数ブロックから残差ビデオブロックを復元することができる。復元モジュール112は、復元された残差ビデオブロックを、予測モジュール100によって生成される1つ又は複数の予測されたビデオブロックからの対応するサンプルに追加して、TUと関連付けられる復元されたビデオブロックを生成することができる。このようにCUの各TUのビデオブロックを復元することによって、ビデオエンコーダ20は、CUのビデオブロックを復元することができる。
[0100]復元モジュール112がCUのビデオブロックを復元した後、フィルタモジュール113は、デブロッキング動作を実行して、CUと関連付けられるビデオブロックにおけるブロック歪み(blocking artifacts)を低減することができる。1つ又は複数のデブロッキング動作を実行した後、フィルタモジュール113は、復号ピクチャバッファ114にCUの復元されたビデオブロックを記憶することができる。動き推定モジュール122及び動き補償モジュール124は、復元されたビデオブロックを含む参照ピクチャを使用して、後続ピクチャのPUに対してインター予測を実行することができる。加えて、イントラ予測モジュール126は、復号ピクチャバッファ114中の復元されたビデオブロックを使用して、CUと同じピクチャの中の他のPUに対してイントラ予測を実行することができる。
[0101]エントロピー符号化モジュール116は、ビデオエンコーダ20の他の機能コンポーネントからデータを受信することができる。例えば、エントロピー符号化モジュール116は、量子化モジュール106から変換係数ブロックを受信することができ、予測モジュール100からシンタクス要素を受信することができる。エントロピー符号化モジュール116がデータを受信するとき、エントロピー符号化モジュール116は、1つ又は複数のエントロピー符号化動作を実行して、エントロピー符号化されたデータを生成することができる。例えば、ビデオエンコーダ20は、コンテキスト適応型可変長コード化(CAVLC)動作、CABAC動作、変数−変数(V2V)レングスコード化動作、シンタクスベースのコンテキスト適応型2値算術コード化(SBAC)動作、Probability Interval Partitioning Entropy(PIPE)コード化動作、又は別のタイプのエントロピー符号化動作をデータに対して実行することができる。エントロピー符号化モジュール116は、エントロピー符号化されたデータを含むビットストリームを出力することができる。
[0102]データに対してエントロピー符号化動作を実行することの一部として、エントロピー符号化モジュール116は、コンテキストモデルを選択することができる。エントロピー符号化モジュール116がCABAC動作を実行している場合、コンテキストモデルは、特定の値を有する特定のビンの確率の推定値を示し得る。CABACの文脈では、「ビン」という用語は、シンタクス要素の2値化されたバージョンのビットを指すために使用される。
[0103]図3は、本開示の技法を実装するように構成され得る、例示的なビデオデコーダ30を示すブロック図である。図3は、説明を目的に与えられており、本開示において広く例示され説明される技法に対する限定ではない。説明のために、本開示は、HEVCコード化の状況において、ビデオデコーダ30について説明する。しかしながら、本開示の技法は、他のコード化規格又は方法にも適用可能であり得る。
[0104]本開示の実施形態によれば、ビデオデコーダ30は、少なくとも1つのベースレイヤと少なくとも1つの拡張レイヤとを定義するスケーラブルビデオコード化方式で、ビデオデータをコード化(例えば、復号)するように構成され得る、ダウンサンプリングモジュール170を含み得る。ダウンサンプリングモジュール170は、復号処理の一部として少なくとも幾つかのビデオデータをダウンサンプリングすることができ、ダウンサンプリングは、例えば、図4〜図7に関して下で説明されるように、例えば、ビデオデータと関連付けられる位相変位情報に少なくとも一部に基づいて選択された画像フィルタセットを使用することによって、適応的な方式で実行される。
[0105]図3の例において、ビデオデコーダ30は、複数の機能コンポーネントを含む。ビデオデコーダ30の機能コンポーネントは、エントロピー復号モジュール150と、予測モジュール152と、逆量子化モジュール154と、逆変換モジュール156と、復元モジュール158と、フィルタモジュール159と、復号ピクチャバッファ160とを含む。予測モジュール152は、動き補償モジュール162と、イントラ予測モジュール164とを含む。幾つかの例では、ビデオデコーダ30は、図2のビデオエンコーダ20に関して説明された符号化経路とは全般に逆の復号経路を実行し得る。他の例では、ビデオデコーダ30は、より多数の、より少数の、又は異なる機能コンポーネントを含み得る。
[0106]ビデオデコーダ30は、符号化されたビデオデータを備えるビットストリームを受信し得る。ビットストリームは、複数のシンタクス要素を含み得る。ビデオデコーダ30がビットストリームを受信すると、エントロピー復号モジュール150は、ビットストリームに対して解析動作を実行することができる。ビットストリームに対して解析動作を実行した結果として、エントロピー復号モジュール150は、ビットストリームからシンタクス要素を抽出することができる。解析動作を実行することの一部として、エントロピー復号モジュール150は、ビットストリーム中のエントロピー符号化されたシンタクス要素を、エントロピー復号することができる。予測モジュール152、逆量子化モジュール154、逆変換モジュール156、復元モジュール158、及びフィルタモジュール159は、ビットストリームから抽出されたシンタクス要素に基づいて復号されたビデオデータを生成する、復元動作を実行することができる。
[0107]上で論じられたように、ビットストリームは、一連のNAL単位を備え得る。ビットストリームのNAL単位は、シーケンスパラメータセットNAL単位、ピクチャパラメータセットNAL単位、SEI NAL単位などを含み得る。ビットストリームに対して解析動作を実行することの一部として、エントロピー復号モジュール150は、シーケンスパラメータセットNAL単位からのシーケンスパラメータセット、ピクチャパラメータセットNAL単位からのピクチャパラメータセット、SEI NAL単位からのSEIデータなどを抽出してエントロピー復号する、解析動作を実行することができる。
[0108]加えて、ビットストリームのNAL単位は、コード化されたスライスNAL単位を含み得る。ビットストリームに対して解析動作を実行することの一部として、エントロピー復号モジュール150は、コード化されたスライスNAL単位からコード化されたスライスを抽出してエントロピー復号する、解析動作を実行することができる。コード化されたスライスの各々は、スライスヘッダとスライスデータとを含み得る。スライスヘッダは、スライスに関するシンタクス要素を含み得る。スライスヘッダ中のシンタクス要素は、スライスを含むピクチャと関連付けられたピクチャパラメータセットを識別するシンタクス要素を含み得る。エントロピー復号モジュール150は、コード化されたスライスヘッダ中のシンタクス要素に対して、CABAC復号動作などのエントロピー復号動作を実行して、スライスヘッダを回復することができる。
[0109]コード化されたスライスNAL単位からスライスデータを抽出することの一部として、エントロピー復号モジュール150は、スライスデータ中のコード化されたCUからシンタクス要素を抽出する、解析動作を実行することができる。抽出されたシンタクス要素は、変換係数ブロックと関連付けられたシンタクス要素を含み得る。エントロピー復号モジュール150は次いで、シンタクス要素の幾つかに対してCABAC復号動作を実行することができる。
[0110]エントロピー復号モジュール150が区分化されていないCUに対して解析動作を実行した後、ビデオデコーダ30は、区分化されていないCUに対して復元動作を実行することができる。区分化されていないCUに対して復元動作を実行するために、ビデオデコーダ30は、CUの各TUに対して復元動作を実行することができる。CUの各TUに対して復元動作を実行することによって、ビデオデコーダ30は、CUと関連付けられる残差ビデオブロックを復元することができる。
[0111]TUに対して復元動作を実行することの一部として、逆量子化モジュール154は、TUと関連付けられた変換係数ブロックを逆量子化、例えば、量子化解除することができる。逆量子化モジュール154は、HEVCのために提案される、又はH.264復号規格によって定義される逆量子化処理と同様の方式で、変換係数ブロックを逆量子化することができる。逆量子化モジュール154は、変換係数ブロックのCUのためにビデオエンコーダ20によって計算される量子化パラメータQPを使用して、量子化の程度を決定し、同様に、逆量子化モジュール154が適用するべき逆量子化の程度を決定することができる。
[0112]逆量子化モジュール154が変換係数ブロックを逆量子化した後、逆変換モジュール156は、変換係数ブロックと関連付けられたTUの残差ビデオブロックを生成することができる。逆変換モジュール156は、TUの残差ビデオブロックを生成するために、逆変換を変換係数ブロックに対して適用することができる。例えば、逆変換モジュール156は、逆DCT、逆整数変換、逆カルーネンレーベ変換(KLT)、逆回転変換、逆方向変換、又は別の逆変換を変換係数ブロックに適用することができる。幾つかの例では、逆変換モジュール156は、ビデオエンコーダ20からの信号伝達に基づいて、変換係数ブロックに適用するべき逆変換を決定することができる。そのような例では、逆変換モジュール156は、変換係数ブロックと関連付けられたツリーブロックの4分木のルートノードにおいて信号伝達された変換に基づいて、逆変換を決定することができる。他の例では、逆変換モジュール156は、ブロックサイズ、コード化モードなどのような、1つ又は複数のコード化特性から逆変換を推測することができる。幾つかの例では、逆変換モジュール156はカスケード逆変換を適用することができる。
[0113]幾つかの例では、動き補償モジュール162は、補間フィルタに基づく補間を実行することによって、PUの予測されたビデオブロックを精緻化することができる。サブサンプル精度を有する動き補償に使用されるべき補間フィルタの識別子は、シンタクス要素中に含まれ得る。動き補償モジュール162は、PUの予測されたビデオブロックの生成中にビデオエンコーダ20によって使用されるのと同じ補間フィルタを使用して、参照ブロックのサブ整数サンプルに対する補間される値を算出することができる。動き補償モジュール162は、受信されたシンタクス情報に従って、ビデオエンコーダ20によって使用された補間フィルタを決定し、その補間フィルタを使用して予測されるビデオブロックを生成することができる。
[0114]イントラ予測を使用してPUが符号化される場合、イントラ予測モジュール164は、イントラ予測を実行して、PUの予測されるビデオブロックを生成することができる。例えば、イントラ予測モジュール164は、ビットストリーム中のシンタクス要素に基づいて、PUのイントラ予測モードを決定することができる。ビットストリームは、PUのイントラ予測モードを決定するのにイントラ予測モジュール164が使用することができる、シンタクス要素を含み得る。
[0115]幾つかの例では、シンタクス要素は、イントラ予測モジュール164が別のPUのイントラ予測モードを使用して、現在のPUのイントラ予測モードを決定するべきであることを示し得る。例えば、現在のPUのイントラ予測モードが、隣接するPUのイントラ予測モードと同じであることがあり得る。言い換えれば、隣接するPUのイントラ予測モードは、現在のPUに対して最もあり得るモードであり得る。従って、この例では、ビットストリームは、PUのイントラ予測モードが、隣接するPUのイントラ予測モードと同じであることを示す、小さいシンタクス要素を含み得る。イントラ予測モジュール164は次いで、イントラ予測モードを使用して、空間的に隣接するPUのビデオブロックに基づいて、PUの予測データ(例えば、予測されるサンプル)を生成することができる。
[0116]復元モジュール158は、適用可能なとき、CUのTUと関連付けられる残差ビデオブロックとCUのPUの予測されるビデオブロックとを使用して、例えば、イントラ予測データ又はインター予測データのいずれかを使用して、CUのビデオブロックを復元することができる。従って、ビデオデコーダ30は、ビットストリーム中のシンタクス要素に基づいて、予測されたビデオブロックと残差ビデオブロックとを生成することができ、予測されたビデオブロックと残差ビデオブロックとに基づいて、ビデオブロックを生成することができる。
[0117]復元モジュール158がCUのビデオブロックを復元した後、フィルタモジュール159は、デブロッキング動作を実行して、CUと関連付けられるブロック歪みを低減することができる。フィルタモジュール159がデブロッキング動作を実行してCUと関連付けられるブロック歪みを低減した後、ビデオデコーダ30は、復号ピクチャバッファ160にCUのビデオブロックを記憶することができる。復号ピクチャバッファ160は、後続の動き補償、イントラ予測、及び図1の表示装置32などの表示装置上での提示のために、参照ピクチャを与えることができる。例えば、ビデオデコーダ30は、復号ピクチャバッファ160中のビデオブロックに基づいて、他のCUのPUに対して、イントラ予測動作又はインター予測動作を実行することができる。
[0118]HEVCの動き補償ループはH.264/AVCのそれと同様であり、例えば、
Figure 0006342402
但し、Pは、Pフレームのための一方向予測又はBフレームのための双方向予測を示す。
[0119]HEVCにおいて利用可能な、約35個のイントラ予測モードがある。幾つかの実施形態では、
Figure 0006342402
図4は、異なる次元におけるスケーラビリティの実施形態を示す図を提供する。図に示されるように、スケーラビリティは、3つの次元において有効にされ得る。例えば、時間に関して、7.5Hz、15Hz又は30Hzのフレームレートが時間スケーラビリティ(T)によってサポートされ得る。空間スケーラビリティ(S)に関して、QCIF、CIF、及び4CIFのような異なる解像度が有効にされ得る。特定の空間解像度及びフレームレートごとに、ピクチャ品質を改善するためにSNR(Q)レイヤが追加され得る。ビデオコンテンツがスケーラブルな方法で符号化されると、例えば、送信チャネル及び/又は他のパラメータに依存し得る適用の要件に従って、配信されたコンテンツを適応させるために、抽出器ツールが使用され得る。図4に示された実施形態では、各立方体は、同じフレームレート(時間レベル)と、空間解像度と、SNRレイヤとを伴うピクチャを含み得る。幾つかの実施形態では、1つ又は複数の次元において立方体(ピクチャ)を追加することによって、改善された表現が達成され得る。加えて、有効にされた2つ、3つ又は更に多くのスケーラビリティがあるとき、複合スケーラビリティがサポートされ得る。
[0120]HEVC SVC規格によれば、最下位の空間レイヤ及び品質レイヤはH.264/AVCと互換性があり得るが、最下位の時間レベルにおけるピクチャは時間ベースレイヤを形成してよく、これは、より上位の時間レベルにおけるピクチャによって増強され得る。H.264/AVC互換レイヤに加えて、空間スケーラビリティ及び/又は品質スケーラビリティを与えるために幾つかの空間及び/又はSNR拡張レイヤが追加され得る。本明細書で使用される場合、SNRスケーラビリティは、品質スケーラビリティとも呼ばれ得る。各空間又はSNR拡張レイヤ自体は、H.264/AVC互換レイヤと同じ時間スケーラビリティ構造によって、時間的にスケーラブルであり得る。1つの空間又はSNR拡張レイヤについて、それが依存するより下位のレイヤは、そのような空間又はSNR拡張レイヤのベースレイヤとも呼ばれ得る。
[0121]図5は、SVCコード化構造の実施形態を示す。最下位の空間レイヤと品質レイヤとを伴うピクチャ(QCIF解像度を有する、レイヤ0及びレイヤ1中のピクチャ)は、H.264/AVCと互換性があり得る。それらの中で、最下位の時間レベルのピクチャは、図5のレイヤ0に示されているように、時間ベースレイヤを形成し得る。この時間ベースレイヤ(レイヤ0)は、より上位の時間レベル(レイヤ1)のピクチャによって増強され得る。H.264/AVC互換レイヤに加えて、空間スケーラビリティ及び/又は品質スケーラビリティを与えるために幾つかの空間及び/又はSNR拡張レイヤが追加され得る。例えば、拡張レイヤは、レイヤ2と実質的に同じ解像度を有するCIF表現であり得る。図示される実施形態では、レイヤ3はSNR拡張レイヤである。示されるように、空間又はSNR拡張レイヤ自体は、H.264/AVC互換レイヤと実質的に同じ時間スケーラビリティ構造によって、時間的にスケーラブルであり得る。更に、拡張レイヤは空間解像度とフレームレートの両方を向上させことができる。例えば、レイヤ4は、フレームレートを15Hzから30Hzに更に増加させる4CIF拡張レイヤを提供し得る。
[0122]図6Aに示されるように、単一の同じ時間的な瞬間のコード化されたスライスは、ビットストリーム順序で連続していてよく、SVCの文脈における1つのアクセス単位を形成してよい。それらのSVCアクセス単位は、次いで、表示順序とは異なり得る、例えば、時間的な予測関係によって決定され得る、復号順序に従い得る。
[0123]SVCの幾つかの機能はH.264/AVCから引き継がれている。以前のスケーラブル規格と比較して、HEVC SVCの幾つかの利点、即ち、レイヤ間予測及び単一ループの復号が、以下でより詳細に論じられる。
単一ループの復号
[0124]複雑さの小さいデコーダを保つために、SVCでは単一ループの復号が必須である。単一ループの復号では、各々のサポートされるレイヤは、単一の動き補償ループによって復号され得る。これを達成するために、レイヤ間イントラ予測の使用は、同じ位置にある参照レイヤの信号がそれのためにイントラコード化される、拡張レイヤのマクロブロックのみに対して可能にされる。より上位のレイヤをレイヤ間予測するために使用される全てのレイヤが、制約されたイントラ予測を使用してコード化されることが、更に要求される。
レイヤ間予測
[0125]SVCは、テクスチャ、残差及び動きに基づいて、空間スケーラビリティ及び/又はSNRスケーラビリティのためのレイヤ間予測を提供する。SVCにおける空間スケーラビリティは、2つのレイヤ間の任意の解像度比に関連し得る。幾つかの実施形態では、SNRスケーラビリティは、粗粒度スケーラビリティ(CGS:Coarse Granularity Scalability)又は中粒度スケーラビリティ(MGS:Medium Granularity Scalability)によって実現される。SVCでは、異なる空間レイヤ又はCGSレイヤは、(例えば、NAL単位ヘッダ中でdependency_idによって示される)異なる依存性レイヤに属し得るが、異なるMGSレイヤは同じ依存性レイヤ中にあり得る。単一の依存性レイヤは、品質拡張レイヤに対応する、0からより高い値までのquality_idと関連付けられる品質レイヤを含み得る。SVCでは、レイヤ間予測方法は、レイヤ間の冗長性を低減するために利用され得る。様々なレイヤ間予測方法が、以下でより詳細に説明される。
レイヤ間イントラ予測
[0126]SVCでは、レイヤ間イントラ予測を使用するコード化モードは、SVCでは「intraBL」モードと呼ばれ得る。単一ループの復号を可能にするために、制約されるイントラモードとしてコード化されるベースレイヤの中に同じ位置にあるMBを有するMBのみに対して、レイヤ間イントラ予測が利用可能であり得る。制約されるイントラモードMBは、隣接するインターコード化されたMBからのサンプルを参照することなくイントラコード化される。複数ループの復号が利用可能である実施形態では、同じ位置にあるベースレイヤのブロックがどのようにコード化されるかについて、そのような制約はなくてよい。幾つかの実施形態では、同じ位置にあるMBは、空間解像度比に従ってアップサンプリングされ得る。
[0127]図6Bは、intraBLモード予測の例400の概略を示す。特に、拡張レイヤ420はベースレイヤ410と同じ位置にある。ベースレイヤ410の中のブロック412は、拡張レイヤの中のブロック422に対応し得る。intraBLモードでは、ブロック422の中のテクスチャは、対応するベースレイヤのブロック412のテクスチャを使用して予測され得る。ベースレイヤのブロック412は、拡張画像(enhancement image)がベースレイヤ画像よりも大きいサイズを有する場合、アップサンプリングを必要とし得る。(残余と呼ばれる)予測誤差は、変換され、量子化され、エントロピー符号化され得る。
レイヤ間残差予測
[0128]MBが残差予測を使用するように指示される実施形態では、レイヤ間予測のための同じ位置にあるベースレイヤMBは、様々な制約を有し得る。例えば、そのようなMBはインターMBであることが必要とされ得る。加えて、関連する空間解像度比に従って、MBの残差をアップサンプリングすることが必要である、又は望ましいことがある。拡張レイヤとベースレイヤのそれとの間の残差の差分は、予測の目的でコード化され使用され得る。
Figure 0006342402
ベースレイヤピクチャに対するアップサンプリング処理
[0129]空間スケーラビリティに関して、ベースレイヤ及び拡張されたレイヤは異なる空間解像度を有し得る。従って、ベースレイヤに対してアップサンプリングフィルタリングを利用して、拡張されたレイヤの空間解像度比と一致させることが必要であり、又は望ましいことがある。例えば、アップサンプリングフィルタセットはベースレイヤのために使用されてよく、フィルタは、分数画素シフト(例えば、位相)に従ってセットから選ばれる。幾つかの実施形態では、位相は、空間アスペクト比、及びベースレイヤピクチャと拡張されたレイヤピクチャとの間の相対的な画素グリッド位置に基づいて計算され得る。
[0130]図6C(b)は、二進空間スケーラビリティのためのH.264/SVCアップサンプリング手順における、ベースレイヤ及び拡張レイヤの相対的なルーマサンプリンググリッドの実施形態を示す。幾つかの実施形態では、拡張されたレイヤピクチャとベースレイヤピクチャとの間の分数画素シフトは、示されるように、0.25及び0.75である。H.264/SVC規格では、位相は1/16の精度で量子化されてよく、これは、1つのフィルタセット中に16個のフィルタをもたらし得る。
[0131]幾つかの実施形態では、単一のアップサンプリングフィルタが、レイヤ間予測のためのスケーリングされたコンテンツを生成するために、ベースレイヤピクチャに適用され得る。ある状況では単一のアップサンプリングフィルタが適切であり得るが、複数のレイヤ間予測のタイプに関しては、それは適切又は理想的ではないことがある。幾つかの実施形態では、複数のアップサンプリングフィルタ又はフィルタのセットが、例えば、intraBL、異なる領域のイントラ及びインター予測、及び/又は残差予測を含む、幾つかのレイヤ間予測方法のコード化性能を更に改善するために利用される。そのような概念が、以下でより詳細に開示される。
[0132]幾つかの実施形態では、ビデオコード化システムは、空間スケーラビリティの目的で複数のアップサンプリングを、更に、SNRスケーラビリティの目的で複数の事前処理フィルタを利用する。例えば、同じ位置にあるベースレイヤサンプルを処理するための専用のフィルタが、使用されているレイヤ間予測のタイプに少なくとも一部に基づいて選ばれ得る。幾つかの実施形態では、フィルタセットは、オフラインで設計され、システム中でハードコード化され得る。或いは、フィルタセットは、コード化内容に従って導出され、ビットストリームで送信され得る。加えて、ダウンサンプリング処理で使用される位相シフトは、ビットストリームで信号伝達され得る。
[0133]本明細書で開示される幾つかの実施形態は2レイヤのスケーラブルビデオコード化の文脈で提示されるが、当業者は、開示される実施形態が、単一のレイヤが複数のベースレイヤ及び/又は拡張レイヤを有する場合のような、複数のレイヤの場合に拡張され得ることを理解し得る。
アップサンプリング処理におけるサンプル位置のマッピング
[0134]図6C及び図6Dは、ダウンサンプリングされるビデオと元のビデオとの間の異なるサンプル位置のマッピング方法が適用される、2つのダウンサンプリング方式を示す。例えば、四角形510と、512と、514とを含む四角形は、拡張レイヤの画素の位置に対応し得る。円520と522とを含む円は、ベースレイヤの画素の位置に対応し得る。ルーマのダウンサンプリングのために、2つのサンプリング位置の例が図6C(a)及び図6C(b)に示される。「0位相ダウンサンプリング」と呼ばれる図6C(a)では、拡張レイヤの画素510とベースレイヤの画素520との間の空間距離は0である(「位相」は、一般に、拡張レイヤの中の左上のサンプルと、ベースレイヤの中の対応する左上のサンプルとの間の空間距離を指し得る)。「対称的なダウンサンプリング」と呼ばれる図6C(b)では、拡張レイヤの中のルーマサンプルの4×4のアレイは、ベースレイヤの中の2×2のアレイへとダウンサンプリングされ、2つのレイヤは同じ中心位置を有する。
[0135]スケーリングされるとき、ベースレイヤピクチャ及び拡張レイヤピクチャは異なるサイズを有し得る。例えば、2倍の空間スケーラビリティでは、図6Cに示されるように、ベースレイヤピクチャの幅は拡張レイヤピクチャの幅の半分であり、ベースレイヤピクチャの高さは拡張レイヤピクチャの高さの半分である。一例では、ベースレイヤのシーケンスは、拡張レイヤをダウンサンプリングすることによって生成され得る。レイヤ間のテクスチャ予測を実行するために、アップサンプリングが、再構築されたベースレイヤピクチャに適用され得る。
[0136]図6C(a)及び図6D(a)に示されるダウンサンプリング方式は、HEVC−SVCにおいてベースレイヤのコンテンツの使用済みテストシーケンスを生成するために使用されてよく、ダウンサンプリングされたピクチャと元のピクチャの左上の画素グリッドが整列される。この例では、ダウンサンプリングされたピクチャと元のピクチャとの間の左上のグリッドの位相シフトは0である。拡張レイヤとベースレイヤとの間に、0位相の関係がある。
[0137]図6C(b)及び図6D(b)に示されるダウンサンプリング方式は、H.264−SVCにおけるデフォルトのダウンサンプリング処理であり、ダウンサンプリングされたピクチャと元のピクチャとの間の位相シフトは、全ての画素グリッドにおいて等しく配分される。ダウンサンプリングされたピクチャと元のピクチャとの間の全体的な位相シフトは0である。図6C(b)では、拡張レイヤとベースレイヤとの間に、対称的な位相の関係がある。
[0138]幾つかの実施形態では、図6C(a)及び図6D(a)によって示される方式は、ダウンサンプリングフィルタリング処理で使用される。水平方向の座標は、次の式によって計算され得る。
Figure 0006342402
[0139]ここで、x_enhanceは処理されるべき拡張ピクチャ(enhancement picture)中のサンプルの水平方向の座標であり、x_baseはベースレイヤの中の対応するサンプルの水平方向の座標である。上で言及されたように、x_baseは1/16の精度で量子化され得る。整数位置を表す値は16によって除算された量子化された値に等しく、一方、分数位置を表す位相は量子化された値を16で除算した際の余りに等しい。
[0140]幾つかの実施形態では、図6C(b)及び図6D(b)によって示される方式は、ダウンサンプリングフィルタリング処理で使用される。水平方向の座標は、次の式によって計算され得る。
Figure 0006342402
[0141]現実的なビデオコーデックの設計では、式(1)及び(2)は、計算の複雑さを下げるために整数化され得る(例えば、整数にされ得る)。
[0142]式(1)によって計算されるxbaseと式(2)によって計算されるxbaseとの間には一定の差があり得る。一実施形態では、アップサンプリング処理で使用されるグリッド位置の差分の情報(例えば、位相情報)は、ビットストリームで信号伝達され得る。この情報は、SPS、PPS、APS、又はスライスヘッダシンタクス要素として信号伝達され得る。
[0143]ある実施形態では式(2)に関連する手順がデフォルトの方法として規定され得る。値Mは、追加のシフトを表すための、信号伝達されたSPS、PPS、又はスライスヘッダであり得る。
Figure 0006342402
[0144]ある実施形態では、式(3)に関連する手順がデフォルトの方法として規定され得る。値Mは、追加の位相修正を表すための、信号伝達されたSPS、PPS、又はスライスヘッダであり得る。
[0145]別の実施形態では、情報信号伝達されるSPS、PPS、又はスライスヘッダはフラグである。フラグは、図6C及び図6Dに示される2つのダウンサンプリング方式のどの1つがダウンサンプリングされたベースレイヤピクチャを生成するために適用されるかを示すために使用され得る。対応する位置マッピング方法は、アップサンプリング処理で使用され得る。
[0146]同様に、上記の方法は、垂直方向のサンプル位置マッピングに適用され得る。ある実施形態では、SPS、PPS、及びスライスヘッダで信号伝達される上記の位置マッピング情報は、水平方向及び垂直方向で独立に信号伝達され得る。
[0147]別の実施形態として、SPS、PPS、及びスライスヘッダで信号伝達される上記の位置マッピング情報は、一度だけ信号伝達され、水平方向と垂直方向の両方で使用され得る。
[0148]ダウンサンプリング位置(例えば、位相情報)は、アップサンプリング処理で必要とされ得る。例えば、図6C(a)で示されるような所与の0位相のダウンサンプリング、拡張レイヤの画素(例えば、510及び512)は、ベースレイヤの画素(例えば、520及び522)からアップサンプリングされる必要があり得る。510及び520は同じ位置にあるので(この例では)、510を生成するためのアップサンプリングフィルタの位相は0である。また、512は520と522の中間点であるので、512を生成するためのアップサンプリングフィルタの位相は1/2である。まとめると、0位相のダウンサンプリングフィルタによる2倍の空間スケーラビリティのために、アップサンプリングフィルタの位相は、0及び1/2であるべきである。同様の分析を使用して、図6C(b)に示されるような、対称的なダウンサンプリングにおける2倍の空間スケーラビリティのために、アップサンプリングフィルタの位相は1/4及び3/4であるべきである。
[0149]幾つかの実施形態では、コーデックが正確なアップサンプリングの位相/位置を選べるように、ダウンサンプリング位置(例えば、位相)情報を信号伝達することが実行される。これは、とりわけ、ビデオパラメータセット(VPS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)、スライスヘッダのような、高レベルのシンタクスを使用して、フラグを信号伝達することによって達成され得る。このフラグは、アップサンプリングの位相の計算のための処理に組み込まれる。
[0150]図7は、ビデオ情報をコード化するための処理700の実施形態を示す。処理は、ブロック710に示されるような、ビデオ情報の第1のレイヤを取得することを含み得る。処理は更に、ブロック720に示されるような、第1のレイヤに対するビデオ情報の第2のレイヤの位相変位情報を決定することを含み得る。処理700は更に、位相変位情報に少なくとも一部に基づいて、画像フィルタを選択することを含み得る。更に、ブロック740で、処理700は更に、選択されたフィルタを使用して第1のレイヤの修正されたバージョンを生成することを含み得る。例えば、幾つかの実施形態では、第1のレイヤはベースレイヤであり、第1のレイヤの修正されたバージョンは第1のレイヤのアップサンプリングされたバージョンであってよく、選択された画像フィルタはアップサンプリングフィルタである。或いは、幾つかの実施形態では、第1のレイヤは拡張レイヤであり、第1のレイヤの修正されたバージョンは第1のレイヤのダウンサンプリングされたバージョンであってよく、選択された画像フィルタはダウンサンプリングフィルタである。
[0151]ある実施形態では、位相情報を示すフラグは、SPSで信号伝達される。他の実施形態では、フラグは、PPS及びVPSのような、他の高レベルシンタクスを使用して信号伝達され得る。表1は、ある実施形態による、フラグの例示的なセットを示す。
Figure 0006342402
[0152]luma_phase_flagは、現在のレイヤピクチャにおけるルーマサンプルの位置、及びレイヤ間予測のために使用され得るレイヤピクチャのためのレイヤフレームのルーマサンプルの位置が対称的かどうかを、規定することができる。例えば、1に等しく設定されたluma_phase_flagは、現在のレイヤピクチャにおけるルーマサンプルの位置、及びレイヤ間予測のために使用され得るレイヤピクチャのためのレイヤフレームのルーマサンプルの位置が対称的である(例えば、図6C(b)に示されるように)と、規定することができる。加えて、0に等しいluma_phase_flagは、現在のレイヤピクチャにおける左上のルーマサンプルの位置、及びレイヤ間予測のために使用され得るレイヤピクチャのためのレイヤフレームの左上のルーマサンプルの位置が垂直方向と水平方向の両方で0位相のシフトを有する(例えば、図6C(a)に示されるように)と、規定することができる。luma_phase_flagが存在しないとき、それは0に等しいと推測され得る。
[0153]chroma_phase_x_flagは、フレーム又はレイヤフレームの半分のルーマサンプルの単位で、クロマ成分の水平方向の位相シフトを規定することができる。chroma_phase_x_flagが存在しないとき、それは0に等しいと推測され得る。位相シフトは、左上のクロマサンプルと左上のルーマサンプルとの間の空間変位を指し得る。
[0154]chroma_phase_yは、フレーム又はレイヤフレームの半分のルーマサンプルの単位で、クロマ成分の垂直方向の位相シフトを規定することができる。chroma_phase_yが存在しないとき、それは0に等しいと推測され得る。chroma_phase_yの値は、両端値を含む0〜2の範囲にあり得る。位相シフトは、左上のクロマサンプルと左上のルーマサンプルとの間の空間変位を指し得る。
[0155]ref_layer_chroma_phase_x_flagは、レイヤ間予測のために使用され得るレイヤピクチャのためのレイヤフレームの半分のルーマサンプルの単位で、クロマ成分の水平方向の位相シフトを規定することができる。ref_layer_chroma_phase_x_flagが存在しないとき、それはchroma_phase_x_flagに等しいと推測され得る。位相シフトは、左上のクロマサンプルと左上のルーマサンプルとの間の空間変位を指し得る。
[0156]ref_layer_chroma_phase_yは、レイヤ間予測のために使用され得るレイヤピクチャのためのレイヤフレームの半分のルーマサンプルの単位で、クロマ成分の垂直方向の位相シフトを規定することができる。ref_layer_chroma_phase_yが存在しないとき、それはchroma_phase_yに等しいと推測され得る。ref_layer_chroma_phase_yの値は、両端値を含む0〜2の範囲にあり得る。位相シフトは、左上のクロマサンプルと左上のルーマサンプルとの間の空間変位を指し得る。
[0157]幾つかの実施形態では、変数refWL、refHL、scaledWL、及びscaledHLは次のように定義され得る。
refWL:ルーマサンプルに関する参照レイヤピクチャの幅
refHL:ルーマサンプルに関する参照レイヤピクチャの高さ
scaledWL:ルーマサンプルに関する現在のレイヤピクチャの幅
scaledHL:ルーマサンプルに関する現在のレイヤピクチャの高さ
[0158]幾つかの実施形態では、変数refWC、refHC、scaledWC、及びscaledHCは次のように定義され得る。
refWC:クロマサンプルに関する参照レイヤピクチャの幅
refHC:クロマサンプルに関する参照レイヤピクチャの高さ
scaledWC:クロマサンプルに関する現在のレイヤピクチャの幅
scaledHC:クロマサンプルに関する現在のレイヤピクチャの高さ
[0159]幾つかの実施形態では、変数PhaseXL、PhaseYL、refPhaseXC、refPhaseYC、phaseXC、及びphaseYCは、以下によって導出され得る。
PhaseXL = 2* luma_phase_flag
PhaseYL = 2* luma_phase_flag
refPhaseXL = 2* luma_phase_flag
refPhaseYL = 2* luma_phase_flag
phaseXC = chroma_phase_x _flag + luma_phase_flag
phaseYC = chroma_phase_y + luma_phase_flag
refPhaseXC = ref_layer_chroma_phase_x_flag+ luma_phase_flag
refPhaseYC = ref_layer_chroma_phase_y + luma_phase_flag
[0160]幾つかの実施形態では、変数shiftX及びshiftYは、以下によって導出され得る。
shiftX = 16
shiftY = 16
[0161]幾つかの実施形態では、変数refW、refH、phaseX、phaseY、scaledW、scaledH、refPhaseX、及びrefPhaseYは、refWL、refHL、phaseXL、phaseYL、scaledWL、scaledHL、refPhaseXL、及びrefPhaseYLであるは、ルーマサンプルに対して定義されてよく、refWC、refHC、phaseXC、phaseYC、scaledWC、scaledHC、refPhaseXC、及びrefPhaseYCは、クロマサンプルに対して定義され得る。
[0162]例えば、変数scaleX及びscaleYは、以下によって導出され得る。
scaleX=((refW<<shiftX)+(scaledW>>1))/scaledW
scaleY=((refH<<shiftY)+(scaledH>>1))/scaledH
[0163]加えて、変数addX及びdeltaXは、以下によって導出され得る。
addX=(((refW*phaseX)<<(shiftX-2))+(scaledW>>1))/scaledW
+(1<<(shiftX-5))
deltaX=4*refPhaseX
[0164]更に、変数addY及びdeltaYは、以下によって導出され得る。
addY=(((refH*phaseY)<<(shiftY-2))+(scaledH>>1))/scaledH
+(1<<(shiftY-5))
deltaY=4*refPhaseY
[0165]また、現在のレイヤにおける位置(x,y)に対して、参照レイヤのサンプル位置(1/16サンプルの単位の)(xRef16,yRef16)が、以下によって導出され得る。
xRef16=((x*scaleX+addX)>>(shiftX-4))-deltaX
yRef16=((y*scaleY+addY)>>(shiftY-4))-deltaY
[0166]別の実施形態では、ルーマサンプルのダウンサンプリングでは、1つの次元(例えば、水平方向の次元)が0ではない位相を使用することができ、他の次元(例えば、垂直方向の次元)が0の位相を使用することができる。例えば、水平方向の次元と垂直方向の次元に対する位相情報は、別々に信号伝達され得る。表2は、この実施形態による、フラグの例示的なセットを示す。
Figure 0006342402
[0167]luma_phase_x_flagは、現在のレイヤピクチャにおけるルーマサンプルの水平方向の位置、及びレイヤ間予測のために使用され得るレイヤピクチャのためのレイヤフレームのルーマサンプルの水平方向の位置が対称的かどうかを、規定することができる。例えば、1に等しく設定されたluma_phase_x_flagは、現在のレイヤピクチャにおけるルーマサンプルの水平方向の位置、及びレイヤ間予測のために使用され得るレイヤピクチャのためのレイヤフレームのルーマサンプルの水平方向の位置が対称的であると、規定することができる。また、0に等しく設定されたluma_phase_x_flagは、現在のレイヤピクチャにおける左上のルーマサンプルの位置、及びレイヤ間予測のために使用され得るレイヤピクチャのためのレイヤフレームの左上のルーマサンプルの位置が水平方向に0位相のシフトを有すると、規定することができる。luma_phase_x_flagが存在しないとき、それは0に等しいと推測され得る。
[0168]luma_phase_y_flagは、現在のレイヤピクチャにおけるルーマサンプルの垂直方向の位置、及びレイヤ間予測のために使用され得るレイヤピクチャのためのレイヤフレームのルーマサンプルの垂直方向の位置が対称的かどうかを、規定することができる。例えば、1に等しく設定されたluma_phase_y_flagは、現在のレイヤピクチャにおけるルーマサンプルの垂直方向の位置、及びレイヤ間予測のために使用され得るレイヤピクチャのためのレイヤフレームのルーマサンプルの垂直方向の位置が対称的であると、規定することができる。また、0に等しく設定されたluma_phase_y_flagは、現在のレイヤピクチャにおける左上のルーマサンプルの位置、及びレイヤ間予測のために使用され得るレイヤピクチャのためのレイヤフレームの左上のルーマサンプルの位置が垂直方向に0位相のシフトを有すると、規定することができる。luma_phase_y_flagが存在しないとき、それは0に等しいと推測され得る。
[0169]この実施形態では、変数PhaseXL、PhaseYL、refPhaseXC、refPhaseYC、phaseXC、及びphaseYCは、以下によって導出され得る。
PhaseXL=2*luma_phase_x_flag
PhaseYL=2*luma_phase_y_flag
refPhaseXL=2*luma_phase_x_flag
refPhaseYL=2*luma_phase_y_flag
phaseXC=chroma_phase_x_flag+luma_phase_x_flag
phaseYC=chroma_phase_y+luma_phase_y_flag
refPhaseXC=ref_layer_chroma_phase_x_flag+luma_phase_x_flag
refPhaseYC=ref_layer_chroma_phase_y+luma_phase_y_flag
[0170]幾つかの実施形態では、クロマサンプリング位置を信号伝達する変数chroma_phase_x_flag、ref_chroma_phase_x_flag、chroma_phase_y、及びref_chroma_phase_yに対して、バイナリ値がx次元のシンタクスのために使用されてよく、一方y次元のためのシンタクス値は更なる値を有してよい。他の実施形態では、異なる組合せがあり得る。例えば、クロマサンプリング位置を信号伝達する変数chroma_phase_x_flag、ref_chroma_phase_x_flag、chroma_phase_y、及びref_chroma_phase_yの各々は、バイナリ値であり得る。別の例では、クロマサンプリング位置を信号伝達する変数chroma_phase_x_flag、ref_chroma_phase_x_flag、chroma_phase_y、及びref_chroma_phase_yの各々は、バイナリではない複数レベルの値を有し得る。具体的には、クロマサンプリング位置を信号伝達する変数chroma_phase_x_flag、ref_chroma_phase_x_flag、chroma_phase_y、及びref_chroma_phase_yの各々は、バイナリの値、又はバイナリではない複数レベルの値のいずれかを有し得る。
[0171]幾つかのシステムでは、各光学センサ(例えば、画素)の位置には小さなずれがあることがあり、中心の画素に対する光学経路は、境界の画素とはわずかに異なることがある。例えば、図8Aは、1Dの画素アレイにおける画素の不整列の例を示す。画素情報の不整列の例の概略。具体的には、装置の欠陥により、画素2及び画素3が整列されていない。2桁のダウンサンプリングを実行するとき、画素1、3、及び5が取得され、これら自体が相対的に整列される。しかしながら、ベースレイヤがレイヤ間参照ピクチャのために使用されるとき、図8Bに示されるように、二進の位相が整列されたアップサンプリング、不整列の結果。アップサンプリングされた画素2及び4は、この例では、画素2及び4の元の位置と整列されていない。従って、整列されていない画素を使用して元の画素を予測することは、拡張レイヤのコード化効率に悪影響を与えるであろう。
[0172]幾つかの実施形態では、各々の線と列の位相の不整列が、例えばSPSを使用して信号伝達され得る。拡張レイヤデコーダは、信号伝達された情報を使用して位相差を調整し、より良好な予測を得ることができる。また、位相情報は、オーバーヘッドを低減するために圧縮され得る。
[0173]幾つかの実施形態では、位相の不整列は、各線及び各列の中では同様であり得る。しかしながら、撮像機器が異質な位相の不整列を有すると判明した場合、位相不整列情報は、x画素座標及びy画素座標から位相オフセットへとマッピングする関数としてモデル化され得る。この関数の形式は、非常に柔軟性があってよく、例えば多項式であってよい。関数の係数は、オフラインで推定され、SPSによって信号伝達され得る。
[0174]デコーダ側において、デコーダは、各画素に対する位相オフセットを計算し、それに従ってアップサンプリング手順を調整又は変更して、より良好な予測信号を得ることができる。
[0175]前に説明されたように、幾つかの実施形態では、chroma_phase_x_flag、chroma_phase_y、ref_chroma_phase_x_flag、及びref_chroma_phase_yという、クロマサンプリング位置情報に対するシンタクス要素がある。現在のレイヤ及びその参照レイヤのためのクロマサンプリング位置情報は、各レイヤに対して信号伝達され得る。
[0176]他の実施形態では、ビデオ信号は複数の成分を有し得る。例えば、それらは、Y成分、U成分、及びV成分であり得る。加えて、成分のサンプリング密度は異なり得る。例えば、4:2:0のフォーマットでは、U又はVのサンプリング比は、水平方向と垂直方向の両方でYの1/2である。言い換えると、2×2のYサンプルは、1つのUサンプルと1つのVサンプルとに対応する。2×2のY成分の左上のサンプルに対するUサンプル又はVサンプルのサンプリング位置は異なり得る。
[0177]図9は、クロマサンプル位置の幾つかの例を示す。例えば、910はクロマサンプルのタイプ2の例であり、920はクロマサンプルのタイプ3の例であり、930はルーマサンプルのトップフィールドの例であり、940はクロマサンプルのタイプ0の例であり、950はクロマサンプルのタイプ1の例であり、960はクロマサンプルのタイプ4の例であり、970はクロマサンプルのタイプ5の例であり、かつ980はルーマサンプルのボトムフィールドの例である。示されるように、灰色の塗りつぶしは、ボトムフィールドのサンプルタイプを示すことができ、一方、塗りつぶしなしは、トップフィールドのサンプルタイプを示すことができる。
[0178]幾つかの実施形態では、全てのサポートされるレイヤに対して、クロマサンプリング位置情報はVPSレベルで送信される。表3は、この実施形態による、フラグの例示的なセットを示す。
Figure 0006342402
[0179]chroma_phase_x_flag[i]は、CVSにおけるiというレイヤインデックスを有するピクチャ又はレイヤピクチャの、半分のルーマサンプルの単位での、クロマ成分の水平方向の位相シフトを規定することができる。chroma_phase_x_flagが存在しないとき、それは0に等しいと推測され得る。位相シフトは、左上のクロマサンプルと左上のルーマサンプルとの間の空間変位を指し得る。
[0180]chroma_phase_y[i]は、CVSにおけるiというレイヤインデックスを有するピクチャ又はレイヤピクチャの、半分のルーマサンプルの単位での、クロマ成分の垂直方向の位相シフトを規定することができる。chroma_phase_yが存在しないとき、それは0に等しいと推測され得る。chroma_phase_yの値は、両端値を含む0〜2の範囲にあり得る。位相シフトは、左上のクロマサンプルと左上のルーマサンプルとの間の空間変位を指し得る。
[0181]別の実施形態では、chroma_phase_x_flag及びchroma_phase_yの単一の値が、全てのレイヤに信号伝達され適用され得る(例えば、全てのレイヤが同じクロマサンプリング位置を有し得る)。表4は、この実施形態による、フラグの例示的なセットを示す。
Figure 0006342402
[0182]chroma_phase_x_flagは、CVSにおける全てのピクチャの、半分のルーマサンプルの単位での、クロマ成分の水平方向の位相シフトを規定することができる。chroma_phase_x_flagが存在しないとき、それは0に等しいと推測され得る。位相シフトは、左上のクロマサンプルと左上のルーマサンプルとの間の空間変位を指し得る。
[0183]chroma_phase_yは、CVSにおける全てのピクチャの、半分のルーマサンプルの単位での、クロマ成分の垂直方向の位相シフトを規定することができる。chroma_phase_yが存在しないとき、それは0に等しいと推測され得る。chroma_phase_yの値は、両端値を含む0〜2の範囲にあり得る。位相シフトは、左上のクロマサンプルと左上のルーマサンプルとの間の空間変位を指し得る。
デフォルトの適応アップサンプルフィルタ
[0184]表5及び表6に列挙されたフィルタセットは、アップサンプリングの実施形態におけるフィルタセットの例を提供する。列挙された1次元のアップサンプリングフィルタは、水平方向、垂直方向、又は両方向を使用した可能性。表5及び表6に列挙されたフィルタセットは、例えば、位相変位情報がビットストリームで信号伝達されない場合に選択すべき、デフォルトのフィルタセットとして使用され得る。
Figure 0006342402
Figure 0006342402
適応アップサンプルフィルタ(AUF)
[0185]一実施形態では、アップサンプリング処理で使用されるフィルタ係数は、ビットストリームで信号伝達され得る。例えば、フィルタは、SPS、PPS、又はスライスヘッドレベルシンタクスで信号伝達され得る。フィルタがSPSレベルで信号伝達されるとき、信号伝達されたフィルタが、シーケンス全体でデフォルトのフィルタを置き換えるために使用され得る。フィルタがPPS又はスライスヘッドレベルで信号伝達されるとき、信号伝達されたフィルタが、対応するピクチャ又はスライスにおいてデフォルトのフィルタを置き換えるために使用され得る。
[0186]アップサンプリングフィルタリング処理において、フィルタセットの中の幾つかのフィルタだけが、特定の空間スケーラブルな用途に利用される。一実施形態では、これらのフィルタの係数のみが信号伝達される。上で説明されたサンプリングマッピング方法が、アップサンプリング処理に関与するこれらのフィルタの位相を導出するために使用され得る。
[0187]ある実施形態では、簡略化されたバージョンが実装され得る。例えば、比2.0と1.5とを有する空間スケーラビリティのみがサポートされると仮定される場合、拡張レイヤとベースレイヤとの間の空間比を示すために、インデックスがSPSで信号伝達され得る。シンタクスは、現在のエンハンスレイヤが空間スケーラビリティレイヤであるか又はSNRスケーラビリティレイヤであるかを示すためのフラグであってよく、別のフラグは、空間比2.0と1.5とを区別することができる。
[0188]適応アップサンプリングフィルタが対応するピクチャ又はスライスにおいて有効にされるかどうかを示すために、フラグがPPS又はスライスヘッドにおいて信号伝達され得る。そのフラグが真であるとき、関与する位相のフィルタ係数が信号伝達され、それ以外の場合、デフォルトのフィルタがアップサンプリング処理において使用され得る。或いは、適応アップサンプリングフィルタが特定の方向において有効にされるかどうかを示すために、2つのフラグが、水平方向及び垂直方向に対して別々に信号伝達され得る。
[0189]適応アップサンプリングフィルタが有効にされるとき、フィルタ長情報Nが、アップサンプリング処理で使用されるフィルタの長さを示すために信号伝達され得る。
[0190]長さNのフィルタに対して、フィルタ係数は、coeff[i],i=0,…,N−1によって表され得る。幾つかの実施形態では、N−1個の係数だけが各フィルタに対して信号伝達されてよく、フィルタの残りの1つの係数は信号伝達されず、デコーダ側において導出され得る。その値は、信号伝達され得るN−1個の係数の合計を(1<<filter_norm)から引いたものに等しく、ここで(1<<filter_norm)は全てのフィルタ係数の合計であり、典型的な値は32、64、及び128であり得る。例として、信号伝達されないものとして選択される係数は、coeff[(N+1)/2−1+(位相+7)/16]であり、これは、このフィルタの最大の係数であると考えられる。
[0191]フィルタ係数は、ある種のVLCによってコード化され得る。1つの例は、係数の絶対値が指数ゴロムコードワード(exponential golomb code word)によってコード化されることである。係数が0ではない場合、係数の符号がコード化される。加えて、フィルタ係数はまた、デフォルトのフィルタの係数から予測され得る。コード化されたフィルタ係数とデフォルトの係数との差分のみが、VLCコード化される。フィルタ係数はまた、以前のコード化されたフィルタコード係数から予測され得る。例えば、水平方向に対するフィルタ係数が事前に信号伝達されているとき、それらが、垂直方向に対するフィルタ係数を予測するために使用され得る。
[0192]フィルタ係数は、水平方向及び垂直方向に対して別々に信号伝達され得る。或いは、1つのフィルタセットが、水平方向と垂直方向の両方に対して信号伝達され適用され得る。加えて、フィルタが水平方向と垂直方向で共有されるかどうかを示すために、フラグが信号伝達され得る。
[0193]フィルタの位相が0又は8であるとき、フィルタは対称的であると考えられる。フィルタ係数の半分だけを信号伝達するために、対称的という特徴を使用することができ、これは、長さNのフィルタに対して、(N+1)/2−1個だけの係数が信号伝達され、残りの係数は導出されるということを意味する。また、フィルタが対称的である場合、位相p1のためのフィルタ及び位相(16−位相1)を有するフィルタは同じ係数を有し得る。即ち、あるフィルタは別のフィルタを反転させることによって得られ得る。フィルタ係数の半分だけを信号伝達するために、対称的であるという特徴を使用することができ、これは、位相p1を有するフィルタと位相(16−位相1)を有するフィルタの両方がアップサンプリング処理に関与するとき、それらの信号1のみことを意味する。
[0194]上で論じられたように、アップサンプリング処理のサンプル位置のマッピングは、幾つかの用途では最適ではないことがある。この場合、適応アップサンプリングフィルタが位相変位に対応するために使用されることが可能であるので、対称的であるという特徴は、そのような用途によって保たれない。本開示は、対称的であるという特徴が適用されるかどうかを示すためのフラグを信号伝達することを提案する。フィルタ係数は、それに対応して信号伝達され得る。
[0195]1つ又は複数の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組合せで実装され得る。各機能は、ソフトウェアで実装される場合、1つ又は複数の命令又はコードとしてコンピュータ可読媒体上に記憶されてよく、或いはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行されてよい。コンピュータ可読媒体は、例えば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、データ記憶媒体又は通信媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得る。このようにして、コンピュータ可読媒体は、全般に、(1)非一時的である有形コンピュータ可読記憶媒体、又は(2)信号又は搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明された技法の実装のための命令、コード及び/又はデータ構造を取り出すために、1つ又は複数のコンピュータ若しくは1つ又は複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。
[0196]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM、CD−ROM又は他の光ディスクストレージ、磁気ディスクストレージ、又は他の磁気記憶装置、フラッシュメモリ、若しくは、命令又はデータ構造の形態の所望のプログラムコードを記憶するために使用されコンピュータによってアクセスされ得る、任意の他の媒体を備え得る。また、如何なる接続もコンピュータ可読媒体と適切に呼ばれる。例えば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、又は赤外線、無線、及びマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、又は他のリモート発信源から送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、又は赤外線、無線、及びマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体及びデータ記憶媒体は、接続、搬送波、信号、又は他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用されるディスク(disk)及びディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)及びブルーレイディスク(登録商標)(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。
[0197]命令は、1つ又は複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、或いは他の等価な集積回路又はディスクリート論理回路などの、1つ又は複数のプロセッサによって実行され得る。従って、本明細書で使用される「プロセッサ」という用語は、前述の構造、又は本明細書で説明される技法の実装に好適な任意の他の構造のいずれかを指す。更に、幾つかの態様では、本明細書で説明された機能は、符号化及び復号のために構成された専用のハードウェア及び/又はソフトウェアモジュール内に与えられてよく、或いは複合コーデックに組み込まれてよい。また、本技法は、1つ又は複数の回路又は論理要素中で十分に実装され得る。
[0198]本開示の技法は、ワイヤレスハンドセット、集積回路(IC)、又はICのセット(例えば、チップセット)を含む、多種多様な機器又は装置において実装され得る。本開示では、開示される技法を実行するように構成された機器の機能的態様を強調するために、様々なコンポーネント、モジュール、又はユニットが説明されたが、それらのコンポーネント、モジュール、又はユニットは、必ずしも異なるハードウェアユニットによる実現を必要とするとは限らない。むしろ、上で説明されたように、様々なユニットが、好適なソフトウェア及び/又はファームウェアとともに、上で説明された1つ又は複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられてよく、又は相互動作するハードウェアユニットの集合によって与えられてよい。
[0199]様々な例が説明された。これら及び他の例は以下の特許請求の範囲内に入る。
以下に本件出願当初の特許請求の範囲に記載された発明を付記する。
[1] ビデオ情報をコード化するように構成された装置であって、ビデオデータを記憶するように構成されるメモリと、前記ビデオデータが、ビデオ情報の第1のレイヤを備える、前記メモリと通信しているプロセッサとを備え、前記プロセッサが、前記第1のレイヤに対するビデオ情報の第2のレイヤの位相変位情報を決定し、前記位相変位情報に少なくとも一部に基づいて画像フィルタセットを選択し、前記第1のレイヤと前記特定された画像フィルタセットとを使用して前記第1のレイヤの修正されたバージョンを生成する
ように構成される、装置。
[2] 前記第1のレイヤがベースレイヤを備え、前記第2のレイヤが拡張レイヤを備え、選択された前記画像フィルタセットがアップサンプリング画像フィルタを備え、前記プロセッサが更に、前記位相変位情報を信号伝達する符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取るように構成される、[1]に記載の装置。
[3] 前記第1のレイヤが拡張レイヤを備え、前記第2のレイヤがベースレイヤを備え、選択された前記画像フィルタセットがダウンサンプリング画像フィルタを備え、前記プロセッサが更に、符号化されたビデオビットストリームに対するシンタクス要素を生成して、前記位相変位情報を信号伝達するように構成される、[1]に記載の装置。
[4] 前記位相変位情報が、前記第1のレイヤにおける画素の位置と前記第2のレイヤにおける前記画素の対応する位置との差を備える、[1]に記載の装置。
[5] 前記位相変位情報が、前記第1のレイヤと前記第2のレイヤとの間の、0位相の関係又は対称的な位相の関係のいずれか1つを示す、バイナリ値を備える、[1]に記載の装置。
[6] 前記位相変位情報が、水平方向の位相変位情報を示すための第1のシンタクス要素と、垂直方向の位相変位情報を示すための第2のシンタクス要素とを備える、[1]に記載の装置。
[7] 前記第1のシンタクス要素と前記第2のシンタクス要素の少なくとも1つが、非バイナリ値を備える、[6]に記載の装置。
[8] 前記プロセッサが更に、前記位相変位情報がビットストリームで信号伝達されない場合、デフォルトの画像フィルタセットを選択し、前記位相変位情報がビットストリームで信号伝達される場合、前記位相変位情報に基づいて画像フィルタセットを選択するように構成される、[1]に記載の装置。
[9] 前記デフォルトの画像フィルタセットが、前記第1のレイヤと前記第2のレイヤとの間の対称的な位相の関係に少なくとも一部に基づく、[8]に記載の装置。
[10] 前記デフォルトの画像フィルタセットが、前記第1のレイヤと前記第2のレイヤとの間の0位相の関係に少なくとも一部に基づく、[8]に記載の装置。
[11] 前記位相変位情報が整列情報を備える、[1]に記載の装置。
[12] 前記整列情報が、x画素座標とy画素座標とを位相オフセットにマッピングする関数としてモデル化される、[11]に記載の装置。
[13] 選択された前記画像フィルタセットが、ビットストリームの一部として信号伝達される係数を備える、[1]に記載の装置。
[14] 選択された前記画像フィルタセットが、0という位相シフトに対して係数{0,0,0,64,0,0,0,0}、1という位相シフトに対して{0,1,−3,63,4,−2,1,0}、2という位相シフトに対して{0,2,−6,61,9,−3,1,0}、3という位相シフトに対して{−1,3,−8,60,13,−4,1,0}、4という位相シフトに対して{−1,4,−10,58,17,−5,1,0}、5という位相シフトに対して{−1,4,−11,53,25,−8,3,−1}、6という位相シフトに対して{−1,4,−11,50,29,−9,3,−1}、7という位相シフトに対して{−1,4,−11,45,34,−10,4,−1}、8という位相シフトに対して{−1,4,−11,40,40,−11,4,−1}、9という位相シフトに対して{−1,4,−10,34,45,−11,4,−1}、10という位相シフトに対して{−1,3,−9,29,50,−11,4,−1}、11という位相シフトに対して{−1,3,−8,25,53,−11,4,−1}、12という位相シフトに対して{0,1,−5,17,58,−10,4,−1}、13という位相シフトに対して{0,1,−4,13,60,−8,3,−1}、14という位相シフトに対して{0,1,−3,8,62,−6,2,0}、15という位相シフトに対して{0,1,−2,4,63,−3,1,0}を備える、[1]に記載の装置。
[15] 選択された前記画像フィルタセットが、0という位相シフトに対して係数{0,64,0,0}、1という位相シフトに対して{−2,62,4,0}、2という位相シフトに対して{−2,58,10,−2}、3という位相シフトに対して{−4,56,14,−2}、4という位相シフトに対して{−4,54,16,−2}、5という位相シフトに対して{−6,52,20,−2}、6という位相シフトに対して{−6,48,26,−4}、7という位相シフトに対して{−4,42,30,−4}、8という位相シフトに対して{−4,36,36,−4}、9という位相シフトに対して{−4,30,42,−4}、10という位相シフトに対して{−4,26,48,−6}、11という位相シフトに対して{−2,20,52,−6}、12という位相シフトに対して{−2,16,54,−4}、13という位相シフトに対して{−2,14,56,−4}、14という位相シフトに対して{−2,10,58,−2}、15という位相シフトに対して{0,4,62,−2}を備える、[1]に記載の装置。
[16] 前記メモリとプロセッサとを備える、デスクトップコンピュータ、ノートブックコンピュータ、タブレットコンピュータ、セットトップボックス、電話ハンドセット、テレビジョン、カメラ、表示装置、デジタルメディアプレーヤ、ビデオゲームコンソール、及びビデオストリーミング装置の少なくとも1つを更に備える、[1]に記載の装置。
[17] ビデオ情報を復号する方法であって、ビデオ情報のベースレイヤを取得することと、符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取ることと、前記シンタクス要素が、拡張レイヤに対するビデオ情報の前記ベースレイヤの位相変位情報を備える、前記位相変位情報に少なくとも一部に基づいて画像フィルタセットを選択することと、前記ベースレイヤと前記特定された画像フィルタセットとを使用して前記拡張レイヤのアップサンプリングされたバージョンを生成することとを備える、方法。
[18] 前記位相変位情報が、前記拡張レイヤにおける画素の位置と前記ベースレイヤにおける前記画素の対応する位置との差を備える、[17]に記載の方法。
[19] 前記位相変位情報が、前記拡張レイヤと前記ベースレイヤとの間の、0位相の関係又は対称的な位相の関係のいずれか1つを示す、バイナリ値を備える、[17]に記載の方法。
[20] 前記受け取られたシンタクス要素が、水平方向の位相変位情報を示す第1のシンタクス要素と、垂直方向の位相変位情報を示す第2のシンタクス要素とを備える、[17]に記載の方法。
[21] 前記第1のシンタクス要素及び前記第2のシンタクス要素の少なくとも1つが、非バイナリ値を備える、[20]に記載の方法。
[22] 前記位相変位情報がビットストリームで信号伝達されない場合、デフォルトの画像フィルタセットを選択することと、前記位相変位情報がビットストリームで信号伝達される場合、前記位相変位情報に基づいて画像フィルタセットを選択することとを更に備える、[17]に記載の方法。
[23] 前記デフォルトの画像フィルタセットが、前記拡張レイヤと前記ベースレイヤとの間の対称的な位相の関係に少なくとも一部基づく、[22]に記載の方法。
[24] 前記デフォルトの画像フィルタセットが、前記拡張レイヤと前記ベースレイヤとの間の0位相の関係に少なくとも一部基づく、[22]に記載の方法。
[25] 前記位相変位情報が整列情報を備える、[17]に記載の方法。
[26] 前記整列情報が、x画素座標とy画素座標とを位相オフセットにマッピングする関数としてモデル化される、[17]に記載の方法。
[27] 選択された前記画像フィルタセットが、ビットストリームの一部として信号伝達される係数を備える、[17]に記載の方法。
[28] 選択された前記画像フィルタセットが、0という位相シフトに対して係数{0,0,0,64,0,0,0,0}、1という位相シフトに対して{0,1,−3,63,4,−2,1,0}、2という位相シフトに対して{0,2,−6,61,9,−3,1,0}、3という位相シフトに対して{−1,3,−8,60,13,−4,1,0}、4という位相シフトに対して{−1,4,−10,58,17,−5,1,0}、5という位相シフトに対して{−1,4,−11,53,25,−8,3,−1}、6という位相シフトに対して{−1,4,−11,50,29,−9,3,−1}、7という位相シフトに対して{−1,4,−11,45,34,−10,4,−1}、8という位相シフトに対して{−1,4,−11,40,40,−11,4,−1}、9という位相シフトに対して{−1,4,−10,34,45,−11,4,−1}、10という位相シフトに対して{−1,3,−9,29,50,−11,4,−1}、11という位相シフトに対して{−1,3,−8,25,53,−11,4,−1}、12という位相シフトに対して{0,1,−5,17,58,−10,4,−1}、13という位相シフトに対して{0,1,−4,13,60,−8,3,−1}、14という位相シフトに対して{0,1,−3,8,62,−6,2,0}、15という位相シフトに対して{0,1,−2,4,63,−3,1,0}を備える、[17]に記載の方法。
[29] 選択された前記画像フィルタセットが、0という位相シフトに対して係数{0,64,0,0}、1という位相シフトに対して{−2,62,4,0}、2という位相シフトに対して{−2,58,10,−2}、3という位相シフトに対して{−4,56,14,−2}、4という位相シフトに対して{−4,54,16,−2}、5という位相シフトに対して{−6,52,20,−2}、6という位相シフトに対して{−6,48,26,−4}、7という位相シフトに対して{−4,42,30,−4}、8という位相シフトに対して{−4,36,36,−4}、9という位相シフトに対して{−4,30,42,−4}、10という位相シフトに対して{−4,26,48,−6}、11という位相シフトに対して{−2,20,52,−6}、12という位相シフトに対して{−2,16,54,−4}、13という位相シフトに対して{−2,14,56,−4}、14という位相シフトに対して{−2,10,58,−2}、15という位相シフトに対して{0,4,62,−2}を備える、[17]に記載の方法。
[30] ビデオ情報を符号化する方法であって、ビデオ情報の拡張レイヤを取得することと、ダウンサンプリング画像フィルタセットを選択することと、前記拡張レイヤと選択された前記画像フィルタセットとを使用してベースレイヤを生成することと、前記拡張レイヤに対する前記ベースレイヤの位相変位情報を備えるシンタクス要素を生成することとを備える、方法。
[31] 前記位相変位情報が、前記拡張レイヤにおける画素の位置と前記ベースレイヤにおける前記画素の対応する位置との差を備える、[30]に記載の方法。
[32] 前記位相変位情報が、前記拡張レイヤと前記ベースレイヤとの間の、0位相の関係又は対称的な位相の関係のいずれか1つを示す、バイナリ値を備える、[30]に記載の方法。
[33] 前記生成されたシンタクス要素が、水平方向の位相変位情報を示す第1のシンタクス要素と、垂直方向の位相変位情報を示す第2のシンタクス要素とを備える、[30]に記載の方法。
[34] 前記第1のシンタクス要素及び前記第2のシンタクス要素の少なくとも1つが、非バイナリ値を備える、[33]に記載の方法。
[35] 選択された前記画像フィルタセットが、前記拡張レイヤと前記ベースレイヤとの間の対称的な位相の関係に少なくとも一部基づく、デフォルトの画像フィルタセットである、[30]に記載の方法。
[36] 選択された前記画像フィルタセットが、前記拡張レイヤと前記ベースレイヤとの間の0位相の関係に少なくとも一部基づく、デフォルトの画像フィルタセットである、[30]に記載の方法。
[37] 前記位相変位情報が整列情報を備える、[30]に記載の方法。
[38] 前記整列情報が、x画素座標とy画素座標とを位相オフセットにマッピングする関数としてモデル化される、[30]に記載の方法。
[39] 選択された前記画像フィルタセットが、ビットストリームの一部として信号伝達される係数を備える、[30]に記載の方法。
[40] 選択された前記画像フィルタセットが、0という位相シフトに対して係数{0,0,0,64,0,0,0,0}、1という位相シフトに対して{0,1,−3,63,4,−2,1,0}、2という位相シフトに対して{0,2,−6,61,9,−3,1,0}、3という位相シフトに対して{−1,3,−8,60,13,−4,1,0}、4という位相シフトに対して{−1,4,−10,58,17,−5,1,0}、5という位相シフトに対して{−1,4,−11,53,25,−8,3,−1}、6という位相シフトに対して{−1,4,−11,50,29,−9,3,−1}、7という位相シフトに対して{−1,4,−11,45,34,−10,4,−1}、8という位相シフトに対して{−1,4,−11,40,40,−11,4,−1}、9という位相シフトに対して{−1,4,−10,34,45,−11,4,−1}、10という位相シフトに対して{−1,3,−9,29,50,−11,4,−1}、11という位相シフトに対して{−1,3,−8,25,53,−11,4,−1}、12という位相シフトに対して{0,1,−5,17,58,−10,4,−1}、13という位相シフトに対して{0,1,−4,13,60,−8,3,−1}、14という位相シフトに対して{0,1,−3,8,62,−6,2,0}、15という位相シフトに対して{0,1,−2,4,63,−3,1,0}を備える、[30]に記載の方法。
[41] 選択された前記画像フィルタセットが、0という位相シフトに対して係数{0,64,0,0}、1という位相シフトに対して{−2,62,4,0}、2という位相シフトに対して{−2,58,10,−2}、3という位相シフトに対して{−4,56,14,−2}、4という位相シフトに対して{−4,54,16,−2}、5という位相シフトに対して{−6,52,20,−2}、6という位相シフトに対して{−6,48,26,−4}、7という位相シフトに対して{−4,42,30,−4}、8という位相シフトに対して{−4,36,36,−4}、9という位相シフトに対して{−4,30,42,−4}、10という位相シフトに対して{−4,26,48,−6}、11という位相シフトに対して{−2,20,52,−6}、12という位相シフトに対して{−2,16,54,−4}、13という位相シフトに対して{−2,14,56,−4}、14という位相シフトに対して{−2,10,58,−2}、15という位相シフトに対して{0,4,62,−2}を備える、[30]に記載の方法。
[42] ビデオビットストリームをコード化するための装置であって、ビデオ情報の拡張レイヤを取得するための手段と、前記拡張レイヤに対するビデオ情報のベースレイヤの位相変位情報を備えるシンタクス要素を生成するための手段と、前記位相変位情報に少なくとも一部に基づいて画像フィルタセットを選択するための手段と、前記拡張レイヤと前記特定された画像フィルタセットとを使用して前記拡張レイヤのダウンサンプリングされたバージョンを生成するための手段と、前記拡張レイヤの前記ダウンサンプリングされたバージョンを記憶するための手段とを備える、装置。
[43] 前記位相変位情報が、前記拡張レイヤにおける画素の位置と前記ベースレイヤにおける前記画素の対応する位置との差を備える、[42]に記載の装置。
[44] 前記位相変位情報が、前記拡張レイヤと前記ベースレイヤとの間の、0位相の関係又は対称的な位相の関係のいずれか1つを示す、バイナリ値を備える、[42]に記載の装置。
[45] 命令を記憶した非一時的コンピュータ可読媒体であって、前記命令が、プロセッサによって実行されると、前記プロセッサに、ビデオ情報のベースレイヤを取得させ、符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取らせ、このとき、前記シンタクス要素が、拡張レイヤに対するビデオ情報の前記ベースレイヤの位相変位情報を備え、前記位相変位情報に少なくとも一部に基づいて画像フィルタセットを選択させ、前記拡張レイヤと前記特定された画像フィルタセットとを使用して前記拡張レイヤのアップサンプリングされたバージョンを生成させる、非一時的コンピュータ可読媒体。
[46] 前記位相変位情報が、前記拡張レイヤにおける画素の位置と前記ベースレイヤにおける前記画素の対応する位置との差を備える、[45]に記載の非一時的コンピュータ可読媒体。
[47] 前記位相変位情報が、前記拡張レイヤと前記ベースレイヤとの間の、0位相の関係又は対称的な位相の関係とのいずれか1つを示す、バイナリ値を備える、[45]に記載の非一時的コンピュータ可読媒体。

Claims (37)

  1. ビデオ情報をコード化するように構成された装置であって、
    ビデオデータを記憶するように構成されるメモリと、前記ビデオデータが、ビデオ情報の第1のレイヤを備える、
    前記メモリと通信しているプロセッサとを備え、前記プロセッサが、
    前記第1のレイヤに対するビデオ情報の第2のレイヤの位相変位情報を決定し、ここにおいて、前記位相変位情報はシンタクス要素としてビデオビットストリームに埋め込まれ、前記第1のレイヤと前記第2のレイヤとの間の、0位相の関係又は対称的な位相の関係のいずれか1つを示す、バイナリ値を備える、
    前記位相変位情報に少なくとも一部に基づいて、前記第1のレイヤをアップサンプリング又はダウンサンプリングするための画像フィルタセットを選択し、
    前記第1のレイヤと選択された前記画像フィルタセットとを使用して前記第1のレイヤの修正されたバージョンを生成する
    ように構成される、装置。
  2. 前記第1のレイヤがベースレイヤを備え、
    前記第2のレイヤが拡張レイヤを備え、
    選択された前記画像フィルタセットがアップサンプリング画像フィルタを備え、
    前記プロセッサが更に、前記位相変位情報を信号伝達する前記ビデオビットストリームから抽出された、埋め込まれた前記シンタクス要素を受け取るように構成される、請求項1に記載の装置。
  3. 前記第1のレイヤが拡張レイヤを備え、
    前記第2のレイヤがベースレイヤを備え、
    選択された前記画像フィルタセットがダウンサンプリング画像フィルタを備え、
    前記プロセッサが更に、前記位相変位情報を信号伝達するために前記ビデオビットストリームに対する埋め込まれた前記シンタクス要素を生成するように構成される、請求項1に記載の装置。
  4. 前記位相変位情報が、前記第1のレイヤにおける画素の位置と前記第2のレイヤにおける前記画素の対応する位置との差を備える、請求項1に記載の装置。
  5. 前記位相変位情報が、水平方向の位相変位情報を示すための第1のシンタクス要素と、垂直方向の位相変位情報を示すための第2のシンタクス要素とを備える、請求項1に記載の装置。
  6. 前記第1のシンタクス要素及び前記第2のシンタクス要素の少なくとも1つが、非バイナリ値を備える、請求項に記載の装置。
  7. ビデオ情報をコード化するように構成された装置であって、
    ビデオデータを記憶するように構成されるメモリと、前記ビデオデータが、ビデオ情報の第1のレイヤを備える、
    前記メモリと通信しているプロセッサとを備え、前記プロセッサが、
    前記第1のレイヤに対するビデオ情報の第2のレイヤの位相変位情報を決定し、ここにおいて、前記位相変位情報はシンタクス要素としてビデオビットストリームに埋め込まれる、
    前記位相変位情報に少なくとも一部に基づいて、前記第1のレイヤをアップサンプリング又はダウンサンプリングするための画像フィルタセットを選択し、
    前記第1のレイヤと選択された前記画像フィルタセットとを使用して前記第1のレイヤの修正されたバージョンを生成する、ここにおいて、選択された前記画像フィルタセットがデフォルト画像フィルタセットであり、前記プロセッサが前記デフォルト画像フィルタセット及び前記位相変位情報に基づいて決定された位相を使用して少なくとも部分的に前記第1のレイヤの前記修正されたバージョンを生成するように構成される、装置。
  8. 前記デフォルトの画像フィルタセットが、前記第1のレイヤと前記第2のレイヤとの間の対称的な位相の関係に少なくとも一部に基づく、請求項に記載の装置。
  9. 前記デフォルトの画像フィルタセットが、前記第1のレイヤと前記第2のレイヤとの間の0位相の関係に少なくとも一部に基づく、請求項に記載の装置。
  10. ビデオ情報をコード化するように構成された装置であって、
    ビデオデータを記憶するように構成されるメモリと、前記ビデオデータが、ビデオ情報の第1のレイヤを備える、
    前記メモリと通信しているプロセッサとを備え、前記プロセッサが、
    前記第1のレイヤに対するビデオ情報の第2のレイヤの位相変位情報を決定し、ここにおいて、前記位相変位情報はシンタクス要素としてビデオビットストリームに埋め込まれる、
    前記位相変位情報に少なくとも一部に基づいて、前記第1のレイヤをアップサンプリング又はダウンサンプリングするための画像フィルタセットを選択し、
    前記第1のレイヤと選択された前記画像フィルタセットとを使用して前記第1のレイヤの修正されたバージョンを生成する
    ように構成され、前記位相変位情報が整列情報を備える、装置。
  11. 前記整列情報が、x画素座標とy画素座標とを位相オフセットにマッピングする関数としてモデル化される、請求項10に記載の装置。
  12. ビデオ情報をコード化するように構成された装置であって、
    ビデオデータを記憶するように構成されるメモリと、前記ビデオデータが、ビデオ情報の第1のレイヤを備える、
    前記メモリと通信しているプロセッサとを備え、前記プロセッサが、
    前記第1のレイヤに対するビデオ情報の第2のレイヤの位相変位情報を決定し、ここにおいて、前記位相変位情報はシンタクス要素としてビデオビットストリームに埋め込まれる、
    前記位相変位情報に少なくとも一部に基づいて、前記第1のレイヤをアップサンプリング又はダウンサンプリングするための画像フィルタセットを選択し、
    前記第1のレイヤと選択された前記画像フィルタセットとを使用して前記第1のレイヤの修正されたバージョンを生成する
    ように構成され、選択された前記画像フィルタセットが、ビットストリームの一部として信号伝達される係数を備える、装置。
  13. ビデオ情報をコード化するように構成された装置であって、
    ビデオデータを記憶するように構成されるメモリと、前記ビデオデータが、ビデオ情報の第1のレイヤを備える、
    前記メモリと通信しているプロセッサとを備え、前記プロセッサが、
    前記第1のレイヤに対するビデオ情報の第2のレイヤの位相変位情報を決定し、ここにおいて、前記位相変位情報はシンタクス要素としてビデオビットストリームに埋め込まれる、
    前記位相変位情報に少なくとも一部に基づいて、前記第1のレイヤをアップサンプリング又はダウンサンプリングするための画像フィルタセットを選択し、
    前記第1のレイヤと選択された前記画像フィルタセットとを使用して前記第1のレイヤの修正されたバージョンを生成する
    ように構成され、
    選択された前記画像フィルタセットが、0という位相シフトに対して係数{0,0,0,64,0,0,0,0}、1という位相シフトに対して{0,1,−3,63,4,−2,1,0}、2という位相シフトに対して{0,2,−6,61,9,−3,1,0}、3という位相シフトに対して{−1,3,−8,60,13,−4,1,0}、4という位相シフトに対して{−1,4,−10,58,17,−5,1,0}、5という位相シフトに対して{−1,4,−11,53,25,−8,3,−1}、6という位相シフトに対して{−1,4,−11,50,29,−9,3,−1}、7という位相シフトに対して{−1,4,−11,45,34,−10,4,−1}、8という位相シフトに対して{−1,4,−11,40,40,−11,4,−1}、9という位相シフトに対して{−1,4,−10,34,45,−11,4,−1}、10という位相シフトに対して{−1,3,−9,29,50,−11,4,−1}、11という位相シフトに対して{−1,3,−8,25,53,−11,4,−1}、12という位相シフトに対して{0,1,−5,17,58,−10,4,−1}、13という位相シフトに対して{0,1,−4,13,60,−8,3,−1}、14という位相シフトに対して{0,1,−3,8,62,−6,2,0}、15という位相シフトに対して{0,1,−2,4,63,−3,1,0}を備える、装置。
  14. ビデオ情報をコード化するように構成された装置であって、
    ビデオデータを記憶するように構成されるメモリと、前記ビデオデータが、ビデオ情報の第1のレイヤを備える、
    前記メモリと通信しているプロセッサとを備え、前記プロセッサが、
    前記第1のレイヤに対するビデオ情報の第2のレイヤの位相変位情報を決定し、ここにおいて、前記位相変位情報はシンタクス要素としてビデオビットストリームに埋め込まれる、
    前記位相変位情報に少なくとも一部に基づいて、前記第1のレイヤをアップサンプリング又はダウンサンプリングするための画像フィルタセットを選択し、
    前記第1のレイヤと選択された前記画像フィルタセットとを使用して前記第1のレイヤの修正されたバージョンを生成する
    ように構成され、
    選択された前記画像フィルタセットが、0という位相シフトに対して係数{0,64,0,0}、1という位相シフトに対して{−2,62,4,0}、2という位相シフトに対して{−2,58,10,−2}、3という位相シフトに対して{−4,56,14,−2}、4という位相シフトに対して{−4,54,16,−2}、5という位相シフトに対して{−6,52,20,−2}、6という位相シフトに対して{−6,48,26,−4}、7という位相シフトに対して{−4,42,30,−4}、8という位相シフトに対して{−4,36,36,−4}、9という位相シフトに対して{−4,30,42,−4}、10という位相シフトに対して{−4,26,48,−6}、11という位相シフトに対して{−2,20,52,−6}、12という位相シフトに対して{−2,16,54,−4}、13という位相シフトに対して{−2,14,56,−4}、14という位相シフトに対して{−2,10,58,−2}、15という位相シフトに対して{0,4,62,−2}を備える、装置。
  15. ビデオ情報を復号する方法であって、
    ビデオ情報のベースレイヤを取得することと、
    符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取ることと、前記シンタクス要素が、拡張レイヤに対するビデオ情報の前記ベースレイヤの位相変位情報を備え、前記位相変位情報が、前記拡張レイヤと前記ベースレイヤとの間の、0位相の関係又は対称的な位相の関係のいずれか1つを示す、バイナリ値を備える、
    前記位相変位情報に少なくとも一部に基づいて前記ベースレイヤをアップサンプリングするための画像フィルタセットを選択することと、
    前記ベースレイヤと選択された前記画像フィルタセットとを使用して前記拡張レイヤのアップサンプリングされたバージョンを生成することとを備える、方法。
  16. 前記受け取られたシンタクス要素が、水平方向の位相変位情報を示す第1のシンタクス要素と、垂直方向の位相変位情報を示す第2のシンタクス要素とを備える、請求項15に記載の方法。
  17. 前記第1のシンタクス要素及び前記第2のシンタクス要素の少なくとも1つが、非バイナリ値を備える、請求項16に記載の方法。
  18. ビデオ情報を復号する方法であって、
    ビデオ情報のベースレイヤを取得することと、
    符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取ることと、前記シンタクス要素が、拡張レイヤに対するビデオ情報の前記ベースレイヤの位相変位情報を備える、
    前記位相変位情報に少なくとも一部に基づいて前記ベースレイヤをアップサンプリングするための画像フィルタセットを選択することと、
    前記ベースレイヤと選択された前記画像フィルタセットとを使用して前記拡張レイヤのアップサンプリングされたバージョンを生成することと、
    前記位相変位情報がビットストリームで信号伝達されない場合、デフォルトの画像フィルタセットを選択することと、前記デフォルトの画像フィルタセットが、前記拡張レイヤと前記ベースレイヤとの間の対称的な位相の関係に少なくとも一部基づく、
    前記位相変位情報がビットストリームで信号伝達される場合、前記位相変位情報に基づいて画像フィルタセットを選択することとを備える、
    方法。
  19. ビデオ情報を復号する方法であって、
    ビデオ情報のベースレイヤを取得することと、
    符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取ることと、前記シンタクス要素が、拡張レイヤに対するビデオ情報の前記ベースレイヤの位相変位情報を備える、
    前記位相変位情報に少なくとも一部に基づいて前記ベースレイヤをアップサンプリングするための画像フィルタセットを選択することと、
    前記ベースレイヤと選択された前記画像フィルタセットとを使用して前記拡張レイヤのアップサンプリングされたバージョンを生成することと、
    前記位相変位情報がビットストリームで信号伝達されない場合、デフォルトの画像フィルタセットを選択することと、前記デフォルトの画像フィルタセットが、前記拡張レイヤと前記ベースレイヤとの間の0位相の関係に少なくとも一部基づく、
    前記位相変位情報がビットストリームで信号伝達される場合、前記位相変位情報に基づいて画像フィルタセットを選択することとを備える、
    方法。
  20. ビデオ情報を復号する方法であって、
    ビデオ情報のベースレイヤを取得することと、
    符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取ることと、前記シンタクス要素が、拡張レイヤに対するビデオ情報の前記ベースレイヤの位相変位情報を備え、前記位相変位情報が整列情報を備える、
    前記位相変位情報に少なくとも一部に基づいて前記ベースレイヤをアップサンプリングするための画像フィルタセットを選択することと、
    前記ベースレイヤと選択された前記画像フィルタセットとを使用して前記拡張レイヤのアップサンプリングされたバージョンを生成することと、
    を備える、方法。
  21. ビデオ情報を復号する方法であって、
    ビデオ情報のベースレイヤを取得することと、
    符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取ることと、前記シンタクス要素が、拡張レイヤに対するビデオ情報の前記ベースレイヤの位相変位情報を備え、前記位相変位情報が整列情報を備える、
    前記位相変位情報に少なくとも一部に基づいて前記ベースレイヤをアップサンプリングするための画像フィルタセットを選択することと、
    前記ベースレイヤと選択された前記画像フィルタセットとを使用して前記拡張レイヤのアップサンプリングされたバージョンを生成することと
    前記整列情報が、x画素座標とy画素座標とを位相オフセットにマッピングする関数としてモデル化される、方法。
  22. ビデオ情報を復号する方法であって、
    ビデオ情報のベースレイヤを取得することと、
    符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取ることと、前記シンタクス要素が、拡張レイヤに対するビデオ情報の前記ベースレイヤの位相変位情報を備える、
    前記位相変位情報に少なくとも一部に基づいて前記ベースレイヤをアップサンプリングするための画像フィルタセットを選択することと、選択された前記画像フィルタセットが、ビットストリームの一部として信号伝達される係数を備える、
    前記ベースレイヤと選択された前記画像フィルタセットとを使用して前記拡張レイヤのアップサンプリングされたバージョンを生成することと、
    を備える、方法。
  23. ビデオ情報を復号する方法であって、
    ビデオ情報のベースレイヤを取得することと、
    符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取ることと、前記シンタクス要素が、拡張レイヤに対するビデオ情報の前記ベースレイヤの位相変位情報を備える、
    前記位相変位情報に少なくとも一部に基づいて前記ベースレイヤをアップサンプリングするための画像フィルタセットを選択することと、
    前記ベースレイヤと選択された前記画像フィルタセットとを使用して前記拡張レイヤのアップサンプリングされたバージョンを生成することと、
    を備え、
    選択された前記画像フィルタセットが、0という位相シフトに対して係数{0,0,0,64,0,0,0,0}、1という位相シフトに対して{0,1,−3,63,4,−2,1,0}、2という位相シフトに対して{0,2,−6,61,9,−3,1,0}、3という位相シフトに対して{−1,3,−8,60,13,−4,1,0}、4という位相シフトに対して{−1,4,−10,58,17,−5,1,0}、5という位相シフトに対して{−1,4,−11,53,25,−8,3,−1}、6という位相シフトに対して{−1,4,−11,50,29,−9,3,−1}、7という位相シフトに対して{−1,4,−11,45,34,−10,4,−1}、8という位相シフトに対して{−1,4,−11,40,40,−11,4,−1}、9という位相シフトに対して{−1,4,−10,34,45,−11,4,−1}、10という位相シフトに対して{−1,3,−9,29,50,−11,4,−1}、11という位相シフトに対して{−1,3,−8,25,53,−11,4,−1}、12という位相シフトに対して{0,1,−5,17,58,−10,4,−1}、13という位相シフトに対して{0,1,−4,13,60,−8,3,−1}、14という位相シフトに対して{0,1,−3,8,62,−6,2,0}、15という位相シフトに対して{0,1,−2,4,63,−3,1,0}を備える、方法。
  24. ビデオ情報を復号する方法であって、
    ビデオ情報のベースレイヤを取得することと、
    符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取ることと、前記シンタクス要素が、拡張レイヤに対するビデオ情報の前記ベースレイヤの位相変位情報を備える、
    前記位相変位情報に少なくとも一部に基づいて前記ベースレイヤをアップサンプリングするための画像フィルタセットを選択することと、
    前記ベースレイヤと選択された前記画像フィルタセットとを使用して前記拡張レイヤのアップサンプリングされたバージョンを生成することと、
    を備え、
    選択された前記画像フィルタセットが、0という位相シフトに対して係数{0,64,0,0}、1という位相シフトに対して{−2,62,4,0}、2という位相シフトに対して{−2,58,10,−2}、3という位相シフトに対して{−4,56,14,−2}、4という位相シフトに対して{−4,54,16,−2}、5という位相シフトに対して{−6,52,20,−2}、6という位相シフトに対して{−6,48,26,−4}、7という位相シフトに対して{−4,42,30,−4}、8という位相シフトに対して{−4,36,36,−4}、9という位相シフトに対して{−4,30,42,−4}、10という位相シフトに対して{−4,26,48,−6}、11という位相シフトに対して{−2,20,52,−6}、12という位相シフトに対して{−2,16,54,−4}、13という位相シフトに対して{−2,14,56,−4}、14という位相シフトに対して{−2,10,58,−2}、15という位相シフトに対して{0,4,62,−2}を備える、方法。
  25. ビデオ情報を符号化する方法であって、
    ビデオ情報の拡張レイヤを取得することと、
    ダウンサンプリング画像フィルタセットを選択することと、
    前記拡張レイヤと選択された前記ダウンサンプリング画像フィルタセットとを使用してベースレイヤを生成することと、
    前記拡張レイヤに対する前記ベースレイヤの位相変位情報を備えるシンタクス要素を生成することとを備え、
    前記位相変位情報が、前記拡張レイヤと前記ベースレイヤとの間の、0位相の関係又は対称的な位相の関係のいずれか1つを示す、バイナリ値を備える、方法。
  26. ビデオ情報を符号化する方法であって、
    ビデオ情報の拡張レイヤを取得することと、
    ダウンサンプリング画像フィルタセットを選択することと、
    前記拡張レイヤと選択された前記ダウンサンプリング画像フィルタセットとを使用してベースレイヤを生成することと、
    前記拡張レイヤに対する前記ベースレイヤの位相変位情報を備えるシンタクス要素を生成することとを備え、
    選択された前記ダウンサンプリング画像フィルタセットが、前記拡張レイヤと前記ベースレイヤとの間の対称的な位相の関係に少なくとも一部基づく、デフォルトの画像フィルタセットである、方法。
  27. ビデオ情報を符号化する方法であって、
    ビデオ情報の拡張レイヤを取得することと、
    ダウンサンプリング画像フィルタセットを選択することと、
    前記拡張レイヤと選択された前記ダウンサンプリング画像フィルタセットとを使用してベースレイヤを生成することと、
    前記拡張レイヤに対する前記ベースレイヤの位相変位情報を備えるシンタクス要素を生成することとを備え、
    選択された前記ダウンサンプリング画像フィルタセットが、前記拡張レイヤと前記ベースレイヤとの間の0位相の関係に少なくとも一部基づく、デフォルトの画像フィルタセットである、方法。
  28. ビデオ情報を符号化する方法であって、
    ビデオ情報の拡張レイヤを取得することと、
    ダウンサンプリング画像フィルタセットを選択することと、
    前記拡張レイヤと選択された前記ダウンサンプリング画像フィルタセットとを使用してベースレイヤを生成することと、
    前記拡張レイヤに対する前記ベースレイヤの位相変位情報を備えるシンタクス要素を生成することとを備え、
    前記位相変位情報が整列情報を備える、方法。
  29. ビデオ情報を符号化する方法であって、
    ビデオ情報の拡張レイヤを取得することと、
    ダウンサンプリング画像フィルタセットを選択することと、
    前記拡張レイヤと選択された前記ダウンサンプリング画像フィルタセットとを使用してベースレイヤを生成することと、
    前記拡張レイヤに対する前記ベースレイヤの位相変位情報を備えるシンタクス要素を生成することとを備え、前記位相変位情報が整列情報を備える、
    前記整列情報が、x画素座標とy画素座標とを位相オフセットにマッピングする関数としてモデル化される、方法。
  30. ビデオ情報を符号化する方法であって、
    ビデオ情報の拡張レイヤを取得することと、
    ダウンサンプリング画像フィルタセットを選択することと、
    前記拡張レイヤと選択された前記ダウンサンプリング画像フィルタセットとを使用してベースレイヤを生成することと、
    前記拡張レイヤに対する前記ベースレイヤの位相変位情報を備えるシンタクス要素を生成することとを備え、
    選択された前記ダウンサンプリング画像フィルタセットが、ビットストリームの一部として信号伝達される係数を備える、方法。
  31. ビデオ情報を符号化する方法であって、
    ビデオ情報の拡張レイヤを取得することと、
    ダウンサンプリング画像フィルタセットを選択することと、
    前記拡張レイヤと選択された前記ダウンサンプリング画像フィルタセットとを使用してベースレイヤを生成することと、
    前記拡張レイヤに対する前記ベースレイヤの位相変位情報を備えるシンタクス要素を生成することとを備え、
    選択された前記ダウンサンプリング画像フィルタセットが、0という位相シフトに対して係数{0,0,0,64,0,0,0,0}、1という位相シフトに対して{0,1,−3,63,4,−2,1,0}、2という位相シフトに対して{0,2,−6,61,9,−3,1,0}、3という位相シフトに対して{−1,3,−8,60,13,−4,1,0}、4という位相シフトに対して{−1,4,−10,58,17,−5,1,0}、5という位相シフトに対して{−1,4,−11,53,25,−8,3,−1}、6という位相シフトに対して{−1,4,−11,50,29,−9,3,−1}、7という位相シフトに対して{−1,4,−11,45,34,−10,4,−1}、8という位相シフトに対して{−1,4,−11,40,40,−11,4,−1}、9という位相シフトに対して{−1,4,−10,34,45,−11,4,−1}、10という位相シフトに対して{−1,3,−9,29,50,−11,4,−1}、11という位相シフトに対して{−1,3,−8,25,53,−11,4,−1}、12という位相シフトに対して{0,1,−5,17,58,−10,4,−1}、13という位相シフトに対して{0,1,−4,13,60,−8,3,−1}、14という位相シフトに対して{0,1,−3,8,62,−6,2,0}、15という位相シフトに対して{0,1,−2,4,63,−3,1,0}を備える、方法。
  32. ビデオ情報を符号化する方法であって、
    ビデオ情報の拡張レイヤを取得することと、
    ダウンサンプリング画像フィルタセットを選択することと、
    前記拡張レイヤと選択された前記ダウンサンプリング画像フィルタセットとを使用してベースレイヤを生成することと、
    前記拡張レイヤに対する前記ベースレイヤの位相変位情報を備えるシンタクス要素を生成することとを備え、
    選択された前記ダウンサンプリング画像フィルタセットが、0という位相シフトに対して係数{0,64,0,0}、1という位相シフトに対して{−2,62,4,0}、2という位相シフトに対して{−2,58,10,−2}、3という位相シフトに対して{−4,56,14,−2}、4という位相シフトに対して{−4,54,16,−2}、5という位相シフトに対して{−6,52,20,−2}、6という位相シフトに対して{−6,48,26,−4}、7という位相シフトに対して{−4,42,30,−4}、8という位相シフトに対して{−4,36,36,−4}、9という位相シフトに対して{−4,30,42,−4}、10という位相シフトに対して{−4,26,48,−6}、11という位相シフトに対して{−2,20,52,−6}、12という位相シフトに対して{−2,16,54,−4}、13という位相シフトに対して{−2,14,56,−4}、14という位相シフトに対して{−2,10,58,−2}、15という位相シフトに対して{0,4,62,−2}を備える、方法。
  33. ビデオビットストリームをコード化するための装置であって、
    ビデオ情報の拡張レイヤを取得するための手段と、
    前記拡張レイヤに対するビデオ情報のベースレイヤの位相変位情報を備えるシンタクス要素を生成するための手段と、前記位相変位情報が、前記拡張レイヤと前記ベースレイヤとの間の、0位相の関係又は対称的な位相の関係のいずれか1つを示す、バイナリ値を備える、
    前記位相変位情報に少なくとも一部に基づいて、前記拡張レイヤをダウンサンプリングするための画像フィルタセットを選択するための手段と、
    前記拡張レイヤと選択された前記画像フィルタセットとを使用して前記拡張レイヤのダウンサンプリングされたバージョンを生成するための手段と、
    前記拡張レイヤの前記ダウンサンプリングされたバージョンを記憶するための手段とを備える、装置。
  34. 前記位相変位情報が、前記拡張レイヤにおける画素の位置と前記ベースレイヤにおける前記画素の対応する位置との差を備える、請求項33に記載の装置。
  35. ビデオビットストリームをコード化するための装置であって、
    ビデオ情報の拡張レイヤを取得するための手段と、
    前記拡張レイヤに対するビデオ情報のベースレイヤの位相変位情報を備えるシンタクス要素を生成するための手段と、前記位相変位情報が、前記拡張レイヤと前記ベースレイヤとの間の、0位相の関係又は対称的な位相の関係のいずれか1つを示す、バイナリ値を備える、
    前記位相変位情報に少なくとも一部に基づいて、前記拡張レイヤをダウンサンプリングするための画像フィルタセットを選択するための手段と、
    前記拡張レイヤと選択された前記画像フィルタセットとを使用して前記拡張レイヤのダウンサンプリングされたバージョンを生成するための手段と、
    前記拡張レイヤの前記ダウンサンプリングされたバージョンを記憶するための手段とを備える、装置。
  36. 命令を記憶したコンピュータ可読記憶媒体であって、前記命令が、プロセッサによって実行されると、前記プロセッサに、
    ビデオ情報のベースレイヤを取得させ、
    符号化されたビデオビットストリームから抽出されたシンタクス要素を受け取らせ、このとき、前記シンタクス要素が、拡張レイヤに対するビデオ情報の前記ベースレイヤの位相変位情報を備え、前記位相変位情報が、前記拡張レイヤと前記ベースレイヤとの間の、0位相の関係又は対称的な位相の関係とのいずれか1つを示す、バイナリ値を備える、
    前記位相変位情報に少なくとも一部に基づいて、前記ベースレイヤをアップサンプリングするための画像フィルタセットを選択させ、
    前記拡張レイヤと選択された前記画像フィルタセットとを使用して前記拡張レイヤのアップサンプリングされたバージョンを生成させる、コンピュータ可読記憶媒体。
  37. 前記位相変位情報が、前記拡張レイヤにおける画素の位置と前記ベースレイヤにおける前記画素の対応する位置との差を備える、請求項36に記載のコンピュータ可読記憶媒体。
JP2015530151A 2012-09-04 2013-09-04 スケーラブルビデオコード化におけるダウンサンプリング位相情報の信号伝達 Active JP6342402B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201261696722P 2012-09-04 2012-09-04
US61/696,722 2012-09-04
US201361808467P 2013-04-04 2013-04-04
US61/808,467 2013-04-04
US201361814243P 2013-04-20 2013-04-20
US61/814,243 2013-04-20
US14/017,169 2013-09-03
US14/017,169 US10448032B2 (en) 2012-09-04 2013-09-03 Signaling of down-sampling location information in scalable video coding
PCT/US2013/058050 WO2014039547A1 (en) 2012-09-04 2013-09-04 Signaling of down-sampling phase information in scalable video coding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018016390A Division JP2018110412A (ja) 2012-09-04 2018-02-01 スケーラブルビデオコード化におけるダウンサンプリング位相情報の信号伝達

Publications (2)

Publication Number Publication Date
JP2015527028A JP2015527028A (ja) 2015-09-10
JP6342402B2 true JP6342402B2 (ja) 2018-06-13

Family

ID=50187598

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2015530151A Active JP6342402B2 (ja) 2012-09-04 2013-09-04 スケーラブルビデオコード化におけるダウンサンプリング位相情報の信号伝達
JP2018016390A Pending JP2018110412A (ja) 2012-09-04 2018-02-01 スケーラブルビデオコード化におけるダウンサンプリング位相情報の信号伝達

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2018016390A Pending JP2018110412A (ja) 2012-09-04 2018-02-01 スケーラブルビデオコード化におけるダウンサンプリング位相情報の信号伝達

Country Status (5)

Country Link
US (1) US10448032B2 (ja)
JP (2) JP6342402B2 (ja)
KR (1) KR20150052248A (ja)
CN (1) CN104718752B (ja)
WO (1) WO2014039547A1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108391135B (zh) 2011-06-15 2022-07-19 韩国电子通信研究院 可伸缩解码方法/设备、可伸缩编码方法/设备和介质
US9794555B2 (en) * 2013-03-15 2017-10-17 Arris Enterprises Llc Adaptive sampling filter process for scalable video coding
US9503732B2 (en) * 2013-04-10 2016-11-22 Arris Enterprises, Inc. Re-sampling with phase offset adjustment for luma and chroma to select filters in scalable video coding
US9510001B2 (en) 2013-07-09 2016-11-29 Electronics And Telecommunications Research Institute Video decoding method and apparatus using the same
WO2015103221A1 (en) 2014-01-03 2015-07-09 Arris Enterprises, Inc. Conditionally parsed extension syntax for hevc extension processing
WO2015137786A1 (ko) * 2014-03-14 2015-09-17 삼성전자 주식회사 스케일러블 비디오 부호화/복호화 방법 및 장치
WO2015143090A1 (en) * 2014-03-18 2015-09-24 Arris Enterprises, Inc. Scalable video coding using reference and scaled reference layer offsets
US20150271495A1 (en) * 2014-03-18 2015-09-24 Arris Enterprises, Inc. Scalable Video Coding using Phase Offset Flag Signaling
EP3120562B1 (en) * 2014-03-18 2020-03-04 ARRIS Enterprises LLC Scalable video coding using reference and scaled reference layer offsets
WO2015168581A1 (en) 2014-05-01 2015-11-05 Arris Enterprises, Inc. Reference layer and scaled reference layer offsets for scalable video coding
US10785492B2 (en) 2014-05-30 2020-09-22 Arris Enterprises Llc On reference layer and scaled reference layer offset parameters for inter-layer prediction in scalable video coding
WO2017079007A1 (en) * 2015-11-02 2017-05-11 Dolby Laboratories Licensing Corporation Piecewise-linear inter-layer predictor for high-dynamic range video coding
GB2552353B (en) * 2016-07-20 2022-04-20 V Nova Int Ltd Apparatuses, methods, computer programs and computer-readable media
US10063612B2 (en) * 2016-09-30 2018-08-28 Amazon Technologies, Inc. Request-based encoding for streaming content portions
CN109257605B (zh) * 2017-07-13 2021-11-19 华为技术有限公司 图像处理方法、设备及系统
JP2021005741A (ja) * 2017-09-14 2021-01-14 シャープ株式会社 画像符号化装置及び画像復号装置
EP3682639A1 (en) * 2017-10-02 2020-07-22 ARRIS Enterprises LLC System and method for reducing blocking artifacts and providing improved coding efficiency
EP3579553B1 (en) * 2018-06-05 2020-05-20 Axis AB A method, controller, and system for encoding a sequence of video frames
US10972744B2 (en) * 2018-11-12 2021-04-06 Analog Devices International Unlimited Company Image scaling
CA3131027A1 (en) * 2019-02-22 2020-08-27 Huawei Technologies Co., Ltd. Method and apparatus for intra prediction using linear model
BR112021018466A2 (pt) * 2019-03-20 2021-11-23 V Nova Int Ltd Processamento de resíduos em codificação de vídeo
JP7321364B2 (ja) 2019-09-14 2023-08-04 バイトダンス インコーポレイテッド ビデオコーディングにおけるクロマ量子化パラメータ
US11356707B2 (en) * 2019-09-23 2022-06-07 Qualcomm Incorporated Signaling filters for video processing
WO2021072177A1 (en) * 2019-10-09 2021-04-15 Bytedance Inc. Cross-component adaptive loop filtering in video coding
JP7443509B2 (ja) 2019-10-14 2024-03-05 バイトダンス インコーポレイテッド ビデオコーディングにおけるクロマ量子化パラメータの使用
JP7508558B2 (ja) 2019-12-09 2024-07-01 バイトダンス インコーポレイテッド ビデオコーディングにおける量子化グループの使用
CN114902657A (zh) 2019-12-31 2022-08-12 字节跳动有限公司 视频编解码中的自适应颜色变换
US12058315B2 (en) 2020-03-04 2024-08-06 Intellectual Discovery Co., Ltd. Video coding method and device, and recording medium storing bitstream

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060105409A (ko) * 2005-04-01 2006-10-11 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
KR100679011B1 (ko) 2004-07-15 2007-02-05 삼성전자주식회사 기초 계층을 이용하는 스케일러블 비디오 코딩 방법 및 장치
US7961963B2 (en) 2005-03-18 2011-06-14 Sharp Laboratories Of America, Inc. Methods and systems for extended spatial scalability with picture-level adaptation
US8175168B2 (en) 2005-03-18 2012-05-08 Sharp Laboratories Of America, Inc. Methods and systems for picture up-sampling
JP2008536414A (ja) * 2005-04-13 2008-09-04 ゴットフリート・ヴィルヘルム・ライプニッツ・ウニヴェルジテート・ハノーヴァー ビデオの拡張された符号化方法及び装置
JP2009522971A (ja) 2006-01-10 2009-06-11 ノキア コーポレイション 拡張可能ビデオ符号化のための切換型フィルタアップサンプリング機構
US8320460B2 (en) 2006-09-18 2012-11-27 Freescale, Semiconductor, Inc. Dyadic spatial re-sampling filters for inter-layer texture predictions in scalable image processing
CN101888559B (zh) 2006-11-09 2013-02-13 Lg电子株式会社 用于解码/编码视频信号的方法及装置
US8054886B2 (en) 2007-02-21 2011-11-08 Microsoft Corporation Signaling and use of chroma sample positioning information
EP2048886A1 (en) * 2007-10-11 2009-04-15 Panasonic Corporation Coding of adaptive interpolation filter coefficients
JP2008103774A (ja) 2008-01-18 2008-05-01 Opnext Japan Inc 高周波光伝送モジュールおよび光伝送器
KR101066117B1 (ko) 2009-11-12 2011-09-20 전자부품연구원 스케일러블 영상 코딩 방법 및 장치
CN101895748B (zh) 2010-06-21 2014-03-26 华为终端有限公司 一种编解码方法以及编解码装置
PL2822276T3 (pl) 2012-02-29 2019-04-30 Lg Electronics Inc Sposób predykcji międzywarstwowej i stosujące go urządzenie
CN110087091B (zh) * 2012-08-06 2021-11-12 Vid拓展公司 多层视频编码中用于空间层的采样栅格信息

Also Published As

Publication number Publication date
WO2014039547A1 (en) 2014-03-13
CN104718752A (zh) 2015-06-17
CN104718752B (zh) 2018-08-28
US20140064386A1 (en) 2014-03-06
JP2015527028A (ja) 2015-09-10
JP2018110412A (ja) 2018-07-12
US10448032B2 (en) 2019-10-15
KR20150052248A (ko) 2015-05-13

Similar Documents

Publication Publication Date Title
JP6342402B2 (ja) スケーラブルビデオコード化におけるダウンサンプリング位相情報の信号伝達
TWI719053B (zh) 內區塊複製合併模式及不可用內區塊複製參考區域之填充
TWI688262B (zh) 用於視訊寫碼之重疊運動補償
JP6141386B2 (ja) 深度範囲パラメータのシグナリング
US9420280B2 (en) Adaptive upsampling filters
CN107409209B (zh) 用于线性模型预测模式的降取样处理
US9344718B2 (en) Adaptive up-sampling filter for scalable video coding
JP6231128B2 (ja) ビデオ情報のスケーラブル及びマルチビュー/3dコード化のための機器及び方法
KR102140361B1 (ko) 멀티 계층 코딩에서의 컨포먼스 윈도우 정보
JP5932049B2 (ja) ビデオコード化のデブロッキングフィルタリングのための境界強度値の決定
TW202027508A (zh) 對以歷史為基礎之運動向量預測器之改良
JP6333942B2 (ja) ビデオ情報のスケーラブルコード化のための装置及び方法
TWI527440B (zh) 在視訊寫碼中針對高效率視訊寫碼(hevc)延伸之多層之低複雜度支援
CN111955007A (zh) 视频解码的方法和装置
CN110800303A (zh) 用于360度视频译码的参考图片推导及运动补偿
TW201803348A (zh) 用於在視頻寫碼中之並列參考指標的一致性約束
KR20190055113A (ko) 비디오 코딩을 위한 가변 수의 인트라 모드들
JP6513684B2 (ja) マルチレイヤビデオコーディングにおける異なるコーデックのベースレイヤのサポート
CN111937394A (zh) 用角度模式扩展的位置相关帧内预测组合
US20140198846A1 (en) Device and method for scalable coding of video information
JP2018110410A (ja) スケーラブルビデオコーディングのための予測モード情報アップサンプリング
TWI535273B (zh) 經組態以寫碼視訊資訊之設備及視訊寫碼裝置、編碼及解碼視訊資訊之方法與非暫態電腦可讀媒體
JP2016521508A (ja) Shvcにおいて再サンプリングプロセスを条件付きで呼び出すこと
US10721465B2 (en) Motion compensation for cubemap packed frames
CN110754091B (zh) 用于360度视频编码的解块滤波

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170523

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170823

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20171024

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180201

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20180209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180417

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180516

R150 Certificate of patent or registration of utility model

Ref document number: 6342402

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250