JP7488256B2

JP7488256B2 - 隣接サンプル依存パラメトリックモデルに基づいたコーディングモードの簡易化

Info

Publication number: JP7488256B2
Application number: JP2021524143A
Authority: JP
Inventors: フランソワエドゥアルド; ルルアンネックファブリス; ポワリエタンギ
Original assignee: インターデイジタルヴィーシーホールディングスインコーポレイテッド
Priority date: 2018-11-05
Filing date: 2019-11-01
Publication date: 2024-05-21
Anticipated expiration: 2039-11-01
Also published as: KR20210083353A; CN112970264A; JP2022506628A; IL282804A; US20220078405A1; EP3878183A1; WO2020096877A1

Description

本実施形態のうちの少なくとも１つは概して、ビデオ符号化、復号、圧縮、または復元のための方法または装置に関する。

高い圧縮効率を達成するために、画像およびビデオコーディングスキームは通常、ビデオコンテンツにおける空間的冗長性および時間的冗長性を活用するために、動きベクトル予測、および変換を含む予測を採用する。一般的に、フレーム内相関またはフレーム間相関を利用するために、イントラ予測またはインター予測が使用され、次いで、予測誤差または予測残差と表わされることが多い、元の画像と予測された画像との間の差が変換され、量子化され、およびエントロピコーディングされる。ビデオを再構築するために、エントロピコーディング、量子化、変換、および予測に対応する逆の処理によって圧縮されたデータが復号される。

本実施形態のうちの少なくとも１つは概して、ビデオ符号化または復号のための方法または装置に関し、特に、隣接サンプル依存パラメトリックモデル（neighboring samples dependent parametric model）に基づいたコーディングモードの簡易化のための方法または装置に関する。

第１の態様に従って、方法が提供される。方法は、カレントブロック内の隣接サンプルのうちの少なくとも１つから、ならびにカレントブロック内の隣接サンプルおよび参照フレーム内の参照サンプルから計算されたパラメトリックモデルから、カレントブロック内のサンプルの予測を判定するステップと、当該予測に基づいて、カレントブロック内の当該サンプルを符号化するステップと、を含む。

第２の態様に従って、方法が提供される。方法は、カレントブロック内の隣接サンプルのうちの少なくとも１つから、ならびにカレントブロック内の隣接サンプルおよび参照フレーム内の参照サンプルから計算されたパラメトリックモデルから、カレントブロック内のサンプルの予測を判定するステップと、当該予測に基づいて、カレントブロック内の当該サンプルを復号するステップと、を含む。

別の態様に従って、装置が提供される。装置は、プロセッサを含む。プロセッサは、上述した方法のいずれかを実行することによって、ビデオのブロックを符号化し、またはビットストリームを復号するように構成されてもよい。

少なくとも１つの実施形態の別の全体態様に従って、デバイスが提供され、デバイスは、復号する実施形態のいずれかに従った装置、および（ｉ）ビデオブロックを含む信号を受信するように構成されたアンテナ、（ｉｉ）受信された信号を、ビデオブロックを含む周波数の帯域に制限するように構成された帯域リミッタ、または（ｉｉｉ）ビデオブロックを表す出力を表示するように構成されたディスプレイ、のうちの少なくとも１つを含む。

少なくとも１つの実施形態の別の全体態様に従って、説明された符号化する実施形態またはその変形例のいずれかに従って生成されたデータコンテンツを含む非一時的コンピュータ可読媒体が提供される。

少なくとも１つの実施形態の別の全体態様に従って、説明された符号化する実施形態またはその変形例のいずれかに従って生成されたビデオデータを含む信号が提供される。

少なくとも１つの実施形態の別の全体態様に従って、説明された符号化する実施形態またはその変形例のいずれかに従って生成されたデータコンテンツを含むビットストリームがフォーマットされる。

少なくとも１つの実施形態の別の全体態様に従って、プログラムがコンピュータによって実行されるとき、説明された復号する実施形態またはその変形例のいずれかをコンピュータに実行させる命令を含むコンピュータプログラム製品が提供される。

添付図面関連して読まれることになる例示的な実施形態の以下の詳細な説明から、全体態様のそれらの態様および他の態様、特徴、ならびに利点が明らかになるであろう。

ａおよびｂの導出のために使用されるサンプルの例示的な位置を示す。ＬＭ＿Ａモードの実施例を示す。ＬＭ＿Ｌモードの実施例を示す。ＪＥＭにおけるＬＩＣモードの表示を示す。標準的な汎用ビデオ圧縮スキームを示す。標準的な汎用ビデオ復元スキームを示す。最も右の位置にある最上ライン（top line）および最も下の位置にある左カラム(left column)からの選択されたサンプルを示す。隣接した特定の位置にある２つのサンプルを使用するための例示的なブロックを示す。最も右の位置にある最上ラインおよび最も下の位置にある左カラムからの選択されたサンプルを示す。最も右の位置および最も左の位置にある最上ラインからの選択されたサンプルを示す。最も上の位置および最も下の位置にある左カラムからの選択されたサンプルを示す。左下の位置、左上の位置、および右上の位置にある選択されたサンプルを示す。最も右の位置および最も左の位置にある最上ラインからの選択されたサンプルを示す。最も上の位置および最も下の位置にある左カラムからの選択されたサンプルを示す。（ａ）は、３つよりも多い位置にある選択されたサンプルを示し、（ｂ）は、上の２つの位置にある選択されたサンプルおよび左の２つの位置にある選択されたサンプルを示し、（ｃ）は、上の３つの位置にある選択されたサンプルおよび左の３つの位置にある選択されたサンプルを示す。線形モデル導出の信頼性を試験するための例示的なブロック図を示す。イントラ予測－インター予測の混合において使用される重みを示す。説明された態様の下の方法の１つの実施形態を示す。全体的な説明された態様の実装態様についての例示的なプロセッサに基づくサブシステムを示す。ＣＣＬＭ／ＭＤＬＭ処理のブロック図を示す。第１の実施形態に従った、ＣＣＬＭ／ＭＤＬＭ処理の修正されたブロック図を示す。第２の実施形態に従った、ＣＣＬＭ／ＭＤＬＭ処理の修正されたブロック図を示す。第２の実施形態の変形例に従った、ＣＣＬＭ／ＭＤＬＭ処理の修正されたブロック図を示す。第３の実施形態の変形例に従った、ＣＣＬＭ／ＭＤＬＭ処理の修正されたブロック図を示す。説明された態様の下の方法の別の実施形態を示す。説明された態様の下の例示的な装置を示す。

本明細書で説明される実施形態は、ビデオ圧縮の分野にあり、概して、ビデオ圧縮ならびにビデオ符号化および復号に関する。

高い圧縮効率を達成するために、画像およびビデオコーディングスキームは通常、ビデオコンテンツにおける空間的冗長性および時間的冗長性を活用するために、動きベクトル予測、および変換を含む予測を採用する。一般的に、フレーム内相関またはフレーム間相関を利用するために、イントラ予測またはインター予測が使用され、次いで、予測誤差または予測残差と表わされることが多い、元の画像と予測された画像との間の差が変換され、量子化され、およびコーディングされる。ビデオを再構築するために、エントロピコーディング、量子化、変換、および予測に対応する逆の処理によって圧縮されたデータが復号される。

ＨＥＶＣ（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ、ＩＳＯ／ＩＥＣ２３００８－２、ＩＴＵ－ＴＨ．２６５）ビデオ圧縮標準では、ビデオの連続したピクチャの間に存在する冗長性を活用するために、動き補償された時間予測が採用される。

これを行うために、動きベクトルが各々の予測ユニット（ＰＵ）に関連付けられる。各々のコーディングツリーユニット（ＣＴＵ）は、圧縮されたドメイン内のコーディングツリーによって表される。これは、各々のリーフがコーディングユニット（ＣＵ）と称される、ＣＴＵの四分木分割である。

各々のＣＵは次いで、いくつかのイントラ予測パラメータまたはインター予測パラメータ（予測情報）が与えられる。これを行うために、それは、１つまたは複数の予測ユニット（ＰＵ）に空間的に区画化され、各々のＰＵは、いくつかの予測情報が割り当てられる。イントラコーディングモードまたはインターコーディングモードは、ＣＵレベルにおいて割り当てられる。

ＪｏｉｎｔＥｘｐｌｏｒａｔｉｏｎＭｏｄｅｌ（ＪＥＭ）として知られる、新たなビデオ圧縮標準に対するＪＶＥＴ（ＪｏｉｎｔＶｉｄｅｏＥｘｐｌｏｒａｔｉｏｎＴｅａｍ）提案では、高い圧縮性能に起因した四分木－二分木（ＱＴＢＴ）ブロック区画化構造を容認することが提案されてきた。二分木（ＢＴ）内のブロックは、中間において水平または垂直のいずれかで分割することによって、２つの等しいサイズにされたサブブロックに分割されることがある。結果として、ＢＴブロックは、ブロックが等しい高さおよび幅を有する正方形形状を常に有するＱＴ内のブロックとは異なり、等しくない幅および高さに有する長方形形状を有することがある。ＨＥＶＣでは、１８０度の角度にわたって４５度から－１３５度までで角度イントラ予測方向（angular intra prediction direction）が定義されており、それらは、ターゲットブロックの形状に依存した角度方向の定義を行ったＪＥＭにおいて維持されている。

それらのブロックを符号化するために、前に再構築された隣接サンプルを使用して、推定されたバージョンのブロックを提供するために、イントラ予測が使用される。次いで、ソースブロックと予測との間の差が符号化される。上記の古典的なコーデックでは、カレントブロックの左および上にある参照サンプルの単一のラインが使用される。

ＨＥＶＣ（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ、Ｈ．２６５）では、ビデオシーケンスのフレームの符号化は、四分木（ＱＴ）ブロック区画化構造に基づいている。フレームは、正方形コーディングツリーユニット（ＣＴＵ）に分割され、ＣＴＵは全て、レート歪み（ＲＤ）基準に基づいた複数のコーディングユニット（ＣＵ）への四分木方式分割（quadtree based splitting）を受ける。各々のＣＵは、イントラ予測され、すなわち、因果的隣接ＣＵ（causal neighbor CU）から空間的に予測され、またはインター予測され、すなわち、既に復号された参照フレームから時間的に予測される、のいずれかである。Ｉスライスでは、全てのＣＵがイントラ予測されるのに対し、ＰスライスおよびＢスライスの両方では、ＣＵは、イントラ予測またはインター予測されることがある。イントラ予測のために、ＨＥＶＣは、１つの平面モード（モード０としてインデックス付けされる）、１つのＤＣモード（モード１としてインデックス付けされる）、および３３個の角度モード（モード２～３４としてインデックス付けされる）を含む、３５個の予測モードを定義する。角度モードは、時計回り方向において４５度から－１３５度までの範囲の予測方向と関連付けられる。ＨＥＶＣが四分木（ＱＴ）ブロック区画化構造をサポートするので、全ての予測ユニット（ＰＵ）は、正方形形状を有する。よって、４５度から－１３５度までの予測角度を定義することは、ＰＵ（予測ユニット）の形状の観点から正当化される。サイズＮ×Ｎの画素のターゲット予測ユニットに対し、最上参照アレイ（top reference array）および左参照アレイ（left reference array）は各々、サイズ２Ｎ＋１のサンプルであり、それは、全てのターゲット画素についての上述した角度範囲を網羅するために必要とされる。ＰＵの高さおよび幅が等しい長さの高さおよび幅であることを考えると、２つの参照アレイの長さが等しいことも理に適っている。

本発明は、所与のブロックの予測を実行するためにパラメトリックモデルを使用するモードに特に焦点が当てられた、ビデオ圧縮の分野にあり、モデルのパラメータは、ブロックの隣接サンプルから導出される。そのようなモードの２つの例は、「クロスコンポーネント線形モデル」（ＣＣＬＭ：cross-component linear model）モードおよび「局所的照度補償」（ＬＩＣ：Local illumination compensation）モードである。本発明は、それらのモードの設計を簡易化および改善することを目的とする。

ＣＣＬＭおよびその変形例の説明
以下のセクションは、異なる変形例のＣＣＬＭを説明する。

基本的なＣＣＬＭモードの説明
その初期のバージョンの（ＪＶＥＴ＿Ｋ１００２を参照）では、ＣＣＬＭモードは、式（１）のように、線形モデルを使用して同一のブロックまたはＣＵの再構築されたルマサンプルに基づいて、クロマサンプルを予測することから構成される。
ｐｒｅｄ_C（ｉ，ｊ）＝ａ．ｒｅｃ_L’（ｉ，ｊ）＋ｂ式（１）
ｐｒｅｄ_C（ｉ，ｊ）は、ＣＵ内の予測されたクロマサンプルを表し、ｒｅｃ_L’（ｉ，ｊ）は、同一のＣＵのダウンサンプルされた、再構築されたルマサンプルを表す。パラメータａおよびｂは、式（２）および式（３）のように、カレントブロックの周りの隣接した再構築されたルマサンプルおよびクロマサンプルの間の回帰誤差を最小化することによって導出される。
ａ＝（ＳＬＣ－ＳＬ．ＳＣ）／（ＳＬＬ－ＳＬ．ＳＬ）式（２）
ｂ＝ＳＣ－ａ．ＳＬ式（３）
Ｌ（ｉ，ｊ）は、ダウンサンプルされた最上の隣接した再構築されたルマサンプルおよびダウンサンプルされた左の隣接した再構築されたルマサンプルを表し、Ｃ（ｉ，ｊ）は、最上の隣接した再構築されたクロマサンプルおよび左の隣接した再構築されたクロマサンプルを表し、Ｎは、カレントクロマコーディングブロックの幅および高さの最小値の２倍に等しく、ＳＬ、ＳＣ、ＳＬＬ、ＳＬＣは、以下のように定義される（記号Σは、最上の隣接したサンプルおよび左の隣接したサンプルにわたった合計を表す）。
－ＳＬ＝ΣＬ（ｎ）
－ＳＣ＝ΣＣ（ｎ）
－ＳＬＣ＝Ｎ・Σ（Ｌ（ｎ）・Ｃ（ｎ））
－ＳＬＬ＝Ｎ・Σ（Ｌ（ｎ）・Ｌ（ｎ））

正方形形状を有するコーディングブロックに対し、上記２つの式が直接適用される。非正方形コーディングブロックについて、より長い境界の隣接したサンプルは、より短い境界についてのサンプルと同一の数のサンプルを有するように最初にサブサンプリングされる。図１は、左のサンプルの位置および上のサンプルの位置、ならびにＣＣＬＭモードに関与するカレントブロックのサンプルの位置を示す。

ＣＵがＣＣＬＭモードを使用してコーディングされるとき、最小平均二乗（ＬＭＳ）法が復号処理において実行される。結果として、ａ値およびｂ値をデコーダに伝達するためにシンタックスが使用されない。

ＭＤＬＭモード
ＭＤＬＭモードは、ＪＶＥＴ－Ｌ０３３８において提案された基本的なＣＣＬＭ設計の改良であり、（ｔｏｐ＋ｌｅｆｔ）参照サンプルテンプレートに加えて、線形モデル係数αおよびβを導出するよう、左専用テンプレート（left-only template）または最上専用テンプレート（top-only template）を選択することが可能である。これは、ＬＭ＿ＡおよびＬＭ＿Ｌ値と称される２つの新たなＣＣＬＭモードが追加されることを意味する。

ＬＭ＿Ａモード（図２を参照）では、線形モデル係数を計算するために上テンプレートのみが使用される。より多くのサンプルを取得するために、上テンプレートが（Ｗ＋Ｈ）まで拡張され、Ｗはブロックの幅であり、Ｈはその高さである。ＬＭ＿Ｌモード（図３を参照）では、線形モデル係数を計算するために左テンプレートのみが使用される。より多くのサンプルを取得するために、左テンプレートが（Ｈ＋Ｗ）まで拡張される。

非正方形ブロックに対し、上テンプレートがＷ＋Ｗまで拡張され、左テンプレートがＨ＋Ｈまで拡張される。

上／左テンプレートが利用可能でない場合、ＬＭ＿Ａ／ＬＭ＿Ｌモードは、チェックされず、またはシグナリングされない。利用可能なサンプルの数が十分に多くない場合、テンプレートは、最も右の（最上テンプレートについての）サンプルまたは最も下の（左テンプレートについての）サンプルを最も近いｌｏｇ２数に複製することによってパディングされる。

ラインバッファ制約を有するＣＣＬＭ／ＭＤＬＭ
現在のＣＣＬＭ係数導出処理では、ＣＣＬＭモード（ＣＣＬＭまたはＭＤＬＭ）の最上テンプレートを取得するようダウンサンプリングするために、２つのルマラインバッファが原則として使用されるが、従来のルマ成分イントラ予測においては１つのルマラインバッファのみが使用される。ラインバッファを減少させるために、ＣＴＵの最上境界に沿ったＣＵに対し、ＬＭ＿Ｌモードのみが使用される。このケースでは、追加のラインバッファが必要とされない。

局所的照度補償の説明
このツールでは、デコーダは、予測されることになるカレントブロックの左および／または最上部において局所化されたいくつかの再構築されたピクチャサンプル、ならびに動き補償されたブロックの左および／または最上部において局所化された参照ピクチャサンプルに基づいて、いくつかの予測パラメータを計算する（図４）。考慮される従来技術のコーデック（ＪＥＭ）では、所与のブロックに対するＬＣＩの使用は、ＬＩＣフラグと称される、このブロックに関連付けられたフラグに依存する。

ＬＩＣパラメータ（ａ，ｂ）は、式（４）に示される歪みを最小化する、最小平均二乗最小化に基づいている。
ｄｉｓｔ＝Σ_{(r∈Vcur,s∈Vref)}（Ｒｃｕｒ（ｒ）－ａ．Ｒｒｅｆ（ｓ）－ｂ）²
式（４）
Ｒｃｕｒ（ｒ）は、隣接した再構築されたサンプルであり、Ｒｒｅｆ（ｓ）は、参照サンプルである。ａおよびｂの導出は、ａおよびｂが前のセクション（式（２）および式（３））において導出された方式と同様である。

カレントＣＵに対してＬＩＣパラメータがエンコーダまたはデコーダによって取得されると、カレントＣＵの予測ｐｒｅｄ（ｉ，ｊ）は、以下の式（５）（単方向予測ケース）から構成される。
ｐｒｅｄ（ｉ，ｊ）＝ａ．ｒｅｆ（ｉ，ｊ）＋ｂ式（５）
ｒｅｆ（ｉ，ｊ）は、カレントブロックの時間予測に対して使用される参照ブロックである。

本明細書で説明される全体態様は、隣接サンプル依存パラメトリックモデルに基づいたＣＣＬＭまたはＬＩＣと同様のモードの設計を改善および簡易化することを目的としている。提案される修正は、パラメトリックモデルのパラメータを導出する方式に関連し、従来技術と比較して、統一化かつ簡易化された方式においてコーデックに含まれるパラメトリックモデル方式の予測ツールをどのように設計するかに関連する。

１つのアプローチは、線形パラメータを導出するためのＣＣＬＭ処理の簡易化を提案する。パラメータａおよびｂを、全ての隣接した再構築されたルマサンプルの間の最小ルマ値および最大ルマ値に対応する２つのポイントを通過する直線のパラメータとして導出するよう、ＬＭＳ方法を置き換えることが提案される。

ａの値およびｂの値は、式（６）および式（７）のように導出される。
ａ＝（Ｃ_B－Ｃ_A）／（Ｌ_B－Ｌ_A）式（６）
ｂ＝Ｃ_A－ａ．Ｌ_A 式（７）
（Ｌ_A，Ｃ_A）は、それに対してＬ_Aが全てのルマ値の間で最小値を有する、隣接した再構築されたサンプルにおけるルマ値およびクロマ値のカップルであり、（Ｌ_B，Ｃ_B）は、それに対してＬ_Bが全てのルマ値の間で最大値を有する、隣接した再構築されたサンプルにおけるルマ値およびクロマ値のカップルである。

このアプローチはなお、最小ルマ値および最大ルマ値を識別する複数の検査を実行することを必要とする。また、それは、Ｌ_AおよびＬ_Aが近いときに問題に直面することがある。

初期のＣＣＬＭスキームおよび初期のＬＩＣスキームにおいて使用されるＬＭＳアプローチは、他の問題を有する。１つの重要なことは、入力サンプルが雑音によって破損されるときにＬＭＳがバイアスにつながり、サンプルがコーディングまたは予測から結果として生じるので、それが明らかであることである。これは、ツールのコーディング効率を低減させることがある。

本明細書で説明される全体態様は、以下の様々な変更を提案する。
－パラメトリックモデルのパラメータを導出するために使用されるサンプルの選択の簡易化：サンプルは、予め定義された位置からフェッチされる
－パラメトリックモデルのパラメータの導出のときに代替的なコーディングモードを使用することは信頼性を有しない
－場合によってはビットストリームにおいてシグナリングされる、パラメトリックモデルのパラメータの導出に補正項（corrective term）を挿入すること
－ＬＩＣとＣＣＬＭとの間でのパラメトリックモデルのパラメータの導出処理を統一すること
－インターブロックおよび混合イントラ－インターブロックに対してＣＣＬＭを拡張すること。

それらの共位置にされた参照サンプルＲｒｅｆ（ｐ）からの、サイズＷカラム×Ｈラインのブロック内の位置ｐにおけるサンプルのカレントブロックＰｃｕｒ（ｐ）を予測する一般的な問題を考慮されたい。また、サンプルがＢビットのビット深度を使用して表されることを考慮されたい。ＣＣＬＭでは、参照サンプルは、再構築されたルマサンプルである。ＬＩＣでは、参照サンプルは、参照ピクチャ内の動き補償されたブロックからのサンプルである。また、予測するブロックの隣接において、再構築されたカレントサンプル（Ｒｃｕｒ）および再構築された参照サンプル（Ｒｒｅｆ）が利用可能である。これは、図７において示される。隣接サンプルは、ブロックの最も近いライン／カラムに必ずしもない。

目的は、ブロック内のＲｒｅｆ（ｐ）から、ならびにブロックの隣接に位置する（典型的には、ブロックの外側のより上のラインおよび左カラム）サンプルＲｃｕｒおよびＲｒｅｆから計算されたパラメトリックモデルから、ブロック内のｐについてのＰｃｕｒ（ｐ）を導出することである。

実施形態１－参照サンプルアレイ内の特定の位置にある直接選択された２つのサンプルの使用
１つの実施形態では、パラメトリックモデルのパラメータの導出を簡易化するために、パラメータは、サンプルが空間的に離れるように選択された、隣接サンプルの少なくとも２つのサンプルから導出される。

１つの実装態様では、以下の処理が適用される（図８において説明された処理）。
－最上サンプルおよび左サンプルの両方が利用可能である場合（ステップ４０１）、最も右の位置にある外側の最上ラインの利用可能なサンプルが選択され（Ｒｒｅｆ_A，Ｒｃｕｒ_A）、最も下の位置にある外側の左カラムの利用可能なサンプルが選択される（Ｒｒｅｆ_B，Ｒｃｕｒ_B）（ステップ４０３）（図９における例示を参照）
－他に、最上サンプルが利用可能である場合（ステップ４０２）、最も右の位置にある外側の最上ラインの利用可能なサンプルが選択され（Ｒｒｅｆ_A，Ｒｃｕｒ_A）、最も左の位置にある外側の最上ラインの利用可能なサンプルが選択される（Ｒｒｅｆ_B，Ｒｃｕｒ_B）（ステップ４０５）（図１０における例示を参照）
－他に、左サンプルが利用可能である場合（ステップ４０４）、最も下の位置にある外側の左カラムの利用可能なサンプルが選択され（Ｒｒｅｆ_A，Ｒｃｕｒ_A）、最も上の位置にある外側の左カラムの利用可能なサンプルが選択される（Ｒｒｅｆ_B，Ｒｃｕｒ_B）（ステップ４０７）（図１１における例示を参照）
－そうでなければ、ＣＣＬＭモードが適用されない（ステップ４０６）。

パラメータａおよびｂは、式（８）および式（９）のように導出される。
ａ＝（Ｒｃｕｒ_B－Ｒｃｕｒ_A）／（Ｒｒｅｆ_B－Ｒｒｅｆ_A）式（８）
ｂ＝Ｒｃｕｒ_A－ａ．Ｒｒｅｆ_A 式（９）
また、いずれかの位置ｐについてのブロック内の予測は、式（１０）のように計算される。
Ｐｃｕｒ（ｐ）＝ａ．Ｒｒｅｆ（ｐ）＋ｂ式（１０）

ＪＶＥＴ－Ｌ０１９１と比較して、解決策は、隣接した参照サンプルの最小値および最大値を識別するために必要とされる複数の検査を回避する。

同一の概念がＭＤＬＭモードに直接適用可能である。例えば、最上サンプルがＭＤＬＭにおいて使用されように選択されるとき、図１０に示されるサンプルが使用される。左サンプルがＭＤＬＭにおいて使用されるように選択されるとき、図１１に示されるサンプルが使用される。

実施形態２－参照サンプルアレイ内の特定の位置にある直接選択された３＋サンプルの使用
この実施形態では、パラメトリックモデルのパラメータの導出を簡易化するために、パラメータは、図１２に示されるように、サンプルが空間的に離れるように選択された、隣接サンプルの少なくとも３つのサンプルから導出される。概念は、図１３および図１４に示されるＭＤＬＭのケースにも適用される。

全てのサンプルが最小ルマ値サンプルおよび最大ルマ値サンプルを発見するよう比較される、上記言及されたアプローチとは異なり、最小ルマ値および最大ルマ値を計算するために３つのみのサンプルまたはそれ以上のサンプルが使用される。最悪のケースは、３つのサンプルのケースにおける２つの比較に制限される。

線形モデルパラメータは、その前のアプローチ、以下の式（６）および式（７）にあるように計算される。

図１５に示されるように、特定の位置にある３つよりも多いサンプルが選択されてもよい。

別の変形例では、最大で４つのサンプルは以下のように使用される。サイズＷｔｏｐの最上ラインの参照サンプルに対し、位置ｘ＝０、ｘ＝Ｗｔｏｐ－１にあるサンプルが使用される。サイズＨｌｅｆｔの左カラムの参照サンプルに対し、位置ｙ＝０、ｙ＝Ｈｌｅｆｔ－１にあるサンプルが使用される。これは、図１５（ｂ）に示される。

別の変形例では、最大で６つのサンプルは以下のように使用される。サイズＷｔｏｐの最上ラインの参照サンプルに対し、位置ｘ＝０、ｘ＝Ｗｔｏｐ－１にあるサンプルおよび中間（例えば、位置ｘ＝Ｗｔｏｐ／２）にある１つのサンプルが使用される。サイズＨｌｅｆｔの左カラムの参照サンプルに対し、位置ｙ＝０、ｙ＝Ｈｌｅｆｔ－１にあるサンプルおよび中間（例えば、位置ｙ＝Ｈｌｅｆｔ／２）にある１つのサンプルが使用される。これは、図１５（ｃ）に示される。

実施形態では、コントリビューションＪＶＥＴ－Ｌ０１９１にあるように、参照サンプルの最小値および最大値（Ｌ_AおよびＬ_B）に基づいて線形パラメータを計算するケースでは、それらの最小値および最大値は、選択された参照ルマサンプルのみを使用して計算される。上の実施形態では、参照サンプルの最大数が２、３、４、５、または６まで減少するので、これは、最小ルマサンプル値および最大ルマサンプル値を識別するために必要な検査の回数を著しく制限する。コントリビューションＪＶＥＴ－Ｌ０１９１では、最悪のケースでは、この検査の回数は、Ｗｔｏｐ最上参照サンプルおよびＨｌｅｆｔ左参照サンプルを有する所与のブロックに対して（Ｗｔｏｐ＋Ｈｌｅｆｔ）×２に等しい。本発明を使用して、この数は、２×２、３×２、４×２、５×２、または６×２まで減少する。

実施形態３－線形モデルが良好に定義されないときの代替的なモードの使用
線形パラメータの計算は、除算を伴う。ＬＭＳのケースでは、それは、式（１１）から構成される。
ａ＝（ＳＬＣ－ＳＬ．ＳＣ）／（ＳＬＬ－ＳＬ．ＳＬ）式（１１）

前のアプローチでは、それは、式（１２）から構成される。
ａ＝（Ｒｃｕｒ_B－Ｒｃｕｒ_A）／（Ｒｒｅｆ_B－Ｒｒｅｆ_A）式（１２）

両方のケースでは、ａはａ＝Ｎｕｍ／Ｄｅｎとして取得され、Ｎｕｍは除算の分子であり、Ｄｅｎは除算の分母である。Ｄｅｎが小さな振幅のものであるとき、これが問題となることがあり、線形パラメータの安定しない推定につながることがある。

また、非常に小さいサイズのブロックに対し、線形パラメータを導出するためのサンプルの数が、信頼性を有する推定を得るために十分の多くないことが考えられることがある。

実施形態では、線形パラメータの導出が良好に定義されると考えられる場合のみ、線形モデルに基づく予測が使用される。そうでなければ、代替的なモードが使用される（図１６における例示的なブロック図）。

線形パラメータ導出の信頼性を検査する異なる方式が使用されてもよい。例えば、以下の条件のうちの１つが真である場合、線形パラメータ導出が適用される。
－Ｄｅｎ＞Ｔ１である場合、
－Ｔ１はブロックサイズに依存することがある予め定義された閾値であり、Ｂはサンプルビット深度である。例えば、
－Ｔ１＝Ｔ２×Ｗ×Ｈ×２^B
－Ｔ２は予め定義された閾値である
－（ＷｘＨ＞Ｎｍｉｎ）である場合、線形パラメータ導出が適用される
－ＷおよびＨは、ブロックの幅および高さである
そうでなければ、簡易化されたモデルが使用される。

閾値Ｔ１またはＴ２も、様々なレベルにおいて、例えば、ＳＰＳ、ＰＰＳ、スライス、タイルグループ、タイル、ＣＴＵ、またはＣＵごとにシグナリングされてもよい。特定の閾値がブロックサイズごとにシグナリングされてもよい。

代替的なモードは、簡易化されたモデルを使用することに基づいてもよい。
－加算的モデル：ａが１に強制され（forced to）、ｂのみが導出される。
Ｐｃｕｒ（ｐ）＝Ｒｒｅｆ（ｐ）＋ｂ
－スケーリングモデル：ｂが０に強制され、ａのみが導出される。
Ｐｃｕｒ（ｐ）＝ａ．Ｒｒｅｆ（ｐ）

実施形態４－線形パラメータの導出における補正パラメータの使用
実施形態では、線形パラメータを導出するために使用される式に補正パラメータＣＰが導入される。

この補正パラメータの利点は、複数の取り得る補正パラメータＣＰによって導入される柔軟性のおかげで、従来技術と比較してコーディング効率を増大させることである。

加算モード（additive mode））または乗算モード（multiplicative mode）において、線形モデルのスケーリングパラメータを導出するときに分子または分母を補正するためにＣＰが使用されてもよい。例えば、以下の補正モードが適用されてもよい。
－Ｎｕｍ’＝ＣＰ×Ｎｕｍ、およびａ＝Ｎｕｍ’／Ｄｅｎ
－Ｎｕｍ’＝（Ｎｕｍ＋ＣＰ×ｓｉｇｎ（Ｎｕｍ））、およびａ＝Ｎｕｍ’／Ｄｅｎ
－Ｄｅｎ’＝ＣＰ×Ｄｅｎ、およびａ＝Ｎｕｍ／Ｄｅｎ’
－Ｄｅｎ’＝（Ｄｅｎ＋ＣＰ×ｓｉｇｎ（Ｄｅｎ））、およびａ＝Ｎｕｍ／Ｄｅｎ’

補正パラメータＣＰは、様々なレベルにおいて、例えば、ＳＰＳ、ＰＰＳ、スライス、タイルグループ、タイル、ＣＴＵ、またはＣＵごとにシグナリングされてもよい。

パラメータは、Ｋ個の取り得る予め定義された値｛ＣＰ₀，ＣＰ₁，…，ＣＰ_K-1｝の制限された集合からフェッチされてもよい。この集合における値のインデックスに対応するインデックスのみがコーディングされてもよい。

ＣＰは、ＮｕｍまたはＤｅｎに依存してもよい。特に、ＣＰが加算パラメータであるとき、ＣＰは、以下のように、考慮された値により増加することができ、
－Ｎｕｍ’＝（Ｎｕｍ＋（ａｂｓ（Ｎｕｍ）＞＞Ｋ２）×ｓｉｇｎ（Ｎｕｍ））、およびａ＝Ｎｕｍ’／Ｄｅｎ
－Ｄｅｎ’＝（Ｄｅｎ＋（ａｂｓ（Ｄｅｎ）＞＞Ｋ２）×ｓｉｇｎ（Ｄｅｎ））、およびａ＝Ｎｕｍ／Ｄｅｎ’
または代わりに、ＣＰは、以下のように、負の補正を使用して増加することができ、
－Ｎｕｍ’＝（Ｎｕｍ－（ａｂｓ（Ｎｕｍ）＞＞Ｋ２）×ｓｉｇｎ（Ｎｕｍ））、およびａ＝Ｎｕｍ’／Ｄｅｎ
－Ｄｅｎ’＝（Ｄｅｎ－（ａｂｓ（Ｄｅｎ）＞＞Ｋ２）×ｓｉｇｎ（Ｄｅｎ））、およびａ＝Ｎｕｍ／Ｄｅｎ’
または代わりに、ＣＰは、以下のように、負の補正を使用して増加することができ、
－Ｎｕｍ’＝（Ｎｕｍ－（ａｂｓ（Ｎｕｍ）＞＞Ｋ２）×ｓｉｇｎ（Ｎｕｍ））、およびａ＝Ｎｕｍ’／Ｄｅｎ
－Ｄｅｎ’＝（Ｄｅｎ－（ａｂｓ（Ｄｅｎ）＞＞Ｋ２）×ｓｉｇｎ（Ｄｅｎ））、およびａ＝Ｎｕｍ／Ｄｅｎ’
Ｋ２は、所与の予め定義された値、例えば、ＣＰ＝ｋ／６４と同等のＫ２＝６である。ａｂｓ（ｘ）は、ｘの加群（module）を返す関数である。

実施形態４ａ－除算を生じさせるための修正されたルックアップテーブルの使用
実装態様を容易にするために、実装態様を複雑にすることがある、線形パラメータの導出に伴う除算をルックアップテーブルによって達成することができる。

実際に、除算ａ＝Ｎｕｍ／Ｄｅｎを、
ａ＝（Ｎｕｍ×Ｉｎｔ（（１＜＜Ｋ０）／Ｄｅｎ）＋ｏｆｆｓｅｔ０）＞＞Ｋ０としての除算なしに達成することができ、Ｋ０は、除算の精度に対応する所与の値であり、ｏｆｆｓｅｔ０は、典型的には（１＜＜（Ｋ０－１））に等しい所与のオフセット値であり、Ｉｎｔ（）は、整数演算子または床演算子（最も近い下限整数値に丸める）。

より一般的に、以下のようにそれを達成することができる。
ａ＝（Ｎｕｍ×（１＜＜Ｉｎｔ（Ｄｅｎ／（１＜＜Ｋ１）））×Ｉｎｔ（（１＜＜Ｋ０）／（Ｄｅｎ％Ｋ１））＋ｏｆｆｓｅｔ０）＞＞Ｋ０
Ｋ１は、ＬＵＴの最大サイズ（（１＜＜Ｋ１）に等しい）を固定する所与のパラメータであり、「％」は、モジュロ演算子である。

値Ｉｎｔ（（１＜＜Ｋ０）／ｋ）は、ルックアップテーブルｄｉｖＬＵＴ［ｋ］に記憶されてもよい。

実施形態では、ルックアップテーブルｄｉｖＬＵＴ［ｋ］は、補正パラメータＣＰを使用して、推定においてバイアスを導入するよう修正される。例えば、以下の補正モードが適用されてもよい。
ｄｉｖＬＵＴ［ｋ］＝Ｉｎｔ（２^K0／（ｋ＋ＣＰ））式（１３）
ｄｉｖＬＵＴ［ｋ］＝Ｉｎｔ（２^K0／（ｋ×ＣＰ））式（１４）
ｄｉｖＬＵＴ［ｋ］＝Ｉｎｔ（（２^K0＋ＣＰ）／ｋ）式（１５）
ｄｉｖＬＵＴ［ｋ］＝Ｉｎｔ（（２^K0×ＣＰ）／ｋ）式（１６）

ＣＰは、ｋに依存してもよい。特に、ＣＰが加算的であるとき（式（１３）または式（１５）のケース）、ＣＰの加群は、ｋにより増加することができる。

実施例では、ＣＰ＝ｋ＞＞Ｋ２、またはＣＰ＝－ｋ＞＞Ｋ２であり、Ｋ２は、所与の予め定義された値、例えば、ＣＰ＝ｋ／６４またはＣＰ＝－ｋ／６４と同等のＫ２＝６である。

ＬＵＴは、デコーダに記憶されてもよい。代わりに、それは、オンザフライで計算されてもよく、補正パラメータＣＰまたはＫ２は、様々なレベルにおいて、例えば、ＳＰＳ、ＰＰＳ、スライス、タイルグループ、タイル、ＣＴＵ、またはＣＵごとにストリームにおいてシグナリングされてもよい。

実施形態５－ＬＩＣおよびＣＣＬＭの統一
ＬＩＣの現在の設計では、線形パラメータを導出するためにＬＭＳ処理が適用される。現在のＣＣＬＭでは、線形パラメータは、参照ルマサンプルの最小値および最大値に対応するサンプルの２つの集合から導出される。

実施形態では、ＬＩＣパラメータおよびの導出およびＣＣＬＭパラメータの導出は、統一され、同一の簡易化された処理を使用する。例えば、サンプルの２つの集合を識別することに基づいた同一の導出処理が両方のツールにおいて使用される。

１つの実施形態では、ＬＩＣ線形パラメータの導出およびＣＣＬＭ線形パラメータの導出の両方は、それに対してＲｒｅｆ_AおよびＲｒｅｆ_Bが隣接参照サンプルの最小値および最大値に対応する、サンプルの２つの集合（Ｒｒｅｆ_A，Ｒｃｕｒ_A）および（Ｒｒｅｆ_B，Ｒｃｕｒ_B）を識別することから構成される。

別の実施形態では、ＬＩＣ線形パラメータの導出およびＣＣＬＭ線形パラメータの導出の両方は、利用可能な隣接サンプルの位置にある極度位置（extreme location）においてフェッチされたサンプルの２つの集合（Ｒｒｅｆ_A，Ｒｃｕｒ_A）および（Ｒｒｅｆ_B，Ｒｃｕｒ_B）を識別することから構成される。

両方のケースでは、線形パラメータは、式（１７）および式（１８）のように導出され、
ａ＝（Ｒｃｕｒ_B－Ｒｃｕｒ_A）／（Ｒｒｅｆ_B－Ｒｒｅｆ_A）式（１７）
ｂ＝Ｒｃｕｒ_A－ａ．Ｒｒｅｆ_A 式（１８）
いずれかの位置ｐについてのブロックにおける予測は、式（１９）のように計算される。
Ｐｃｕｒ（ｐ）＝ａ．Ｒｒｅｆ（ｐ）＋ｂ式（１９）

実施形態２および３において議論された変形例も、両方のケースに適用されてもよい。

実施形態６－インターブロックへのＣＣＬＭの拡張
現在の設計では、ＣＣＬＭのみがイントラＣＵまたはイントラブロックに適用される。

実施形態では、ＣＣＬＭは、インターＣＵのクロマ成分を予測するために有効にされる。したがって、新たなモード、混合インターＣＣＬＭが本明細書で導入される。モードは、ＣＵレベルフラグを使用して、ＣＵごとにシグナリングされてもよい。
－ルマ成分がインターモードを使用してコーディングされる。
－ルマ成分サンプルの予測および再構築の全処理が実行される。
－ルマブロックサンプルの全再構築まで、完全再構築処理が実行される。
－ブロックのクロマ成分サンプルが、ブロックの再構築されたルマサンプルを使用して、ＣＣＬＭモードを使用して、すなわち、ブロックの隣接した再構築されたルマサンプルおよびクロマサンプルからの計算された線形パラメータを使用して予測される。
－これは、ブロックのクロマ成分サンプルが時間予測を使用して構築されないことを意味する。

演算をパイプライン化する観点で、この新たなモードは、従来のＣＣＬＭモードと同一の問題を生じさせる。隣接からの再構築されたサンプルが必要とされると共に、カレントブロックからの再構築されたルマサンプルが必要とされるので、全てのイントラルマブロックおよびインタールマブロックが処理されると、混合インターＣＣＬＭモードによりコーディングされたブロックの処理を遅延させることが望ましい。

実施形態７－混合イントラ－インターブロックへのＣＣＬＭの拡張
ＶＴＭ（ＶｅｒｓａｔｉｌｉｅＶｉｄｅｏＣｏｄｉｎｇＴｅｓｔＭｏｄｅｌ）では、新たなモード、混合イントラ－インターが導入されている。モードは、１つのイントラ予測および１つのマージインデックス付けされた時間予測を組み合わせる。マージＣＵでは、フラグが真であるとき、イントラ候補リストからイントラモードを選択するよう、１つのフラグがマージモードに対してシグナリングされる。ルマ成分に対し、ＤＣモード、平面モード、水平モード、および垂直モードを含む４つのイントラ予測モードからイントラ候補リストが導出され、イントラ候補リストのサイズは、ブロック形状に応じて３または４であってもよい。ＣＵ幅がＣＵ高さの２倍よりも大きいとき、水平モードは、イントラモードリストから除外され、ＣＵ高さがＣＵ幅の２倍よりも大きいとき、垂直モードは、イントラモードリストから除去される。イントラモードインデックスによって選択された１つのイントラ予測モードおよびマージインデックスによって選択された１つのマージインデックス付けされた予測は、重み付け平均を使用して組み合わされる。クロマ成分に対し、ＤＭは、余分なシグナリングなしに常に適用される。

予測を組み合わせるための重みは、以下のように説明される（図１７にも示される）。ＤＣモードもしくは平面モードが選択され、またはブロッ幅もしくは高さが４よりも小さいとき、等しい重みが適用される。４以上の幅および高さを有するそれらのブロックに対し、水平／垂直モードが選択されるとき、１つのブロックが４つの等しいエリアの領域に垂直／水平に最初に分割される。（ｗ＿ｉｎｔｒａ_i，ｗ＿ｉｎｔｅｒ_i）として表され、ｉが１～４であり、（ｗ＿ｉｎｔｒａ₁，ｗ＿ｉｎｔｅｒ₁）＝（６，２）、（ｗ＿ｉｎｔｒａ₂，ｗ＿ｉｎｔｅｒ₂）＝（５，３）、（ｗ＿ｉｎｔｒａ₃，ｗ＿ｉｎｔｅｒ₃）＝（３，５）、および（ｗ＿ｉｎｔｒａ₄，ｗ＿ｉｎｔｅｒ₄）＝（２，６）である各々の重み集合が、対応する領域に適用される。（ｗ＿ｉｎｔｒａ₁，ｗ＿ｉｎｔｅｒ₁）は、参照サンプルに最も近い領域に対するものであり、（ｗ＿ｉｎｔｒａ₄，ｗ＿ｉｎｔｅｒ₄）は、参照サンプルから最も遠い領域に対するものである。次いで、組み合わされた予測は、２つの重み付けられた予測および右にシフトした３ビットを合計することによって計算されてもよい。その上、予測子のイントラ仮説（intra hypothesis）についてのイントラ予測モードは、後続の隣接ＣＵの参照のために保存されてもよい。

提案される実施形態では、ＣＣＬＭは、混合イントラ－インターＣＵのクロマ成分を予測するために有効にされる。したがって、新たなモード、混合インターＣＣＬＭが導入される。モードは、ＣＵレベルフラグを使用してＣＵごとにシグナリングされてもよい。フラグは、ＤＭモードまたはＣＣＬＭモードが使用されるかどうかを示す。

代わりに、クロマに対してＤＭモードを適用する代わりに、他のアプローチと同様に、ＤＭモードの代わりにＣＣＬＭモードが適用される。
－ルマ成分が混合イントラ－インターモードを使用してコーディングされる。
－ルマ成分サンプルの予測および再構築の全処理が実行される。
－ブロックのクロマ成分サンプルが、ブロックの再構築されたルマサンプルを使用して、ＣＣＬＭモードを使用して、すなわち、ブロックの隣接した再構築されたルマサンプルおよびクロマサンプルから計算された線形パラメータを使用して予測される。

第１のバージョンでは、クロマ成分に対してイントラ予測およびインター予測の混合が存在せず、ＣＣＬＭモードを使用してクロマブロックが完全に予測される。

変形例では、イントラ予測およびインター予測を重み付けて混合することは、ＤＭモードが水平モードまたは垂直モードに対応するのと同様に、クロマ成分に対してなおも適用され、それは、クロマの最終的な予測がインター予測の混合およびＣＣＬＭの混合であることを意味する。従来技術において説明される混合処理が適用されてもよい。

代わりに、ＤＭがＤＣモードおよび平面モードに対応する従来技術と同様に、クロマブロック全体に対して同一の等しい重みが使用されてもよい。

前の実施形態にあるように、演算をパイプライン化する観点で、全てのイントラルマブロック、インタールマブロック、および混合イントラ－インタールマブロックが処理されると、混合インター－ＣＣＬＭモードによりコーディングされたブロックの処理を遅延させることが可能である。

ＣＣＬＭにおいて使用されるメモリサイズの減少
その実際の実装態様では、コントリビューションＪＶＥＴ－Ｌ０１９１におけるＣＣＬＭ処理は、以下のように達成される（Ｂはルマ信号およびクロマ信号のビット深度を表す）。

最小ルマ値および最大ルマ値Ｌ_A、Ｌ_B、およびそれらの関連するクロマ値Ｃ_A、Ｃ_Bが識別されると、線形パラメータが以下のように導出される。各々のステップについての疑似コードの記述を使用して、図２０のブロック図に処理が示される。

変数ａ、ｂ、およびｓｈｉｆｔ＿ｐｒｅｄは、以下のように導出される。
－パラメータｓｈｉｆｔ、ａｄｄ、ｄｉｆｆ、およびｋが以下のように導出される。
－（Ｂ＞８）である場合、ｓｈｉｆｔが（Ｂ－９）に等しく設定され、そうでなければ、ｓｈｉｆｔが０に等しく設定される（ステップ５０１）
－（ｓｈｉｆｔ＞０）である場合、ａｄｄが（１＜＜（ｓｈｉｆｔ－１））に等しく設定され、そうでなければ、ａｄｄが０に等しく設定される（ステップ５０２）
－ｄｉｆｆ＝（Ｌ_B－Ｌ_A＋ａｄｄ）＞＞ｓｈｉｆｔ（ステップ５０３）
－ｓｈｉｆｔ＿ｐｒｅｄ＝１６
－ｄｉｆｆが０よりも大きい場合（ステップ５０４）、以下が適用される、
－ｄｉｖ＝（（Ｃ_B－Ｃ_A）×ＬＵＴ＿ｌｏｗ［ｄｉｆｆ－１］＋２¹⁵）＞＞１６（ステップ５０５）
－ａ＝（（Ｃ_B－Ｃ_A）×ＬＵＴ＿ｈｉｇｈ［ｄｉｆｆ－１］＋ｄｉｖ＋ａｄｄ）＞＞ｓｈｉｆｔ（ステップ５０６）
－そうでなければ（ステップ５０４）、以下が適用される、
－ａ＝０（ステップ５０７）
－ｂが以下のように導出される（ステップ５０８）
－ｂ＝Ｃ_A－（（ａ×Ｌ_A）＞＞ｓｈｉｆｔ＿ｐｒｅｄ）
ＬＵＴ＿ｈｉｇｈおよびＬＵＴ＿ｌｏｗは、５１２個の要素の２つのルックアップテーブルであり、その各々は、以下のように導出される。
ＬＵＴ＿ｈｉｇｈ［ｘ］＝Ｆｌｏｏｒ（２¹⁶／ｄｉｆｆ）
ＬＵＴ＿ｌｏｗ［ｘ］＝Ｆｌｏｏｒ（２³²／ｄｉｆｆ）－Ｆｌｏｏｒ（２¹⁶／ｄｉｆｆ）ｘ２¹⁶
Ｆｌｏｏｒ（ｘ）は、ｘ以下の最大整数である。

クロマブロック内のいずれかのｐについての予測サンプルＰｃｕｒ（ｐ）は、以下のように導出される（ステップ５０９）、
－Ｐｃｕｒ（ｐ）＝（（ｐＲｅｆ（ｐ）×ａ）＞＞ｓｈｉｆｔ＿ｐｒｅｄ）＋ｂ

信号ビット深度によって定義された許容された範囲内で信号を維持するために、クリッピングも適用される。

以下の問題が観察される、
－５１２の整数の２つのルックアップテーブル、ＬＵＴ＿ｈｉｇｈおよびＬＵＴ＿ｌｏｗが必要とされる。
－８ビットよりも多い信号に対し、パラメータａを導出するために（Ｂ－９）の右シフトが適用され、それは、精度の損失につながることがある。
－予測サンプルＰｃｕｒ（ｐ）を生成するとき、パラメータｋによる右シフトが式の第１の項に適用され、それは、精度の損失につながることがある。

以下の実施形態は、それらの問題に対処することを目的とする。それらは、共に組み合わされてもよい。

実施形態８－ルックアップテーブルのうちの１つの除去
１つの実施形態では、ルックアップテーブルＬＵＴ＿ｌｏｗを除去することによって処理が簡易化される。パラメータａが以下のように導出される。
ａ＝（（Ｃ_B－Ｃ_A）×ＬＵＴ＿ｈｉｇｈ［ｄｉｆｆ－１］＋ａｄｄ）＞＞ｓｈｉｆｔ

１つの変形例では、ＬＵＴ＿ｈｉｇｈ［ｘ］が以下のように導出される。
ＬＵＴ＿ｈｉｇｈ［ｘ］＝Ｆｌｏｏｒ（（２¹⁶＋（ｄｉｆｆ／２））／ｄｉｆｆ）
これは、２の係数だけメモリの必要性を低減させることを可能にする。

修正された処理が図２１に示され、変更したブロックが太線で示される。新たなブロックは、前のステップ５０６に代えてステップ６０６であり、前のステップ５０５は除去されている。

実施形態９－ルックアップテーブルへのアクセスの修正
１つの実施形態では、ルックアップテーブルへのアクセスが以下のように修正される。
ｓｈｉｆｔ＝（Ｌ_B－Ｌ_A）／２^K、または同様に、
ｓｈｉｆｔ＝（Ｌ_B－Ｌ_A）＞＞Ｋ
ＫはＢよりも少ない整数値である。

これは、以下のことを可能にする。
－ルックアップテーブルのサイズを２^K個の要素に減少させる。Ｋ＝８であるとき、これは、ＪＶＥＴ－Ｌ０１９１の参照の実装態様における５１２個の代わりに、２５６個の要素にテーブルを制限する。
－２^Bがルックアップテーブルのサイズよりも大きい場合でさえ、（Ｌ_B－Ｌ_A）が２^Kより小さいときのａの計算において精度を高める。これは、２^Bが実際のルックアップテーブルのサイズ（５１２個）よりも大きいとすぐに、（Ｌ_B－Ｌ_A）が（Ｂ－９）によって分割される、ＪＶＥＴ－Ｌ０１９１の参照の実装態様におけるケースではない。

修正された処理が図２２に示され、変更したブロックが太線で示される。新たなブロックは、前のステップ５０６に代えてステップ７０１である。

実施形態では、追加のステップ７０１ａは、以下のようにシフト値を修正するよう、ステップ７０１の後およびステップ５０２の前に導入される。
－ｓｈｉｆｔ＞０である場合、ｓｈｉｆｔ＝１＋Ｆｌｏｏｒ（Ｌｏｇ２（ｓｈｉｆｔ））
Ｌｏｇ２（ｘ）は、ｘの二進対数である。

変更が図２３に示される。例えば、Ｋ＝８（サイズ２^K＝２５６個の要素のテーブル）であり、入力信号ビット深度がＢ＝１０であるケースについて、以下の結果が取得される、
－（Ｌ_B－Ｌ_A）が０～２５５である場合、ｓｈｉｆｔが０に等しく設定される
－そうでなく、（Ｌ_B－Ｌ_A）が２５６～５１１である場合、ｓｈｉｆｔが１に等しく設定される
－そうでなく、（Ｌ_B－Ｌ_A）が５１２～１０２３である場合、ｓｈｉｆｔが２に等しく設定される
この処理は、（ｄｉｆｆ－１）の値が最大テーブルインデックス値内に残ることを保証する。

実施形態１０－線形予測の適合
１つの実施形態では、予測信号の計算における精度を高めるために、パラメータｂが以下のように計算される、
ｂ＝（Ｃ_A＜＜ｓｈｉｆｔ＿ｐｒｅｄ）－（ａ×Ｌ_A）＋（１＜＜（ｓｈｉｆｔ＿ｐｒｅｄ－１））
また、線形予測が以下のように実行される。
Ｐｃｕｒ（ｐ）＝（ｐＲｅｆ（ｐ）×ａ＋ｂ）＞＞ｓｈｉｆｔ＿ｐｒｅｄ

修正された処理が図２４に示され、変更したブロックが太線で示される。新たなブロックは、前のステップ５０８に代えてステップ８０８であり、前のステップ５０９に代えてステップ８０９である。

本明細書で説明される全体態様の下の方法１８００の１つの実施形態が図１８に示される。方法は、開始ブロック１８０１において開始し、制御がブロック１８１０に進み、ブロック１８１０では、カレントブロック内の隣接サンプルのうちの少なくとも１つから、ならびにカレントブロック内の隣接サンプルおよび参照フレーム内の参照サンプルから計算されたパラメトリックモデルから、カレントブロック内のサンプルを予測する。制御がブロック７１０からブロック７２０に進み、ブロック７２０では、予測されたサンプルを使用してブロックを符号化する。

本明細書で説明される全体態様の下の方法２５００の別の実施形態が図２５に示される。方法は、開始ブロック２５０１において開始し、制御がブロック２５１０に進み、ブロック２５１０では、カレントブロック内の隣接サンプルのうちの少なくとも１つから、ならびにカレントブロック内の隣接サンプルおよび参照フレーム内の参照サンプルから計算されたパラメトリックモデルから、カレントブロック内のサンプルを予測する。制御がブロック２５１０からブロック２５２０に進み、ブロック２５２０では、予測されたサンプルを使用してブロックを復号する。

図２６は、隣接サンプル依存パラメトリックモデルに基づいた簡易化されたコーディングモードを使用して、ビデオデータを符号化し、復号し、圧縮し、または復元する装置２６００の１つの実施形態を示す。装置は、プロセッサ２６１０を含み、少なくとも１つのポートを通じてメモリ２６２０に相互接続されてもよい。プロセッサ２６１０およびメモリ２６２０の両方は、外部接続への１つまたは複数の追加の相互接続をも有してもよい。

プロセッサ２６１０はまた、ビットストリームに情報を挿入し、またはビットストリームにおいて情報を受信するかのいずれか、および説明された態様のいずれかを使用して圧縮し、符号化し、または復号するかのいずれかを行うように構成される。

本出願は、ツール、機構、実施形態、モデル、アプローチなどを含む様々な態様を説明する。それらの態様の多くは、少なくとも個々の特性を示すために詳細に説明される。しかしながら、このことは、説明を明確にすることを目的としており、本出願またはそれらの態様の範囲を限定しない。実際に、異なる態様の全ては、更なる態様を提供するよう組み合わされてもよく、相互に交換されてもよい。その上、態様は、前の出願でも説明された態様と組み合わされてもよく、相互に交換されてもよい。

本出願において説明および考慮される態様は、多くの異なる形式において実装されてもよい。図５、図６、および図１９は、いくつかの実施形態を提供するが、他の実施形態も考慮され、図５、図６、および図１９の議論は、実装態様の範囲を制限するものではない。態様のうちの少なくとも１つは概して、ビデオ符号化およびビデオ復号に関し、少なくとも１つの他の態様は概して、生成されたビットストリームまたは符号化されたビットストリームを伝送することに関する。それらの態様および他の態様は、方法、装置、説明される方法のいずれかに従ってビデオデータを符号化もしくは復号するための命令を記憶したコンピュータ可読記憶媒体、および／または説明される方法のいずれかに従って生成されたビットストリームを記憶したコンピュータ可読記憶媒体として実装されてもよい。

本出願では、用語「再構築される」および「復号される」は、相互に交換可能に使用されてもよく、用語「画素」および「サンプル」は、相互に交換可能に使用されてもよく、用語「画像」、「ピクチャ」、および「フレーム」は、相互に交換可能に使用されてもよい。通常、必ずしもそうではないが、用語「再構築される」は、エンコーダ側において使用され、用語「復号される」は、デコーダ側において使用される。

様々な方法が本明細書で説明され、方法の各々は、説明される方法を達成するための１つまたは複数のステップまたはアクションを含む。ステップまたはアクションの特定の順序が方法の適切な動作のために必要とされない限り、特定のステップおよび／またはアクションの順序および／または仕様は、修正されてもよく、または組み合わされてもよい。

本出願において説明される様々な方法および他の態様は、図５および図６のビデオエンコーダ１００およびデコーダ２００のモジュール、例えば、イントラ予測モジュール、エントロピコーディングモジュール、および／または復号モジュール（１６０、３６０、１４５、３３０）を修正するために使用されてもよい。その上、本態様は、ＶＶＣまたはＨＥＶＣに限定されず、以前から存在し、またはこれから開発されるかどうかに関わらず、例えば、他の標準および勧告、ならびにいずれかのそのような標準および勧告の拡張（ＶＶＣおよびＨＥＶＣを含む）に適用されてもよい。他に示されない限り、または技術的に排除されない限り、本出願において説明される態様は、個々に使用されてもよく、または組み合わせで使用されてもよい。

様々な数値が本出願において使用される。例えば、特定の値を意図しており、説明される態様はそれらの特定の値に限定されない。

図５は、エンコーダ１００を示す。このエンコーダ１００の変形例が考慮されるが、エンコーダ１００は、全ての予測される変形例を記述することなく、明確を目的として以下で説明される。

符号化される前、ビデオシーケンスは、圧縮に対してより弾力性がある信号分布を得るために（例えば、色成分の１つのヒストグラム均等化を使用して）、事前符号化処理（１０１）、例えば、入力色ピクチャに色変換を適用すること（例えば、ＲＧＢ４：４：４からＹＣｂＣｒ４：２：０への変換）、または入力ピクチャ成分の再マッピングを実行することを受けてもよい。メタデータが事前処理と関連付けられてもよく、ビットストリームに付加されてもよい。

エンコーダ１００では、以下で説明されるように、エンコーダ要素によってピクチャが符号化される。符号化されることになるピクチャは、区画化され（１０２）、例えば、ＣＵの単位（ユニット）で処理される。各々のユニットは、例えば、イントラモードまたはインターモードのいずれかを使用して符号化される。ユニットがイントラモードにおいて符号化されるとき、それは、イントラ予測（１６０）を実行する。インターモードでは、動き推定（１７５）および補償（１７０）が実行される。エンコーダは、ユニットを符号化するためにイントラモードまたはインターモードのどちらを使用するかを決定し、例えば、予測モードフラグによってイントラ／インター決定を示す。例えば、元の画像ブロックから予測されたブロックを差し引くこと（１１０）によって予測残差が計算される。

次いで、予測残差が変換（１２５）および量子化される（１３０）。量子化された変換係数と共に、動きベクトルおよび他のシンタックス要素は、ビットストリームを出力するようエントロピコーディングされる（１４５）。エンコーダは、変換をスキップしてもよく、変換されていない残差信号に量子化を直接適用してもよい。エンコーダは、変換および量子化の両方をバイパスしてもよく、すなわち、変換および量子化処理の適用なしに残差が直接コーディングされる。

エンコーダは、更なる予測のための参照を提供するよう、符号化されたブロックを復号する。量子化された変換係数は、予測残差を復号するよう、逆量子化（１４０）および逆変換される（１５０）。復号された予測残差および予測されたブロックを組み合わせて（１５５）、画像ブロックが再構築される。符号化アーチファクトを低減させるよう、例えば、デブロッキング／ＳＡＯ（サンプル適応オフセット：Sample Adaptive Offset）フィルタリングを実行するために、インループフィルタ（１６５）が再構築されたピクチャに適用される。フィルタリングされた画像が参照ピクチャバッファ（１８０）に記憶される。

図６は、ビデオデコーダ２００のブロック図を示す。デコーダ２００では、ビットストリームは、以下で説明されるように、デコーダ要素によって復号される。ビデオデコーダ２００は概して、図５に説明されたような符号化パスと相互の復号パスを実行する。エンコーダ１００も概して、ビデオデータを符号化することの一部としてビデオを復号することを実行する。

特に、デコーダの入力は、ビデオエンコーダ１００によって生成することができるビデオビットストリームを含む。ビットストリームは、変換係数、動きベクトル、および他のコーディングされた情報を取得するよう最初にエントロピ復号される（２３０）。ピクチャ区画化情報は、ピクチャがどのように区画化されるかを示す。したがって、デコーダは、復号されたピクチャ区画化情報に従ってピクチャを分割する（２３５）。変換係数は、予測残差を復号するよう、逆量子化（２４０）および逆変換される（２５０）。復号された予測残差および予測されたブロックを組み合わせて（２５５）、画像ブロックが再構築される。予測されたブロックは、イントラ予測（２６０）または動き補償された予測（すなわち、インター予測）（２７５）から取得されてもよい（２７０）。ループフィルタ（２６５）は、再構築された画像に適用される。フィルタリングされた画像が参照ピクチャバッファ（２８０）に記憶される。

復号されたピクチャは更に、復号後処理（２８５）、例えば、事前符号化処理（１０１）において実行された再マッピング処理の逆を実行する、逆色変換（例えば、ＹＣｂＣｒ４：２：０からＲＧＢ４：４：４への変換）または逆再マッピングを受けてもよい。復号後処理は、事前符号化処理において導出され、ビットストリームにおいてシグナリングされたメタデータを使用してもよい。

図１９は、様々な態様および実施形態が実装されるシステムの実施例のブロック図を示す。システム１０００は、以下で説明される様々な構成要素を含むデバイスとして具体化されてもよく、本明細書において説明される態様のうちの１つまたは複数を実行するように構成される。そのようなデバイスの例は、それらに限定されないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオレコーディングシステム、接続されたホームアプライアンス、およびサーバを含む。システム１０００の要素は単独または組み合わせで、単一の集積回路（ＩＣ）、複数のＩＣ、および／または分離した構成要素において具体化されてもよい。例えば、少なくとも１つの実施形態では、システム１０００処理要素およびエンコーダ／デコーダ要素は、複数のＩＣおよび／または離散した構成要素にわたって分散される。様々な実施形態では、システム１０００は、例えば、通信バスを介して、または専用入力および／もしくは出力ポートを通じて、１つまたは複数の他のシステムまたは他の電子デバイスに通信可能に結合される。様々な実施形態では、システム１０００は、本明細書において説明される態様のうちの１つまたは複数を実装するように構成される。

システム１０００は、例えば、本明細書において説明される様々な態様を実装するためにロードされる命令を実行するように構成される。プロセッサ１０１０は、埋め込みメモリ、入力出力インタフェース、および本分野において既知の様々な他の回路を含んでもよい。システム１０００は、少なくとも１つのメモリ１０２０（例えば、揮発性メモリデバイスおよび／または不揮発性メモリデバイス）を含む。システム１０００は、記憶装置１０４０を含み、記憶装置１０４０は、それらに限定されないが、電気的消去可能プログラマブルリードオンリメモリ（ＥＥＰＲＯＭ）、リードオンリメモリ（ＲＯＭ）、プログラマブルリードオンリメモリ（ＰＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、スタティックランダムアクセスメモリ（ＳＲＡＭ）、フラッシュ、磁気ディスクドライブ、および／または光学ディスクドライブ含む、不揮発性メモリおよび／または揮発性メモリを含んでもよい。記憶装置１０４０は、非限定的な実施例として、内蔵記憶装置、取り付け記憶装置（取り外し可能記憶装置および非取り外し可能記憶装置を含む）、ならびに／またはネットワークアクセス可能記憶装置を含んでもよい。

システム１０００は、例えば、符号化されたビデオまたは復号されたビデオを提供するようデータを処理するように構成されたエンコーダ／デコーダモジュール１０３０を含み、エンコーダ／デコーダモジュール１０３０は、その自身のプロセッサおよびメモリを含んでもよい。エンコーダ／デコーダモジュール１０３０は、符号化機能および／または復号機能を実行するようデバイスに含めることができるモジュール（複数可）を表す。既知なように、デバイスは、符号化モジュールおよび復号モジュールの一方または両方を含んでもよい。加えて、エンコーダ／デコーダモジュール１０３０は、システム１０００の別個の要素として実装されてもよく、または当業者に既知なハードウェアおよびソフトウェアの組み合わせとしてプロセッサ１０１０内に組み込まれてもよい。

本明細書において説明される様々な態様を実行するようプロセッサ１０１０またはエンコーダ／デコーダ１０３０にロードされることになるプログラムコードは、記憶装置１０４０に記憶されてもよく、その後、プロセッサ１０１０による実行のためにメモリ１０２０にロードされてもよい。様々な実施形態に従って、プロセッサ１０１０、メモリ１０２０、記憶装置１０４０、およびエンコーダ／デコーダモジュール１０３０のうちの１つまたは複数は、本明細書において説明される処理の実行の間に様々な項目のうちの１つまたは複数を記憶してもよい。そのような記憶された項目は、それらに限定されないが、入力されたビデオ、復号されたビデオまたは復号されたビデオの一部、ビットストリーム、マトリクス、変数、ならびに数式、公式、演算、および演算ロジックの処理からの中間結果または最終結果を含んでもよい。

いくつかの実施形態では、プロセッサ１０１０および／またはエンコーダ／デコーダモジュール１０３０の内部のメモリは、命令を記憶し、符号化または復号の間に必要な処理のためのワーキングメモリを提供するために使用される。しかしながら、それらの機能のうちの１つ以上に対して、処理デバイス（例えば、処理デバイスは、プロセッサ１０１０またはエンコーダ／デコーダモジュール１０３０のいずれかであってもよい）の外部のメモリが使用される。外部メモリは、メモリ１０２０ならびに／または記憶装置１０４０、例えば、動的揮発性メモリおよび／もしくは不揮発性フラッシュメモリであってもよい。いくつかの実施形態では、例えば、テレビのオペレーティングシステムを記憶するために外部不揮発性フラッシュメモリが使用される。少なくとも１つの実施形態では、ＲＡＭなどの高速外部動的揮発性メモリは、ＭＰＥＧ－２（ＭＰＥＧは、ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐを指し、ＭＰＥＧ－２はＩＳＯ／ＩＥＣ１３８１８とも称され、１３８１８－１もＨ．２２２として既知であり、１３８１８－２もＨ．２６２として既知である）、ＨＥＶＣ（ＨＥＶＣは、Ｈ．２６５およびＭＰＥＧ－ＨＰａｒｔ２としても既知のＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇを指す）、またはＶＶＣ（ＪｏｉｎｔＶｉｄｅｏＥｘｐｅｒｔｓＴｅａｍ（ＪＶＥＴ）によって開発されている新たな標準であるＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ）などについてのビデオコーディング演算および復号演算のためのワーキングメモリとして使用される。

システム１０００の要素への入力は、ブロック１１３０において示されるように様々な入力デバイスを通じて提供されてもよい。そのような入力デバイスは、それらに限定されないが、（ｉ）ブロードキャスタによって無線で送信されたＲＦ信号を受信する無線周波数（ＲＦ）部分、（ｉｉ）コンポーネント（ＣＯＭＰ）入力端子（または、ＣＯＭＰ入力端子のセット）、（ｉｉｉ）ユニバーサルシリアルバス（ＵＳＢ）入力端子、および／または（ｉｖ）ＨｉｇｈＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅ（ＨＤＭＩ）入力端子を含む。図１９に示されない他の例は、コンポジットビデオを含む。

様々な実施形態では、ブロック１１３０の入力デバイスは、本分野において既知の関連するそれぞれの入力処理要素を有する。例えば、ＲＦ部分は、（ｉ）所望の周波数を選択し（信号を選択すること、または信号を周波数の帯域に帯域制限することとも称される）、（ｉｉ）選択された信号をダウンコンバートし、（ｉｉｉ）例えば、特定の実施形態ではチャネルと称されることがある信号周波数帯域を選択するよう周波数のより狭い帯域に再度帯域制限し、（ｉｖ）ダウンコンバートされ、帯域制限された信号を復調し、（ｖ）誤り訂正を実行し、（ｖｉ）所望のデータパケットのストリームを選択するよう逆多重化する、野に適切な要素と関連付けられてもよい。様々な実施形態のＲＦ部分は、それらの機能を実行する１つまたは複数の要素、例えば、周波数セレクタ、信号セレクタ、帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤り訂正器、およびマルチプレクサを含む。ＲＦ部分は、例えば、受信された信号をより低い周波数（例えば、中間周波数もしくはベースバンドに近い周波数）またはベースバンドにダウンコンバートすることを含む、様々なそれらの機能を実行するチューナを含んでもよい。１つのセットトップボックスの実施形態では、ＲＦ部分およびその関連する入力処理要素は、有線（例えば、ケーブル）媒体を通じて送信されたＲＦ信号を受信し、所望の周波数帯域へのフィルタリング、ダウンコンバート、および再度のフィルタリングによって周波数選択を実行する。様々な実施形態は、上記説明された（および、他の）要素の順序を再配列し、それらの要素の一部を除去し、および／または類似の機能もしくは異なる機能を実行する他の要素を追加する。要素を追加することは、例えば、増幅器およびアナログ－デジタル変換器を挿入することなど、既存の要素の間に要素を挿入することを含んでもよい。様々な実施形態では、ＲＦ部分は、アンテナを含む。

加えて、ＵＳＢ端子および／またはＨＤＭＩ端子は、ＵＳＢ接続および／またはＨＤＭＩ接続の間でシステム１０００を他の電子デバイスに接続するためのそれぞれのインタフェースプロセッサを含んでもよい。入力処理、例えば、リードソロモン誤り訂正の様々な態様が、例えば、別個の入力処理ＩＣ内で、またはプロセッサ１０１０内で必要に応じて実装されてもよいことが理解されよう。同様に、ＵＳＢインタフェース処理またはＨＤＭＩインタフェース処理の態様は、別個のインタフェースＩＣ内で、またはプロセッサ１０１０内で必要に応じて実装されてもよい。復調されたストリーム、誤り訂正されたストリーム、および逆多重化されたストリームは、出力デバイス上で提示するために必要に応じてデータストリームを処理するために、例えば、プロセッサ１０１０、ならびにメモリおよび記憶素子との組み合わせで動作するエンコーダ／デコーダ１０３０を含む様々な処理要素に提供される。

システム１０００の様々な要素は、統合された筐体内で設けられてもよい。統合された筐体内で、様々な要素は、適切な接続配列、例えば、インターＩＣ（Ｉ２Ｃ）バス、配線、およびプリント回路基板を含む、本分野において既知の内部バスを使用して、相互接続されてもよく、それらの間でデータを伝送してもよい。

システム１０００は、通信チャネル１０６０を介して他のデバイスとの通信を有効にする通信インタフェース１０５０を含む。通信インタフェース１０５０は、それらに限定されないが、通信チャネル１０６０を通じてデータを送信および受信するように構成された送受信機を含んでもよい。通信インタフェース１０５０は、それらに限定されないが、モデムまたはネットワークカードを含んでもよく、通信チャネル１０６０は、例えば、有線媒体および／または無線媒体内で実装されてもよい。

様々な実施形態では、Ｗｉ－Ｆｉネットワーク、例えば、ＩＥＥＥ８０２．１１（ＩＥＥＥは、ＩｎｓｔｉｔｕｔｅｏｆＥｌｅｃｔｒｉｃａｌａｎｄＥｌｅｃｔｒｏｎｉｃｓＥｎｇｉｎｅｅｒｓを指す）などの無線ネットワークを使用して、データがシステム１０００にストリーミングされ、またはそうでなければ、システム１０００に提供される。それらの実施形態のＷｉ－Ｆｉ信号は、Ｗｉ－Ｆｉ通信に対して適合された通信チャネル１０６０および通信インタフェース１０５０を通じて受信される。それらの実施形態の通信チャネル１０６０は典型的には、ストリーミングアプリケーションおよび他のオーバザトップ通信を可能にするための、インターネットを含む外部ネットワークへのアクセスを提供するアクセスポイントまたはルータに接続される。他の実施形態は、入力ブロック１１３０のＨＤＭＩ接続を通じてデータを配送するセットトップボックスを使用して、システム１０００にストリーミングされたデータを提供する。更なる他の実施形態は、入力ブロック１１３０のＲＦ接続を使用して、システム１０００にストリーミングされたデータを提供する。上記示されたように、様々な実施形態は、非ストリーミング方式においてデータを提供する。加えて、様々な実施形態は、Ｗｉ－Ｆｉ以外の無線ネットワーク、例えば、セルラネットワークまたはＢｌｕｅｔｏｏｔｈネットワークを使用する。

システム１０００は、ディスプレイ１１００、スピーカ１１１０、および他の周辺デバイス１１２０を含む、様々な出力デバイスに出力信号を提供してもよい。様々な実施形態のディスプレイ１１００は、例えば、タッチスクリーンディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、カーブドディスプレイ、および／またはフォルダブルディスプレイ、のうちの１つまたは複数を含む。ディスプレイ１１００は、テレビ、タブレット、ラップトップ、セルフォン（携帯電話）、または他のデバイスに対するものであってもよい。ディスプレイ１１００はまた、他の構成要素（例えば、スマートフォンにあるような）と統合されてもよく、または別個であってもよい（例えば、ラップトップに対する外部モニタ）。他の周辺デバイス１１２０は、実施形態の様々な実施例では、スタンドアロンデジタルビデオディスク（もしくは、デジタル多用途ディスク）（両方の用語に対するＤＶＲ）、ディスクプレイヤ、ステレオシステム、および／または照明システム、のうちの１つまたは複数を含む。様々な実施形態は、システム１０００の出力に基づいて機能を提供する１つまたは複数の周辺デバイス１１２０を使用する。例えば、ディスクプレイヤは、システム１０００の出力を再生する機能を実行する。

様々な実施形態では、ＡＶリンク、コンシューマエレクトロニクスコントロール（ＣＥＣ）、またはユーザの介入によりもしくはユーザの介入なしにデバイスツーデバイス制御を有効にする他の通信プロトコルなどのシグナリングを使用して、システム１０００と、ディスプレイ１１００、スピーカ１１１０、または他の周辺デバイス１１２０との間で制御信号が通信される。出力デバイスは、それぞれのインタフェース１０７０、１０８０、および１０９０を通じて専用接続を介して、システム１０００に通信可能に結合されてもよい。代わりに、出力デバイスは、通信インタフェース１０５０を介して通信チャネル１０６０を使用して、システム１０００に接続されてもよい。ディスプレイ１１００およびスピーカ１１１０は、例えば、テレビなどの電子デバイスにおいてシステム１０００の他の構成要素と単一のユニットにおいて統合されてもよい。様々な実施形態では、ディスプレイインタフェース１０７０は、例えば、タイミングコントローラ（ＴＣｏｎ）チップなどのディスプレイドライバを含む。

ディスプレイ１１００およびスピーカ１１１０は代わりに、例えば、入力１１３０のＲＦ部が別個のセットトップボックスの部分である場合、他の構成要素の内の１つまたは複数とは別個であってもよい。ディスプレイ１１００およびスピーカ１１１０が外部構成要素である様々な実施形態では、出力信号は、例えば、ＨＤＭＩポート、ＵＳＢポート、またはＣＯＭＰ出力を含む専用出力接続を介して提供されてもよい。

実施形態は、プロセッサ１０１０もしくはハードウェア、またはハードウェアおよびソフトウェアの組み合わせによって実装されたコンピュータソフトウェアによって実行されてもよい。非限定的な実施例として、実施形態は、１つまたは複数の集積回路によって実装されてもよい。メモリ１０２０は、技術的環境に適切ないずれかのタイプのメモリであってもよく、非限定的な実施例として、光学メモリデバイス、磁気メモリデバイス、半導体方式メモリデバイス、固定メモリ、および着脱可能メモリなどのいずれかの適切なデータ技術を使用して実装されてもよい。プロセッサ１０１０は、技術的環境に適切ないずれかのタイプのプロセッサであってもよく、非限定的な実施例として、マイクロプロセッサ、汎用コンピュータ、特殊目的コンピュータ、およびマルチコアアーキテクチャに基づくプロセッサのうちの１つまたは複数を含んでもよい。

様々な実装態様は、復号することを伴う。本出願において使用される「復号すること」は、例えば、表示のために適切な最終的な出力を生成するために、受信され符号化されたシーケンスにおいて実行される処理の全てまたは一部を含んでもよい。様々な実施形態では、そのような処理は、デコーダ、例えば、エントロピ復号、逆量子化、逆変換、および差分復号によって典型的には実行される処理のうちの１つまたは複数を含む。様々な実施形態では、そのような処理は加えてまたは代わりに、本出願において説明される様々な実装態様のデコーダによって実行される処理を含む。

更なる実施例として、１つの実施形態では、「復号すること」は、エントロピ復号することのみを指し、別の実施形態では、「復号すること」は、差分復号することのみを指し、別の実施形態では、「復号すること」は、エントロピ復号することおよび差分復号することの組み合わせを指す。フレーズ「復号処理」が演算または全体的により広義に復号処理のサブセットを指すことが、特定の説明のコンテキストに基づいて明確であることが意図され、当業者によって公知であると信じられる。

様々な実装態様は、符号化することを伴う。「復号すること」と同様の方式では、本出願において使用される「符号化すること」は、例えば、符号化されたビットストリームを生成するために、入力ビデオシーケンスに対して実行される処理の全てまたは一部を含んでもよい。様々な実施形態では、そのような処理は、エンコーダ、例えば、区分化、差分符号化、変換、量子化、およびエントロピ符号化によって典型的には実行される処理のうちの１つまたは複数を含む。様々な実施形態では、そのような処理は加えてまたは代わりに、本出願において説明される様々な実装態様のエンコーダによって実行される処理を含む。

更なる実施例として、１つの実施形態では、「符号化すること」は、エントロピ符号化することのみを指し、別の実施形態では、「符号化すること」は、差分符号化することのみを指し、別の実施形態では、「符号化すること」は、差分符号化することおよび差分符号化することの組み合わせを指す。フレーズ「符号化処理」が演算または全体的により広義に符号化処理のサブセットを指すことが、特定の説明のコンテキストに基づいて明確であることが意図され、当業者によって公知であると信じられる。

本明細書で使用されるシンタックス要素は、記述的用語であることに留意されたい。それ自体として、それらは、他のシンタックス要素名の使用を排除しない。

図がフローチャートとして表されるとき、それは対応する装置のブロック図も提供することが理解されるべきである。同様に、図がブロック図として表されるとき、それは対応する方法／処理のフローチャートも提供することが理解されるべきである。

様々な実施形態は、パラメトリックモデルを指す。特に、計算の複雑性を多くに仮定して、符号化処理の間、レートと歪みとの間のバランスまたはトレードオフが通常考慮される。それは、レート歪み最適化（ＲＤＯ）メトリック、最小平均二乗（ＬＭＳ）、絶対誤差平均（ＭＡＥ）、または他のそのような測定を通じて測定されてもよい。レート歪み最適化は通常、レートの重み付け合計および歪みの重み付け合計である、レート歪み関数を最小化するとして定式化される。レート歪み最適化問題を解く異なるアプローチが存在する。例えば、アプローチは、全ての考慮されるモードまたはコーディングパラメータ値を含む全ての符号化オプションの広範な試験と共に、符号化および復号の後の再構築された信号のそれらの符号化コストおよび関連する歪みの完全な評価に基づいてもよい。符号化の複雑性、特に、再構築されたものではなく、予測信号または予測残差信号に基づいた近似された歪みの計算による符号化の複雑性を抑えるためにより高速なアプローチも使用されてもよい。取り得る符号化オプションの一部のみについての近似された歪み、および他の符号化オプションについての完全な歪みを使用することなどによって、それらの２つのアプローチの混合も使用されてもよい。他のアプローチは、取り得る符号化オプションのサブセットのみを評価する。より一般的に、多くのアプローチは、最適化を実行する様々な技術のいずれかを採用するが、最適化は必ずしも、符号化コストおよび関連する歪みの両方の完全な評価ではない。

本明細書で説明される実装態様および態様は、例えば、方法もしくは処理、装置、ソフトウェアプログラム、データストリーム、または信号において実装されてもよい。単一の形式の実装態様のコンテキストにおいてのみ議論される場合でさえ（例えば、方法として議論される）、議論される特徴の実装態様は、他の形式（例えば、装置またはプログラム）において実装されてもよい。装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアにおいて実装されてもよい。方法は、例えば、処理デバイスを指すプロセッサにおいて実装されてもよく、処理デバイスは概して、例えば、コンピュータ、マイクロプロセッサ、集積回路、またはプログラマブル論理回路を含む。プロセッサはまた、例えば、コンピュータ、携帯電話、ポータブル／携帯情報端末（「ＰＤＡ」）、エンドユーザの間の情報の通信を促進する他のデバイスなどの通信デバイスを含む。

「１つの実施形態」、「実施形態」、「１つの実装態様」、または「実装態様」と共に、それらの他の変形例は、実施形態と関連して説明された特定の特徴、構造、および特性などが、少なくとも１つの実施形態に含まれることを意味する。よって、フレーズ「１つの実施形態では」、「実施形態では」、「１つの実装態様では」、または「実装態様では」の出現と共に、本出願の全体を通じて様々な位置で出現するいずれかの他の変形例は、全てが同一の実施形態を必ずしも指すわけではない。

加えて、本出願は、情報の様々な部分を「判定すること」に言及してもよい。情報を判定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、またはメモリから情報を取り出すことのうちの１つまたは複数を含んでもよい。

更に、本出願は、情報の様々な部分に「アクセスすること」に言及してもよい。情報にアクセスすることは、例えば、情報を受信すること、情報を取り出すこと（例えば、メモリから）、情報を記憶すること、情報を移動すること、情報を複製すること、情報を計算すること、情報を判定すること、情報を予測すること、または情報を推定することのうちの１つまたは複数を含んでもよい。

加えて、本出願は、情報の様々な部分を「受信すること」に言及してもよい。「アクセスすること」と共に受信することは、広義な用語であることが意図される。情報を受信することは、例えば、情報にアクセスすること、または情報を取り出すこと（例えば、メモリから）のうちの１つまたは複数を含んでもよい。更に、「受信すること」は典型的には、例えば、情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動すること、情報を複製すること、情報を消去すること、情報を計算すること、情報を判定すること、情報を予測すること、または情報を推定することなどの演算の間、１つの方式または別の方式に含まれてもよい。

例えば、「Ａ／Ｂ」、「Ａおよび／またはＢ」、ならびに「ＡおよびＢのうちの少なくとも１つ」のケースにおける「／」、「および／または」、ならびに「～のうちの少なくとも１つ」のいずれかの使用は、第１のリスト化されたオプション（Ａ）のみの選択、第２のリスト化されたオプション（Ｂ）のみの選択、または両方のオプション（ＡおよびＢ）の選択を包含することが意図される。更なる実施例として、「Ａ、Ｂ、および／またはＣ」ならびに「Ａ、Ｂ、およびＣのうちの少なくとも１つ」のケースでは、そのようなフレーズは、第１のリスト化されたオプション（Ａ）のみの選択、第２のリスト化されたオプション（Ｂ）のみの選択、第３のリスト化されたオプション（Ｃ）のみの選択、第１のリスト化されたオプションおよび第２のリスト化されたオプション（ＡおよびＢ）のみの選択、第１のリスト化されたオプションおよび第３のリスト化されたオプション（ＡおよびＣ）のみの選択、第２のリスト化されたオプションおよび第３のリスト化されたオプション（ＢおよびＣ）のみの選択、または全ての３つのオプション（Ａ、Ｂ，およびＣ）の選択を包含することが意図される。これは、当業者に対して自明であるように、多くの項目がリスト化されるように拡張されてもよい。

また、本明細書で使用されるように、用語「シグナリング」は、とりわけ、対応するデコーダに何かを示すことを指す。例えば、特定の実施形態では、エンコーダは、複数のコーディングモードまたはフラグの特定の１つをシグナリングする。このようにして、実施形態では、エンコーダ側およびデコーダ側の両方において同一のパラメータが使用される。よって、例えば、エンコーダは、デコーダに特定のパラメータを送信することができ（明示的なシグナリング）、その結果、デコーダは、同一の特定のパラメータを使用することができる。逆に、デコーダが特定のパラメータと共に他のパラメータを既に有している場合、デコーダが特定のパラメータを認識および選択することを単純に可能にするよう送信することなく（非明示的なシグナリング）シグナリングが使用されてもよい。いずれかの実際の関数の送信を回避することによって、様々な実施形態では、ビット節約が実現される。様々な方式においてシグナリングを達成することができることが認識されよう。例えば、様々な実施形態では、対応するデコーダに情報をシグナリングするために、１つまたは複数のシンタックス要素およびフラグなどが使用される。先述したことは、用語「シグナリング」の動詞の形式に関連すると共に、用語「シグナリング」は、本明細書では名詞としても使用されてもよい。

当業者にとって明白であるように、実装態様は、例えば、記憶または送信することができる情報を搬送するようフォーマットされた様々な信号を生成することができる。情報は、例えば、方法を実行するための命令、または説明された実装態様の１つによって生成されたデータを含んでもよい。例えば、信号は、説明された実装態様のビットストリームを搬送するようフォーマットされてもよい。そのような信号は、例えば、電磁気波として（（例えば、スペクトルの無線周波数部分を使用して）、またはベースバンド信号としてフォーマットされてもよい。フォーマットは、例えば、データストリームを符号化すること、および符号化されたデータストリームにより搬送波を変調することを含んでもよい。信号が搬送する情報は、例えば、アナログ情報またはデジタル情報であってもよい。信号は、既知のように、様々な異なる有線リンクまたは無線リンクを通じて送信されてもよい。信号は、プロセッサ可読媒体に記憶されてもよい。

いくつかの実施形態を説明した。それらの実施形態の特徴は、単独またはいずれかの組み合わせにおいて提供されてもよい。更に、実施形態は、様々な特許請求されるカテゴリおよびタイプにわたって、単独またはいずれかの組み合わせにおいて、以下の特徴、デバイス、または態様のうちの１つまたは複数を含んでもよい。
－デコーダおよび／またはエンコーダにおいて適用されるコーディングモード処理を修正すること。
－デコーダおよび／またはエンコーダにおいていくつかの拡張されたコーディングモード予測方法を有効にすること。
－デコーダが使用するコーディングモード予測方法を識別することを可能にするシンタックス要素をシグナリングに挿入すること。
－それらのシンタックス要素に基づいて、デコーダにおいて適用するコーディングモード予測方法を選択すること。
－デコーダにおいて導出するためのコーディングモード予測方法を適用すること。
－上記予測処理により、およびルックアップテーブルの除去によりパラメータを導出すること。
－上記予測処理により、およびルックアップテーブルの修正によりパラメータを導出すること。
－線形予測を使用して予測パラメータを導出すること。
－議論された実施形態のいずれかに従ってエンコーダにおいて残差を適応させること。
－説明されたシンタックス要素またはその変形例のうちの１つまたは複数を含むビットストリームまたは信号。
－説明された実施形態のいずれかに従って生成された情報を搬送するシンタックスを含むビットストリームまたは信号。
－説明された実施形態のいずれかに従って生成すること、送信すること、受信すること、および／または復号すること。
－説明された実施形態のいずれかに従った方法、処理、装置、命令を記憶した媒体、データを記憶した媒体、または信号。
－エンコーダによって使用されるものに対応する方式においてデコーダがコーディングモードを判定することを可能にするシンタックス要素をシグナリングに挿入すること。
－説明されたシンタックス要素またはその変形例のうちの１つまたは複数を含むビットストリームまたは信号を生成すること、送信すること、受信すること、および／または復号すること。
－説明された実施形態のいずれかに従ってコーディングモード判定を実行するＴＶ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
－説明された実施形態のいずれかに従ってコーディングモード判定を実行し、結果として生じた画像を表示する（例えば、モニタ、スクリーン、または他のタイプのディスプレイを使用して）ＴＶ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
－符号化された画像を含む信号を受信するようチャネルを選択し、帯域制限し、または同調し（例えば、チューナを使用して）、説明された実施形態のいずれかに従ってコーディングモード判定を実行するＴＶ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
－符号化された画像を含む信号を無線で受信し（例えば、アンテナを使用して）、コーディングモード判定を実行するＴＶ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。

Claims

カレントブロック内の少なくとも１つの隣接サンプルから、ならびに前記カレントブロック内の隣接サンプルおよび参照フレーム内の参照サンプルから計算されたパラメトリックモデルから、前記カレントブロック内のサンプルの予測を判定するステップであって、前記隣接サンプルが相互に最大の距離に位置し、前記カレントブロックの上の隣接サンプルの最上行に、隣接サンプルの左カラムに、ならびに最上参照行および左参照カラムの交差にそれぞれ位置するように、前記パラメトリックモデルのパラメータが空間的制約を有する隣接サンプルから導出される、ステップと、
前記予測に基づいて、前記カレントブロック内の前記サンプルを符号化するステップと
を備えたことを特徴とする方法。
カレントブロック内の少なくとも１つ隣接サンプルから、ならびに前記カレントブロック内の隣接サンプルおよび参照フレーム内の参照サンプルから計算されたパラメトリックモデルから、前記カレントブロック内のサンプルの予測を判定し、前記隣接サンプルが相互に最大の距離に位置し、前記カレントブロックの上の隣接サンプルの最上行に、隣接サンプルの左カラムに、ならびに最上参照行および左参照カラムの交差にそれぞれ位置するように、前記パラメトリックモデルのパラメータが空間的制約を有する隣接サンプルから導出され、
前記予測に基づいて、前記カレントブロック内の前記サンプルを符号化する、
ように構成されたプロセッサを備えたことを特徴とする装置。
カレントブロック内の少なくとも１つ隣接サンプルから、ならびに前記カレントブロック内の隣接サンプルおよび参照フレーム内の参照サンプルから計算されたパラメトリックモデルから、前記カレントブロック内のサンプルの予測を判定するステップであって、前記隣接サンプルが相互に最大の距離に位置し、前記カレントブロックの上の隣接サンプルの最上行に、隣接サンプルの左カラムに、ならびに最上参照行および左参照カラムの交差にそれぞれ位置するように、前記パラメトリックモデルのパラメータが空間的制約を有する隣接サンプルから導出される、ステップと、
前記予測に基づいて、前記カレントブロック内の前記サンプルを復号するステップと、
を備えたことを特徴とする方法。
カレントブロック内の少なくとも１つ隣接サンプルから、ならびに前記カレントブロック内の隣接サンプルおよび参照フレーム内の参照サンプルから計算されたパラメトリックモデルから、前記カレントブロック内のサンプルの予測を判定し、前記隣接サンプルが相互に最大の距離に位置し、前記カレントブロックの上の隣接サンプルの最上行に、隣接サンプルの左カラムに、ならびに最上参照行および左参照カラムの交差にそれぞれ位置するように、前記パラメトリックモデルのパラメータが空間的制約を有する隣接サンプルから導出され、
前記予測に基づいて、前記カレントブロック内の前記サンプルを復号する、
ように構成されたプロセッサを備えたことを特徴とする装置。
前記パラメトリックモデルは、線形モデルから導出される、ことを特徴とする請求項１または３に記載の方法。
前記パラメトリックモデルの前記パラメータは、ルックアップテーブルにより導出される、ことを特徴とする請求項１または３に記載の方法。
前記パラメトリックモデルの前記パラメータは、空間的距離制約を有する隣接サンプルのうちの少なくとも２つのサンプルから導出される、ことを特徴とする請求項１または３に記載の方法。
前記パラメトリックモデルの前記パラメータは、少なくとも３つの隣接サンプルから導出され、前記３つの隣接サンプルは、前記カレントブロックの上の隣接サンプルの最も右の最上行に、隣接サンプルの左カラムの下に、ならびに最上参照行および左参照カラムの交差にそれぞれ位置する、ことを特徴とする請求項１または３に記載の方法。
線形パラメータ導出が良好に定義される場合、線形モデルに基づく予測が使用され、そうでなければ、代替的なモードが使用される、ことを特徴とする請求項１または３に記載の方法。
前記パラメトリックモデルのパラメータの導出は、補正パラメータを含む、ことを特徴とする請求項１または請求項３に記載の方法。
インターコーディングされたブロックのクロマ成分を予測するためのクロスコンポーネント線形モデルが有効にされる、ことを特徴とする請求項１または請求項３に記載の方法。
前記パラメトリックモデルは、線形モデルから導出される、ことを特徴とする請求項２または４に記載の装置。
前記パラメトリックモデルの前記パラメータは、ルックアップテーブルにより導出される、ことを特徴とする請求項２または４に記載の装置。
前記パラメトリックモデルの前記パラメータは、空間的距離制約を有する隣接サンプルのうちの少なくとも２つのサンプルから導出される、ことを特徴とする請求項２または４に記載の装置。
前記パラメトリックモデルの前記パラメータは、少なくとも３つの隣接サンプルから導出され、前記３つの隣接サンプルは、前記カレントブロックの上の隣接サンプルの最も右の最上行に、隣接サンプルの左カラムの下に、ならびに最上参照行および左参照カラムの交差にそれぞれ位置する、ことを特徴とする請求項２または４に記載の装置。
線形パラメータ導出が良好に定義される場合、線形モデルに基づく予測が使用され、そうでなければ、代替的なモードが使用される、ことを特徴とする請求項２または４に記載の装置。
前記パラメトリックモデルのパラメータの導出は、補正パラメータを含む、ことを特徴とする請求項２または４に記載の装置。
インターコーディングされたブロックのクロマ成分を予測するためのクロスコンポーネント線形モデルが有効にされる、ことを特徴とする請求項２または４に記載の装置。
請求項４および１２乃至１８のいずれか一項に従った装置と、
（ｉ）ビデオブロックを含む信号を受信するように構成されたアンテナ、（ｉｉ）前記受信された信号を、前記ビデオブロックを含む周波数の帯域に制限するように構成された帯域リミッタ、および（ｉｉｉ）前記ビデオブロックを表す出力を表示するように構成されたディスプレイと、のうちに少なくとも１つと、
を備えたことを特徴とするデバイス。
コンピュータによって実行されると、前記コンピュータに、請求項１、３、および５乃至１１のいずれか一項に記載の方法を実行させる命令を含む、ことを特徴とする非一時的コンピュータ可読媒体。
コンピュータによって実行されると、前記コンピュータに、請求項１、３、および５乃至１１のいずれか一項に記載の方法を実行させる命令を含む、ことを特徴とするコンピュータプログラム。