JP2017515339A

JP2017515339A - 無損失ビデオコーディングのシグナリングのための方法および装置

Info

Publication number: JP2017515339A
Application number: JP2016557937A
Authority: JP
Inventors: イエイエン; シウシアオユー; ホーユーウェン
Original assignee: ヴィドスケールインコーポレイテッド
Priority date: 2014-03-16
Filing date: 2015-03-09
Publication date: 2017-06-08
Anticipated expiration: 2035-03-09
Also published as: US20170180737A1; JP7000409B2; WO2015142556A2; CN106105227A; JP6640731B2; CN106105227B; US10404988B2; KR20220133337A; CN111064965B; EP3120561A2; CN111064965A; JP2020065284A; WO2015142556A3; AU2015231883A1; EP4250727A2; KR102355224B1; JP2022023857A; KR20160135262A; KR20220012429A; EP3120561B1

Abstract

無損失コーディングが用いられることを示す高水準シグナリング無損失コーディングシンタックス要素を含むビデオデータビットストリームを生成および復号するためのシステムおよび方法が記載される。高水準シグナリングシンタックスは、ビデオパラメータセット（ＶＰＳ）、シーケンスパラメータセット（ＳＰＳ）、ピクチャパラメータセット（ＰＰＳ）またはスライスセグメントヘッダのうちの１つである。無損失コーディングシンタックス要素は、量子化、変形、変形スキップ、変形スキップ回転、およびループ内フィルタリングプロセスに関係付けられた１または複数のＳＰＳ、ＰＰＳをおよびスライスセグメントヘッダシンタックス要素を生成するための条件として用いられ得る。

Description

本発明は、無損失ビデオコーディングのシグナリングのための方法および装置に関する。

関連出願の相互参照
本出願は、２０１４年３月１６日に出願された米国特許仮出願第６１／９５３，９２２号明細書および２０１５年１月１５日に出願された米国特許仮出願第６２／１０３，９１６号明細書の非仮出願であり、米国特許法第１１９条（ｅ）下でのこれらの米国特許仮出願からの利益を主張する。これらの特許出願の内容は、参照によりそれらの全体が本明細書に援用される。

過去２０年にわたって、効率的なデジタルビデオ通信、配信および消費を可能にする様々なデジタルビデオ圧縮技術が開発され、標準化されてきた。Ｈ．２６１、ＭＰＥＧ−１、ＭＰＥＧ−２Ｈ．２６３、ＭＰＥＧ−４（ｐａｒｔ−２）およびＨ．２６４／ＡＶＣ（ＭＰＥＧ−４ｐａｒｔ１０ＡｄｖａｎｃｅＶｉｄｅｏＣｏｄｉｎｇ）等、商業的に広く展開されている規格のほとんどは、ＩＳＯ／ＩＥＣおよびＩＴＵ−Ｔによって開発されている。新たな高度なビデオ圧縮技術の登場および成熟に起因して、ＩＴＵ−Ｔビデオコーディングエキスパートグループ（ＶＣＥＧ）およびＩＳＯ／ＩＥＣＭＰＥＧによる共同開発の下で、新たなビデオコーディング規格、高効率ビデオコーディング（ＨＥＶＣ）である、ＨＥＶＣ（ＩＴＵ−ＴＨ．２６５／ＩＳＯ／ＩＥＣ２３００８−２）は２０１３年前半に国際規格として承認され、現行の最新技術であるＨ．２６４／ＡＶＣよりも実質的に高いコーディング効率を達成することができる。

従来のデジタルビデオサービス（衛星、ケーブルおよび陸上伝送チャネルを介したＴＶ信号の送信等）と比較して、ＩＰＴＶ、ビデオチャット、モバイルビデオおよびストリーミングビデオ等のますます多くの新たなビデオアプリケーションが異種環境において展開されている。そのような異種性は、ネットワークのみでなくクライアントにも存在する。クライアント側において、Ｎスクリーンのシナリオ、すなわち、スマートフォン、タブレット、ＰＣおよびＴＶを含む様々なスクリーンサイズおよびディスプレイ機能を有するデバイス上でビデオコンテンツを消費することが、既に市場を支配しており、また支配し続けることが予期されている。ネットワーク側において、ビデオは、インターネット、ＷｉＦｉネットワーク、モバイル（３Ｇおよび４Ｇ）ネットワーク、および／またはそれらの任意の組み合わせにわたって伝送されている。

Ｒ．Ｊｏｓｈｉ，Ｊ．Ｘｕ，ＨＥＶＣＳｃｒｅｅｎＣｏｎｔｅｎｔＣｏｄｉｎｇＤｒａｆｔＴｅｘｔ２．ＤｏｃｕｍｅｎｔＮｏ．ＪＣＴＶＣ−Ｓ１００５，Ｏｃｔ．２０１４（Ｊｏｓｈｉ２０１４）Ｄ．Ｆｌｙｎｎ，Ｍ．Ｎａｃｃａｒｉ，Ｃ．Ｒｏｓｅｗａｒｎｅ，Ｊ．Ｓｏｌｅ，Ｇ．Ｓｕｌｌｉｖａｎ，Ｔ．Ｓｕｚｕｋｉ， "ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ）ＲａｎｇｅＥｘｔｅｎｓｉｏｎｓｔｅｘｔｓｐｅｃｉｆｉｃａｔｉｏｎ：Ｄｒａｆｔ６，" ＤｏｃｕｍｅｎｔＮｏ．ＪＣＴＶＣ−Ｐ１００５，Ｊａｎ２０１４Ｂ．Ｂｒｏｓｓ，Ｗ．−Ｊ．Ｈａｎ，Ｇ．Ｊ．Ｓｕｌｌｉｖａｎ，Ｊ．−Ｒ．Ｏｈｍ，Ｙ．Ｋ．Ｗａｎｇ，Ｔ．Ｗｉｅｇａｎｄ．ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ）ｔｅｘｔｓｐｅｃｉｆｉｃａｔｉｏｎｄｒａｆｔ１０．ＤｏｃｕｍｅｎｔＮｏ．ＪＣＴＶＣ−Ｌ１００３．Ｊａｎ．２０１３

無損失符号化の高水準シグナリングに関係するシステムおよび方法が本明細書に記載される。いくつかの実施形態では、本方法は、無損失コーディングが用いられることを示す高水準シンタックス要素を含むビデオデータビットストリームを生成することを含む。高水準シグナリングシンタックスは、ピクチャパラメータセット（ＰＰＳ）、シーケンスパラメータセット（ＳＰＳ）、ビデオパラメータセット（ＶＰＳ）またはスライスセグメントヘッダのうちの１つであり得る。無損失コーディングシンタックス要素は、量子化、変形、変形スキップ、変形スキップ回転、およびループ内フィルタリングプロセスに関係付けられた１または複数のＳＰＳシンタックス要素を生成するための条件として用いられ得る。

いくつかの実施形態では、方法は、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇを含むピクチャパラメータセット（ＰＰＳ）を生成することを含む。ＰＰＳを参照するスライス内の全てのコーディングユニットのｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇのデフォルト値を示すｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇは１に設定される。ＰＰＳは、０に等しいｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇも有することができる。

デコーダ側において、無損失コーディングが適用されるとき、逆量子化、逆変換、デブロッキングフィルタ、サンプル適応オフセット（ＳＡＯ）等を含む、複数の処理ブロックがバイパスされ得る。したがって、デコーダが高水準無損失コーディングインジケーションを受信する場合、デコーダは、コーディングユニット（ＣＵ）の大きな群がこれらの処理ブロックを必要としないと判断する。これらの処理ブロックを、復号の前にシャットダウンすることは、電力低減、処理サイクル低減、より良好な負荷プロビジョニング等の観点で有利であり得る。

このため、いくつかの実施形態では、方法は、ビデオデコーダにおいて、高水準無損失コーディングインジケーションを受信し、それに応じて複数の処理ブロックをシャットダウンすることを含む。複数の処理ブロックは、以下のハードウェアブロック、すなわち、逆量子化、逆変換、デブロッキングフィルタおよび／またはＳＡＯのうちの任意のもののうちの１つまたは複数を含むことができる。更に、処理ブロックは、ビデオ復号の前にシャットダウンされ、処理ブロックハードウェアコンポーネントの少なくとも一部分の電力消費の低減を引き起こすことが可能である。

更なる詳細な理解は、例として添付の図面と併せて提示される以下の説明から得られることが可能である。
ブロックベースのビデオエンコーダの例を示すブロック図である。ブロックベースの無損失ビデオエンコーダの例を示すブロック図である。ブロックベースのビデオデコーダの例を示すブロック図である。ブロックベースの無損失ビデオデコーダの例を示すブロック図である。８個の方向予測モードの例の図である。３３個の方向予測モードおよび２つの非方向予測モードの例を示す図である。水平予測の例の図である。平面モードの例の図である。動き予測の例を示す図である。ピクチャ内のブロックレベルの動きの例を示す図である。例示的な通信システムを示す図である。例示的な無線送信／受信ユニット（ＷＴＲＵ）を示す図である。コーディングされたビットストリーム構造の例を示す図である。フラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇを用いて変更されたＰＰＳ拡張シンタックスを復号する方法のフローチャートである。

ここで、様々な図面を参照して、例示的な実施形態の詳細な説明が提供される。この説明は、可能な実施態様の詳細な例を提供するが、提供される詳細は、例示であることが意図され、本出願の範囲をいかなる形においても限定することは意図されていないことに留意されるべきである。

ビデオの符号化および復号
図１は、ブロックベースのビデオエンコーダ、例えば、ハイブリッドビデオ符号化システムの例を示すブロック図である。ビデオエンコーダ１００は、入力ビデオ信号１０２を受信することができる。入力ビデオ信号１０２は、ブロックごとに処理され得る。ビデオブロックは任意のサイズであり得る。例えば、ビデオブロックユニットは、１６×１６ピクセルを含むことができる。１６×１６ピクセルのビデオブロックユニットは、マクロブロック（ＭＢ）と呼ばれる場合がある。高効率ビデオコーディング（ＨＥＶＣ）では、拡張されたブロックサイズ（例えば、これらはコーディングツリーユニット（ＣＴＵ）またはコーディングユニット（ＣＵ）と呼ばれる場合があり、本発明ではこれらの２つの用語は同義である）が、高分解能（例えば、１０８０ｐ以上）のビデオ信号を効率的に圧縮するために用いられ得る。ＨＥＶＣにおいて、ＣＵは最大６４×６４ピクセルとすることができる。ＣＵは、予測ユニット（ＰＵ）に区分することができ、これらのユニットに対し、別個の予測方法を適用することができる。

入力ビデオブロック（例えば、ＭＢまたはＣＵ）について、空間予測１６０および／または時間予測１６２を行うことができる。空間予測（例えば、「イントラ予測」）は、同じビデオピクチャ／スライス内の既にコーディングされた近隣ブロックからのピクセルブロックを用いて現在のビデオブロックを予測することができる。空間予測は、ビデオ信号内に固有の空間冗長性を低減することができる。時間予測（例えば、「インター予測」または「動き補償予測」）は、既にコーディングされたビデオピクチャ（例えば、「参照ピクチャ」と呼ばれる場合がある）からのピクセルを用いて、現在のビデオブロックを予測することができる。時間予測は、ビデオ信号内に固有の時間冗長性を低減することができる。ビデオブロックのための時間予測信号は、１または複数の動きベクトルによってシグナリングされることが可能であり、これは、現在のブロックと、参照ピクチャにおけるその予測ブロックとの間の動きの量および／または方向を示すことができる。（例えば、Ｈ．２６４／ＡＶＣおよび／またはＨＥＶＣの場合のように）複数の参照ピクチャがサポートされる場合、ビデオブロックについて、その参照ピクチャインデックスが送信され得る。参照ピクチャインデックスは、参照ピクチャストア１６４内のいずれの参照ピクチャから時間予測信号が到来するかを特定するのに用いられ得る。

エンコーダにおけるモード決定ブロック１８０は、例えば、空間および／または時間予測の後に予測モードを選択することができる。予測ブロックは、１１６において、現在のビデオブロックから減算され得る。予測残差は、変換１０４および／または量子化１０６され得る。量子化ブロック１０６は、予測残差をコーディングするのに必要なビット数を効果的に低減することができる。量子化パラメータ（ＱＰ）が、量子化の厳密度（severity）を制御するのに用いられ得る。ＱＰ値が増大すると、より厳密な量子化が適用されることが可能であるが、結果として、コーディングされるビデオビットレートが低減される場合があり、同時に、復号化されるビデオ品質が劣化する場合がある。量子化に起因する一般的に知られている視覚的アーチファクトは、ブロッキングアーチファクト、ブラー、不鮮明化、リンギング、フリッカ等を含む。図１および図２に示されるビデオコーディングシステム内の他の処理ブロックも、特に、これらの処理ブロックが、処理パイプラインにおける中間データのビット深度に対し上限を必要とする固定点操作を適用するとき、情報損失を引き起こす場合がある。例えば、変換ブロック１０４において、水平方向の変換が最初に適用されることが可能であり、その後、垂直方向の変換が適用され得る。変換はデータビット深度を増大させるため（乗算に起因する）、水平変換の後、垂直変換のために入力データビット深度を低減させるために、水平変換の出力に右シフトが適用され得る。そのようなシフト操作は、（データビットの深度を低減することによって）実装コストを低減するのに役立つことができるが、処理パイプラインにおける情報損失も引き起こす場合がある。更に、固定点操作を可能にするために、Ｈ．２６４／ＡＶＣおよびＨＥＶＣ等の最新のビデオ標準規格における変換は、積分値変換である。これらの積分値変換のうちのいくつかは、ほぼ直交であるが完全に直交でない場合がある。変換（および逆変換）行列が完全に直交でない場合、これらは完全な再構成を補償することができない。換言すれば、量子化を一切行わない場合であっても、非直交変換および逆変換が入力データブロックに適用された後、出力データブロック（スケーリング係数が出力に適用され得る）は、入力データブロックと数学的に同一のままでない場合がある。

量子化された残差係数は、逆量子化１１０および／または逆変換１１２され、再構成された残差を形成することができる。この再構成された残差は予測ブロック１２６に戻して加算され、再構成されたビデオブロックを形成することができる。

ループ内フィルタリング（例えば、デブロッキングフィルタ、サンプル適応オフセット、適応ループフィルタ等）が再構成されたビデオブロックに適用される（１６６）ことが可能であり、その後、これは参照ピクチャストア１６４に入れられ、かつ／または未来のビデオブロックをコーディングするのに用いられる。ビデオエンコーダ１００は、出力ビデオストリーム１２０を出力することができる。出力ビデオビットストリーム１２０を形成するために、コーディングモード（例えば、インター予測モードまたはイントラ予測モード）、予測モード情報、動き情報および／または量子化された残差係数がエントロピーコーディングユニット１０８に送信され、圧縮および／またはパッキングされ、ビットストリームを形成することができる。参照ピクチャストア１６４は、復号されたピクチャバッファ（ＤＰＢ）と呼ばれる場合がある。

図２は、ブロックベースのビデオデコーダの例を示すブロック図である。ビデオデコーダ２００は、ビデオビットストリーム２０２を受信することができる。ビデオビットストリーム２０２は、エントロピー復号ユニット２０８においてアンパッキングおよび／またはエントロピー復号され得る。ビデオビットストリームを符号化するのに用いられるコーディングモードおよび／または予測情報は、空間予測ユニット２６０（例えば、イントラコーディングされている場合）および／または時間予測ユニット２６２（例えば、インターコーディングされている場合）に送信され、予測ブロックを形成することができる。インターコーディングされている場合、予測情報は、予測ブロックサイズ、１つもしくは複数の動きベクトル（例えば、動きの方向および量を示すことができる）、および／または１もしくは複数の基準インデックス（例えば、これはいずれの参照ピクチャから予測信号が得られるかを示すことができる）を含むことができる。

動き補償予測が時間予測ユニット２６２によって適用され、時間予測ブロックを形成することができる。残差変換係数は、逆量子化ユニット２１０および逆変換ユニット２１２に送信され、残差ブロックを再構成することができる。予測ブロックおよび残差ブロックは、２２６において共に加算され得る。再構成されたブロックは、ループフィルタ２６６によるループ内フィルタリングを受け、その後、参照ピクチャストア２６４内に記憶される。参照ピクチャストア２６４内の再構成されたビデオは、表示デバイスを駆動するために用いられることが可能であり、かつ／または未来のビデオブロックを予測するのに用いられることが可能である。ビデオデコーダ２００は、再構成されたビデオ信号２２０を出力することができる。参照ピクチャストア２６４は、復号されたピクチャバッファ（ＤＰＢ）と呼ばれることもできる。

ビデオエンコーダおよび／またはデコーダ（例えば、ビデオエンコーダ１００またはビデオデコーダ２００）は、空間予測を行うことができる（例えば、これはイントラ予測と呼ばれることが可能である）。空間予測は、複数の予測方向のうちの１つに従って、既にコーディングされた近傍ピクセルから予測することによって実行され得る（例えば、これは方向イントラ予測と呼ばれる場合がある）。

図３は、８つの方向予測モードの例の図である。図３の８つの方向予測モードは、Ｈ．２６４／ＡＶＣにおいてサポートされ得る。９個のモード（ＤＣモード２を含む）は、以下である。
・モード０：垂直予測
・モード１：水平予測
・モード２：ＤＣ予測
・モード３：斜め左下予測
・モード４：斜め右下予測
・モード５：垂直右予測
・モード６：水平下予測
・モード７：垂直左予測
・モード８：水平上予測

空間予測は、様々なサイズおよび／または形状のビデオブロックにおいて実行され得る。例えば、（例えば、Ｈ．２６４／ＡＶＣにおける）４×４、８×８および１６×１６ピクセルのブロックサイズについて、ビデオ信号のルーマ成分の空間予測が実行され得る。例えば、（例えば、Ｈ．２６４／ＡＶＣにおける）８×８のブロックサイズについて、ビデオ信号のクロマ成分の空間予測が実行され得る。４×４または８×８のルーマブロックについて、合計で９個の予測モード、例えば、（例えば、Ｈ．２６４／ＡＶＣにおいて）８個の方向予測モードおよびＤＣモードがサポートされ得る。例えば、サイズ１６×１６のルーマブロックについて、４つの予測モード、すなわち、水平、垂直、ＤＣおよび平面予測がサポートされ得る。

方向イントラ予測モードおよび非方向予測モードがサポートされ得る。図４は、３３個の方向予測モードおよび２つの非方向予測モードの例を示す図である。図４の３３個の方向予測モードおよび２つの非方向予測モードがＨＥＶＣによってサポートされ得る。より大きなブロックサイズを用いる空間予測がサポートされ得る。例えば、空間予測は、任意のサイズ、例えば、４×４、８×８、１６×１６、３２×３２または６４×６４の平方ブロックサイズのブロック上で実行され得る。（例えば、ＨＥＶＣにおける）方向イントラ予測は、１／３２ピクセルの精度で実行され得る。

例えば、方向イントラ予測に加えて、非方向イントラ予測モードが（例えば、Ｈ．２６４／ＡＶＣ、ＨＥＶＣ等において）サポートされ得る。非方向イントラ予測モードは、ＤＣモードおよび／または平面モードを含むことができる。ＤＣモードの場合、予測値は、利用可能な近傍ピクセルを平均化することによって得られることが可能であり、予測値は、ブロック全体に一様に適用され得る。平面モードの場合、低速な遷移で平滑な領域を予測するために線形補間が用いられ得る。Ｈ．２６４／ＡＶＣは、１６×１６のルーマブロックおよびクロマブロックについて平面モードの使用を可能にすることができる。

エンコーダ（例えば、エンコーダ１００）は、（例えば、図１のブロック１８０において）モード決定を実行し、ビデオブロックのための最良のコーディングモードを決定することができる。エンコーダが（例えばインター予測の代わりに）イントラ予測を適用することを決定するとき、エンコーダは、利用可能なモードの組から最適なイントラ予測モードを決定することができる。選択される方向イントラ予測モードは、入力ビデオブロックにおける任意のテクスチャ、エッジおよび／または構造の方向に関して強力なヒントを与えることができる。図５は、（例えば、４×４のブロックについての）水平予測の例の図である。現在の４×４のビデオブロックにおけるピクセルを予測するために、既に再構成されたピクセルＰ０、Ｐ１、Ｐ２およびＰ３（例えば、影付きのボックス）が、用いられ得る。水平予測において、再構成されたピクセル、例えば、ピクセルＰ０、Ｐ１、Ｐ２および／またはＰ３は、対応する行の方向に沿って水平方向に伝搬され、４×４のブロックを予測することができる。例えば予測は、以下の式（１）に従って実行され得る。ここで、Ｌ（ｘ，ｙ）は、（ｘ，ｙ）、ｘ，ｙ＝０．．．３において予測されるピクセルであり得る。

Ｌ（ｘ，０）＝Ｐ０
Ｌ（ｘ，１）＝Ｐ１
Ｌ（ｘ，２）＝Ｐ２
Ｌ（ｘ，３）＝Ｐ３（１）

図６は、平面モードの例の図である。平面モードは、状況に応じて実行され得る。最上行の最も右側のピクセル（例えば、Ｔによってマーキキングされている）は、最も右側の列内のピクセルを予測するために複製され得る。左列内の最下ピクセル（例えば、Ｌによってマーキングされている）は、最下行内のピクセルを予測するために複製され得る。（例えば、左ブロックに示すように）水平方向における双線形補間は、中心ピクセルの第１の予測Ｈ（ｘ，ｙ）を生成するように実行され得る。（例えば、右ブロックに示すように）垂直方向における双線形補間は、中心ピクセルの第２の予測Ｖ（ｘ，ｙ）を生成するように実行され得る。水平予測および垂直予測間の平均化は、Ｌ（ｘ，ｙ）＝（（Ｈ（ｘ，ｙ）＋Ｖ（ｘ，ｙ））≫ｌ）を用いて最終予測Ｌ（ｘ，ｙ）を得るように実行され得る。

図７および図８は、（例えば、図１の動き予測ユニット１６２を用いた）ビデオブロックの動き予測の例を示す図である。図８は、例えば、参照ピクチャ「Ｒｅｆｐｉｃ０」、「Ｒｅｆｐｉｃ１」および「Ｒｅｆｐｉｃ２」を含む例示的な復号されたピクチャバッファを示す図である。現在のピクチャ内のブロックＢ０、Ｂ１およびＢ２は、それぞれ、参照ピクチャ「Ｒｅｆｐｉｃ０」、「Ｒｅｆｐｉｃ１」および「Ｒｅｆｐｉｃ２」内のブロックから予測され得る。動き予測は、近傍のビデオフレームからのビデオブロックを用いて現在のビデオブロックを予測することができる。動き予測は、時間相関を利用し、かつ／またはビデオ信号に固有の時間冗長性を取り除くことができる。例えば、Ｈ．２６４／ＡＶＣおよびＨＥＶＣにおいて、時間予測は、様々なサイズのビデオブロック（例えば、ルーマ成分の場合、時間予測ブロックサイズは、Ｈ．２６４／ＡＶＣにおいて１６×１６〜４×４、ＨＥＶＣにおいて６４×６４〜４×４に変動し得る）において実行され得る。（ｍｖｘ，ｍｖｙ）の動きベクトルを用いて、時間予測は、式（１）によって与えられるように実行され得る。

Ｐ（ｘ，ｙ）＝ｒｅｆ（ｘ−ｍｖｘ，ｙ−ｍｖｙ）（１）
ここで、ｒｅｆ（ｘ，ｙ）は、参照ピクチャ内のロケーション（ｘ，ｙ）におけるピクセル値であることが可能であり、Ｐ（ｘ，ｙ）は予測されたブロックであることが可能である。ビデオコーディングシステムは、小数ピクセル精度でインター予測をサポートすることができる。動きベクトル（ｍｖｘ，ｍｖｙ）が小数ピクセル値を有する場合、１または複数の補間フィルタが適用されて、小数ピクセル位置におけるピクセル値を得ることができる。ブロックベースのビデオコーディングシステムは、時間予測を改善するために、複数仮説による予測を用いることができ、例えば、ここで、予測信号は、様々な参照ピクチャから複数の予測信号を組み合わせることによって形成され得る。例えば、Ｈ．２６４／ＡＶＣおよび／またはＨＥＶＣは、２つの予測信号を組み合わせることができる二重予測を用いることができる。二重予測は、それぞれ参照ピクチャからの２つの予測信号を組み合わせて、以下の式（２）等の予測を形成することができる。

ここで、Ｐ₀（ｘ，ｙ）およびＰ₁（ｘ，ｙ）は、それぞれ第１の予測ブロックおよび第２の予測ブロックであることが可能である。式（２）に示すように、２つの予測ブロックは、それぞれ２つの動きベクトル（ｍｖｘ_0,ｍｖｙ₀）および（ｍｖｘ_1,、ｍｖｙ₁）を用いて２つの参照ピクチャｒｅｆ₀（ｘ，ｙ）およびｒｅｆ₁（ｘ，ｙ）から動き補償された予測を実行することによって得られることが可能である。予測ブロックＰ（ｘ，ｙ）は、（例えば、加算器１１６において）ソースビデオブロックから減算され、予測残差ブロックを形成することができる。予測残差ブロックは、（例えば、変換ユニット１０４において）変換され、かつ／または（例えば、量子化ユニット１０６において）量子化され得る。量子化された残差変換係数ブロックは、エントロピーコーディングユニット（例えば、エントロピーコーディングユニット１０８）に送信され、ビットレートを低減するようにエントロピーコーディングされ得る。エントロピーコーディングされた残差係数は、パッキングされ、出力ビデオビットストリーム（例えば、ビットストリーム１２０）の一部を形成することができる。

図１１は、コーディングされたビットストリーム構造の例を示す図である。コーディングされたビットストリーム１０００は複数のＮＡＬ（ネットワーク抽出層）ユニット１００１からなる。ＮＡＬユニットは、コーディングされたスライス１００６等のコーディングされたサンプルデータ、またはパラメータセットデータ、スライスヘッダデータ１００５もしくは補助的強化情報データ１００７（これは、ＳＥＩメッセージと呼ばれる場合がある）等の高水準シンタックスメタデータを含むことができる。パラメータセットは、複数のビットストリーム層（例えば、ビデオパラメータセット１００２（ＶＰＳ））に適用することができるか、または１つの層内のコーディングされたビデオシーケンス（例えば、シーケンスパラメータセット１００３（ＳＰＳ））に適用することができるか、または１つのコーディングされたビデオシーケンス内の複数のコーディングされたピクチャ（例えば、ピクチャパラメータセット１００４（ＰＰＳ））に適用することができる重要なシンタックス要素を含む高水準シンタックス構造である。パラメータセットは、ビデオビットストリームのコーディングされたピクチャとともに送信され得るか、または他の手段（信頼性のあるチャネル、ハードコーディング等を用いた帯域外伝送を含む）を通じて送信され得る。スライスヘッダ１００５も、比較的小さいか、またはある特定のスライスまたはピクチャタイプのみに関係するいくつかのピクチャ関連情報を含むことができる高水準シンタックス構造である。ＳＥＩメッセージ１００７は、復号プロセスによって必要とされない場合があるが、ピクチャ出力タイミングもしくは表示および／または損失検出および秘匿等の様々な他の目的で用いられ得る情報を搬送する。

図９は、通信システムの例を示す図である。通信システム１３００は、エンコーダ１３２０と、通信ネットワーク１３０４と、デコーダ１３０６とを備えることができる。エンコーダ１３０２は、接続１３０８を介して通信ネットワーク１３０４と通信することができる。接続１３０８は、有線接続または無線接続であり得る。エンコーダ１３０２は、図１のブロックベースのビデオエンコーダに類似し得る。エンコーダ１３０２は、単層コーデック（例えば、図１）または多層コーデックを含むことができる。

デコーダ１３０６は、接続１３１０を介して通信ネットワーク１３０６と通信することができる。接続１３１０は、有線接続または無線接続であり得る。デコーダ１３０６は、図２のブロックベースのビデオデコーダに類似し得る。デコーダ１３０６は、単層コーデック（例えば、図２）または多層コーデックを含むことができる。例えば、デコーダ１３０６は、ピクチャレベルのＩＬＰサポートを有する多層（例えば２層）スケーラブルデコーディングシステムであり得る。

エンコーダ１３０２および／またはデコーダ１３０６は、デジタルテレビ、無線ブロードキャストシステム、ネットワーク要素／端末、コンテンツサーバまたはウェブサーバ等のサーバ（例えば、ハイパーテキスト転送プロトコル（ＨＴＴＰ）サーバ）、携帯情報端末（ＰＤＡ）、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、デジタルカメラ、デジタル記録デバイス、ビデオゲームデバイス、ビデオゲームコンソール、セルラまたは衛星無線電話、デジタルメディアプレーヤ等であるが、これらに限定されない、多岐にわたる有線通信デバイスおよび／または無線送信／受信ユニット（ＷＴＲＵ）に組み込まれ得る。

通信ネットワーク１３０４は、任意の適したタイプの通信ネットワークであり得る。例えば、通信ネットワーク１３０４は、音声、データ、ビデオ、メッセージ、ブロードキャスト等のコンテンツを複数の無線ユーザに提供する複数のアクセスシステムであり得る。通信ネットワーク１３０４は、複数の無線ユーザが、無線帯域幅を含むシステムリソースの共有を通じてそのようなコンテンツにアクセスすることを可能にすることができる。例えば、通信ネットワーク１３０４は、符号分割多重アクセス（ＣＤＭＡ）、時分割多重アクセス（ＴＤＭＡ）、周波数分割多重アクセス（ＦＤＭＡ）、直交ＦＤＭＡ（ＯＦＤＭＡ）、単一搬送波ＦＤＭＡ（ＳＣ−ＦＤＭＡ）等の１または複数のチャネルアクセス方法を利用することができる。通信ネットワーク１３０４は、複数の接続された通信ネットワークを含むことができる。通信ネットワーク１３０４は、インターネット、および／または、セルラネットワーク、ＷｉＦｉホットスポット、インターネットサービスプロバイダネットワーク（ＩＳＰ）等の１つもしくは複数の商用プライベートネットワークを含むことができる。

図１０は、例示的なＷＴＲＵのシステム図である。ＷＴＲＵ９０２は、プロセッサ９１８、送受信機９２０、送信／受信要素９２２、スピーカ／マイクロフォン９２４、キーパッドまたはキーボード９２６、ディスプレイ／タッチパッド９２８、非取り外し可能メモリ９３０、取り外し可能メモリ９３２、電源９３４、グローバルポジショニングシステム（ＧＰＳ）チップセット９３６および／または他の周辺機器９３８を含むことができる。ＷＴＲＵ９０２は、実施形態との一貫性を保ちながら、上記の要素の任意の部分的組み合わせを含むことができることが理解されよう。更に、エンコーダ（例えば、エンコーダ８０２）および／またはデコーダ（例えば、デコーダ８０６）が組み込まれ得る端末は、図１０のＷＴＲＵ９０２を参照して本明細書において描かれ、説明された要素のうちのいくつかまたは全てを含むことができる。

プロセッサ９１８は、汎用プロセッサ、専用プロセッサ、従来のプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、グラフィック処理ユニット（ＧＰＵ）、複数のマイクロプロセッサ、ＤＳＰコアに関連付けられた１または複数のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）回路、任意の他のタイプの集積回路（ＩＣ）、状態マシン等であり得る。プロセッサ９１８は、信号コーディング、データ処理、電力制御、入出力処理、および／またはＷＴＲＵ９０２が有線および／または無線環境で動作することを可能にする任意の他の機能を実行することができる。プロセッサ９１８は、送受信機９２０に結合されることが可能であり、送受信機９２０は、送信／受信要素９２２に結合されることが可能である。図１０は、プロセッサ９１８および送受信機９２０を別個の要素として描いているが、プロセッサ９１８および送受信機９２０は、電子パッケージおよび／またはチップにおいて共に集積され得ることが理解されよう。

送信／受信要素９２２は、エアインタフェース９１５を介して別の端末に信号を送信しかつ／または別の端末から信号を受信するように構成され得る。例えば、１または複数の実施形態において、送信／受信要素９２２は、ＲＦ信号を送信および／または受信するように構成されたアンテナであり得る。１または複数の実施形態において、送信／受信要素９２２は、例えば、ＩＲ、ＵＶまたは可視光信号を送信および／または受信するように構成されたエミッタ／検出器であり得る。１または複数の実施形態では、送信／受信要素９２２は、ＲＦ信号および光信号の双方を送信および／または受信するように構成され得る。送信／受信要素９２２は、無線信号の任意の組み合わせを送信および／または受信するように構成され得る。

更に、送信／受信要素９２２が図１０において単一の要素として示されているが、ＷＴＲＵ９０２は、任意の数の送信／受信要素９２２を含むことができる。より詳細には、ＷＴＲＵ９０２は、ＭＩＭＯ技術を採用することができる。このため、いくつかの実施形態では、ＷＴＲＵ９０２は、エアインタフェース９１５を介して無線信号を送信および受信するための２つ以上の送信／受信要素９２２（例えば、複数のアンテナ）を含むことができる。

送受信機９２０は、送信／受信要素９２２によって送信されることになる信号を変調し、かつ／または送信／受信要素９２２によって受信される信号を復調するように構成され得る。上記に示すように、ＷＴＲＵ９０２は、マルチモード機能を有することができる。このため、送受信機９２０は、例えば、ＵＴＲＡおよびＩＥＥＥ８０２．１１等の、ＷＴＲＵ９０２が複数のＲＡＴを介して通信することを可能にするための複数の送受信機を含むことができる。

ＷＴＲＵ９０２のプロセッサは、スピーカ／マイクロフォン９２４、キーパッド９２６および／またはディスプレイ／タッチパッド９２８（例えば、液晶ディスプレイ（ＬＣＤ）表示ユニットまたは有機発光ダイオード（ＯＬＥＤ）表示ユニット）に結合されることが可能であり、これらからユーザ入力データを受信することができる。プロセッサ９１８は、スピーカ／マイクロフォン９２４、キーボード９２６および／またはディスプレイ／タッチパッド９２８にユーザデータを出力することもできる。更に、プロセッサ９１８は、非取り外し可能メモリ９３０および／または取り外し可能メモリ９３２等の任意のタイプの適切なメモリからの情報にアクセスし、このメモリにデータを記憶することができる。非取り外し可能メモリ９３０は、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、ハードディスクまたは任意の他のタイプのメモリストレージデバイスを含むことができる。取り外し可能メモリ９３２は、加入者アイデンティティモジュール（ＳＩＭ）カード、メモリスティック、セキュアデジタル（ＳＤ）メモリカード等を含むことができる。１または複数の実施形態では、プロセッサ９１８は、サーバまたはホームコンピュータ（図示せず）等のＷＴＲＵ９０２上に物理的に位置していないメモリからの情報にアクセスし、このメモリにデータを記憶することができる。

プロセッサ９１８は、電源９３４から電力を受信することができ、ＷＴＲＵ９０２内の他のコンポーネントに対し電力を分配および／または制御するように構成され得る。電源９３４は、ＷＴＲＵ９０２に電力供給するための任意の適切なデバイスであり得る。例えば、電源９３４は、１または複数の乾電池（例えば、ニッケルカドミウム（ＮｉＣｄ）、ニッケル亜鉛（ＮｉＺｎ）、ニッケル水素（ＮｉＭＨ）、リチウムイオン（Ｌｉイオン）等）、太陽電池、燃料電池等を含むことができる。

プロセッサ９１８は、ＧＰＳチップセット９３６に結合され得る。これは、ＷＴＲＵ９０２の現在のロケーションに関するロケーション情報（例えば、緯度および経度）を提供するように構成され得る。ＧＰＳチップセット９３６からの情報に加えて、またはこの情報に代えて、ＷＴＲＵ９０２は端末（例えば、基地局）からのエアインタフェース９１５を介してロケーション情報を受信し、かつ／または２つ以上の近隣の基地局から信号が受信されるタイミングに基づいてそのロケーションを求めることができる。ＷＴＲＵ９０２は、実施形態との一貫性を保ちながら、任意の適切なロケーション決定方法によってロケーション情報を取得することができることが理解されよう。

プロセッサ９１８は、更なる特徴、機能および／または有線もしくは無線接続性を提供する１または複数のソフトウェアおよび／またはハードウェアモジュールを含むことができる他の周辺機器９３８に更に結合され得る。例えば、周辺機器９３８は、加速度計、方位センサ、動きセンサ、近接性センサ、電子コンパス、衛星送受信機、デジタルカメラおよび／またはビデオレコーダ（例えば、写真および／またはビデオ用）、ユニバーサルシリアルバス（ＵＳＢ）ポート、振動デバイス、テレビ送受信機、ハンズフリーヘッドセット、Ｂｌｕｅｔｏｏｔｈ（登録商標）モジュール、周波数変調（ＦＭ）無線ユニット、およびデジタル音楽プレーヤ、メディアプレーヤ、ビデオゲームプレーヤモジュール、インターネットブラウザ等のソフトウェアモジュールを含むことができる。

例として、ＷＴＲＵ９０２は、無線信号を送信および／または受信するように構成されることが可能であり、ユーザ機器（ＵＥ）、移動局、固定または移動加入者ユニット、ページャ、セルラ電話、携帯情報端末（ＰＤＡ）、スマートフォン、ラップトップ、ネットブック、タブレットコンピュータ、パーソナルコンピュータ、無線センサ、消費者家電、または圧縮されたビデオ通信を受信および処理することが可能な任意の他の端末を含むことができる。

ＷＴＲＵ９０２および／または通信ネットワーク（例えば、通信ネットワーク８０４）は、広帯域ＣＤＭＡ（ＷＣＤＭＡ）を用いてエアインタフェース９１５を確立することができるユニバーサル移動体通信システム（ＵＭＴＳ）陸上無線アクセス（ＵＴＲＡ）等の無線技術を実施することができる。ＷＣＤＭＡは、高速パケットアクセス（ＨＳＰＡ）および／または発展型ＨＳＰＡ（ＨＳＰＡ＋）等の通信プロトコルを含むことができる。ＨＳＰＡは、高速ダウンリンクパケットアクセス（ＨＳＤＰＡ）および／または高速アップリンクパケットアクセス（ＨＳＵＰＡ）を含むことができる。ＷＴＲＵ９０２および／または通信ネットワーク（例えば、通信ネットワーク８０４）は、発展型ＵＭＴＳ陸上無線アクセス（Ｅ−ＵＴＲＡ）等の無線技術を実装することができる。この無線技術は、ロングタームエボリューション（ＬＴＥ）および／またはＬＴＥアドバンスト（ＬＴＥ−Ａ）を用いてエアインタフェース９１５を確立することができる。

ＷＴＲＵ９０２および／または通信ネットワーク（例えば、通信ネットワーク８０４）は、ＩＥＥＥ８０２．１６（例えば、マイクロ波アクセスのための世界規模の相互運用性（ＷｉＭＡＸ））、ＣＤＭＡ２０００、ＣＤＭＡ２０００１Ｘ、ＣＤＭＡ２０００ＥＶ−ＤＯ、暫定基準２０００（ＩＳ−２０００）、暫定基準９５（ＩＳ−９５）、暫定基準８５６（ＩＳ−８５６）、移動通信のためのグローバルシステム（ＧＳＭ）、ＧＳＭエボリューションのための強化されたデータレート（ＥＤＧＥ）、ＧＳＭＥＤＧＥ（ＧＥＲＡＮ）等の無線技術を実施することができる。ＷＴＲＵ９０２および／または通信ネットワーク（例えば、通信ネットワーク８０４）は、ＩＥＥＥ８０２．１１、ＩＥＥＥ８０２．１５等の無線技術を実施してもよい。

無損失コーディング
医療ビデオアプリケーションおよびハイエンドプロフェッショナルビデオアプリケーション等のいくつかのビデオアプリケーションについて、損失を伴うことなく元のビデオ信号内に全ての情報を保持することが望ましい場合がある。そのようなビデオアプリケーションについて、無損失コーディングを用いることができる。無損失コーディングにおいて、変換および量子化等の情報損失を引き起こす場合があるビデオコーデックにおける処理ブロックが変更および／またはバイパスされ得る。それぞれ図１Ｂおよび図２Ｂのエンコーダおよびデコーダ構成は、無損失コーディングを達成するために用いられ得る。無損失コーディングにおいて、変換、量子化、逆変換および逆量子化のための処理ブロックは適用されない。更に、図１Ｂの加算器１２６および図２Ｂの加算器２２６の結果として再構成されたビデオブロックは、元のビデオブロックと数学的に同じであるため、ループ内フィルタリングは必要でない場合があり、実際に、望ましくない歪みを引き起こす場合がある。したがって、いくつかの実施形態では、ループ内フィルタリングのための処理ブロックも適用されない。

無線ディスプレイおよびクラウドコンピューティング等の急速に成長するビデオアプリケーションに起因して、スクリーンコンテンツコーディング（ＳＣＣ）が近年、学界および産業界からの多くの関心を得ている。ＨＥＶＣは、以前のビデオコーディング規格と比較してコーディング効率において大きな改善を達成しているが、これは、主にカメラによって捕捉される自然のビデオのために設計されたものである。一方、通常、テキストおよびグラフィック等のコンピュータにより生成されたコンテンツからなるスクリーンコンテンツビデオは、自然のコンテンツの特性と極めて異なる特性を示す。これを考慮すると、スクリーンコンテンツコーディングのためにＨＥＶＣを拡張することが望ましい。ブロック内コピー（ＩＢＣ）は、非特許文献１に記載されているように、ＨＥＶＣスクリーンコンテンツコーディング拡張に採用されている１つのコーディング方法である。ＩＢＣは、同じピクチャの既に再構成された領域のピクセルから現在のＰＵのピクセルを予測することによって、（特に、ピクチャが、テキストおよびグラフィックが豊富なかなりの量のスクリーンコンテンツを含む場合に）１つのピクチャにおいて固有のピクチャ内冗長性を利用するように設計された。インターモードと同様に、ＩＢＣモードを用いてコーディングされたＣＵの場合、１つの予測されたＰＵとその基準ブロックとの間の変位は、ブロックベクトル（ＢＶ）によって表される。ＢＶは、ビットストリーム内の対応する残差とともにコーディングされる。

ＨＥＶＣおよびその拡張において、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇと呼ばれるシンタックス要素は、ピクチャパラメータセット（ＰＰＳ）においてシグナリングされ、変換および量子化が、ブロックごとの単位でバイパスされることが可能であるか否かを示す。非特許文献２に記載されているように、ＨＥＶＣにおけるＰＰＳシンタックステーブルが以下の表１に示され、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇが行２２に示されている。

現在のスライスが、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇ（表１の行２２）が１に設定されている（これは、スライスヘッダ（表２における行５）内のｓｌｉｃｅ＿ｐｉｃ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄを、適切なＰＰＳを特定するための適切な値に設定することによって行われる）ＰＰＳを参照する場合、コーディングユニットまたはＣＵレベルにおいて、現在のスライスにおける全てのＣＵについてｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇと呼ばれる追加のフラグがシグナリングされる。ｃｏｄｉｎｇ＿ｕｎｉｔシンタックステーブルが表３に示されている。

ｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇの値（表３の行３）は、（ｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇが１に等しい場合）変換および量子化が現在のＣＵについてバイパスされているか、または（ｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇが０に等しい場合）変換および量子化が現在のＣＵについて適用されるかを示す。ＰＰＳにおけるｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０に設定されているとき、追加のＣＵレベルフラグであるｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇはシグナリングされず、０である（すなわち、変換および量子化が現在のＣＵについて適用される）ことが推測される。

フラグｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇが現在のＣＵについて１に設定されているとき、変換および量子化は予測残差に適用されない。代わりに、予測残差は、その予測モード情報、動き情報等とともに直接エントロピーコーディングされ、ビデオビットストリームにパッキングされる。更に、デブロッキングおよびサンプル適応オフセット（ＳＡＯ）は、現在のＣＵのためにバイパスされる。このようにして、ブロックレベル無損失コーディングが達成され、すなわち、再構成されたＣＵは元のＣＵと数学的に同じである。

無損失コーディングを必要とするビデオアプリケーションの場合、シーケンスレベルにおいて無損失コーディングを適用する（すなわち、シーケンス全体が損失を伴うことなくコーディングされる）か、またはピクチャ／スライスレベルにおいて無損失コーディングを適用する（すなわち、ピクチャ／スライス全体が損失を伴うことなくコーディングされる）ことが望ましい場合がある。第１のバージョンのＨＥＶＣ規格およびＨＥＶＣ範囲拡張は、現在、ＪＣＴ−ＶＣにおける開発下にあり、シーケンス／ピクチャ／スライスレベルの無損失コーディングを示すための高水準シグナリングを含まず、他の方法でも提供しない。代わりに、既存のシグナリング方式を用いてシーケンス／ピクチャ／スライスレベルの無損失コーディングを達成するために、以下の動作、すなわち、（ｉ）ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に設定されるＰＰＳの作成、（ｉｉ）ビデオシーケンス／ピクチャ／スライスのスライスセグメントヘッダにおいて、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しいＰＰＳを参照すること、（ｉｉｉ）シーケンス／ピクチャ／スライス内の全てのＣＵについて、フラグｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇの値を１に設定すること、が実行され得る。

無損失モードのブロックレベルのシグナリングのみに依拠することは、いくつかの欠点を有する。特に、これは、シーケンス／ピクチャ／スライスにおける全てのＣＵについてｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇを送信することを必要とし、これは効率的でない場合がある。このＣＵレベルのフラグｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇをコーディングするのにコンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）が用いられ、これはシグナリングオーバヘッドを効果的に低減することができるが、これは依然として、デコーダがシーケンス／ピクチャ／スライス内の全てのＣＵについて追加のシンタックス要素をパースすることを依然として必要とし、これは冗長な動作となる場合がある。

更に、無損失モードのためのブロックレベルシグナリングのみが利用可能である場合、デコーダは、完全に無損失のコーディングのために適切に準備することができない場合がある。なぜなら、逆量子化、逆変換、デブロッキングフィルタ、ＳＡＯ等の処理ブロックが、いくつかの未来のＣＵのために依然として必要とされる場合がある（すなわち、いくつかの未来のＣＵのｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇの値が０に設定される場合がある）ことが起こり得るままであるためである。これにより、そうでなければ、不要な処理ブロックをシャットダウンすることにより得られたはずの利用可能な電力節減が制限される。

同様に、現在のビデオビットストリームは、無損失符号化に必要とされない様々なレベルの複数のシンタックス要素を含む。これらの要素は、高水準シンタックス構造における逆量子化、逆変換、デブロッキングおよびＳＡＯに関係する。例えば、ＰＰＳにおいて、いくつかのシンタックス要素（例えば、それぞれ表１の行１１、１４、１７、１８に示すようにｉｎｉｔ＿ｑｐ＿ｍｉｎｕｓ２６、ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｐｐｓ＿ｃｂ／ｃｒ＿ｑｐ＿ｏｆｆｓｅｔ）は、逆量子化プロセスに関係付けられ、いくつかのシンタックス要素（例えば、それぞれ表１の行４０、４３、４４に示すようにｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｏｖｅｒｒｉｄｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｐｐｓ＿ｂｅｔａ＿ｏｆｆｓｅｔ＿ｄｉｖ２、ｐｐｓ＿ｔｃ＿ｏｆｆｓｅｔ＿ｄｉｖ２）は、デブロッキングプロセスに関係付けられ、いくつかのシンタックス要素（それぞれ表１の行７２、７３に示すようにｌｏｇ２＿ｓａｏ＿ｏｆｆｓｅｔ＿ｓｃａｌｅ＿ｌｕｍａ、ｌｏｇ２＿ｓａｏ＿ｏｆｆｓｅｔ＿ｓｃａｌｅ＿ｃｈｒｏｍａ）はＳＡＯプロセスに関係付けられている。同様に、スライスセグメントヘッダにおけるいくつかのシンタックス要素は、逆量子化（それぞれ表２の行７４、７６、７７に示すように、ｓｌｉｃｅ＿ｑｐ＿ｄｅｌｔａ、ｓｌｉｃｅ＿ｃｂ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｒ＿ｑｐ＿ｏｆｆｓｅｔ）、デブロッキング（行８６、８７に示すように、ｓｌｉｃｅ＿ｂｅｔａ＿ｏｆｆｓｅｔ＿ｄｉｖ２、ｓｌｉｃｅ＿ｔｃ＿ｏｆｆｓｅｔ＿ｄｉｖ２）、およびＳＡＯ（表２の行４７および４９に示すように、ｓｌｉｃｅ＿ｓａｏ＿ｌｕｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｓａｏ＿ｃｈｒｏｍａ＿ｆｌａｇ）に関係付けられている。これらのシンタックス要素および他のシンタックス要素は、表１〜表３においてアスタリスクでマーキングされている。無損失コーディングがシーケンス／ピクチャ／スライスレベルで適用されるとき、これらのシンタックス要素をシグナリングする必要がない場合があり、これによってシグナリングオーバヘッドが低減する。一方、無損失コーディングモードの高水準のインジケーションがない場合、これらの高水準シンタックス要素は、ビットストリーム内に符号化され、それぞれのデコーダに送信されなくてはならない。

また更に、ビデオビットストリームは、ブロックレベルにおいて（例えば、ＣＵレベルにおいて）変換に関係するシグナリングを含むことができる。例えば、ｔｒａｎｓｆｏｒｍ＿ｔｒｅｅ（）シンタックス構造（ｔｒａｎｓｆｏｒｍ＿ｔｒｅｅ（）の単純化されたバージョンが表７に示されている）において、変換ユニットの四分木分割が行われているか否か（ｔｒａｎｓｆｏｒｍ＿ｓｐｌｉｔ＿ｆｌａｇ）および／または変換ブロックにおいて、ルーマおよびクロマのための任意の非ゼロ係数が存在するか否かを示すフラグ（ｃｂｆ＿ｌｕｍａ、ｃｂｆ＿ｃｂおよびｃｂｆ＿ｃｒ）がシグナリングされる。無損失コーディングモードにおいて、ｔｒａｎｓｆｏｒｍ＿ｔｒｅｅ（）シンタックスは、これらのフラグのシグナリングを明示的にバイパスし、代わりに、これらのフラグを適切なデフォルト値に設定することによって単純化され得る。

シグナリング無損失コーディングモード
本明細書において記載されているのは、上記の不利な点のうちの１つまたは複数を克服することができる、無損失コーディングモードにおいて用いられるシグナリング方法の様々な実施形態である。１つのそのような実施形態では、無損失コーディングモードのシグナリングは、ＰＰＳシンタックス構造を変更することによって行われ得る。表４は、いくつかの実施形態による変更されたＰＰＳシンタックステーブルを示す。ここで、このＰＰＳを参照するスライス内の全てのコーディングユニットのフラグｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇのデフォルト値を示すための追加のフラグであるｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが追加される。この実施形態では、ビットストリームは、各個々のコーディングユニットにおいてフラグｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇをシグナリングする必要がない。この新たなフラグを１に設定し、フラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇを０に設定することによって、エンコーダは、シーケンスおよび／またはピクチャおよび／またはスライスレベルにおいて、無損失コーディングが適用されることをデコーダに示すことができる。すなわち、ＣＵレベルのシグナリングを一切伴うことなく、この現在のＰＰＳを参照する全てのＣＵの変換、変換スキップ、量子化およびループ内フィルタリングプロセスがバイパスされる。

ｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇが存在しないとき、新たなフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇがｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇのデフォルト値を指定するとみなされ得る。

０のＣＵレベルフラグｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇの既存のセマンティクスは、以下のように変更され得る。１に等しいｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇは、副節８．６に指定されるようなスケーリングおよび変換プロセスを指定し、副節８．７において指定されるようなループ内フィルタプロセスはバイパスされる。ｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇが存在しないとき、このフラグはｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇに等しいことが推測される。表４に示されているように、この新たなフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇ（表４、行１１）は、表４においてアスタリスクでマーキングされている逆量子化、逆変換およびループ内フィルタリングプロセスに関係するＰＰＳ内の（表４の行１２、１５、１７、２１、２８、４２、４５、５７、７４および８４に示すような）複数のシンタックス要素の存在を条件付けるために用いられ得る。これらの条件は、これらのシンタックス要素が、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが０に等しいとき（すなわち、損失ありコーディングが適用されるとき）にのみ送信されるように設定される。ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に等しいとき（すなわち、無損失コーディングが適用されるとき）、これらのシンタックス要素は送信されない。代わりに、それらの値は０であることが推測される。例えば、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に設定されているときに、ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が０であると推測することによって、デルタＱＰ関連シンタックス要素がＣＵレベルにおいてシグナリングされないことが示され、これにより、ビットを節減し、シンタックスパースを単純化する。

更に、ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇの存在を条件付けるために新たなフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが用いられる。ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、変換プロセスのみをバイパスする（量子化プロセスをバイパスしない）ために用いられる。したがって、これはｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇのサブセットである。更に、新たなフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇは、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの存在を条件付けるために用いられる。このようにして、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に設定されるとき（すなわち、無損失コーディングモード）、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０であることが推測され、ＣＵレベルにおけるｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇのシグナリングがスキップされる。

別の実施形態において、ＨＥＶＣ範囲拡張を通じた提案される追加のシンタックス要素を実施するために、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇのロケーションが、ＰＰＳ拡張の一部として（すなわち、ｐｐｓ＿ｅｘｔｅｎｓｉｏｎ＿ｆｌａｇ［０］の「ｉｆ」条件内で）更に下方に動かされ得る。この構成は、ＨＥＶＣ範囲拡張のＰＰＳシンタックスが、ＨＥＶＣ標準規格の第１のバージョンと最大限の後方互換性を有することを確実にすることができる（非特許文献３）。表５は、そのような構成の一例を示す。この構成において、新たなフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇは、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値で条件付けられ得る。すなわち、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇは、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０に等しいときにしかシグナリングされない。ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しいとき、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇはシグナリングされず、このＰＰＳを参照する各コーディングユニットにおけるｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇの値は、コーディングユニットレベルのビットストリームから明示的に受信される。一方、この実施形態の構成において、新たなフラグは、主要なＰＰＳシンタックスの一部でないため、上記で説明したような表４内の量子化、変形、変形スキップおよびループ内フィルタリングに関係する既存のＰＰＳシンタックス要素（アスタリスクでマーキングされたシンタックス要素）の存在を条件付けするために用いられ得ない。別のフラグｌｏｓｓｌｅｓｓ＿ｃｏｄｉｎｇ＿ｃｏｎｆｏｒｍａｎｃｅ＿ｆｌａｇは、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１である場合にシグナリングされる。フラグｌｏｓｓｌｅｓｓ＿ｃｏｄｉｎｇ＿ｃｏｎｆｏｒｍａｎｃｅ＿ｆｌａｇが１である場合、無損失コーディングモードにおいて用いられていないシンタックス要素のシグナリングされた値が適切な値を有することを確実にするために、ビットストリーム適合性要件が適用され得る。例えば、適合するビットストリームにおいて、ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｐｐｓ＿ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｓｌｉｃｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｄｅｂｌｏｃｋｉｎｇｆｉｌｔｅｒ＿ｃｏｎｔｒｏｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ、ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｌｉｓｔ＿ｄａｔａ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ等を含むシンタックス要素の値は、新たなフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に設定されている場合に、０に設定されるように要求され得る。そのようなビットストリーム適合性要件は、無損失コーディングにおいて用いられていないシンタックス要素に関係するシグナリングオーバヘッドを最小にするのに役立つことができる。

上記で説明したように、いくつかの実施形態では、ＰＰＳは、無損失コーディングのインジケーションのために、新たなフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇを搬送するように用いられる。一方、他の実施形態では、提案されたフラグを搬送するために、シーケンスパラメータセット（ＳＰＳ）またはビデオパラメータセット（ＶＰＳ）等の他の高水準シンタックス構造も用いられてもよい。あるいは、スライスレベルの無損失コーディングインジケーションのみが望ましい場合、提案された新たなフラグを搬送するためにスライスセグメントヘッダが用いられてもよい。

量子化、変換およびループ内フィルタリングプロセスに関係するいくつかのシンタックス要素は、ＳＰＳの一部としてシグナリングされ得ることに留意されたい。そのようなＳＰＳシンタックス要素の例は、ｌｏｇ２＿ｍｉｎ＿ｔｒａｎｓｆｏｒｍ＿ｂｌｏｃｋ＿ｓｉｚｅ＿ｍｉｎｕｓ２、ｌｏｇ２＿ｄｉｆｆｍａｘ＿ｍｉｎ＿ｔｒａｎｓｆｏｒｍ＿ｂｌｏｃｋ＿ｓｉｚｅ、ｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｅｒ、ｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｒａ、ｓｃａｌｉｎｇ＿ｌｉｓｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｓａｍｐｌｅ＿ａｄａｐｔｉｖｅ＿ｏｆｆｓｅｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｐｃｍ＿ｌｏｏｐ＿ｆｉｌｔｅｒ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇ、ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｒｏｔａｔｉｏｎ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｃｏｎｔｅｘｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ等を含む。無損失コーディングモードがＳＰＳレベルまたはＶＰＳレベルにおけるフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇを用いて示される場合、提案されるフラグは、量子化、変形、変形スキップ、変形スキップ回転、およびループ内フィルタリングプロセスに関係するＳＰＳシンタックス要素の存在を条件付けるために用いられ得る。あるいは、同様のビットストリーム適合性要件もまた、これらのシンタックス要素のために適切な値がシグナリングされることを確実にするために、例えば、適合性フラグが設定される場合にループ内フィルタが無効にされることを確実にするために適用され得る。

スライスヘッダシグナリング
更なる実施形態において、スライスヘッダシグナリングが用いられ得る。ＰＰＳと同様に、表２におけるスライスセグメントヘッダも、変形、量子化、およびループ内フィルタリング処理ブロックのために用いられる複数のシンタックス要素（アスタリスクでマーキングされたシンタックス要素）を含む。これらのシンタックス要素は、新たなフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇの値で条件付けられることが可能であり、無損失コーディングが、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇを１に設定することによって示されているとき、これらのシンタックス要素はシグナリングされる必要がない場合がある。表６はそのような例を示す。

表２に示すように、スライスセグメントヘッダは、量子化、変換およびループ内フィルタリングプロセスに関係付けられたいくつかのシンタックス要素を含む。そのようなスライスセグメントヘッダシンタックス要素（それらの行番号がアスタリスクでマーキングされている）は、ｓｌｉｃｅ＿ｓａｏ＿ｌｕｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｓａｏ＿ｃｈｒｏｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｑｐ＿ｄｅｌｔａ、ｓｌｉｃｅ＿ｃｂ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｒ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｈｒｏｍａ＿ｑｐ＿ａｄｊｕｓｔｍｅｎｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ、ｓｌｉｃｅ＿ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇ、ｓｌｉｃｅ＿ｂｅｔａ＿ｏｆｆｓｅｔ＿ｄｉｖ２、ｓｌｉｃｅ＿ｔｃ＿ｏｆｆｓｅｔ＿ｄｉｖ２およびｓｌｉｃｅ＿ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｓｌｉｃｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇを含む。スライスレベル無損失コーディングが、スライスセグメントヘッダにおいて提案されたフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇをシグナリングすることによって有効にされている場合、提案されたフラグは、スライスセグメントヘッダにおける量子化、変換およびループ内フィルタリングプロセスに関係付けられたシンタックス要素の存在を条件付けするために用いられ得る。このため、１つの実施形態では、フラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇは、スライスセグメントヘッダにおける量子化、変換およびループ内フィルタリングに関係付けられたシンタックス要素の前に配置される。別の実施形態では、フラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇは、スライスセグメントヘッダにおける代替的なロケーション、例えば、量子化、変換およびループ内フィルタリングに関係付けられたシンタックス要素の後に配置され得る。この場合、ビットストリーム適合性要件は、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に設定されている場合に、これらのシンタックス要素の値が適切に設定されることを確実にするように適用されるべきである。ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇを１に設定することは、現在のスライス内の全てのコーディングユニットが、無損失モードにおいて、ビットストリーム内の各個々のコーディングユニットのｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇをシグナリングすることなくコーディングされることを示す。更に、以下のビットストリーム適合性要件、すなわち、提案されるフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に設定されているとき、現在のスライスが参照するＰＰＳのフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１に等しいことが適用され得る。

表６は、提案されるフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが、スライスセグメントヘッダにおける量子化、変換およびループ内フィルタリングに関係付けられたシンタックス要素の前にシグナリングされるときの変更されたスライスセグメントヘッダの１つの例を示す。表６の例は、提案されるｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇがスライスセグメントヘッダにおいてシグナリングされることを示しているが、このフラグは代わりにＰＰＳ（表５）においてシグナリングされてもよく、アスタリスクで示されるスライスセグメントヘッダシンタックス要素の存在を条件付けるように用いられてもよい。

ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇがＰＰＳ拡張の一部としてシグナリングされる表５を例として用いると、図１２は、変更されたＰＰＳ拡張シンタックスをデコーダ側でパースするためのアルゴリズムの１つの実施形態を示す。変更されたＰＰＳ拡張において、提案されるフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇがパースされ、その値がステップ１２０２において検査される。ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが０に等しい場合、高効率ビデオコーディング（ＨＥＶＣ）範囲拡張テキスト仕様（草案６）における既存のＰＰＳ拡張シンタックス要素がパースされ、処理される（ステップ１２０４）。ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に等しい場合、シンタックス要素ｃｈｒｏｍａ＿ｑｐ＿ａｄｊｕｓｔｍｅｎｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｌｏｇ２＿ｓａｏ＿ｏｆｆｓｅｔ＿ｓｃａｌｅ＿ｌｕｍａおよびｌｏｇ２＿ｓａｏ＿ｏｆｆｓｅｔ＿ｓｃａｌｅ＿ｃｈｒｏｍａがパースされず、代わりにそれらの値が０であると推測される（ステップ１２０６）。フラグｌｏｓｓｌｅｓｓ＿ｃｏｄｉｎｇ＿ｃｏｎｆｏｒｍａｎｃｅ＿ｆｌａｇが１である場合（ステップ１２０７）、ビットストリーム適合性要件が適用される。適合性要件は、量子化、変換、およびループ内フィルタリングに関係付けられた既存のＰＰＳシンタックス要素（例えば、ｉｎｉｔ＿ｑｐ＿ｍｉｎｕｓ２６、ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｐｐｓ＿ｃｂ／ｃｒ＿ｑｐ＿ｏｆｆｓｅｔ、ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｐｐｓ＿ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｓｌｉｃｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｃｏｎｔｒｏｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ、ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｌｉｓｔ＿ｄａｔａ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ等）のシグナリングされた値をチェックし、これらのシンタックス要素が適切に無効にされていることを確実にすることによって適用される（ステップ１２０８）。これらのシンタックス要素のうちの１つまたは複数が無効にされていない場合、デコーダはビットストリーム適合性違反を報告し（ステップ１２１０）、そうでない場合、ＰＰＳ拡張のパースが正常に完了する。

変換木シンタックスシグナリング
無損失コーディングのための変換四分木分割
ＨＥＶＣおよびＨＥＶＣ範囲拡張は、変換木分割シンタックスを用いて、変換ユニット（ＴＵ）のサイズをシグナリングする。１つの実施形態では、高効率ビデオコーディング（ＨＥＶＣ）範囲拡張テキスト仕様（草案６）のセクション７．３．８．８において指定される変換木シンタックスは、新たな提案されるフラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇに基づいて変更される必要がない。別の実施形態では、変換木シンタックスは、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に等しいとき、四分木分割フラグ（ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇ）、ならびに／またはルーマおよびクロマ成分のためのコーディングされたブロックフラグ（ｃｂｆ＿ｌｕｍａ、ｃｂｆ＿ｃｂ、ｃｂｆ＿ｃｒ）のシグナリングをバイパスするように単純化され得る。単純化されたｔｒａｎｓｆｏｒｍ＿ｔｒｅｅ（）シンタックスが表７に示されている。ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇは、ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇの存在の更なる条件として用いられる。存在しないとき、ほとんどの場合、ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇの値は０であると推測され（すなわち、変換四分木分割は適用されない）、変換四分木分割が施行されるとき（例えば、Ｎ×Ｎの区分がイントラコーディングにおいて用いられるとき、または現在のＣＵサイズが３２×３２の最も大きな変換サイズよりも大きいとき等）のいくつかの既存の特殊な事例の場合、１であると推測される（すなわち、変換四分木分割が適用される）。更に、表７に示すように、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に等しいとき、ｔｒａｎｓｆｏｒｍ＿ｔｒｅｅ（）内の（ルーマ成分およびクロマ成分についての）全てのｃｂｆフラグのシグナリングがスキップされ得る。代わりにそれらの値は、１に等しいと推定され得る。なぜなら、無損失コーディングにおいて量子化プロセスがないことに起因して、ｃｂｆフラグが非ゼロ値を有する可能性が最も高いためである。

ｃｂｆ＿ｌｕｍａ、ｃｂｆ＿ｃｂ、およびｃｂｆ＿ｃｒのセマンティクスも変更され得る。１に等しいｃｂｆ＿ｌｕｍａ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］の値は、ルーマ変換ブロックが、０に等しくない１または複数の変換係数レベルを含むことを指定するために用いられ得る。アレイインデックスｘ０、ｙ０は、ピクチャの左上のルーマサンプルに対する検討中の変換ブロックの左上のルーマサンプルのロケーション（ｘ０，ｙ０）を指定する。アレイインデックスｔｒａｆｏＤｅｐｔｈは、変換コーディングの目的での、ブロックへのコーディングブロックの現在の細分化レベルを指定する。コーディングブロックに対応するブロックについて、ｔｒａｆｏＤｅｐｔｈは０に等しい。ｃｂｆ＿ｌｕｍａ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］は、存在しないとき、１に等しいと推測される。

１に等しいｃｂｆ＿ｃｂ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］の値は、Ｃｂ変換ブロックが、０に等しくない１または複数の変換係数レベルを含むことを示すために用いられ得る。アレイインデックスｘ０、ｙ０は、検討される変換ユニットの左上ロケーション（ｘ０、ｙ０）を指定する。アレイインデックスｔｒａｆｏＤｅｐｔｈは、変換コーディングの目的での、ブロックへのコーディングブロックの現在の細分化レベルを指定する。コーディングブロックに対応するブロックについて、ｔｒａｆｏＤｅｐｔｈは０に等しい。ｃｂｆ＿ｃｂ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］は、存在しないとき、ｃｂｆ＿ｃｂ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］の値は、以下のように推測され得る。

・ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に等しい場合、ｃｂｆ＿ｃｂ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］は１に等しいと推測される
・そうではなく、ｔｒａｆｏＤｅｐｔｈが０よりも大きく、かつｌｏｇ２ＴｒａｆｏＳｉｚｅが２に等しい場合、ｃｂｆ＿ｃｂ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］はｃｂｆ＿ｃｂ［ｘＢａｓｅ］［ｙＢａｓｅ］［ｔｒａｆｏＤｅｐｔｈ−１］に等しいと推測される
・そうでない場合、ｃｂｆ＿ｃｂ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］は０に等しいと推測される。

１に等しいｃｂｆ＿ｃｒ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］の値は、Ｃｒ変換ブロックが、０に等しくない１または複数の変換係数レベルを含むことを指定する。アレイインデックスｘ０、ｙ０は、検討される変換ユニットの左上のロケーション（ｘ０，ｙ０）を指定する。アレイインデックスｔｒａｆｏＤｅｐｔｈは、変換コーディングの目的での、ブロックへのコーディングブロックの現在の細分化レベルを指定する。コーディングブロックに対応するブロックについて、ｔｒａｆｏＤｅｐｔｈの値は０に等しい。

ｃｂｆ＿ｃｒ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］が存在しないとき、ｃｂｆ＿ｃｒ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］の値は以下のように推測され得る。

・ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に等しいとき、ｃｂｆ＿ｃｒ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］は１に等しいと推測される
・そうではなく、ｔｒａｆｏＤｅｐｔｈが０よりも大きく、かつｌｏｇ２ＴｒａｆｏＳｉｚｅが２に等しい場合、ｃｂｆ＿ｃｒ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］がｃｂｆ＿ｃｒ［ｘＢａｓｅ］［ｙＢａｓｅ］［ｔｒａｆｏＤｅｐｔｈ−１］に等しいと推測される
・そうでない場合、ｃｂｆ＿ｃｒ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］は０に等しいと推測される。

表７は、提案される高水準フラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇを用いてｔｒａｎｓｆｏｒｍ＿ｔｒｅｅ（）シンタックスを単純化する例を示すが、同じことに従って、ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇ、ｃｂｆ＿ｌｕｍａ、ｃｂｆ＿ｃｂおよびｃｂｆ＿ｃｒの存在を条件付けるために、既存のブロックレベルのフラグｃｕ＿ｔｒａｎｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇが代わりに用いられてもよい。

表７に示す一実施形態において、異なるサイズの、かつ異なるコーディングモードでコーディングされたＣＵについて、四分木分割フラグｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇおよびコーディングされたブロックフラグｃｂｆ＿ｌｕｍａ、ｃｂｆ＿ｃｂおよびｃｂｆ＿ｃｒはバイパスされ、フラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に等しいとき、対応するデフォルト値であると推測される。一方、入力ビデオの特性に依拠して、異なるブロックサイズおよびコーディングモードを用いるＣＵの残差は、独特の統計的特性を呈することができる。この場合、１つのピクチャまたはシーケンス内の全てのＣＵについて変換四分木分割を無効にすることは有益でない場合がある。代わりに、コーディング性能を改善するために、開示の１つの実施形態として、提案されるｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが、コーディングされるＣＵのブロックサイズ、コーディングモード（すなわち、インター、イントラまたはＩＢＣ）、またはブロックサイズおよびコーディングモードの組み合わせに依拠して、条件に応じて、変換四分木分割フラグおよび／またはコーディングされたブロックフラグのシグナリングをバイパスするために用いられる。例えば、複雑度および性能のトレードオフの観点において、ブロックが非イントラモードを用いてコーディングされ（すなわち、インターまたはＩＢＣモードを用いてコーディングされ）、ブロックサイズが８×８または１６×１６である場合にのみ変換四分木分割を可能にすることが有益であり得る。

１つの実施形態では、フラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に等しいとき、以下が適用される。全てのイントラコーディングされたＣＵについて、および６４×６４〜３２×３２のブロックサイズを有する全てのインターコーディングおよびＩＢＣコーディングされたＣＵについて、ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇおよび／またはコーディングされたブロックフラグ（ｃｂｆ＿ｌｕｍａ、ｃｂｆ＿ｃｂおよびｃｂｆ＿ｃｒ）はシグナリングされず、それらは上記で論考したように対応するデフォルト値であると推測される。インターモードまたはＩＢＣモードでコーディングされた８×８および１６×１６のＣＵの場合、更なる分割が許可され得る。ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇおよび／またはコーディングされたブロックフラグ（ｃｂｆ＿ｌｕｍａ、ｃｂｆ＿ｃｂおよびｃｂｆ＿ｃｒ）は、現在のブロックが４つの四分木に更に区分されるか否かおよび／または１つのＴＵ内の係数がオールゼロであるか否かをそれぞれ示すように、依然としてシグナリングされる。

いくつかの実施形態では、２つのシンタックス要素ｌｏｇ２＿ｉｎｔｒａ＿ｍａｘ＿ｎｏ＿ｔｒａｎｓｆｏｒｍ＿ｓｐｌｉｔ＿ｃｏｄｉｎｇ＿ｂｌｏｃｋ＿ｓｉｚｅ＿ｍｉｎｕｓ３およびｌｏｇ２＿ｉｎｔｅｒ＿ｍａｘ＿ｎｏ＿ｔｒａｎｓｆｏｒｍ＿ｓｐｌｉｔ＿ｃｏｄｉｎｇ＿ｂｌｏｃｋ＿ｓｉｚｅ＿ｍｉｎｕｓ３がＳＰＳまたはＰＰＳに加えられ、それぞれイントラおよびインター／ＩＢＣコーディングされたＣＵに変換四分木分割が適用される最大ＣＵサイズを指定する。例えば、上記の条件１）および２）を用いて、ｌｏｇ２＿ｉｎｔｒａ＿ｍａｘ＿ｎｏ＿ｔｒａｎｓｆｏｒｍ＿ｓｐｌｉｔ＿ｃｏｄｉｎｇ＿ｂｌｏｃｋ＿ｓｉｚｅ＿ｍｉｎｕｓ３およびｌｏｇ２＿ｉｎｔｅｒ＿ｍａｘ＿ｎｏ＿ｔｒａｎｓｆｏｒｍ＿ｓｐｌｉｔ＿ｃｏｄｉｎｇ＿ｂｌｏｃｋ＿ｓｉｚｅ＿ｍｉｎｕｓ３の値がそれぞれｌｏｇ２（６４）−３＝３およびｌｏｇ２（１６）−３＝１に設定される。表８は、２つの提案されるシンタックス要素を有する変更されたＳＰＳスクリーンコンテンツコーディング拡張シンタックステーブルを示す。

表８は、２つの追加のシンタックス要素を示すが、本開示の別の実施形態では、ｌｏｇ２＿ｉｎｔｒａ＿ｍａｘ＿ｎｏ＿ｔｒａｎｓｆｏｒｍ＿ｓｐｌｉｔ＿ｃｏｄｉｎｇ＿ｂｌｏｃｋ＿ｓｉｚｅ＿ｍｉｎｕｓ３の値はシグナリングされない場合がある。代わりに、値は、許可される最大ＣＵサイズと常に同じであると推測され得る。許可される最大ＣＵサイズは、最小ＣＵサイズ（ＳＰＳ内のシンタックス要素ｌｏｇ２＿ｍｉｎ＿ｌｕｍａ＿ｃｏｄｉｎｇ＿ｂｌｏｃｋ＿ｓｉｚｅ＿ｍｉｎｕｓ３によって指定される）を、最大ＣＵサイズと最小ＣＵサイズとの差（ＳＰＳ内のシンタックス要素ｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｍｉｎ＿ｌｕｍａ＿ｃｏｄｉｎｇ＿ｂｌｏｃｋ＿ｓｉｚｅによって指定される）と加算することによって導出され得る。そのような実施形態において、ＣＵがイントラモードでコーディングされ、無損失コーディングが適用されているとき、変換四分木分割は許容されない。

ｌｏｇ２＿ｉｎｔｒａ＿ｍａｘ＿ｎｏ＿ｔｒａｎｓｆｏｒｍ＿ｐａｒｔｉｔｉｏｎ＿ｃｏｄｉｎｇ＿ｂｌｏｃｋ＿ｓｉｚｅ＿ｍｉｎｕｓ３の値に３をプラスした値は、コーディングユニットがイントラコーディングされるとき、およびｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇが１に等しいときに変換四分木分割が適用されるコーディングユニットの最大ブロックサイズを指定する。

ｌｏｇ２＿ｉｎｔｅｒ＿ｍａｘ＿ｎｏ＿ｔｒａｎｓｆｏｒｍ＿ｐａｒｔｉｔｉｏｎ＿ｃｏｄｉｎｇ＿ｂｌｏｃｋ＿ｓｉｚｅ＿ｍｉｎｕｓ３の値に３をプラスした値は、コーディングユニットがインターコーディングまたはイントラブロックコピーコーディングされるとき、およびｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇが１に等しいときに変換四分木分割が適用されるコーディングユニットの最大ブロックサイズを指定する。

表９は、ブロックサイズおよび現在のＣＵのコーディングモードを条件としたｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇ、ｃｂｆ＿ｌｕｍａ、ｃｂｆ＿ｃｂおよびｃｂｆ＿ｃｒの提案されるシグナリング制約を有する変更されたｔｒａｎｓｆｏｒｍ＿ｔｒｅｅ（）シンタックステーブルを示す。この例示的な実施形態は、ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇおよびｃｂｆのシグナリングを可能にするか否かを条件付けるためにＣＵコーディングモードおよびＣＵサイズの双方を用いるが、他の変更された条件が用いられてもよいことに留意されたい。例えば、コーディングモードおよびブロックサイズのいずれか（双方ではない）が用いられてもよい。更に、別個の（および異なる）条件がｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇシグナリングまたはｃｂｆシグナリングに適用されてもよい。

別の実施形態では、無損失の場合にｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇのシグナリングをスキップするために、ＳＰＳにおけるシンタックス要素ｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｅｒおよびｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｒａが０に設定され得る。この方法は、現在のｔｒａｎｓｆｏｒｍ＿ｔｒｅｅ（）シンタックスに対する低レベルの変更を必要とせず、シーケンスレベル無損失コーディングの場合にｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇのシグナリングをバイパスする。そのような実施形態において、ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇはシグナリングされず、代わりに、デフォルト値であると推測される。デフォルト値は、ＴＵ四分木分割が施行される場合を除いて、ほとんどの場合に０である（例えば、イントラコーディングについて、またはＣＵサイズが最も大きなＴＵサイズよりも大きいとき等にＮ×Ｎの区分が用いられる）。このため、シーケンスレベル無損失コーディングが適用されるとき、ｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｅｒおよびｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｒａが適切に０に設定されることを必要とするビットストリーム制約を課すことによって、ブロックレベル変更を一切必要とすることなくｔｒａｎｓｆｏｒｍ＿ｓｐｌｉｔ＿ｆｌａｇのシグナリングがバイパスされ得る。同様に、ｔｒａｎｓｆｏｒｍ＿ｓｐｌｉｔ＿ｆｌａｇのシグナリングは、シーケンスレベルの無損失コーディングの場合、最大変換サイズおよび最小変換サイズが同じでなくてはならないというビットストリーム制約を課すことによって、ブロックレベル変更を一切必要とすることなくバイパスされ得る。この制約は、シーケンスレベル無損失コーディングの場合に、ＳＰＳシンタックスｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｍｉｎ＿ｔｒａｎｓｆｏｒｍ＿ｂｌｏｃｋ＿ｓｉｚｅが０に設定されることを必要とすることによって達成され得る。ｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｅｒ、ｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｒａおよびｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｍｉｎ＿ｔｒａｎｓｆｏｒｍ＿ｂｌｏｃｋ＿ｓｉｚｅはＳＰＳ内に位置するので、この場合、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇもＳＰＳ内に入れることがより好ましい場合がある。

開示の別の実施形態において、フラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇを追加することなく無損失コーディングのためのエンコーダのみの方法が提案される。そのような一実施形態において、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇを用いる条件付きの項は、ダガー（†）を用いてマーキングされた表７および表９におけるシンタックス要素から省かれ得る。この実施形態は、ＳＰＳ内のシンタックス要素ｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｅｒおよびｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｒａまたはｔｒａｎｓｆｏｒｍ＿ｔｒｅｅ（）内のシンタックス要素の値の変更を必要としない。符号化複雑度を低減するために、フラグｓｐｌｉｔ＿ｔｒａｎｆｏｒｍ＿ｆｌａｇは依然としてエンコーダのみの方法のためにシグナリングされているが、表７または表９に記載されているようなｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇのデフォルト値によって示される変換四分木分割のみがＣＵごとに試験される。

いくつかの実施形態では、現在のＣＵについてフラグｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇが１に等しいとき、エンコーダは、ほとんどの場合について、非変形四分木区分のレート−歪み（Ｒ−Ｄ）性能のみを試験し、Ｎ×ＮのＰＵ区分がイントラコーディングされたＣＵに適用されるかまたは現在のＣＵサイズが閾値よりも大きいとき等のいくつかの特殊な場合について、ワンタイム変換四分木区分（one-time transform quadtree partition）のＲ−Ｄ性能を試験する。このようにして、このエンコーダのみの方法は、ダガー（†）を用いてマーキングされたシンタックス要素における表７内のフラグｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇに適用される条件と適合している。

別の実施形態では、フラグｃｕ＿ｔｒａｎｓｆｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇが１に等しいとき、エンコーダはＣＵが厳密に１つの予測ユニットを含むとき、６４×６４〜３２×３２のブロックサイズを有する全てのイントラコーディングされたＣＵおよび全てのインター／ＩＢＣコーディングされたＣＵについて変換四分木区分のＲ−Ｄ性能のみを試験し、ＣＵが少なくとも２つの予測ユニットを含むとき、６４×６４〜３２×３２のブロックサイズを有する全てのイントラコーディングされたＣＵおよび全てのインター／ＩＢＣコーディングされたＣＵについてワンタイム変換四分木区分のＲ−Ｄ性能のみを試験し、ブロックサイズ１６×１６および８×８を有するインター／ＩＢＣコーディングされたＣＵについて、非変換四分木分割および更なる変換四分木分割の双方のＲ−Ｄ性能がエンコーダによって試験される。このため、このエンコーダのみの方法は、表９におけるダガー（†）を用いてマーキングされたフラグｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇに適用される条件に適合する。更に、フラグｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇは依然として上記のエンコーダのみの方法のためにビットストリームにおいてシグナリングされるが、１つのビットストリーム適合性制約が、ブロックサイズおよびブロックコーディングモードに依拠してシンタックス要素ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇの値がそのデフォルト値に設定されることを要求するために適用されてもよい。

いくつかの実施形態では、変換四分木分割フラグのデフォルト値の決定は、少なくとも部分的に、関連コーディングユニットにおける複数の予測ユニットに基づく。１つのそのような実施形態において、デフォルト値の決定は、コーディングユニットがイントラコーディングされているか否か、コーディングユニットのサイズがサイズ閾値よりも大きいか否か、およびコーディングユニットが厳密に１つの予測ユニットを含むか否かを決定することを含む。コーディングユニットがイントラコーディングされておらず、コーディングユニットがサイズ閾値より大きく、コーディングユニットが厳密に１つの予測ユニットを含むという判断に応答して、変換四分木分割フラグのデフォルト値は、非変換四分木区分を示すように設定される。

別のそのような実施形態では、変換四分木分割フラグのデフォルト値の決定は、関連コーディングユニットがイントラコーディングされているか否か、コーディングユニットのサイズがサイズ閾値よりも大きいか否か、および第１のコーディングユニットが少なくとも２つの予測ユニットを含むか否かを判断することを含む。コーディングユニットがイントラコーディングされておらず、コーディングユニットがサイズ閾値より大きく、コーディングユニットが少なくとも２つの予測ユニットを含むという判断に応答して、変換四分木分割フラグのデフォルト値は、ワンタイム変換四分木区分を示すように設定される。

更なる実施形態では、変換四分木分割フラグのデフォルト値の決定は、関連コーディングユニットがイントラコーディングされているか否か、および第１のコーディングユニットが厳密に１つの予測ユニットを含むか否かを判断することを含む。コーディングユニットがイントラコーディングされ、厳密に１つの予測ユニットを含むという判断に応答して、変換四分木分割フラグのデフォルト値は、非変換四分木区分を示すように設定される。

別の実施形態では、変換四分木分割フラグのデフォルト値の決定は、関連コーディングユニットがイントラコーディングされているか否か、およびコーディングユニットが少なくとも２つの予測ユニットを含むか否かを判断することを含む。コーディングユニットがイントラコーディングされておらず、かつコーディングユニットが少なくとも２つの予測ユニットを含むという判断に応答して、変換四分木分割フラグのデフォルト値が、ワンタイム変換四分木区分を示すように設定される。

コーディングユニットが厳密に１つの予測ユニットを含むかまたは少なくとも２つの予測ユニットを含むかの判断は、コーディングユニットの区分モードを判断することによって行われ得る。例えば、２Ｎ×２Ｎの区分モードを用いるコーディングユニットは厳密に１つの予測ユニットを含む一方、例えば、２Ｎ×Ｎ、Ｎ×２Ｎ、２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、ｎＲ×２ＮまたはＮ×Ｎの区分モードを用いるコーディングユニットは、少なくとも２つの予測ユニットを含む。

イントラブロックコピーモードのための変換木分割
変換四分木分割の最大深度は、符号化および復号の複雑度と密接に関係している。符号化効率と計算複雑度との間の柔軟なトレードオフを与えるために、ＨＥＶＣおよびその拡張は、ＳＰＳにおいてシンタックス要素を用いて、ＴＵサイズおよびＴＵ分割深度を指定する。値ｌｏｇ２＿ｍｉｎ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｂｌｏｃｋ＿ｓｉｚｅ＿ｍｉｎｕｓ２およびｌｏｇ２＿ｄｉｆｆ＿ｍａｘ＿ｍｉｎ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｂｌｏｃｋ＿ｓｉｚｅは、ビデオシーケンスをコーディングするのに用いられるＴＵサイズの組を示し、ｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｅｒおよびｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｒａは、それぞれ、イントラおよびインターコーディングされたＣＵのための最大分割深度を示す。ある特定の条件において、変換四分木分割は適用されない場合がある。例えば、ｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｒａ／ｉｎｔｅｒが０に設定される場合、変換四分木分割は現在のイントラ／インターコーディングされたＣＵに適用されない。

ＨＥＶＣ、その範囲拡張、およびＳＣＣ草案において、変換四分木分割が無効にされているとき、１つの暗黙的なＴＵ区分方法が、損失ありコーディングおよび無損失コーディングの双方に適用され、それによって、ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇの値は、複数の予測ユニット（ＰＵ）に区分され、インターモードにおいてコーディングされたＣＵについて、常に１である（すなわち、変換四分木分割が適用される）と推測される。これは、ＣＵ内のＰＵの異なる動きベクトルが人工的な高周波数情報を引き起こし、近傍のＰＵ間の境界にわたって一貫性のない残差をもたらすことに起因している。この場合、ＣＵをより小さなＴＵに分割することは、ＣＵのサイズと同じ大きさのＴＵサイズを用いるよりも良好なコーディング効率を提供することができる。

ＨＥＶＣスクリーンコンテンツコーディング拡張［００５７］の研究草案において、上記の暗黙的ＴＵ区分は、ＩＢＣモードにおいてコーディングされたＣＵに適用されない。より詳細には、変換四分木分割が無効にされているとき、ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇの値は、全てのＩＢＣコーディングされたＣＵについて常に０である（すなわち、変換ユニットサイズがＣＵのものと同じに設定される）と推測される。ＩＢＣモードとインターモードとの間の固有の類似性を与えられると、ＩＢＣコーディングされたＣＵの残差は、インターコーディングされたＣＵのものと類似した特性を呈することができる。したがって、変換コーディングの効率を更に改善するために、ＩＢＣコーディングされたＣＵに暗黙的ＴＵ区分を適用する（すなわち、ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇの値が１であると推測する）ことも有利であり得る。本明細書において説明される一実施形態において、変換四分木区分が無効にされているとき、インターモードに適用される同じ暗黙的ＴＵ区分方法も、損失ありコーディングおよび無損失コーディングの双方におけるＩＢＣコーディングされたＣＵに用いられる。換言すれば、２つ以上のＰＵ区分（例えば、２Ｎ×Ｎ、Ｎ×２ＮおよびＮ×Ｎ）がＩＢＣモードでコーディングされた現在のＣＵに存在するとき、ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇの値は１である（すなわち、変換四分木が分割される）と推測される。

ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇの値の導出プロセスは、［００５７］のセクション７．４．９．９において指定されている。本明細書に開示する例示的な実施形態におけるＩＢＣモードのための暗黙的なＴＵ分割の有効化に伴い、ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇのセマンティクスは以下のように動作する。

アレイｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］は、ブロックが、変換コーディングの目的で２分の１の水平サイズおよび２分の１の垂直サイズを有する４つのブロックに分割されるか否かを指定する。アレイインデックスｘ０、ｙ０は、ピクチャの左上ルーマサンプルに対する検討中のブロックの左上ルーマサンプルのロケーション（ｘ０、ｙ０）を指定する。アレイインデックスｔｒａｆｏＤｅｐｔｈは、変換コーディングの目的で、ブロックへのコーディングブロックの現在の細分化レベルを指定する。コーディングブロックに対応するブロックについて、ｔｒａｆｏＤｅｐｔｈの値は０に等しい。

変数ｉｎｔｅｒＳｐｌｉｔＦｌａｇは、以下のように導出される。ＩｎｔｅｒＳｐｌｉｔＦｌａｇは、以下の条件、すなわち、ｍａｘ＿ｔｒａｎｓｆｏｒｍ＿ｈｉｅｒａｒｃｈｙ＿ｄｅｐｔｈ＿ｉｎｔｅｒが０に等しくかつＣｕＰｒｅｄＭｏｄｅ［ｘ０］［ｙ０］がＭＯＤＥ＿ＩＮＴＥＲに等しい、またはｉｎｔｒａ＿ｂｃ＿ｆｌａｇ［ｘ０］［ｙ０］が１に等しくかつＰａｒｔＭｏｄｅがＰＡＲＴ＿２Ｎｘ２Ｎに等しくなく、かつｔｒａｆｏＤｅｐｔｈが０に等しい、のうちの１つまたは複数が適用されるとき、１に等しく設定される。そうでない場合、ｉｎｔｅｒＳｐｌｉｔＦｌａｇが０に等しく設定される。

ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］が存在しないとき、その値は以下のように推測される。以下の条件、すなわち、ｌｏｇ２ＴｒａｆｏＳｉｚｅがＭａｘＴｂＬｏｇ２ＳｉｚｅＹよりも大きいか、ＩｎｔｒａＳｐｌｉｔＦｌａｇが１に等しくかつｔｒａｆｏＤｅｐｔｈが０に等しいか、またはｉｎｔｅｒＳｐｌｉｔＦｌａｇが１に等しい、のうちの１つまたは複数が真である場合、ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］の値が１に等しいと推測される。そうでない場合、ｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇ［ｘ０］［ｙ０］［ｔｒａｆｏＤｅｐｔｈ］の値は０に等しいと推測される。

実施形態
例示的な実施形態において、スライスセグメントヘッダおよび複数のコーディングユニットを含むビデオスライスをコーディングする方法が提供される。本方法は、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされているか否かを示す、スライスセグメントヘッダにおけるバイパスフラグを生成することを含む。

いくつかのそのような実施形態において、バイパスフラグは、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇである。本方法は、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇを含むピクチャパラメータセット（ＰＰＳ）を生成することを含むことができ、ここで、スライスは、ピクチャパラメータセットを参照し、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に設定されているとき、ゼロに設定される。

いくつかの実施形態では、バイパスフラグは、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされているわけではないことを示し、本方法は、スライスセグメントヘッダにおいて、損失ありコーディングに関係付けられたシンタックス要素を生成することを含む。バイパスフラグは、損失ありコーディングに関係付けられたシンタックス要素の前に位置決めされ得る。

いくつかの実施形態において、バイパスフラグは、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされているわけではないことを示し、本方法は、スライスセグメントヘッダにおいて、量子化、変換およびループ内フィルタリングプロセスに関係付けられたシンタックス要素を生成することを更に含む。バイパスフラグは、量子化、変換およびループ内フィルタリングプロセスに関係付けられたシンタックス要素の前に位置決めされ得る。

いくつかの実施形態では、バイパスフラグは、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされるわけではないことを示し、本方法は、スライスセグメントヘッダにおいて、ｓｌｉｃｅ＿ｓａｏ＿ｌｕｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｓａｏ＿ｃｈｒｏｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｑｐ＿ｄｅｌｔａ、ｓｌｉｃｅ＿ｃｂ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｒ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｈｒｏｍａ＿ｑｐ＿ａｄｊｕｓｔｍｅｎｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ、ｓｌｉｃｅ＿ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇ、ｓｌｉｃｅ＿ｂｅｔａ＿ｏｆｆｓｅｔ＿ｄｉｖ２、ｓｌｉｃｅ＿ｔｃ＿ｏｆｆｓｅｔ＿ｄｉｖ２およびｓｌｉｃｅ＿ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｓｌｉｃｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇからなる群から選択された１または複数のシンタックス要素を生成することを更に含む。バイパスフラグは、ｓｌｉｃｅ＿ｓａｏ＿ｌｕｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｓａｏ＿ｃｈｒｏｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｑｐ＿ｄｅｌｔａ、ｓｌｉｃｅ＿ｃｂ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｒ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｈｒｏｍａ＿ｑｐ＿ａｄｊｕｓｔｍｅｎｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ、ｓｌｉｃｅ＿ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇ、ｓｌｉｃｅ＿ｂｅｔａ＿ｏｆｆｓｅｔ＿ｄｉｖ２、ｓｌｉｃｅ＿ｔｃ＿ｏｆｆｓｅｔ＿ｄｉｖ２およびｓｌｉｃｅ＿ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｓｌｉｃｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇからなる群から選択された１または複数のシンタックス要素の前に位置決めされ得る。

いくつかの実施形態では、バイパスフラグは、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされていることを示し、本方法は、スライスセグメントヘッダから、損失ありコーディングに関係付けられたシンタックス要素を除外することを更に含む。

いくつかの実施形態では、バイパスフラグが、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされていることを示す場合、本方法は、スライスセグメントヘッダから、量子化、変換およびループ内フィルタリングプロセスに関係付けられたシンタックス要素を除外することを更に伴う。

いくつかの実施形態では、バイパスフラグが、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされていることを示す場合、本方法は、スライスセグメントヘッダから、ｓｌｉｃｅ＿ｓａｏ＿ｌｕｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｓａｏ＿ｃｈｒｏｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｑｐ＿ｄｅｌｔａ、ｓｌｉｃｅ＿ｃｂ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｒ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｈｒｏｍａ＿ｑｐ＿ａｄｊｕｓｔｍｅｎｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ、ｓｌｉｃｅ＿ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇ、ｓｌｉｃｅ＿ｂｅｔａ＿ｏｆｆｓｅｔ＿ｄｉｖ２、ｓｌｉｃｅ＿ｔｃ＿ｏｆｆｓｅｔ＿ｄｉｖ２およびｓｌｉｃｅ＿ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｓｌｉｃｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇからなる群から選択された１または複数のシンタックス要素を除外することを更に伴う。

いくつかの実施形態では、バイパスフラグが、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされるわけではないことを示す場合、本方法は、スライス内のコーディングユニットごとにｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇをシグナリングすることを更に含む。

いくつかの実施形態では、バイパスフラグが、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされていることを示す場合、本方法は、スライス内の各コーディングユニットからｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇを除外することを更に伴う。

例示的な実施形態では、ピクチャパラメータセットおよびピクチャパラメータセット（ＰＰＳ）を参照する少なくとも１つのスライスを含むビデオをコーディングする方法が提供される。ここで、スライスは、スライスセグメントヘッダおよび複数のコーディングユニットを含む。この実施形態において、本方法は、ピクチャパラメータセットにおいて、ピクチャパラメータセットを参照するスライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされているか否かを示すバイパスフラグを生成することを含む。

いくつかのそのような実施形態では、バイパスフラグは、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇである。ピクチャパラメータセット（ＰＰＳ）は、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇを含み、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に設定されるとき、０に設定される。

バイパスフラグが、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされているわけではないことを示すいくつかの実施形態では、本方法は、スライスセグメントヘッダにおいて、損失ありコーディングに関係付けられたシンタックス要素を生成することを更に含む。

バイパスフラグが、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされているわけではないことを示すいくつかの実施形態において、本方法は、スライスセグメントヘッダにおいて、量子化、変換およびループ内フィルタリングプロセスに関係付けられたシンタックス要素を生成することを更に含む。

バイパスフラグが、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされているわけではないことを示すいくつかの実施形態において、本方法は、スライスセグメントヘッダにおいて、ｓｌｉｃｅ＿ｓａｏ＿ｌｕｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｓａｏ＿ｃｈｒｏｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｑｐ＿ｄｅｌｔａ、ｓｌｉｃｅ＿ｃｂ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｒ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｈｒｏｍａ＿ｑｐ＿ａｄｊｕｓｔｍｅｎｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ、ｓｌｉｃｅ＿ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇ、ｓｌｉｃｅ＿ｂｅｔａ＿ｏｆｆｓｅｔ＿ｄｉｖ２、ｓｌｉｃｅ＿ｔｃ＿ｏｆｆｓｅｔ＿ｄｉｖ２およびｓｌｉｃｅ＿ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｓｌｉｃｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇからなる群から選択された１または複数のシンタックス要素を生成することを更に含む。

バイパスフラグが、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされていることを示すいくつかの実施形態において、本方法は、スライスセグメントヘッダから、損失ありコーディングに関係するシンタックス要素を除外することを更に伴う。

バイパスフラグが、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされていることを示すいくつかの実施形態において、本方法は、スライスセグメントヘッダから、量子化、変換およびループ内フィルタリングプロセスに関係付けられたシンタックス要素を除外することを更に伴う。

バイパスフラグが、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされていることを示すいくつかの実施形態において、本方法は、スライスセグメントヘッダから、ｓｌｉｃｅ＿ｓａｏ＿ｌｕｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｓａｏ＿ｃｈｒｏｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｑｐ＿ｄｅｌｔａ、ｓｌｉｃｅ＿ｃｂ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｒ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｈｒｏｍａ＿ｑｐ＿ａｄｊｕｓｔｍｅｎｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ、ｓｌｉｃｅ＿ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇ、ｓｌｉｃｅ＿ｂｅｔａ＿ｏｆｆｓｅｔ＿ｄｉｖ２、ｓｌｉｃｅ＿ｔｃ＿ｏｆｆｓｅｔ＿ｄｉｖ２およびｓｌｉｃｅ＿ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｓｌｉｃｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇからなる群から選択された１または複数のシンタックス要素を除外することを伴う。

バイパスフラグが、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされているわけではないことを示すいくつかの実施形態において、本方法は、スライス内のコーディングユニットごとに、ｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇをシグナリングすることを更に含む。

バイパスフラグが、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされているわけではないことを示すいくつかの実施形態において、本方法は、スライス内の各コーディングユニットからｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇを除外することを更に伴う。

例示的な実施形態において、ビデオをコーディングする方法が提供され、ここで、ビデオは、高水準シンタックス構造および高水準シンタックス構造を参照する少なくとも１つのスライスを含み、スライスは複数のコーディングユニットを含む。本方法は、スライス内の全てのコーディングユニットが無損失コーディングを用いてコーディングされているか否かを示す高水準シンタックス構造においてバイパスフラグを生成することを含む。各それぞれのコーディングユニットについて、四分木分割フラグを生成するべきか否かの判断が行われる。この判断は、少なくとも部分的に、それぞれのコーディングユニットのブロックサイズおよびコーディングモードからなる群から選択されたパラメータに基づく。四分木分割フラグは、四分木分割フラグを生成する判断を行った後にのみ、それぞれのコーディングユニットについて生成される。

そのような実施形態において、高水準シンタックス構造は、ピクチャパラメータセット、セグメントスライスヘッダまたはｓｐｌｉｔ＿ｔｒａｎｓｆｏｒｍ＿ｆｌａｇであり得る。いくつかのそのような実施形態において、四分木分割フラグは、ブロックが非イントラモードを用いてコーディングされており、かつブロックサイズが８×８または１６×１６であるときにのみ生成される。四分木分割フラグは、ブロックサイズが６４×６４〜３２×３２である場合、生成されない。

いくつかの実施形態は、最大非変換四分木分割ブロックコーディングサイズを示す高水準シンタックス要素を生成することを更に伴う。いくつかの実施形態では、最大非変換四分木分割ブロックコーディングサイズを示す高水準シンタックス要素がシーケンスパラメータセット（ＳＰＳ）において生成される。いくつかの実施形態では、最大非変換四分木分割ブロックコーディングサイズを示す高水準シンタックス要素は、ピクチャパラメータセット（ＰＰＳ）において生成される。

いくつかの実施形態では、高水準シンタックス要素は、最大非変換四分木分割ブロックコーディングサイズが、非イントラモードにおいてコーディングされたブロックのための最大非変換四分木分割ブロックコーディングサイズを示すことを示すのに用いられる。

いくつかの実施形態では、ブロックが非イントラモードを用いてコーディングされており、かつ非イントラモードにおいてコーディングされたブロックについて、ブロックサイズが最大非変換四分木分割ブロックコーディングサイズよりも大きくない場合に四分木分割フラグが生成される。

いくつかの実施形態において、最大非変換四分木分割ブロックコーディングサイズを示す高水準シンタックス要素が、イントラモードにおいてコーディングされたブロックについて、最大非変換分割ブロックコーディングサイズを示す。

いくつかの実施形態において、四分木分割フラグは、ブロックがイントラモードを用いてコーディングされており、かつイントラモードにおいてコーディングされたブロックについて、ブロックサイズが最大非変換四分木分割ブロックコーディングサイズ以下である場合に生成される。

例示的な実施形態において、ビデオをコーディングする方法が提供される。ビデオは、高水準シンタックス構造および高水準シンタックス構造を参照する少なくとも１つのスライスを含み、スライスは、複数のコーディングユニットを含む。本方法は、高水準シンタックス構造において、スライス内のコーディングユニットの全てが無損失コーディングでコーディングされているか否かを示すバイパスフラグを生成することを含む。各それぞれのコーディングユニットについて、コーディングされたブロックフラグを生成するか否かの判断が行われる。判断は、少なくとも部分的に、それぞれのコーディングユニットのブロックサイズおよびコーディングモードからなる群から選択されたパラメータに基づく。コーディングされたブロックフラグは、コーディングされたブロックフラグを生成する判断を行った後にのみ、それぞれのコーディングユニットについて生成される。

そのような実施形態において、高水準シンタックス構造は、ピクチャパラメータセットまたはセグメントスライスヘッダであり得る。コーディングされたブロックフラグは、ｃｂｆ＿ｌｕｍａｆｌａｇ、ｃｂｆ＿ｃｂｆｌａｇまたはｃｂｆ＿ｃｒｆｌａｇのうちの１または複数であり得る。いくつかの実施形態では、コーディングされたブロックフラグは、ブロックが非イントラモードを用いてコーディングされており、かつブロックサイズが８×８または１６×１６であるときにのみ生成されるのに対し、コーディングされたブロックフラグは、ブロックがイントラモードを用いてコーディングされるかまたはブロックサイズが６４×６４〜３２×３２である場合、生成されない。

いくつかの実施形態では、最大非変換四分木分割ブロックコーディングサイズを示す高水準シンタックス要素が生成される。最大非変換四分木分割ブロックコーディングサイズを示す高水準シンタックス要素は、シーケンスパラメータセット（ＳＰＳ）またはピクチャパラメータセット（ＰＰＳ）において生成され得る。

いくつかの実施形態では、高水準シンタックス要素は、非イントラモードにおいてコーディングされたブロックのための最大非変換四分木分割ブロックコーディングサイズを示す最大非変換四分木分割ブロックコーディングサイズを示す。ブロックが非イントラモードを用いてコーディングされており、かつイントラモードにおいてコーディングされたブロックについて、ブロックサイズが最大非変換分割ブロックコーディングサイズ以下の場合に、コーディングされたフラグが生成される。

いくつかの実施形態において、最大非変換分割ブロックコーディングサイズを示す高水準シンタックス要素が、イントラモードにおいてコーディングされたブロックのための最大非変換分割ブロックコーディングサイズを示す。

いくつかの実施形態では、コーディングされたブロックフラグは、ブロックがイントラモードを用いてコーディングされており、かつイントラモードにおいてコーディングされたブロックについて、ブロックサイズが最大非変換分割ブロックコーディングサイズ以下である場合に生成される。

例示的な実施形態において、ビデオをコーティングする方法が提供される。ここで、ビデオは高水準シンタックス構造および高水準シンタックス構造を参照する少なくとも１つのスライスを含み、スライスは、複数のコーディングユニットを含む。本方法は、フラグｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇがコーディングユニットについて１に等しいと判断することを含む。判断は、コーディングユニットサイズおよびコーディングユニットのコーディングモードのうちの少なくとも一方に基づいて、ワンタイム変換四分木区分のレート−歪み性能を試験するために行われる。判断後、ワンタイム変換四分木区分のレート−歪み性能が試験される。

いくつかのそのような実施形態では、本方法は、更なるコーディングユニットについて、ワンタイム変換四分木区分のレート−歪み性能を試験しないことの判断を行うことを更に含む。レート−歪み性能の試験は、追加のコーディングユニットのための非変換四分木区分についてのみ実行される。

例示的な実施形態において、ビデオをコーディングする方法が提供される。ここで、ビデオは、分割変換フラグを含む変換木シンタックスを含み、複数のコーディングユニットを更に含む。本方法は、それぞれのコーディングユニットについて、コーディングユニットがイントラブロックコピーモードでコーディングされているか否か、および２つ以上の予測ユニット区分がコーディングユニット内に存在するか否かを判断することを含む。コーディングユニットがイントラブロックコピーモードでコーディングされており、かつ２つ以上の予測ユニット区分がコーディングユニット内に存在するという判断に応答して、分割変換フラグの値が１であると推測される。

例示的な方法において、変換および量子化プロセスがバイパスされることを示すコーディングユニットフラグのためのデフォルト値を含む高水準シンタックス構造が生成される。

いくつかのそのような実施形態では、高水準シンタックス構造を参照するスライス内の全てのコーディングユニットのｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇのデフォルト値を示すデフォルト値、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に設定される。高水準シンタックス構造は、ピクチャパラメータセット（ＰＰＳ）、シーケンスパラメータセット（ＳＰＳ）、ビデオパラメータセット（ＶＰＳ）またはスライスセグメントヘッダのうちの少なくとも１つであり得る。

いくつかの実施形態では、本方法は、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０に等しいＰＰＳを含むビットストリームを生成することを含む。いくつかの実施形態では、本方法は、ビットストリームを生成することを含み、コーディングユニットパラメータはｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇを含まない。

例示的な実施形態では、特定の高水準シンタックス構造における高水準シンタックス要素を介して、その特定の高水準シンタックス構造を参照する全てのＣＵについて、変換、変換スキップ、量子化およびループ内フィルタリングプロセスをバイパスするようにデコーダにシグナリングする方法が提供される。

別の例示的な実施形態では、逆量子化、逆変換およびループ内フィルタリングプロセスのうちの任意の１または複数に関係付けられた複数のＰＰＳシンタックス要素の存在を特定するための高水準シンタックス要素を受信および処理するようにデコーダを動作させる方法が提供される。

いくつかのそのような方法において、高水準シンタックス要素は、デフォルトフラグ値（ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇ）である。いくつかのそのような方法において、高水準シンタックス要素は、ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇ要素の存在を特定するために用いられる。

いくつかの実施形態では、本方法は、推測によりｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０であると判断し、これに応じて、ＣＵレベルにおいてｃｕ＿ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｆｌａｇのシグナリングを削除またはスキップすることを含む。いくつかの実施形態では、デフォルトフラグは、ＰＰＳ拡張パラメータセットまたはＳＰＳ拡張パラメータセットのうちの少なくとも１つに含まれる。

いくつかの実施形態において、デフォルトフラグの存在は、ｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値を条件とする。いくつかの実施形態において、デフォルトフラグはｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇである。

いくつかの実施形態において、本方法は、無損失コーディングモードにおいて使用されないシンタックス要素のシグナリングされた値が適切に設定されたことを示す追加の適合性フラグのシグナリングを受信することを更に含む。

いくつかの実施形態では、ｃｕ＿ｑｐ＿ｄｅｌｔａ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｐｐｓ＿ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｓｌｉｃｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｃｏｎｔｒｏｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ、ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｌｉｓｔ＿ｄａｔａ＿ｐｒｅｓｅｎｔ＿ｆｌａｇを含むシンタックス要素は、フラグｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇが１に設定される場合に０に設定される。

例示的な実施形態では、無損失コーディングが用いられることを示す高水準シグナリング無損失コーディングシンタックス要素を含むビデオデータビットストリームを受信する方法が提供される。

いくつかのそのような方法では、高水準シグナリングシンタックスは、ピクチャパラメータセット（ＰＰＳ）、シーケンスパラメータセット（ＳＰＳ）、ビデオパラメータセット（ＶＰＳ）またはスライスセグメントヘッダのうちの１つである。いくつかのそのような方法では、無損失コーディングシンタックス要素は、量子化、変形、変形スキップ、変形スキップ回転、およびループ内フィルタリングプロセスに関係付けられた１または複数のＳＰＳシンタックス要素を表すための条件として用いられる。

例示的な実施形態において、スライスセグメントヘッダが受信され、デフォルトフラグは、変換、量子化およびループ内フィルタリング処理ブロックのために用いられるスライスセグメントシンタックス要素の特定を条件付けるためのものである。いくつかのそのような方法において、デフォルトフラグはｔｒａｎｓｑｕａｎｔ＿ｂｙｐａｓｓ＿ｄｅｆａｕｌｔ＿ｆｌａｇである。

例示的な実施形態において、高水準無損失コーディングインジケーションを受信し、これに応じて複数の処理ブロックをシャットダウンする方法がビデオデコーダにおいて実行される。いくつかのそのような実施形態では、高水準無損失コーディングインジケーションは、ＰＰＳ、ＳＰＳ、ＶＰＳまたはスライスヘッダのうちの１つのパラメータ要素である。いくつかの実施形態では、複数の処理ブロックは、以下のハードウェアブロック、すなわち、逆量子化、逆変換、デブロッキングフィルタ、ＳＡＯのうちの任意のもののうちの１または複数を含む。

上記の技法のうちの任意のものを用いて符号化されたビデオが、任意の適切な有線もしくは無線伝送媒体を用いて送信されることが可能であり、かつ／または任意の適切な非一時的デジタルストレージ媒体上に記録されることが可能である。

特徴および要素が、上記において特定の組み合わせで説明されたが、当業者であれば、各特徴または要素は、単独で、または他の特徴と要素との任意の組み合わせで用いられ得ることを理解するであろう。更に、本明細書において説明される方法は、コンピュータまたはプロセッサによって実行するためのコンピュータ可読媒体に組み込まれたコンピュータプログラム、ソフトウェアまたはファームウェアにおいて実施され得る。コンピュータ可読媒体の例は、（有線または無線接続を介して送信される）電子信号およびコンピュータ可読記憶媒体を含む。コンピュータ可読記憶媒体の例は、限定ではないが、リードオンリーメモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、レジスタ、キャッシュメモリ、半導体メモリデバイス、内部ハードディスクおよび取り外し可能ディスク等の磁気媒体、磁気光媒体、ならびにＣＤ−ＲＯＭディスクおよびデジタル多用途ディスク（ＤＶＤ）等の光媒体を含む。ソフトウェアに関連付けられたプロセッサは、ＷＴＲＵ、ＵＥ、端末、基地局、ＲＮＣまたは任意のホストコンピュータにおいて用いるための無線周波数送受信機を実装するように用いられ得る。

ビデオの符号化および復号
図１Ａは、ブロックベースのビデオエンコーダ、例えば、ハイブリッドビデオ符号化システムの例を示すブロック図である。ビデオエンコーダ１００は、入力ビデオ信号１０２を受信することができる。入力ビデオ信号１０２は、ブロックごとに処理され得る。ビデオブロックは任意のサイズであり得る。例えば、ビデオブロックユニットは、１６×１６ピクセルを含むことができる。１６×１６ピクセルのビデオブロックユニットは、マクロブロック（ＭＢ）と呼ばれる場合がある。高効率ビデオコーディング（ＨＥＶＣ）では、拡張されたブロックサイズ（例えば、これらはコーディングツリーユニット（ＣＴＵ）またはコーディングユニット（ＣＵ）と呼ばれる場合があり、本発明ではこれらの２つの用語は同義である）が、高分解能（例えば、１０８０ｐ以上）のビデオ信号を効率的に圧縮するために用いられ得る。ＨＥＶＣにおいて、ＣＵは最大６４×６４ピクセルとすることができる。ＣＵは、予測ユニット（ＰＵ）に区分することができ、これらのユニットに対し、別個の予測方法を適用することができる。

エンコーダにおけるモード決定ブロック１８０は、例えば、空間および／または時間予測の後に予測モードを選択することができる。予測ブロックは、１１６において、現在のビデオブロックから減算され得る。予測残差は、変換１０４および／または量子化１０６され得る。量子化ブロック１０６は、予測残差をコーディングするのに必要なビット数を効果的に低減することができる。量子化パラメータ（ＱＰ）が、量子化の厳密度（severity）を制御するのに用いられ得る。ＱＰ値が増大すると、より厳密な量子化が適用されることが可能であるが、結果として、コーディングされるビデオビットレートが低減される場合があり、同時に、復号化されるビデオ品質が劣化する場合がある。量子化に起因する一般的に知られている視覚的アーチファクトは、ブロッキングアーチファクト、ブラー、不鮮明化、リンギング、フリッカ等を含む。図１Ａおよび図２Ａに示されるビデオコーディングシステム内の他の処理ブロックも、特に、これらの処理ブロックが、処理パイプラインにおける中間データのビット深度に対し上限を必要とする固定点操作を適用するとき、情報損失を引き起こす場合がある。例えば、変換ブロック１０４において、水平方向の変換が最初に適用されることが可能であり、その後、垂直方向の変換が適用され得る。変換はデータビット深度を増大させるため（乗算に起因する）、水平変換の後、垂直変換のために入力データビット深度を低減させるために、水平変換の出力に右シフトが適用され得る。そのようなシフト操作は、（データビットの深度を低減することによって）実装コストを低減するのに役立つことができるが、処理パイプラインにおける情報損失も引き起こす場合がある。更に、固定点操作を可能にするために、Ｈ．２６４／ＡＶＣおよびＨＥＶＣ等の最新のビデオ標準規格における変換は、積分値変換である。これらの積分値変換のうちのいくつかは、ほぼ直交であるが完全に直交でない場合がある。変換（および逆変換）行列が完全に直交でない場合、これらは完全な再構成を補償することができない。換言すれば、量子化を一切行わない場合であっても、非直交変換および逆変換が入力データブロックに適用された後、出力データブロック（スケーリング係数が出力に適用され得る）は、入力データブロックと数学的に同一のままでない場合がある。

図２Ａは、ブロックベースのビデオデコーダの例を示すブロック図である。ビデオデコーダ２００は、ビデオビットストリーム２０２を受信することができる。ビデオビットストリーム２０２は、エントロピー復号ユニット２０８においてアンパッキングおよび／またはエントロピー復号され得る。ビデオビットストリームを符号化するのに用いられるコーディングモードおよび／または予測情報は、空間予測ユニット２６０（例えば、イントラコーディングされている場合）および／または時間予測ユニット２６２（例えば、インターコーディングされている場合）に送信され、予測ブロックを形成することができる。インターコーディングされている場合、予測情報は、予測ブロックサイズ、１つもしくは複数の動きベクトル（例えば、動きの方向および量を示すことができる）、および／または１もしくは複数の基準インデックス（例えば、これはいずれの参照ピクチャから予測信号が得られるかを示すことができる）を含むことができる。

エンコーダ（例えば、エンコーダ１００）は、（例えば、図１Ａのブロック１８０において）モード決定を実行し、ビデオブロックのための最良のコーディングモードを決定することができる。エンコーダが（例えばインター予測の代わりに）イントラ予測を適用することを決定するとき、エンコーダは、利用可能なモードの組から最適なイントラ予測モードを決定することができる。選択される方向イントラ予測モードは、入力ビデオブロックにおける任意のテクスチャ、エッジおよび／または構造の方向に関して強力なヒントを与えることができる。図５は、（例えば、４×４のブロックについての）水平予測の例の図である。現在の４×４のビデオブロックにおけるピクセルを予測するために、既に再構成されたピクセルＰ０、Ｐ１、Ｐ２およびＰ３（例えば、影付きのボックス）が、用いられ得る。水平予測において、再構成されたピクセル、例えば、ピクセルＰ０、Ｐ１、Ｐ２および／またはＰ３は、対応する行の方向に沿って水平方向に伝搬され、４×４のブロックを予測することができる。例えば予測は、以下の式（１）に従って実行され得る。ここで、Ｌ（ｘ，ｙ）は、（ｘ，ｙ）、ｘ，ｙ＝０．．．３において予測されるピクセルであり得る。

図７および図８は、（例えば、図１Ａの動き予測ユニット１６２を用いた）ビデオブロックの動き予測の例を示す図である。図８は、例えば、参照ピクチャ「Ｒｅｆｐｉｃ０」、「Ｒｅｆｐｉｃ１」および「Ｒｅｆｐｉｃ２」を含む例示的な復号されたピクチャバッファを示す図である。現在のピクチャ内のブロックＢ０、Ｂ１およびＢ２は、それぞれ、参照ピクチャ「Ｒｅｆｐｉｃ０」、「Ｒｅｆｐｉｃ１」および「Ｒｅｆｐｉｃ２」内のブロックから予測され得る。動き予測は、近傍のビデオフレームからのビデオブロックを用いて現在のビデオブロックを予測することができる。動き予測は、時間相関を利用し、かつ／またはビデオ信号に固有の時間冗長性を取り除くことができる。例えば、Ｈ．２６４／ＡＶＣおよびＨＥＶＣにおいて、時間予測は、様々なサイズのビデオブロック（例えば、ルーマ成分の場合、時間予測ブロックサイズは、Ｈ．２６４／ＡＶＣにおいて１６×１６〜４×４、ＨＥＶＣにおいて６４×６４〜４×４に変動し得る）において実行され得る。（ｍｖｘ，ｍｖｙ）の動きベクトルを用いて、時間予測は、式（１）によって与えられるように実行され得る。

図９は、通信システムの例を示す図である。通信システム１３００は、エンコーダ１３２０と、通信ネットワーク１３０４と、デコーダ１３０６とを備えることができる。エンコーダ１３０２は、接続１３０８を介して通信ネットワーク１３０４と通信することができる。接続１３０８は、有線接続または無線接続であり得る。エンコーダ１３０２は、図１Ａのブロックベースのビデオエンコーダに類似し得る。エンコーダ１３０２は、単層コーデック（例えば、図１Ａ）または多層コーデックを含むことができる。

デコーダ１３０６は、接続１３１０を介して通信ネットワーク１３０６と通信することができる。接続１３１０は、有線接続または無線接続であり得る。デコーダ１３０６は、図２Ａのブロックベースのビデオデコーダに類似し得る。デコーダ１３０６は、単層コーデック（例えば、図２Ａ）または多層コーデックを含むことができる。例えば、デコーダ１３０６は、ピクチャレベルのＩＬＰサポートを有する多層（例えば２層）スケーラブルデコーディングシステムであり得る。

Claims

ビデオコーディング方法であって、
ビデオスライスにおいて複数のコーディングユニットを生成することと、
前記ビデオスライスによって参照される高水準シンタックス構造を生成することと、
を含み、前記高水準シンタックス構造の前記生成は、前記高水準シンタックス構造において、前記スライス内の全ての前記コーディングユニットが無損失コーディングを用いてコーディングされているか否かを示すバイパスフラグを生成することを含むことを特徴とするビデオコーディング方法。
前記ビデオスライスを符号化する前記コーディングユニットが全て無損失コーディングを用いるか否かの判断を行うことを更に含み、前記バイパスフラグの値は、前記判断の結果を示すことを特徴とする請求項１に記載のビデオコーディング方法。
前記ビデオスライスのためのスライスセグメントヘッダを生成することを更に含み、前記スライスセグメントヘッダの前記生成は、損失ありコーディングに関係する少なくとも１つのシンタックス要素について、前記スライスセグメントヘッダ内に前記損失ありコーディングシンタックス要素を含めるか否かを判断することを含み、前記損失ありコーディングシンタックス要素を含めるか否かの前記判断は、前記ビデオスライス内の前記コーディングユニットが全て無損失コーディングを用いるか否かの前記判断に基づくことを特徴とする請求項２に記載のビデオコーディング方法。
前記損失ありコーディングシンタックス要素は、量子化、変換およびループ内フィルタリングプロセスからなる群から選択されたプロセスに関係するシンタックス要素であることを特徴とする請求項３に記載のビデオコーディング方法。
前記損失ありコーディングシンタックス要素は、ｓｌｉｃｅ＿ｓａｏ＿ｌｕｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｓａｏ＿ｃｈｒｏｍａ＿ｆｌａｇ、ｓｌｉｃｅ＿ｑｐ＿ｄｅｌｔａ、ｓｌｉｃｅ＿ｃｂ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｒ＿ｑｐ＿ｏｆｆｓｅｔ、ｓｌｉｃｅ＿ｃｈｒｏｍａ＿ｑｐ＿ａｄｊｕｓｔｍｅｎｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｏｖｅｒｒｉｄｅ＿ｆｌａｇ、ｓｌｉｃｅ＿ｄｅｂｌｏｃｋｉｎｇ＿ｆｉｌｔｅｒ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇ、ｓｌｉｃｅ＿ｂｅｔａ＿ｏｆｆｓｅｔ＿ｄｉｖ２、ｓｌｉｃｅ＿ｔｃ＿ｏｆｆｓｅｔ＿ｄｉｖ２およびｓｌｉｃｅ＿ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｓｌｉｃｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇからなる群から選択されることを特徴とする請求項３に記載のビデオコーディング方法。
前記ビデオスライスのためのスライスセグメントヘッダを生成することを更に含み、前記スライスセグメントヘッダは、量子化、変換およびループ内フィルタリングプロセスからなる群から選択された損失ありコーディングプロセスに関係する少なくとも１つのシンタックス要素を含み、
前記ビデオスライスを符号化する前記コーディングユニットが全て無損失コーディングを用いるという判断に応じて、前記シンタックス要素の値は、前記損失ありコーディングプロセスが適用されないことを示すことを特徴とする請求項２に記載のビデオコーディング方法。
前記ビデオスライスを符号化する前記コーディングユニットが全て無損失コーディングを用いるという判断に応じて、
各それぞれのコーディングユニットについて、前記それぞれのコーディングユニットのブロックサイズおよびコーディングモードからなる群から選択されたパラメータに少なくとも部分的に基づいて変換四分木分割フラグを生成するか否かを判断することと、
前記変換四分木分割フラグを生成することの判断を行った後にのみ、それぞれのコーディングユニットについて変換四分木分割フラグを生成することと、
を更に含むことを特徴とする請求項２に記載のビデオコーディング方法。
前記ビデオスライスを符号化する前記コーディングユニットが全て無損失コーディングを用いるという判断に応じて、
各それぞれのコーディングユニットについて、前記それぞれのコーディングユニットのブロックサイズおよびコーディングモードからなる群から選択されたパラメータに少なくとも部分的に基づいてコーディングされたブロックフラグを生成するか否かを判断することと、
前記コーディングされたブロックフラグを生成することの判断を行った後にのみ、それぞれのコーディングユニットについてコーディングされたブロックフラグを生成することと、
を更に含むことを特徴とする請求項２に記載のビデオコーディング方法。
前記高水準シンタックス構造は、ビデオパラメータセット（ＶＰＳ）、シーケンスパラメータセット（ＳＰＳ）、ピクチャパラメータセット（ＰＰＳ）およびスライスヘッダからなる群から選択されることを特徴とする請求項１に記載のビデオコーディング方法。
ビデオデコーダであって、
ビットストリームから、複数のコーディングユニットを用いて符号化されたビデオスライスを含むビデオおよび前記ビデオスライスによって参照される高水準シンタックス構造をアンパックするように動作可能なエントロピー復号ユニットであって、前記高水準シンタックス構造は、前記スライス内の前記コーディングユニットの全てが無損失コーディングを用いてコーディングされているか否かを示すバイパスフラグを含む、エントロピー復号ユニットと、
逆量子化ユニットと、
逆変換ユニットと、
を備え、前記デコーダは、前記バイパスフラグからの、前記スライス内の全ての前記コーディングユニットが無損失コーディングを用いてコーディングされていることのインジケーションに応答して、前記逆量子化ユニットおよび前記逆変換ユニットをシャットダウンするように動作可能であることを特徴とするビデオデコーダ。
ループフィルタを更に備え、前記デコーダは、前記バイパスフラグからの、前記スライス内の前記コーディングユニットの全てが無損失コーディングを用いてコーディングされているというインジケーションに応答して、前記ループフィルタをシャットダウンするように動作可能であることを特徴とする請求項１０に記載のビデオデコーダ。
複数のコーディングユニットを含むビデオスライスをコーディングする方法であって、
前記複数のコーディングユニット内の少なくとも第１のコーディングユニットを、無損失コーディングを用いて符号化する判断を行うことと、
前記第１のコーディングユニットを、無損失コーディングを用いて符号化する判断に応答して、前記第１のコーディングユニットの変換四分木分割フラグのデフォルト値を決定することと、
前記第１のコーディングユニットの前記変換四分木分割フラグを前記変換四分木分割フラグの前記デフォルト値に設定することと、
を含むことを特徴とする方法。
前記第１のコーディングユニットの前記変換四分木分割フラグを前記変換四分木分割フラグの前記デフォルト値に設定することは、前記変換四分木分割フラグの前記デフォルト値を用いて前記第１のコーディングユニットのレート−歪み性能を試験することを更に含むことを特徴とする請求項１２に記載の方法。
前記変換四分木分割フラグの前記デフォルト値の前記決定は、前記第１のコーディングユニットがイントラコーディングされているか否かに少なくとも部分的に基づくことを特徴とする請求項１２に記載の方法。
前記変換四分木分割フラグの前記デフォルト値の前記決定は、前記第１のコーディングユニットのサイズに少なくとも部分的に基づくことを特徴とする請求項１２に記載の方法。
前記変換四分木分割フラグの前記デフォルト値の前記決定は、前記第１のコーディングユニット内の複数の予測ユニットに少なくとも部分的に基づくことを特徴とする請求項１２に記載の方法。
前記変換四分木分割フラグの前記デフォルト値を決定することは、
前記第１のコーディングユニットがイントラコーディングされているか否かを判断することと、
前記第１のコーディングユニットのサイズがサイズ閾値よりも大きいか否かを判断することと、
前記第１のコーディングユニットが厳密に１つの予測ユニットを含むか否かを判断することと、
を含み、前記第１のコーディングユニットがイントラコーディングされておらず、前記第１のコーディングユニットが前記サイズ閾値よりも大きく、かつ前記第１のコーディングユニットが厳密に１つの予測ユニットを含むという判断に応答して、前記変換四分木分割フラグの前記デフォルト値は、非変換四分木区分を示すことを特徴とする請求項１２に記載の方法。
前記変換四分木分割フラグの前記デフォルト値を決定することは、
前記第１のコーディングユニットがイントラコーディングされているか否かを判断することと、
前記第１のコーディングユニットのサイズがサイズ閾値よりも大きいか否かを判断することと、
前記第１のコーディングユニットが少なくとも２つの予測ユニットを含むか否かを判断することと、
を含み、前記第１のコーディングユニットがイントラコーディングされておらず、前記第１のコーディングユニットが前記サイズ閾値よりも大きく、かつ前記第１のコーディングユニットが少なくとも２つの予測ユニットを含むという判断に応答して、前記変換四分木分割フラグの前記デフォルト値は、ワンタイム変換四分木区分を示すことを特徴とする請求項１２に記載の方法。
前記変換四分木分割フラグの前記デフォルト値を決定することは、
前記第１のコーディングユニットがイントラコーディングされているか否かを判断することと、
前記第１のコーディングユニットが厳密に１つの予測ユニットを含むか否かを判断することと、
を含み、前記第１のコーディングユニットがイントラコーディングされており、かつ前記第１のコーディングユニットが厳密に１つの予測ユニットを含むという判断に応答して、前記変換四分木分割フラグの前記デフォルト値は非変換四分木区分を示すことを特徴とする請求項１２に記載の方法。
前記変換四分木分割フラグの前記デフォルト値を決定することは、
前記第１のコーディングユニットがイントラコーディングされているか否かを判断することと、
前記第１のコーディングユニットが少なくとも２つの予測ユニットを含むか否かを判断することと、
を含み、前記第１のコーディングユニットがイントラコーディングされておらず、かつ前記第１のコーディングユニットが少なくとも２つの予測ユニットを含むという判断に応答して、前記変換四分木分割フラグの前記デフォルト値はワンタイム変換四分木区分を示すことを特徴とする請求項１２に記載の方法。