JP6640751B2

JP6640751B2 - ブロックベクトル導出を用いるイントラブロックコピー符号化のための方法およびシステム

Info

Publication number: JP6640751B2
Application number: JP2016574117A
Authority: JP
Inventors: ユーウェンホー; イエンイエ; シアオユーシウ
Original assignee: ヴィドスケールインコーポレイテッド
Priority date: 2014-06-19
Filing date: 2015-06-18
Publication date: 2020-02-05
Anticipated expiration: 2035-06-18
Also published as: EP3158753A1; WO2015195942A1; CN111432220A; CN111432220B; US20150373366A1; EP3158753B1; KR20220079687A; TW201618548A; EP4033766A1; US20190200038A1; CN106576178A; KR20170023086A; KR102402622B1; US9877043B2; CN106576178B; US20200404321A1; TWI679882B; US10284874B2; US20180160141A1; JP2017522803A

Description

本発明は、ブロックベクトル導出を用いるイントラブロックコピー符号化（Ｉｎｔｒａｂｌｏｃｋｃｏｐｙｃｏｄｉｎｇ）に関する。

本出願は、２０１４年６月１９日に出願された米国仮特許出願第６２／０１４，６６４号の非仮出願であり、米国特許法第１１９条（ｅ）に基づく同出願からの利益を主張する。同出願の内容は、その全体が、参照により本明細書に組み込まれる。過去２０年にわたって、様々なデジタルビデオ圧縮技術が、効率的なデジタルビデオ通信、配信、および消費を可能にするために、開発され、規格化されてきた。Ｈ．２６１、ＭＰＥＧ−１、ＭＰＥＧ−２Ｈ．２６３、ＭＰＥＧ−４（ｐａｒｔ−２）、およびＨ．２６４／ＡＶＣ（ＭＰＥＧ−４ｐａｒｔ１０ＡｄｖａｎｃｅＶｉｄｅｏＣｏｄｉｎｇ）など、商業的に広く展開されている規格のほとんどは、ＩＳＯ／ＩＥＣおよびＩＴＵ−Ｔによって開発されている。新しい高度ビデオ圧縮技術が出現および成熟したために、新しいビデオ符号化規格である高効率ビデオ符号化（ＨＥＶＣ）が、ＩＴＵ−Ｔビデオコーディングエキスパーツグループ（ＶＣＥＧ）およびＩＳＯ／ＩＥＣＭＰＥＧによって共同開発中である。ＨＥＶＣ（ＩＴＵ−ＴＨ．２６５／ＩＳＯ／ＩＥＣ２３００８−２）は、２０１３年前半には国際規格として承認され、現在最新のＨ．２６４／ＡＶＣよりもかなり高い符号化効率を達成することができる。

スクリーンコンテンツ共有アプリケーションは、リモートデスクトップ、ビデオ会議、およびモバイルメディアプレゼンテーションアプリケーションの普及に伴って、近年ますます人気が高まっている。双方向スクリーンコンテンツ共有システムは、キャプチャラ、エンコーダ、および送信機を含むホストサブシステムと、受信機、デコーダ、およびディスプレイ（レンダラ）を含むクライアントサブシステムとを含むことができる。スクリーンコンテンツ符号化（ＳＣＣ）については、業界からの様々なアプリケーション要件が存在する。自然なビデオコンテンツと比較した場合、スクリーンコンテンツは、シャープな曲線およびスクリーンコンテンツ内に頻繁に出現するテキストのために、いくつかの主要色および強いエッジを有する多数のブロックをしばしば含む。

ＩTU−T Q6／16 and ISO／IEC JCT1／SC29／WG11，"Joint Call for Proposals for Coding of Screen Content"，MPEG2014／N14175，Jan．2014，San Jose，USA Ｊ．Chen，Y．Chen，T．Hsieh，R．Joshi，M．Karczewicz，W．−S．Kim，X．Li，C．Pang，W．Pu，Ｋ．Rapaka，J．Sole，L．Zhang，F．Zou，"Description of screen content coding technology proposal by Qualcomm"，JCTVC−Q0031，Mar 2014，Valencia，ES C．-C．Chen,T．-S．Chang,Ｒ．-L．Liao,C．-W Kuo, W．-Ｈ．Peng, H．−M．Hang, Y．-Ｊ．Chang,C．-H Hung，C．-C．Lin,Ｊ．-Ｓ．Tu,Ｅ．-C．Ke,Ｊ．-Y．Kao,C．-L．Lin,Ｆ．-D．Jou,Ｆ．-C．Chen，"Description of screen content coding technology proposal by NCTU and ITRI International"，JCTVC−Q0032，Mar 2014，Valencia,ES P．Lai，T．-D．Chuang，Y．-C．Sun，X．Xu，Ｊ．Ye，S．-T．Hsiang，Y．-W．Chen，K．Zhang，X．Zhang，S．Liu，Y．-W．Huang，S．Lei，"Description of screen content coding technology proposal by MediaTek"，JCTVC−Q0033，Mar 2014，Valencia，ES Z．Ma，W．Wang，Ｍ．Xu，X．Wang，H．Yu，"Description of screen content coding technology proposal by Huawei Technologies"，JCTVC−Q0034，Mar 2014，Valencia，ES B．Li，Ｊ．Xu，F．Wu，X．Guo，G．Ｊ．Sullivan，"Description of screen content coding technology proposal by Microsoft"，JCTVC−Q0035，Mar 2014，Valencia，ES R．Cohen，A．Minezawa，X．Zhang，Ｋ．Miyazawa，A．Vetro，Ｓ．Sekiguchi，K．Sugimoto，T．Murakami，"Description of screen content coding technology proposal by Mitsubishi Electric Corporation"，JCTVC−Q0036，Mar 2014，Valencia，ＥＳＸ．Xiu，C．−Ｍ．Tsai，Ｙ．He，Y．Ye，"Description of screen content coding technology proposal by InterDigital"，JCTVC−Q0037，Mar 2014，Valencia，ES Ｔ．Lin，Ｓ．Wang，P．Zhang，ａｎｄＫ．Zhou，"AHG8：P2M based dual−coder extension of HEVC"， Document no JCTVC−L0303，Jan．2013 Ｘ．Guo，Ｂ．Li，Ｊ．−Ｚ．Ｘｕ，Ｙ．Lu，S．Li，and F．Wu，"AHG8：Major−color−based screen content coding"，Document no JCTVC−O0182，Oct．2013 Ｌ．ＧｕｏＭ．Karczewicz，Ｊ．Sole，ａｎｄＲ．Joshi，"Evaluation of Palette Mode Coding on HM−12.0＋RExt−4.1"，JCTVC−O0218，Oct2013 Ｃ．Pang，Ｊ．Sole，Ｌ．Guo，Ｍ．Karczewicz，and Ｒ．Joshi，"Non−RCE3：Intra Motion Compensation with 2−D MVs"，JCTVC−N0256，July2013 B．Bross，Ｗ−Ｊ．Han，G．Ｊ．Sullivan，Ｊ−Ｒ．Ohm，T．Wiegand，"High Efficiency Video Coding （HEVC） Text Specification Draft 10"，JCTVC−L1003．Jan2013 G．Ｊ．Sullivan and T．Wiegand，Rate−distortion optimization for video compression． IEEE Signal Processing Magazine，vol．15，issue 6，November1998 T．Vermeir，"Use cases and requirements for lossless and screen content coding"， JCTVC−M0172，Apr．2013，Incheon，KR Ｊ．Sole，Ｒ．Joshi，Ｍ．Karczewicz，"AhG8：Requirements for wireless display applications"，JCTVC−M0315，Apr.2013，Incheon，KR D．Flynn，M．Naccari，K．Sharman，C．Rosewarne，Ｊ．Sole，Ｇ．Ｊ．Sullivan，Ｔ．Suzuki，"HEVC Range Extension Draft 6"，JCTVC−P1005，Jan．2014，San Jose Ｊ．Sole，Ｓ．Liu，"HEVC Screen Content Coding Core Experiment 1 （SCCE１）:Intra Block Copying Extensions"，JCTVC−Q 1121，Mar 2014，Valencia Ｃ．−Ｃ．Chen，Ｘ．Xu，Ｌ．Zhang，"HEVC Screen Content Coding Core Experiment 2 （SCCE２）: Line-based Intra Copy"，JCTVC−Q1122，Mar 2014，Valencia Y.-W．Huang, P. Onno，R. Joshi, R. Cohen，X. Xiu, Z. Ma,"HEVC Screen Content Coding Core Experiment 3 (SCCE3):Palette mode",JCTVC−Q1123,Mar．2014,Valencia Ｙ．Chen，Ｊ．Xu，"HEVC Screen Content Coding Core Experiment 4（SCCE4）： String matching for sample coding"，JCTVC−Q1124，Mar 2014，Valencia X．Xiu, J. Chen,"HEVC Screen Content Coding Core Experiment 5:Inter-component prediction and adaptive color transforms", JCTVC−Q1125, Mar 2014,Valencia P．Onno，G．Laroche，Ｔ．Poirier，C．Gisquet，"AhG5：On the displacement vector prediction scheme for Intra Block Copy"，JCTVC−Q0062，Mar 2014，Valencia X．Zhang，K．Zhang，Ｊ．Ａｎ，H．Huang，S．Lei，"Block vector prediction for intra block copy"，JCTVC−Q0080，Mar 2014，Valencia K．Zhang，Ｊ．Ａｎ，X．Zhang，Ｈ．Huang，S．Lei，"Symmetric intra block copy"，JCTVC−Q0082，Mar 2014，Valencia S．−Ｔ．Hsiang，T．−Ｄ．Chuang，S．Lei，"AHG8；Coding the prediction differences of the intra BC vectors"，JCTVC−Q0095，Mar 2014，Valencia C．Pang,Ｊ．Sole，Ｒ．JoshiＭ．Karczewicz，"Block vector prediction method for intra block copｙ"，JCTVC−Q0114，Mar 2014，Valencia L．Zhu，Ｊ．Xu，G．J．Sullivan，Ｙ．Wu，S．Sankuratri，B．A．Kumar，"Ping− pong block vector predictor for intra block copy"，JCTVC−Q0134，Mar 2014，Valencia B．Li，Ｊ．Xu，"Hash−based intraBC search"，JCTVC−Q0252，Mar．2014，Valencia C．Pang，Ｊ．Sole，Ｔ．Hsieh，M．Karczewicz，"Intra block copy with larger search region"，JCTVC−Q0139，Mar 2014，Valencia R．Joshi，Ｊ．Xu，R．Cohen，Ｓ．Liu，Z．Ma，Y．Ye，"Screen content coding test model 1 （SCM 1）"，JCTVC−Q1014，Mar 2014，Valencia

既存のビデオ圧縮方法を使用して、スクリーンコンテンツをエンコードし、その後、そのコンテンツを受信機側に送信することができるが、ほとんどの既存の方法は、スクリーンコンテンツの特性に対応しておらず、したがって、低い圧縮性能をもたらす。従来のビデオ符号化技術を使用するスクリーンコンテンツの再構成は、しばしば深刻な品質問題をもたらす。例えば、曲線およびテキストが、不鮮明になり、認識するのが困難なことがある。したがって、スクリーンコンテンツを効率的に再構成するための、良好に設計されたスクリーンコンテンツ圧縮方法が、望ましい。

いくつかの例示的な実施形態では、入力ビデオブロックを含むビデオをエンコードしたビットストリームを生成するための方法が、提供される。エンコーダは、少なくとも、入力ビデオブロックの予測のための第１の候補ブロックベクトル（ＢＶ）を識別し、第１の候補ブロックベクトルは、第１の候補ブロックを指し示す（ｐｏｉｎｔ）。エンコーダは、次に、第１の候補ブロックをエンコードするために使用される第１の予測ベクトル（例えば、ブロックベクトルまたは動きベクトル）を識別する。第１の候補ブロックベクトルおよび第１の予測ベクトルから、エンコーダは、導出された予測ベクトル（例えば、導出されたブロックベクトルまたは導出された動きベクトル）を生成する。エンコーダは、次に、入力ビデオブロックの予測のための導出された予測ベクトルを使用して、ビデオブロックをビットストリームにエンコードする。

いくつかの実施形態では、エンコーダは、導出された予測ベクトルをビットストリームで伝達する。いくつかの実施形態では、エンコーダは、第１の予測ベクトルをビットストリームで伝達し、入力ビデオブロックが第１の予測ベクトルから導出された導出された予測ベクトルを使用してエンコードされたことを示すフラグもビットストリームで伝達する。

いくつかの実施形態では、エンコーダは、マージ候補リスト内の導出された予測ベクトルを識別するインデックスをビットストリームで伝達する。

導出された予測ベクトルは、第１の候補ブロックベクトルと第１の予測ベクトルとを合算することによって生成することができる。そのような実施形態では、第１の予測ベクトルが第２のブロックベクトルである場合、導出された予測ベクトルは、第１の候補ブロックベクトルと第２のブロックベクトル（第１の予測ベクトル）とを合算することによって生成されるブロックベクトルとすることができる。第１の予測ベクトルが動きベクトルである場合、導出された予測ベクトルは、式
ＭＶｄ＝ＢＶ０＋（（ＭＶ１＋２）＞＞２）
に従って、第１の候補ブロックベクトルと第１の動きベクトルとを合算することによって生成される動きベクトルとすることができ、ここで、ＢＶ０は、第１の候補ブロックベクトルであり、ＭＶ１は、第１の動きベクトルであり、ＭＶｄは、導出された動きベクトルである。

いくつかの例示的な実施形態では、導出された予測ベクトル（ブロックベクトルまたは動きベクトル）は、マージ候補として使用される。例示的な方法では、エンコーダは、少なくとも、入力ビデオブロックのエンコーディングのための第１のブロックベクトルマージ候補を識別し、エンコーダは、第１の候補ブロックをエンコードするために使用される第１の予測ベクトルを識別する。エンコーダは、次に、第１のブロックベクトルマージ候補および第１の予測ベクトルから、導出された予測ベクトル（導出されたブロックベクトルまたは導出された動きベクトル）を生成する。導出された予測ベクトルは、マージ候補リストに挿入される。マージ候補リストから、エンコーダは、入力ビデオブロックの予測のための選択された予測ベクトルを選択する。エンコーダは、次に、入力ビデオブロックの予測のための選択された予測ベクトルを使用して、入力ビデオブロックをビットストリームにエンコードする。選択された予測ベクトルは、導出された予測ベクトルとすることができる。

いくつかのそのような実施形態では、エンコーダは、導出された予測ベクトルを生成し、挿入する前に、マージ候補リストが満杯であるかどうかを決定する。導出された予測ベクトルを生成し、マージ候補リストに挿入するステップは、マージ候補リストが満杯ではないという決定が行われた後にだけ、実行される。

いくつかのそのような実施形態では、エンコーダは、先にエンコードされたビデオブロックの探索を行うことによって、第１の候補ブロックベクトルを識別する。

符号化されたビデオブロックをビットストリームからデコードする例示的な方法では、デコーダは、少なくとも、入力ビデオブロックの予測のための第１の候補ブロックベクトルを識別し、第１の候補ブロックベクトルは、第１の候補ブロックを指し示す（ｐｏｉｎｔ）。デコーダは、第１の候補ブロックをエンコードするために使用された第１の予測ベクトルを識別する。デコーダは、次に、第１のブロックベクトルおよび第１の予測ベクトルから導出された予測ベクトルを生成し、符号化されたビデオブロックの予測のための導出された予測ベクトルを使用して、符号化されたビデオブロックをデコードする。

そのような実施形態では、第１の候補ブロックベクトルは、様々な異なる技法を使用して、識別することができる。１つのそのような方法では、第１の候補ブロックベクトルは、ビットストリームで伝達され、第１の候補ブロックベクトルの識別は、ビットストリームで伝達された第１の候補ブロックベクトルを受信することを含む。そのような方法では、導出された予測ベクトルの生成は、入力ビデオブロックが導出された予測ベクトルを用いてエンコードされたことを示すフラグをビットストリームで受信したことに応答して、実行することができる。別のそのような方法では、第１の候補ブロックベクトルの識別は、第１のブロックベクトルマージ候補の識別を含む。そのような実施形態では、導出された予測ベクトルは、マージ候補とすることもできる。デコーダは、導出された予測ベクトルマージ候補を識別するインデックスをビットストリームで受信したことに応答して、導出された予測ベクトルを使用して、符号化されたビデオブロックをデコードすることができる。

図１は、ブロックベースビデオエンコーダの例を示すブロック図である。図２は、ブロックベースビデオデコーダの例を示すブロック図である。図３は、８個の方向予測モードの例の図である。図４は、３３個の方向予測モードおよび２個の無方向予測モードの例を示す図である。図５は、水平予測の例の図である。図６は、平面モードの例の図である。図７は、動き予測の例を示す図である。図８は、ピクチャ内におけるブロックレベルの動きの例を示す図である。図９は、符号化されたビットストリーム構造の例を示す図である。図１０は、例示的な通信システムを示す図である。図１１は、例示的な無線送受信ユニット（ＷＴＲＵ）を示す図である。図１２は、例示的なスクリーンコンテンツ共用システムを示す図である。図１３は、フルフレームイントラブロックコピーモードの例を示す図である。図１４は、局所領域イントラブロックコピーモードの例を示す図である。図１５は、イントラブロックコピーマージのための空間的候補の２つの例を示す図である。図１６は、例示的なブロックベクトル導出を示す図である。図１７は、例示的な動きベクトル導出を示す図である。図１８Ａは、図１８Ｂと併せて１つの例示的な方法のフローチャートである。図１８Ｂは、図１８Ａと併せて１つの例示的な方法のフローチャートである。

説明的な実施形態の詳細な説明が、様々な図を参照しながら、今から提供される。この説明は、可能な実施の詳細な例を提供するが、提供される詳細は、例としてのものであり、本出願の範囲を限定するものでは決してないことが意図されていることに留意されたい。

図１は、ブロックベースビデオエンコーダ、例えば、ハイブリッドビデオエンコーディングシステムの例を示すブロック図である。ビデオエンコーダ１００は、入力ビデオ信号１０２を受信することができる。入力ビデオ信号１０２は、ブロックごとに処理することができる。ビデオブロックは、任意のサイズとすることができる。例えば、ビデオブロックユニットは、１６×１６ピクセルを含むことができる。１６×１６ピクセルのビデオブロックユニットは、マクロブロック（ＭＢ）と呼ばれることがある。高効率ビデオ符号化（ＨＥＶＣ）では、高解像度（例えば、１０８０ｐ以上）ビデオ信号を効率的に圧縮するために、拡張されたブロックサイズ（例えば、それは符号化ツリーユニット（ＣＴＵ）または符号化ユニット（ＣＵ）と呼ばれることがあり、２つの用語は、本開示の目的では等価である）を使用することができる。ＨＥＶＣでは、ＣＵは、最大で６４×６４ピクセルとすることができる。ＣＵは、予測ユニット（ＰＵ）に分割することができ、それらに対しては、別々の予測方法を適用することができる。

入力ビデオブロック（例えば、ＭＢまたはＣＵ）に対して、空間的予測１６０および／または時間的予測１６２を実行することができる。空間的予測（例えば、「イントラ予測」）は、同じビデオピクチャ／スライス内のすでに符号化された近隣ブロックからのピクセルを使用して、現在のビデオブロックを予測することができる。空間的予測は、ビデオ信号に内在する空間冗長性を低減させることができる。時間的予測（例えば、「インター予測」または「動き補償予測」）は、（例えば、「参照ピクチャ」と呼ばれることがある）すでに符号化されたビデオピクチャからのピクセルを使用して、現在のビデオブロックを予測することができる。時間的予測は、ビデオ信号に内在する時間冗長性を低減させることができる。ビデオブロックのための時間的予測信号は、１または複数の動きベクトルによって伝達することができ、それらは、現在のブロックと参照ピクチャ内のそれの予測ブロックとの間の動きの量および／または方向を示すことができる。複数の参照ピクチャがサポートされる場合（例えば、Ｈ．２６４／ＡＶＣおよび／またはＨＥＶＣがそれに当てはまることがある）、ビデオブロックについて、それの参照ピクチャインデックスを送信することができる。参照ピクチャインデックスは、時間的予測信号が参照ピクチャストア１６４内のどの参照ピクチャから来るかを識別するために、使用することができる。

エンコーダ内のモード決定ブロック１８０は、例えば、空間的予測および／または時間的予測の後、予測モードを選択することができる。１１６において、現在のビデオブロックから予測ブロックを減算することができる。予測残差を変換（１０４）し、および／または量子化（１０６）することができる。量子化された残差係数を逆量子化（１１０）し、および／または逆変換（１１２）して、再構成された残差を形成することができ、それを予測ブロック１２６に加算し戻して、再構成されたビデオブロックを形成することができる。

インループフィルタリング（例えば、デブロッキングフィルタ、サンプル適応オフセット、および／または適応ループフィルタなど）を、再構成されたビデオブロックに適用することができ（１６６）、その後、それは、参照ピクチャストア１６４に入れられ、かつ／または将来のビデオブロックを符号化するために使用される。ビデオエンコーダ１００は、出力ビデオストリーム１２０を出力することができる。出力ビデオストリーム１２０を形成するために、符号化モード（例えば、インター予測モードまたはイントラ予測モード）、予測モード情報、動き情報、および／または量子化された残差係数が、エントロピ符号化ユニット１０８に送られて、圧縮および／またはパックが行われ、ビットストリームを形成することができる。参照ピクチャストア１６４は、デコード済みピクチャバッファ（ＤＰＢ）と呼ばれることがある。

図２は、ブロックベースビデオデコーダの例を示すブロック図である。ビデオデコーダ２００は、ビデオビットストリーム２０２を受信することができる。ビデオビットストリーム２０２は、エントロピ復号化ユニット２０８において、アンパックし、および／またはエントロピデコードすることができる。ビデオビットストリームをエンコードするために使用された符号化モードおよび／または予測情報は、（例えば、イントラ符号化された場合は）空間的予測ユニット２６０、および／または（例えば、インターコーディングされた場合は）時間的予測ユニット２６２に送られて、予測ブロックを形成することができる。インターコーディングされた場合、予測情報は、予測ブロックサイズ、（例えば、動きの方向および量を示すことができる）１もしくは複数の動きベクトル、ならびに／または（例えば、どの参照ピクチャから予測信号を獲得すべきかを示すことができる）１もしくは複数の参照インデックスを含むことができる。動き補償予測は、時間的予測ユニット２６２によって適用されて、時間的予測ブロックを形成することができる。

残差変換係数は、逆量子化ユニット２１０および逆変換ユニット２１２に送られて、残差ブロックを再構成することができる。予測ブロックおよび残差ブロックは、２２６において、合算することができる。再構成されたブロックは、インループフィルタリング２６６を通過することができ、その後、それは、参照ピクチャストア２６４内に記憶される。参照ピクチャストア２６４内の再構成されたビデオは、表示デバイスを駆動するために使用することができ、かつ／または将来のビデオブロックを予測するために使用することができる。ビデオデコーダ２００は、再構成されたビデオ信号２２０を出力することができる。参照ピクチャストア２６４は、デコード済みピクチャバッファ（ＤＰＢ）と呼ばれることがある。

ビデオエンコーダおよび／またはデコーダ（例えば、ビデオエンコーダ１００またはビデオデコーダ２００）は、（例えば、イントラ予測と呼ばれることがある）空間的予測を実行することができる。空間的予測は、複数の予測方向の１つに従って、すでに符号化された近隣ピクチャから予測することによって、実行することができる（例えば、それは方向イントラ予測と呼ばれることがある）。

図３は、８個の方向予測モードの例の図である。図３の８個の方向予測モードは、Ｈ．２６４／ＡＶＣにおいてサポートすることができる。図３の３００において全体的に示されるように、（ＤＣモード２を含む）９個のモードは、以下の通りである。
●モード０：垂直予測
●モード１：水平予測
●モード２：ＤＣ予測
●モード３：対角線下−左予測
●モード４：対角線下−右予測
●モード５：垂直−右予測
●モード６：水平−下予測
●モード７：垂直−左予測
●モード８：水平−上予測

空間的予測は、様々なサイズおよび／または形状のビデオブロック上で実行することができる。ビデオ信号のルーマ成分の空間的予測は、（例えば、Ｈ．２６４／ＡＶＣでは）例えば、４×４、８×８、および１６×１６ピクセルのブロックサイズに対して、実行することができる。ビデオ信号のクロマ成分の空間的予測は、（例えば、Ｈ．２６４／ＡＶＣでは）例えば、８×８のブロックサイズに対して、実行することができる。サイズ４×４または８×８のルーマブロックの場合、（例えば、Ｈ．２６４／ＡＶＣでは）９個の予測モードのすべてを、例えば、８個の方向予測モードおよびＤＣモードをサポートすることができる。サイズ１６×１６のルーマブロックの場合、４個の予測モードを、例えば、水平、垂直、ＤＣ、および平面予測をサポートすることができる。

さらに、方向イントラ予測モードおよび無方向予測モードをサポートすることができる。

図４は、３３個の方向予測モードおよび２個の無方向予測モードの例を示す図である。図４の４００において全体的に示されるような、３３個の方向予測モードおよび２個の無方向予測モードを、ＨＥＶＣによってサポートすることができる。より大きいブロックサイズを使用する空間的予測をサポートすることができる。例えば、空間的予測は、任意のサイズ、例えば、４×４、８×８、１６×１６、３２×３２、または６４×６４の正方形ブロックサイズのブロック上で、実行することができる。（例えば、ＨＥＶＣでは）方向イントラ予測を、１／３２ピクセル精度で実行することができる。

（例えば、Ｈ．２６４／ＡＶＣでは）方向イントラ予測に加えて、例えば、無方向イントラ予測モードをサポートすることができる。無方向イントラ予測モードは、ＤＣモードおよび／または平面モードを含むことができる。ＤＣモードの場合、予測値は、利用可能な近隣ピクセルを平均することによって、獲得することができ、予測値は、ブロック全体に一様に適用することができる。平面モードの場合、線形補間を使用して、推移の遅い滑らかな領域を予測することができる。Ｈ．２６４／ＡＶＣは、１６×１６ルーマブロックおよびクロマブロックに対して、平面モードの使用を可能にすることができる。

エンコーダ（例えば、エンコーダ１００）は、（例えば、図１のブロック１８０において）モード決定を実行して、ビデオブロックのための最良の符号化モードを決定することができる。エンコーダが、（例えば、インター予測の代わりに）イントラ予測を適用すると決定した場合、エンコーダは、利用可能なモードのセットから、最適なイントラ予測モードを決定することができる。選択された方向イントラ予測は、入力ビデオブロックにおける任意のテクスチャ、エッジ、および／または構造についての指示に関する強いヒントを提供することができる。

図５は、図５の５００において全体として示されるような、（例えば、４×４ブロックについての）水平予測の例の図である。すでに再構成されたピクセルＰ０、Ｐ１、Ｐ２、およびＰ３（すなわち、影付きピクセル）を使用して、現在の４×４ビデオブロック内のピクセルを予測することができる。水平予測では、再構成されたピクセル、例えば、ピクセルＰ０、Ｐ１、Ｐ２、および／またはＰ３は、対応する行の方向に沿って水平に伝搬して、４×４ブロックを予測することができる。例えば、予測は、以下の式（１）に従って実行することができ、Ｌ（ｘ，ｙ）は、（ｘ，ｙ）において予測されるピクセルとすることができ、ｘ，ｙ＝０．．．３である。
Ｌ（ｘ，０）＝Ｐ０
Ｌ（ｘ，１）＝Ｐ１（１）
Ｌ（ｘ，２）＝Ｐ２
Ｌ（ｘ，３）＝Ｐ３

図６は、図６の６００において全体として示されるような、平面モードの例の図である。平面モードは、しかるべく実行することができ、すなわち、（Ｔによって示される）最上行の右端のピクセルは、右端の列のピクセルを予測するために、複製することができる。（Ｌによって示される）左端の列の一番下のピクセルは、最下行のピクセルを予測するために、複製することができる。（左ブロックに示されるような）水平方向における双線形補間を実行して、中央ピクセルの第１の予測Ｈ（ｘ，ｙ）を生成することができる。（例えば、右ブロックに示されるような）垂直方向における双線形補間を実行して、中央ピクセルの第２の予測Ｖ（ｘ，ｙ）を生成することができる。Ｌ（ｘ，ｙ）＝（（Ｈ（ｘ，ｙ）＋Ｖ（ｘ，ｙ））＞＞１）を使用して、水平予測と垂直予測との間の平均を実行することで、最終的な予測Ｌ（ｘ，ｙ）を獲得することができる。

図７および図８は、７００および８００において全体として示されるような、（例えば、図１の時間的予測ユニット１６２を使用する）ビデオブロックの動き予測の例を示す図である。図８は、ピクチャ内におけるブロックレベルの動きの例を示しており、例えば、参照ピクチャ「Ｒｅｆｐｉｃ０」、「Ｒｅｆｐｉｃ１」、および「Ｒｅｆｐｉｃ２」を含む、例示的なデコード済みピクチャバッファを示す図である。現在のピクチャ内のブロックＢ０、Ｂ１、およびＢ２は、それぞれ、参照ピクチャ「Ｒｅｆｐｉｃ０」、「Ｒｅｆｐｉｃ１」、および「Ｒｅｆｐｉｃ２」内のブロックから予測することができる。動き予測は、近隣ビデオフレームからのビデオブロックを使用して、現在のビデオブロックを予測することができる。動き予測は、時間相関を利用することができ、かつ／またはビデオ信号内に内在する時間冗長性を除去することができる。例えば、Ｈ．２６４／ＡＶＣおよびＨＥＶＣでは、時間的予測は、様々なサイズのビデオブロック上で実行することができる（例えば、ルーマ成分については、時間的予測ブロックサイズは、Ｈ．２６４／ＡＶＣでは、１６×１６から４×４まで、ＨＥＶＣでは、６４×６４から４×４まで変化することができる）。動きベクトルを（ｍｖｘ，ｍｖｙ）とすると、時間的予測は、式（２）によって提供されるように実行することができ、
Ｐ（ｘ，ｙ）＝ｒｅｆ（ｘ−ｍｖｘ，ｙ−ｍｖｙ）（２）
ここで、ｒｅｆ（ｘ，ｙ）は、参照ピクチャ内のロケーション（ｘ，ｙ）におけるピクセル値とすることができ、Ｐ（ｘ，ｙ）は、予測されたブロックとすることができる。ビデオ符号化システムは、分数ピクセル精度を有するインター予測をサポートすることができる。動きベクトル（ｍｖｘ，ｍｖｙ）が分数ピクセル値を有する場合、１または複数の補間フィルタを適用して、分数ピクセル位置におけるピクセル値を獲得することができる。ブロックベースビデオ符号化システムは、多仮説予測を使用して、時間的予測を改善することができ、例えば、その場合、異なる参照ピクチャからの数々の予測信号を組み合わせることによって、予測信号を形成することができる。例えば、Ｈ．２６４／ＡＶＣおよび／またはＨＥＶＣは、２つの予測信号を組み合わせることができる双予測を使用することができる。双予測は、各々が参照ピクチャからのものである、２つの予測信号を組み合わせて、以下の式（３）のように、予測を形成することができ、

ここで、Ｐ₀（ｘ，ｙ）およびＰ₁（ｘ，ｙ）は、それぞれ、第１および第２の予測ブロックとすることができる。式（３）に示されるように、２つの予測ブロックは、２つの参照ピクチャｒｅｆ₀（ｘ，ｙ）およびｒｅｆ₁（ｘ，ｙ）からの、それぞれ２つの動きベクトル（ｍｖｘ₀，ｍｖｙ₀）および（ｍｖｘ₁，ｍｖｙ₁）を用いる、動き補償予測を実行することによって、獲得することができる。（例えば、１１６において）予測ブロックＰ（ｘ，ｙ）をソースビデオブロックから減算して、予測残差ブロックを形成することができる。予測残差ブロックは、（例えば、変換ユニット１０４において）変換することができ、かつ／または（例えば、量子化ユニット１０６において）量子化することができる。量子化された残差変換係数ブロックは、エントロピ符号化ユニット（例えば、エントロピ符号化ユニット１０８）に送って、エントロピ符号化し、ビットレートを低減させることができる。エントロピ符号化された残差係数は、パックして、出力ビデオビットストリーム（例えば、ビットストリーム１２０）の一部を形成することができる。

シングルレイヤビデオエンコーダは、単一のビデオシーケンス入力を取得し、シングルレイヤデコーダに送信される単一の圧縮されたビットストリームを生成することができる。ビデオコーデックは、（例えば、衛星、ケーブル、および地上伝送チャネル上でのＴＶ信号の送信などの、しかし、それらに限定されない）デジタルビデオサービスのために設計することができる。ビデオ中心アプリケーションが異機種環境において展開される場合、ビデオ符号化規格の拡張として、マルチレイヤビデオ符号化技術を開発して、様々なアプリケーションを可能にすることができる。例えば、スケーラブルビデオ符号化および／またはマルチビュービデオ符号化などの、複数レイヤビデオ符号化技術は、２つ以上のビデオレイヤを扱うように設計することができ、その場合、各レイヤをデコードして、特定の空間解像度、時間解像度、忠実度、および／またはビューのビデオ信号を再構成することができる。シングルレイヤエンコーダおよびデコーダが、図１および図２を参照して説明されたが、本明細書で説明される概念は、例えば、マルチビューおよび／またはスケーラブルコーディング技術のための、複数レイヤエンコーダおよび／またはデコーダを利用することができる。

スケーラブルビデオ符号化は、異種ネットワーク上の異なる能力を有するデバイス上で動作するビデオアプリケーションについてのエクスペリエンスの質を改善することができる。スケーラブルビデオ符号化は、最も高い表現（例えば、時間的解像度、空間的解像度、品質など）において一度信号をエンコードすることができるが、クライアントデバイス上で動作するあるアプリケーションによって必要とされる特定のレートおよび表現に応じて、ビデオストリームのサブセットからの復号化を可能にすることができる。スケーラブルビデオ符号化は、非スケーラブルのソリューションと比較して、帯域幅および記憶を節約することができる。国際ビデオ規格、例えば、ＭＰＥＧ−２ビデオ、Ｈ．２６３、ＭＰＥＧ４ビジュアル、Ｈ．２６４などは、スケーラビリティのモードをサポートするツールおよび／またはプロファイルを有することができる。

表１は、異なるタイプのスケーラビリティの例を、それらをサポートすることができる対応する規格とともに提供している。ビット深度スケーラビリティおよび／またはクロマフォーマットスケーラビリティは、例えば、プロフェッショナル用のビデオアプリケーションによって主として使用されることがあるビデオフォーマット（例えば、８ビットビデオよりも高いもの、およびＹＵＶ４：２：０よりも高いクロマサンプリングフォーマット）に結び付けられる。アスペクト比スケーラビリティを提供することができる。

スケーラブルビデオ符号化は、ベースレイヤビットストリームを使用して、ビデオパラメータの第１のセットと関連付けられた、ビデオ品質の第１のレベルを提供することができる。スケーラブルビデオ符号化は、１または複数のエンハンスメントレイヤビットストリームを使用して、エンハンスされたパラメータの１または複数のセットと関連付けられた、より高い品質の１または複数のレベルを提供することができる。ビデオパラメータのセットは、空間的解像度、フレームレート、（例えば、ＳＮＲ、ＰＳＮＲ、ＶＱＭ、ビジュアル品質などの形態を取る）再構成されたビデオの品質、（例えば、２つ以上のビューを有する）３Ｄ能力、ルーマおよびクロマビット深度、クロマフォーマット、ならびに基礎をなすシングルレイヤ符号化規格のうちの１または複数を含むことができる。異なる使用事例は、例えば、表１に示されるような、異なるタイプのスケーラビリティを使用することができる。スケーラブル符号化アーキテクチャは、１または複数のスケーラビリティ（例えば、表１に列挙されたスケーラビリティ）をサポートするように構成することができる、共通の構造を提供することができる。スケーラブル符号化アーキテクチャは、最低限の構成労力で異なるスケーラビリティをサポートする、柔軟性を有することができる。スケーラブル符号化アーキテクチャは、符号化ロジック（例えば、エンコーディングおよび／または復号化ロジック）が、スケーラブル符号化システム内において最大限再使用することができるように、ブロックレベル動作に対する変更を必要としなくてよい、少なくとも１つの好ましい動作モードを含むことができる。例えば、ピクチャレベルのインターレイヤ処理および管理ユニットに基づいた、スケーラブル符号化アーキテクチャを提供することができ、ピクチャレベルにおいて、インターレイヤ予測を実行することができる。

図９は、符号化されたビットストリーム構造の例を示す図である。符号化されたビットストリーム１０００は、多数のＮＡＬ（ネットワークアブストラクションレイヤ）ユニット１００１から成る。ＮＡＬユニットは、符号化されたスライス１００６などの、符号化されたサンプルデータ、またはパラメータセットデータ、スライスヘッダデータ１００５、または（ＳＥＩメッセージと呼ばれることがある）補助エンハンスメント情報データ１００７などの、高レベルシンタックスメタデータを含むことができる。パラメータセットは、（例えば、ビデオパラメータセット１００２（ＶＰＳ）は）複数のビットストリームレイヤに適用することができ、または（例えば、シーケンスパラメータセット１００３（ＳＰＳ）は）１つのレイヤ内の符号化されたビデオシーケンスに適用することができ、または（例えば、ピクチャパラメータセット１００４（ＰＰＳ）は）１つの符号化されたビデオシーケンス内の多数の符号化されたピクチャに適用することができる、必須シンタックス要素を含む、高レベルシンタックス構造である。パラメータセットは、ビデオビットストリームの符号化されたピクチャと一緒に送信することができ、または（信頼できるチャネルを使用するアウトオブバンド送信、ハードコーディングなどを含む）他の手段を通して送信することができる。スライスヘッダ１００５も、相対的に小さい、またはあるスライスもしくはピクチャタイプにだけ関連する、何らかのピクチャ関連情報を含むことができる、高レベルシンタックス構造である。ＳＥＩメッセージ１００７は、復号化プロセスによって必要とされないことがあるが、ピクチャ出力タイミングまたは表示、ならびにロス検出および隠蔽など、様々な他の目的のために使用することができる情報を搬送する。

図１０は、通信システムの例を示す図である。通信システム１３００は、エンコーダ１３０２と、通信ネットワーク１３０４と、デコーダ１３０６とを備えることができる。エンコーダ１３０２は、有線接続または無線接続とすることができる接続１３０８を介して、通信ネットワーク１３０４と通信することができる。エンコーダ１３０２は、図１のブロックベースビデオエンコーダに類似したものとすることができる。エンコーダ１３０２は、シングルレイヤコーデック（例えば、図１）またはマルチレイヤコーデックを含むことができる。例えば、エンコーダ１３０２は、ピクチャレベルのＩＬＰサポートを有するマルチレイヤ（例えば、２レイヤ）スケーラブル符号化システムとすることができる。デコーダ１３０６は、有線接続または無線接続とすることができる接続１３１０を介して、通信ネットワーク１３０４と通信することができる。デコーダ１３０６は、図２のブロックベースビデオデコーダに類似したものとすることができる。デコーダ１３０６は、シングルレイヤコーデック（例えば、図２）またはマルチレイヤコーデックを含むことができる。例えば、デコーダ１３０６は、ピクチャレベルのＩＬＰサポートを有するマルチレイヤ（例えば、２レイヤ）スケーラブル復号化システムとすることができる。

エンコーダ１３０２および／またはデコーダ１３０６は、デジタルテレビジョン、無線ブロードキャストシステム、ネットワーク要素／端末、コンテンツもしくはウェブサーバなどの（例えば、ハイパーテキスト転送プロトコル（ＨＴＴＰ）サーバなどの）サーバ、携帯情報端末（ＰＤＡ）、ラップトップもしくはデスクトップコンピュータ、タブレットコンピュータ、デジタルカメラ、デジタル記録デバイス、ビデオゲーミングデバイス、ビデオゲームコンソール、セルラもしくは衛星無線電話、および／またはデジタルメディアプレーヤなどの、しかし、それらに限定されない、多種多様な有線通信デバイスおよび／または無線送受信ユニット（ＷＴＲＵ）に組み込むことができる。

通信ネットワーク１３０４は、適切なタイプの通信ネットワークとすることができる。例えば、通信ネットワーク１３０４は、音声、データ、ビデオ、メッセージング、放送などのコンテンツを複数の無線ユーザに提供する、多元接続システムとすることができる。通信ネットワーク１３０４は、複数の無線ユーザが、無線帯域幅を含むシステムリソースの共用を通して、そのようなコンテンツにアクセスすることを可能にすることができる。例えば、通信ネットワーク１３０４は、符号分割多元接続（ＣＤＭＡ）、時分割多元接続（ＴＤＭＡ）、周波数分割多元接続（ＦＤＭＡ）、直交ＦＤＭＡ（ＯＦＤＭＡ）、および／またはシングルキャリアＦＤＭＡ（ＳＣ−ＦＤＭＡ）などの、１または複数のチャネルアクセス方法を利用することができる。通信ネットワーク１３０４は、複数の接続された通信ネットワークを含むことができる。通信ネットワーク１３０４は、インターネット、および／またはセルラネットワーク、ＷｉＦｉホットスポット、インターネットサービスプロバイダ（ＩＳＰ）ネットワークなどの１もしくは複数の私設商用ネットワークを含むことができる。

図１１は、例示的なＷＴＲＵのシステム図である。示されるように、ＷＴＲＵ１２０２は、プロセッサ１２１８、送受信機１２２０、送信／受信要素１２２２、スピーカ／マイクロフォン１２２４、キーパッドもしくはキーボード１２２６、ディスプレイ／タッチパッド１２２８、着脱不能メモリ１２３０、着脱可能メモリ１２３２、電源１２３４、全地球測位システム（ＧＰＳ）チップセット１２３６、および／または他の周辺機器１２３８を含むことができる。ＷＴＲＵ１０２は、実施形態との整合性を保ちながら、上記の要素の任意のサブコンビネーションを含むことができることが理解される。さらに、エンコーダ（例えば、エンコーダ１００）および／またはデコーダ（例えば、デコーダ２００）が組み込まれた端末は、図１１のＷＴＲＵ１２０２内に示され、図１１のＷＴＲＵ１２０２を参照して本明細書で説明される、要素のいくつかまたはすべてを含むことができる。

プロセッサ１２１８は、汎用プロセッサ、専用プロセッサ、従来型プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、グラフィックス処理ユニット（ＧＰＵ）、複数のマイクロプロセッサ、ＤＳＰコアと連携する１または複数のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）回路、他の任意のタイプの集積回路（ＩＣ）、状態機械などとすることができる。プロセッサ１２１８は、信号符号化、データ処理、電力制御、入力／出力処理、および／またはＷＴＲＵ１２０２が有線および／または無線環境で動作することを可能にする他の任意の機能を実行することができる。プロセッサ１２１８は、送受信機１２２０に結合することができ、送受信機１２２０は、送信／受信要素１２２２に結合することができる。図１１は、プロセッサ１２１８および送受信機１２２０を別々の構成要素として示しているが、プロセッサ１２１８および送受信機１２２０は、電子パッケージおよび／またはチップ内に一緒に統合することができることが理解される。

送信／受信要素１２２２は、エアインターフェース１２１５上で、別の端末に信号を送信し、かつ／または別の端末から信号を受信するように構成することができる。例えば、１または複数の実施形態では、送信／受信要素１２２２は、ＲＦ信号を送信および／または受信するように構成されたアンテナとすることができる。１または複数の実施形態では、送信／受信要素１２２２は、例えば、ＩＲ、ＵＶ、または可視光信号を送信および／または受信するように構成された放射器／検出器とすることができる。１または複数の実施形態では、送信／受信要素１２２２は、ＲＦ信号と光信号の両方を送信および／または受信するように構成することができる。送信／受信要素１２２２は、無線信号の任意の組み合わせを送信および／または受信するように構成することができることが理解される。

加えて、送信／受信要素１２２２は、図１１では単一の要素として示されているが、ＷＴＲＵ１２０２は、任意の数の送信／受信要素１２２２を含むことができる。より具体的には、ＷＴＲＵ１２０２は、ＭＩＭＯ技術を利用することができる。したがって、一実施形態では、ＷＴＲＵ１２０２は、エアインターフェース１２１５上で無線信号を送信および受信するための２つ以上の送信／受信要素１２２２（例えば、複数のアンテナ）を含むことができる。

送受信機１２２０は、送信／受信要素１２２２によって送信される信号を変調し、かつ／または送信／受信要素１２２２によって受信された信号を復調するように構成することができる。上で言及されたように、ＷＴＲＵ１２０２は、マルチモード機能を有することができる。したがって、送受信機１２２０は、ＷＴＲＵ１２０２が、例えば、ＵＴＲＡおよびＩＥＥＥ８０２．１１などの複数のＲＡＴを介して通信することを可能にするための、複数の送受信機を含むことができる。

ＷＴＲＵ１２０２のプロセッサ１２１８は、スピーカ／マイクロフォン１２２４、キーパッド１２２６、および／またはディスプレイ／タッチパッド１２２８（例えば、液晶表示（ＬＣＤ）ディスプレイユニットまたは有機発光ダイオード（ＯＬＥＤ）ディスプレイユニット）に結合することができ、それらからユーザ入力データを受信することができる。プロセッサ１２１８は、スピーカ／マイクロフォン１２２４、キーパッド１２２６、および／またはディスプレイ／タッチパッド１２２８にユーザデータを出力することもできる。加えて、プロセッサ１２１８は、着脱不能メモリ１２３０および／または着脱可能メモリ１２３２など、任意のタイプの適切なメモリから情報を入手することができ、かつそれらにデータを記憶することができる。着脱不能メモリ１２３０は、ランダムアクセスメモリ（ＲＡＭ）、リードオンリメモリ（ＲＯＭ）、ハードディスク、または他の任意のタイプのメモリ記憶デバイスを含むことができる。着脱可能メモリ１２３２は、加入者識別モジュール（ＳＩＭ）カード、メモリスティック、セキュアデジタル（ＳＤ）メモリカードなどを含むことができる。１または複数の実施形態では、プロセッサ１２１８は、ＷＴＲＵ１２０２上に物理的に配置されたメモリではなく、サーバまたはホームコンピュータ（図示されず）上などに配置されたメモリから情報を入手することができ、それにデータを記憶することができる。

プロセッサ１２１８は、電源１２３４から電力を受け取ることができ、ＷＴＲＵ１２０２内の他の構成要素への電力の分配および／または制御を行うように構成することができる。電源１２３４は、ＷＴＲＵ１２０２に給電するための任意の適切なデバイスとすることができる。例えば、電源１２３４は、１または複数の乾電池（例えば、ニッケル−カドミウム（ＮｉＣｄ）、ニッケル−亜鉛（ＮｉＺｎ）、ニッケル水素（ＮｉＭＨ）、リチウムイオン（Ｌｉ−ｉｏｎ）など）、太陽電池、燃料電池などを含むことができる。

プロセッサ１２１８は、ＧＰＳチップセット１２３６に結合することができ、ＧＰＳチップセット１２３６は、ＷＴＲＵ１２０２の現在位置に関する位置情報（例えば、経度および緯度）を提供するように構成することができる。ＧＰＳチップセット１２３６からの情報に加えて、またはその代わりに、ＷＴＲＵ１２０２は、端末（例えば、基地局）からエアインターフェース１２１５上で位置情報を受信することができ、かつ／または２つ以上の近くの基地局から受信した信号のタイミングに基づいて、自らの位置を決定することができる。ＷＴＲＵ１２０２は、実施形態との整合性を保ちながら、任意の適切な位置決定方法を用いて、位置情報を獲得することができることが理解される。

プロセッサ１２１８は、他の周辺機器１２３８にさらに結合することができ、他の周辺機器１２３８は、追加的な特徴、機能、および／または有線もしくは無線接続性を提供する、１または複数のソフトウェアモジュールおよび／またはハードウェアモジュールを含むことができる。例えば、周辺機器１２３８は、加速度計、向きセンサ、動きセンサ、近接センサ、ｅコンパス、衛星送受信機、（写真またはビデオ用の）デジタルカメラおよび／またはビデオレコーダ、ユニバーサルシリアルバス（ＵＳＢ）ポート、バイブレーションデバイス、テレビ送受信機、ハンズフリーヘッドセット、Ｂｌｕｅｔｏｏｔｈ（登録商標）モジュール、周波数変調（ＦＭ）ラジオユニット、ならびにデジタル音楽プレーヤ、メディアプレーヤ、ビデオゲームプレーヤモジュール、インターネットブラウザなどのソフトウェアモジュールを含むことができる。

例として、ＷＴＲＵ１２０２は、無線信号を送信および／または受信するように構成することができ、ユーザ機器（ＵＥ）、移動局、固定もしくは移動加入者ユニット、ページャ、セルラ電話、携帯情報端末（ＰＤＡ）、スマートフォン、ラップトップ、ネットブック、タブレットコンピュータ、パーソナルコンピュータ、無線センサ、家電製品、または圧縮されたビデオ通信を受信および処理することが可能な他の任意の端末を含むことができる。

ＷＴＲＵ１２０２および／または通信ネットワーク（例えば、通信ネットワーク１３０４）は、広帯域ＣＤＭＡ（ＷＣＤＭＡ（登録商標））を使用してエアインターフェース１２１５を確立することができる、ユニバーサル移動体通信システム（ＵＭＴＳ）地上無線アクセス（ＵＴＲＡ）などの無線技術を実施することができる。ＷＣＤＭＡは、高速パケットアクセス（ＨＳＰＡ）および／または進化型ＨＳＰＡ（ＨＳＰＡ＋）などの通信プロトコルを含むことができる。ＨＳＰＡは、高速ダウンリンクパケットアクセス（ＨＳＤＰＡ）および／または高速アップリンクパケットアクセス（ＨＳＵＰＡ）を含むことができる。ＷＴＲＵ１２０２および／または通信ネットワーク（例えば、通信ネットワーク１３０４）は、ロングタームエボリューション（ＬＴＥ）および／またはＬＴＥアドバンスト（ＬＴＥ−Ａ）を使用してエアインターフェース１２１５を確立することができる、進化型ＵＭＴＳ地上無線アクセス（Ｅ−ＵＴＲＡ）などの無線技術を実施することができる。

ＷＴＲＵ１２０２および／または通信ネットワーク（例えば、通信ネットワーク１３０４）は、ＩＥＥＥ８０２．１６（例えば、マイクロ波アクセス用の世界的相互運用性（ＷｉＭＡＸ））、ＣＤＭＡ２０００、ＣＤＭＡ２０００１Ｘ、ＣＤＭＡ２０００ＥＶ−ＤＯ、暫定標準２０００（ＩＳ−２０００）、暫定標準９５（ＩＳ−９５）、暫定標準８５６（ＩＳ−８５６）、移動体通信用グローバルシステム（ＧＳＭ（登録商標））、ＧＳＭエボリューション用の高速データレート（ＥＤＧＥ）、ＧＳＭＥＤＧＥ（ＧＥＲＡＮ）などの無線技術を実施することができる。ＷＴＲＵ１２０２および／または通信ネットワーク（例えば、通信ネットワーク１３０４）は、ＩＥＥＥ８０２．１１、ＩＥＥＥ８０２．１５などの無線技術を実施することができる。

図１２は、例示的な２方向スクリーンコンテンツ共用システム１６００を示す図である。図は、キャプチャラ１６０２と、エンコーダ１６０４と、送信機１６０６とを含む、ホストサブシステムを示している。図１２は、（受信された入力ビットストリーム１６１０を出力する）受信機１６０８と、デコーダ１６１２と、ディスプレイ（レンダラ）１６１８とを含む、クライアントサブシステムをさらに示している。デコーダ１６１２は、表示ピクチャバッファ１６１４に出力し、それが、今度は、デコードされたピクチャ１６１６をディスプレイ１６１８に送信する。スクリーンコンテンツコーディング（ＳＣＣ）については、業界からのアプリケーション要件が存在する。非特許文献１２、１３を参照されたい。ますます多くの人々が、メディアプレゼンテーションまたはリモートデスクトップ目的で、デバイスコンテンツを共有するようになっているので、スクリーンコンテンツ圧縮方法は、ある特定のアプリケーションのために重要になってきている。モバイルデバイスのスクリーンディスプレイは、高精細度または超高精細度をサポートするように大幅に改善された。従来のビデオ符号化方法は、スクリーン共有アプリケーションにおいてスクリーンコンテンツを送信するための帯域幅要件を増加させる。

上で説明されたように、図２は、図１のエンコーダなどのエンコーダによって生成されたビデオビットストリームを受信し、表示されるビデオ信号を再構成する、汎用ブロックベースシングルレイヤデコーダのブロック図である。やはり上で説明されたように、ビデオデコーダにおいて、ビットストリームは、最初にエントロピデコーダによって解析される。残差係数は、逆量子化され、逆変換されて、再構成された残差を獲得する。空間的予測または時間的予測を使用して、予測信号を獲得するために、符号化モードおよび予測情報が、使用される。予測信号および再構成された残差は、合算されて、再構成されたビデオを取得する。再構成されたビデオは、ループフィルタリングをさらに通過し、その後、参照ピクチャストア内に記憶されてから、表示すること、および／または将来のビデオ信号をデコードするために使用することができる。図１に示されるように、効率的な圧縮を達成するために、シングルレイヤエンコーダは、（イントラ予測とも呼ばれる）空間的予測および（インター予測および／または動き補償予測とも呼ばれる）時間的予測など、広く知られた技法を利用して、入力ビデオ信号を予測する。エンコーダは、レートおよび歪みといった検討事項の組み合わせなど、ある基準に通常は基づいて、最も適切な予測の形態を選択する、モード決定ロジックも有する。非特許文献１１を参照されたい。エンコーダは、その後、予測残差（入力信号と予測信号との間の差信号）を変換し、量子化する。量子化された残差は、モード情報（例えば、イントラまたはインター予測）、および予測情報（動きベクトル、参照ピクチャインデックス、イントラ予測モードなど）と一緒に、エントロピコーダにおいてさらに圧縮され、出力ビデオビットストリーム内にパックされる。図１に示されるように、エンコーダは、量子化された残差に逆量子化および逆変換を適用して、再構成された残差を獲得し、それを予測信号に加算し戻すことによって、再構成されたビデオ信号も生成する。再構成されたビデオ信号は、ループフィルタプロセス（例えば、デブロッキングフィルタ、サンプル適応オフセット、または適応ループフィルタ）をさらに通過し、最終的に参照ピクチャストア内に記憶されて、将来のビデオ信号を予測するために使用することができる。

送信帯域幅および記憶を節約するために、ＭＰＥＧは、多年にわたって、ビデオ符号化規格に取り組んできた。高効率ビデオ符号化（ＨＥＶＣ）（非特許文献１３を参照されたい）は、新たに出現したビデオ圧縮規格である。ＨＥＶＣは、現在、ＩＴＵ−Ｔビデオコーディングエキスパーツグループ（ＶＣＥＧ）およびＩＳＯ／ＩＥＣムービングピクチャエキスパーツグループ（ＭＰＥＧ）によって一緒に共同開発されている。それは、Ｈ．２６４と比較して、品質は同じままで、帯域幅を５０％節約することができる。ＨＥＶＣは、それのエンコーダおよびデコーダが、図１および図２に関連して上で説明された方法に従って概ね動作するという点で、依然として、ブロックベースハイブリッドビデオ符号化規格である。ＨＥＶＣは、より大きいビデオブロックの使用を可能にし、それは、四分木分割を使用して、ブロック符号化情報を伝達する。ピクチャまたはスライスは、最初に、同じサイズ（例えば、６４×６４）を有する、符号化ツリーブロック（ＣＴＢ）に分割される。各ＣＴＢは、四分木を用いて、ＣＵに分割され、各ＣＵは、やはり四分木を使用して、予測ユニット（ＰＵ）と変換ユニット（ＴＵ）とにさらに分割される。インター符号化されたＣＵごとに、それのＰＵは、図３に関連して示され、説明されたような、８つの分割モードのうちの１つとすることができる。動き補償とも呼ばれる時間的予測が、適用されて、インター符号化されたすべてのＰＵを再構成する。（ＨＥＶＣでは１／４ピクセルまでとすることができる）動きベクトルの精度に応じて、線形フィルタが、適用されて、分数位置におけるピクセル値を獲得する。ＨＥＶＣでは、補間フィルタは、ルーマについては７または８つのタップ、クロマについては４つのタップを有する。ＨＥＶＣにおけるデブロッキングフィルタは、コンテンツベースであり、符号化モードの違い、動きの違い、参照ピクチャの違い、ピクセル値の違いなど、数々の要因に応じて、異なるデブロッキングフィルタ操作が、ＴＵおよびＰＵ境界において適用される。エントロピ符号化について、ＨＥＶＣは、高レベルパラメータを除く、ほとんどのブロックレベルシンタックス要素のために、コンテキストベース適応算術２値コーディング（ＣＡＢＡＣ）を採用する。ＣＡＢＡＣコーディングには、２種類のビンが存在し、一方は、コンテキストベースで符号化される通常のビンであり、他方は、コンテキストを用いずに、バイパスコーディングされるビンである。

現在のＨＥＶＣ設計は、様々なブロック符号化モードを含むが、それは、スクリーンコンテンツ符号化のために、空間的冗長性を十分には利用していない。これは、ＨＥＶＣが、４：２：０フォーマットの連続トーンビデオコンテンツに重点を置いており、モード決定および変換符号化ツールは、４：４：４ビデオのフォーマットでしばしばキャプチャされる、離散トーンスクリーンコンテンツに対して最適化されていないためである。ＨＥＶＣ規格が、２０１２年終盤に成熟し、安定化し始めたときに、規格化組織ＶＣＥＧおよびＭＰＥＧは、スクリーンコンテンツ符号化のためのＨＥＶＣの将来の拡張に取り組み始めた。２０１４年１月に、スクリーンコンテンツ符号化についての提案の呼び掛け（ＣＦＰ）が、ＩＴＵ−ＴＶＣＥＧおよびＩＳＯ／ＩＥＣＭＰＥＧによって共同で公表された。ＣＦＰは、かなりの量の注目を集め、様々な効率的なＳＣＣソリューションを提案する様々な異なる会社から７つの応答（非特許文献２〜８）を得た。テキストおよびグラフィックスなどのスクリーンコンテンツ素材が、自然なビデオコンテンツと比較して、異なる特性を示すことを考慮して、スクリーンコンテンツ符号化の符号化効率を改善するいくつかの新規な符号化ツールが、例えば、ＩＤストリングコピー（非特許文献９）、パレットコーディング（非特許文献１０、１１）、およびイントラブロックコピー（ＩｎｔｒａＢＣ）（非特許文献１２、１７）が、提案された。それらすべてのスクリーンコンテンツコーディング関連のツールは、中核的な実験（非特許文献１８〜２２）において調査された。スクリーンコンテンツは、線分またはブロック、および多くの小さい均質な領域（例えば、単色領域）に関して、高度に反復的なパターンを有する。通常、小さいブロック内には、わずか数色が存在するだけである。対照的に、自然なビデオの場合、小さいブロック内でさえも、多くの色が存在する。各位置における色値は、通常、それの上側または水平近隣ピクセルから反復される。ＩＤストリングコピーは、先行する再構成されたピクセルバッファから、可変長のストリングを予測することを含む。位置およびストリング長が、伝達される。パレット符号化モードでは、ピクセル値を直接的に符号化する代わりに、それらの主要色を記録するためのディクショナリとして、パレットテーブルが使用される。符号化ブロック内の各ピクセルの色値を表すために、対応するパレットインデックスマップが使用される。さらに、「ラン」値を使用して、同じ主要色（すなわち、パレットインデックス）を有する連続するピクセルの長さを示すことで、空間的冗長性を低減させる。パレット符号化は、通常、わずかな色しか含まない大きいブロックに対して良好である。イントラブロックコピーは、再構成されたピクセルを使用して、同じピクチャ内の現在の符号化ブロックを予測することを含み、ブロックベクトルと呼ばれる変位情報が、符号化される。

図１３は、フルフレームイントラブロックコピーモードの例を示す図である。複雑さおよび帯域幅アクセスを考慮して、ＨＥＶＣでは、スクリーンコンテンツ符号化拡張参照ソフトウェア（ＳＣＭ−１．０）（非特許文献３１）は、イントラブロックコピーモードのための２つの構成を有する。１つは、フルフレームイントラブロックコピーモードであり、図１３の１７００において全体として示されるように、すべての再構成されたピクセルを、予測のために使用することができる。ブロックベクトル探索の複雑さを低減させるために、ハッシュベースイントラブロックコピー探索が提案された（非特許文献２９、３０）。もう１つは、局所領域イントラブロックコピーモードであり、それが、次に説明される。

図１４は、１８００において全体として示されるような、局所領域イントラブロックコピーモードの例を示す図である。局所領域イントラブロックコピーモードが使用される場合、左側および現在の符号化ツリーユニット（ＣＴＵ）内の再構成されたピクセルだけが、参照として使用されることを許可される。

ＳＣＣと自然なビデオ符号化との間には、別の相違が存在する。自然なビデオ符号化の場合、符号化歪みは、ピクチャ全体に分散する。しかしながら、スクリーンコンテンツの場合、エラーは、通常、強いエッジの周囲に局所化され、それが、ピクチャ全体ではＰＳＮＲ（ピーク信号対雑音比）がきわめて高い場合であっても、アーチファクトをより目立つようにする。したがって、スクリーンコンテンツは、主観的な品質の観点からは、エンコードするのがより困難である。

イントラブロックコピーモードの使用は、ブロックベクトルのシグナリングを必要とする。フルフレームイントラブロックコピー構成では、ブロックベクトルは、非常に大きいものであることができ、イントラブロックコピーモードのための高いオーバヘッドをもたらす。スクリーンコンテンツの場合、高度に反復的なパターンが存在するので、しばしば、１つのブロックは、複数の類似した対等物を見出すことができる。ブロックベクトル符号化効率を改善するために、様々な予測および符号化方法が提案された（非特許文献２３〜２８）。目下開示されているシステムおよび方法の実施形態は、ブロックベクトル導出を使用して、イントラブロックコピー符号化効率を改善する。本開示において議論および説明される変形の中には、（ｉ）イントラブロックコピーマージモードにおけるブロックベクトル導出、および（ｉｉ）明示的なブロックベクトルモードを用いるイントラブロックコピーにおけるブロックベクトル導出がある。

本開示には、イントラブロックコピー符号化のための変位情報導出方法の説明が含まれる。参照ブロックの符号化タイプに応じて、導出されたブロックベクトルまたは動きベクトルを、異なる方法で使用することができる。１つの方法は、導出されたＢＶを、ＩｎｔｒａＢＣマージモードにおけるマージ候補として使用することであり、このオプションは、以下の「イントラブロックコピーマージモード」と題されたサブセクションにおいて説明される。別の方法は、導出されたＢＶ／ＭＶを、通常のＩｎｔｒａＢＣ予測のために使用することであり、このオプションは、以下の「導出されたブロックベクトルを用いるイントラブロックコピーモード」と題されたサブセクションにおいて説明される。

図１６は、例示的なブロックベクトル導出を示す図である。ブロックベクトルを与えると、与えられたＢＶによって指し示される参照ブロックがＩｎｔｒａＢＣ符号化されたブロックである場合、第２のブロックベクトルを導出することができる。導出されるブロックベクトルは、式（４）で計算される。図１６は、２０００において全体的に、この種類のブロックベクトル導出を示している。
ＢＶｄ＝ＢＶ０＋ＢＶ１（４）

図１７は、例示的な動きベクトル導出を示す図である。与えられたＢＶによって指し示されるブロックが、インターコーディングされたブロックである場合、動きベクトルを導出することができる。図１７は、２１００において全体的に、ＭＶ導出のケースを示している。図１７のブロックＢ１が、単予測モードである場合、ブロックＢ０のための整数ピクセルにおける導出された動きＭＶｄは、
ＭＶｄ＝ＢＶ０＋（（ＭＶ１＋２）＞＞２）（５）
である。いくつかの実施形態では、１／４ピクセル解像度における導出された値ＭＶｄ＿ｑは、
ＭＶｄ＿ｑ＝（ＢＶ０＜＜２）＋ＭＶ１
として計算される。参照ピクチャは、Ｂ１のそれと同じである。ＨＥＶＣでは、通常の動きベクトルは、１／４ピクセル精度であり、ブロックベクトルは、整数精度である。導出された動きベクトルについての整数ピクセル動きが、ここでは例として使用される。ブロックＢ１が、双予測モードである場合、動きベクトル導出を実行するための２つの方法が存在する。１つは、２つの方向についての２つの動きベクトルを別々に導出し、参照インデックスを単予測モードと同じに導出することである。もう１つは、より小さい量子化パラメータ（より高い品質）を有する参照ピクチャから、動きベクトルを選択することである。両方の参照ピクチャが、同じ量子化パラメータを有する場合、ピクチャオーダオブカウント（ＰＯＣ）距離においてより近い参照ピクチャ（より高い相関）から、動きベクトルを選択することができる。以下の説明は、複雑さを低減させるために、双予測を単予測に変換する、第２の方法を使用する例を使用する。

イントラブロックコピーマージモード
図１５は、イントラブロックコピーマージのための空間的候補の２つの例を示す図である。ＨＥＶＣメインプロファイル（非特許文献１３）および範囲拡張（非特許文献１７）では、インターコーディングユニットマージモードは、動き情報を直接的に伝達しないが、インターマージ候補リストのインデックスをデコーダに伝達する。インターマージ候補リストは、エンコーダにおけるものと同じ決定論的な方法で構成される。動き情報は、インデックスを使用して候補リストから導出される。図１５の番号１９０２の例では、５つの空間的近隣ブロックおよび１つの時間的連結ブロックが存在する。インターモードで符号化されたそれらのブロックだけが、インターマージ候補リストに追加される。候補リストが、空間的および時間的近隣ブロックで満杯ではない場合、２つのリスト内の既存のマージ候補とゼロ動きとを組み合わせることによる双予測動きが、追加される。

イントラブロックコピーマージモードの場合、マージモードを適用する類似の方法が、実施される。ＢＶ情報は、明示的に符号化されないが、マージ候補インデックスが、符号化される。ＨＥＶＣＳＣＣ拡張（ＳＣＭ−１．０）（非特許文献３１）では、ＢＶは、最後に符号化されたＢＶをプレディクタとして使用する差分符号化を用いて、符号化される。ＢＶ候補リスト構成では、ＢＶプレディクタが、最初にチェックされる。ＢＶプレディクタが、現在のＣＵに対して有効である場合、それは、第１のマージ候補として追加される。その後、図１５の番号１９０２および１９０４の例では、５つの空間的ブロックが、チェックされ、それらの有効なＢＶが、（１）空間的近隣ブロックが、ＩｎｔｒａＢＣコーディングされ、したがって、ＢＶを有し、（２）ＢＶが、現在のＣＵに対して有効であり（例えば、ＢＶによって指し示される参照ブロックが、ピクチャ境界の外になく、すでに符号化されており）、および（３）ＢＶが、現在の候補リストにまだ出現していない場合、順番に追加される。マージ候補リストが、満杯ではない場合、ＢＶは、リスト内にすでにあるそれらの有効なＢＶを用いて導出される。一実施形態では、式（４）の導出されたブロックベクトルだけが、考慮され、式（５）の導出された動きベクトルは、考慮されず、そのような例では、候補リスト内のマージ候補のすべては、イントラブロックコピーモードに対応するブロックベクトルである。

複雑な設計の場合、式（５）からの導出された動きベクトルは、ブロックベクトルとミックスし、一緒にマージ候補に追加することができる。別の実施形態は、候補ブロックベクトルＢＶ₀ごとのものであり、ＢＶ₀に基づいて導出されたＢＶ_dまたはＭＶ_dが、有効である場合、ＢＶ₀およびＢＶ_d／ＭＶ_dを用いる双予測モードと候補ブロックを見なし、その場合、双予測は、ブロックベクトルＢＶ₀を適用することによって獲得された第１の予測を、導出されたブロックまたは動きベクトルＢＶ_d／ＭＶ_dを適用することによって獲得された第２の予測とともに平均することによって獲得される。

図１８Ａおよび図１８Ｂは、併せて１つの、イントラブロックコピーマージ候補リスト構成の例示的な方法のフローチャートである。例示的な方法２２００は、ステップ２２０２において開始し、それは、「ＩｎｔｒａＢＣマージ候補導出」である。方法は、次に、「空間的ＢＶ候補生成」と名付けられた破線ボックスに、特にステップ２２０４に進み、それは、「ＢＶプレディクタを、それが現在のＣＵに対して有効である場合は、マージ候補リストに追加する」である。処理は、次に、ステップ２２０６に進み、それは、「空間的近隣ブロックからのＢＶをチェックし、それが有効である場合は、それをマージ候補リストに追加する」である。

方法は、次に、決定ボックス２２０８に進み、そこで、以下の条件が、すなわち、「（（左側、上側、右上、左下の近隣ブロックがチェックされた）｜｜（ｎｕｍ＿ｏｆ＿ｃａｎｄ＿ｌｉｓｔ≧ｍａｘ＿ｎｕｍ＿ｏｆ＿ｍｅｒｇｅ＿ｃａｎｄ））か？」が評価される。２２０８における条件が、偽であると決定された場合、処理は、ステップ２２０６に戻る。

２２０８における条件が、代わりに、真であると決定された場合、処理は、決定ボックス２２１０に進み、そこで、以下の条件が、すなわち、「（ｎｕｍ＿ｏｆ＿ｃａｎｄ＿ｌｉｓｔ＜ｍａｘ＿ｎｕｍ＿ｏｆ＿ｍｅｒｇｅ＿ｃａｎｄ−１）か？」が、評価される。２２１０における条件が、真であると決定された場合、処理は、ステップ２２１２に進み、それは、「左上の近隣ブロックのＢＶをチェックし、それが有効である場合は、それをマージ候補リストに追加する」である。２２１０における条件が、偽であると決定された場合、ステップ２２１２は、バイパスされる。いずれにしても、処理は、次に、図１８Ｂの「ＢＶｄ候補生成」と題された破線ブロックに、特に決定ボックス２２１６に進み、そこで、以下の条件が、すなわち、「（（リスト内のすべての空間的ＢＶ候補がチェックされた）｜｜（ｎｕｍ＿ｏｆ＿ｃａｎｄ＿ｌｉｓｔ≧ｍａｘ＿ｎｕｍ＿ｏｆ＿ｍｅｒｇｅ＿ｃａｎｄ））か？」が評価される。

２２１６における条件が、真であると決定された場合、処理は、ステップ２２２４において終了する。２２１６における条件が、偽であると決定された場合、処理は、ステップ２２１８に進み、それは、「候補リストから１つの空間的ＢＶを取り、ＢＶｄを導出する」である。

次に、処理は、決定ボックス２２２０に進み、そこで、以下の条件が、すなわち、「ＢＶｄは有効か？」が、評価される。２２２０における条件が、真であると決定された場合、処理は、ステップ２２２２に進み、それは、「ＢＶｄをマージ候補リストに追加する」である。２２２０における条件が、代わりに、偽であると決定された場合、処理は、決定ボックス２２１６に戻る。

導出されたブロックベクトルを用いるイントラブロックコピーモード
通常のイントラブロックコピーモードでは、ブロックベクトルは、符号化ユニット内の予測ユニットごとに明示的に伝達される。いくつかの実施形態では、このモードは、ＩｎｔｒａＢＣ予測において、伝達されたブロックベクトルが使用されるか、または導出されたブロックベクトルが使用されるかを示すためのフラグを追加することによって、拡張される。フラグが０である場合、伝達されたブロックベクトルが、ＩｎｔｒａＢＣ予測のために使用され、ＢＶ導出を適用する必要はない。フラグが１である場合、ＢＶまたはＭＶが、伝達されたブロックベクトルに基づいて、式（４）または式（５）を使用して導出され、導出されたＢＶまたはＭＶが、イントラブロックコピー予測または動き補償予測のために使用される。

別の実施形態は、通常のＩｎｔｒａＢＣモードに２つのフラグを追加することである。第１のフラグは、ＢＶ導出プロセスが適用されるかどうかを示すために使用される。第１のフラグが、１である場合、第２のフラグが、単予測が使用されるか、または双予測が使用されるかを示すように符号化される。第２のフラグが、０である場合、導出されたＢＶまたはＭＶだけが、イントラブロックコピー予測または動き補償予測のために使用される。そうではなく、第２のフラグが、１である場合、伝達されたＢＶが、第１の予測を生成するために使用され、導出されたＢＶまたはＭＶが、第２の予測を生成するために使用され、最終的な予測は、双予測モードに類似して、それら２つの予測を平均することによって生成される。

ブロックベクトル導出のためのメモリアクセス帯域幅低減
ブロックベクトル導出は、図１６および図１７のブロックＢ１についての情報など、ブロック符号化モードおよびブロックベクトル／動きベクトルに関する情報を使用して動作する。デコーダチップ設計について、符号化されたすべてのブロックのモード／ＢＶ／動き情報を記憶するための２つの方法が存在する。１つは、外部メモリ内に情報を記憶することである。この技法は、外部メモリへのアクセスを必要とし、したがって、メモリアクセス帯域幅を増加させる。もう１つの技法は、オンチップメモリ内に情報をキャッシュすることであり、それは、キャッシュサイズを増加させる。

記憶される必要がある情報の量を低減させるための、２つの例示的な方法が、ここでは説明される。１つは、その情報を粗い粒度で記憶することである。ＨＥＶＣでは、元のＢＶ／ＭＶ情報は、４×４ブロックサイズに基づいて記憶される。メモリサイズは、より大きいブロックサイズ、例えば、１６×１６ブロックサイズに基づいた圧縮された形式で、元のＢＶ／ＭＶ情報を記憶することによって、大幅に低減される。１６×１６ブロックサイズが使用される場合、必要とされるＢＶ記憶は、ＨＥＶＣにおける圧縮された動きと同じ粒度を有する。このように、それらのデータを妥当なサイズでキャッシュすることが可能である。第２のソリューションは、符号化されたブロックのその情報を、すでに符号化されたすべてのブロックの代わりに、限定された範囲でキャッシュすることである。例えば、デコーダは、現在のＣＴＵ行および現在のＣＴＵ行の上側の限られた数の符号化された近隣ＣＴＵ行に関する情報だけをキャッシュすることができる。図１６および図１７の第１のＢＶによって指し示されるブロックＢ１が、デコーダがキャッシュする範囲外にある場合、このＢＶは、無効と見なされ、ＢＶ／ＭＶ導出は、適用されない。

符号化シンタックスおよびセマンティクス
ＨＥＶＣ範囲拡張ドラフト（非特許文献１７）の現在のシンタックス設計に基づいた、イントラブロックコピーマージおよび導出されたブロックベクトルを用いるイントラブロックコピーを用いて符号化されたＣＵを伝達するための、新しいシンタックス要素が提案された。本セクションで説明される提案されたパレット符号化方法は、追加のシンタックスを導入することによって、ビットストリームで伝達することができる。以下の表（表２）は、提案されたシンタックス要素を示しており、ＨＥＶＣ範囲拡張ドラフト（非特許文献１７）のそれに対する変更は、番号［１０］、［１２］、［１３］、［１４］、［１７］、［２７］、［２８］、［２９］、［４０］、［４１］、および［４２］の行内に含まれる。
シンタックス

表２に関して、以下のことが留意される。

１に等しいｉｎｔｒａ＿ｂｃ＿ｍｅｒｇｅ＿ｆｌａｇ［ｘ０］［ｙ０］は、現在の符号化ユニットが、マージモードで符号化され、ブロックベクトルが、マージ候補から選択されることを指定する。０に等しいｉｎｔｒａ＿ｂｃ＿ｍｅｒｇｅ＿ｆｌａｇ［ｘ０］［ｙ０］は、符号化ユニットが、マージモードで符号化されず、現在の符号化ユニットのブロックベクトルが、明示的に符号化されることを指定する。存在しない場合、ｉｎｔｒａ＿ｂｃ＿ｍｅｒｇｅ＿ｆｌａｇの値は、０に等しいと推測される。配列インデックスｘ０、ｙ０は、ピクチャの左上ルーマサンプルに対する、検討中の符号化ブロックの左上ルーマサンプルのロケーション（ｘ０，ｙ０）を指定する。

ｉｎｔｒａ＿ｂｃ＿ｍｅｒｇｅ＿ｉｎｄｅｘ［ｘ０］［ｙ０］は、現在の符号化ユニットのブロックベクトルがそれと同じであるマージ候補の間のインデックスを指定する。ｉｎｔｒａ＿ｂｃ＿ｍｅｒｇｅ＿ｉｎｄｅｘ［ｘ０］［ｙ０］は、０からイントラブロックコピーイングマージ候補マイナス１までの範囲内にあるものとする。配列インデックスｘ０、ｙ０は、ピクチャの左上ルーマサンプルに対する、検討中の符号化ブロックの左上ルーマサンプルのロケーション（ｘ０，ｙ０）を指定する。

１に等しいｉｎｔｒａ＿ｂｃ＿ｂｖ＿ｄｅｒｉｖａｔｉｏｎ＿ｆｌａｇ［ｘ０］［ｙ０］は、導出されたＢＶまたはＭＶが、現在のＰＵ予測のために使用されることを指定する。

さらなる例示的な実施形態
例示的な実施形態では、導出されたブロックベクトルが、生成され、導出されたブロックベクトルが、イントラブロックコピーマージモードにおけるマージ候補として使用される。いくつかのそのような方法では、導出されたブロックベクトルＢＶｄは、ブロックベクトルＢＶ０が与えられた場合、ＢＶｄ＝ＢＶ０＋ＢＶ１に従って決定される。

別の例示的な実施形態では、導出された動きベクトルが、生成され、導出された動きベクトルが、イントラブロックコピーマージモードにおけるマージ候補として使用される。いくつかのそのような方法では、整数ピクセルユニットにおける導出された動きベクトルＭＶｄは、ブロックベクトルＢＶ０が与えられた場合、ＭＶｄ＝ＢＶ０＋（（ＭＶ１＋２）＞＞２）に従って決定される。

例示的な実施形態では、導出されたブロックベクトルが、生成され、導出されたブロックベクトルが、イントラブロックコピー方法を用いる通常のＩｎｔｒａＢＣ予測のために使用される。

別の例示的な実施形態では、導出された動きベクトルが、生成され、導出された動きベクトルが、動き補償予測方法を用いる通常のＩｎｔｒａＢＣ予測のために使用される。

例示的な実施形態では、ブロックベクトル（ＢＶ）候補リストが、形成される。導出されたＢＶ（ＢＶｄ）が、生成され、ＢＶｄが、候補リストに追加される。

いくつかのそのような実施形態では、ＢＶ候補リストの形成は、ＢＶプレディクタが現在の符号化ユニット（ＣＵ）に対して有効である場合、ＢＶプレディクタを追加することと、５つの空間的ブロックをチェックし、有効なそれらそれぞれの空間的ブロックＢＶを追加することとを含む。いくつかのそのような実施形態では、空間的ブロックＢＶは、（ｉ）空間的隣接ブロックがＩｎｔｒａＢＣコーディングされており、（ｉｉ）ＢＶが現在のＣＵに対して有効であり、および（ｉｉｉ）ＢＶが現在の候補リスト内にまだ出現していない場合に限って、追加される。いくつかのそのような実施形態では、ＢＶｄは、マージ候補リストが満杯ではない場合に限って、生成される。ＢＶｄは、候補リストに追加される前に、有効性についてチェックすることができる。いくつかの実施形態では、生成されたＢＶｄは、専らＢＶｄ＝ＢＶ０＋ＢＶ１に従って導出される。いくつかのそのような方法では、導出された動きベクトル（ＭＶｄ）が、生成され、ＭＶｄが、候補リストに追加される。いくつかの実施形態では、ＢＶｄは、（ｉ）ＢＶｄ＝ＢＶ０＋ＢＶ１、および（ｉｉ）ＭＶｄ＝ＢＶ０＋（（ＭＶ１＋２）＞＞２）の両方に従って、導出される。いくつかの実施形態では、候補ブロックは、ＢＶ₀およびＢＶ_d／ＭＶ_dを用いる双予測モードとして扱われる。双予測は、最初に、ブロックベクトルＢＶ₀を適用することによって獲得された第１の予測を、ブロックベクトルまたは動きベクトルＢＶ_d／ＭＶ_dを適用することによって獲得された第２の予測とともに平均することによって獲得することができる。

例示的な実施形態では、ビデオコーディングされたビットストリームが、受信され、ＩｎｔｒａＢＣ予測において、伝達されたブロックベクトルが使用されるか、または導出されたブロックベクトルが使用されるかを示すフラグが、識別される。フラグが、第１の値である場合、伝達されたブロックベクトルが、ＩｎｔｒａＢＣ予測のために使用される。フラグが、第２の値である場合、ＢＶまたはＭＶが、伝達されたブロックベクトルに基づいて導出される。いくつかのそのような方法では、導出されたＢＶまたはＭＶは、イントラブロックコピー予測または動き補償予測のために使用される。

別の例示的な実施形態では、符号化されたビデオビットストリームが、受信される。ビットストリーム内の第１のフラグが、ＩｎｔｒａＢＣ予測において、伝達されたブロックベクトルが使用されるか、または導出されたブロックベクトルが使用されるかを示すものとして識別される。ビットストリーム内の第２のフラグが、単予測が使用されるか、または双予測が使用されるかを示すものとして識別される。

いくつかのそのような実施形態では、第１のフラグが１であり、第２のフラグが０である場合、イントラブロックコピー予測または動き補償予測のために、導出されたＢＶ／ＭＶだけが使用される。第１のフラグが１であり、第２のフラグが１である場合、伝達されたＢＶが、第１の予測を生成するために使用され、導出されたＢＶ／ＭＶが、第２の予測を生成するために使用され、最終的な予測は、それら２つの予測を平均することによって生成される。

例示的な実施形態では、元のＢＶ／ＭＶ情報は、より大きいブロックサイズに基づいたＢＶ／ＭＶ情報を記憶することによって、圧縮される。より大きいブロックサイズは、例えば、１６×１６ブロックサイズとすることができる。

別の例示的な実施形態では、デコーダは、すでに符号化されたすべてのブロックよりも小さい限定された範囲で、符号化されたブロックの情報をキャッシュするために使用される。いくつかのそのような方法では、デコーダは、現在のＣＴＵ行および現在のＣＴＵ行の上側の所定の数の符号化された近隣ＣＴＵ行についての情報だけをキャッシュする。

例示的な実施形態では、予測ベクトルを導出するビデオ符号化方法が、提供される。方法は、ビデオブロックの予測のための第１の候補ブロックベクトルを識別するステップを含み、第１の候補ブロックベクトルは、第１の候補ブロックを指し示す（ポイントする）。少なくとも、第１の候補ブロックと関連付けられた第１の予測ブロックが、識別される。導出された予測ベクトルが、第１の候補ブロックベクトルおよび第１の予測ベクトルから生成され、ビデオブロックは、導出された予測ベクトルを使用して符号化される。いくつかの実施形態では、導出された予測ベクトルを使用するビデオブロックの符号化は、導出された予測ベクトルが指し示す（ポイントする）第２の候補ブロックを識別することと、第２の候補ブロックを使用してビデオブロックを予測することとを含む。

いくつかの実施形態では、ビデオブロックを符号化することは、第１の候補ブロックベクトルをビットストリームで伝達することを含む。いくつかの実施形態では、ビデオブロックを符号化することは、第１の予測ベクトルをビットストリームで伝達することをさらに含む。いくつかの実施形態では、ビデオブロックを符号化することは、フラグをビットストリームで伝達することをさらに含み、フラグの第１の値は、導出された予測ベクトルを使用して、ビデオブロックを符号化することを示し、フラグの第２の値は、第１の候補ブロックベクトルを使用して、ビデオブロックを符号化することを示す。いくつかの実施形態では、入力ビデオブロックをビットストリームにエンコードすることは、マージ候補リスト内で導出された予測ベクトルを識別するインデックスをビットストリームにエンコードすることを含む。

導出された予測ベクトルは、いくつかの実施形態では、第１の候補ブロックベクトルと第１の予測ベクトルとを合算することによって生成される。第１の候補ブロックベクトルおよび第１の予測ベクトルが、異なる精度を有する場合、第１の候補ブロックベクトルと第１の予測ベクトルとの合算は、それらを同じ精度に調整した後で実行することができる。

いくつかの実施形態では、ビデオ符号化方法は、マージ候補リストを生成するステップと、導出された予測ベクトルをマージ候補リストに挿入するステップとを含む。いくつかのそのような実施形態では、導出された予測ベクトルが有効であるかどうかについての決定が、行われ、導出された予測ベクトルは有効であると決定された後にだけ、導出された予測ベクトルが、マージ候補リストに挿入される。導出された予測ベクトルを使用してビデオブロックを符号化することは、マージ候補リスト内で導出された予測ベクトルを識別するインデックスを提供することを含む。導出された予測ベクトルが有効であるかどうかについての決定は、いくつかの実施形態では、導出された予測ベクトルが指し示す（ポイントする）第２の候補ブロック識別することと、第２の候補ブロック内のすべてのサンプルが利用可能かどうかを決定することとを含む。導出された予測ベクトルは、第２の候補ブロック内のすべてのサンプルが利用可能である場合に、有効であると決定される。導出された予測ベクトルは、第２の候補ブロック内の少なくとも１つのサンプルが利用可能ではない場合に、有効ではないと決定される。いくつかの実施形態では、第２の候補ブロック内のサンプルは、以下のいずれかが真である場合に、すなわち、サンプルがまだ符号化されていない、またはサンプルが異なるスライスもしくは異なるタイル内にある、またはサンプルがビデオピクチャ境界の外にある場合に、利用不可能である。

例示的な実施形態では、ビデオをエンコードしたビットストリームから、符号化されたビデオブロックをデコードする方法が、提供される。少なくとも、第１の候補ブロックベクトルが、入力ビデオブロックの予測のために識別され、第１の候補ブロックベクトルは、第１の候補ブロックを指し示す（ポイントする）。少なくとも、第１の候補ブロックと関連付けられた第１の予測ベクトルが、識別される。導出された予測ベクトルが、第１のブロックベクトルおよび第１の予測ベクトルから生成され、符号化されたビデオブロックは、導出された予測ベクトルを使用してデコードされる。いくつかのそのような実施形態では、第１の候補ブロックベクトルの識別は、ビットストリームで伝達された第１の候補ブロックベクトルを受信することを含む。

いくつかのそのような実施形態では、導出された予測ベクトルを使用する符号化されたビデオブロックの復号化は、入力ビデオブロックが導出された予測ベクトルを用いてエンコードされたことを示すフラグをビットストリームで受信したことに応答して、実行される。

いくつかの実施形態では、第１の候補ブロックベクトルの識別は、第１のブロックベクトルマージ候補の識別を含む。いくつかの実施形態では、導出された予測ベクトルは、導出された予測ベクトルマージ候補であり、符号化されたビデオブロックを導出された予測ベクトルマージ候補を使用してデコードすることは、導出された予測ベクトルマージ候補を識別するインデックスをビットストリームで受信したことに応答して、実行される。

例示的な実施形態では、入力ビデオブロックを含むビデオをエンコードしたビットストリームを生成するための、ビデオエンコーディング方法が、提供される。入力ビデオブロックの近隣ブロックが、識別される。近隣ブロックは、例えば、入力ビデオブロックの左側、上側、または左上の近隣ブロックとすることができる。近隣ブロックと関連付けられた第１のブロックベクトルが、識別され、第１のブロックベクトルは、第１の候補ブロックを指し示す（ポイントする）。第１の候補ブロックと関連付けられた第２のブロックベクトルが、識別される。導出されたブロックベクトルが、第１のブロックベクトルと第２のブロックベクトルとを合算することによって生成され、第１の予測ブロックが、入力ビデオブロックの予測のために、導出されたブロックベクトルを使用して生成される。

いくつかのそのような実施形態では、入力ビデオブロックのエンコーディングは、少なくとも、第３のブロックベクトルを使用して入力ビデオブロックの予測のための第２の予測ブロックを生成することをさらに含む。第１の予測ブロックおよび第２の予測ブロックは、比較され、予測ブロックおよびそれに関連するブロックベクトルが、エンコーディングメトリックに基づいて、選択される。エンコーディングメトリックは、例えば、ラグランジュのレート−歪みコストとすることができる。

例示的な実施形態では、入力ビデオブロックを含むビデオをエンコードしたビットストリームを生成するための、ビデオエンコーダが、提供される。エンコーダは、プロセッサと、プロセッサ上で実行された場合に、入力ビデオブロックの予測のための第１の候補ブロックベクトルを識別することであって、第１の候補ブロックベクトルは、第１の候補ブロックを指し示す（ポイントする）、識別することと、第１の候補ブロックをエンコードするために使用される第１の予測ベクトルを識別することと、第１の候補ブロックおよび第１の予測ベクトルから、導出された予測ベクトルを生成することと、入力ビデオブロックの予測のための導出された予測ベクトルを使用して、入力ビデオブロックをビットストリームにエンコードすることとを含む機能を実行するように動作する命令を記憶した、非一時的記憶媒体とを含む。

例示的な実施形態では、入力ビデオブロックを含むビデオをエンコードしたビットストリームを生成するための、ビデオエンコーダが、提供される。エンコーダは、プロセッサと、プロセッサ上で実行された場合に、少なくとも、入力ビデオブロックのエンコーディングのための第１のブロックベクトルマージ候補を識別することと、第１の候補ブロックをエンコードするために使用される第１の予測ベクトルを識別することと、第１のブロックベクトルマージ候補および第１の予測ベクトルから、導出された予測ベクトルを生成することと、導出された予測ベクトルをマージ候補リストに挿入することと、マージ候補リストから、入力ビデオブロックの予測のための選択された予測ベクトルを選択することと、入力ビデオブロックの予測のための選択された予測ベクトルを使用して、入力ビデオブロックをビットストリームにエンコードすることとを含む機能を実行するように動作する命令を記憶した、非一時的記憶媒体とを含む。

例示的な実施形態では、ビデオをエンコードしたビットストリームから符号化されたビデオブロックをデコードするための、ビデオデコーダが、提供され、デコーダは、プロセッサと、プロセッサ上で実行された場合に、少なくとも、符号化されたビデオブロックの復号化のための第１のブロックベクトルを識別することと、第１のブロックベクトルをエンコードするために使用された第１の予測ベクトルを識別することと、第１のブロックベクトルおよび第１の予測ベクトルから、導出された予測ベクトルを生成することと、符号化されたビデオブロックの予測のための導出された予測ベクトルを使用して、符号化されたビデオブロックをデコードすることとを含む機能を実行するように動作する命令を記憶した、非一時的記憶媒体とを含む。

上では特徴および要素が特定の組み合わせで説明されたが、各特徴または要素は、単独で使用することができ、または他の特徴および要素との任意の組み合わせで使用することができることを当業者は理解する。加えて、本明細書で説明された方法は、コンピュータまたはプロセッサによって実行されるための、コンピュータ可読媒体内に含まれた、コンピュータプログラム、ソフトウェア、またはファームウェアで実施することができる。コンピュータ可読媒体の例は、（有線または無線接続上で送信される）電子信号、およびコンピュータ可読記憶媒体を含む。コンピュータ可読記憶媒体の例は、リードオンリメモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、レジスタ、キャッシュメモリ、半導体メモリデバイス、内蔵ハードディスクおよび着脱可能ディスクなどの磁気媒体、光磁気媒体、ならびにＣＤ−ＲＯＭディスクおよびデジタル多用途ディスク（ＤＶＤ）などの光媒体を含むが、それらに限定されない。ソフトウェアと連携するプロセッサを使用して、ＷＴＲＵ、ＵＥ、端末、基地局、ＲＮＣ、または任意のホストコンピュータにおいて使用するための無線周波送受信機を実施することができる。

Claims

予測ベクトルを導出するビデオ符号化方法であって、
第１のピクチャにおけるビデオブロックの予測のための第１の候補ブロックベクトルを識別するステップであって、前記第１の候補ブロックベクトルは、前記第１のピクチャにおける第１の候補ブロックを指し示している、ステップと、
前記第１の候補ブロックと関連付けられた少なくとも第１の予測ベクトルを識別するステップと、
前記第１の候補ブロックベクトルおよび前記第１の予測ベクトルから、導出された予測ベクトルを生成するステップと、
前記導出された予測ベクトルを使用して、前記ビデオブロックを符号化するステップと
を備えることを特徴とする方法。
前記導出された予測ベクトルを使用して、前記ビデオブロックを符号化する前記ステップは、
前記導出された予測ベクトルが指し示している第２の候補ブロックを識別することと、
前記第２の候補ブロックを使用して、前記ビデオブロックを予測することと
を含むことを特徴とする請求項１に記載の方法。
前記ビデオブロックを符号化する前記ステップは、前記第１の候補ブロックベクトルをビットストリームの中でシグナリングすることを含むことを特徴とする請求項１に記載の方法。
前記ビデオブロックを符号化する前記ステップは、
前記第１の予測ベクトルを前記ビットストリームの中でシグナリングすることをさらに含むことを特徴とする請求項３に記載の方法。
前記ビデオブロックを符号化する前記ステップは、
フラグを前記ビットストリームの中でシグナリングすることであって、前記フラグの第１の値は、前記導出された予測ベクトルが、前記ビデオブロックを符号化するために使用されるのを示すことをさらに含むことを特徴とする請求項３に記載の方法。
前記フラグの第２の値は、前記第１の候補ブロックベクトルが、前記ビデオブロックを符号化するために使用されることを示すことを特徴とする請求項５に記載の方法。
前記導出された予測ベクトルは、前記第１の候補ブロックベクトルと前記第１の予測ベクトルとを合算することによって生成されることを特徴とする請求項１に記載の方法。
前記第１の候補ブロックベクトルおよび前記第１の予測ベクトルは、異なる精度を有し、前記第１の候補ブロックベクトルと前記第１の予測ベクトルとの合算は、それらを同じ精度に揃えた後で実行されることを特徴とする請求項７に記載の方法。
前記第１の予測ベクトルは、第２のブロックベクトルであり、前記導出された予測ベクトルは、導出されたブロックベクトルであることを特徴とする請求項１に記載の方法。
前記導出されたブロックベクトルは、前記第１の候補ブロックベクトルと前記第２のブロックベクトルとを合算することによって生成されることを特徴とする請求項９に記載の方法。
前記第１の予測ベクトルは、第１の動きベクトルであり、前記導出された予測ベクトルは、導出された動きベクトルであることを特徴とする請求項１に記載の方法。
前記導出された動きベクトルは、前記第１の候補ブロックベクトルと前記第１の動きベクトルとを合算することによって生成されることを特徴とする請求項１１に記載の方法。
前記第１の候補ブロックベクトルおよび前記第１の動きベクトルは、異なる精度を有し、前記導出された動きベクトルは、前記第１の候補ブロックベクトルおよび前記第１の動きベクトルの前記精度を調整し、前記精度が調整された第１の候補ブロックベクトルと前記精度が調整された第１の動きベクトルとを合算することによって生成されることを特徴とする請求項１２に記載の方法。
前記精度が調整された第１の候補ブロックベクトルと前記精度が調整された第１の動きベクトルとは、式
ＭＶｄ＝ＢＶ０＋（（ＭＶ１＋２）＞＞２）
に従って合算され、ここで、ＢＶ０は、前記第１の候補ブロックベクトルであり、ＭＶ１は、前記第１の動きベクトルであり、ＭＶｄは、前記導出された動きベクトルであることを特徴とする請求項１３に記載の方法。
前記ビデオ符号化方法は、前記導出された予測ベクトルをマージ候補リストに挿入するステップをさらに備えることを特徴とする請求項１に記載の方法。
前記導出された予測ベクトルが有効であるかどうかを決定するステップであって、前記導出された予測ベクトルは、前記導出された予測ベクトルが有効であると決定された後にだけ前記マージ候補リストに挿入される、ステップ
をさらに備えることを特徴とする請求項１５に記載の方法。
前記導出された予測ベクトルが有効であるかどうかを決定する前記ステップは、
前記導出された予測ベクトルが指し示す第２の候補ブロックを識別することと、
前記第２の候補ブロック内のすべてのサンプルが利用可能であるかどうかを決定することと、
前記第２の候補ブロック内のすべてのサンプルが利用可能である場合は、前記導出された予測ベクトルは有効であると決定し、前記第２の候補ブロック内の少なくとも１つのサンプルが利用可能ではない場合は、前記導出された予測ベクトルは有効ではないと決定することと
を含むことを特徴とする請求項１６に記載の方法。
前記第２の候補ブロック内のサンプルは、以下のいずれかが真である場合、すなわち、
前記サンプルが、まだ符号化されていない場合、または
前記サンプルが、異なるスライスもしくは異なるタイル内にある場合、または
前記サンプルが、ビデオピクチャ境界の外にある場合、
利用不可能であることを特徴とする請求項１７に記載の方法。
前記導出された予測ベクトルを使用して、前記ビデオブロックを符号化する前記ステップは、前記マージ候補リスト内で前記導出された予測ベクトルを識別するインデックスを備えることを含むことを特徴とする請求項１５に記載の方法。
ビデオをエンコードしたビットストリームから符号化されたビデオブロックをデコードする方法であって、
第１のピクチャにおける前記符号化されたビデオブロックの予測のための少なくとも第１の候補ブロックベクトルを識別するステップであって、前記第１の候補ブロックベクトルは、前記第１のピクチャにおける第１の候補ブロックを指し示している、ステップと、
前記第１の候補ブロックと関連付けられた少なくとも第１の予測ベクトルを識別するステップと、
前記第１の候補ブロックベクトルおよび前記第１の予測ベクトルから、導出された予測ベクトルを生成するステップと、
前記導出された予測ベクトルを使用して、前記符号化されたビデオブロックをデコードするステップと
を備えることを特徴とする方法。