JP7302044B2

JP7302044B2 - イントラインター予測を制御する方法、エンコーダ、デコーダ、及びプログラム

Info

Publication number: JP7302044B2
Application number: JP2022004241A
Authority: JP
Inventors: ジャオ，シン; リ，シアン; リィウ，シャン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2018-11-14
Filing date: 2022-01-14
Publication date: 2023-07-03
Anticipated expiration: 2039-11-12
Also published as: JP7011735B2; WO2020102173A3; EP3881536A2; CN112005549A; KR102458813B1; KR102637503B1; CN112005549B; US20240146928A1; JP2021520157A; WO2020102173A2; JP2023120367A; CN115623202A; US11909976B2; US20210044803A1; US11388404B2; US20220303540A1; EP3881536A4; KR20200142067A; JP2022050621A; US20200154107A1

Description

〔関連出願の相互参照〕
本出願は、米国特許商標庁に、２０１８年１１月１４日にて提出された米国仮特許出願第６２／７６７．４７３号、及び２０１９年６月２７日にて提出された米国出願第１６／４５４．２９４号の優先権を主張し、それらの全内容が援用により本明細書に組み込まれる。

実施形態に該当する方法及び装置はビデオ符号化に関し、特に、予測モードとコーディングブロックフラグ（ＣＢＦ）をエントロピー符号化するための改善されたコンテキスト設計の方法及び装置に関する。

図１Ａは、高効率ビデオ符号化（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ、ＨＥＶＣ）において利用されるイントラ予測モードを示す。ＨＥＶＣにおいて、合計３５のイントラ予測モードがあり、これらのイントラ予測モードにおいて、モード１０（１０１）は水平モードであり、モード２６（１０２）は垂直モードであり、モード２（１０３）、モード１８（１０４）及びモード３４（１０５）は対角モードである。これらのイントラ予測モードは、３つの最確モード（ＭＰＭ）と残りの３２個のモードによってシグナリングされる。

多用途ビデオコーディング（ｖｅｒｓａｔｉｌｅｖｉｄｅｏｃｏｄｉｎｇ、ＶＶＣ）について、一部のコーディングユニット構文テーブルが以下に示されている。スライスタイプがイントラではなく、且つスキップモードが選択されない場合、フラグｐｒｅｄ_ｍｏｄｅ_ｆｌａｇをシグナリングするとともに、１つのコンテキスト（例えば、変数ｐｒｅｄ_ｍｏｄｅ_ｆｌａｇ）のみを利用して当該フラグを符号化する。一部のコーディングユニットの構文テーブルは次の通りである。

図１Ｂを参照し、ＶＶＣにおいて、合計８７のイントラ予測モードがあり、これらのイントラ予測モードにおいて、モード１８（１０６）は水平モードであり、モード５０（１０７）は垂直モードであり、モード２（１０８）、モード３４（１０９）及びモード６６（１１０）は対角モードである。モード―１からモード―１０（１１１）、及びモード６７からモード７６（１１２）は広角イントラ予測（Ｗｉｄｅ―ＡｎｇｌｅＩｎｔｒａＰｒｅｄｉｃｔｉｏｎ、ＷＡＩＰ）モードと呼ばれる。

イントラコーディングブロックの色度成分について、符号器は、平面モード（モードインデックス０）、ＤＣモード（モードインデックス１）、水平モード（モードインデックス１８）、垂直モード（モードインデックス５０）及び対角モード（モードインデックス６６）を含む５つのモードのうちの最適な色度予測モードを選択するとともに、関連する輝度成分のイントラ予測モードの直接コピー、即ち、ＤＭモードを選択する。以下の表１は、色度のイントラ予測方向とイントラ予測モードの番号との間のマッピングを示す。

重複モードを避けるために、ＤＭモード以外の４つのモードは、関連する輝度（Luma）成分のイントラ予測モードに基づき割り当てられる。色度（Chroma）成分のイントラ予測モードの番号が４である場合、輝度成分のイントラ予測方向を、色度成分のイントラ予測サンプルの生成に適用する。色度成分のイントラ予測モードの番号が４ではなく、輝度成分のイントラ予測モードの番号と同じである場合、イントラ予測方向６６を、色度成分のイントラ予測サンプルの生成に適用する。

マルチ仮説イントラインター予測は、１つのイントラ予測と１つのマージインデックス付き予測を組み合わせ、即ち、イントラインター予測モードになる。マージコーディングユニット（Ｃｏｄｉｎｇｕｎｉｔ、ＣＵ）において、マージモードに対して、１つのフラグを信号で送信することで、当該フラグが真である場合、イントラ候補リストからイントラモードを選択する。輝度成分に対して、イントラ候補リストは、ＤＣモード、平面モード、水平モード及び垂直モードを含む４つのイントラ予測モードから取得され、ブロック形状に応じて、イントラ候補リストの大きさは３又は４であってもよい。ＣＵの幅がＣＵの高さの２倍より大きい場合、イントラ候補リストから水平モードを除去し、ＣＵの高さがＣＵの幅の２倍より大きい場合、イントラ候補リストから垂直モードを除去する。加重平均を利用して、イントラモードインデックスによって選択された１つのイントラ予測モードと、マージインデックスによって選択された１つのマージインデックス付き予測とを組み合わせる。色度成分に対して、追加のシグナリングを必要としなく、常にＤＭを利用する。

予測を組み合わせるための重みは以下のように説明される。ＤＣモード、又は平面モードが選択されたか、又はコーディングブロック（ＣｏｄｉｎｇＢｌｏｃｋ、ＣＢ）の幅又は高さが４よりも小さい場合、等しい重みを適用する。ＣＢの幅又は高さが４以上であるこれらのＣＢについて、水平／垂直モードが選択された場合、まず、１つのＣＢを垂直／水平に４つの等面積領域に分割する。各領域に、対応する（ｗ_ｉｎｔｒａ_ｉ，ｗ_ｉｎｔｅｒ_ｉ）として示される重みセットを適用し、ｉは１から４であり、（ｗ_ｉｎｔｒａ_１，ｗ_ｉｎｔｅｒ_１）＝（６，２）、（ｗ_ｉｎｔｒａ_２，ｗ_ｉｎｔｅｒ_２）＝（５，３）、（ｗ_ｉｎｔｒａ_１，ｗ_ｉｎｔｅｒ_３）＝（３，５）、（ｗ_ｉｎｔｒａ_４，ｗ_ｉｎｔｅｒ_４）＝（２，６）である。（ｗ_ｉｎｔｒａ_１，ｗ_ｉｎｔｅｒ_１）は、参照サンプルに最も近い領域に対応し、（ｗ_ｉｎｔｒａ_４，ｗ_ｉｎｔｅｒ_４）は、参照サンプルから最も遠い領域に対応する。そして、２つの重み付け予測を合計し、３ビットだけ右シフトすることで、組み合わせられた予測を計算する。また、予測器のイントラ仮説のイントラ予測モードは、その後の、隣接ＣＢがイントラ符号化される場合、これらのＣＢに対してイントラモード符号化を行うために保存できる。

実施形態によれば、ビデオシーケンスの復号化又は符号化のためのイントラインター予測を制御するための方法は、少なくとも１つのプロセッサによって実行される。当該方法は、現在ブロックの隣接ブロックがイントラインター予測モードによって符号化されるかどうかを決定するステップと、隣接ブロックがイントラインター予測モードによって符号化されていると決定されたことに基づいて、イントラインター予測モードに関連付けられたイントラ予測モードを利用して、現在ブロックのイントラモード符号化を実行し、隣接ブロックに関連付けられた予測モードフラグを設定し、設定された隣接ブロックに関連付けられた予測モードフラグに基づいてコンテキスト値を取得し、取得されたコンテキスト値を利用して、現在ブロックがイントラ符号化されていることを示す、現在ブロックに関連付けられた予測モードフラグに対する、エントロピー符号化を実行するという操作を実行するステップと、を含む。

実施形態によれば、ビデオシーケンスの復号化又は符号化のためのイントラインター予測を制御するための装置は、コンピュータプログラムコードを記憶するように配置される少なくとも１つのメモリと、前記少なくとも１つのメモリにアクセスするとともに、コンピュータプログラムコードに基づき動作するように配置される少なくとも１つのプロセッサと、を含む。コンピュータプログラムコードは、少なくとも１つのプロセッサに、現在ブロックの隣接ブロックがイントラインター予測モードによって符号化されるかどうかを決定させるように配置される第１決定コードと、少なくとも１つのプロセッサに、隣接ブロックがイントラインター予測モードによって符号化されたと決定されていることに基づいて、イントラインター予測モードに関連付けられたイントラ予測モードを利用して現在ブロックのイントラモード符号化を実行させるように配置される実行コードと、少なくとも１つのプロセッサに、隣接ブロックがイントラインター予測モードによって符号化されていると決定されたことに基づいて、隣接ブロックに関連付けられた予測モードフラグを設定し、設定された、隣接ブロックに関連付けられた予測モードフラグに基づいて、コンテキスト値を取得し、取得されたコンテキスト値を利用して、現在ブロックがイントラ符号化されていることを示す、現在ブロックに関連付けられた予測モードフラグに対する、エントロピー符号化を実行するという操作を実行させるように配置される設定コード設定コードと、を含む。

実施形態によれば、命令が記憶された非一時的コンピュータ可読記憶媒体であって、当該命令は少なくとも１つのプロセッサに、現在ブロックの隣接ブロックがイントラインター予測モードによって符号化されるかどうかを決定するステップと、隣接ブロックがイントラインター予測モードによって符号化されていると決定されたことに基づいて、イントラインター予測モードに関連付けられたイントラ予測モードを利用して、現在ブロックのイントラモード符号化を実行し、隣接ブロックに関連付けられた予測モードフラグを設定し、設定された、隣接ブロックに関連付けられた予測モードフラグに基づいて、コンテキスト値を取得し、取得されたコンテキスト値を利用して、現在ブロックがイントラ符号化されていることを示す、現在ブロックに関連付けられた予測モードフラグに対する、エントロピー符号化を実行するという操作を実行するステップとを、実行させる。

ＨＥＶＣにおけるイントラ予測モードの図である。ＶＶＣにおけるイントラ予測モードの図である。実施形態による、通信システムの簡略化ブロック図である。実施形態による、ビデオ符号器とビデオ復号器のストリーミング環境における配置の図である。実施形態による、ビデオ復号器の機能ブロック図である。実施形態による、ビデオ符号器の機能ブロック図である。実施形態による、現在ブロック及び現在ブロックの隣接ブロックの図である。実施形態による、ビデオシーケンスの復号化又は符号化のためのイントラインター予測を制御する方法を示すフローチャートである。実施形態による、ビデオシーケンスの復号化又は符号化のためのイントラインター予測を制御するための装置の簡略化ブロック図である。実施形態を実現するのに適したコンピュータシステムの図面である。

図２は、実施形態による通信システム（２００）の簡略化ブロック図である。通信システム（２００）は、ネットワーク（２５０）を介して相互接続される少なくとも２つの端末（２１０～２２０）を含み得る。一方向のデータ伝送の場合、第１端末（２１０）は、ローカル位置にあるビデオデータを符号化することで、ネットワーク（２５０）を介して他の端末（２２０）に伝送することができる。第２端末（２２０）は、ネットワーク（２５０）から他の端末の符号化されたビデオデータを受信し、符号化されたビデオデータを復号化し、復元されたビデオデータを表示することができる。一方向のデータ伝送は、メディアサービスアプリケーションなどでは一般的であり得る。

図２は、例えばビデオ会議中に発生する可能性がある符号化されたビデオの双方向伝送をサポートするために提供される第２対の終端（２３０、２４０）を示す。双方向のデータ伝送の場合、各端末（２３０、２４０）は、ローカル位置でキャプチャされたビデオデータを符号化することで、ネットワーク（２５０）を介して他の端末に伝送することができる。各端末（２３０、２４０）はまた、他の端末から伝送された、符号化されたビデオデータを受信し、符号化されたビデオデータを復号化して、復元されたビデオデータをローカル表示機器に表示することができる。

図２において、端末（２１０～２４０）はサーバ、パーソナルコンピュータ及びスマートフォンとして示されるが、実施形態の原理はこれに限定されていない。実施形態はラップトップコンピュータ、タブレット、メディアプレイヤー及び／又は専用のビデオ会議機器に適用される。ネットワーク（２５０）は、端末（２１０～２４０）の間で符号化されたビデオデータを伝送するための、例えば有線及び／又は無線通信ネットワークが含まれた任意の数のネットワークを示す。通信ネットワーク（２５０）は、回路交換及び／又はパケット交換チャネルにおいてデータを交換することができる。代表的なネットワークは電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワーク及び／又はインターネットを含む。本出願の検討の目的のために、ネットワーク（２５０）のアーキテクチャ及びトポロジは、以下に本明細書で説明されない限り、実施形態の操作にとって重要ではないかもしれない。

図３は、実施形態による、ビデオ符号器とビデオ復号器の、ストリーミング環境における配置の図である。開示されたテーマは等価的に、例えばビデオ会議、デジタルＴＶ、圧縮されたビデオなどのＣＤ、ＤＶＤ、メモリースティックなどが含まれるデジタル媒体への記憶を含む、ビデオをサポートするための他のアプリケーションに適用され得る。

ストリーミングシステムは、キャプチャサブシステム（３１３）を含んでもよく、当該キャプチャサブシステムは、例えば非圧縮のビデオサンプルストリーム（３０２）を作成するためのビデオソース（３０１）（例えばデジタルカメラ）を含んでもよい。符号化されたビデオビットストリームと比較して、当該サンプルストリーム（３０２）はデータ量が多いことを強調するように太線として描画され、当該サンプルストリーム（３０２）は撮影装置（３０１）に連結される符号器（３０３）によって処理され得る。符号器（３０３）は、以下でより詳細に説明する開示されたテーマの各態様を実現又は実施するために、ハードウェア、ソフトウェア、又はそれらの組み合わせを含み得る。サンプルストリームと比較して、符号化されたビデオビットストリーム（３０４）はデータ量が少ないことを強調するように細線として描画され、符号化されたビデオビットストリーム（３０４）は、将来の使用のために、ストリーミングサーバ（３０５）に記憶され得る。１つ以上のストリーミングクライアント（３０６、３０８）は、ストリーミングサーバ（３０５）にアクセスして、符号化されたビデオビットストリーム（３０４）のレプリカ（３０７、３０９）を検索することができる。クライアント（３０６）は、符号化されたビデオデータの着信レプリカ（３０７）を復号化するとともに、ディスプレイ（３１２）又は他のレンダリング機器（図示せず）にレンダリングされる発信ビデオサンプルストリーム（３１１）を作成するためのビデオ復号器（３１０）を含むことができる。いくつかのストリーミングシステムにおいて、いくつかのビデオ符号化／圧縮規格に基づき、ビデオビットストリーム（３０４、３０７、３０９）を符号化できる。これらの規格の例はＩＴＵ―ＴＨ．２６５提案書を含む。非公式的にＶＶＣと呼ばれるビデオ符号化規格は開発中である。開示されたテーマはＶＶＣのコンテキストに適用され得る。

図４は、実施形態によるビデオ復号器（３１０）の機能ブロック図である。

受信機（４１０）は、復号器（３１０）によって復号化される１つ以上のコーデックビデオシーケンスを受信することができ、同一の実施形態又は他の実施形態において、一度に１つの符号化されたビデオシーケンスを受信し、各符号化されたビデオシーケンスの復号化は、他の符号化されたビデオシーケンスと独立している。チャネル（４１２）から符号化されたビデオシーケンスを受信することができ、当該チャネルは、符号化されたビデオデータを記憶するための記憶機器へのハードウェア／ソフトウェアリンクであってもよい。受信機（４１０）は、符号化されたビデオデータ及び他のデータ、例えば、それぞれの使用エンティティ（図示せず）に転送され得る符号化されたオーディオデータ及び／又は補助データストリームを受信することができる。受信機（４１０）は、符号化されたビデオシーケンスを他のデータから分離することができる。ネットワークのジッタを対処するために、受信機（４１０）とエントロピー復号器／パーサー（以下、「パーサ」と呼ばれる）との間にバッファメモリ（４１５）を連結することができる。受信機（４１０）は十分な帯域幅及び制御可能性を有する記憶／転送機器、又は等時性リアルタイムネットワークからデータを受信する場合、バッファメモリ（４１５）を必要としない場合があり、又は、バッファ（６１５）が小さくてもよい。インターネットのようなパケットネットワークをなるべく利用するために、バッファメモリ（４１５）を必要とする場合があり、バッファメモリは比較的大きく、有利に適応的なサイズを有してもよい。

ビデオ復号器（３１０）は、エントロピー符号化されたビデオシーケンスに基づきシンボル（４２１）を再構築するために、パーサー（４２０）を含み得る。これらのシンボルのカテゴリは、ビデオ復号器（３１０）の操作を管理するための情報、及びディスプレイ（３１２）のようなレンダリング機器を制御するための潜在的な情報が含まれ、図４に示すように、当該レンダリング機器は復号器の構成部分ではないが、復号器に連結され得る。レンダリング機器のための制御情報は、補充拡張情報（ＳｕｐｐｌｅｍｅｎｔａｌＥｎｈａｎｃｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎ、ＳＥＩメッセージ）又はビデオユーザビリティ情報（ＶｉｄｅｏＵｓａｂｉｌｉｔｙＩｎｆｏｒｍａｔｉｏｎ、ＶＵＩ）パラメータセットフラグメント（図示せず）という形式であってもよい。パーサー（４２０）は、受信された符号化されたビデオシーケンスに対して解析／エントロピー復号化を行う。符号化されたビデオシーケンスの符号化は、ビデオ符号化技術又は規格に拠することができ、可変長符号、ハフマン符号（Ｈｕｆｆｍａｎｃｏｄｉｎｇ）、文脈依存の有無にかかわらず算術符号化などを含む当業者に周知の原理に従うことができる。パーサーはグループに対応する少なくとも１つのパラメータに基づき、符号化されたビデオシーケンスからビデオ復号器における画素のサブグループのうちの少なくとも１つのサブグループのためのサブグループパラメータセットを抽出する。サブグループには、ピクチャグループ（ＧｒｏｕｐｓｏｆＰｉｃｔｕｒｅ、ＧＯＰ）、ピクチャ、タイル、スライス、マクロブロック、コーディングユニット（ＣｏｄｉｎｇＵｎｉｔ、ＣＵ）、ブロック、変換ユニット（ＴｒａｎｓｆｏｒｍＵｎｉｔ、ＴＵ）、予測ユニット（ＰｒｅｄｉｃｔｉｏｎＵｎｉｔ、ＰＵ）などが含まれる。エントロピー復号器／パーサーはさらに、符号化されたビデオシーケンスから、変換係数、量子化器パラメータ（ｑｕａｎｔｉｚｅｒｐａｒａｍｅｔｅｒ、ＱＰ）値、動きベクトルなどのような情報を抽出してもよい。

パーサー（４２０）はバッファメモリ（４１５）から受信されたビデオシーケンスに対してエントロピー復号化／解析操作を実行することで、シンボル（４２１）を作成することができる。パーサーは、符号化されたデータを受信するとともに、特定のシンボル（４２１）を選択的に復号化してもよい。また、パーサーは、特定のシンボル（４２１）が動き補償予測ユニット（４５３）、スケーラ／逆変換ユニット（４５１）、イントラ予測ユニット（４５２）又はループフィルタ（４５４）に提供されるかどうかを判定することができる。

符号化されたビデオピクチャ又は符号化されたビデオピクチャの一部のタイプ（例えば、インターピクチャとイントラピクチャ、インターブロックとイントラブロック）及び他の要因によって、シンボル（４２１）の再構築は、複数の異なるユニットに関与することができる。関与するユニット及び関与方式は、符号化されたビデオシーケンスからパーサー（４２０）が解析したサブグループ制御情報によって制御される。簡潔のために、パーサー（４２０）と以下の複数のユニットとの間にあるこのようなサブグループ制御情報の流れは説明していない。

既に言及された機能ブロックに加えて、復号器（３１０）は、概念的に、以下に説明する複数の機能ユニットに細分され得る。商業的な制約の下で実行する実際の実現方式において、これらのユニットの多くは互いに密接に相互作用し、少なくとも部分的に互いに統合されてもよい。しかしながら、開示されたテーマを説明するために、概念的には、以下の機能ユニットに細分されることは適切である。

第１ユニットは、スケーラ／逆変換ユニット（４５１）である。スケーラ／逆変換ユニット（４５１）は、パーサー（４２０）から、使用する変換方式、ブロックのサイズ、量子化因子、量子化スケーリング行列などを含む、シンボル（４２１）としての量子化変換係数及び制御情報を受信する。アグリゲーター（４５５）に入力され得るサンプル値を含むブロックを出力することができる。

いくつかの場合、スケーラ／逆変換（４５１）の出力サンプルは、イントラコーディングブロック、即ち、以前に再構築されたピクチャからの予測情報を使用しなく、現在ピクチャの以前に再構築された部分からの予測情報を使用できるブロックに属することができる。このような予測情報は、イントラ予測ユニット（４５２）によって提供され得る。いくつかの場合、イントラ予測ユニット（４５２）は、現在（部分的に再構築された）ピクチャ（４５６）から取得された、周辺が既に再構築された情報を利用して、再構築しているブロックと同じサイズ及び形状のブロックを生成する。いくつかの場合、アグリゲーター（４５５）は、各サンプルに基づいて、イントラ予測ユニット（４５２）によって生成された予測情報を、スケーラ／逆変換ユニット（４５１）から提供された出力サンプル情報に追加する。

他の場合には、スケーラ／逆変換ユニット（４５１）の出力サンプルはインター符号化され、且つ潜在的に動き補償されたブロックに属し得る。このような場合、動き補償予測ユニット（４５３）は参照ピクチャバッファ（４５７）にアクセスして、予測のためのサンプルを取得することができる。ブロックに属するシンボル（４２１）に基づき、取得されたサンプルに対して動き補償を行った後、これらのサンプルはアグリゲーター（４５５）によってスケーラ／逆変換ユニットの出力（この場合、残差サンプル又は残差信号と呼ばれる）に追加されることで、出力サンプル情報を生成することができる。動き補償予測ユニットが予測サンプルを抽出するための参照ピクチャメモリ内のアドレスは、動きベクトルによって制御されてもよく、動きベクトルはシンボル（４２１）の形で、動き補償予測ユニットによって使用されることができ、シンボル（４２１）は、例えばＸ、Ｙ及び参照ピクチャ成分を有してもよい。動き補償はさらに、サブサンプルの正確な動きベクトルが使用される際に参照ピクチャメモリから取得されたサンプル値の補間、動きベクトル予測メカニズムなどを含んでもよい。

アグリゲーター（４５５）の出力サンプルはループフィルタユニット（４５４）において、様々なループフィルタリング技術によって処理されてもよい。ビデオ圧縮技術はループ内フィルタ技術を含んでもよく、ループ内フィルタ技術は、符号化されたビデオビットストリームに含まれるパラメータによって制御され、前記パラメータはパーサー（４２０）からのシンボル（４２１）として、ループフィルタユニット（４５４）に適用されることができ、しかしながら、ビデオ圧縮技術はさらに、符号化されたピクチャ又は符号化されたビデオシーケンスの（復号化順序での）前の部分を復号化する期間に取得されたメタ情報に応答してもよいし、以前に構築されループフィルタリング処理されたサンプル値に応答してもよい。

ループフィルタユニット（４５４）の出力はサンプルストリームであってもよく、当該サンプルストリームは、将来のピクチャ間予測で使用されるために、レンダリング機器（３１２）に出力され、参照ピクチャバッファ（４５６）に記憶されてもよい。

ある符号化されたピクチャは、完全に再構築されたと、参照ピクチャとして、将来の予測のために用いられる。符号化されたピクチャは完全に再構築され、当該符号化されたピクチャは（例えばパーサー（４２０）によって）参照ピクチャとして認識されると、現在参照ピクチャ（４５６）は参照ピクチャバッファ（４５７）の一部になり、その後の符号化されたピクチャの再構築を開始する前に、新たな現在ピクチャメモリを再割当てることができる。

ビデオ復号器（３１０）は例えばＩＴＵ―ＴＨ．２６５提案書の規格に記録された所定のビデオ圧縮技術に基づき、復号化操作を実行してもよい。符号化されたビデオシーケンスは、例えば、ビデオ圧縮技術ドキュメント又は規格において、そのプロファイルで明確に指定されたビデオ圧縮技術又は規格の構文に従う意味で、符号化されたビデオシーケンスは使用されるビデオ圧縮技術又は規格によって指定される構文に合う。コンプライアンスについて、符号化されたビデオシーケンスの複雑度がビデオ圧縮技術又は規格のレベルによって限定される範囲内にあることも要求する。いくつかの場合、レベルは、最大ピクチャのサイズ、最大フレームレート、最大再構築サンプルレート（例えば、１秒あたりのメガのサンプルを単位として測定する）、最大参照ピクチャサイズなどを制限する。いくつかの場合、レベルによって設定される制限は、仮想参照復号器（ＨｙｐｏｔｈｅｔｉｃａｌＲｅｆｅｒｅｎｃｅＤｅｃｏｄｅｒ、ＨＲＤ）の仕様、及び符号化されたビデオシーケンスにおいてシグナリングされるＨＲＤバッファ管理のメタデータによってさらに限定されてもよい。

実施形態において、受信機（４１０）は、符号化されたビデオとともに追加（冗長）データを受信できる。追加データは符号化されたビデオシーケンスの一部として含まれる。追加データはビデオ復号器（３１０）によって利用されることで、データを適切に復号化し、及び／又は元のビデオデータをより正確に再構築する。追加データは、例えば時間、空間、又は信号対雑音比（ＳＮＲ）拡張層、冗長スライス、冗長ピクチャ、前方誤り訂正符号などの形式であってもよい。

図５は、実施形態によるビデオ符号器（３０３）の機能ブロック図であり得る。

符号器（３０３）は、ビデオソース（３０１）（符号器の一部ではない）からビデオサンプルを受信でき、当該ビデオソースは、符号器（３０３）によって符号化されるビデオ画像をキャプチャすることができる。

ビデオソース（３０１）は、符号器（３０３）によって符号化される、デジタルビデオサンプルストリームの形であるソースビデオシーケンスを提供してもよく、デジタルビデオサンプルストリームは任意の適切なビット深度（例えば、８ビット、１０ビット、１２ビットなど）、任意の色空間（例えば、ＢＴ．６０１ＹＣｒＣＢ、ＲＧＢなど）、及び任意の適切なサンプリング構成（例えば、ＹＣｒＣｂ４:２:０、ＹＣｒＣｂ４:４:４）を含んでもよい。メディアサービスシステムにおいて、ビデオソース（３０１）は以前に準備されたビデオを記憶するための記憶機器であってもよい。ビデオ会議システムにおいて、ビデオソース（３０１）は、ビデオシーケンスとして、ローカル画像情報をキャプチャするための撮影装置であってもよい。ビデオデータは、順番に見る際に動きが与えられる複数の個別のピクチャとして提供されてもよい。ピクチャそのものは、空間画素アレイとして組織されてもよく、なお、使用されるサンプリング構成、色空間などによって、各画素には１つ以上のサンプルが含まれてもよい。画素とサンプルとの間の関係は、当業者にとって容易に理解できる。以下の記載はサンプルに着目する。

実施形態によれば、符号器（３０３）は、リアルタイムで、又はアプリケーションに必要な任意の他の時間の制約で、ソースビデオシーケンスのピクチャを符号化するとともに、符号化されたビデオシーケンス（５４３）として圧縮される。適切な符号化速度で実行することは、コントローラ（５５０）の機能の１つである。コントローラは、以下に説明する他の機能ユニットを制御し、機能的にこれらの機能ユニットに結合される。簡潔のために、結合は図示されていない。コントローラによって設定されるパラメータは、レート制御関連パラメータ（ピクチャスキップ、量子化器、レート歪み最適化技術のλ値など・・・）、ピクチャのサイズ、ピクチャグループ（ＧＯＰ）の配置、最大動きベクトルの検索範囲などを含んでもよい。当業者は容易に、コントローラ（５５０）の他の機能を、特定のシステム設計に対して最適化されたビデオ符号器（３０３）に関するものとして認識できる。

いくつかのビデオ符号器は、当業者にとって容易に了解できる「符号化ループ」で操作する。非常に簡略化した説明として、符号化ループは、符号器（５３０）（その後、「ソース符号器」と呼ばれる）の（符号化対象となる入力ピクチャと参照ピクチャに基づいて、シンボルを作成することを担当する）符号化部分、及び符号器（３０３）に埋め込まれる（ローカル）復号器（５３３）を含んでもよく、復号器（５３３）は、（リモート）復号器によっても作成しようとするサンプルデータを作成するように、シンボルを再構築する（なぜならば、本開示のテーマで考慮されるビデオ圧縮技術において、シンボルと符号化されたビデオビットストリームとの間の任意の圧縮は可逆であるからだ）。当該再構築されたサンプルストリームは参照ピクチャメモリ（５３４）に入力される。シンボルストリームの復号化は、復号器位置（ローカル又はリモート）と関係がないビットが正確である結果が得られるため、参照ピクチャバッファのコンテンツはローカル符号器とリモート符号器との間でビットが正確である。つまり、符号器の予測部分から「見られる」参照ピクチャサンプルは、復号器が復号化中に予測を利用する際に「見られる」サンプル値とは全く同じである。このような参照ピクチャの同期性という基本原理（及び、例えばチャネル誤差のため、同期性を維持できない場合に発生するドリフト）は当業者にとって周知である。

「ローカル」復号器（５３３）の動作は、以上で図４を参照して詳細に説明された「リモート」復号器（３１０）の動作と同じであってもよい。しかしながら、図４を簡単に参照し、シンボルは利用可能であり、エントロピー符号器（５４５）とパーサー（４２０）が無損失でシンボルを符号化されたビデオシーケンスに符号化／復号化することができる場合、チャネル（４１２）、受信機（４１０）、バッファメモリ（４１５）及びパーサーが含まれた復号器（３１０）のエントロピー復号化部分を、復号器（５３３）で完全に実現する必要がない。

この場合、復号器に存在する解析／エントロピー復号化以外の任意の復号器技術も、必然的に、基本的に同じ機能形式で対応する符号器に存在することが観察され得る。符号器技術と完全に説明された復号器技術とは相互に逆であるため、符号器技術に対する説明を簡略化できる。より詳しい説明は、いくつかの箇所のみにとって必要であり、以下で提供される。

ソース符号器（５３０）の動作の一部として、ソース符号器（５３０）は、動き補償予測符号化を実行することができ、動き補償予測符号化はビデオシーケンスからの、「参照フレーム」として指定された１つ以上の以前に符号化されたフレームを参照して、入力フレームに対して予測符号化を行う。このようにして、符号化エンジン（５３２）は入力フレームの画素ブロックと、入力フレームの予測参照の参照フレームとして選択され得る画素ブロックとの間の差を符号化してもよい。

復号器（５３３）はソース符号器（５３０）によって作成された符号に基づいて、参照フレームとして指定されるフレームの以前に符号化されたビデオデータを復号化する。符号化エンジン（５３２）の操作は有利的に非可逆処理であってもよい。符号化されたビデオデータはビデオ復号器（図４において図示せず）で復号化されると、再構築されたビデオシーケンスは、一般的にいくつかの誤差を有するソースビデオシーケンスのレプリカであってもよい。復号器（５３３）は、ビデオ復号器によって参照フレームに対して実行され得る復号化処理をコピーするとともに、再構築された参照フレームを参照ピクチャキャッシュ（５３４）に記憶させることができる。このようにして、ビデオ符号器（３０３）は、再構築された参照フレームのレプリカをローカルに記憶することができ、これらのレプリカは、リモートビデオ復号器によって取得される再構築された参照フレームと共通のコンテンツを有する（伝送誤差が存在していない）。

予測器（５３５）は符号化エンジン（５３２）に対して予測検索を実行する。つまり、符号化対象となる新たなフレームに対して、予測器（５３５）は参照ピクチャメモリ（５３４）から、新たなピクチャの適切な予測参照として使用得るサンプルデータ（候補参照画素ブロックとして）、又は例えば参照ピクチャの動きベクトル、ブロック形状などの特定のメタデータを検索してもよい。予測器（５３５）はサンプルブロックに基づいて画素ブロックごとに動作することで、適切な予測参照を見つけることができる。いくつかの場合、予測器（５３５）によって取得された検索結果から決定されるように、入力ピクチャは参照ピクチャメモリ（５３４）に記憶された複数の参照ピクチャから取得される予測参照を有してもよい。

コントローラ（５５０）は、例えばビデオデータを符号化するためのパラメータとサブグループパラメータの設定を含む、ソース符号器（５３０）の符号化操作を管理することができる。

エントロピー符号器（５４５）において、以上の全ての機能ユニットの出力に対して、エントロピー符号化を行ってもよい。エントロピー符号器は、当業者の既知技術（例えばハフマン符号、可変長符号、算術符号など）に基づき、各種機能ユニットによって生成されたシンボルに対して可逆圧縮を行うことで、これらのシンボルを符号化されたビデオシーケンスに変換する。

伝送器（５４０）は、通信チャネル（５６０）を介した伝送の準備をするように、エントロピー符号器（５４５）によって作成された、符号化されたビデオシーケンスをバッファリングすることができ、当該通信チャネルは、符号化されたビデオデータを記憶するための記憶機器へのハードウェア／ソフトウェアリンクであってもよい。伝送器（５４０）はソース符号器（５３０）からの符号化されたビデオデータと、伝送対象となる他のデータ、例えば符号化されたオーディオデータ及び／又は補助データストリーム（ソースは図示せず）とをマージすることができる。

コントローラ（５５０）は、符号器（３０３）の動作を管理することができる。符号化中に、コントローラ（５５０）は各符号化されたピクチャに、特定の符号化されたピクチャタイプを割り当てもよく、これは、対応するピクチャに適用される符号化技術に影響する可能性がある。例えば、一般的に、ピクチャは以下のフレームタイプのうちの１つとして割り当てられる。

イントラピクチャ（Ｉピクチャ）は、シーケンス内の任意の他のフレームを予測のソースとして使用せずに符号化及び復号化されるピクチャであってもよい。一部のビデオコーデックは、例えば、独立復号器リフレッシュピクチャ（ＩｎｄｅｐｅｎｄｅｎｔＤｅｃｏｄｅｒＲｅｆｒｅｓｈ」）を含む異なるタイプのイントラピクチャを許容する。当業者は、Ｉピクチャのそれらの変形及び対応する用途と特徴を知っている。

予測ピクチャ（Ｐピクチャ）は、多くとも１つの動きベクトル及び参照インデックスを使用して各ブロックのサンプル値を予測するためのイントラ予測又はインター予測を使用して、符号化及び復号化を行うピクチャであってもよい。

双方向予測性ピクチャ（Ｂピクチャ）は、多くとも２つの動きベクトルと参照インデックスを使用して各ブロックのサンプル値を予測するためのイントラ予測又はインター予測を使用して、符号化及び復号化を行うピクチャであってもよい。同様に、複数の予測ピクチャは、２つを超える参照画像及び関連メタデータを単一のブロックの再構成に使用できる。

ソースピクチャは一般的に、空間的に、複数のサンプルブロック（例えば、それぞれ４×４、８×８、４×８又は１６×１６サンプルのブロック）に細分され、ブロックごとに符号化しされてもよい。ブロックは、該ブロックの対応するピクチャに適用される符号化割り当てによって決定される他の（既に符号化された）ブロックを参照して予測的に符号化されてもよい。例えば、Ｉピクチャのブロックは、非予測的に符号化されてもよいし、同一のピクチャの符号化されたブロックを参照して予測的に符号化されてもよい（空間的予測又はイントラ予測）。Ｐピクチャの画素ブロックは、非予測的に、１つの以前に符号化された参照ピクチャを参照して空間的予測又は時間的予測を介して符号化されてもよい。Ｂピクチャのブロックは、非予測的に、１つ又は２つの以前に符号化された参照ピクチャを参照して、空間的予測又は時間的予測を介して非予測的に符号化されてもよい。

ビデオ符号器（３０３）は例えばＩＴＵ―ＴＨ．２６５提案書の所定のビデオ符号化技術又は規格に基づき、符号化操作を実行し得る。ビデオ符号器（３０３）の動作中に、ビデオ符号器（３０３）は、入力ビデオシーケンスにおける時間的及び空間的冗長性による予測符号化操作を含む様々な圧縮動作を実行することができる。従って、符号化されたビデオデータは、使用されているビデオ符号化技術又は規格によって指定された構文に準拠し得る。

実施形態において、伝送器（５４０）は符号化されたビデオとともに、追加データを伝送できる。ソース符号器（５３０）は符号化されたビデオシーケンスの一部として、このようなデータを含んでもよい。追加データは時間／空間／ＳＮＲ拡張層、例えば冗長ピクチャ及びスライスのような他の形式の冗長データ、補充拡張情報（ＳＥＩ）メッセージ、ビデオユーザビリティ情報（ＶＵＩ）パラメータセットセグメントなどを含んでもよい。

従来技術において、ブロックがイントラ符号化されるかそれともインター符号化されるかということを指示するためのフラグｐｒｅｄ_ｍｏｄｅ_ｆｌａｇを符号化するために、隣接ブロックに適用されるフラグの値ではなく、１つのコンテキストのみを利用する。また、隣接ブロックがイントラインター予測モードによって符号化される場合、イントラ予測モードとインター予測モードの組み合わせを使用して、当該隣接ブロックを予測し、そして、そのため、フラグｐｒｅｄ_ｍｏｄｅ_ｆｌａｇをシグナリングするコンテキスト設計について、イントラインター予測モードによって隣接ブロックを符号化するかどうかを考慮することは、より効果的であり得る。

本明細書に記載の実施形態は、単独、又は任意の順序で組み合わせて利用されてもよい。以下は、フラグｐｒｅｄ_ｍｏｄｅ_ｆｌａｇは、現在ブロックがイントラ符号化されるか、それともインター符号化されるかということを指示する。

図６は、実施形態による、現在ブロック及び現在ブロックの隣接ブロックの図である。

図６を参照して、現在ブロック（６１０）及び現在ブロック（６１０）のトップ隣接ブロック（６２０）と左側隣接ブロック（６３０）を示す。トップ隣接ブロック（６２０）と左側隣接ブロック（６３０）のそれぞれの幅は４であり、高さは４である。

実施形態において、隣接ブロック（例えば、トップ隣接ブロック（６２０）と左側隣接ブロック（６３０））がイントラ予測モード、インター予測モード、又はイントラインター予測モードのいずれによって符号化されるかという情報を使用して、現在ブロック（例えば、現在ブロック（６１０））のフラグｐｒｅｄ_ｍｏｄｅ_ｆｌａｇをエントロピー符号化するためのコンテキスト値を取得する。詳細には、隣接ブロックがイントラインター予測モードによって符号化される場合、関連付けられたイントラ予測モードは、現在ブロックのイントラモード符号化及び／又はＭＰＭの導出に適用されるが、現在ブロックのフラグｐｒｅｄ_ｍｏｄｅ_ｆｌａｇをエントロピー符号化するためのコンテキスト値を導出する場合、隣接ブロックに対してイントラ予測を利用したにも関わらず、当該隣接ブロックはインターコーディングブロックであると見なされる。

一例において、イントラインター予測モードの関連付けられたイントラ予測モードは、常に平面モードである。

他の例において、イントラインター予測モードの関連付けられたイントラ予測モードは、常にＤＣモードである。

さらに他の例において、関連付けられるイントラ予測モードは、イントラインター予測モードで適用されるイントラ予測モードとアライメントする。

実施形態において、イントラインター予測モードによって隣接ブロック（例えば、トップ隣接ブロック（６２０）と左側隣接ブロック（６３０））を符号化する場合、関連付けられたイントラ予測モードは現在ブロック（例えば、現在ブロック（６１０））のイントラモード符号化及び／又はＭＰＭの導出に適用され、現在ブロックのフラグｐｒｅｄ_ｍｏｄｅ_ｆｌａｇをエントロピー符号化するためのコンテキスト値を導出する場合に、隣接ブロックもイントラコーディングブロックであると見なされる。

一例において、イントラインター予測モードの関連付けられたイントラ予測モードは常に平面モードである。

他の例において、イントラインター予測モードの関連付けられたイントラ予測モードは常にＤＣモードである。

さらに他の例において、関連付けられたイントラ予測モードは、イントラインター予測モードで適用されるイントラ予測モードとアライメントする。

一実施形態において、隣接ブロックがそれぞれイントラ予測モード、インター予測モード及びインター―イントラ予測モードによって符号化された場合、コンテキストインデックス又は値をそれぞれ２、０及び１だけインクリメントする。

他の実施形態において、隣接ブロックがそれぞれイントラ予測モード、インター予測モード及びインター―イントラ予測モードによって符号化された場合、コンテキストインデックス又は値をそれぞれ１、０及び０．５だけインクリメントして、最終的なコンテキストインデックスを、最も近い整数に丸める。

現在ブロックの全ての隣接ブロックに対してコンテキストインデックス又は値をインクリメントして、最終的なコンテキストインデックスを決定した後、決定された最終的なコンテキストインデックスを隣接ブロックの数で除算して、最も近い整数に丸めることで、平均コンテキストインデックスを決定することができる。決定された平均コンテキストインデックスに基づいて、フラグｐｒｅｄ_ｍｏｄｅ_ｆｌａｇを、現在ブロックがイントラ符号化又はインター符号化されることを指示するように設定するとともに、算術符号化を実行することで、現在ブロックのｐｒｅｄ_ｍｏｄｅ_ｆｌａｇを符号化する。

実施形態において、現在ブロック（例えば、現在ブロック（６１０））がイントラ予測モード、インター予測モード、又はインター―イントラ予測モードのいずれによって符号化されるかという情報を使用して、現在ブロックのＣＢＦをエントロピー符号化するための１つ以上のコンテキスト値を取得する。

一実施形態において、３つの別個のコンテキスト（例えば、変数）は、ＣＢＦをエントロピー符号化するために使用され、１つのコンテキストは、現在ブロックがイントラ予測モードによって符号化される場合に使用され、１つのコンテキストは、現在ブロックがインター予測モードによって符号化される場合に使用され、及び、１つのコンテキストは、現在ブロックがイントラインター予測モードによって符号化される場合に使用される。当該３つの別個のコンテキストは、輝度ＣＢＦを符号化するためにのみ、色度ＣＢＦを符号化するためにのみ、又は輝度ＣＢＦと色度ＣＢＦの両方を符号化するためにのみ適用されてもよい。

他の実施形態において、２つの別個のコンテキスト（例えば、変数）は、ＣＢＦをエントロピー符号化するために使用され、１つのコンテキストは、現在ブロックがイントラ予測モードによって符号化される場合に使用され、１つのコンテキストは現在ブロックがインター予測モード又はイントラインター予測モードによって符号化される場合に使用される。当該２つの別個のコンテキストは、輝度ＣＢＦを符号化するためにのみ、色度ＣＢＦを符号化するためにのみ、又は輝度ＣＢＦと色度ＣＢＦの両方を符号化するためにのみ適用されてもよい。

さらなる他の実施形態において、２つの別個のコンテキスト（例えば、変数）は、ＣＢＦをエントロピー符号化するために使用され、１つのコンテキストは、現在ブロックがイントラ予測モード又はイントラインター予測モードによって符号化される場合に使用され、１つのコンテキストは、現在ブロックがインター予測モードによって符号化される場合に使用される。当該２つの別個のコンテキストは、輝度ＣＢＦを符号化するためにのみ、色度ＣＢＦを符号化するためにのみ、又は輝度と色度ＣＢＦの両方を符号化するためにのみに適用されてもよい。

図７は、実施形態による、ビデオシーケンスの復号化又は符号化のためのイントラインター予測を制御する方法（７００）を示すフローチャートである。いくつかの実現方法において、図７の１つ以上の処理ブロックは復号器（３１０）によって実行され得る。いくつかの実現方式において、図７の１つ以上の処理ブロックは、復号器（３１０）と別の、又は復号器（３１０）を含む他の機器、又は機器グループ（例えば、符号器（３０３））によって実行され得る。

図７を参照し、第１ブロック（７１０）において、方法（７００）は、現在ブロックの隣接ブロックがイントラインター予測モードによって符号化されるかどうかを決定するステップを含む。隣接ブロックがイントラインター予測モードによって符号化されていないと決定された（７１０―ＮＯ）ことに基づいて、方法（７００）は終了する。

隣接ブロックがイントラインター予測モードによって符号化されていると決定された（７１０―ＹＥＳ）ことに基づいて、第２ブロック（７２０）において、方法（７００）はイントラインター予測モードに関連付けられたイントラ予測モードを使用して現在ブロックのイントラモード符号化を実行するステップを含む。

第３ブロック（７３０）において、方法（７００）は、隣接ブロックに関連付けられた予測モードフラグを設定するステップを含む。

第４ブロック（７４０）において、方法（７００）は、設定された、隣接ブロックに関連付けられた予測モードフラグに基づいて、コンテキスト値を取得するステップを含む。

第５ブロック（７５０）において、方法（７００）は、取得されたコンテキスト値を使用して、現在ブロックがイントラ符号化されていることを示す、現在ブロックに関連付けられた予測モードフラグのエントロピー符号化を実行するステップを含む。

方法（７００）はさらに、隣接ブロックがイントラインター予測モードによって符号化されていると決定された（７１０―ＹＥＳ）ことに基づいて、イントラインター予測モードに関連付けられたイントラ予測モードを利用して現在ブロックのＭＰＭの導出を実行するステップを含む。

イントラインター予測モードに関連付けられたイントラ予測モードは、平面モード、ＤＣモード、又はイントラインター予測モードで適用されるイントラ予測モードであってもよい。

隣接ブロックに関連付けられた予測モードフラグを設定することは、当該隣接ブロックがイントラ符号化されていることを示すように、隣接ブロックに関連付けられた予測モードフラグを設定するステップを含んでもよい。

隣接ブロックに関連付けられた予測モードフラグを設定することは、当該隣接ブロックがインター符号化されていることを示すように、隣接ブロックに関連付けられた予測モードフラグを設定するステップを含んでもよい。

方法（７００）はさらに、隣接ブロックがイントラ予測モード、インター予測モード、又はイントラインター予測モードのいずれによって符号化されるかを決定するステップと、隣接ブロックがイントラ予測モードによって符号化されていると決定されたことに基づいて、現在ブロックに関連付けられた予測モードフラグのコンテキストインデックスを２だけインクリメントし、隣接ブロックがインター予測モードにより符号化されていると決定されたことに基づいて、コンテキストインデックスを０だけインクリメントし、隣接ブロックがイントラインター予測モードによって符号化されていると決定されたことに基づいて、コンテキストインデックスを１だけインクリメントするステップと、インクリメントされたコンテキストインデックス、及び現在ブロックの隣接ブロックの数に基づいて、平均コンテキストインデックスを決定するステップと、決定された平均コンテキストインデックスに基づいて、現在ブロックに関連付けられた予測モードフラグを設定するステップと、を含んでもよい。

方法はさらに、隣接ブロックがイントラ予測モード、インター予測モード、又はイントラインター予測モードのいずれによって符号化されるかを決定するステップと、隣接ブロックがイントラ予測モードによって符号化されていると決定されたことに基づいて、現在ブロックに関連付けられた予測モードフラグのコンテキストインデックスを１だけインクリメントし、隣接ブロックがインター予測モードによって符号化されていると決定されたことに基づいて、コンテキストインデックスを０だけインクリメントし、隣接ブロックがイントラインター予測モードによって符号化されていると決定されたことに基づいて、コンテキストインデックスを０.５だけインクリメントするステップと、インクリメントされたコンテキストインデックス、及び現在ブロックの隣接ブロックの数に基づいて、平均コンテキストインデックスを決定するステップと、決定された平均コンテキストインデックスに基づいて、現在ブロックに関連付けられた予測モードフラグを設定するステップと、を含んでもよい。

図７は方法（７００）のブロック例を示したが、いくつかの実現方式において、図７に描画されたこれらのブロックよりも、方法（７００）は、追加のブロック、より少ないブロック、異なるブロック、又は異なる配置のブロックを含んでもよい。追加又は代わりとして、方法（７００）のブロックのうちの２つ又は複数のブロックを並行して実行してもよい。

また、提案された方法は、処理回路（例えば、１つ以上のプロセッサ、又は１つ以上の集積回路）によって実現されてもよい。一例において、１つ以上のプロセッサは、非一時的なコンピュータ可読媒体に記憶された、提案された方法のうちの１つ以上の方法を実行するためのプログラムを実行する。

図８は、実施形態による、ビデオシーケンスの復号化又は符号化のためのイントラインター予測を制御するための装置（８００）の簡略化ブロック図である。

図８を参照し、装置（８００）は、第１決定コード（８１０）と、実行コード（８２０）と、設定コード（８３０）とを含む。装置（８００）はさらに、インクリメントコード（８４０）と、第２決定コード（８５０）とを含んでもよい。

第１決定コード（８１０）は、少なくとも１つのプロセッサに、現在ブロックの隣接ブロックがイントラインター予測モードによって符号化されるかどうかを決定させるように配置される。

実行コード（８２０）は、少なくとも１つのプロセッサに、隣接ブロックがイントラインター予測モードによって符号化されていると決定されたことに基づいて、イントラインター予測モードに関連付けられたイントラ予測モードを利用して、現在ブロックのイントラモード符号化を実行させるように配置される。

設定コード（８３０）は、少なくとも１つのプロセッサに、隣接ブロックがイントラインター予測モードによって符号化されていると決定されたことに基づいて、以下のように動作させるように配置され、即ち、隣接ブロックに関連付けられた予測モードフラグを設定し、設定された、隣接ブロックに関連付けられた予測モードフラグに基づいて、コンテキスト値を取得し、取得されたコンテキスト値を利用して、現在ブロックに関連付けられた予測モードフラグのエントロピー符号化を実行し、当該予測モードフラグは、現在ブロックがイントラ符号化されていることを示す。

実行コード（８２０）はさらに、少なくとも１つのプロセッサに、隣接ブロックがイントラインター予測モードによって符号化されていると決定されたことに基づいて、イントラインター予測モードに関連付けられたイントラ予測モードを利用して、現在ブロックの最確モード（ＭＰＭ）の導出を実行させるように配置されてもよい。

イントラインター予測モードに関連付けられたイントラ予測モードは平面モード、ＤＣモード、又はイントラインター予測モードで適用されるイントラ予測モードであってもよい。

設定コード（８３０）はさらに、少なくとも１つのプロセッサに、当該隣接ブロックがイントラ符号化されていることを示すように、隣接ブロックに関連付けられた予測モードフラグを設定させるように配置されてもよい。

設定コード（８３０）はさらに、少なくとも１つのプロセッサに、当該隣接ブロックがインター符号化されていることを示すように、隣接ブロックに関連付けられた予測モードフラグを設定させるように配置されてもよい。

第１決定コード（８１０）はさらに、少なくとも１つのプロセッサに、隣接ブロックがイントラ予測モード、インター予測モード、又はイントラインター予測モードのいずれによって符号化されるかを決定させるように配置されてもよい。インクリメントコード（８４０）は、少なくとも１つのプロセッサに、隣接ブロックがイントラ予測モードによって符号化されていると決定されたことに基づいて、現在ブロックに関連付けられた予測モードフラグのコンテキストインデックスを２だけインクリメントするステップと、隣接ブロックがインター予測モードによって符号化されていると決定されたことに基づいて、コンテキストインデックスを０だけインクリメントするステップと、隣接ブロックがイントラインター予測モードによって符号化されていると決定されたことに基づいて、前記コンテキストインデックスを１だけインクリメントステップと、実行させるように配置されてもよい。第２決定コード（８５０）はさらに、少なくとも１つのプロセッサに、インクリメントされたコンテキストインデックス、及び現在ブロックの隣接ブロックの数に基づいて、平均コンテキストインデックスを決定させるように配置されてもよい。設定コード（８３０）はさらに、少なくとも１つのプロセッサに、決定された平均コンテキストインデックスに基づいて、現在ブロックに関連付けられた予測モードフラグを設定させるように配置されてもよい。

第１決定コード（８１０）はさらに、少なくとも１つのプロセッサに、隣接ブロックがイントラ予測モード、インター予測モード、又はイントラインター予測モードのいずれにより符号化されるかを決定させるように配置されてもよい。インクリメントコード（８４０）は、少なくとも１つのプロセッサに、隣接ブロックがイントラ予測モードによって符号化されていると決定されたことに基づいて、現在ブロックに関連付けられた予測モードフラグのコンテキストインデックスを１だけインクリメントするステップと、隣接ブロックがインター予測モードによって符号化されていると決定されたことに基づいて、コンテキストインデックスを０だけインクリメントするステップと、隣接ブロックがイントラインター予測モードによって符号化されたと決定されていることに基づいて、前記コンテキストインデックスを０．５だけインクリメントするステップと、を実行させるように配置されてもよい。第２決定コード（８５０）は、少なくとも１つのプロセッサに、インクリメントされたコンテキストインデックス、及び現在ブロックの隣接ブロックの数に基づいて、平均コンテキストインデックスを決定させるように配置されてもよい。設定コード（８３０）はさらに、少なくとも１つのプロセッサに、決定された平均コンテキストインデックスに基づいて、現在ブロックに関連付けられた予測モードフラグを設定させるように配置されてもよい。

上記の技術はコンピュータ可読命令を使用してコンピュータソフトウェアとして実現され、１つ以上のコンピュータ可読媒体に物理的に記憶されてもよい。。

図９は実施形態を実現するのに適したコンピュータシステム（９００）の図である。

コンピュータソフトウェアは、任意の適切なマシンコード又はコンピュータ言語によって符号化することができ、マシンコード又はコンピュータ言語に対して、アセンブル、コンパイル、リンクなどのメカニズムを実行することで、コンピュータ中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）などによって直接的に実行されるか、又は解釈、マイクロコードなどによって実行される命令を含むコードを作成することができる。

命令は、例えばパーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーム機器、モノのインターネット機器などを含む、様々なタイプのコンピュータ又はそれらのコンポーネントで実行されることができる。

図９に示すコンピュータシステム（９００）のためのコンポーネントは、本質的に例示であり、各実施形態を実現するためのコンピュータソフトウェアの使用範囲又は機能に制限を加えることを意図するものではない。コンポーネントの配置も、コンピュータシステム（９００）の例示的な実施形態に示めされるコンポーネントのいずか、又はそれらの組み合わせに関連する任意の依存性又は要件を有するものとして解釈されるべきではない。

コンピュータシステム（９００）はいくつかのヒューマンインタフェース入力機器を含んでもよい。このようなヒューマンインタフェース入力機器は、例えば触覚入力（例えば：キーストローク、スライド、データグローブ移動）、オーディオ入力（例えば：声、手をたたく音）、視覚入力（例えば：姿勢）、嗅覚入力（図示せず）などの、１つ以上の人間ユーザーによる入力に応答することができる。ヒューマンインタフェース機器は例えば、オーディオ（例えば、音声、音楽、環境音）、画像（例えば、スキャンした画像、静的画像撮影装置から取得された写真画像）、ビデオ（例えば２次元ビデオ、ステレオビデオが含まれる３次元ビデオ）などの、人間の意識的な入力に必ずしも直接関連しない特定のメディアをキャプチャするために使用されることもできる。

ヒューマンインタフェース入力機器は、キーボード（９０１）、マウス（９０２）、タッチパッド（９０３）、タッチパネル（９１０）、データグローブ（９０４）、ジョイスティック（９０５）、マイク（９０６）、スキャナ（９０７）、撮影装置（９０８）のうちの１つ以上を含んでもよい（それぞれが１つのみ図示される）。

コンピュータシステム（９００）はさらにいくつかのヒューマンインタフェース出力機器を含んでもよい。このようなヒューマンインタフェース出力機器は、例えば触覚出力、音、光及び匂い／味を介して１つ以上の人間ユーザーの感覚を刺激することができる。このようなヒューマンインタフェース出力機器は、触覚出力機器（例えば、タッチパネル（９１０）、データグローブ（９０４）又はジョイスティック（９０５）による触覚フィードバック機器があるが、入力機器として用いられていない触覚フィードバック機器も存在する）、オーディオ出力機器（例えばスピーカー（９０９）、ヘッドフォン（図示せず））、視覚出力機器（例えばスクリーン（９１０）であって、陰極線管（ＣＲＴ）スクリーン、液晶ディスプレイ（ＬＣＤ）スクリーン、プラズマスクリーン、有機発光ダイオード（ＯＬＥＤ）スクリーンを含み、各々はタッチスクリーン入力能力、触覚フィードバック能力を有してもよく、有してなくてもよく、そのうちのいくつかのスクリーンは、立体グラフィックス出力のような手段で、２次元視覚出力又は３次元以上の出力を出力できる可能性があり、バーチャルリアリティ眼鏡（図示せず）、ホログラフィックディスプレイ及びスモークタンク（図示せず））、及びプリンター（図示せず）を含む。

コンピュータシステム（９００）はさらに人間がアクセスし得る記憶機器及びその関連する媒体を含んでもよく、例えばＣＤ／ＤＶＤなどの媒体（９２１）を有するＣＤ／ＤＶＤＲＯＭ／ＲＷ（９２０）が含まれた光学媒体、サムドライブ（９２２）、取り外し可能なハードドライブ又はソリッドステートドライブ（９２３）、磁気テープとフロッピーディスクのような従来の磁気媒体（図示せず）、セキュリティドングル（図示せず）ような、専用ＲＯＭ／ＡＳＩＣ／ＰＬＤに基づく機器などを含む。

また、当業者は、現在開示されたテーマに関連して使用される「コンピュータ可読媒体」という用語には、伝送媒体、搬送波又は他の一時的な信号が含まれていないことを理解するべきである。

コンピュータシステム（９００）はさらに１つ以上の通信ネットワークへのインタフェースを含んでもよい。ネットワークは、例えば無線、有線、光学などであってもよい。ネットワークはさらに、ローカルエリア、ワイドエリア、メトロポリタン、車両及び工業、リアルタイム、遅延耐性などであってもよい。ネットワークの例は、イーサネットなどのローカルエリアネットワーク、無線ＬＡＮ、セルラーネットワーク（グローバルモバイルコミュニケーションシステム（ＧＳＭ）、第三世代（３Ｇ）、第四世代（４Ｇ）、第五世代（５Ｇ）、ロングタームエボリューション（ＬＴＥ）などが含まれる）、テレビ有線又は無線広域デジタルネットワーク（有線テレビ、衛星テレビ及び地上波テレビが含まれる）、車両及び工業（ＣＡＮＢｕｓが含まれる）などを含む。いくつかのネットワークは一般的に、特定の汎用データポート又は周辺バス（９４９）（例えば、コンピュータシステム（９００）のユニバーサルシリアルバス（ＵＳＢ）ポート）に接続される外部ネットワークインタフェースアダプタを必要とし、他のネットワークは一般的に、以下で説明されるシステムバスに接続されることで、コンピュータシステム（９００）のコアに集積される（例えば、ＰＣコンピュータシステムのイーサネットインタフェース、又はスマートフォンコンピュータシステムのセルラーネットワークインタフェースに集積される）。これらのネットワークのいずれかを使用して、コンピュータシステム（９００）は他のエンティティと通信できる。このような通信は一方向受信のみ（例えば、放送テレビ）、一方向送信のみ（例えば、あるＣＡＮｂｕｓ機器へのＣＡＮｂｕｓ）、又は双方向（例えば、ローカルエリア又はワイドエリアデジタルネットワークを介して他のコンピュータシステムに達する）であってもよい。上記のようなこれらのネットワーク及びネットワークインタフェースのそれぞれに、特定のプロトコル及びプロトコルスタックを使用することができる。

以上のヒューマンインタフェース機器、人間がアクセスし得る記憶機器及びネットワークインタフェースは、コンピュータシステム（９００）のコア（９４０）に接続され得る。

コア（９４０）は１つ以上の中央処理ユニット（ＣＰＵ）（９４１）、グラフィック処理ユニット（ＧＰＵ）（９４２）、フィールドプログラム可能なゲートアレイ（ＦＰＧＡ）（９４３）という形式の専門プログラム可能な処理ユニット、いくつかのタスクのためのハードウェアアクセラレータ（９４４）などを含む。これらの機器は、読み取り専用メモリ（ＲＯＭ）（９４５）、ランダムアクセスメモリ（ＲＡＭ）（９４６）、内部大容量記憶装置（例えば内部のユーザーがアクセスできないハードディスクドライブ、ソリッドステートドライブ（ＳＳＤ）など）（９４７）とともに、システムバス（９４８）を介して接続される。いくつかのコンピュータシステムにおいて、１つ以上の物理プラグという形式で、システムバス（９４８）にアクセスすることで、追加されたＣＰＵ、ＧＰＵなどによる拡張を可能にすることができる。周辺機器は、直接的又は周辺バス（９４９）を介してコアのシステムバス（９４８）に接続され得る。周辺バスのアーキテクチャは周辺コンポーネント相互接続（ＰＣＩ）、ＵＳＢなどを含む。

ＣＰＵ（９４１）、ＧＰＵ（９４２）、ＦＰＧＡ（９４３）及びアクセラレータ（９４４）はいくつかの命令を実行することができ、これらの命令を組み合わせると、上記のコンピュータコードを構成することができる。当該コンピュータコードはＲＯＭ（９４５）又はＲＡＭ（９４６）に記憶されてもよい。一時的なデータもＲＡＭ（９４６）に記憶され、永久データは例えば内部大容量記憶装置（９４７）に記憶されてもよい。キャッシュメモリによって記憶機器のいずれかへの高速記憶及び検索を実現することができ、当該キャッシュメモリは１つ以上のＣＰＵ（９４１）、ＧＰＵ（９４２）、大容量記憶装置（９４７）、ＲＯＭ（９４５）、ＲＡＭ（９４６）などに密接に関連することができる。

コンピュータ可読媒体は、コンピュータが実現する各種操作を実行するためのコンピュータコードをその上に有することができる。媒体とコンピュータコードとは、実施形態の目的のために、特別に設計及び構築される媒体とコンピュータコードであってもよいし、又は、コンピュータソフトウェアの当業者にとって周知且つ利用可能なタイプのものであってもよい。

限定ではなく、例示として、アーキテクチャを有するコンピュータシステム（９００）、特にコア（９４０）は、プロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータなどを含む）が１つ以上の有形コンピュータ可読媒体に実装されるソフトウェアを実行することで、機能を提供することができる。このようなコンピュータ可読媒体は、以上に紹介された、ユーザーがアクセスし得る大容量記憶装置に関する媒体、及びコア内部大容量記憶装置（９４７）又はＲＯＭ（９４５）などの非一時的な性質を持つコア（９４０）のいくつかの記憶装置であってもよい。各種実施形態を実現するためのソフトウェアはこのような機器に記憶されるとともに、コア（９４０）によって実行される。特定のニーズに応じて、コンピュータ可読媒体には１つ以上のメモリ機器又はチップが含まれてもよい。ソフトウェアは、コア（９４０）、特にそのうちのプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む）に、本明細書で説明された、ＲＡＭ（９４６）に記憶されるデータ構成を限定すること、及びソフトウェアによって限定されたプロセスに基づきこれらのデータ構成を修正することが含まれる特定プロセス又は特定プロセスの特定部分を実行させる。また、さらに又は代替として、コンピュータシステムは、ハードワイヤード又は他の方式で回路（例えば、アクセラレータ（９４４））に実装されるロジックによって機能を提供し、当該ロゾックは、ソフトウェアの代わりとして、又はソフトウェアとともに動作することで、本明細書で説明された特定プロセス又は特定プロセスの特定部分を実行することができる。適切な場合、ソフトウェアに対する言及にはロジックが含まれ、逆に、ロジックに対する言及にはソフトウェアが含まれてもよい。適切な場合、コンピュータ可読媒体に対する言及には、実行するためのソフトウェアが記憶される回路（例えば、集積回路（ＩＣ））、実行するためのロジックを具現化する回路、又はその両方が含まれてもよい。実施形態にはハードウェアとソフトウェアとの任意の適切な組み合わせが含まれる。

本開示には既にいくつかの例示的な実施形態が説明されたが、本開示の範囲内に含まれる変更、置き換え及び様々な代替の均等物が存在する。従って、当業者は、本明細書では明示的に示されていないか、又は説明されていないが、本開示の原理を具現化したのでその精神及び範囲内にある多数のシステム及び方法を考案できることが理解されたい。

Claims

エンコーダが実行する、ビデオシーケンスの符号化のためにイントラインター予測を制御する方法であって、
現在ブロックの上又は左の隣接ブロックに関連付けられる第１予測モードフラグｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇを、前記隣接ブロックがインター予測モードであるのか、それともイントラ予測モードであるのかを示すように設定するステップと、
決定フラグを用いて、前記現在ブロックの上又は左の前記隣接ブロックがインター予測モードで符号化されているのか、それともイントラインター予測モードで符号化されているのかを最終決定するステップと、
前記隣接ブロックに関連付けられる前記第１予測モードフラグｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇに基づき、前記現在ブロックに関連付けられる第２予測モードフラグｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇに関するコンテキスト値を導出するステップと、
導出した前記コンテキスト値を用いて、前記現在ブロックに関連付けられる前記第２予測モードフラグｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇのエントロピーコーディングを実行ステップと、
を含む、方法。
前記隣接ブロックが前記イントラインター予測モードによって符号化されていると最終決定したことに基づき、前記イントラインター予測モードに関連付けられているイントラ予測モードを用いて、前記現在ブロックのイントラ予測コーディングを実行するステップと、
をさらに含む、請求項１に記載の方法。
前記隣接ブロックが前記イントラインター予測モードによって符号化されていると最終決定したことに基づき、前記イントラインター予測モードに関連付けられているイントラ予測モードを用いて、前記現在ブロックの最確モード（ＭＰＭ）の導出を実行するステップをさらに含む、請求項１又は２に記載の方法。
前記イントラインター予測モードに関連付けられているイントラ予測モードは平面モードである、請求項２又は３に記載の方法。
前記イントラインター予測モードに関連付けられているイントラ予測モードは直流ＤＣモードである、請求項２又は３に記載の方法。
前記イントラインター予測モードに関連付けられているイントラ予測モードは、前記イントラインター予測モードにおいて適用されるイントラ予測モードである、請求項２又は３に記載の方法。
前記コンテキスト値を取得するステップは、
前記隣接ブロックがイントラ予測モードによって符号化されていると決定したことに基づき、前記コンテキスト値を２だけインクリメントするステップと、
前記隣接ブロックがインター予測モードによって符号化されていると決定したことに基づき、前記コンテキスト値を０だけインクリメントするステップと、
前記隣接ブロックがイントラインター予測モードによって符号化されていると決定したことに基づき、前記コンテキスト値を１だけインクリメントするステップと、
をさらに含み、当該方法は、
インクリメント後の前記コンテキスト値及び前記現在ブロックの隣接ブロックの数に基づき、平均コンテキストインデックスを決定するステップと、
決定した前記平均コンテキストインデックスに基づき、前記第２予測モードフラグを設定するステップと、
をさらに含む、請求項１乃至６のいずれか一項に記載の方法。
前記第２予測モードフラグに関する前記コンテキスト値を取得するステップは、
前記隣接ブロックがイントラ予測モードによって符号化されていると決定したことに基づき、前記コンテキスト値を１だけインクリメントするステップと、
前記隣接ブロックがインター予測モードによって符号化されていると決定したことに基づき、前記コンテキスト値を０だけインクリメントするステップと、
前記隣接ブロックがイントラインター予測モードによって符号化されていると決定したことに基づき、前記コンテキスト値を０．５だけインクリメントするステップと、
をさらに含み、当該方法は、
インクリメント後の前記コンテキスト値及び前記現在ブロックの隣接ブロックの数に基づき、平均コンテキストインデックスを決定するステップと、
決定した前記平均コンテキストインデックスに基づき、前記第２予測モードフラグを設定するステップと、
をさらに含む、請求項１乃至６のいずれか一項に記載の方法。
デコーダが実行する、ビデオシーケンスの復号のためにイントラインター予測を制御する方法であって、
現在ブロックの上又は左の隣接ブロックに関連付けられる第１予測モードフラグｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇを、前記隣接ブロックがインター予測モードであるのか、それともイントラ予測モードであるのかを示すように設定するステップと、
決定フラグを用いて、前記現在ブロックの上又は左の前記隣接ブロックがインター予測モードで符号化されているのか、それともイントラインター予測モードで符号化されているのかを最終決定するステップと、
前記隣接ブロックに関連付けられる前記第１予測モードフラグｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇに基づき、前記現在ブロックに関連付けられる第２予測モードフラグｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇに関するコンテキスト値を導出するステップと、
導出した前記コンテキスト値を用いて、前記現在ブロックに関連付けられる前記第２予測モードフラグｐｒｅｄ＿ｍｏｄｅ＿ｆｌａｇのエントロピーコーディングを実行ステップと、
を含む、方法。
前記隣接ブロックが前記イントラインター予測モードによって符号化されていると最終決定したことに基づき、前記イントラインター予測モードに関連付けられているイントラ予測モードを用いて、前記現在ブロックのイントラ予測コーディングを実行するステップと、
をさらに含む、請求項９に記載の方法。
エンコーダであって、
プログラムを記憶している少なくとも１つのメモリと、
前記メモリに接続される少なくとも１つのプロセッサと、
を含み、
前記プログラムは、前記少なくとも１つのプロセッサに、請求項１乃至８のいずれか一項に記載の方法を実行させるように構成されている、
エンコーダ。
デコーダであって、
プログラムを記憶している少なくとも１つのメモリと、
前記メモリに接続される少なくとも１つのプロセッサと、
を含み、
前記少なくとも１つのプロセッサは、前記プログラムを実行して、請求項９又は１０に記載の方法を実現するように構成される、
デコーダ。
コンピュータに、請求項１乃至１０のいずれか一項に記載の方法を実行させるためのプログラム