WO2023067822A1

WO2023067822A1 - 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法および映像システム

Info

Publication number: WO2023067822A1
Application number: PCT/JP2021/045640
Authority: WO
Inventors: 健太徳満; 慶一蝶野; 健太飯田; 裕哉八巻
Original assignee: 日本電気株式会社
Priority date: 2021-10-22
Filing date: 2021-12-10
Publication date: 2023-04-27
Also published as: JPWO2023067822A1

Abstract

映像符号化装置１０は、イントラ予測の予測モードを、符号量と符号化歪みとに基づいて決定する予測モード決定部１１を含み、予測モード決定部１１は、イントラ予測が実行されるときの符号化対象ブロックの発生符号量を、符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定する符号量推定部１２を含む。

Description

映像符号化装置、映像復号装置、映像符号化方法、映像復号方法および映像システム

　本発明は、映像信号を符号化または復号する映像符号化装置、映像復号装置、映像符号化方法、映像復号方法および映像システムに関する。

　非特許文献１は、ＶＶＣ（Versatile Video Coding）と呼ばれる映像符号化方式を開示する。

　非特許文献１に記載された映像符号化方式では、ディジタル化された映像の各フレームは符号化ツリーユニット（ＣＴＵ：Coding Tree Unit）に分割され、ラスタスキャン順に各ＣＴＵが符号化される。

　各ＣＴＵは、四分木（ＱＴ：Quad-Tree）構造またはマルチタイプ木（ＭＭＴ：Multi-Type Tree）構造で、符号化ユニット（ＣＵ：Coding Unit）に分割されて符号化される。四分木構造を用いる分割では、ブロックが、水平および垂直に等分割される。マルチタイプ木構造を用いる分割では、ブロックが、水平もしくは垂直に２分割または３分割される。

　各ＣＵは、予測ユニット（ＰＵ：Prediction Unit）に分割されて予測符号化される。予測符号化には、イントラ予測と動き補償予測（以下、インター予測という。）がある。各ＰＵの予測誤差は、周波数変換に基づいて変換符号化される。

　イントラ予測は、符号化対象フレームと表示時刻が同一の再構築画像から予測画像を生成する予測である。非特許文献１では、図１４に示す６５種類の角度イントラ予測が定義されている。図１４において、数字は、予測モード番号を示す。角度イントラ予測では、符号化対象ブロック周辺の再構築画素を６５種類の方向のいずれかに外挿して、イントラ予測信号が生成される。非特許文献１では、角度予測に加えて、符号化対象ブロック周辺の再構築画素を平均するDC予測、および、符号化対象ブロック周辺の再構築画素を線形補間するPlanar予測が定義されている。

"Versatile video coding", Recommendation ITU-T H.266 (08/2020)

　図１５は、符号化対象ブロックのイントラ予測の、符号化対象ブロックの上側で隣接するブロックの予測モードおよび左側で隣接するブロックの予測モードへの依存関係を説明するための説明図である。図１５において、矢印は、依存関係を示す。

　上記のような依存関係が存在するので、ＣＵ単位での符号化コストの計算を並列して実行することはできない。その結果、ＣＵ単位でのイントラ予測を並列して実行することはできない。

　なお、予測方向選択部２０５が、符号量の計算をしない場合、すなわち、符号量計算部２１１が取り除かれた場合には、符号化コストの計算を並列して実行可能である。しかし、予測方向選択部２０５がそのように構成された場合には、符号化歪みのみに基づいて符号化効率が計算される。その結果、符号化対象ブロックの予測モードの選択精度が低下する。換言すれば、イントラ予測による符号化効率が低下する。

　本発明は、符号化効率の低下を防止しつつ、ＣＵ単位でのイントラ予測を並列して実行可能な映像符号化装置、映像復号装置、映像符号化方法、映像復号方法および映像システムを提供することを目的とする。

　本発明による映像符号化装置は、イントラ予測の予測モードを、符号量と符号化歪みとに基づいて決定する予測モード決定手段を含み、予測モード決定手段は、イントラ予測が実行されるときの符号化対象ブロックの発生符号量を、当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定する符号量推定手段を含む。

　本発明による映像復号装置は、イントラ予測が実行されるときの符号化対象ブロックの発生符号量であって当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定された発生符号量に基づいて決定された予測モードと、イントラ予測に関するシンタクス要素との関係が設定された対応記憶手段と、対応記憶手段に設定されている関係に基づいて予測モードを特定する予測モード特定手段とを含む。

　本発明による映像符号化方法は、イントラ予測の予測モードを、符号量と符号化歪みとに基づいて決定し、予測モードを決定するときに、イントラ予測が実行されるときの符号化対象ブロックの発生符号量を、当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定する。

　本発明による、映像復号方法は、イントラ予測が実行されるときの符号化対象ブロックの発生符号量であって当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定された発生符号量に基づいて決定された予測モードと、イントラ予測に関するシンタクス要素との関係が設定された対応記憶手段に設定されている関係に基づいて予測モードを特定する。

　本発明による映像システムは、上記の映像符号化装置と、上記の映像復号装置とを含む。

　本発明によれば、符号化効率の低下を防止しつつ、ＣＵ単位でのイントラ予測を並列して実行可能になる。

映像符号化装置の構成例を示すブロック図である。予測方向を選択する予測方向選択部の構成例を示すブロック図である。第１の実施形態における予測方向選択部の構成例を示すブロック図である。第１の実施形態における予測モードと推定符号量との関係を示す説明図である。予測方向選択部の動作を示すフローチャートである。第２の実施形態における予測モードと推定符号量との関係を示す説明図である。第３の実施形態における予測方向選択部の構成例を示すブロック図である。予測方向記憶部および予測方向更新部の動作を示すフローチャートである。映像復号装置の構成例を示すブロック図である。映像システムの一例を示すブロック図である。ＣＰＵを有するコンピュータの一例を示すブロック図である。映像符号化装置の主要部を示すブロック図である。映像復号装置の主要部を示すブロック図である。６５種類の角度イントラ予測の例を示す説明図である。符号化対象ブロックのイントラ予測の依存関係を示す説明図である。

　図１は、非特許文献１に記載された映像符号化を実行可能な映像符号化装置の構成例を示すブロック図である。図１に示す映像符号化装置１００は、減算器１０１、変換／量子化器１０２、逆量子化／逆変換器１０３、エントロピー符号化器１０４、加算器１０５、ブロックメモリ１０６、インループフィルタ１０７、フレームメモリ１０８、および予測部１１０を含む。予測部１１０は、イントラ予測器１１１とインター予測器１１２とを含む。

　なお、図１に示す映像符号化装置は、ＶＶＣ規格に基づいて符号化処理を実行するが、他の規格、例えば、ＨＥＶＣ規格、Ｈ．２６４／ＡＶＣ規格、ＭＰＥＧ（Moving Picture Experts Group）－２規格に基づいて符号化処理を実行してもよい。

　減算器１０１は、ブロック（例えば、ＰＵ）ごとに、入力信号（入力画素値）から予測信号を減算し、予測誤差信号を生成する。予測誤差信号は、予測残差または予測残差信号とも呼ばれる。なお、ＰＵのサイズはＣＵのサイズと等しく設定されることが多いので、以下、ブロックはＣＵであることを想定する。

　変換／量子化器１０２は、予測誤差信号を周波数変換して変換係数を得る。変換／量子化器１０２は、さらに、周波数変換された予測誤差信号（変換係数）を量子化する。以下、量子化された変換係数を変換量子化値という。

　エントロピー符号化器１０４は、予測パラメータ（符号化情報）と変換量子化値とをエントロピー符号化する。予測パラメータは、予測部１１０が決定した予測モード（イントラ予測、インター予測）、イントラ予測ブロックサイズ、イントラ予測方向、インター予測ブロックサイズ、および動きベクトルなど、ＣＴＵ（Coding Tree Unit）およびブロックの予測に関連した情報である。エントロピー符号化器１０４から供給されるエントロピー符号化データと他のデータとが多重化され、ビットストリームとして出力される。

　逆量子化／逆変換器１０３は、変換量子化値を逆量子化して変換係数を復元する。さらに、逆量子化／逆変換器１０３は、逆量子化した変換係数を逆周波数変換して予測誤差信号を復元する。加算器１０５は、復元された予測誤差信号と予測信号とを加算して再構築信号（再構築画像）を生成する。ブロックメモリ１０６およびインループフィルタ１０７は、再構築信号を入力する。

　ブロックメモリ１０６は、符号化対象ピクチャ内の参照ブロックを格納するためのバッファメモリである。

　インループフィルタ１０７は、例えば、デブロッキングフィルタ、サンプル適応オフセットフィルタおよび適応ループフィルタを含み、適切なフィルタリングを行う。インループフィルタ１０７でフィルタリングされた再構築信号は、フレームメモリ１０８に格納される。

　イントラ予測器１１１は、符号化対象ブロックとは異なるフレームメモリ１０８内の参照ブロックを参照して、符号化対象ブロックについてイントラ予測を行い、予測信号（この場合には、イントラ予測信号）を生成する。

　イントラ予測器１１１は、符号化対象のブロックのための予測方向を決定する。ＶＶＣ方式が用いられている場合、イントラ予測器１１１は、６７種類の予測方向から、符号化効率が最もよい予測方向を選択する。

　図２は、予測方向を選択する予測方向選択部の一般的な構成例を示すブロック図である。図２に示す例では、予測方向選択部２０５は、符号量計算部２１１、歪み計算部２１２および予測方向決定部２１３を含む。

　符号量計算部２１１は、複数の予測方向のそれぞれを使用して符号化対象のブロックが符号化されたときの、それぞれの発生符号量に対応する符号量コスト（以下、符号量という。）を計算する。歪み計算部２１２は、複数の予測方向のそれぞれを使用して符号化対象のブロックが符号化されたときの、それぞれの符号化歪みを計算する。予測方向決定部２１３は、各々の符号量Ｒと各々の符号化歪みＤとを使用して、例えば、下記の（１）式で表されるＲＤ（Rate-distortion）コストを計算する。下記の（１）式において、λは、ラグランジュ乗数である。そして、予測方向決定部２１３は、最小のＲＤコストに対応する予測方向を、符号化効率を最も高くする予測方向として決定する。

　Cost＝Ｄ＋λＲ　　　　　　・・・（１）

　なお、歪み計算部２１２は、例えば、入力信号（入力画像）と再構築画像との差に基づいて歪みを計算する。

　符号量の計算方法として、例えば、シンタクスに基づく符号量を計算する方法が考えられる。ＶＶＣ方式では、イントラ予測に関するシンタクス要素として、下記のシンタクス要素がある。なお、ＶＶＣ方式では、ＭＰＭ（Most Probable Mode）が使用されうる。ＭＰＭは、符号化対象ロックで使用される確率が高いと考えられる予測モード（予測方向）に対して少ない符号量を割り当てる仕組みである。

・intra_luma_mpm_flag[x0][y0]
・intra_luma_not_planar_flag[x0][y0]
・intra_luma_mpm_idx[x0][y0]
・intra_luma_mpm_remainder[x0][y0]

　intra_luma_mpm_flag[x0][y0]は、予測モードがＭＰＭで使用されるＭＰＭリストに含まれる予測モードのいずれかに該当するか否かを示すフラグである。ＭＰＭリストには、複数の予測モードが設定される。ＭＰＭリストに設定される予測モードは、符号化対象ブロックの上側で隣接するブロックの予測モードと左側で隣接するブロックの予測モードを基に設定される。intra_luma_mpm_flag[x0][y0]が「１」である場合、予測モードがＭＰＭリストに設定された予測モードであることを示す。

　intra_luma_not_planar_flag[x0][y0]は、予測モードがPlanarであるか否かを示すフラグである。intra_luma_not_planar_flag[x0][y0]が「１」である場合に、予測モードはPlanarでないことを示す。

　intra_luma_mpm_idx[x0][y0]は、予測モードがＭＰＭである場合に、ＭＰＭリストにおける候補番号を示すインデックスである。

　intra_luma_mpm_remainder[x0][y0]は、ＭＰＭが使用されないときの予測モード、すなわち、ＭＰＭリストに設定されていない予測モードが、どの予測モード番号の予測モードであるのかを示す。以下、ＭＰＭが使用されないときの予測モード（ＭＰＭリストに設定されていない予測モード）を、非ＭＰＭの予測モードということがある。

　なお、符号量をビット数で表すと、intra_luma_mpm_flag[x0][y0]およびintra_luma_not_planar_flag[x0][y0]のビット数は、それそれ一定値（具体的には、１ビット）である。intra_luma_mpm_idx[x0][y0]およびintra_luma_mpm_remainder[x0][y0]は、それぞれ、依存関係に応じた可変値である。符号化対象ブロックのイントラ予測では、符号化対象ブロックの上側や左側に位置するブロックの復号済みの再構築画像が参照信号として利用される。したがって、符号化対象ブロックのイントラ予測は、符号化対象ブロックの上側で隣接するブロックの予測モードおよび左側で隣接するブロックの予測モードへの依存関係を有する。

　そこで、符号化対象ブロックの発生符号量に関して、符号化対象ブロックの上側や左側に位置するブロックの予測モードも考慮される。

　符号化対象ブロックの上側や左側に位置するブロックの予測モードを以下のように表す。
・dir_(x0-1,y0)
・dir_(x0,y0-1)

　dir_(x0-1,y0)は、符号化対象ブロックの左側で隣接するブロックの予測モード（予測方向）を表す。dir_(x0,y0-1)は、符号化対象ブロックの上側で隣接するブロックの予測モード（予測方向）を表す。

　上記の検討に基づいて、予測モードに関する符号量Code(dir)（dir：０～６６）を下記の（２）式のように表すことができる。F1は、括弧内の各パラメータを変数とする関数を意味する。

　Code(dir) = F1(A(x0,y0), B(x0,y0), C(x0,y0), D(x0,y0), dir_(x0-1,y0), dir_(x0,y0-1))　　　　　　・・・（２）

　（２）式において、A(x0,y0)は、intra_luma_mpm_flag[x0][y0]である。B(x0,y0)は、intra_luma_not_planar_flag[x0][y0]である。C(x0,y0)は、intra_luma_mpm_idx[x0][y0]である。D(x0,y0)は、intra_luma_mpm_remainder[x0][y0]である。以下、A(x0,y0)、B(x0,y0)、C(x0,y0)、D(x0,y0)を、Ａ、Ｂ、Ｃ、Ｄと表記することがある。したがって、Ａ、Ｂ、Ｃ、Ｄとシンタクス要素との対応は、以下のようになる。

・Ａ：intra_luma_mpm_flag[x0][y0]
・Ｂ：intra_luma_not_planar_flag[x0][y0]
・Ｃ：intra_luma_mpm_idx[x0][y0]
・Ｄ：intra_luma_mpm_remainder[x0][y0]

　以下、本発明の実施形態を図面を参照して説明する。

実施形態１．
　図３は、第１の実施形態における予測方向を選択する予測方向選択部の構成例を示すブロック図である。なお、映像符号化装置の全体的な構成は、図１に示された構成と同じである。

　図３に示す例では、予測方向選択部２００は、符号量推定部２１０、歪み計算部２１２および予測方向決定部２１３を含む。予測方向選択部２００は、例えば、イントラ予測器１１１内に設けられる。予測方向選択部２００は、イントラ予測器１１１の外部に設けられていてもよい。

　符号量推定部２１０は、複数の予測方向のそれぞれを使用して符号化対象のブロックが符号化されるときの、それぞれの発生符号量を推定する。歪み計算部２１２は、図２に示された例と同様に、複数の予測方向のそれぞれを使用して符号化対象のブロックが符号化されたときの、それぞれの符号化歪みを計算する。予測方向決定部２１３は、図２に示された例と同様に、各々の符号量と各々の符号化歪みとを使用して、例えば、上記の（１）式で表されるＲＤコストを計算する。

　符号量推定部２１０は、各予測モードについて符号量を推定するときに、予測モードの依存関係を考慮しない。よって、予測モードに関する符号量Code(dir)を、例えば、下記の（３）式のように定めることができる。F2は、括弧内の各パラメータを変数とする関数を意味する。なお、F2で表される符号量は、推定された符号量（推定符号量）に相当する。（３）式に示されるように、イントラ予測で使用される予測モードを決定するときに、符号化対象ブロックに隣接するブロックの予測パラメータ（例えば、予測方向）は使用されない。

　　Code(dir) = F2(A(x0,y0), B(x0,y0), C(x0,y0), D(x0,y0))　　　　　　・・・（３）

　符号量Code(dir)を、各々の予測モードに対応するシンタクス要素（Ａ、Ｂ、Ｃ、Ｄ）を表現できるビット数で表すと、以下のように表現することができる。なお、符号量Code(dir)を定めるときに、ＭＰＭに関するシンタクス要素と非ＭＰＭに関するシンタクス要素との双方が考慮される。

・Code(0)＝Ａ＋Ｂ＝２
・Code(1)＝Ａ＋Ｂ＋Ｃ＝３　または　Ａ＋Ｄ＝２
・Code(dir)（dir：０、１以外）＝Ａ＋Ｄ＝１＋ceil（log₂(dir+1)）
　ceilは、最も近い整数に切り上げることを意味する。

　ＭＰＭでのシンタクス要素を表現できるビット数と非ＭＰＭでのシンタクス要素を表現できるビット数とが異なる場合には、多い方のビット数が採用される。すなわち、符号量推定部２１０は、符号量を表現可能な複数の値のうち、多い方（想定最大値）を使用する。上記の例では、例えばCode(1)に対して３が採用される。なお、符号量推定部２１０は、想定最大値を使用するのではなく、任意の値を使用してもよい。

　図４は、上述した考え方に基づく、予測モードと推定符号量との関係を示す説明図である。図４に示す符号量は、例えば、予測方向選択部２００において、あらかじめ予測モードに対応した符号量テーブルとして記憶される。符号量推定部２１０は、符号量テーブルから、各予測モードに対応する符号量を取得することによって、発生符号量を推定する。

　図５は、予測方向選択部２００の動作を示すフローチャートである。

　予測方向選択部２００において、予測方向決定部２１３は、ＲＤコストバッファに初期値をセットする（ステップＳ１０１）。また、予測方向決定部２１３は、変数ｉに０をセットする（ステップＳ１０２）。ＲＤコストバッファは、予測方向選択部２００に設けられている。初期値は、例えば、ＲＤコストバッファに設定可能な最大の値である。

　符号量推定部２１０は、dir（ｉ）に対応する符号量を符号量テーブルから取得する（ステップＳ１０３）。歪み計算部２１２は、符号化歪みを計算する（ステップＳ１０４）。なお、歪み計算部２１２は、符号化歪みの計算のために、公知のいずれの手法を用いてもよい。

　予測方向決定部２１３は、上記の（１）式を用いてＲＤコストを計算する（ステップＳ１０５）。予測方向決定部２１３は、計算されたＲＤコストとＲＤコストバッファに設定されているＲＤコストとを比較する（ステップＳ１０５）。計算されたＲＤコストがＲＤコストバッファに設定されているＲＤコスト以上である場合には、処理は、ステップＳ１０８に移行する（ステップＳ１０６）。

　計算されたＲＤコストがＲＤコストバッファに設定されているＲＤコストよりも小さい場合には、予測方向決定部２１３は、ステップＳ１０５の処理で計算されたＲＤコストで、ＲＤコストバッファに設定されているＲＤコストを更新する（ステップＳ１０７）。また、予測方向決定部２１３は、変数ｉのそのときの値を例えばＲＤコストバッファに保存する。

　次に、予測方向決定部２１３は、変数ｉの値が６６に達しているか否か確認する（ステップＳ１０８）。変数ｉの値が６６に達していない場合には、予測方向決定部２１３は、変数ｉの値を１増やす（ステップＳ１０９）。そして、処理は、ステップＳ１０３に戻る。

　変数ｉの値が６６に達している場合には、予測方向決定部２１３は、ＲＤコストバッファに保存されている変数ｉの値が示す予測モードを、イントラ予測において使用される予測モードとする（ステップＳ１１０）。

　以上の処理によって、予測方向決定部２１３は、符号化処理で実行されるイントラ予測において使用される予測モードを決定することができる。予測モードを決定する際に、予測方向選択部２００は、隣接するブロックの予測モードへの依存関係を使用しない。よって、予測方向選択部２００は、ブロック単位で、符号化コストの計算を並列して実行可能になる。その結果、イントラ予測器１１１は、ＣＵ単位でのイントラ予測を並列して実行可能になる。また、予測方向選択部２００は、dir_(x0-1,y0)およびdir_(x0,y0-1)を考慮しないが、各々の予測モードに対応するシンタクス要素（Ａ、Ｂ、Ｃ、Ｄ）に基づいて符号量Code(dir)を推定するので、符号化効率はさほど低下しない。

実施形態２．
　第２の実施形態の映像符号化装置の全体的な構成は、図１に示された構成と同じである。第２の実施形態における予測方向選択部の構成は、図３に示された構成と同じである。

　第２の実施形態でも、予測方向選択部２００は、基本的に、各予測モードについて、シンタクス要素を表現できるビット数を表現可能な複数の値のうち、多い方のビット数（想定最大値）を採用する。しかし、第２の実施形態では、予測方向選択部２００は、一般的なイントラ予測において頻出する予測モード（実際に実行されるイントラ予測で使用される頻度が高い予測モード）に対する符号量（ビット数）を、第１の実施形態における符号量に比べて少なくする。なお、「実際に実行されるイントラ予測」は、決定された最適な予測モードを用いて実行されるイントラ予測である。

　頻出する予測モードとして、以下のdir（予測モード番号）の予測モードを例示することができる。

・dir＝０（Planar）
・dir＝１（ＤＣ）
・dir＝５０（垂直方向）
・dir＝１８（水平方向）
・dir＝４６
・dir＝５４

　符号量Code(dir)を、各々の予測モードに対応するシンタクス要素（Ａ、Ｂ、Ｃ、Ｄ）を表現できるビット数で表すと、以下のように表現することができる。

・Code(0)＝Ａ＋Ｂ＝２
・Code(1)＝Ａ＋Ｂ＋Ｃ＝３
・Code(50)＝Ａ＋Ｂ＋Ｃ＝４
・Code(18)＝Ａ＋Ｂ＋Ｃ＝５
・Code(46)＝Ａ＋Ｂ＋Ｃ＝６
・Code(54)＝Ａ＋Ｂ＋Ｃ＝７
・Code(dir)（dir：上記のdir以外）＝Ａ＋Ｄ＝１＋ceil（log₂(dir+1)）

　図６は、第２の実施形態における予測モードと推定符号量との関係を示す説明図である。第１の実施形態と同様に、図６に示す符号量は、例えば、予測方向選択部２００において、あらかじめ予測モードに対応させて符号量テーブルに記憶される。符号量推定部２１０は、符号量テーブルから、各予測モードに対応する符号量を取得する。

　図６に示す関係と図４に示す第１の実施形態における関係とを比較すると、特に、dir＝５０、dir＝１８（水平方向）およびdir＝４６に対応する符号量が少なくなっている。なお、頻出する予測モードに対するビット数の割り当ては、ＭＰＭを流用している。すなわち、dir＝０以外の予測モード（dir＝１、dir＝５０、dir＝１８、dir＝４６、およびdir＝５４）は、Ｃで特定される。

　第２の実施形態でも、予測方向選択部２００は、図５のフローチャートに例示された処理を行う。しかし、第２の実施形態では、イントラ予測において頻出する予測モードに対する符号量（推定符号量）が第１の実施形態よりも少なくなっている。よって、第１の実施形態に比べて、一般的なイントラ予測において頻出する予測モードが選択されやすくなる。その結果、推定符号量を用いて予測モードを決定することによってやや低下する可能性がある符号化効率すなわち第１の実施形態における符号化効率を改善することができる。

　なお、頻出する予測モードは、上記の例に限られない。別の予測モードで構成される集合を頻出する予測モードとしてもよい。

実施形態３．
　第３の実施形態では、過去に実行された符号化対象ブロックのイントラ予測における隣接ブロックからの予測方向の分布を使用して、予測モードと推定符号量との関係が決定される。

　図７は、第３の実施形態における予測方向を選択する予測方向選択部の構成例を示すブロック図である。なお、映像符号化装置の全体的な構成は、図１に示された構成と同じである。

　図３に示された予測方向選択部２００と比較すると、図７に示す予測方向選択部２０１には、予測方向記憶部２１４と予測方向更新部２１５とが追加されている。

　図８のフローチャートを参照して、予測方向記憶部２１４および予測方向更新部２１５の動作を説明する。なお、予測方向選択部２０１は、図５に例示されたフローチャートによる処理で、最適な予測モードを決定する。

　また、以下の説明では、映像符号化装置の実稼働中に、予測方向選択部２０１が頻出する予測モードを決定することが想定されている。しかし、映像符号化装置が稼働する前に、予測方向選択部２０１が頻出する予測モードを決定してもよい。すなわち、映像符号化装置が稼働する前に、予測方向選択部２０１が、試験的に図８に示される処理を実行してもよい。

　予測方向記憶部２１４は、最適な予測モードとして決定された予測モード（ステップＳ１１０の処理で決定される予測モード）の決定回数を記憶する。すなわち、予測方向記憶部２１４は、実際に実行される複数回のイントラ予測に亘って、イントラ予測で使用された予測モードの使用回数を記憶する。具体的には、イントラ予測が実行されると、予測方向記憶部２１４は、例えば、イントラ予測で使用された予測モードに対応するカウンタの値を１増やす（ステップＳ２０１）。カウンタは、予測モードの種類数分用意されている。予測方向更新部２１５は、予測方向記憶部２１４に、あらかじめ定められた数の予測モードが記憶されると、すなわち、所定回のイントラ予測が実行されると、使用回数が多い順に複数（例えば、６個）の予測モードを予測方向記憶部２１４から抽出する（ステップＳ２０２，Ｓ２０３）。

　予測方向選択部２０１に、図６に例示された符号量テーブルが記憶されている場合を想定する。その場合、予測方向更新部２１５は、抽出された複数の予測モードで符号量テーブルの内容を更新する（ステップＳ２０４）。具体的には、予測方向更新部２１５は、ステップＳ２０３の処理で予測方向記憶部２１４から抽出した予測モードのそれぞれに符号量を割り当てる。予測方向更新部２１５は、例えば、図６に例示された符号量テーブルに設定される符号量の設定の仕方と同様の考え方に基づいて、符号量を予測モードに割り当てる。すなわち、予測方向更新部２１５は、例えば、ＭＰＭを流用する。そして、予測方向更新部２１５は、符号量を予測モードとともに符号量テーブルに設定する。なお、符号量テーブルにおける従前の符号量および予測モードは削除される。また、新たに符号量テーブルに設定される符号量として、第２の実施形態における頻出する予測モードと同様に、より少ないビット数が設定される。

　なお、図８に示された処理が実行されるときに、イントラ予測器１１１は、符号化対象ブロックを対象として、一般的なＶＶＣ方式のイントラ予測を実行してもよい。すなわち、イントラ予測器１１１は、図２に示された符号量計算部２１１の機能を用いて決定された最適な予測モードでイントラ予測を実行してもよい。換言すれば、ステップＳ２０１～Ｓ２０３の処理が実行されるときに、予測モードの依存関係を考慮した一般的な方法で最適な予測モードを決定してもよい。その場合には、予測方向選択部２０１は、図２に示された符号量計算部２１１の機能も有する。

　そして、ステップＳ２０４の処理が実行された後、予測方向選択部２０１は、第２の実施形態における処理と同様の処理を行う。すなわち、予測方向選択部２０１は、予測モードの依存関係を使用せず、符号量テーブルを使用して符号量を推定する。

　第３の実施形態でも、頻出する予測モードが選択されやすくなる。その結果、推定符号量を用いて予測モードを決定することによってやや低下する可能性がある符号化効率、すなわち第１の実施形態における符号化効率を改善することができる。また、第３の実施形態では、実際に頻出した予測モードが選択されやすくなるので、符号化効率がより改善することが期待される。

　なお、上記の例では、予測方向選択部２０１に、事前に図６に例示された符号量テーブルが記憶されている。しかし、図４に例示された符号量テーブルが記憶されていてもよい。さらに、図８に例示されたフローチャートによる処理が開始される前に、予測方向選択部２０１に符号量テーブルが記憶されていなくてもよい。その場合には、予測方向更新部２１５は、符号量テーブルの更新を行うのではなく、符号量テーブルの作成を行う。

　また、予測方向選択部２０１が、符号量テーブルの更新または作成を行った後、所定期間が経過したら、または、所定回数のイントラ予測が実行されたら、再度、図８に示された処理を実行してもよい。

　また、符号量推定部２１０は、符号化対象の映像を構成する各画像の事前解析に基づいて発生符号量を推定してもよい。事前解析は、映像符号化装置が稼働する前に、例えば、符号化対象の映像信号における符号化対象ブロックへの予測モードとしてどの予測モード番号の予測モードが決定されやすいかを解析する処理である。なお、「事前解析」は、映像符号化装置の実稼働前に実行される解析を意味する。

実施形態４．
　図９は、映像復号装置の構成例を示すブロック図である。図９に示す映像復号装置３００は、エントロピー復号器３０１、逆量子化／逆変換器３０２、加算器３０３、予測部３１０、およびバッファ３０４を含む。予測部３１０は、イントラ予測器３１１、インター予測器３１２および対応記憶部３１３を含む。なお、図９に示す映像復号装置は、例えば、第１～第３の実施形態の映像符号化装置からのビットストリームを受信することができる。

　エントロピー復号器３０１は、エントロピー符号化データをエントロピー復号する。エントロピー符号化データは、予測パラメータがエントロピー符号化されたデータと変換量子化値がエントロピー符号化されたデータとを含む。エントロピー復号器３０１は、エントロピー復号した変換量子化値を逆量子化／逆変換器３０２に供給する。また、エントロピー復号器３０１は、エントロピー復号した予測パラメータを、予測部３１０に供給する。

　逆量子化／逆変換器３０２は、変換量子化値を逆量子化する。さらに、逆量子化／逆変換器３０２は、逆量子化した周波数変換係数を逆周波数変換する。

　予測部３１０において、対応記憶部３１３には、符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定された、イントラ予測が実行されるときの符号化対象ブロックの発生符号量に基づいて決定された予測モードと、イントラ予測に関するシンタクス要素との関係が設定されている。すなわち、第１～第３の実施形態において符号量の計算に利用された［Ａ＋Ｂ］、［Ａ＋Ｂ＋Ｃ］、または［Ａ＋Ｄ］（図４、図６参照）と予測モード番号との関係が、対応記憶部３１３にあらかじめ設定されている。

　予測部３０４は、予測パラメータに基づいて、各ブロックの予測信号を生成する。なお、予測パラメータがイントラ予測を示している場合には、イントラ予測器３１１が予測信号を生成する。予測パラメータがインター予測を示している場合には、インター予測器３１２が予測信号を生成する。

　なお、イントラ予測器３１１は、予測パラメータ（具体的には、イントラ予測に関するシンタクス）と対応記憶部３１３に設定されている関係とから、予測モードを特定する。

　逆量子化／逆変換器３０２で逆周波数変換された予測誤差信号は、加算器３０３によって、予測部３１０から供給される予測信号が加えられた後、再構築画像としてバッファ３０４に供給される。バッファ３０４は、再構築画像を格納する。バッファ３０４に格納された各再構築画像は、表示順に復号映像として出力される。

　映像復号装置３００が、上記のように構成され、かつ、上記のように動作するので、第１～第３の実施形態の映像符号化装置と映像復号装置との相互運用性が確保される。

実施形態５．
　図１０は、映像システムの一例を示すブロック図である。図１０に示す映像システムは、第１～第３の実施形態の映像符号化装置と図９に例示された映像復号装置３００とが、無線伝送路または有線伝送路４００で接続されるシステムである。

　映像符号化装置１００の構成および動作は、図１に示された映像符号化装置の構成および動作と同じである。映像復号装置３００の構成および動作は、図９に示された映像復号装置３００の構成および動作と同じである。

　なお、上記の実施形態では、ＶＶＣ規格に基づいて符号化処理を実行する映像符号化装置とＶＶＣ規格に基づいて復号処理を実行する映像復号装置とを例にしたが、映像符号化装置および映像復号装置は、ＨＥＶＣ規格やＨ．２６４／ＡＶＣ規格などの他の規格に基づいて符号化処理および復号処理を実行してもよい。

　また、上記の各実施形態を、ハードウェアで構成することも可能であるが、コンピュータプログラムにより実現することも可能である。

　図１１は、ＣＰＵ（Central Processing Unit ）を有するコンピュータの一例を示すブロック図である。コンピュータは、図１に示された映像符号化装置１００と図９に示された映像復号装置３００のそれぞれに実装可能である。ＣＰＵ１０００は、記憶装置１００１に格納されたプログラム（映像符号化プログラムまたは映像復号プログラム）に従って処理を実行することによって、上記の各実施形態における各機能を実現する。

　すなわち、コンピュータが図１に示された映像符号化装置１００に実装される場合には、ＣＰＵ１０００は、映像符号化装置１００における、減算器１０１、変換／量子化器１０２、逆量子化／逆変換器１０３、エントロピー符号化器１０４、加算器１０５、インループフィルタ１０７、ならびに予測部１１０におけるイントラ予測器１１１およびインター予測器１１２の機能を実現する。

　コンピュータが図９に示された映像復号装置３００に実装される場合には、ＣＰＵ１０００は、映像復号装置３００における、エントロピー復号器３０１、逆量子化／逆変換器３０２、加算器３０３、ならびに予測部３１０におけるイントラ予測器３１１およびインター予測器３１２の機能を実現する。

　記憶装置１００１は、例えば、非一時的なコンピュータ可読媒体（non-transitory computer readable medium ）である。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（tangible storage medium ）を含む。非一時的なコンピュータ可読媒体の具体例として、磁気記録媒体（例えば、ハードディスク）、ＣＤ－ＲＯＭ（Compact Disc-Read Only Memory ）、ＣＤ－Ｒ（Compact Disc-Recordable ）、ＣＤ－Ｒ／Ｗ（Compact Disc-ReWritable ）、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM ）、フラッシュＲＯＭ）がある。

　また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（transitory computer readable medium ）に格納されてもよい。一時的なコンピュータ可読媒体には、例えば、有線通信路または無線通信路を介して、すなわち、電気信号、光信号または電磁波を介して、プログラムが供給される。

　メモリ１００２は、例えばＲＡＭ（Random Access Memory）で実現される。メモリ１００２は、ＣＰＵ１０００が処理を実行するときに一時的にデータを格納する記憶手段である。メモリ１００２に、記憶装置１００１または一時的なコンピュータ可読媒体が保持するプログラムが転送され、ＣＰＵ１０００がメモリ１００２内のプログラムに基づいて処理を実行するような形態も想定しうる。

　また、メモリ１００２は、図１に示されたブロックメモリ１０６およびフレームメモリ１０８として使用可能である。メモリ１００２は、図７に示された予測方向記憶部２１４として使用可能である。メモリ１００２は、図９に示されたバッファ３０４および対応記憶部３１３として使用可能である。

　図１２は、映像符号化装置の主要部を示すブロック図である。図１２に示す映像符号化装置１０は、イントラ予測の予測モードを、符号量と符号化歪みとに基づいて決定する予測モード決定部１１（予測モード決定手段：実施形態では、予測方向選択部２００，２０１で実現される。）を備え、予測モード決定部１１は、イントラ予測が実行されるときの符号化対象ブロックの発生符号量を、符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定する符号量推定部１２（符号量推定手段：実施形態では、符号量推定部２１０で実現される。）を含む。

　予測モード決定部１１は、過去の複数回のイントラ予測の各々によって符号化されたブロックについて使用された予測モードのうち、頻出した予測モードを特定する頻出予測モード特定部（頻出予測モード特定手段：実施形態では、予測方向記憶部２１４および予測方向更新部２１５で実現される。）を含んでいてもよい。

　図１３は、映像復号装置の主要部を示すブロック図である。図１３に示す映像復号装置２０は、符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定された、イントラ予測が実行されるときの符号化対象ブロックの発生符号量に基づいて決定された予測モードと、イントラ予測に関するシンタクス要素との関係が設定された対応記憶部２１（対応記憶手段：実施形態では、対応記憶部３１３で実現される。）と、対応記憶部２１に設定されている関係に基づいて予測モードを特定する予測モード特定部２２（予測モード特定手段：実施形態では、イントラ予測器３１１で実現される。）とを備える。

　上記の実施形態の一部または全部は、以下の付記のようにも記載され得るが、本発明は、以下の構成に限定されるわけではない。

（付記１）少なくともイントラ予測機能を有する映像符号化装置であって、
　イントラ予測の予測モードを、符号量と符号化歪みとに基づいて決定する予測モード決定手段を備え、
　前記予測モード決定手段は、イントラ予測が実行されるときの符号化対象ブロックの発生符号量を、当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定する符号量推定手段を含む
　映像符号化装置。

（付記２）前記符号量推定手段は、予測モードに関するシンタクス要素を表現しうるビット数に基づいて発生符号量を推定する
　付記１に記載の映像符号化装置。

（付記３）ＶＣＣ方式でイントラ予測を行う映像符号化装置であって、
　前記符号量推定手段は、シンタクス要素であるintra_luma_mpm_flag、intra_luma_not_planar_flag、intra_luma_mpm_idxおよびintra_luma_mpm_remainderを表現しうるビット数に基づいて発生符号量を推定する
　付記２に記載の映像符号化装置。

（付記４）前記符号量推定手段は、頻出する予測モードに関するシンタクス要素を表現しうるビット数を減らす
　付記２または付記３に記載の映像符号化装置。

（付記５）前記予測モード決定手段は、過去の複数回のイントラ予測の各々によって符号化されたブロックについて使用された予測モードから、頻出した予測モードを特定する頻出予測モード特定手段を含む
　付記４に記載の映像符号化装置。

（付記６）前記予測モード決定手段は、符号化対象の映像信号における符号化対象ブロックへの予測モードとしてどの予測モード番号の予測モードが決定されやすいかを事前に解析し、解析結果に基づいて、頻出した予測モードを特定する頻出予測モード特定手段を含む
　付記４に記載の映像符号化装置。

（付記７）少なくともイントラ予測機能を有する映像復号装置であって、
　イントラ予測が実行されるときの符号化対象ブロックの発生符号量であって当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定された発生符号量に基づいて決定された予測モードと、イントラ予測に関するシンタクス要素との関係が設定された対応記憶手段と、
　前記対応記憶手段に設定されている前記関係に基づいて予測モードを特定する予測モード特定手段と
　を備えた映像復号装置。

（付記８）少なくともイントラ予測を実行する映像符号化方法であって、
　イントラ予測の予測モードを、符号量と符号化歪みとに基づいて決定し、
　前記予測モードを決定するときに、イントラ予測が実行されるときの符号化対象ブロックの発生符号量を、当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定する
　映像符号化方法。

（付記９）予測モードに関するシンタクス要素を表現しうるビット数に基づいて発生符号量を推定する
　付記８に記載の映像符号化方法。

（付記１０）ＶＣＣ方式でイントラ予測を実行する映像符号化方法であって、
　シンタクス要素であるintra_luma_mpm_flag、intra_luma_not_planar_flag、intra_luma_mpm_idxおよびintra_luma_mpm_remainderを表現しうるビット数に基づいて発生符号量を推定する
　付記９に記載の映像符号化方法。

（付記１１）頻出する予測モードに関するシンタクス要素を表現しうるビット数を減らす
　付記９または付記１０に記載の映像符号化方法。

（付記１２）過去の複数回のイントラ予測の各々によって符号化されたブロックについて使用された予測モードから、頻出した予測モードを特定する
　付記１１に記載の映像符号化方法。

（付記１３）少なくともイントラ予測を実行する映像復号方法であって、
　イントラ予測が実行されるときの符号化対象ブロックの発生符号量であって当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定された発生符号量に基づいて決定された予測モードと、イントラ予測に関するシンタクス要素との関係が設定された対応記憶手段に設定されている前記関係に基づいて予測モードを特定する
　映像復号方法。

（付記１４）コンピュータに、
　イントラ予測の予測モードを、符号量と符号化歪みとに基づいて決定させ、
　前記予測モードを決定させるときに、イントラ予測が実行されるときの符号化対象ブロックの発生符号量を、当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定させる
　ための映像符号化プログラム。

（付記１５）コンピュータに、
　イントラ予測が実行されるときの符号化対象ブロックの発生符号量であって当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定された発生符号量に基づいて決定された予測モードと、イントラ予測に関するシンタクス要素との関係が設定された対応記憶手段に設定されている前記関係に基づいて予測モードを特定させる
　ための映像復号プログラム。

（付記１６）コンピュータで実行されるときに、
　イントラ予測の予測モードを、符号量と符号化歪みとに基づいて決定し、
　前記予測モードを決定させるときに、イントラ予測が実行されるときの符号化対象ブロックの発生符号量を、当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定する
　映像符号化プログラムが格納された非一時的なコンピュータ読み取り可能な記録媒体。

（付記１７）コンピュータで実行されるときに、
　イントラ予測が実行されるときの符号化対象ブロックの発生符号量であって当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定された発生符号量に基づいて決定された予測モードと、イントラ予測に関するシンタクス要素との関係が設定された対応記憶手段に設定されている前記関係に基づいて予測モードを特定する
　映像復号プログラムが格納された非一時的なコンピュータ読み取り可能な記録媒体。

（付記１８）付記１から付記６のうちのいずれか１項に記載の映像符号化装置と、
　付記７に記載の映像復号装置と
　を備える映像システム。

　以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、２０２１年１０月２２日に出願された日本特許出願２０２１－１７２８９３を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　１０　　　映像符号化装置
　１１　　　予測モード決定部
　１２　　　符号量推定部
　２０　　　映像復号装置
　２１　　　対応記憶部
　２２　　　予測モード特定部
　１００　　映像符号化装置
　１０１　　減算器
　１０２　　変換／量子化器
　１０３　　逆量子化／逆変換器
　１０４　　エントロピー符号化器
　１０５　　加算器
　１０６　　ブロックメモリ
　１０７　　インループフィルタ
　１０８　　フレームメモリ
　１１０　　予測部
　１１１　　イントラ予測器
　１１２　　インター予測器
　２００，２０１　予測方向選択部
　２１０　　符号量推定部
　２１１　　符号量推定部
　２１２　　歪み計算部
　２１３　　予測方向決定部
　２１４　　予測方向記憶部
　２１５　　予測方向更新部
　３００　　映像復号装置
　３０１　　エントロピー復号器
　３０２　　逆量子化／逆変換器
　３０３　　加算器
　３０４　　バッファ
　３１０　　予測部
　３１１　　イントラ予測器
　３１２　　インター予測器
　３１３　　対応記憶部
　１０００　ＣＰＵ
　１００１　記憶装置
　１００２　メモリ

Claims

　少なくともイントラ予測機能を有する映像符号化装置であって、
　イントラ予測の予測モードを、符号量と符号化歪みとに基づいて決定する予測モード決定手段を備え、
　前記予測モード決定手段は、イントラ予測が実行されるときの符号化対象ブロックの発生符号量を、当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定する符号量推定手段を含む
　映像符号化装置。
　前記符号量推定手段は、予測モードに関するシンタクス要素を表現しうるビット数に基づいて発生符号量を推定する
　請求項１に記載の映像符号化装置。
　ＶＣＣ方式でイントラ予測を行う映像符号化装置であって、
　前記符号量推定手段は、シンタクス要素であるintra_luma_mpm_flag、intra_luma_not_planar_flag、intra_luma_mpm_idxおよびintra_luma_mpm_remainderを表現しうるビット数に基づいて発生符号量を推定する
　請求項２に記載の映像符号化装置。
　前記符号量推定手段は、頻出する予測モードに関するシンタクス要素を表現しうるビット数を減らす
　請求項２または請求項３に記載の映像符号化装置。
　前記予測モード決定手段は、過去の複数回のイントラ予測の各々によって符号化されたブロックについて使用された予測モードから、頻出した予測モードを特定する頻出予測モード特定手段を含む
　請求項４に記載の映像符号化装置。
　少なくともイントラ予測機能を有する映像復号装置であって、
　イントラ予測が実行されるときの符号化対象ブロックの発生符号量であって当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定された発生符号量に基づいて決定された予測モードと、イントラ予測に関するシンタクス要素との関係が設定された対応記憶手段と、
　前記対応記憶手段に設定されている前記関係に基づいて予測モードを特定する予測モード特定手段と
　を備えた映像復号装置。
　少なくともイントラ予測を実行する映像符号化方法であって、
　イントラ予測の予測モードを、符号量と符号化歪みとに基づいて決定し、
　前記予測モードを決定するときに、イントラ予測が実行されるときの符号化対象ブロックの発生符号量を、当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定する
　映像符号化方法。
　予測モードに関するシンタクス要素を表現しうるビット数に基づいて発生符号量を推定する
　請求項７に記載の映像符号化方法。
　少なくともイントラ予測を実行する映像復号方法であって、
　イントラ予測が実行されるときの符号化対象ブロックの発生符号量であって当該符号化対象ブロックに隣接するブロックの符号化情報を使用せずに推定された発生符号量に基づいて決定された予測モードと、イントラ予測に関するシンタクス要素との関係が設定された対応記憶手段に設定されている前記関係に基づいて予測モードを特定する
　映像復号方法。
　請求項１から請求項５のうちのいずれか１項に記載の映像符号化装置と、
　請求項６に記載の映像復号装置と
　を備える映像システム。