WO2007072895A1

WO2007072895A1 - 画面内予測モード決定方法、画像符号化方法及び画像符号化装置

Info

Publication number: WO2007072895A1
Application number: PCT/JP2006/325464
Authority: WO
Inventors: Kazuya Takagi
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2005-12-21
Filing date: 2006-12-21
Publication date: 2007-06-28
Also published as: US20090268974A1; JP2009060153A

Abstract

　画面内予測符号化において、符号化効率をある程度維持しつつ、画面内予測モードを決定する際の処理量を削減し得る方法等を提供する。　符号化対象ブロックを構成する少なくとも３つの領域の代表値を計算し、１つの方向上に分布する少なくとも２つの前記代表値の誤差和と、前記方向とは異なる少なくとも１つの方向上に分布する少なくとも２つの前記代表値の誤差和を計算し、前記計算された少なくとも２つの誤差の内、前記誤差和が最小となる方向の面内予測モードを少なくとも１つ決定することにより、画面内予測モードを決定する際の処理負荷を軽減する。

Description

画面内予測モード決定方法、画像符号化方法及び画像符号化装置技術分野

[0001] 本発明は、画像符号化方法及び画像符号化装置に関し、特に、 H. 264/AVC の画面内予測符号ィ匕における予測モード決定方法に関する。

背景技術

[0002] ITU— Tおよび ISOZIECによって策定された動画像の符号化標準である「： H. 26 4ZAVC」は、従来の符号ィ匕標準である「MPEG—4」や「H. 263」に比べて約 2倍の圧縮効率を実現している。本標準は、従来標準と同様、時間相関を利用した画面間予測符号ィ匕技術に加え、空間相関を利用した画面内予測 (単に「面内予測」ともいう。）符号化技術を採用している点に特徴を有する。

[0003] 「画面内予測符号化」とは、入力画像と画面内で生成した画面内予測画像との予測誤差画像にっヽて周波数変換等を行ヽ符号ィ匕する技術である。画面内予測画像は、符号化対象ブロックに隣接する画素 (具体的には、符号化済みの上隣及び左隣の画素）を用いて画面内予測モードの方向に画素値をコピーすることで生成される画像である。 H. 264ZAVCでは、複数種類の画面内予測モード（単に「予測モード」ともいう。）が定められており、選択できる画面内予測モードの数は、符号化対象プロックのサイズにより異なる。具体的には、 4 X 4画素又は 8 X 8画素の輝度成分については、図 4 (a)に示すように 9種類の予測モードがあり、 16 X 16画素の輝度成分については、図 4 (b)に示すように 4種類の予測モードがある。また、色差成分についても同様に、図 4 (b)に示すように 4種類の予測モードが用意されている（以下、特に断りが無い限り、 8 X 8画素の輝度成分について説明する)。尚、図 4 (a)及び (b)の矢印に付与されて、る番号は予測モード番号である。

[0004] 図 5 (a)〜（c)は、 8 X 8画素を用いた画面内予測における画面内予測画像を生成する際の具体例を示す図である。図 5 (a)〜（c)における「A」〜「Y」は、符号化対象ブロックに隣接する画素値である。図 5 (a)に示す通り、垂直方向の画面内予測を行う予測モード 0では、隣接画素の値を垂直方向にコピーして画面内予測画像を生成する。同様に、水平方向の画面内予測を行う予測モード 1では、図 5 (b)に示す通り、隣接画素の値を水平方向にコピーして面内予測画像を生成する。更に、右下 45度方向の画面内予測を行う予測モード 3では、図 5 (c)に示す通り、隣接画素の値を右下 45度方向にコピーして画面内予測画像を生成する。

[0005] 次に、 H. 264ZAVCの画面内予測符号化を実現する、従来の画像符号化装置 2 の機能構成について説明する。図 1は、従来の画像符号化装置 2の機能構成を示すブロック図である。図 1に示すように、画像符号ィ匕装置 2は、画面内予測部 20、予測誤差符号化部 11、予測誤差復号化部 12、フレームメモリ 13、可逆符号化部 14、差分器 1000、加算器 1001を備える。以下、各部の機能及び処理内容について順に説明する。

[0006] 画面内予測部 20は、フレームメモリ 13に保存されている復号画像を入力し、対象ブロックに隣接する画素を用いて画面内予測画像を生成する。画面内予測画像は、前述の通り、複数種類の予測モードから選択された最適な予測モードが定める予測方向に隣接画素の値をコピーすることで生成される。画面内予測部 20で生成された画面内予測画像は、差分器 1000と加算器 1001に出力される。

[0007] 予測誤差符号ィ匕部 11は、差分器 1000から出力される入力画像と画面内予測画像との予測誤差画像を入力し、当該予測誤差画像に離散コサイン変換またはカーネル'レーべ変換等の周波数変換処理と量子化処理を施して、予測誤差信号を生成する。生成された予測誤差信号は、可逆符号化部 14と予測誤差復号化部 12に出力される。

[0008] 予測誤差復号ィ匕部 12は、予測誤差符号ィ匕部 11から出力される予測誤差信号を入力し、当該予測誤差信号に対して逆量子化及び逆周波数変換処理を施し、予測誤差復号画像を生成する。生成された予測誤差復号画像は、加算器 1001に出力される。

[0009] 加算器 1001は、画面内予測部 20より出力される画面内予測画像と予測誤差符号化部 11から出力される予測誤差復号画像を入力し、両者を加算して、復号画像としてフレームメモリ 13に出力する。

[0010] フレームメモリ 13は、加算器 1001から出力される復号画像を入力し、当該復号画像を保存する。保存されている復号画像は、画面内予測画像を作成する際に、画面内予測部 20に出力される。

[0011] 可逆符号ィ匕部 14は、予測誤差符号ィ匕部 11から出力される予測誤差信号を入力し

、当該予測誤差信号に対して可変長符号ィ匕若しくは算術符号ィ匕に基づく可逆符号化を施し、符号語を生成する。生成された符号語が、最終的な符号化画像となる。

[0012] 図 8は、上記図 1に示す従来の画像符号ィヒ装置 2における処理の流れを示すフロ一チャートである。以下の処理は、周波数変換サイズであるブロック単位で処理が施される。

[0013] 最初に、画面内予測部 20で、入力画像 org— blkと画面内予測画像 prd— blk[mo de] (mode = 0, 1, · · · , 8)との予測誤差を予測評価値 costとし、最小の予測評価値 min— costとなる最適な画面内予測モード best— modeを 1つ選択する（ステップ A0)。これは、入力画像と画面内で生成する画面内予測画像との予測誤差が小さいほど、符号ィ匕効率が向上すると考えられるからである。当該ステップの詳細な処理フローについては、後述する。

[0014] 次に、画面内予測部 20で、ステップ AOで選択された最適な予測モード best— mo deが定める予測方向に隣接画素の値をコピーして面内予測画像 prd— blk[best— mode]を生成する（ステップ A 1)。

[0015] そして、差分器 101で、入力画像 org— blkと上記ステップ A1で生成された画面内予測画像 prd— blk [best— mode]との予測誤差画像 diff— blkを生成する（ステップ A2)。

[0016] 更に、予測誤差符号ィ匕部 11で、上記ステップ A2で生成された予測誤差画像 diff

—blkに離散コサイン変換またはカーネル 'レーべ変換等の周波数変換と量子化を施し、予測誤差信号 diff_signalを生成する (ステップ A3)。

[0017] 最後に、可逆符号化部 14で、ステップ A3で生成された予測誤差信号 diff— signal に対して可変長符号ィ匕若しくは算術符号ィ匕に基づく可逆符号ィ匕を施し、符号語を生成する（ステップ A4)。

[0018] 以上が、従来の H. 264ZAVCの画面内予測符号化の処理フローである。

[0019] 次に、上記図 8のステップ AOの最適な画面内予測モード best modeを決定する処理の詳細について説明する。図 9は、画面内予測モードの候補を選定する際の処理の流れを示すフローチャートである。以下の処理は、上記図 8と同様、周波数変換サイズであるブロック単位で処理が施される。

[0020] 最初に、画面内予測モード候補選定部 101は、画面内予測モード mode (mode = 0, 1, . . . , 8)の候補を選定する (ステップ BO)。この場合の候補は、候補フラグ flag [mode]を用いて指定する。候補フラグ flag [mode]は、「1」の値をとるとき、その画面内予測モードが候補であることを示し、「0」の値をとるとき、候補外であることを示す。本ステップの詳細な処理フローに関しては、後述する。

[0021] 次に、画面内予測モード決定部 102は、最適な面内予測モードの予測評価値 min —costと最適な面内予測モード best— modeの初期化を行う（ステップ Bl)。最適な画面内予測モードの予測評価値 min— costに関しては、予測評価値が取り得な!/ヽ大きい値 MAXCOSTに設定する。また、最適な画面内予測モード best— modeに関しては、画面内予測モード BESTMODE (任意の面内予測モード mode (mode = 0, 1, · · · , 8) )に設定する。

[0022] そして、画面内予測モード決定部 102は、全ての画面内予測モード mode (mode

=0, 1, . . . , 8)に対して (ステップ Β2)、候補フラグ flag[mode]が 0か 1かを判定する（ステップ B3)。画面内予測モード modeが「1」、すなわち、画面内予測モード m odeが画面内予測の候補である場合、画面内予測モード modeが定める画面内予測方向に隣接画素の値をコピーして画面内予測画像 prd— blk[mode]を生成する (ステツプ B4)。更に、面内予測モード決定部 102は、入力画像 org— blkとステップ C4 にお、て生成した画面内予測画像 prd— blk[mode]を用いて予測評価値 costを計算する (ステップ B5)。

[0023] 最後に、画面内予測モード決定部 102は、上記ステップ B5で計算された予測評価値 costと最適な画面内予測モードの予測評価値 min— costの大小関係を比較する (ステップ B6)。予測評価値 costの方が小さい場合、予測モード決定部 302は、最適な画面内予測モードの予測評価値 min— costを予測評価値 costに置き換え、最適な画面内予測モード best— modeを画面内予測モード modeに置き換える（ステップ B7)。 [0024] 以上の処理を全ての画面内予測モード mode (mode = 0, 1, · · · , 8)について実施することで、最小の予測評価値をとる最適な画面内予測モード best— modeが決まる。

[0025] しかしながら、上述した従来の画面内予測符号化方法では、最適な画面内予測モードを決定する際に、全ての画面内予測モードに対して、逐一、画面内予測画像を生成し、入力画像と画面内予測画像との予測評価値を計算する必要がある。そこで、非特許文献 1のように、入力画像のエッジ特性に基づいて画面内予測モードの候補を選定する方法や (例えば、特許文献 1参照）、入力画像の周波数特性に基づいて面内予測モードの候補を選定する方法 (例えば、非特許文献 2参照）が提案されている。

[0026] 最初に、エッジ特性に基づ、て予測モードを決定する方法にっ、て説明する。エツジ特性に基づく方法は、最適な面内予測モードの予測方向は、エッジ方向にほぼ一致するという考えに基づく方法である。

[0027] 図 2に、エッジ特性に基づく画面内予測モードの候補選定を実現する画面内予測部 20のブロック図を示す。図 2に示すように、画面内予測部 20は、エッジ特性解析部 100、予測モード候補選定部 101、予測モード決定部 102を備える。以下、各部の処理内容及び機能について順に説明する。

[0028] エッジ特性解析部 100は、入力画像を入力とし、当該入力画像の各画素に対して、エッジ検出フィルタである SOBELフィルタを適用し、図 6に示す通り、エッジ方向を面内予測方向別に分類し、ヒストグラムを作成する。そして、エッジ特性解析部 100は、当該ヒストグラムをエッジ特性情報として、予測モード候補選定部 101に出力する。

[0029] 予測モード候補選定部 101は、エッジ特性解析部 100から出力されるエッジ特性情報から、最頻の画面内予測方向とその近傍方向に面内予測する画面内予測モードを候補として選定する。そして、予測モード候補選定部 101は、当該画面内予測モードの候補を予測モード候補情報として、予測モード決定部 102に出力する。

[0030] 予測モード決定部 102は、予測モード候補選定部 101から出力される予測モード候補情報を入力とし、画面内予測モードの候補から 1つ面内予測モードを選択し、当該画素面内予測モードに対応する画面内予測画像を出力する。 [0031] 以上が、エッジ特性に基づく画面内予測モードの候補選定を実現する画面内予測部 20の説明である。

[0032] 次に、エッジ特性に基づく画面内予測モードの候補選定に係る処理フローに関して説明する。図 10は、エッジ特性に基づく面内予測モードの候補選定に係るフローチャートである。以下の処理フローは、周波数変換サイズのブロック単位に実施される。

[0033] 最初に、予測モード候補選定部 101は、画面内予測モード mode (mode = 0, 1, .

. . , 8)の候補フラグ flag [mode]を「0」に初期化する。

[0034] 次に、エッジ特性解析部 100は、入力画像 org— blkのブロック内の各画素に対して（ステップ CO)、 SOBELフィルタを施し (ステップ C1)、各画素のエッジ方向を画面内予測方向別に分類し、個々の方向別に頻度をカウントする (ステップ C2)。

[0035] そして、最後に、最頻の画面内予測方向とその近傍方向に画面内予測する画面内予測モード mode— edgeの候補フラグ flag [mode— edge]を「1」にする（ステップ C3

) o

[0036] 以上が、エッジ特性に基づく画面内予測モードの候補選定に係るフローチャートである。

[0037] 次に、周波数特性に基づいて予測モードを決定する方法について説明する。

[0038] 図 3は、周波数特性に基づく画面内予測モードの候補選定を実現する画面内予測部 21のブロック図を示す。図 3に示すように、画面内予測部 21は、周波数特性解析部 200、予測モード候補選定部 201及び 202予測モード決定部 202を備える。以下、各部の処理内容及び機能について順に説明する。

[0039] 周波数特性解析部 200は、入力画像を入力とし、当該入力画像に対して、離散コサイン変換またはカーネル 'レーべ変換等の周波数変換を適用し、水平方向の周波数成分、垂直方向の周波数成分、水平方向のエネルギー強度、垂直方向のエネルギー強度の 4変数を計算する。そして、周波数特性解析部 200は、当該 4変数を周波数特性情報として、予測モード候補選定部 201に出力する。

[0040] 予測モード候補選定部 201は、周波数特性解析部 200から出力される周波数特性情報を入力し、水平 ·垂直方向の周波数成分とエネルギーの偏りから、図 7に示す分布パターンに分類し、当該分布パターン力画面内予測モードの候補を選定する。そして、予測モード候補選定部 201は、当該画面内予測モードの候補を予測モード候補情報として、予測モード決定部 202に出力する。

[0041] 予測モード決定部 202は、予測モード決定部 102と同様、予測モード候補選定部 2 01から出力される予測モード候補情報を入力し、画面内予測モードの候補から 1つ画面内予測モードを選択し、当該画面内予測モードに対応する画面内予測画像を出力する。

[0042] 以上が、周波数特性に基づく面内予測モードの候補選定を実現する画面内予測部 21の説明である。

[0043] 次に、周波数特性に基づく画面内予測モードの候補選定に係る処理フローに関して説明する。図 11は、周波数特性に基づく画面内予測モードの候補選定に係るフロ一チャートである。以下の処理フローは、周波数変換サイズのブロック単位に実施される。

[0044] 最初に、予測モード候補選定部 301は、画面内予測モード mode (mode = 0, 1, ·

• · , 8)の候補フラグ flag [mode]を「0」に初期化する。

[0045] 次に、周波数特性解析部 200は、入力画像 org— blkに対して、離散コサイン変換またはカーネル 'レーべ変換等の周波数変換を施し (ステップ DO)、水平'垂直方向の周波数成分 CH、 CV (ステップ D1)と、水平 ·垂直方向のエネルギー EH、 EV (ステツプ D2)を計算する。

[0046] そして、最後に、予測モード候補選定部 201は、水平'垂直方向の周波数成分 CH 、 CVとエネルギー EH, EVから、図 7に示す分布パターンに分類し、対応する面内予測モード mode— freqの候補フラグ flag [mode— freq]を 1にする（ステップ D3)。

[0047] 以上が、周波数特性に基づく画面内予測モードの候補選定に係るフローチャートである。

非特許文献 1 : Feng P. et al, 'Fast Mode Decision for Intra Predictio n", JVT-G013, Mar, 2003.

非特許文献 2 :筑波，永吉，花村，富永， "周波数特性に基づく H. 264ZAVCイントラ予測モード決定方法に関する検討"， 2004— AVM— 47. 発明の開示

発明が解決しょうとする課題

[0048] し力しながら、上記 2つの従来方法は、入力画像に対して、エッジ検出フィルタの適用、又は離散コサイン変換若しくはカーネル 'レーべ変換等の周波数変換を必要とするため、やはり処理量が少なくな!/、と!/、う問題がある。

[0049] 本発明は、上記課題に鑑みてなされたものであり、符号化効率をある程度維持しつつ、処理量を大幅に削減できる画像符号ィ匕方法及び画像符号ィ匕装置等を提供することを目的とする。

課題を解決するための手段

[0050] 上記目的を達成するために、本発明に係る画面内予測モード決定方法は、入力画像と生成された画面内予測画像との予測誤差を符号化する画像符号装置における画面内予測モード決定化方法であって、前記入力画像の一部に対応する符号化対象ブロックを構成する少なくとも 3つのサブブロックにおける特徴量を算出し、さらに、一の予測方向上の少なくとも 2つサブブロックにおける前記特徴量の差と、前記一の予測方向とは異なる他の予測方向上の少なくとも 2つのサブブロックにおける前記特徴量の差とを算出する特徴量分布解析ステップと、前記特徴量分布解析ステップにぉヽて算出された前記特徴量の差が小さ!/ヽ方の前記予測方向に対応する少なくとも 1つの予測モードの候補を選定する予測モード候補選定ステップと、前記予測モード候補選定ステップにおいて選定された予測モードの候補の中から一の予測モードを決定する予測モード決定ステップとを含むことを特徴とする。

[0051] これにより、予測モードを決定する際の画面内予測画像を生成する回数が減るため、当該処理量の削減が可能となる。

[0052] また、前記一の予測方向と前記他の予測方向とは、互い直交しており、前記特徴量分布解析ステップでは、前記一の予測方向上の前記 2つサブブロックにおける前記特徴量の差と、前記他の予測方向上の少なくとも 2つのサブブロックにおける前記特徴量の差とを算出することを特徴とする。

[0053] これにより、 2つの方向が 90° 異なるため、画面内予測方向の候補選定に係る分離能に優れている。 [0054] また、前記符号ィ匕対象ブロックは、当該符号化対象ブロックを 4等分する矩形の左上、右上、左下及び右下の各サブブロックで構成されており、前記特徴量分布解析ステップでは、前記左上のサブブロックと前記右下サブブロックにおける前記特徴量の差と、前記右上のサブブロックと前記左下のサブブロックにおける前記特徴量の差とを算出することを特徴とする。

[0055] これにより、全ての画面内予測モードのうち、頻度の高い垂直方向、水平方向及びその中間の斜め 45度方向の差分和を計算することができるため、画面内予測方向の候補選定に係る分離能に優れてヽる。

[0056] また、前記特徴量分布解析ステップでは、前記特徴量を計算する際に、前記各サブブロックにおける最上行の画素及び左端の列の画素のみを用いて、前記特徴量を算出することを特徴とする。

[0057] これにより、実際に画面内予測画像を生成する際に用いる隣接画素に近い画素を用いているため、予測モード候補を選定する際の精度を向上させることができる。

[0058] また、前記特徴量分布解析ステップでは、前記特徴量の差を計算する際に、前記予測方向の起点に近い領域の前記特徴量の差を算出することを特徴とする。

[0059] これにより、実際に画面内予測画像を生成する際に用いる隣接画素に近い画素を用いているため、予測モード候補を選定する際の精度を向上させることができる。

[0060] また、上記目的を達成するために、本発明に係る画像符号化装置は、入力画像と生成された画面内予測画像との予測誤差を符号ィ匕する画像符号ィ匕装置であって、前記入力画像の一部に対応する符号ィ匕対象ブロックを構成する少なくとも 3つのサブブロックにおける特徴量を算出し、さらに、一の予測方向上の少なくとも 2つサブブロックにおける前記特徴量の差と、前記一の予測方向とは異なる他の予測方向上の少なくとも 2つのサブブロックにおける前記特徴量の差とを算出する特徴量分布解析手段と、前記特徴量分布解析手段において算出された前記特徴量の差が小さい方の前記予測方向に対応する少なくとも 1つの予測モードの候補を選定する予測モード候補選定手段と、前記予測モード候補選定手段にお!、て選定された予測モードの候補の中から一の予測モードを決定する予測モード決定手段と、前記予測モード決定手段にお、て決定された前記予測モードを用いて生成された画面内予測画像と前記入力画像との予測誤差を符号ィ匕する予測誤差符号ィ匕手段とを備えることを特徴とする。

[0061] なお、本発明は、上記画面内予測モード決定方法の特徴的なステップを含む画像符号ィ匕方法として実現したり、それらのステップをコンピュータに実行させるためのプログラムとして実現したり、そのプログラムを DVD等の記録媒体やインターネット等の伝送媒体を介して広く流通させることができるのは云うまでもない。

[0062] さらに、上記画像符号化装置における特徴的な構成手段を集積回路で実現してもよい。

発明の効果

[0063] 本発明によれば、低処理量で画面内予測モードを決定することが可能となるため、画像処理の高速ィ匕ゃ上記方法等を実現する ICコストの軽減が可能となり、さらに、消費電力につ、ても肖 IJ減することができる。

図面の簡単な説明

[0064] [図 1]図 1は、従来の画像符号化装置及び実施の形態 1に係る画像符号化装置の機能構成を示すブロック図である。

[図 2]図 2は、従来のエッジ特性を利用した画面内予測部の機能構成を示すブロック図である。

[図 3]図 3は、従来の周波数特性を利用した画面内予測部の機能構成を示すブロック図である。

[図 4]図 4 (a)及び (b)は、 H264ZAVCにおける画面内予測モードとその方向を示す図である。

[図 5]図 5 (a)〜（c)は、 8 X 8画素を用いた画面内予測における画面内予測画像を生成する際の具体例を示す図である。

[図 6]図 6は、エッジ方向を画面内予測モードの方向に分類した場合のヒストグラフの一例である。

[図 7]図 7は、周波数特性と画面内予測モードの候補との関係の一例を示す図である [図 8]図 8は、面内予測符号ィ匕処理のフローチャートである。 [図 9]図 9は、面内予測処理のフローチャートである。

[図 10]図 10は、従来のエッジ特性に基づく画面内予測モードの候補を選定する処理の流れを示すフローチャートである。

[図 11]図 11は、従来の周波数特性に基づく画面内予測モードの候補を選定する処理の流れを示すフローチャートである。

[図 12]図 12は、実施の形態 1に係る画面内予測部の機能構成を示すブロック図である。

[図 13]図 13は、実施の形態 1に係るサブブロックと画面内予測モードの候補を選定する際に用いる方向との関係の一例を示す図である。

[図 14]図 14 (a)及び (b)は、実施の形態 1に係るサブブロックと画面内予測モードの候補を選定する際に用いる方向との関係のその他の例を示す図である。

[図 15]図 15 (a)及び (b)は、実施の形態 1に係るサブブロックと画面内予測モードの候補を選定する際に用いる方向との関係の変形例を示す図である。

[図 16]図 16 (a)及び (b)は、特徴量を計算する際に、サブブロック内の一部の画素を用いることを示す例である。

[図 17]図 17は、実施の形態 1に係る特徴量分布特性に基づく画面内予測モードの候補を選定する処理の流れを示すフローチャートである。

符号の説明

1、 2 画像符号化装置

10、 20、 21 画面内予測部

11 予測誤差符号化部

12 予測誤差復号化部

13 フレームメモリ

14 可逆符号化部

100 エッジ特性解析部

101 予測モード候補選定部

102 予測モード決定部

200 周波数特性解析部 201 予測モード候補選定部

202 予測モード決定部

300 特徴量分布解析部

301 予測モード候補選定部

302 予測モード決定部

1000 減算器

1001 加算器

A〜Y 隣接画素

発明を実施するための最良の形態

[0066] 以下、本発明に係る画像符号化装置の実施の形態について、図面を参照しながら説明する。なお、本発明について、以下の実施の形態および添付の図面を用いて説明を行うが、これは例示を目的としており、本発明がこれらに限定されることを意図しない。

[0067] (実施の形態 1)

上記図 1には、本実施の形態に係る画像符号ィ匕装置 1の機能構成を示すブロック図についても示されている。図 1に示されるように、画像符号ィ匕装置 1は、画面内予測部 10を除き、従来の画像符号化装置 2と同じ機能構成を有している。

[0068] 画面内予測部 10は、フレームメモリ 13に保存されている復号画像を入力し、符号化対象ブロックに隣接する画素を用いて画面内予測画像を生成する。さらに、画面内予測部 10は、符号ィ匕対象ブロックを構成するサブブロックにおける画像上の特徴量 (例えば、各画素の輝度など）に基づいて、評価対象となる予測モードの候補を絞り、この絞られた予測モードの中から 1つの予測モードを決定して画面内予測画像を生成する。画面内予測部 10で生成された画面内予測画像は、差分器 1000と加算器 1001に出力される。

[0069] 以下、本発明において特徴的な画面内予測部 10について重点的に説明する。

[0070] 図 12は、上記図 1の画像符号化装置 1における画面内予測部 10の機能構成を示すブロック図である。図 12に示すように、画面内予測部 10は、特徴量分布解析部 30 0、予測モード候補選定部 301、予測モード決定部 302を備える。以下、各部の機能について、図 13から図 17を参照しながら説明する。

[0071] 特徴量分布解析部 300は、入力画像を入力し、図 13に示す通り、当該入力画像に対応する符号ィ匕対象ブロックを構成する 4つのサブブロック i (i=0, 1, 2, 3)毎の画像上の特徴量 (以下、本実施の形態では「輝度平均値 avg [i]」とする。）を計算する。輝度平均値 avg [i]は、下記の式（1)で与えられる。

[0072] [数 1]

》 org—blkj /

avg[i] = ^jeSubBl0CkJ /n ⁽¹⁾

[0073] ここで、 jは画素座標、 nはサブブロック i内の画素数を示す。図 13の例では、周波数変換サイズが 8 X 8画素単位であるため、サブブロック i (i=0, 1, 2, 3)のサイズは 4 X 4画素、つまり、画素数 nは「16」となる。そして、特徴量分布解析部 300は、右下方向上に分布する 2つのサブブロック i (i=0, 3)の輝度平均値の差分絶対値 delta —aと左下方向上に分布する 2つのサブブロック i (i= l, 2)の輝度平均値の差分絶対値 delta— bを計算する。すなわち、下記の式（2)及び式（3)の通り、

[0074] [数 2] delta_a= I avg[0] - avg[3] \ (2)

[0075] [数 3] delta— b= \ avg[l] - avg[2] | (3)

を計算する。そして、特徴量分布解析部 300は、差分絶対値 delta_aと delta_bを特徴量分布特性情報として、予測モード候補選定部 201に出力する。

[0076] 予測モード候補選定部 301は、特徴量分布解析部 300から出力される特徴量分布特性情報を入力し、 2つの差分絶対値 delta— aと delta— bの大小関係カゝら画面内予測モードの候補を選定する。具体的には、差分絶対値 delta— aが差分絶対値 del ta—bより小さい場合は、右下方向に画面内予測を行う画面内予測モード mode (mo de = 4, 5, 6)を候補に入れ、逆に、差分絶対値 delta_bが差分絶対値 delta_aより小さい場合は、左下方向に画面内予測を行う画面内予測モード mode (mode = 3 , 7, 8)を候補に入れる。そして、予測モード候補選定部 301は、候補として選定した画面内予測モードを予測モード候補情報として、予測モード決定部 202に出力する

[0077] 予測モード決定部 302は、上記従来の予測モード決定部 102や予測モード決定部 202と同様、予測モード候補選定部 301から出力される予測モード候補情報を入力して画面内予測モードの候補から 1つ画面内予測モードを選択し、当該画面内予測モードに対応する画面内予測画像を生成して出力する。

[0078] 次に、本実施の形態に係る画面内予測部 10において画面内予測モードの候補を選定する際の処理手順について説明する。図 17は、画面内予測部 10における予測モード候補を選定する際の処理の流れを示すフローチャートである。以下の処理フロ一は、周波数変換サイズのブロック単位に実施される。

[0079] 最初に、予測モード候補選定部 301は、画面内予測において頻度の高い垂直予測モード、水平予測モード及び DC予測モードを、固定の候補として選定する (ステツプ E0)。これは、一般的な画像に垂直方向又は水平方向のテクスチャが多く含まれているためである。予測モード候補として指定する方法は、前述の通り、候補フラグ fl ag [mode] (mode = 0, 1, · · · , 8)を用いて指定する。ステップ E0では、候補フラグ f lag [mode] (mode = 0, 1 , 2)に「1」を設定し、候補フラグ flag [mode] (mode = 3, 4, · · · , 8)に「0」を設定する。

[0080] 次に、特徴量分布解析部 300は、上記図 13に示す通り、符号化対象ブロックを構成する 4つのサブブロック i (i=0, 1, 2, 3)の輝度平均値 avg [i]を計算する (ステップ El)。輝度平均値 avg [i]は、前述の通り、式（1)で与えられる。

[0081] そして、特徴量分布解析部 300は、右下方向と左下方向上に分布するサブブロック i (i = 0, 1, 2, 3)の輝度平均値 avg [i]の差分絶対値 delta— a及び delta— bを計算する (ステップ E2)。 [0082] 右下方向の差分絶対値 delta— aは、図 13に示す符号化対象ブロックの左上と右下に位置するサブブロック i (i=0, 3)の輝度平均値 avg [i]を用いて、上記の式（2) に従って計算される。同様にして、左下方向の差分絶対値 delta— bは、符号化対象ブロックの右上と左下に位置するサブブロック i (i= 1 , 2)の輝度平均値 avg [i]を用いて、上記の式（3)に従って計算される (ステップ E2)。

[0083] さらに、予測モード候補選定部 301は、 2つの差分絶対値 delta— aと delta— bの大小関係を比較する (ステップ E3)。差分絶対値 delta— aが差分絶対値 delta— bより小さい場合は、右下方向の画面内予測を行う画面内予測モード mode (mode =4 , 5, 6)を予測モード候補に入れる。すなわち、候補フラグ flag [mode] (mode =4, 5, 6)に「1」を設定する (ステップ E4)。

[0084] 逆に、差分絶対値 delta— bが差分絶対値 delta— aより小さい場合は、左下方向の面内予測を行う面内予測モード mode (mode = 3, 7, 8)を予測モード候補に入れる。すなわち、候補フラグ flag [mode] (mode = 3, 7, 8)に「1」を設定する（ステップ E 5)。

[0085] 以上のように、実施の形態 1に係る画像符号化装置 1によれば、低処理量で斜め方向の画面内予測モードの候補を絞ることができるため、画面内予測処理全体として処理量を削減することが可能となる。

[0086] なお、特徴量分布解析部 300における、輝度平均値の差分絶対値 delta— aと delt a— bを計算する際に対象とするサブブロックの関係は、上記図 13に限るものではない。例えば、図 14や図 15に示すようなサブブロックを用いてもよい。

[0087] 図 14 (a)及び (b)は、上記実施の形態 1に係るサブブロックと画面内予測モードの候補を選定する際に用いる方向との関係のその他の例を示す図である。図 14 (a)に示すように、サブブロック 0とサブブロック 1を用いて上記 delta_a (実線)を計算し、サブブロック 1とサブブロック 3を用いて delta— b (実線）を計算してもよ、（勿論、サブブロック 0とサブブロック 2を用いて上記 delta_a (破線）を計算し、サブブロック 2とサブブロック 3を用いて delta_b (破線）を計算してもよ、)。

[0088] また、図 14 (b)に示すように、符号ィ匕済みのサブブロック aとサブブロック 1を用いて上記 delta aを計算し、符号化済みのサブブロック cとサブブロック 0を用いて delta _bを計算してもよい（同様に、符号ィ匕済みのサブブロック dとサブブロック 2を用いて上記 delta— aを計算し、符号ィ匕済みのサブブロック bとサブブロック 1を用いて上記 d elta— bを計算してもよい)。

[0089] 図 15 (a)及び (b)は、上記実施の形態 1に係るサブブロックと画面内予測モードの候補を選定する際に用いる方向との関係の変形例を示す図である。図 15 (a)に示すように、符号ィ匕済みのサブブロック eとサブブロック 0を用いて上記 delta— aを計算し、符号ィ匕済みのサブブロック bとサブブロック 0を用いて上記 delta— bを計算してもよヽ (勿論、符号ィ匕済みのサブブロック bとサブブロック 0を用いる代わりに、符号化済みのサブブロック dとサブブロック 0を用いて上記 delta— bを計算してもよ!/、）。

[0090] また、図 15 (b)に示すように、サブブロック 0と符号ィ匕済みのサブブロック dを用いて上記 delta— aを計算し、サブブロック 0とサブブロック 3を用いて上記 delta— bを計算してちよい。

[0091] (実施の形態 2)

上記実施の形態 1では、画面内予測符号ィ匕方式において予測モードを決定する際に、符号ィ匕対象ブロックを構成するサブブロックにおける画像上の特徴量に基づヽて予測モードの候補を絞る画像符号ィ匕装置について説明したが、本発明の実施の形態 2では、更に、平坦部を細かく量子化し、複雑部を粗く量子化する、量子化変調方法の中間データを活用する画像符号ィ匕装置について説明する。当該量子化変調方法は、主観的な品質向上方法の 1つであり、人間の目は平坦部対して敏感で、逆に、複雑部に対しては鈍いことを利用するものであり、平坦部の画質を相対的に向上さ ·¾：るちのである。

[0092] 本実施の形態で扱う量子化変調方法では、入力画像の輝度分散値 varに基づ、て平坦部と複雑部に分類する。このとき、輝度分散値 varの計算で必要となる輝度平均値 avgを、サブブロック i (i = 0, 1, 2, 3)の輝度平均値 avg [i]力も計算する。すななち、下記の式 (4)及び式（5)に従って計算することができる。

[0093] [数 4]

[0095] ここで、 org— blkは、入力画像の輝度成分の画素値、 jは画素座標、 nは直交変換サイズのブロック内の画素数を示す。

[0096] 以上のように、本実施の形態 2によれば、量子化変調方法を適用する場合に、上記実施の形態 1における式（1)の処理を共有化できる。

[0097] (実施の形態 3)

上記実施の形態 1では、 4つのサブブロック i (i=0, 1, 2, 3)の輝度平均値 avg [i] を計算する際に、サブブロック i内の全画素を用いて計算したが、全画素を用いて計算せずに、図 16 (a)や図 16 (b)に示す通り、画素を間引いて計算してもよい。特に、図 16 (b)に示す通り、各サブブロック iの最上部の行の画素（この場合は 4画素）と左端の 1列の画素（この場合は 4画素）を用いて輝度平均値 avg [i] (i=0, 1, 2, 3)を計算してもよヽ (この場合、全画素を用いる場合よりも予測モード候補の選定精度が若干向上することがある)。

[0098] 尚、上記の説明では、サブブロック i (i=0, 1, 2, 3)の輝度平均値 avg [i]を特徴量として計算したが、特徴量は輝度平均値に限定するものではなぐ各サブブロックおける輝度の中央値ゃ最頻値などであってもよい。更に、各サブブロックの形状 (即ち、画素構成）は、正方形に限定するものではなぐ例えば、 4 X 8画素や 8 X 4画素で構成される長方形等であってもよヽ。

[0099] また、上記の実施の形態 1では、 4つのサブブロック i (i=0, 1, 2, 3)の輝度平均値 avg [i]を計算したが、少なくとも 2つの方向の差分絶対値 deltaが計算できればよぐサブブロックは少なくとも 3つあればよい。例えば、図 14 (a)に示すように、サブブロック 0とサブブロック 1で水平方向の delta— aを算出し、サブブロック 1とサブブロック 3 で delta— bを算出してもよい。この場合に必要となるサブブロックは 3つである。

[0100] 更に、 1つの方向上に分布するサブブロックは 2つであった力少なくとも 2つあればでよぐ 3つ以上でもよい。 1つの方向上にサブブロックが少なくとも 3つ分布する場合については、画面内予測方向の起点に近い領域の代表値との誤差和を計算する。すなわち、誤差和を deltaとすると、下記の式（6)で与えられる。

[0101] [数 6] n-1

delta = I avg[0] - avg[\] | (6)

/=o

[0102] ここで、 avg [i] (i=0, 1 , · · · , n— 1)は、画面内予測方向の起点に近い領域 (例えば、サブブロック 0)力 i番目の輝度平均値、 nは 1つの方向上に分布する全てのサブブロックの数である。産業上の利用可能性

[0103] 本発明に係る予測モード決定方法、画像符号化方法および画像符号化装置は、画面内予測符号ィ匕に係る処理量の削減が可能であるため、例えば、携帯電話、ハードディスクレコーダ及びパーソナルコンピュータ等において画像の圧縮符号ィ匕を行う方法又は装置として有用である。

Claims

請求の範囲

[1] 入力画像と生成された画面内予測画像との予測誤差を符号ィ匕する画像符号装置における画面内予測モード決定ィ匕方法であって、

前記入力画像の一部に対応する符号ィ匕対象ブロックを構成する少なくとも 3つのサブブロックにおける特徴量を算出し、さらに、一の予測方向上の少なくとも 2つサブブロックにおける前記特徴量の差と、前記一の予測方向とは異なる他の予測方向上の少なくとも 2つのサブブロックにおける前記特徴量の差とを算出する特徴量分布解析ステップと、

前記特徴量分布解析ステップにおいて算出された前記特徴量の差が小さい方の前記予測方向に対応する少なくとも 1つの予測モードの候補を選定する予測モード候補選定ステップと、

前記予測モード候補選定ステップにお、て選定された予測モードの候補の中から一の予測モードを決定する予測モード決定ステップと

を含むことを特徴とする画面内予測モード決定方法。

[2] 前記一の予測方向と前記他の予測方向とは、互い直交しており、

前記特徴量分布解析ステップでは、前記一の予測方向上の前記 2つサブブロックにおける前記特徴量の差と、前記他の予測方向上の少なくとも 2つのサブブロックにおける前記特徴量の差とを算出する

ことを特徴とする請求項 1記載の画面内予測モード決定方法。

[3] 前記符号化対象ブロックは、当該符号化対象ブロックを 4等分する矩形の左上、右上、左下及び右下の各サブブロックで構成されており、

前記特徴量分布解析ステップでは、前記左上のサブブロックと前記右下サブブロックにおける前記特徴量の差と、前記右上のサブブロックと前記左下のサブブロックにおける前記特徴量の差とを算出する

[4] 前記特徴量分布解析ステップでは、前記特徴量を計算する際に、前記各サブプロックにおける最上行の画素及び左端の列の画素のみを用いて、前記特徴量を算出することを特徴とする請求項 1記載の画面内予測モード決定方法。

[5] 前記特徴量分布解析ステップでは、前記特徴量の差を計算する際に、前記予測方向の起点に近い領域の前記特徴量の差を算出する

[6] 前記特徴量は、前記各サブブロックを構成する全ての画素に係る輝度の平均値、中央値又は最頻値であり、

前記特徴量分布解析ステップでは、前記各サブブロックにおける前記輝度の平均値、中央値又は最頻値を算出し、さらに、一の予測方向上の少なくとも 2つサブブロックにおける前記輝度の平均値、中央値又は最頻値の差と、前記一の予測方向とは異なる他の予測方向上の少なくとも 2つのサブブロックにおける前記輝度の平均値、中央値又は最頻値の差とを算出する

[7] 入力画像と生成された画面内予測画像との予測誤差を符号化する画像符号化方法であって、

前記予測モード候補選定ステップにお、て選定された予測モードの候補の中から一の予測モードを決定する予測モード決定ステップと、

前記予測モード決定ステップにお、て決定された前記予測モードを用いて生成された画面内予測画像と前記入力画像との予測誤差を符号ィヒする予測誤差符号化ステツプと

を含むことを特徴とする画像符号化方法。

[8] 入力画像と生成された画面内予測画像との予測誤差を符号化する画像符号化装置であって、

前記入力画像の一部に対応する符号ィ匕対象ブロックを構成する少なくとも 3つのサブブロックにおける特徴量を算出し、さらに、一の予測方向上の少なくとも 2つサブブロックにおける前記特徴量の差と、前記一の予測方向とは異なる他の予測方向上の少なくとも 2つのサブブロックにおける前記特徴量の差とを算出する特徴量分布解析手段と、

前記特徴量分布解析手段において算出された前記特徴量の差が小さい方の前記予測方向に対応する少なくとも 1つの予測モードの候補を選定する予測モード候補選定手段と、

前記予測モード候補選定手段にぉ、て選定された予測モードの候補の中から一の予測モードを決定する予測モード決定手段と、

前記予測モード決定手段において決定された前記予測モードを用いて生成された画面内予測画像と前記入力画像との予測誤差を符号化する予測誤差符号化手段とを備えることを特徴とする画像符号化装置。

[9] 入力画像と生成された画面内予測画像との予測誤差を符号化する画像符号化装置に用いられる、コンピュータに実行させるためのプログラムであって、

前記プログラムは、

前記予測モード候補選定ステップにお、て選定された予測モードの候補の中から一の予測モードを決定する予測モード決定ステップとを含むことを特徴とするプログラム。

入力画像と生成された画面内予測画像との予測誤差を符号化する集積回路であつて、

前記予測モード決定手段において決定された前記予測モードを用いて生成された画面内予測画像と前記入力画像との予測誤差を符号化する予測誤差符号化手段とを備えることを特徴とする集積回路。