JP5514130B2 - テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム - Google Patents

テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム Download PDF

Info

Publication number
JP5514130B2
JP5514130B2 JP2011010020A JP2011010020A JP5514130B2 JP 5514130 B2 JP5514130 B2 JP 5514130B2 JP 2011010020 A JP2011010020 A JP 2011010020A JP 2011010020 A JP2011010020 A JP 2011010020A JP 5514130 B2 JP5514130 B2 JP 5514130B2
Authority
JP
Japan
Prior art keywords
image
prediction mode
prediction
unit
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011010020A
Other languages
English (en)
Other versions
JP2012151755A (ja
Inventor
俊枝 三須
善明 鹿喰
和久 井口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2011010020A priority Critical patent/JP5514130B2/ja
Publication of JP2012151755A publication Critical patent/JP2012151755A/ja
Application granted granted Critical
Publication of JP5514130B2 publication Critical patent/JP5514130B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、テクスチャ画像を分析するテクスチャ解析装置、このテクスチャ解析装置によって分析した結果をイントラ予測やパターン認識へ応用したイントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラムに関する。
従来、画像のテクスチャを解析する技法として、画像のフラクタル特徴に基づく技法(例えば、特許文献1参照)や、エッジ検出に基づく技法が提案されている(例えば、特許文献2参照)。
テクスチャ解析の目的としては、該解析結果に基づくパターン認識によりコンクリート等の欠陥を検出する技法(例えば、特許文献2参照)や、画像符号化に応用する技法が挙げられる(例えば、特許文献3参照)。
イントラ予測の技法としては、MPEG−4 AVC/H.264方式等において規格化されている。イントラ予測に予測対象ブロックの画素値を、該予測対象ブロックに隣接する画素群の画素値に基づいて予測する技法がある(例えば、特許文献4参照)。また、予測対象ブロックの画素値を、その隣接画素群から特定方向について予測する技法がある(例えば、特許文献5参照)。さらに、予測対象ブロックの隣接画素と、予測対象ブロックから1画素を超える距離に存在する画素との対に基づき、予測対象ブロックの予測を行う技法がある(例えば、特許文献6参照)。
特開平5−28266号公報 特開平6−60182号公報 特許第4450828号明細書 特開2009−49969号公報 特開2008−245088号公報 特開2008−271371号公報
前述したように、画像のテクスチャ解析を行うことは構造物表面の欠陥検出や画像符号化など様々な分野で要求されている。しかし、従来のテクスチャ解析技法は、テクスチャ毎に領域を分割したり、そのテクスチャが何であるかを認識したりすることを目的としていた。例えば、特許文献2の技法では、観測された画像からコンクリートのひびを検出するよう設計されているため、このテクスチャ解析結果に基づいて、隣接領域のテクスチャを予測するという目的には則していない。
一方、特許文献3の技法では、画像のテクスチャ解析を行い、この解析結果から予測対象ブロックを予測し、画像合成的にはめ込みを行うことで、符号化効率の改善を図っている。しかし、特許文献3の技法は、主観的な画質向上を目指して、画像合成的にテクスチャをはめ込むものであるから、実際の符号化対象の入力画像と、復号後に得られる出力画像との間で、信号波形(位相、振幅)としての類似性は全く保証されない。
一方、信号波形の類似性を重視する画像符号化技法においては、入力画像(または、動き補償後の残差画像)を複数のブロックに分割し、ある注目ブロック(予測ブロック)の画素値を、すでに符号化済みの周囲の画素値群から内外挿補間することで予測を行う。その後、画像符号化技法は、この予測結果と入力画像(または、動き補償後の残差画像)との残差をエントロピー符号化する。例えば、MPEG−4 AVC/H.264規格のイントラ予測では予測対象ブロックの周辺画素からの0次ホールドでの予測を行うが、最適な予測方向を複数試行の結果、レート対歪みの観点で特定している。この予測処理では最適な予測方向の決定が行われるが、その最適な予測方向を示す情報(予測モードの情報)の伝送が必要である。このため、イントラ予測における最適な予測方向に関して、復号済みの参照画素のテクスチャを分析して予測対象ブロックの相関方向を検出できれば、予測モードの情報の伝送負荷を減少させることができる。
しかし、精度よく簡易な方式で予測対象ブロックの相関方向を検出するテクスチャ解析技法はなかった。とりわけ、画像符号化のイントラ予測に利用可能なテクスチャ解析技法は存在しなかった。従来のテクスチャ解析技法では、相関演算により特定の方向のテクスチャの存在を検出することはできたが、排他的にその方向のみに強い相関を持つか否かを評価するものではなかった。
特に、エッジ検出を通じて排他的に強い相関の方向を求める技法はあったが、ある領域内で大局的に特定の方向に強い相関を持つか否かを評価するものではなかった。
本発明の目的は、上述の問題に鑑みて為されたものであり、テクスチャ画像を分析するテクスチャ解析装置、このテクスチャ解析装置によって分析した結果をイントラ予測やパターン認識へ応用したイントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラムを提供することにある。
本発明のテクスチャ解析装置は、入力画像のスペクトルを演算し、空間スペクトル画像を生成するスペクトル演算部と、前記空間スペクトル画像について方位ごとに所定の走査パターンで空間周波数を走査する走査制御部と、当該走査された空間周波数におけるスペクトルを集計する集計部と、当該集計した結果の集計値のうちの最大値及び/又は最小値を判別し、前記最大値及び/又は前記最小値に該当する当該方位の情報をテクスチャ方位として決定する最適化処理部と、を備えることを特徴とする。
本発明のテクスチャ解析装置によれば、入力画像の各方位に沿った空間周波数を走査することで、入力画像の空間周波数の繰り返し波形の存在の度合を求めて集計して、繰り返し波形の存在の度合の最も強いまたは最も弱い方位を探索して評価するため、高精度のテクスチャ方位の情報を得ることができるようになる。
また、本発明のイントラ予測モード判定装置は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測モード判定装置であって、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像としてテクスチャ方位の情報を出力する本発明によるテクスチャ解析装置と、前記テクスチャ解析装置によって決定されるテクスチャ方位の情報を予め定めた所定数の予測モードの方位のうちのいずれか1つに割り当て、割り当てた予測モードの方位に関する推定予測モードの識別子を生成する判定部と、を備えることを特徴とする。
本発明のイントラ予測モード判定装置によれば、特定の方向に沿った予測を行う複数の予測モードの中から、適した方位の予測モードを本発明に係るテクスチャ方位の情報に応じて決定することができ、イントラ予測の予測精度を向上させることができるようになる。
また、本発明の第1態様のイントラ予測装置は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置であって、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する本発明のイントラ予測モード判定装置と、前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測する予測部と、を備えることを特徴とする。
本発明の第1態様のイントラ予測装置によれば、イントラ予測対象のブロック画像の周囲の参照領域画像における参照領域のテクスチャ方位に沿って予測する方向を決定するため、当該周囲の参照領域の波形を本発明に係るテクスチャ方位の情報によって延長するようイントラ予測を行うことになり、この結果、参照領域画像からイントラ予測対象のブロック画像に貫入するような画素値パターンを精度よく近似することができるようになる。
また、本発明の第2態様のイントラ予測装置は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置であって、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する本発明のイントラ予測モード判定装置と、予め定めたレート歪み特性に基づいて前記複数の予測モードの中から1つの予測モードを最適予測モードとして決定して当該予測画像を生成するとともに、当該最適予測モードの識別子を前記推定予測モードの識別子と同一の記述形態で生成するRD最適化処理部と、前記推定予測モードの識別子と前記最適予測モードの識別子を用いて当該記述形態を疎表現化した、予測モードの疎表現化記述子を生成する予測モード記述子疎表現化部と、を備えることを特徴とする。
本発明の第2態様のイントラ予測装置によれば、予め用意した複数の予測モードの中からレート歪み特性の観点で最適な予測モードを決定する一方で、本発明に係るイントラ予測モード判定装置により決定される予測モードを求め、最適予測モードの識別子の記述形態を推定予測モードの識別子の記述形態で変化させることができ、換言すれば、単に最適予測モードの識別子を伝送するよりも記述形態を疎表現化した態様で予測モードの情報を伝送することが可能となる。特に、最適予測モードの識別子と推定予測モードの識別子との間に非零の相関がある状況においては、符号化側及び復号側の双方でイントラ予測モード判定装置を具備することにより、符号化側と復号側との間の当該識別子の伝送が圧縮可能となり、実質的な伝送符号量を削減することができるようになる。
また、本発明の第3態様のイントラ予測装置は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置であって、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する本発明のイントラ予測モード判定装置と、前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測し、予測画像の初期値として設定する予測画像初期値設定部と、前記参照領域画像と、当該初期値が設定されたイントラ予測対象のブロック画像からなる処理ブロックを生成する処理ブロック生成部と、前記処理ブロックの画像に対して直交変換を施す直交変換部と、前記直交変換部によって生成される直交変換係数を、高周波領域において元の値よりも小さい値に修正する係数修正部と、前記修正された直交変換係数に対して逆直交変換を施す逆直交変換部と、前記逆直交変換部によって生成される画像のうち、前記参照領域画像の画像領域における画素値を前記参照領域画像の元の画素値に修正する画像修正部と、前記直交変換部、前記係数修正部及び前記逆直交変換部による一連の処理を、当該参照領域画像の画像領域における画素値の修正が所定の修正量以下となるまで所定回数以内で繰返す分岐部と、当該繰り返しによって得られる最終的な処理ブロックの画像から、イントラ予測対象のブロック画像を抽出して予測画像を生成する予測画像抽出部と、を備えることを特徴とする。
本発明の第3態様のイントラ予測装置によれば、本発明に係るイントラ予測モード判定装置により決定される予測モードから予測画像の初期値を設定し、さらに、当該周囲の参照領域の波形を参照画像領域における細かい領域制御で収束演算することを可能とするために、より高精度の参照画像を早い収束速度で求めることができるようになる。
本発明のプログラムは、コンピュータに、入力画像のスペクトルを演算し、空間スペクトル画像を生成するステップと、前記空間スペクトル画像について方位ごとに所定の走査パターンで空間周波数を走査するステップと、当該走査された空間周波数におけるスペクトルを集計するステップと、当該集計した結果の集計値のうちの最大値及び/又は最小値を判別し、前記最大値及び/又は前記最小値に該当する当該方位の情報をテクスチャ方位として決定するステップと、を実行させるためのプログラムである。
本発明のプログラムは、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測モード判定装置として構成するコンピュータに、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像として、当該入力画像のスペクトルを演算し、空間スペクトル画像を生成するステップと、前記空間スペクトル画像について方位ごとに所定の走査パターンで空間周波数を走査するステップと、当該走査された空間周波数におけるスペクトルを集計するステップと、当該集計した結果の集計値のうちの最大値及び/又は最小値を判別し、前記最大値及び/又は前記最小値に該当する当該方位の情報をテクスチャ方位として決定するステップと、当該決定されるテクスチャ方位の情報を予め定めた所定数の予測モードの方位のうちのいずれか1つに割り当て、割り当てた予測モードの方位に関する推定予測モードの識別子を生成するステップと、を実行させるためのプログラムである。
本発明のプログラムは、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測装置として構成するコンピュータに、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像として、当該入力画像のスペクトルを演算し、空間スペクトル画像を生成するステップと、前記空間スペクトル画像について方位ごとに所定の走査パターンで空間周波数を走査するステップと、当該走査された空間周波数におけるスペクトルを集計するステップと、当該集計した結果の集計値のうちの最大値及び/又は最小値を判別し、前記最大値及び/又は前記最小値に該当する当該方位の情報をテクスチャ方位として決定するステップと、当該決定されるテクスチャ方位の情報を予め定めた所定数の予測モードの方位のうちのいずれか1つに割り当て、割り当てた予測モードの方位に関する推定予測モードの識別子を生成するステップと、前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測するステップと、を実行させるためのプログラムである。
本発明のプログラムは、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測装置として構成するコンピュータに、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像として、当該入力画像のスペクトルを演算し、空間スペクトル画像を生成するステップと、前記空間スペクトル画像について方位ごとに所定の走査パターンで空間周波数を走査するステップと、当該走査された空間周波数におけるスペクトルを集計するステップと、当該集計した結果の集計値のうちの最大値及び/又は最小値を判別し、前記最大値及び/又は前記最小値に該当する当該方位の情報をテクスチャ方位として決定するステップと、当該決定されるテクスチャ方位の情報を予め定めた所定数の予測モードの方位のうちのいずれか1つに割り当て、割り当てた予測モードの方位に関する推定予測モードの識別子を生成するステップと、予め定めたレート歪み特性に基づいて前記複数の予測モードの中から1つの予測モードを最適予測モードとして決定して当該予測画像を生成するとともに、当該最適予測モードの識別子を前記推定予測モードの識別子と同一の記述形態で生成するステップと、前記推定予測モードの識別子と前記最適予測モードの識別子を用いて当該記述形態を疎表現化した、予測モードの疎表現化記述子を生成するステップと、を実行させるためのプログラムである。
本発明のプログラムは、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測装置として構成するコンピュータに、(a)イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像として、当該入力画像のスペクトルを演算し、空間スペクトル画像を生成するステップと、(b)前記空間スペクトル画像について方位ごとに所定の走査パターンで空間周波数を走査するステップと、(c)当該走査された空間周波数におけるスペクトルを集計するステップと、(d)当該集計した結果の集計値のうちの最大値及び/又は最小値を判別し、前記最大値及び/又は前記最小値に該当する当該方位の情報をテクスチャ方位として決定するステップと、(e)当該決定されるテクスチャ方位の情報を予め定めた所定数の予測モードの方位のうちのいずれか1つに割り当て、割り当てた予測モードの方位に関する推定予測モードの識別子を生成するステップと、(f)前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測し、予測画像の初期値として設定するステップと、(g)前記参照領域画像と、当該初期値が設定されたイントラ予測対象のブロック画像からなる処理ブロックを生成するステップと、(h)前記処理ブロックの画像に対して直交変換を施すステップと、(i)前記ステップ(h)によって生成される直交変換係数を、高周波領域において元の値よりも小さい値に修正するステップと、(j)前記修正された直交変換係数に対して逆直交変換を施すステップと、(k)前記ステップ(j)によって生成される画像のうち、前記参照領域画像の画像領域における画素値を前記参照領域画像の元の画素値に修正するステップと、(l)前記ステップ(h)、前記ステップ(i)及び前記ステップ(j)による一連の処理を、当該参照領域画像の画像領域における画素値の修正が所定の修正量以下となるまで所定回数以内で繰返すステップと、(m)当該繰り返しによって得られる最終的な処理ブロックの画像から、イントラ予測対象のブロック画像を抽出して予測画像を生成するステップと、を実行させるためのプログラムである。
本発明によれば、テクスチャの特徴解析として、隣接領域に対する相関を方位別に算出して高精度に評価することができるので、特に、イントラ予測の予測モードの予測に応用することで符号化効率をより向上させることができる。
本発明による一実施例のテクスチャ解析装置のブロック図である。 (a),(b)は、本発明による一実施例のテクスチャ解析装置における処理対象の入力画像を例示する図である。 (a),(b)は、本発明による一実施例のテクスチャ解析装置における空間スペクトル画像に対するラジアル走査の一例を示す図である。 (a),(b)は、本発明による一実施例のテクスチャ解析装置における空間スペクトル画像に対するラジアル走査の別例を示す図である。 本発明による一実施例のテクスチャ解析装置における空間周波数に関して離散化された空間スペクトル画像の標本点群のテーブル例を示す図である。 本発明による一実施例のテクスチャ解析装置の動作フロー図である。 本発明による一実施例のイントラ予測モード判定装置のブロック図である。 既存のイントラ予測における複数の予測モードの例を示す図である。 本発明による第1態様のイントラ予測装置の実施例を示す図である。 本発明による符号化側の第2態様のイントラ予測装置の実施例を示す図である。 本発明による復号側の第2態様のイントラ予測装置の実施例を示す図である。 本発明による第3態様のイントラ予測装置の構成を示すブロック図である。 本発明による第3態様のイントラ予測装置の処理を説明する図である。 (a),(c)は、本発明による第3態様のイントラ予測装置で行う処理の単位となる処理ブロックPを例示する図であり、(b),(d)は、本発明による第3態様のイントラ予測装置で行う処理の単位となる処理ブロックPの周波数領域を示す図である。 本発明による第3態様の符号化側イントラ予測装置を備える符号化器の構成を示すブロック図である。 本発明による第3態様の復号側イントラ予測装置を備える復号器の構成を示すブロック図である。
以下、図面を参照して、本発明による一実施例のテクスチャ解析装置、本発明による一実施例のイントラ予測モード判定装置、及び、本発明による3つの実施例のイントラ予測装置についてそれぞれ説明する。
〔テクスチャ解析装置〕
図1は、本発明による一実施例のテクスチャ解析装置のブロック図である。本実施例のテクスチャ解析装置1は、入力画像について解析してテクスチャ方位の情報を出力する装置であり、スペクトル演算部10と、走査制御部11と、集計部12と、最適化処理部13とを備える。尚、テクスチャ解析装置1として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、テクスチャ解析装置1の各機能を実現する処理内容を記述したプログラムを、当該コンピュータの記憶部(図示せず)に格納しておき、当該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることで実現することができる。
尚、入力画像Lは、正方形の画像であっても任意形状の画像であっても構わない。例えば、スペクトル演算部10は、入力画像L内にK個(Kは自然数)の正方形のブロックB(k)(k=0,1,・・・,K−1)を設定して、ブロックごとに処理を行うよう動作させてもよい。
例えば、図2(a),(b)は、本発明による一実施例のテクスチャ解析装置における処理対象の入力画像を例示する図である。図2(a)に示すように、入力画像Lが正方形の場合には、入力画像L全体を1個のブロックB(0)とみなして処理する。また、例えば、入力画像Lが非正方形の場合には、図2(b)に示すように、複数の正方形のブロックB(k)を入力画像Lの画像領域に空間的に覆い尽くすように設定するのが好適であるが、必ずしも入力画像Lの全体が複数のブロックB(k)によって完全に覆い尽くされる必要もない。
また、複数の正方形のブロックB(k)のブロック同士は、重なりがあっても重なりがなくても構わない。入力画像Lの画像領域形状を固定にした場合でも、この固定した画像領域形状内に完全には包含されないブロックが存在してもよく、例えば画像中の端部処理などで、入力画像Lの画像領域形状内に完全には包含されない画素又はブロックについては、入力画像Lの画像領域の外側に対応する画素をパディングによって適当な値を埋め込むものとする。例えば、テクスチャ解析装置1を、映像符号化のイントラ予測に利用する場合には、図2(b)に示すような逆L字型の復号済みの画像領域を入力画像Lとして利用することができる。
スペクトル演算部10は、入力画像Lのスペクトルを演算し、空間スペクトル画像Pを生成して集計部12に送出する。
走査制御部11は、空間スペクトル画像について予め定めた原点(例えば、(u,v)=(0,0)の点)からの方位ごとに所定の走査パターンで空間周波数を走査し、集計部12に対して走査する空間周波数の情報を送出するとともに、最適化処理部13に対して走査する空間周波数の情報に対応する方位の情報を送出する。尚、走査する空間周波数の情報及び対応する方位の情報は、予め対応付けたテーブルを保持しておくのが好適である。
集計部12は、空間スペクトル画像について、当該走査された空間周波数におけるスペクトルを集計し、集計結果を最適化処理部13に送出する。
最適化処理部13は、当該空間周波数ごとの集計結果の集計値のうちの最大値及び/又は最小値を判別し、当該最大値及び/又は当該最小値に該当する方位の情報をテクスチャ方位として決定する。ここで、集計値のうちの最大値をもつテクスチャ方位は、その方位に対して直交する方位に強い相関を持つことが推定され、集計値のうちの最小値をもつテクスチャ方位は、その方位に対して平行する方位に強い相関を持つことが推定されることから、集計値のうちの最大値か又は最小値のいずれか一方をテクスチャ方位の情報として決定することができるほか、集計値のうちの最大値から推定する方位と集計値のうちの最小値から推定する方位の双方を加味して強い相関を持つ方位をテクスチャ方位の情報として決定することができる。
図6は、本発明による一実施例のテクスチャ解析装置の動作フロー図である。テクスチャ解析装置1には、解析対象の画像ブロックB(k)が入力される(S1)。
スペクトル演算部10は、入力画像の各ブロックB(k)に対しスペクトルを演算し、空間周波数領域への写像を行う(S2)。この写像は、例えば、離散フーリエ変換、離散コサイン変換、離散サイン変換、アダマール変換、スラント変換などの線形変換によることが可能である。また、これらの線形変換を近似する変換(例えば、MPEG−4 AVC/H.264に用いられる整数変換など)を用いてもよい。
例えば、スペクトル演算部10は、離散フーリエ変換によって各ブロックB(k)のスペクトル画像S(k)を求める。ブロックB(k)の大きさをM×M画素(Mは自然数)とする。ブロックB(k)は行列表現とし、ブロック内の画像座標(i,j)における画素値(例えば、輝度値)を行列のj行i列成分B(k) j,iに対応づける。スペクトル画像S(k)の大きさもM×M画素とし、空間周波数(u,v)におけるスペクトル値を行列S(k)のv行u列成分S(k) v,uに対応づける。
このとき、式(1)のフーリエ変換行列を用いて、式(2)により、スペクトル画像S(k)を得ることができる。
Figure 0005514130
Figure 0005514130
なお、式(1)におけるjは虚数単位である。
さらに、スペクトル演算部10は、式(3)に示すように、スペクトル画像S(k)の複素共役とスペクトル画像S(k)とのアダマール積により出力すべき空間スペクトル画像Pを求める(S3)。
Figure 0005514130
ここに、上線は複素共役、白丸はアダマール積を表す。すなわち成分ごとに、式(4)に示す演算を行うことで空間スペクトル画像Pを生成することができる。
Figure 0005514130
尚、式(4)の演算は、ブロック数Kが1のときには、式(5)のように示すことができる。
Figure 0005514130
式(3)〜式(5)は、ブロックごとに求めたパワースペクトル画像を、全ブロックについて成分ごとに総和をとったものである。
走査制御部11は、スペクトル画像P上において方位θを変化させつつ、各方位θの場合について動径方向の走査(ラジアル走査)を行ない、最適化処理部13に対して、現在走査している方位θを出力するとともに、集計部12に対して、方位θの直線上にある空間周波数値(ベクトル)を順次出力して集計させる(S4,S5)。尚、方位θの直線上にある空間周波数値とは、方位θの直線上における所定間隔の標本点相当値を云うものであり、例えば、実直線上にない標本点の空間周波数値については、当該直線近傍の空間周波数値(つまり、空間周波数の量子化に起因する誤差を許容した直線近傍の空間周波数値)を用いればよい。
例えば、スペクトル演算部10は、M×M画素のブロックに対するフーリエ変換に基づいてパワースペクトルの空間スペクトル画像Pを得た場合、スペクトルは水平及び垂直の各空間周波数に関して、いずれも周期Mの周期波形となる。図3(a),(b)は、本発明による一実施例のテクスチャ解析装置における空間スペクトル画像に対するラジアル走査の一例を示す図であり、方位θの当該ラジアル走査の走査線R(θ)が示されている。
図3(a),(b)に示すように、走査制御部11は、原点を中心として180度をなす2方向の半直線又は線分上を走査するものとして構成することができる。他の例として、図4(a),(b)は、本発明による一実施例のテクスチャ解析装置における空間スペクトル画像に対するラジアル走査の別例を示す図であり、原点を中心として一方向の半直線又は線分上を走査するものとして構成することができる。
なお、空間周波数に関して離散化された空間スペクトル画像Pの標本点群の中から、各方位θについて、それぞれ走査すべき標本点を予めテーブル化しておき、走査制御部11がテーブル参照によって順次選択すべき標本点群を決定するよう構成してもよい。すなわち、例えば、図5に示す方位θ〜θ11の場合のように、各方位θについて空間スペクトル画像P中において走査すべき標本点(黒点部分)を予め定めておき、これら標本点群の空間周波数をテーブルに記憶しておく。そして、走査制御部11は、方位θを順次変化させつつ、各方位0に関するテーブル内のレコードを参照し、該レコードに記憶されている空間周波数値をさらに順次出力する。
このように、集計部12は、走査制御部11でラジアル走査されていく各空間周波数(u,v)∈R(θ)におけるスペクトル値P(u,v)を集計し、集計値T(θ)を出力する。集計の方法として、例えば、式(6)に示す総和演算によることができる。
Figure 0005514130
また、集計部12は、重み付き総和演算で集計するように構成することもでき、例えば、空間周波数(u,v)毎に予め定義された重みw(u,v)を用い、式(7)によって集計値T(θ)を求める。
Figure 0005514130
また、ブロックの大きさMを法とする剰余類において−vと合同な0以上M未満の整数をμ(v)としたときに、集計部12は、式(8)又は式(9)によって集計値T(θ)を求めるように構成することができる。
Figure 0005514130
Figure 0005514130
式(8)及び式(9)は、方位θにおけるスペクトル値の和と方位θ+π/2におけるスペクトル値の和の比に相当する。
最適化処理部13は、集計値T(θ)が最大及び/又は最小となる方位θを求め、この方位θに基づいて出力すべきテクスチャ方位φを算出する(S6)。
例えば、最適化処理部13は、式(10)によって集計値T(θ)が最大となる方位θを求め、方位θと直交する方位をテクスチャ方位φとして出力する。
Figure 0005514130
尚、テクスチャ方位φが0以上π未満となるよう、式(11)によりテクスチャ方位φを求めてもよい。
Figure 0005514130
また、例えば、最適化処理部13は、集計値T(θ)が最小となる方位θを求め、この方位θをテクスチャ方位φとして出力することができ、演算負担を軽減して直ちに出力することができる。さらに、集計値T(θ)が最小となる方位θと、集計値T(θ)が最大となる方位θのそれぞれから求めたテクスチャ方位φの平均(2乗平均を含む)として決定し、最終的なテクスチャ方位φとして出力するように構成することができ、より高確度のテクスチャ方位φを決定することができる。
Figure 0005514130
さらに、例えば、最適化処理部13は、集計値T(θ)の最大値が所定の閾値に満たない
場合、及び/又は、集計値T(θ)の最小値が所定の閾値を超える場合に、テクスチャ方位φとして、「該当なし」の旨を表す値を出力するように構成するのが好適である。
このように、本実施例のテクスチャ解析装置1によれば、走査制御部11によって入力画像の各方位に沿った空間周波数を走査することで、集計部12によって入力画像の空間周波数の繰り返し波形の存在の度合を求めて集計して、最適化処理部13によって繰り返し波形の存在の度合の最も強いまたは最も弱い方位を探索して評価するため、高精度のテクスチャ方位の情報を得ることができるようになる。
次に、本発明による一実施例のイントラ予測モード判定装置について説明する。
〔イントラ予測モード判定装置〕
図7は、本発明による一実施例のイントラ予測モード判定装置のブロック図である。 図8に、既存のイントラ予測における複数の予測モードの例を示す。A〜Mの画素部分が参照領域であり、白の部分が予測領域である。本実施例のイントラ予測モード判定装置2は、上述した本実施例のテクスチャ解析装置1を具備している。
イントラ予測とは、画像符号化や映像符号化において、すでに復号可能な部分画像の情報から、これから符号化すべき部分画像の信号を予測する技術である。予測の元となる領域を参照領域、参照領域の画像を参照領域画像、予測すべき領域を予測領域、予測領域における予測された画像を予測画像、予測領域における元の画像を実画像として、それぞれ説明する。
本実施例のイントラ予測モード判定装置2は、複数のイントラ予測の予測モードの中から、最適なイントラ予測モードを推定し、推定予測モードの識別子を出力する装置である。
イントラ予測の予測モードの識別子をzとする。予測モードz=2以外に記した矢印は、予測の方向性(方位)を表す。例えば、予測モードz=0では、上隣の画素値を垂直下奉公に外挿補間する。例えば、参照領域内のAの画素の値を、そのまま下側に延長するように外挿を行う。また、予測モードz=1は、右方向への外挿補間である。予測方法z=2は、画素A,B,C,D,I,J,K及びLの平均値で予測ブロックを埋める。予測モードz=3〜8は、矢印に示す方位の斜め方向の予測である。具体的な演算方法の例については、MPEG−4 AVC/H.264方式(ISO/IEC14496−10/ITU−T Rec.H.264)を参照されたい。
イントラ予測モード判定装置2は、前述したテクスチャ解析装置1と、判定部21と、予測モード記憶部22とを備える。予測モード記憶部22は、イントラ予測対象のブロック画像に対して図8に示すような複数の予測モードの情報を保持している。尚、イントラ予測モード判定装置2として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、イントラ予測モード判定装置2の各機能を実現する処理内容を記述したプログラムを、当該コンピュータの記憶部(図示せず)に格納しておき、当該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることで実現することができる。
判定部21は、テクスチャ解析装置1から出力されるテクスチャ方位の情報に基づき、予め定めた規則によってテクスチャ方位の情報を予測モード記憶部22に保持される予め定めた所定数の予測モードの方位のうちのいずれか1つに割り当て、割り当てた予測モードの方位に関する推定予測モードの識別子を生成して出力する。
例えば、判定部21は、テクスチャ解析装置1から出力されたテクスチャ方位φを近似する方向性の外挿又は内挿を行う予測モードの識別子zを、予測モード記憶部22に保持される予め定めた所定数の予測モードの中から選択して出力する。
例えば、判定部21による予め定めた規則による選択例を説明するに、テクスチャ方位φ(φは0以上π未満の数値又は「該当なし」の旨を表す数値により表現されているものとする)に応じて以下の規則により推定予測モードzを決定することができる。
・テクスチャ方位φがπ/16未満又は15π/16以上の場合、z=1
・テクスチャ方位φがπ/16以上3π/16未満の場合、z=6
・テクスチャ方位φが3π/16以上5π/16未満の場合、z=4
・テクスチャ方位φが5π/16以上7π/16未満の場合、z=5
・テクスチャ方位φが7π/16以上9π/16未満の場合、z=0
・テクスチャ方位φが9π/16以上11π/16未満の場合、z=7
・テクスチャ方位φが11π/16以上13π/16未満の場合、z=3
・テクスチャ方位φが13π/16以上15π/16未満の場合、z=8
・テクスチャ方位φが「該当なし」の旨を示す場合、z=2
このように、本実施例のイントラ予測モード判定装置によれば、特定の方向に沿った予測を行う複数の予測モードの中から、適した方位の予測モードをテクスチャ解析装置1からのテクスチャ方位の情報に応じて決定することができ、イントラ予測の予測精度を向上させることができるようになる。
次に、本発明に係るイントラ予測装置について説明する。前述したイントラ予測モード判定装置2の利点を生かした3つの態様のイントラ予測装置について順に説明する。尚、イントラ予測装置として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、イントラ予測装置の各機能を実現する処理内容を記述したプログラムを、当該コンピュータの記憶部(図示せず)に格納しておき、当該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることで実現することができる。また、同様な構成要素には同一の参照番号を付して説明する。
〔第1態様のイントラ予測装置〕
図9は、本発明による第1態様のイントラ予測装置の実施例を示す図である。第1態様のイントラ予測装置3は、イントラ予測モード判定装置2と、予測部31とを備える。
予測部31は、参照領域画像及び推定予測モードの識別子に基づいて、図7を参照して説明したように予測領域の画素値を予測し、予測画像を生成する。
尚、第1態様のイントラ予測装置3は、符号化側及び復号側の装置の双方に適用することができるし、MPEG−4 AVC/H.264方式と同様に、推定予測モードの識別子を符号化側から復号側の装置に伝送するように構成することができる。
つまり、第1態様のイントラ予測装置3によれば、イントラ予測対象のブロック画像の周囲の参照領域画像における参照領域のテクスチャ方位に沿って予測する方向を決定するため、当該周囲の参照領域の波形をテクスチャ解析装置1からのテクスチャ方位の情報に基づいて延長するようイントラ予測を行うことになり、この結果、参照領域画像からイントラ予測対象のブロック画像に貫入するような画素値パターンを精度よく近似することができるようになる。
次に、本発明による第2態様のイントラ予測装置の実施例について説明する。
〔第2態様のイントラ予測装置〕
図10及び図11は、本発明による第2態様のイントラ予測装置の実施例を示す図である。図10は符号化側で用いるイントラ予測装置であり、図11は復号側で用いるイントラ予測装置である。
図10を参照するに、第2態様の符号化側イントラ予測装置4は、前述したイントラ予測モード判定装置2と、前述した予測部31と、予測モード識別子発生部41と、RD最適化処理部42と、予測モード記述子疎表現化部43とを備える。
予測モード識別子発生部41は、図8で例示した予測モードの識別子z=0〜8を予測部31及びRD最適化処理部42に順次出力する。
予測部31は、予測モード識別子発生部41から出力された予測モードの識別子に応じて参照領域画像から予測領域の予測画像を生成し、各予測モードの識別子に対応する予測画像をRD最適化処理部42に送出する。
RD最適化処理部42は、予測領域の実画像と各予測モードによる予測画像とを比較し、RD(Rate-Distortion)規範(ビットレートと画質劣化に基づく予め定めた尺度)が最適なものとなる予測モードを特定し、特定した予測モードの識別子を最適予測モードの識別子として予測モード記述子疎表現化部43に出力する。尚、RD最適化処理部42は、最適予測モードの識別子に対応する予測領域の予測画像を出力する。
一方、イントラ予測モード判定装置2は、前述したように、参照領域画像から最適と推定される予測モードの識別子を推定予測モードの識別子として予測モード記述子疎表現化部43に出力する。尚、最適予測モードの識別子を推定予測モードの識別子と同一の記述形態であり、例えば、z=0〜8の識別子であれば、最適予測モードの識別子を推定予測モードの識別子の双方は方位ごとに3bitで表すことができる。
予測モード記述子疎表現化部43は、最適予測モードの識別子と、推定予測モードの識別子を用いて当該記述形態を疎表現化した、予測モードの疎表現化記述子を生成して出力する。これにより、最適予測モードの識別子の記述形態を推定予測モードの識別子の記述形態で変化させ、エントロピーの小さい記述子を生成することができる。
例えば、予測モード記述子疎表現化部43は、最適予測モードの識別子と、推定予測モードの識別子との数値としての差分を演算し、その結果を予測モードの疎表現化記述子として出力する。
図11を参照するに、第2態様の復号側イントラ予測装置4bは、前述したイントラ予測モード判定装置2と、前述した予測部31と、最適予測モード識別子生成部42bとを備える。
最適予測モード識別子生成部42bは、予測モード記述子疎表現化部43から予測モードの疎表現化記述子をうけとり、イントラ予測モード判定装置2からの推定予測モードの識別子を用いて、最適予測モードの識別子を復元し、予測部31に送出する。
図11に示す予測部31は、最適予測モード識別子生成部42bからの最適予測モードの識別子に応じて参照領域画像から予測領域の予測画像を生成する。
第2態様のイントラ予測装置4,4bによれば、予め用意した複数の予測モードの中からレート歪み特性の観点で最適な予測モードを決定する一方で、本発明に係るイントラ予測モード判定装置により決定される予測モードを求め、最適予測モードの識別子の記述形態を推定予測モードの識別子の記述形態で変化させることができ、換言すれば、単に最適予測モードの識別子を伝送するよりも記述形態を疎表現化した態様で予測モードの情報を伝送することが可能となる。特に、最適予測モードの識別子と推定予測モードの識別子との間に非零の相関がある状況においては、符号化側及び復号側の双方でイントラ予測モード判定装置を具備することにより、符号化側と復号側との間の当該識別子の伝送が圧縮可能となり、実質的な伝送符号量を削減することができるようになる。
次に、本発明による第3態様のイントラ予測装置の実施例について説明する。
〔第3態様のイントラ予測装置〕
図12は、本発明による第3態様のイントラ予測装置の構成を示すブロック図である。第3態様のイントラ予測装置5は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定してそれにより予測画像の初期値を生成し、これに対して繰り返し処理を適用して最終的な予測画像を生成する装置であり、イントラ予測モード判定装置2と、制御パラメータ設定部51と、予測画像初期値設定部52と、処理ブロック生成部53と、直交変換部54と、係数修正部55と、逆直交変換部56と、分岐部57と、画像修正部58と、予測画像抽出部59とを備える。
イントラ予測モード判定装置2は、前述と同様に、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する。
制御パラメータ設定部51は、イントラ予測モード判定装置2から推定予測モードの識別子の情報を取得し、予測画像初期値設定部52に送出するとともに、後述するように、分岐部57に対する繰返し処理の回数の設定、処理ブロック生成部53に対する参照領域画像の可変の画像領域の設定、係数修正部55に対する高周波領域における修正量の設定、及び、逆直交変換部56における修正された直交変換係数に対する基底の設定等の制御パラメータの設定を行う。尚、符号化側で第3態様のイントラ予測装置を用いる場合、これらの制御パラメータを復号側に出力することができる。一方、復号側で第3態様のイントラ予測装置を用いる場合、これらの制御パラメータを受信して第3態様のイントラ予測装置の設定に用いることができる。
予測画像初期値設定部52は、推定予測モードの識別子によって指示される予測モードによって前記参照領域画像からイントラ予測対象のブロック画像を予測し、予測画像の初期値として設定する。
処理ブロック生成部53は、参照領域画像と、当該初期値が設定されたイントラ予測対象のブロック画像からなる処理ブロックを生成する。
直交変換部54は、処理ブロックの画像に対して直交変換を施す。
係数修正部55は、直交変換部54によって生成される直交変換係数を、高周波領域において元の値よりも小さい値に修正する。
逆直交変換部56は、修正された直交変換係数に対して逆直交変換を施す。
画像修正部58は、逆直交変換部56によって生成される画像のうち、参照領域画像の画像領域における画素値を参照領域画像の元の画素値に修正する。
分岐部57は、直交変換部54、係数修正部55及び逆直交変換部56による一連の処理を、当該参照領域画像の画像領域における画素値の修正が所定の修正量以下となるまで所定回数以内で繰返す。例えば、分岐部57は、直交変換部54、係数修正部55及び逆直交変換部56による一連の処理の繰り返しを終了する所定の条件(つまり、繰り返し処理を行う際の現在の画素値と繰り返し処理を行う前の元の復号済みの画像の画素値との差分値が所定の閾値以下であるという条件)を満たすか否かを判定し、該所定の条件を満たしていないと判定した場合には、該一連の処理を繰り返し実行させるために逆直交変換部54によって生成された画像を画像修正部58に供給し、該所定の条件を満たしていると判定した場合には、該一連の処理の繰り返しを終了して逆直交変換部56によって生成された画像を予測画像抽出部59に供給する。
予測画像抽出部59は、当該繰り返しによって得られる最終的な処理ブロックの画像から、イントラ予測対象のブロック画像を抽出して予測画像を生成する。
第3態様のイントラ予測装置5は、上記の繰り返し処理を行うことで、より一層、交流成分の不連続性を低減することができる。
図13は、本発明による第3態様のイントラ予測装置5の処理を説明する図である。また、図14(a)及び図14(c)は、イントラ予測装置5で行う処理の単位となる処理ブロックPを例示する図である。図14(b)及び図14(d)は、処理ブロックPの周波数領域を示す図であり、左上の領域は低周波成分を示し、右下の領域は高周波成分を示す。画像ブロックXは、イントラ予測の対象となる画像ブロック(以下、「予測ブロック」という)である。画像ブロックD,B,Aは、符号化された後に復号された画像ブロックであり、予測ブロックの画素値を予測するために参照領域画像(以下、「参照ブロック」という)である。また、以下の説明において、参照ブロックD,B,A内の画像をそれぞれ参照領域画像d,b,aといい、予測ブロックX内の画像を予測画像xという。
各ブロックのサイズは予め設定されており、図14(a)に示すように、参照ブロックDはk画素×mライン、参照ブロックBはl画素×mライン、参照ブロックAはk画素×nライン、予測ブロックXはl画素×nライン、処理ブロックPは(k+l)画素×(m+n)ラインである。
まず、第3態様のイントラ予測装置5は、予測画像初期値設定部52によって、推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測し、予測画像の初期値として設定する(S101)。
次に、処理ブロック生成部53によって、図14(a)に示すように、参照ブロックD,B,Aと初期値が設定された予測ブロックXからなる処理ブロックPを生成する(S102)。
次に、直交変換部54によって、処理ブロックの画像に対して直交変換を施す(S103)。
次に、係数修正部55によって生成される直交変換係数を、高周波領域において元の値よりも小さい値に修正する(S104)。次に、逆直交変換部56によって、修正された直交変換係数に対して逆直交変換を施す(S105)。
尚、係数修正部55は、参照ブロックD,B,Aと予測ブロックXの境界領域において、参照領域画像d,b,aと予測画像xとの間に交流的な連続性をもたせる(不連続性を低減する)ために、処理ブロックPの高周波成分を抑圧するため、直交変換部54から入力される直交変換係数のうち、図14(b)に示すように、高周波領域である係数修正領域Hの直交変換係数の絶対値を元の値よりも小さい値に修正する。係数修正領域H内の係数の数hは、1≦h<(k+l)×(m+n)である。そして、修正した直交変換係数は逆直交変換部56に出力される。修正する値は、0とするのが高周波成分を除去するのに好適である。また、直交変換が修正される係数修正領域Hは、図14(d)に示すように、正方形状又は長方形状としてもよい。
また、係数修正部14は、後述する繰り返し処理によりN回目の処理を行う場合には、最高次の直交変換係数から順にh個の直交変換係数の絶対値を元の値よりも小さい値に修正する(S106)。ここで、係数修正領域Hを所定の値に修正するという制約条件を徐々に緩和させるために、処理を繰り返すごとに、繰り返し後の係数修正領域Hの面積を繰り返し前の面積以下とし、h≧h≧…≧hとするのが好適である。
次に、画像修正部58によって、逆直交変換部56によって生成される画像のうち、参照領域画像の画像領域における画素値を参照領域画像の元の画素値に修正する(S107)。
分岐部57によって、直交変換部54、係数修正部55及び逆直交変換部56による一連の処理を、当該参照領域画像の画像領域における画素値の修正が所定の修正量以下となるまで所定回数以内で繰返されると、予測画像抽出部59は、当該繰り返しによって得られる最終的な処理ブロックの画像から、イントラ予測対象のブロック画像を抽出して予測画像を生成する(S108)。
尚、分岐部57は、上記の直交変換、直交変換係数の修正、逆直交変換という一連の処理を繰り返すか否かを判定する。例えば、繰り返し回数が所定の回数以下の場合には、繰り返し処理を実行させるために、逆直交変換部56から入力される画像を画像修正部57に出力し、繰り返し回数が所定の回数を超えた場合には、繰り返し処理を終了して逆直交変換部56から入力される画像を予測画像抽出部59に出力する。
また、分岐部57における別の判定方法として、参照ブロックD,B,A内の領域について、現在の画素値と繰り返し処理を行う前の元の復号済みの画像の画素値との差分値を算出し、この差分値が閾値以上の場合には繰り返し処理を実行させるために、逆直交変換部56から入力される画像を画像修正部58に出力し、閾値より小さい場合には繰り返し処理を終了して逆直交変換部56から入力される画像を予測画像抽出部59に出力するようにしてもよい。差分値を算出する対象となる参照ブロックD,B,A内の領域は、以下に説明する、画像修正部58で修正する画像修正領域Gとするのが好適である。また、この判定方法による場合でも、繰り返し回数を制限するために、繰り返しの上限回数を設けるのが好適である。
すなわち、画像修正部58は、境界領域において、元の参照領域画像d,b,aと予測画像xとの間に交流的な連続性をもたせるために、分岐部57から入力される画像を修正する。高次の直交変換係数の絶対値を元の値よりも小さい値に修正して逆直交変換を行うことにより、参照ブロックD,B,Aと予測ブロックXとの境界領域における画素値の不連続性が緩和されるが、参照ブロックD,B,Aの画素値は元の値から変化している。そのため、例えば、図14(c)に示すように、参照ブロックD,B,A内のうち、予測ブロックXに隣接する画像修正領域Gの画素値を、参照ブロックD,B,Aの元の画素値に修正する。画像修正領域G内の画素数gは、1≦g≦k×m+l×m+k×nである。そして、画素値を修正した後の処理ブロックPを直交変換部54に出力する。
画像修正部58は、繰り返し処理によりN回目の処理を行う場合には、参照ブロックD,B,Aのうち、g個の画素からなる画像修正領域Gを元の画素値に修正する。ここで、参照領域画像d,b,aが演算により変化した場合には元の値に修正するという制約条件を徐々に緩和させるために、処理を繰り返すごとに、繰り返し後の画像修正領域Gの面積を繰り返し前の面積以下とし、g≧g≧…≧gとするのが好適である。
次に、本発明による第1態様〜第3態様のイントラ予測装置は、符号化器及び復号器に適用することができ、代表的に、本発明による第3態様のイントラ予測装置5を備える符号化器について説明する。
[符号化器]
図15は、本発明による第3態様の符号化側イントラ予測装置5を備える符号化器6の構成を示すブロック図である。本発明に係る符号化器6は、本発明による第3態様のイントラ予測装置5と、減算部61と、直交変換部62と、量子化部63と、エントロピー符号化部64と、逆量子化部65と、逆直交変換部66と、動き補償予測とイントラ予測の切り替えを行う切替えスイッチ67と、加算部68と、メモリ69と、動き補償予測部70とを備える。
動き補償予測部70は、動き補償予測の場合に、入力画像に対して、メモリ69から取得する参照画像を用いて動きベクトル検出を行い、得られた動きベクトルを用いて動き補償を行い、その結果得られた予測画像を、切替えスイッチ67を介して減算部61及び加算部68に出力する。また、動き補償予測部70は、動き情報(動きベクトル等)をエントロピー符号化部64に出力する。
減算部61は、入力画像と、動き補償予測部70又はイントラ予測装置5からの予測画像との差分画像を生成して直交変換部62に出力する。
直交変換部62は、減算部61から供給される差分画像に対して小領域の画素ブロックごとに直交変換(例えば、DCT;Discrete Cosine Transform)を施し、直交変換係数を量子化部63に出力する。
量子化部63は、直交変換部62から入力される直交変換係数に対して量子化テーブルを選択して量子化処理を行い、エントロピー符号化部64及び逆量子化部65に出力する。
エントロピー符号化部64は、量子化部63から入力される量子化された直交変換係数についてスキャンを行って可変長符号化処理を施しビットストリームを生成するとともに、動き補償予測部70から入力される動き情報もエントロピー符号化を施して外部に出力する。
つまり、本発明に係る符号器2は、従来のMPEG4 AVC/H.264方式の符号器と比較して、従来のMPEG4 AVC/H.264方式の符号器におけるイントラ予測部に代えて本発明による第3態様のイントラ予測装置5を備える点で相違するが、動作は従来のMPEG4 AVC/H.264方式の符号器と同様である。
第3態様のイントラ予測装置5は、逆量子化部65、逆直交変換部66及び加算部68を経てメモリ69に格納された参照領域画像を入力して予測画像を生成し、切替えスイッチ67を介して減算部61及び加算部68に出力する。制御パラメータは、エントロピー符号化部64にて符号化される。
[復号器]
図16は、本発明による第3態様の復号側イントラ予測装置5を備える復号器7の構成を示すブロック図である。復号器7は、第3態様の復号側イントラ予測装置5と、エントロピー復号部71と、逆量子化部72と、逆直交変換部73と、加算部74と、メモリ75と、動き補償予測部76と、切替えスイッチ77と、画像信号再構成部78とを備える。復号器7は、従来のMPEG4 AVC/H.264方式の復号器と比較して、従来のMPEG4 AVC/H.264方式の復号器のイントラ予測部に代えて、本発明による第3態様の復号側イントラ予測装置5を備える点で相違する。
エントロピー復号部71は、フレーム間予測で符号化されたビットストリームを入力して、エントロピー復号処理を施し逆量子化部72に出力するとともに、動き情報を復号して動き補償予測部76に出力する。動き補償予測部76は、動き補償予測の場合の予測画像を生成し、復号側イントラ予測装置5は、イントラ予測の場合の予測画像を生成する。さらに、符号化器側から制御パラメータが伝送された場合には、制御パラメータを復号して復号側イントラ予測装置5に出力する。
逆量子化部72は、エントロピー復号部71から入力される量子化された直交変換係数に対して逆量子化処理を施して逆直交変換部73に出力する。
逆直交変換部73は、逆量子化部72から入力される差分画像の直交変換係数に対して、逆直交変換(例えば、IDCT)を施し、得られる当該差分画像を加算部74に出力する。
加算部74は、逆直交変換部73から得られる当該差分画像と、動き補償予測部56から入力される予測画像又は本発明による第3態様の復号側イントラ予測装置5から入力される予測画像とを加算して画像信号再構成部78に送出する。
画像信号再構成部78は、加算部74から得られるコンポーネント信号から画像を復元する。
このように、本発明に係る第3態様のイントラ予測装置5は、本発明に係る第1及び第2態様のイントラ予測装置も同様に、MPEG4 AVC/H.264方式の符号化器及び復号器に大きな変更無く適用することが可能である。
本発明によれば、テクスチャの特徴解析として、隣接領域に対する相関を方位別に算出して高精度に評価することができるので、特に、イントラ予測の用途に有用である。
1 テクスチャ解析装置
2 イントラ予測モード判定装置
3 イントラ予測装置
4 イントラ予測装置
5 イントラ予測装置
10 スペクトル演算部
11 走査制御部
12 集計部
13 最適化処理部
21 判定部
22 予測モード記憶部
31 予測部
41 予測モード識別子発生部
42 RD最適化処理部
43 予測モード記述子疎表現化部
4b イントラ予測装置
42b 最適予測モード識別子生成部
51 制御パラメータ設定部
52 予測画像初期値設定部
53 処理ブロック生成部
54 直交変換部
55 係数修正部
56 逆直交変換部
57 分岐部
58 画像修正部
59 予測画像抽出部

Claims (10)

  1. 入力画像のスペクトルを演算し、空間スペクトル画像を生成するスペクトル演算部と、
    前記空間スペクトル画像について方位ごとに所定の走査パターンで空間周波数を走査する走査制御部と、
    当該走査された空間周波数におけるスペクトルを集計する集計部と、
    当該集計した結果の集計値のうちの最大値及び/又は最小値を判別し、前記最大値及び/又は前記最小値に該当する当該方位の情報をテクスチャ方位として決定する最適化処理部と、
    を備えることを特徴とするテクスチャ解析装置。
  2. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測モード判定装置であって、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像としてテクスチャ方位の情報を出力する請求項1に記載のテクスチャ解析装置と、
    前記テクスチャ解析装置によって決定されるテクスチャ方位の情報を予め定めた所定数の予測モードの方位のうちのいずれか1つに割り当て、割り当てた予測モードの方位に関する推定予測モードの識別子を生成する判定部と、
    を備えることを特徴とするイントラ予測モード判定装置。
  3. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置であって、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する請求項2に記載のイントラ予測モード判定装置と、
    前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測する予測部と、
    を備えることを特徴とするイントラ予測装置。
  4. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置であって、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する請求項2に記載のイントラ予測モード判定装置と、
    予め定めたレート歪み特性に基づいて前記複数の予測モードの中から1つの予測モードを最適予測モードとして決定して当該予測画像を生成するとともに、当該最適予測モードの識別子を前記推定予測モードの識別子と同一の記述形態で生成するRD最適化処理部と、
    前記推定予測モードの識別子と前記最適予測モードの識別子を用いて当該記述形態を疎表現化した、予測モードの疎表現化記述子を生成する予測モード記述子疎表現化部と、
    を備えることを特徴とするイントラ予測装置。
  5. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置であって、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する請求項2に記載のイントラ予測モード判定装置と、
    前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測し、予測画像の初期値として設定する予測画像初期値設定部と、
    前記参照領域画像と、当該初期値が設定されたイントラ予測対象のブロック画像からなる処理ブロックを生成する処理ブロック生成部と、
    前記処理ブロックの画像に対して直交変換を施す直交変換部と、
    前記直交変換部によって生成される直交変換係数を、高周波領域において元の値よりも小さい値に修正する係数修正部と、
    前記修正された直交変換係数に対して逆直交変換を施す逆直交変換部と、
    前記逆直交変換部によって生成される画像のうち、前記参照領域画像の画像領域における画素値を前記参照領域画像の元の画素値に修正する画像修正部と、
    前記直交変換部、前記係数修正部及び前記逆直交変換部による一連の処理を、当該参照領域画像の画像領域における画素値の修正が所定の修正量以下となるまで所定回数以内で繰返す分岐部と、
    当該繰り返しによって得られる最終的な処理ブロックの画像から、イントラ予測対象のブロック画像を抽出して予測画像を生成する予測画像抽出部と、
    を備えることを特徴とするイントラ予測装置。
  6. コンピュータに、
    入力画像のスペクトルを演算し、空間スペクトル画像を生成するステップと、
    前記空間スペクトル画像について方位ごとに所定の走査パターンで空間周波数を走査するステップと、
    当該走査された空間周波数におけるスペクトルを集計するステップと、
    当該集計した結果の集計値のうちの最大値及び/又は最小値を判別し、前記最大値及び/又は前記最小値に該当する当該方位の情報をテクスチャ方位として決定するステップと、
    を実行させるためのプログラム。
  7. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測モード判定装置として構成するコンピュータに、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像として、当該入力画像のスペクトルを演算し、空間スペクトル画像を生成するステップと、
    前記空間スペクトル画像について方位ごとに所定の走査パターンで空間周波数を走査するステップと、
    当該走査された空間周波数におけるスペクトルを集計するステップと、
    当該集計した結果の集計値のうちの最大値及び/又は最小値を判別し、前記最大値及び/又は前記最小値に該当する当該方位の情報をテクスチャ方位として決定するステップと、
    当該決定されるテクスチャ方位の情報を予め定めた所定数の予測モードの方位のうちのいずれか1つに割り当て、割り当てた予測モードの方位に関する推定予測モードの識別子を生成するステップと、
    を実行させるためのプログラム。
  8. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測装置として構成するコンピュータに、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像として、当該入力画像のスペクトルを演算し、空間スペクトル画像を生成するステップと、
    前記空間スペクトル画像について方位ごとに所定の走査パターンで空間周波数を走査するステップと、
    当該走査された空間周波数におけるスペクトルを集計するステップと、
    当該集計した結果の集計値のうちの最大値及び/又は最小値を判別し、前記最大値及び/又は前記最小値に該当する当該方位の情報をテクスチャ方位として決定するステップと、
    当該決定されるテクスチャ方位の情報を予め定めた所定数の予測モードの方位のうちのいずれか1つに割り当て、割り当てた予測モードの方位に関する推定予測モードの識別子を生成するステップと、
    前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測するステップと、
    を実行させるためのプログラム。
  9. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測装置として構成するコンピュータに、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像として、当該入力画像のスペクトルを演算し、空間スペクトル画像を生成するステップと、
    前記空間スペクトル画像について方位ごとに所定の走査パターンで空間周波数を走査するステップと、
    当該走査された空間周波数におけるスペクトルを集計するステップと、
    当該集計した結果の集計値のうちの最大値及び/又は最小値を判別し、前記最大値及び/又は前記最小値に該当する当該方位の情報をテクスチャ方位として決定するステップと、
    当該決定されるテクスチャ方位の情報を予め定めた所定数の予測モードの方位のうちのいずれか1つに割り当て、割り当てた予測モードの方位に関する推定予測モードの識別子を生成するステップと、
    予め定めたレート歪み特性に基づいて前記複数の予測モードの中から1つの予測モードを最適予測モードとして決定して当該予測画像を生成するとともに、当該最適予測モードの識別子を前記推定予測モードの識別子と同一の記述形態で生成するステップと、
    前記推定予測モードの識別子と前記最適予測モードの識別子を用いて当該記述形態を疎表現化した、予測モードの疎表現化記述子を生成するステップと、
    を実行させるためのプログラム。
  10. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測装置として構成するコンピュータに、
    (a)イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像として、当該入力画像のスペクトルを演算し、空間スペクトル画像を生成するステップと、
    (b)前記空間スペクトル画像について方位ごとに所定の走査パターンで空間周波数を走査するステップと、
    (c)当該走査された空間周波数におけるスペクトルを集計するステップと、
    (d)当該集計した結果の集計値のうちの最大値及び/又は最小値を判別し、前記最大値及び/又は前記最小値に該当する当該方位の情報をテクスチャ方位として決定するステップと、
    (e)当該決定されるテクスチャ方位の情報を予め定めた所定数の予測モードの方位のうちのいずれか1つに割り当て、割り当てた予測モードの方位に関する推定予測モードの識別子を生成するステップと、
    (f)前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測し、予測画像の初期値として設定するステップと、
    (g)前記参照領域画像と、当該初期値が設定されたイントラ予測対象のブロック画像からなる処理ブロックを生成するステップと、
    (h)前記処理ブロックの画像に対して直交変換を施すステップと、
    (i)前記ステップ(h)によって生成される直交変換係数を、高周波領域において元の値よりも小さい値に修正するステップと、
    (j)前記修正された直交変換係数に対して逆直交変換を施すステップと、
    (k)前記ステップ(j)によって生成される画像のうち、前記参照領域画像の画像領域における画素値を前記参照領域画像の元の画素値に修正するステップと、
    (l)前記ステップ(h)、前記ステップ(i)及び前記ステップ(j)による一連の処理を、当該参照領域画像の画像領域における画素値の修正が所定の修正量以下となるまで所定回数以内で繰返すステップと、
    (m)当該繰り返しによって得られる最終的な処理ブロックの画像から、イントラ予測対象のブロック画像を抽出して予測画像を生成するステップと、
    を実行させるためのプログラム。
JP2011010020A 2011-01-20 2011-01-20 テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム Active JP5514130B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011010020A JP5514130B2 (ja) 2011-01-20 2011-01-20 テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011010020A JP5514130B2 (ja) 2011-01-20 2011-01-20 テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム

Publications (2)

Publication Number Publication Date
JP2012151755A JP2012151755A (ja) 2012-08-09
JP5514130B2 true JP5514130B2 (ja) 2014-06-04

Family

ID=46793575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011010020A Active JP5514130B2 (ja) 2011-01-20 2011-01-20 テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム

Country Status (1)

Country Link
JP (1) JP5514130B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2516425B (en) * 2013-07-17 2015-12-30 Gurulogic Microsystems Oy Encoder and decoder, and method of operation

Also Published As

Publication number Publication date
JP2012151755A (ja) 2012-08-09

Similar Documents

Publication Publication Date Title
RU2530318C2 (ru) Способ выполнения локализованного многогипотезного прогнозирования во время видеокодирования элемента кодирования и соответствующее устройство
KR101351714B1 (ko) 비트 스트림 복호 방법
CN101409840B (zh) 图像编码装置及方法,和图像解码装置及方法
US11277615B2 (en) Intra-prediction method for reducing intra-prediction errors and device for same
JP5490404B2 (ja) 画像復号装置
EP2579598A2 (en) Method for encoding/decoding high-resolution image and device for performing same
US20130089265A1 (en) Method for encoding/decoding high-resolution image and device for performing same
Egilmez et al. Graph-based transforms for inter predicted video coding
WO2011064990A1 (ja) 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法
KR20110114524A (ko) 화상 예측 부호화 장치, 방법 및 프로그램, 화상 예측 복호 장치, 방법 및 프로그램, 및 부호화·복호 시스템 및 방법
JP2009060153A (ja) 面内予測モード決定方法及び装置及びプログラム
JP2019106742A (ja) 画像符号化装置、画像復号化装置、及びこれらのプログラム
KR20110091000A (ko) 화상 부호화 장치 및 화상 복호 장치
KR101663235B1 (ko) 화면 내 예측 부호화/복호화 방법 및 장치
JP5514130B2 (ja) テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム
JP2010041191A (ja) 画像符号化方法及び画像符号化装置
WO2020047430A1 (en) Coefficient context modeling in video coding
JP5328629B2 (ja) エンコーダおよび画像変換装置
JP2010278519A (ja) 動きベクトル検出装置
JP2013121044A (ja) 画像符号化装置及び画像符号化方法
JP5509106B2 (ja) テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム
JP5222878B2 (ja) イントラ予測装置、符号化器、復号器及びプログラム
JP2020028067A (ja) 画像符号化装置、画像復号装置、及びプログラム
WO2012118358A2 (ko) 변환 계수 스캔 방법 및 그 장치
JP2013017128A (ja) イントラ予測モード推定装置、画像符号化装置、画像復号装置、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130625

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140328

R150 Certificate of patent or registration of utility model

Ref document number: 5514130

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250