JP5509106B2 - テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム - Google Patents

テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム Download PDF

Info

Publication number
JP5509106B2
JP5509106B2 JP2011001463A JP2011001463A JP5509106B2 JP 5509106 B2 JP5509106 B2 JP 5509106B2 JP 2011001463 A JP2011001463 A JP 2011001463A JP 2011001463 A JP2011001463 A JP 2011001463A JP 5509106 B2 JP5509106 B2 JP 5509106B2
Authority
JP
Japan
Prior art keywords
image
prediction mode
prediction
correlation
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011001463A
Other languages
English (en)
Other versions
JP2012147053A (ja
Inventor
善明 鹿喰
和久 井口
俊枝 三須
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2011001463A priority Critical patent/JP5509106B2/ja
Publication of JP2012147053A publication Critical patent/JP2012147053A/ja
Application granted granted Critical
Publication of JP5509106B2 publication Critical patent/JP5509106B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、入力画像の方向別の相関を解析するテクスチャ解析装置、このテクスチャ解析装置によって解析した結果をイントラ予測やパターン認識へ応用したイントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラムに関する。
従来、画像のテクスチャを解析する技法として、画像のフラクタル特徴に基づく技法(例えば、特許文献1参照)や、エッジ検出に基づく技法が提案されている(例えば、特許文献2参照)。
テクスチャ解析の目的としては、該解析結果に基づくパターン認識によりコンクリート等の欠陥を検出する技法(例えば、特許文献2参照)や、画像符号化に応用する技法が挙げられる(例えば、特許文献3参照)。
イントラ予測の技法としては、MPEG−4 AVC/H.264方式等において規格化されている。また、予測対象ブロックの画素値を、該予測対象ブロックに隣接する画素群の画素値に基づいて予測する技法がある(例えば、特許文献4参照)。また、予測対象ブロックの画素値を、その隣接画素群から特定方向について予測する技法がある(例えば、特許文献5参照)。さらに、予測対象ブロックの隣接画素と、予測対象ブロックから1画素を超える距離に存在する画素との対に基づき、予測対象ブロックの予測を行う技法がある(例えば、特許文献6参照)。
特開平5−28266号公報 特開平6−60182号公報 特許第4450828号公報 特開2009−49969号公報 特開2008−245088号公報 特開2008−271371号公報
前述したように、画像のテクスチャ解析を行うことは欠陥検出や画像符号化など様々な分野で要求されている。しかし、従来のテクスチャ解析技法は、テクスチャ毎に領域を分割したり、そのテクスチャが何であるかを認識したりすることを目的としていた。例えば、特許文献2の技法では、観測された画像からコンクリートのひびを検出するよう設計されているため、このテクスチャ解析結果に基づいて、隣接領域のテクスチャを予測するという目的には則していない。
一方、特許文献3の技法では、画像のテクスチャ解析を行い、この解析結果から予測対象ブロックを予測し、画像合成的にはめ込みを行うことで、符号化効率の改善を図っている。しかし、特許文献3の技法は、主観的な画質向上を目指して、画像合成的にテクスチャをはめ込むものであるから、実際の符号化対象の入力画像と、復号後に得られる出力画像との間で、信号波形(位相、振幅)としての類似性は全く保証されない。
一方、信号波形の類似性を重視する画像符号化技法において、入力画像(又は動き補償後の残差画像)を複数のブロックに分割し、ある注目ブロック(予測ブロック)の画素値を、すでに符号化済みの周囲の画素値群から内外挿補間することで予測を行う。その後、画像符号化技法は、この予測結果と入力画像(又は動き補償後の残差画像)との残差をエントロピー符号化する。例えば、MPEG−4 AVC/H.264規格のイントラ予測では予測対象ブロックの周辺画素からの0次ホールドでの予測を行うが、最適な予測方向を複数試行の結果、レート対歪みの観点で特定している。この予測処理では最適な予測方向の決定が行われるが、その最適な予測方向を示す情報(予測モードの情報)の伝送が必要である。このため、イントラ予測における最適な予測方向に関して、復号済みの参照画素のテクスチャを分析して予測対象ブロックの相関方向を検出できれば、予測モードの情報の伝送負荷を減少させることができる。
つまり、精度良く簡易な方式で予測対象ブロックの相関方向を検出するテクスチャ解析技法はなかった。とりわけ、画像符号化のイントラ予測に利用可能なテクスチャ解析技法は存在しなかった。従来のテクスチャ解析技法では、相関演算により特定の方向のテクスチャの存在を検出することはできたが、排他的にその方向のみに強い相関を持つか否かを評価するものではなかった。
特に、エッジ検出を通じて排他的に強い相関の方向を求める技法はあったが、ある領域内で大局的に特定の方向に強い相関を持つか否かを評価するものではなかった。
本発明の目的は、上述の問題に鑑みて為されたものであり、入力画像の方向別の相関を解析するテクスチャ解析装置、このテクスチャ解析装置によって分析した結果をイントラ予測やパターン認識へ応用したイントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラムを提供することにある。
上記課題を解決するため、本発明に係るテクスチャ解析装置は、入力画像の方向別の相関を解析するテクスチャ解析装置であって、入力画像に対して、基準方向及び該基準方向に直交する直交方向の対を複数有する複数の方向について、それぞれ相関を算出する相関算出部と、前記基準方向及び直交方向の対ごとに、基準方向の相関及び直交方向の相関の相関比を算出する相関比算出部と、前記算出された相関比が最大となる基準方向をテクスチャ方向として決定するテクスチャ方向決定部と、を備えることを特徴とする。
さらに、本発明に係るテクスチャ解析装置において、前記相関算出部は、前記複数の方向を記憶する方向記憶部と、前記方向記憶部に記憶された複数の方向に沿った変位量をずらし量として生成するずらし量生成部と、前記入力画像の位置を前記ずらし量だけ並進してずらしたずらし画像を生成するずらし画像生成部と、前記基準方向について、前記入力画像及び前記ずらし画像の間の相関を算出する基準方向相関算出部と、前記直交方向について、前記入力画像及び前記ずらし画像の間の相関を算出する直交方向相関算出部と、を備えることを特徴とする。
さらに、本発明に係るテクスチャ解析装置において、前記基準方向相関算出部は、前記基準方向について、前記入力画像及び前記ずらし画像の間の相関を、自己相関により算出し、前記直交方向相関算出部は、前記直交方向について、前記入力画像及び前記ずらし画像の間の相関を、自己相関により算出することを特徴とする。
さらに、本発明に係るテクスチャ解析装置において、前記ずらし画像生成部は、前記ずらし画像を、前記入力画像が繰り返し連続されるものとして生成することを特徴とする。
また、上記課題を解決するため、本発明に係るイントラ予測モード判定装置は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測モード判定装置であって、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像としてテクスチャ方向を出力する請求項1〜4のいずれか一項に記載のテクスチャ解析装置と、前記テクスチャ解析装置によって決定されるテクスチャ方向を、予め定めた所定数の予測モードの方向のうちのいずれか1つに割り当て、割り当てた予測モードの方向に関する推定予測モードの識別子を生成する判定部と、を備えることを特徴とする。
また、上記課題を解決するため、本発明に係る第1態様のイントラ予測装置は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置であって、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する請求項5に記載のイントラ予測モード判定装置と、前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測する予測部と、を備えることを特徴とする。
また、上記課題を解決するため、本発明に係る第2態様のイントラ予測装置は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置であって、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する請求項5に記載のイントラ予測モード判定装置と、予め定めたレート歪み特性に基づいて前記複数の予測モードの中から1つの予測モードを最適予測モードとして決定して当該予測画像を生成するとともに、当該最適予測モードの識別子を前記推定予測モードの識別子と同一の記述形態で生成するRD最適化処理部と、前記推定予測モードの識別子と前記最適予測モードの識別子を用いて当該記述形態を疎表現化した、予測モードの疎表現化記述子を生成する予測モード記述子疎表現化部と、を備えることを特徴とする。
また、上記課題を解決するため、本発明に係る第3態様のイントラ予測装置は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置であって、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する請求項5に記載のイントラ予測モード判定装置と、前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測し、予測画像の初期値として設定する予測画像初期値設定部と、前記参照領域画像と、前記初期値が設定されたイントラ予測対象のブロック画像からなる処理ブロックを生成する処理ブロック生成部と、前記処理ブロックの画像に対して直交変換を施して直交変換係数を生成する直交変換部と、前記直交変換部によって生成された直交変換係数の絶対値を、高周波領域において元の値よりも小さい値に修正する係数修正部と、前記修正された直交変換係数に対して逆直交変換を施して画像を生成する逆直交変換部と、前記逆直交変換部によって生成された画像のうち、前記参照領域画像の画像領域を元の復号済みの画像の画素値に修正し、該修正した画像を前記直交変換部に供給する画像修正部と、前記逆直交変換部によって生成された画像から予測ブロックの画像を抽出して予測画像を生成する予測画像抽出部と、前記画像修正部、前記直交変換部、前記係数修正部、及び前記逆直交変換部による一連の処理の繰り返しを終了する所定の条件を満たすか否かを判定し、該所定の条件を満たしていないと判定した場合には、該一連の処理を繰り返し実行させるために前記逆直交変換部によって生成された画像を前記画像修正部に供給し、該所定の条件を満たしていると判定した場合には、該一連の処理の繰り返しを終了して前記逆直交変換部によって生成された画像を前記予測画像抽出部に供給する分岐部と、を備えることを特徴とする。
また、本発明は、入力画像の方向別の相関を解析するテクスチャ解析装置として構成するコンピュータに、入力画像に対して、基準方向及び該基準方向に直交する直交方向の対を複数有する複数の方向について、それぞれ相関を算出するステップと、前記基準方向及び直交方向の対ごとに、基準方向の相関及び直交方向の相関の相関比を算出するステップと、前記算出された相関比が最大となる基準方向をテクスチャ方向として決定するステップと、を実行させるためのプログラムとしても特徴付けられる。
また、本発明は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測モード判定装置として構成するコンピュータに、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像とし、該入力画像に対して、基準方向及び該基準方向に直交する直交方向の対を複数有する複数の方向について、それぞれ相関を算出するステップと、前記基準方向及び直交方向の対ごとに、基準方向の相関及び直交方向の相関の相関比を算出するステップと、前記算出された相関比が最大となる基準方向をテクスチャ方向として決定するステップと、前記決定されたテクスチャ方向を、予め定めた所定数の予測モードの方向のうちのいずれか1つに割り当て、割り当てた予測モードの方向に関する推定予測モードの識別子を生成するステップと、を実行させるためのプログラムとしても特徴付けられる。
また、本発明は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測装置として構成するコンピュータに、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像とし、該入力画像に対して、基準方向及び該基準方向に直交する直交方向の対を複数有する複数の方向について、それぞれ相関を算出するステップと、前記基準方向及び直交方向の対ごとに、基準方向の相関及び直交方向の相関の相関比を算出するステップと、前記算出された相関比が最大となる基準方向をテクスチャ方向として決定するステップと、前記決定されたテクスチャ方向を、予め定めた所定数の予測モードの方向のうちのいずれか1つに割り当て、割り当てた予測モードの方向に関する推定予測モードの識別子を生成するステップと、前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測するステップと、を実行させるためのプログラムとしても特徴付けられる。
また、本発明は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置として構成するコンピュータに、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像とし、該入力画像に対して、基準方向及び該基準方向に直交する直交方向の対を複数有する複数の方向について、それぞれ相関を算出するステップと、前記基準方向及び直交方向の対ごとに、基準方向の相関及び直交方向の相関の相関比を算出するステップと、前記算出された相関比が最大となる基準方向をテクスチャ方向として決定するステップと、前記決定されたテクスチャ方向を、予め定めた所定数の予測モードの方向のうちのいずれか1つに割り当て、割り当てた予測モードの方向に関する推定予測モードの識別子を生成するステップと、予め定めたレート歪み特性に基づいて前記複数の予測モードの中から1つの予測モードを最適予測モードとして決定して当該予測画像を生成するとともに、当該最適予測モードの識別子を前記推定予測モードの識別子と同一の記述形態で生成するステップと、前記推定予測モードの識別子と前記最適予測モードの識別子を用いて当該記述形態を疎表現化した、予測モードの疎表現化記述子を生成するステップと、を実行させるためのプログラムとしても特徴付けられる。
また、本発明は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置として構成するコンピュータに、(a)イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像とし、該入力画像に対して、基準方向及び該基準方向に直交する直交方向の対を複数有する複数の方向について、それぞれ相関を算出するステップと、(b)前記基準方向及び直交方向の対ごとに、基準方向の相関及び直交方向の相関の相関比を算出するステップと、(c)前記算出された相関比が最大となる基準方向をテクスチャ方向として決定するステップと、(d)前記決定されたテクスチャ方向を、予め定めた所定数の予測モードの方向のうちのいずれか1つに割り当て、割り当てた予測モードの方向に関する推定予測モードの識別子を生成するステップと、(e)前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測し、予測画像の初期値として設定するステップと、(f)前記参照ブロックと、前記初期値が設定された予測ブロックからなる処理ブロックを生成するステップと、(g)前記処理ブロックの画像に対して直交変換を施して直交変換係数を生成するステップと、(h)前記ステップ(g)によって生成された直交変換係数の絶対値を、高周波領域において元の値よりも小さい値に修正するステップと、(i)前記ステップ(h)によって修正された直交変換係数に対して逆直交変換を施して画像を生成するステップと、(j)前記ステップ(g)からステップ(i)の一連の処理の繰り返しを終了する所定の条件を満たすか否かを判定するステップと、(k)前記ステップ(j)により、前記所定の条件を満たしていないと判定した場合には、前記ステップ(i)によって生成された画像のうち、前記参照ブロック内の画像領域を、元の復号済みの画像の画素値に修正し、前記ステップ(g)から当該ステップ(j)を繰り返し行うステップと、(l)前記ステップ(j)により、前記所定の条件を満たしていると判定した場合には、前記一連の処理の繰り返しを終了して前記ステップ(i)によって生成された画像から予測ブロックの画像を抽出して予測画像を生成するステップと、を実行させるためのプログラムとしても特徴付けられる。
本発明によれば、テクスチャの特徴解析として、隣接領域に対する相関を方向別に算出して高精度に評価することができるので、特に、イントラ予測の予測モードの推定に応用することで符号化効率をより向上させることができる。
本発明による一実施例のテクスチャ解析装置の構成を示すブロック図である。 本発明による一実施例のテクスチャ解析装置の動作を示すフローチャートである。 本発明による一実施例のテクスチャ解析装置の位相ずらしを説明する図である。 本発明による一実施例のテクスチャ解析装置の方向の設定例を説明する図である。 本発明による一実施例のイントラ予測モード判定装置の構成を示すブロック図である。 従来のMPEG−4 AVC/H.264方式における4画素×4ライン単位で予測する場合の予測モードを示す図である。 本発明による一実施例のイントラ予測装置で行う処理の単位となる処理ブロックを例示する図である。 本発明による第1態様のイントラ予測装置の構成を示すブロック図である。 本発明による第2態様の符号化側のイントラ予測装置の構成を示すブロック図である。 本発明による第2態様の復号側のイントラ予測装置の構成を示すブロック図である。 本発明による第3態様の復号側のイントラ予測装置の構成を示すブロック図である。 本発明による第3態様のイントラ予測装置の動作を示すフローチャートである。 本発明による第3態様のイントラ予測装置の動作を説明する図である。 本発明による第3態様のイントラ予測装置を備える符号化器の構成を示すブロック図である。 本発明による第3態様のイントラ予測装置を備える復号器の構成を示すブロック図である。
以下、図面を参照して、本発明による一実施例のテクスチャ解析装置、イントラ予測モード判定装置、及び、イントラ予測装置についてそれぞれ説明する。
〔テクスチャ解析装置〕
図1は、本実施例のテクスチャ解析装置の構成を示すブロック図である。テクスチャ解析装置1は、入力画像を解析してテクスチャの相関が最大となる方向(以下、テクスチャ方向と称する)を出力する装置である。テクスチャ解析装置1は、相関算出部10と、相関比算出部11と、テクスチャ方向決定部12とを備える。
相関算出部10は、入力画像に対して、予め設定された複数の方向についてそれぞれ相関を算出する。より詳細には、相関算出部10は、方向記憶部101と、ずらし量生成部102と、ずらし画像生成部103と、n(n≧2)個の基準方向相関算出部104(104−1〜104−n)と、n個の直交方向相関算出部105(105−1〜105−n)とを備える。
方向記憶部101は、入力画像の方向別の相関(類似度)を解析するために、複数の方向を記憶する。複数の方向は、複数の基準方向と、複数の基準方向にそれぞれ直交する複数の直交方向とからなる。
ずらし量生成部102は、方向記憶部101に記憶された複数の方向に沿った変位量をずらし量として生成し、ずらし画像生成部103に出力する。
ずらし画像生成部103は、入力画像の位置を、ずらし量生成部102から入力されるずらし量だけ並進してずらした画像(以下、ずらし画像と称する)を生成し、基準方向についてずらしたずらし画像を基準方向相関算出部104に出力し、直交方向についてずらしたずらし画像を直交方向相関算出部105に出力する。
基準方向相関算出部104は、入力画像及びずらし画像生成部103から入力される基準方向にずらしたずらし画像の間の相関を算出し、相関比算出部11に出力する。
直交方向相関算出部105は、入力画像及びずらし画像生成部103から入力される直交方向にずらしたずらし画像の間の相関を算出し、相関比算出部11に出力する。
相関比算出部11は、基準方向及び直交方向の対ごとに、基準方向の相関及び直交方向の相関の相関比を算出する。ここで、所定の方向の相関及び所定の方向に直交する方向の相関の比を相関比と定義する。より詳細には、相関比算出部11は、n個の方向別相関比算出部11(111−1〜111−n)を備える。
方向別相関比算出部111は、基準方向相関算出部104から入力される基準方向の相関、及び直交方向相関算出部105から入力される直交方向の相関の比を算出し、テクスチャ方向決定部12に出力する。
テクスチャ方向決定部12は、方向別相関比算出部111−1〜111−nから入力される各方向についての相関比のうち、最大の相関比を選択し、このときの基準方向をテクスチャ方向として決定する。最大の相関比が所定の閾値未満である場合には、テクスチャ方向が存在しない旨の情報を出力してもよい。また、nの値を大きくすることによって、より精度の高いテクスチャ方向を検出することができる。
次に、このように構成されるテクスチャ解析装置1の動作について説明する。図2は、テクスチャ解析装置1の動作を示すフローチャートである。ステップS101では、テクスチャ解析装置1は、解析対象となる画像を入力する。
ステップS102では、テクスチャ解析装置1は、相関算出部10により、方向記憶部101に記憶された複数の方向について相関を算出する。図3は、ずらし量生成部102及びずらし画像生成部103における位相ずらしを説明する図である。ずらし量生成部102は、方向記憶部101に記憶された方向が角度θである場合、
Figure 0005509106
となる(Δx,Δy)をずらし量として決定する。ずらし画像生成部103は、入力画像Iを(Δx,Δy)だけずらしたずらし画像I’を生成する。例えば、図3に示すように、θ=60°のとき
Figure 0005509106
であるため、(Δx,Δy)=(1,2)とし、入力画像Iを(1,2)だけずらしたずらし画像I’を生成する。
基準方向相関算出部104は、入力画像及びずらし画像の自己相関により相関を算出する。座標(x,y)の画素値をg(x,y)としたとき、自己相関は、次式(1)により算出できる。また、演算処理を簡易化するために、次式(2)により自己相関を算出してもよい。
L1(θ)=Σ{g(x,y)・g(x+Δx,y+Δy)} (1)
L2(θ)=Σ‖g(x,y)−g(x+Δx,y+Δy)‖ (2)
式(1)及び(2)において、Σは入力画像中の全ての画素について演算を行うことを意味する。また、式(2)において、‖はノルムを意味し、ノルムは自乗や絶対値等を用いることができる。
なお、入力画像に対してずらし画像のはみ出す領域については、0次ホールドや鏡像により未定義の画素を埋める方法も適用可能であるが、同じ画像が繰り返されていることを仮定して未定義の画素を埋めることが、テクスチャの方向性をくずさない意味において好適である。
図4は、テクスチャ解析装置1の方向の設定例を説明する図である。図中の四角は画素を示しており、一部の画素には画素を識別するための識別番号0〜31を付している。設定可能な方向を、識別番号を用いて説明すると、画像サイズが3×3画素の場合は、識別番号1−5,2−6,3−7,4−8の4方向を設定可能である。画像サイズが5×5画素の場合は、上記4方向に識別番号9−13,10−14,11−15,12−16の4方向を加えた8方向を設定可能である。同様に、画像サイズが7×7画素の場合は16方向を設定可能である。このように、解析対象の画像サイズが大きくなるにつれて、設定可能な方向の数は増加する。
識別番号0に対して、識別番号1及び5は、向きは逆ではあるが方向は同じなので、識別番号1−5方向の相関Lの値を、識別番号0−1方向の相関値及び識別番号0−5方向の相関値の一方の値としてもよいし、両方の平均値としてもよい。
テクスチャ解析装置1は、基準方向相関算出部104で角度θ方向の相関L(θ)を算出したとき、直交方向相関算出部105により、角度(θ+90°)方向の相関L(θ+90°)を算出する。例えば、基準方向相関算出部104−kで識別番号1−5方向の相関L(90°)を算出した場合には、直交方向相関算出部105−kは識別番号3−7方向の相関L(180°)を算出する。
ステップS103では、テクスチャ解析装置1は、方向別相関比算出部13により、ステップS102にて算出した相関L(θ)と相関L(θ+90°)の比である相関比を算出する。
ステップS104では、テクスチャ解析装置1は、テクスチャ方向決定部12により、ステップS103で算出した各方向についての相関比のうち、最大の相関比を選択し、相関比が最大となる基準方向をテクスチャ方向として出力する。なお、式(1)によりL1(θ)を求めた場合、値が大きいほど相関が大きいことを示し、式(2)によりL2(θ)を求めた場合、値が大きいほど相関が小さいことを示す。よって、相関の算出に式(1)を用いた場合には相関比をL1(θ)/L1(θ+90°)とし、相関の算出に式(2)を用いた場合には相関比をL2(θ+90°)/L2(θ)とする。
なお、テクスチャ解析装置1として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、テクスチャ解析装置1の各機能を実現する処理内容を記述したプログラムを、当該コンピュータの記憶部(図示せず)に格納しておき、当該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることで実現することができる。
〔イントラ予測モード判定装置〕
次に、本発明による一実施例のイントラ予測モード判定装置について説明する。図5は、本実施例のイントラ予測モード判定装置の構成を示すブロック図である。イントラ予測モード判定装置2は、複数のイントラ予測の予測モードの中から、最適なイントラ予測モードを推定し、推定予測モードの識別子を出力する装置である。イントラ予測モード判定装置2は、前述したテクスチャ解析装置1と、判定部21と、予測モード記憶部22とを備える。
予測モード記憶部22は、複数の予測モードの情報を保持している。一例として、図6に、既存のMPEG−4 AVC/H.264方式におけるイントラ予測の予測モードを示す。MPEG−4 AVC/H.264方式におけるイントラ予測は、4画素×4ライン単位、8画素×8ライン単位、又は16画素×16ライン単位で行われ、複数種類の予測方向のモード(予測モード)(例えば、4画素×4ライン単位の予測については9種類)の中から最適な予測方向を選択する。図6は、4画素×4ライン単位で予測する場合の予測モードを示す図である。図中のA〜Mは復号済みの画素を示し、矢印は予測方向を示している。(a)の予測モード0では垂直方向予測、(b)の予測モード1では水平方向予測、(c)の予測モード2ではDC予測、(d)の予測モード3では対角左下方向予測、(e)の予測モード4では対角右下方向予測、(f)の予測モード5では垂直右方向予測、(g)の予測モード6では水平下方向予測、(h)の予測モード7では垂直左方向予測、(i)の予測モード8では水平上方向予測を行う。
判定部21は、予め定めた規則に従って、テクスチャ解析装置1から入力されるテクスチャ方向を予測モード記憶部22に保持される予め定められた予測モードのうちのいずれか1つに割り当て、割り当てた予測モードを示す推定予測モードの識別子zを生成して出力する。すなわち、図6に示す予測モードに割り当てる場合には、テクスチャ方向により示される方向に対し、予測モード0〜8のうち最も近い方向の予測モードを割り当て、予測モードの識別子z=0〜8を出力する。テクスチャ解析装置1からテクスチャ方向が存在しない旨の情報が入力された場合には、図6に例示する予測モードを使用するとき、予測モードの識別子z=2とする。
テクスチャ解析装置1で検出する相関方向の数と予測モードの方向の数とは一致している必要はない。例えば、検出方向数が少ない場合には、検出された相関比の大きさをもとに、中間に位置する方向の相関比を内挿予測して判定に用いることも可能である。また、検出方向と予測モードの方向とが一致しない場合にも、内挿を用いた評価により最適なイントラ予測方向を推定することも可能である。
図7は、イントラ予測装置で行う処理の単位となる処理ブロックPを例示する図である。一般にイントラ予測では、画像ブロックXを予測するのに、画像ブロックD,B,Aを参照する。そのため、テクスチャ解析装置1は、参照領域の相関方向の検出を行う際に、参照領域と相関を算出する方向とを関連付けて、画像ブロックBを参照領域とする場合には垂直に近い方向(例えば、45°〜135°)、画像ブロックAを参照領域とする場合には水平に近い方向(例えば、−45°〜45°)について相関を算出するのが効率的である。
なお、イントラ予測モード判定装置2として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、イントラ予測モード判定装置2の各機能を実現する処理内容を記述したプログラムを、当該コンピュータの記憶部(図示せず)に格納しておき、当該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。
このように、本実施例のイントラ予測モード判定装置2によれば、特定の方向に沿った予測を行う複数の予測モードの中から、適した方向の予測モードをテクスチャ解析装置1からのテクスチャ方向に従って決定することができ、イントラ予測の予測精度を向上させることができるようになる。
〔第1態様のイントラ予測装置〕
次に、前述したイントラ予測モード判定装置2の利点を生かした3つの態様のイントラ予測装置について順に説明する。また、同様な構成要素には同一の参照番号を付して説明する。
図8は、第1態様のイントラ予測装置の構成を示すブロック図である。第1態様のイントラ予測装置3は、イントラ予測モード判定装置2と、予測部31とを備える。
予測部31は、参照領域画像、及びイントラ予測モード判定装置2から入力される推定予測モードの識別子に基づいて、予測領域の画素値を予測し、予測画像を生成する。
なお、第1態様のイントラ予測装置3は、符号化側及び復号側の装置の双方に適用することができるし、MPEG−4 AVC/H.264方式と同様に、推定予測モードの識別子を符号化側から復号側の装置に伝送するように構成することができる。
つまり、第1態様のイントラ予測装置3によれば、イントラ予測対象のブロック画像の周囲の参照領域画像における参照領域のテクスチャ方向に沿って予測する方向を決定するため、当該周囲の参照領域の波形をテクスチャ解析装置1からのテクスチャ方向の情報に基づいて延長するようイントラ予測を行うことになり、この結果、参照領域画像からイントラ予測対象のブロック画像に貫入するような画素値パターンを精度良く近似することができるようになる。
〔第2態様のイントラ予測装置〕
次に、本発明による第2態様のイントラ予測装置の実施例について説明する。図9及び図10は、第2態様のイントラ予測装置の構成を示すブロック図である。図9は符号化側で用いるイントラ予測装置を示しており、図10は復号側で用いるイントラ予測装置を示している。
図9を参照するに、第2態様の符号化側イントラ予測装置4は、前述したイントラ予測モード判定装置2と、前述した予測部31と、予測モード識別子発生部41と、RD最適化処理部42と、予測モード記述子疎表現化部43とを備える。
予測モード識別子発生部41は、予測モードの識別子z(図6に例示する予測モードを使用するとき、z=0〜8)を予測部31及びRD最適化処理部42に順次出力する。
予測部31は、予測モード識別子発生部41から入力された予測モードの識別子に応じて参照領域画像から予測領域の予測画像を生成し、各予測モードの識別子に対応する予測画像をRD最適化処理部42に送出する。
RD最適化処理部42は、予測領域の実画像と各予測モードによる予測画像とを比較し、RD(Rate-Distortion)規範(ビットレートと画質劣化に基づく予め定めた尺度)が最適なものとなる予測モードを特定し、特定した予測モードの識別子を最適予測モードの識別子として予測モード記述子疎表現化部43に出力する。なお、RD最適化処理部42は、最適予測モードの識別子に対応する予測領域の予測画像を出力する。
一方、イントラ予測モード判定装置2は、前述したように、参照領域画像から最適と推定される予測モードの識別子を推定予測モードの識別子として予測モード記述子疎表現化部43に出力する。なお、最適予測モードの識別子及び推定予測モードの識別子は同一の記述形態であり、例えば、z=0〜8の識別子であれば、最適予測モードの識別子及び推定予測モードの識別子の双方は方向ごとに3bitで表すことができる。
予測モード記述子疎表現化部43は、RD最適化処理部42から入力される最適予測モードの識別子、及びイントラ予測モード判定装置2から入力される推定予測モードの識別子を用いて当該記述形態を疎表現化した、予測モードの疎表現化記述子を生成して出力する。これにより、最適予測モードの識別子の記述形態を推定予測モードの識別子の記述形態で変化させ、エントロピーの小さい記述子を生成することができる。
例えば、予測モード記述子疎表現化部43は、最適予測モードの識別子と、推定予測モードの識別子との数値としての差分を演算し、その結果を予測モードの疎表現化記述子として出力する。
次に、図10を参照するに、第2態様の復号側イントラ予測装置4bは、前述したイントラ予測モード判定装置2と、前述した予測部31と、最適予測モード識別子生成部42bとを備える。
最適予測モード識別子生成部42bは、符号化側の予測モード記述子疎表現化部43から予測モードの疎表現化記述子を受け取り、イントラ予測モード判定装置2からの推定予測モードの識別子を用いて、最適予測モードの識別子を復元し、予測部31に送出する。
図10に示す予測部31は、最適予測モード識別子生成部42bから入力される最適予測モードの識別子に応じて、参照領域画像から予測領域の予測画像を生成する。
第2態様のイントラ予測装置4,4bによれば、予め用意した複数の予測モードの中からレート歪み特性の観点で最適な予測モードを決定する一方で、本発明に係るイントラ予測モード判定装置2により決定される予測モードを求め、最適予測モードの識別子の記述形態を推定予測モードの識別子の記述形態で変化させることができ、換言すれば、単に最適予測モードの識別子を伝送するよりも記述形態を疎表現化した態様で予測モードの情報を伝送することが可能となる。最適予測モードの識別子と推定予測モードの識別子との間には高い相関があると考えられ、符号化側及び復号側の双方でイントラ予測モード判定装置2を具備することにより、符号化側と復号側との間の当該識別子の伝送が圧縮可能となり、実質的な伝送符号量を削減することができるようになる。
〔第3態様のイントラ予測装置〕
次に、本発明による第3態様のイントラ予測装置の実施例について説明する。図11は、第3態様のイントラ予測装置の構成を示すブロック図である。第3態様のイントラ予測装置5は、イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定してそれにより予測画像の初期値を生成し、これに対して繰り返し処理を適用して最終的な予測画像を生成する装置であり、イントラ予測モード判定装置2と、制御パラメータ設定部51と、予測画像初期値設定部52と、処理ブロック生成部53と、直交変換部54と、係数修正部55と、逆直交変換部56と、分岐部57と、画像修正部58と、予測画像抽出部59とを備える。
イントラ予測モード判定装置2は、前述と同様に、イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する。
制御パラメータ設定部51は、イントラ予測モード判定装置2から推定予測モードの識別子の情報を取得し、予測画像初期値設定部52に送出するとともに、後述するように、分岐部57に対する繰返し処理の回数の設定、処理ブロック生成部53に対する参照領域画像の可変の画像領域の設定、係数修正部55に対する高周波領域における修正量の設定、及び、逆直交変換部56における修正された直交変換係数に対する基底の設定等の制御パラメータの設定を行う。なお、符号化側でも第3態様のイントラ予測装置5を用いる場合には、参照領域及び予測領域を規定するパラメータ、繰り返し処理を規定するパラメータを固定値とすることで、制御パラメータを符号化側から復号側に送信する必要が無くなり、伝送符号量を削減することができる。
予測画像初期値設定部52は、推定予測モードの識別子によって指示される予測モードによって前記参照領域画像からイントラ予測対象のブロック画像を予測し、予測画像の初期値として設定する。
処理ブロック生成部53は、参照領域画像と、当該初期値が設定されたイントラ予測対象のブロック画像からなる処理ブロックを生成し、直交変換部54に出力する。
直交変換部54は、処理ブロック生成部53から入力される処理ブロックの画像に対して直交変換を施し、導出した直交変換係数を係数修正部55に出力する。
係数修正部55は、直交変換部54から入力される直交変換係数を、高周波領域において元の値よりも小さい値に修正し、逆直交変換部56に出力する。
逆直交変換部56は、係数修正部55から入力される修正された直交変換係数に対して逆直交変換を施して画像を生成し、この画像を分岐部57に出力する。
分岐部57は、後述する画像の修正、及び上記の直交変換、直交変換係数の修正、逆直交変換という一連の処理を繰り返すか否かを判定する。繰り返し処理を実行する場合には、逆直交変換部56から入力される画像を画像修正部58に出力し、繰り返し処理を終了する場合には、逆直交変換部56から入力される画像を予測画像抽出部59に出力する。
画像修正部58は、逆直交変換部56によって生成される画像のうち、参照領域画像の画像領域における画素値を参照領域画像の元の画素値に修正する。
予測画像抽出部59は、分岐部57から入力される、当該繰り返しによって得られる最終的な処理ブロックの画像から、イントラ予測対象のブロック画像を抽出して予測画像を生成する。
第3態様のイントラ予測装置5は、上記の繰り返し処理を行うことで、より一層、交流成分の不連続性を低減することができる。
次に、このように構成される第3態様のイントラ予測装置5の動作について説明する。図12は、第3態様のイントラ予測装置5の動作を示すフローチャートである。また、図13(a)及び図13(c)は、イントラ予測装置5で行う処理の単位となる処理ブロックPを例示する図である。図13(b)及び図13(d)は、処理ブロックPの周波数領域を示す図であり、左上の領域は低周波成分を示し、右下の領域は高周波成分を示す。画像ブロックXは、イントラ予測の対象となる画像ブロック(予測ブロック)である。画像ブロックD,B,Aは、符号化された後に復号された画像ブロックであり、予測ブロックの画素値を予測するための参照領域となる画像ブロック(参照ブロック)である。また、以下の説明において、参照ブロックD,B,A内の画像をそれぞれ参照領域画像d,b,aといい、予測ブロックX内の画像を予測画像xという。
各ブロックのサイズは予め設定されており、図13(a)に示すように、参照ブロックDはk画素×mライン、参照ブロックBはl画素×mライン、参照ブロックAはk画素×nライン、予測ブロックXはl画素×nライン、処理ブロックPは(k+l)画素×(m+n)ラインである。
ステップS201では、イントラ予測モード判定装置2によって、参照領域画像を解析して推定予測モードの識別子を生成する。
ステップS202では、予測画像初期値設定部52によって、推定予測モードの識別子により指示される予測モードに応じて前記参照領域画像から前記イントラ予測対象のブロック画像を予測し、予測画像の初期値として設定する。
ステップS203では、処理ブロック生成部53によって、図13(a)に示すように、参照ブロックD,B,Aと初期値が設定された予測ブロックXからなる処理ブロックPを生成する。
ステップS204では、直交変換部54によって、処理ブロックPの画像に対して直交変換を施す。
ステップS205では、係数修正部55によって、ステップS204にて生成される直交変換係数を、高周波領域において元の値よりも小さい値に修正する。
係数修正部55は、参照ブロックD,B,Aと予測ブロックXの境界領域において、参照領域画像d,b,aと予測画像xとの間に交流的な連続性をもたせる(不連続性を低減する)ために、処理ブロックPの高周波成分を抑圧するため、直交変換部54から入力される直交変換係数のうち、図13(b)に示すように、高周波領域である係数修正領域Hの直交変換係数の絶対値を元の値よりも小さい値に修正する。係数修正領域H内の係数の数hは、1≦h<(k+l)×(m+n)である。修正する値は、0とするのが高周波成分を除去するのに好適である。また、直交変換が修正される係数修正領域Hは、図13(d)に示すように、正方形状又は長方形状としてもよい。
係数修正部55は、後述する繰り返し処理によりn回目の処理を行う場合には、最高次の直交変換係数から順にhn個の直交変換係数の絶対値を元の値よりも小さい値に修正する。ここで、係数修正領域Hを所定の値に修正するという制約条件を徐々に緩和させるために、処理を繰り返すごとに、繰り返し後の係数修正領域Hの面積を繰り返し前の面積以下とし、h1≧h2≧…≧hnとするのが好適である。
ステップS206では、逆直交変換部56によって、ステップS205にて修正された直交変換係数に対して逆直交変換を施す。
ステップS207では、分岐部57によりステップS204からステップS206の処理が所定回数繰り返して行われたか否かを判定する。繰り返しが所定回数に達していないと判定した場合には処理をステップS108に進め、繰り返しが所定回数に達していると判定した場合には処理をステップS109に進める。
また、分岐部57における別の判定方法として、参照領域について、現在の画素値と繰り返し処理を行う前の元の復号済みの画像の画素値との差分値を算出し、この差分値が閾値以上の場合には繰り返し処理を実行させるために、逆直交変換部56から入力される画像を画像修正部58に出力し、閾値より小さい場合には繰り返し処理を終了して逆直交変換部56から入力される画像を予測画像抽出部59に出力するようにしてもよい。また、この判定方法による場合でも、繰り返し回数を制限するために、繰り返しの上限回数を設けるのが好適である。
高次の直交変換係数の絶対値を元の値よりも小さい値に修正して逆直交変換を行うことにより、参照ブロックD,B,Aと予測ブロックXとの境界領域における画素値の不連続性が緩和されるが、参照ブロックD,B,Aの画素値は元の値から変化している。そのため、ステップS208では、画像修正部58により、例えば、図13(c)に示すように、参照ブロックD,B,A内のうち、予測ブロックXに隣接する画像修正領域Gの画素値を、参照ブロックD,B,Aの元の画素値に修正する。画像修正領域G内の画素数gは、1≦g≦k×m+l×m+k×nである。そして、画素値を修正した後の処理ブロックPを直交変換部54に出力する。
画像修正部58は、繰り返し処理によりn回目の処理を行う場合には、参照ブロックD,B,Aのうち、gn個の画素からなる画像修正領域Gを元の画素値に修正する。ここで、参照画像d,b,aが演算により変化した場合には元の値に修正するという制約条件を徐々に緩和させるために、処理を繰り返すごとに、繰り返し後の画像修正領域Gの面積を繰り返し前の面積以下とし、g1≧g2≧…≧gnとするのが好適である。
ステップS209では、分岐部57によって、直交変換部54、係数修正部55及び逆直交変換部56による一連の処理を、当該参照領域画像の画像領域における画素値の修正が所定の修正量以下となるまで所定回数以内で繰返されると、予測画像抽出部59は、当該繰り返しによって得られる最終的な処理ブロックPの画像から、イントラ予測対象のブロック画像を抽出して予測画像を生成する。
なお、イントラ予測装置として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、イントラ予測装置の各機能を実現する処理内容を記述したプログラムを、当該コンピュータの記憶部(図示せず)に格納しておき、当該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。
[符号化器]
本発明による第1態様〜第3態様のイントラ予測装置は、符号化器及び復号器に適用することができる。次に、代表的に、本発明による第3態様のイントラ予測装置5を備える符号化器について説明する。
図14は、第3態様の符号化側イントラ予測装置5を備える符号化器6の構成を示すブロック図である。符号化器6は、第3態様のイントラ予測装置5と、減算部61と、直交変換部62と、量子化部63と、エントロピー符号化部64と、逆量子化部65と、逆直交変換部66と、動き補償予測とイントラ予測の切り替えを行う切替えスイッチ67と、加算部68と、メモリ69と、動き補償予測部70とを備える。
動き補償予測部70は、動き補償予測の場合に、入力画像に対して、メモリ69から取得する参照領域画像を用いて動きベクトル検出を行い、得られた動きベクトルを用いて動き補償を行い、その結果得られた予測画像を、切替えスイッチ67を介して減算部61及び加算部68に出力する。また、動き補償予測部70は、動き情報(動きベクトル等)をエントロピー符号化部64に出力する。
減算部61は、入力画像と、動き補償予測部70又はイントラ予測装置5からの予測画像との差分画像を生成して直交変換部62に出力する。
直交変換部62は、減算部61から供給される差分画像に対して小領域の画素ブロックごとに直交変換(例えば、DCT;Discrete Cosine Transform)を施し、直交変換係数を量子化部63に出力する。
量子化部63は、直交変換部62から入力される直交変換係数に対して量子化テーブルを選択して量子化処理を行い、エントロピー符号化部64及び逆量子化部65に出力する。
エントロピー符号化部64は、量子化部63から入力される量子化された直交変換係数についてスキャンを行って可変長符号化処理を施しビットストリームを生成するとともに、動き補償予測部70から入力される動き情報もエントロピー符号化を施して外部に出力する。
逆量子化部65は、量子化部63から入力される量子化された直交変換係数について逆量子化処理を行って逆直交変換部66に出力する。
逆直交変換部66は、逆量子化部65から入力された直交変換係数に対して逆直交変換(例えば、IDCT;Inverse Discrete Cosine Transform)を施し、加算部68に出力する。
加算部68は、逆直交変換部66から得られる逆直交変換した画像と、動き補償予測部70又はイントラ予測装置5から得られる予測画像とを加算処理して復号画像を生成し、フレームメモリ69に出力する。
切替えスイッチ67は、動き補償予測とイントラ予測とを切替える。
第3態様のイントラ予測装置5は、逆量子化部65、逆直交変換部66及び加算部68を経てメモリ69に格納された参照領域画像を入力して予測画像を生成し、切替えスイッチ67を介して減算部61及び加算部68に出力する。制御パラメータは、エントロピー符号化部64にて符号化される。
つまり、本発明に係る符号器2は、従来のMPEG−4 AVC/H.264方式の符号器と比較して、従来のMPEG−4 AVC/H.264方式の符号器におけるイントラ予測部に代えて本発明による第3態様のイントラ予測装置5を備える点で相違するが、動作は従来のMPEG−4 AVC/H.264方式の符号器と同様である。
[復号器]
図15は、第3態様の復号側イントラ予測装置5を備える復号器7の構成を示すブロック図である。復号器7は、第3態様の復号側イントラ予測装置5と、エントロピー復号部71と、逆量子化部72と、逆直交変換部73と、加算部74と、メモリ75と、動き補償予測部76と、切替えスイッチ77とを備える。復号器7は、従来のMPEG−4 AVC/H.264方式の復号器と比較して、従来のMPEG−4 AVC/H.264方式の復号器のイントラ予測部に代えて、第3態様の復号側イントラ予測装置5を備える点で相違する。
エントロピー復号部71は、フレーム間予測で符号化されたビットストリームを入力して、エントロピー復号処理を施し逆量子化部72に出力するとともに、動き情報を復号して動き補償予測部76に出力する。動き補償予測部76は、動き補償予測の場合の予測画像を生成し、復号側イントラ予測装置5は、イントラ予測の場合の予測画像を生成する。さらに、符号化器側から制御パラメータが伝送された場合には、制御パラメータを復号して復号側イントラ予測装置5に出力する。
逆量子化部72は、エントロピー復号部71から入力される量子化された直交変換係数に対して逆量子化処理を施して逆直交変換部73に出力する。
逆直交変換部73は、逆量子化部72から入力される差分画像の直交変換係数に対して、逆直交変換(例えば、IDCT)を施し、得られる当該差分画像を加算部74に出力する。
加算部74は、逆直交変換部73から得られる当該差分画像と、動き補償予測部76から入力される予測画像又は第3態様の復号側イントラ予測装置5から入力される予測画像とを加算して画像信号を外部に出力する。
動き補償予測部76は、メモリ75から得られる参照領域画像とエントロピー復号部71から得られる動きベクトルとを用いて予測画像を生成し、切替えスイッチ77を介して加算部74に出力する。
第3態様のイントラ予測装置5は、逆量子化部72及び逆直交変換部73を経てメモリ75に格納された参照領域画像を入力して予測画像を生成し、切替えスイッチ77を介して加算部74に出力する。
このように、本発明に係る第3態様のイントラ予測装置5は、本発明に係る第1及び第2態様のイントラ予測装置3,4,4bも同様に、MPEG−4 AVC/H.264方式の符号化器及び復号器に大きな変更無く適用することが可能である。そして、参照画素と予測画素との間で交流成分の連続性が損なわれない予測を行うことができ、復号済みの画像に含まれる符号化歪みや原画像に含まれる雑音成分の影響の少ない予測を行うことができる。
本発明によれば、テクスチャの特徴解析として、隣接領域に対する相関を方向別に算出して高精度に評価することができるので、特に、イントラ予測の用途に有用である。
1 テクスチャ解析装置
2 イントラ予測モード判定装置
3,4,4b,5 イントラ予測装置
10 相関算出部
11 相関比算出部
12 テクスチャ方向決定部
101 方向記憶部
102 ずらし量生成部
103 ずらし画像生成部
104(104−1〜104−n) 基準方向相関算出部
105(105−1〜105−n) 直交方向相関算出部
21 判定部
22 予測モード記憶部
31 予測部
41 予測モード識別子発生部
42 RD最適化処理部
42b 最適予測モード識別子生成部
43 予測モード記述子疎表現化部
51 制御パラメータ設定部
52 予測画像初期値設定部
53 処理ブロック生成部
54 直交変換部
55 係数修正部
56 逆直交変換部
57 分岐部
58 画像修正部
59 予測画像抽出部

Claims (13)

  1. 入力画像の方向別の相関を解析するテクスチャ解析装置であって、
    入力画像に対して、基準方向及び該基準方向に直交する直交方向の対を複数有する複数の方向について、それぞれ相関を算出する相関算出部と、
    前記基準方向及び直交方向の対ごとに、基準方向の相関及び直交方向の相関の相関比を算出する相関比算出部と、
    前記算出された相関比が最大となる基準方向をテクスチャ方向として決定するテクスチャ方向決定部と、
    を備えることを特徴とするテクスチャ解析装置。
  2. 前記相関算出部は、
    前記複数の方向を記憶する方向記憶部と、
    前記方向記憶部に記憶された複数の方向に沿った変位量をずらし量として生成するずらし量生成部と、
    前記入力画像の位置を前記ずらし量だけ並進してずらしたずらし画像を生成するずらし画像生成部と、
    前記基準方向について、前記入力画像及び前記ずらし画像の間の相関を算出する基準方向相関算出部と、
    前記直交方向について、前記入力画像及び前記ずらし画像の間の相関を算出する直交方向相関算出部と、
    を備えることを特徴とする、請求項1に記載のテクスチャ解析装置。
  3. 前記基準方向相関算出部は、前記基準方向について、前記入力画像及び前記ずらし画像の間の相関を、自己相関により算出し、
    前記直交方向相関算出部は、前記直交方向について、前記入力画像及び前記ずらし画像の間の相関を、自己相関により算出する
    ことを特徴とする、請求項2に記載のテクスチャ解析装置。
  4. 前記ずらし画像生成部は、前記ずらし画像を、前記入力画像が繰り返し連続されるものとして生成することを特徴とする、請求項3に記載のテクスチャ解析装置。
  5. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測モード判定装置であって、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像としてテクスチャ方向を出力する請求項1〜4のいずれか一項に記載のテクスチャ解析装置と、
    前記テクスチャ解析装置によって決定されるテクスチャ方向を、予め定めた所定数の予測モードの方向のうちのいずれか1つに割り当て、割り当てた予測モードの方向に関する推定予測モードの識別子を生成する判定部と、
    を備えることを特徴とするイントラ予測モード判定装置。
  6. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置であって、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する請求項5に記載のイントラ予測モード判定装置と、
    前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測する予測部と、
    を備えることを特徴とするイントラ予測装置。
  7. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置であって、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する請求項5に記載のイントラ予測モード判定装置と、
    予め定めたレート歪み特性に基づいて前記複数の予測モードの中から1つの予測モードを最適予測モードとして決定して当該予測画像を生成するとともに、当該最適予測モードの識別子を前記推定予測モードの識別子と同一の記述形態で生成するRD最適化処理部と、
    前記推定予測モードの識別子と前記最適予測モードの識別子を用いて当該記述形態を疎表現化した、予測モードの疎表現化記述子を生成する予測モード記述子疎表現化部と、
    を備えることを特徴とするイントラ予測装置。
  8. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置であって、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力して、当該推定予測モードの識別子を生成する請求項5に記載のイントラ予測モード判定装置と、
    前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測し、予測画像の初期値として設定する予測画像初期値設定部と、
    前記参照領域画像と、前記初期値が設定されたイントラ予測対象のブロック画像からなる処理ブロックを生成する処理ブロック生成部と、
    前記処理ブロックの画像に対して直交変換を施して直交変換係数を生成する直交変換部と、
    前記直交変換部によって生成された直交変換係数の絶対値を、高周波領域において元の値よりも小さい値に修正する係数修正部と、
    前記修正された直交変換係数に対して逆直交変換を施して画像を生成する逆直交変換部と、
    前記逆直交変換部によって生成された画像のうち、前記参照領域画像の画像領域を元の復号済みの画像の画素値に修正し、該修正した画像を前記直交変換部に供給する画像修正部と、
    前記逆直交変換部によって生成された画像から予測ブロックの画像を抽出して予測画像を生成する予測画像抽出部と、
    前記画像修正部、前記直交変換部、前記係数修正部、及び前記逆直交変換部による一連の処理の繰り返しを終了する所定の条件を満たすか否かを判定し、該所定の条件を満たしていないと判定した場合には、該一連の処理を繰り返し実行させるために前記逆直交変換部によって生成された画像を前記画像修正部に供給し、該所定の条件を満たしていると判定した場合には、該一連の処理の繰り返しを終了して前記逆直交変換部によって生成された画像を前記予測画像抽出部に供給する分岐部と、
    を備えることを特徴とするイントラ予測装置。
  9. 入力画像の方向別の相関を解析するテクスチャ解析装置として構成するコンピュータに、
    入力画像に対して、基準方向及び該基準方向に直交する直交方向の対を複数有する複数の方向について、それぞれ相関を算出するステップと、
    前記基準方向及び直交方向の対ごとに、基準方向の相関及び直交方向の相関の相関比を算出するステップと、
    前記算出された相関比が最大となる基準方向をテクスチャ方向として決定するステップと、
    を実行させるためのプログラム。
  10. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測モード判定装置として構成するコンピュータに、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像とし、該入力画像に対して、基準方向及び該基準方向に直交する直交方向の対を複数有する複数の方向について、それぞれ相関を算出するステップと、
    前記基準方向及び直交方向の対ごとに、基準方向の相関及び直交方向の相関の相関比を算出するステップと、
    前記算出された相関比が最大となる基準方向をテクスチャ方向として決定するステップと、
    前記決定されたテクスチャ方向を、予め定めた所定数の予測モードの方向のうちのいずれか1つに割り当て、割り当てた予測モードの方向に関する推定予測モードの識別子を生成するステップと、
    を実行させるためのプログラム。
  11. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定するイントラ予測装置として構成するコンピュータに、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像とし、該入力画像に対して、基準方向及び該基準方向に直交する直交方向の対を複数有する複数の方向について、それぞれ相関を算出するステップと、
    前記基準方向及び直交方向の対ごとに、基準方向の相関及び直交方向の相関の相関比を算出するステップと、
    前記算出された相関比が最大となる基準方向をテクスチャ方向として決定するステップと、
    前記決定されたテクスチャ方向を、予め定めた所定数の予測モードの方向のうちのいずれか1つに割り当て、割り当てた予測モードの方向に関する推定予測モードの識別子を生成するステップと、
    前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測するステップと、
    を実行させるためのプログラム。
  12. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置として構成するコンピュータに、
    イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像とし、該入力画像に対して、基準方向及び該基準方向に直交する直交方向の対を複数有する複数の方向について、それぞれ相関を算出するステップと、
    前記基準方向及び直交方向の対ごとに、基準方向の相関及び直交方向の相関の相関比を算出するステップと、
    前記算出された相関比が最大となる基準方向をテクスチャ方向として決定するステップと、
    前記決定されたテクスチャ方向を、予め定めた所定数の予測モードの方向のうちのいずれか1つに割り当て、割り当てた予測モードの方向に関する推定予測モードの識別子を生成するステップと、
    予め定めたレート歪み特性に基づいて前記複数の予測モードの中から1つの予測モードを最適予測モードとして決定して当該予測画像を生成するとともに、当該最適予測モードの識別子を前記推定予測モードの識別子と同一の記述形態で生成するステップと、
    前記推定予測モードの識別子と前記最適予測モードの識別子を用いて当該記述形態を疎表現化した、予測モードの疎表現化記述子を生成するステップと、
    を実行させるためのプログラム。
  13. イントラ予測対象のブロック画像に対して複数の予測モードの中から1つの予測モードを決定し、予測画像を生成するイントラ予測装置として構成するコンピュータに、
    (a)イントラ予測対象のブロック画像の予測に用いる参照領域画像を入力画像とし、該入力画像に対して、基準方向及び該基準方向に直交する直交方向の対を複数有する複数の方向について、それぞれ相関を算出するステップと、
    (b)前記基準方向及び直交方向の対ごとに、基準方向の相関及び直交方向の相関の相関比を算出するステップと、
    (c)前記算出された相関比が最大となる基準方向をテクスチャ方向として決定するステップと、
    (d)前記決定されたテクスチャ方向を、予め定めた所定数の予測モードの方向のうちのいずれか1つに割り当て、割り当てた予測モードの方向に関する推定予測モードの識別子を生成するステップと、
    (e)前記推定予測モードの識別子によって指示される予測モードによって前記参照領域画像から前記イントラ予測対象のブロック画像を予測し、予測画像の初期値として設定するステップと、
    (f)前記参照ブロックと、前記初期値が設定された予測ブロックからなる処理ブロックを生成するステップと、
    (g)前記処理ブロックの画像に対して直交変換を施して直交変換係数を生成するステップと、
    (h)前記ステップ(g)によって生成された直交変換係数の絶対値を、高周波領域において元の値よりも小さい値に修正するステップと、
    (i)前記ステップ(h)によって修正された直交変換係数に対して逆直交変換を施して画像を生成するステップと、
    (j)前記ステップ(g)からステップ(i)の一連の処理の繰り返しを終了する所定の条件を満たすか否かを判定するステップと、
    (k)前記ステップ(j)により、前記所定の条件を満たしていないと判定した場合には、前記ステップ(i)によって生成された画像のうち、前記参照ブロック内の画像領域を、元の復号済みの画像の画素値に修正し、前記ステップ(g)から当該ステップ(j)を繰り返し行うステップと、
    (l)前記ステップ(j)により、前記所定の条件を満たしていると判定した場合には、前記一連の処理の繰り返しを終了して前記ステップ(i)によって生成された画像から予測ブロックの画像を抽出して予測画像を生成するステップと、
    を実行させるためのプログラム。
JP2011001463A 2011-01-06 2011-01-06 テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム Active JP5509106B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011001463A JP5509106B2 (ja) 2011-01-06 2011-01-06 テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011001463A JP5509106B2 (ja) 2011-01-06 2011-01-06 テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム

Publications (2)

Publication Number Publication Date
JP2012147053A JP2012147053A (ja) 2012-08-02
JP5509106B2 true JP5509106B2 (ja) 2014-06-04

Family

ID=46790221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011001463A Active JP5509106B2 (ja) 2011-01-06 2011-01-06 テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム

Country Status (1)

Country Link
JP (1) JP5509106B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004304724A (ja) * 2003-04-01 2004-10-28 Sony Corp 画像処理装置とその方法、並びに符号化装置
KR101291196B1 (ko) * 2008-01-25 2013-07-31 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
JP4995789B2 (ja) * 2008-08-27 2012-08-08 日本電信電話株式会社 画面内予測符号化方法,画面内予測復号方法,これらの装置,およびそれらのプログラム並びにプログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP2012147053A (ja) 2012-08-02

Similar Documents

Publication Publication Date Title
US11546627B2 (en) Moving picture decoding method and moving picture encoding method
KR101351714B1 (ko) 비트 스트림 복호 방법
JP5421757B2 (ja) 画像符号化装置
WO2011064990A1 (ja) 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法
JP2013509063A (ja) 画像シーケンスのブロックを符号化する方法およびこのブロックを再構成する方法
JP2009111691A (ja) 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
JP4762938B2 (ja) データ埋め込み装置、データ抽出装置、データ埋め込み方法およびデータ抽出方法
KR100727988B1 (ko) 변환 영역에서의 dc 계수 예측 방법 및 장치
JP4197695B2 (ja) 動画像符号化方法、装置及びプログラム
JP5509106B2 (ja) テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム
JP5832263B2 (ja) 画像符号化装置及び画像符号化方法
JP5328629B2 (ja) エンコーダおよび画像変換装置
JP5514130B2 (ja) テクスチャ解析装置、イントラ予測モード判定装置及びイントラ予測装置、並びにこれらのプログラム
JP5358485B2 (ja) 画像符号化装置
KR100859073B1 (ko) 움직임 추정 방법
WO2010061515A1 (ja) 動画像符号化装置及び符号化方法、動画像復号化装置及び復号化方法
JP5542636B2 (ja) イントラ予測装置、符号化器、復号器、及びプログラム
US10051268B2 (en) Method for encoding, decoding video signal and device therefor
JP5194039B2 (ja) イントラ予測装置、符号化器、復号器、及びプログラム
JP5667269B2 (ja) 画像符号化装置、画像復号装置、画像符号化・復号装置、画像符号化・復号方法及び画像符号化・復号プログラム
JP2014222936A (ja) 画像復号装置、画像復号方法、画像符号化復号方法及び画像復号プログラム
JP2007116206A (ja) 画像評価方法、画像評価装置、画像符号化方法及び画像符号化装置
JP2009147535A (ja) 動画像符号化装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130625

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140324

R150 Certificate of patent or registration of utility model

Ref document number: 5509106

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250