JP4802297B2

JP4802297B2 - 画像処理装置、画像処理方法および画像処理プログラム

Info

Publication number: JP4802297B2
Application number: JP2010529528A
Authority: JP
Inventors: 珊珊于; 雅芳清水
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2008-09-17
Filing date: 2008-09-17
Publication date: 2011-10-26
Anticipated expiration: 2028-09-17
Also published as: WO2010032296A1; JPWO2010032296A1; US20110229041A1; US8422790B2

Description

本発明は、画像データを量子化する画像処理装置、画像処理方法および画像処理プログラムに関するものである。

近年、カメラ等によって撮影された画像中から、各種の物体（例えば、人物の顔、車等）を検出する物体検出の研究が行われている。物体検出の技術は、予め、検出対象となる物体の特徴を学習して学習データを作成し、作成した学習データと、画像データとを比較することで、画像中に検出対象となる物体が存在するか否かを判定する技術である。

また、画像データそのものの情報量は膨大であり、物体検出の技術では、画像中に検索対象となる物体が存在しているか否かを判定できればよいので、情報の量子化技術を利用して画像データを削減し、メモリ資源を節約する必要がある。

情報の量子化技術には、画像データを周波数変換（ウェーブレット＜Wavelet＞変換）し、変換結果となる変換係数の大小（または、隣り合う画素同士の画素値の差分の大小）から量子化処理を行う技術がある（例えば、非特許文献１参照）。かかる量子化処理では、変換係数と、静的に設定した量子化閾値とを比較することにより、画像データを３段階に量子化するので、物体検出に用いられる画像データ、学習データの記憶領域を削減することが可能となる。

なお、画像圧縮の技術分野ではあるが、画像の圧縮前と圧縮後との画素値の差分（歪み）に基づいて画像の周波数成分毎の量子化ステップを変化させることで、量子化後に復元した画像の劣化を防止するという技術が知られている（例えば、特許文献１参照）。

特開２００１−２９８３６６号公報 H.Schneiderman and T. Kanade, Object Detection Using the Statistics of Parts To appear in International Journal of Computer Vision,2002.

しかしながら、上述した従来の技術では、変換係数と、静的な量子化閾値とを比較して量子化処理を実行しているため、処理対象となる画像の多様性に対応しづらく、物体検出の精度が低下してしまうという問題があった。

すなわち、物体検出で処理対象とすべき画像は、明るい画像、暗い画像、逆光画像など、様々なタイプが考えられる。いずれのタイプの画像でも、精度よく物体検出を行う場合には、物体検出に必要な被写体の特徴を残したまま量子化することが望ましい。

なお、周知技術のように、画像の圧縮前と圧縮後との画素値の差分に基づいて画像の周波数成分毎の量子化ステップを変化することで、画像劣化を防止する技術も存在するが、物体検出では、画像圧縮を行わないので、かかる技術を適用することが出来ない。

この発明は、上述した従来技術による問題点を解消するためになされたものであり、処理対象となる画像の多様性に対応して物体検出の精度を向上させることができる画像処理装置、画像処理方法および画像処理プログラムを提供することを目的とする。

上述した課題を解決し、目的を達成するために、この画像処理装置は、入力画像を、複数の周波数成分に変換する変換手段と、前記変換手段により変換された前記入力画像の複数の周波数成分のうち、第１の周波数成分に対する第１の量子化閾値を、前記第１の周波数成分の統計値に基づいて算出する第１の量子化閾値算出手段と、前記第１の量子化閾値算出手段によって算出された第１の量子化閾値に基づいて、前記複数の周波数成分のうち、前記第１の周波数成分以外の第２の周波数成分に対する第２の量子化閾値を算出する第２の量子化閾値算出手段と、前記第１の周波数成分には前記第１の量子化閾値を用いて、前記第２の周波数成分には前記第２の量子化閾値を用いて、それぞれ量子化を行う量子化手段と、を有することを要件とする。

この画像処理装置によれば、画像の特徴を現している第１の周波数成分に対して算出した量子化閾値を、他の周波数成分の量子化閾値の算出に利用することで、他の周波数成分の量子化閾値の算出を簡略化でき、処理の高速化を図ることができる。

図１は、動的量子化を実行する画像処理装置の構成を示す機能ブロック図である。図２は、量子化閾値の算出方法の一例を説明するための図である。図３は、動的量子化と静的量子化の効果の違いを説明するための図である。図４は、本実施例にかかる画像処理装置の概要を説明するための図である。図５は、各周波数成分の相関性を説明するための図である。図６は、本実施例にかかる画像処理装置の構成を示す機能ブロック図である。図７は、顔学習データのデータ構造の一例を示す図である。図８は、非顔学習データのデータ構造の一例を示す図である。図９は、比較対象データのデータ構造の一例を示す図である。図１０は、顔検出処理部の処理の一例を説明するための図である。図１１は、比較結果テーブルのデータ構造の一例を示す図である。図１２は、検出範囲の移動の様子を説明するための図である。図１３は、本実施例にかかる画像処理装置の処理手順を示すフローチャートである。図１４は、量子化処理の処理手順を示すフローチャートである。図１５は、本実施例にかかる画像処理装置を構成するコンピュータのハードウェア構成を示す図である。

符号の説明

１０，１００画像処理装置
１１，２０周波数変換処理部
１２ａ，１２ｂ，１２ｃ，２１ヒストグラム算出部
１３ａ，１３ｂ，１３ｃ，２２ａ，２２ｂ，２２ｃ量子化閾値算出部
１４，２３量子化部
３０コンピュータ
３１入力装置
３２モニタ
３３ＲＡＭ
３３ａ，３９ａ各種データ
３４ＲＯＭ
３５通信制御装置
３６媒体読取装置
３７カメラ
３８ＣＰＵ
３８ａ画像処理プロセス
３９ＨＤＤ
３９ｂ画像処理プログラム
１１０ａ，１１０ｂ変換処理部
１２０ａ，１２０ｂ分散処理部
１３０記憶部
１３０ａ顔学習データ
１３０ｂ非顔学習データ
１３０ｃ比較対象データ
１４０顔検出処理部

以下に、本発明にかかる画像処理装置、画像処理方法および画像処理プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。

まず、本願発明の内容を説明する前に、本願発明を考案する前のステップとして発明者が考案した動的量子化処理について説明する。以下に説明する動的量子化処理は、周知技術ではない。

従来の量子化処理では、画像データを周波数変換した後に、変換係数と、静的に設定した量子化閾値（利用者が予め設定した閾値）とを比較することにより、画像データを３段階に量子化していた。一方、発明者の考案した動的量子化では、画像データを周波数変換した結果から得られる各周波数成分について、ヒストグラムをそれぞれ算出し、算出したヒストグラムに基づいて、量子化閾値を動的に算出する。

このように、動的量子化処理では、画像データの特徴にあわせて量子化閾値を動的に算出するので、画像データを最適に量子化することができる。そして、かかる動的処理を物体検出処理に適用すれば、メモリ資源を節約しつつ、物体検出の精度を向上させることが出来る。

次に、上述した動的量子化を実行する画像処理装置の構成について説明する。図１は、動的量子化を実行する画像処理装置１０の構成を示す機能ブロック図である。同図に示すように、この画像処理装置１０は、周波数変換処理部１１と、ヒストグラム算出部１２ａ〜１２ｃと、量子化閾値算出部１３ａ〜１３ｃと、量子化部１４とを有する。ここでは一例として、ヒストグラム算出部１２ａ〜１２ｃ、量子化閾値算出部１３ａ〜１３ｃのみを示すが、この画像処理装置１０は、その他にも、ヒストグラム算出部、量子化閾値算出部を有しているものとする。

このうち、周波数変換処理部１１は、画像データを取得し、取得した画像データに対して周波数変換処理（例えば、ウェーブレット変換）を実行する処理部である。画像データに対する周波数変換処理は、周知技術と同様である。周波数変換処理部１１は、周波数変換した画像データをヒストグラム算出部１２ａ〜１２ｃに出力する。

ヒストグラム算出部１２ａ〜１２ｃは、周波数変換処理部１１から周波数変換された画像データを取得した場合に、取得した画像データから、予め設定された周波数成分を抽出し、抽出した周波数成分に対応する変換係数と頻度とからなるヒストグラムを算出する処理部である。ここでは一例として、第１の周波数成分、第２の周波数成分、第３の周波数成分を用いて説明する。ただし、第１の周波数＞第２の周波数＞第３の周波数とする。

ヒストグラム算出部１２ａは、周波数変換処理部１１から周波数変換された画像データを取得した場合に、取得した画像データから、第１の周波数成分を抽出し、抽出した第１の周波数成分に対応する変換係数と頻度との関係を示すヒストグラムを算出する。

ヒストグラム算出部１２ｂは、周波数変換処理部１１から周波数変換された画像データを取得した場合に、取得した画像データから第２の周波数成分を抽出し、抽出した第２の周波数成分に対応する変換係数と頻度との関係を示すヒストグラムを算出する。

ヒストグラム算出部１２ｃは、周波数変換処理部１１から周波数変換された画像データを取得した場合に、取得した画像データから第３の周波数成分を抽出し、抽出した第３の周波数成分に対応する変換係数と頻度との関係を示すヒストグラムを算出する。

量子化閾値算出部１３ａは、ヒストグラム算出部１２ａが算出したヒストグラムに基づいて、量子化閾値を算出する処理部である。量子化閾値算出部１３ａは、算出した量子化閾値Ｑ１、Ｑ２を、量子化部１４に出力する。

図２は、量子化閾値の算出方法の一例を説明するための図である。例えば、量子化閾値算出部１３ａは、予め、規定値Ｃ１、Ｃ２を設定しておき、ヒストグラムに含まれる全てのデータ量Ａ（ヒストグラムの線と、横軸との間の領域に含まれるデータ量）を特定し、データ量Ｂ／データ量ＡがＣ１となるような量子化閾値Ｑ１を算出する。また、データ量Ｃ／データ量ＡがＣ２となるような量子化閾値Ｑ２を算出する。

ここで、データ量Ｂは、ヒストグラムの線、横軸、量子化閾値Ｑ１からの垂線に囲まれた領域のデータ量であり、データ量Ｃは、ヒストグラムの線、横軸、量子化閾値Ｑ２からの垂線に囲まれた領域のデータ量である。ヒストグラムの形状によって、量子化閾値Ｑ１、Ｑ２は左右に移動する。すなわち、各種の画像データに応じて、量子化閾値Ｑ１、Ｑ２は動的に算出されるので、処理対象となる画像データの多様性に対応することができる。

量子化閾値算出部１３ｂは、ヒストグラム算出部１２ｂが算出したヒストグラムに基づいて、量子化閾値を算出する処理部であり、算出した量子化閾値Ｑ１、Ｑ２を量子化部１４に出力する。量子化閾値算出部１３ｃは、ヒストグラム算出部１２ｃが算出したヒストグラムに基づいて、量子化閾値を算出する処理部であり、算出した量子化閾値Ｑ１、Ｑ２を量子化部１４に出力する。量子化閾値算出部１３ｂ、１３ｃの処理は、量子化閾値算出部１３ａと同様である。

量子化部１４は、量子化閾値算出部１３ａ〜１３ｃから取得する量子化閾値を基にして、画像データを量子化する処理部である。具体的に、量子化部１４は、量子化閾値算出部１３ａから取得する量子化閾値Ｑ１、Ｑ２と、第１の周波数成分における変換係数とを比較して、画像データを３段階に量子化する。例えば、量子化部１４は、画像データ中の領域（ブロック）において、量子化閾値Ｑ１未満となる変換係数の領域を「０」、量子化閾値Ｑ１以上、かつ、量子化閾値Ｑ２以下となる変換係数の領域を「１」、量子化閾値Ｑ２より大きい変換係数の領域を「２」に置き換える。

また、量子化部１４は、量子化閾値算出部１３ｂから取得する量子化閾値Ｑ１、Ｑ２と、第２の周波数成分における変換係数とを比較して、画像データを３段階に量子化する。例えば、量子化部１４は、画像データ中の領域において、量子化閾値Ｑ１未満となる変換係数の領域を「０」、量子化閾値Ｑ１以上、かつ、量子化閾値Ｑ２以下となる変換係数の領域を「１」、量子化閾値Ｑ２より大きい変換係数の領域を「２」に置き換える。

また、量子化部１４は、量子化閾値算出部１３ｃから取得する量子化閾値Ｑ１、Ｑ２と、第３の周波数成分における変換係数とを比較して、画像データを３段階に量子化する。例えば、量子化部１４は、画像データ中の領域において、量子化閾値Ｑ１未満となる変換係数の領域を「０」、量子化閾値Ｑ１以上、かつ、量子化閾値Ｑ２以下となる変換係数の領域を「１」、量子化閾値Ｑ２より大きい変換係数の領域を「２」に置き換える。

図３は、動的量子化と静的量子化の効果の違いを説明するための図である。図３の（ａ）、（ｂ）、（ｃ）は、明るさの異なる画像データを量子化した場合の動的量子化およびし静的量子化の違いを示している。ただし、画像の明るさは、（ａ）＜（ｂ）＜（ｃ）とする。

図３の（ｂ）では、動的量子化、静的量子化共に、良好に画像データを量子化することができる。しかし、図３の（ａ）では、画像が暗すぎるので、静的量子化を行うと、被写体（例えば、顔）の特徴が欠落し、適切に量子化することができない。一方、動的量子化を行うと、良好に画像データを量子化することができる。

また、図３の（ｃ）では、画像が明るすぎるので、静的量子化を行うと、被写体の以外の物体の特徴が混在してしまい、適切に量子化することができない。一方、動的量子化を行うと、良好に画像データを量子化することができる。

しかしながら、上述した動的量子化では、画像データの多様性に対応して画像データを適切に量子化できるが、周波数成分毎にヒストグラムを算出することにより各周波数成分の量子化閾値を算出するので、各周波数成分に対応するヒストグラムを全て算出する必要があり、量子化処理を高速化することができないという課題があった。

次に、本実施例にかかる画像処理装置の概要について説明する。図４は、本実施例にかかる画像処理装置１００の概要を説明するための図である。図４に示すように、画像処理装置１００は、周波数変換処理部２０と、ヒストグラム算出部２１と、量子化閾値算出部２２ａ〜２２ｃと、量子化部２３とを有する。

このうち、周波数変換処理部２０は、画像データを取得し、取得した画像データに対して周波数変換処理（例えば、ウェーブレット変換）を実行する処理部である。画像データに対する周波数変換処理は、周知技術と同様である。周波数変換処理部２０は、周波数変換した画像データをヒストグラム算出部２１に出力する。

ヒストグラム算出部２１は、周波数変換処理部２０から周波数変換された画像データを取得した場合に、取得した画像データから、予め設定された周波数成分を抽出し、抽出した周波数成分に対応する変換係数と頻度とからなるヒストグラムを算出する処理部である。ここでは一例として、第１の周波数成分、第２の周波数成分、第３の周波数成分を用いて説明する。ただし、第１の周波数＞第２の周波数＞第３の周波数とする。

例えば、ヒストグラム算出部２１は、第１の周波数成分を抽出し、抽出した周波数成分に対応する変換係数と頻度との関係を示すヒストグラムを算出する処理部である。ヒストグラム算出部２１は、算出したヒストグラムの情報を量子化閾値算出部２２ａに出力する。

量子化閾値算出部２２ａは、ヒストグラム算出部２１が算出したヒストグラムに基づいて、第１の周波数成分に対応する量子化閾値Ｑ１、Ｑ２を算出する処理部である。なお、量子化閾値算出部２２ａが量子化閾値Ｑ１、Ｑ２を算出する処理は、図１に示した量子化閾値算出部１３ａと同様である。量子化閾値算出部２２ａは、第１の周波数成分に対応する量子化閾値Ｑ１、Ｑ２を、量子化閾値算出部２２ｂ、２２ｃおよび量子化部２３に出力する。

量子化閾値算出部２２ｂは、量子化閾値算出部２２ａから、第１の周波数成分に対応する量子化閾値Ｑ１、Ｑ２を取得し、取得した量子化閾値に基づいて、第２の周波数成分に対応する量子化閾値Ｑ１、Ｑ２を算出する処理部である。量子化閾値算出部２２ｂは、算出した第２の周波数成分に対応する量子化閾値Ｑ１、Ｑ２を量子化部２３に出力する。

具体的に、量子化閾値算出部２２ｂが、第２の周波数成分に対応する量子化閾値Ｑ１、Ｑ２を算出する場合には、例えば、第１の周波数成分に対応する量子化閾値Ｑ１、Ｑ２にｎ（ｎは整数）を乗算することにより第２の周波数成分に対応する量子化閾値Ｑ１、Ｑ２を算出する。

量子化閾値算出部２２ｃは、量子化閾値算出部２２ａから、第１の周波数成分に対応する量子化閾値Ｑ１、Ｑ２を取得し、取得した量子化閾値に基づいて、第３の周波数成分に対応する量子化閾値Ｑ１、Ｑ２を算出する処理部である。量子化閾値算出部２２ｃは、算出した第３の周波数成分に対応する量子化閾値Ｑ１、Ｑ２を量子化部２３に出力する。

具体的に、量子化閾値算出部２２ｃが、第３の周波数成分に対応する量子化閾値Ｑ１、Ｑ２を算出する場合には、例えば、第１の周波数成分に対応する量子化閾値Ｑ１、Ｑ２にｍ（ｍはｎよりも大きい整数）を乗算することにより第３の周波数成分に対応する量子化閾値Ｑ１、Ｑ２を算出する。

量子化部２３は、量子化閾値算出部２２ａ〜２２ｃから取得する量子化閾値を基にして、画像データを量子化する処理部である。具体的な処理は、図１に示した量子化部１４と同様である。

このように、本実施例にかかる画像処理装置１００は、画像データを複数の周波数成分に変換した後、所定の周波数成分に対する量子化閾値を、所定の周波数成分のヒストグラム（統計値）に基づいて算出し、その他の周波数成分のヒストグラムを算出する処理を省略する。そして、画像処理装置１００は、算出した量子化閾値に基づいて、残りの周波数成分に対する量子化閾値を算出した後に、画像データを量子化するので、量子化処理を高速化することができる。

図５は、各周波数成分の相関性を説明するための図である。ここでは、第一の周波数成分として、元画像を周波数変換した結果の横方向の高周波成分を用いている。また、第二の周波数成分として、元画像を周波数変換した結果の縦方向の高周波成分を用いている。また、第三の周波数成分として、元画像を周波数変換した結果の斜め方向の周波数成分を用いている。図５に示すように、画像データの周波数成分は、それぞれ相関しているので、全ての周波数成分に対応するヒストグラムを算出しなくても、上述した手法によって、各周波数成分に対応する量子化閾値を精度よく算出することができる。

次に、本実施例にかかる画像処理装置の構成について説明する。図６は、本実施例にかかる画像処理装置１００の構成を示す機能ブロック図である。図６に示すように、この画像処理装置１００は、変換処理部１１０ａ，１１０ｂと、分析処理部１２０ａ，１２０ｂと、記憶部１３０と、顔検出処理部１４０とを有する。

変換処理部１１０ａは、顔画像集データおよび非顔画像集データを取得し、取得した顔画像集データおよび非顔画像集データに対して周波数変換処理（例えば、ウェーブレット変換）を実行する処理部である。変換処理部１１０ａは、図４に示した周波数変換部２０に対応する。

ここで、顔画像集データは、様々な人物の顔画像を集めた画像データであり、非顔画像集データは、顔画像以外の各種の画像を集めた画像データである。また、顔画像集データのサイズおよび非顔画像集データのサイズは統一されているものとする。ここで、顔画像集データに含まれる画像データは、顎から頭をほぼ含む上下幅、両耳をほぼ含む左右幅で、顔を全面に写した画像群で構成されている。もちろん、多様な顔を検出するための学習データであるので、真正面から顔を写したデータのほかに、斜め上や下や左や右を向いたデータや、帽子や眼鏡を掛けた顔のデータ、様々な年齢や性別の人のデータが含まれていても良い。非顔画像集データは、顔を含まない様々な画像データで構成されている。

変換処理部１１０ａは、入力装置、記憶装置（図示略）等から顔画像集データおよび非顔画像集データを取得する。変換処理部１１０ａは、周波数変換した顔画像集データおよび非顔画像集データを分析処理部１２０ａに出力する。以下の説明において、周波数変換した顔画像集データを変換顔画像集データと表記し、周波数変換した非顔画像集データを変換非顔画像集データと表記する。

変換処理部１１０ｂは、入力画像データを取得し、取得した入力画像データに対して周波数変換処理（例えば、ウェーブレット変換）を実行する処理部である。変換処理部１１０ｂは、図４に示した周波数変換部２０に対応する。なお、入力画像データは、物体検出対象となる画像データである。変換処理部１１０ｂは、入力装置、記憶装置（図示略）等から入力画像データを取得する。変換処理部１１０ｂは、周波数変換した入力画像データを分析処理部１２０ｂに出力する。

分析処理部１２０ａは、変換顔画像集データおよび変換非顔画像データを取得した場合に、変換顔画像集データを量子化することにより顔学習データを作成し、変換非顔画像集データを量子化することにより非顔学習データを作成する処理部である。

分析処理部１２０ａが、変換顔画像集データを量子化して顔学習データを作成する処理は、図４に示した、ヒストグラム算出部２１、量子化閾値算出部２２ａ〜２２ｃ、量子化部２３と同様である。分析処理部１２０ａは、作成した顔学習データを記憶部１３０に出力する。

また、分析処理部１２０ａが、変換非顔画像集データを量子化して非顔学習データを作成する処理は、図４に示した、ヒストグラム算出部２１、量子化閾値算出部２２ａ〜２２ｃ、量子化部２３と同様である。分析処理部１２０ａは、作成した非顔学習データを記憶部１３０に出力する。

分析処理部１２０ｂは、周波数変換された入力画像データを取得した場合に、取得した入力画像データを３段階に量子化する処理部である。なお，入力画像データとは，顔検出処理対象（入力されるフレームそのもの）から切り出した画像を意味し，これが比較対象データに相当する。顔検出対象のフレーム全体の中に，どのような大きさの顔が含まれているかはわからないので、比較対象データを複数種類の大きさに変化させて、また、フレーム内で切り出し位置をずらしながら切り出して、比較対象データの領域を設定することになる。分析処理部１２０ｂが入力画像データを取得し、比較対象データを作成する処理は、図４に示した、ヒストグラム算出部２１、量子化閾値算出部２２ａ〜２２ｃ、量子化部２３と同様である。

記憶部１３０は、分析処理部１２０ａから出力される顔学習データ１３０ａ、非顔学習データ１３０ｂ、分析処理部１２０ｂから出力される比較対象データ１３０ｃを記憶する記憶部である。

図７は、顔学習データ１３０ａのデータ構造の一例を示す図である。図７に示すように、この顔学習データ１３０ａは、位置情報と変換係数値（量子化後の値）とを対応付けて記憶している。なお、顔学習データ１３０ａのデータ構造は、図７に示したものに限らず、例えば、物体検出時に比較する変換係数の塊（例えば、８係数）毎に変換係数値を対応付けて記憶させても良い。

図８は、非顔学習データ１３０ｂのデータ構造の一例を示す図である。図８に示すように、この非顔学習データ１３０ｂは、位置情報と変換係数値（量子化後の値、図中では数値情報と表記）とを対応付けて記憶している。なお、非顔学習データ１３０ｂのデータ構造は、図８に示したものに限らず、例えば、物体検出時に比較する変換係数の塊（例えば、８係数）毎に変換係数値を対応付けて記憶させても良い。

図９は、比較対象データ１３０ｃのデータ構造の一例を示す図である。同図に示すように、この比較対象データ１３０ｃは、位置情報と変換係数値（量子化後の値、図中では数値情報と表記）とを対応付けて記憶している。なお、比較対象データ１３０ｃのデータ構造は、図９に示したものに限らず、例えば、物体検出時に比較する変換係数の塊（例えば、８変換係数）毎に変換係数値を対応付けて記憶させても良い。

顔検出処理部１４０は、記憶部１３０に記憶された顔学習データ１３０ａと、非顔学習データ１３０ｂと、比較対象データ１３０ｃとを比較して、入力画像データに顔画像が含まれているか否かを判定する処理部である。顔検出処理部１４０は、判定結果を上位の処理部（図示略）に出力する。

図１０は、顔検出処理部１４０の処理の一例を説明するための図である。具体的に、顔検出処理部１４０は、検出範囲を設定し、顔学習データ１３０ａ、非顔学習データ１３０ｂ、比較対象データ１３０ｃの同一位置の検出範囲に含まれる各変換係数値をそれぞれ比較する。そして、顔検出処理部１４０は、比較した結果、比較対象データの検出範囲が顔学習データに類似しているのか、非顔学習データに類似しているのかを判定し、判定結果を比較結果テーブルに登録する。かかる比較結果テーブルは、顔検出処理部１４０が、保持しているものとする。

図１１は、比較結果テーブルのデータ構造の一例を示す図である。同図に示すように、この比較結果テーブルは、検出範囲を識別する検出範囲識別情報と、比較結果とを対応付けて記憶している。顔検出処理部１４０は、顔学習データ１３０ａ、非顔学習データ１３０ｂ、比較対象データ１３０ｃの検出範囲を比較した結果、顔学習データ１３０ａに類似していると判定した場合には、比較結果に「マル」を登録し、非顔学習データ１３０ｂに類似していると判定した場合には、比較結果に「バツ」を登録する。

具体的に、図１０を用いて説明する。ここでは一例として、現在、各画像データ１３０ａ〜１３０ｃに設定されている検出範囲の検出範囲識別情報を「１００１」とする。顔検出処理部１４０が、比較対象データ１３０ｃの検出範囲の各変換係数値と、顔学習データ１３０ａの検出範囲の各変換係数値とを比較すると、８つヒットする。

一方、顔検出処理部１４０が、比較対象データ１３０ｃの検出範囲の各変換係数値と、非顔学習データ１３０ｂの各変換係数値とを比較すると、１つヒットする。この場合、顔検出処理部１４０は、顔学習データ１３０ａの方が、非顔学習データ１３０ｂよりもヒット数が多いので、検出範囲識別情報「１００１」に対応する比較結果を「マル」に設定する。逆に非顔学習データ１３０ｂのほうがヒット数が多い場合は「バツ」を設定する。同数の場合には，ここでは，どちらにも設定しないこととする。

顔検出処理部１４０は、図１２に示すように、検出範囲を移動させながら、比較結果テーブルの比較結果に「マル」または「バツ」を順次登録していく。図１２は、検出範囲の移動の様子を説明するための図である。なお、顔検出処理部１４０が、検出範囲内の各変換係数値を比較する際には、顔学習データ１３０ａ、非顔学習データ１３０ｂ、比較対象データ１３０ｃ上に配置される検出範囲の位置が統一されているものとする。

そして、顔検出処理部１４０は、比較対象データ１３０ｃ、顔学習データ１３０ａ、非顔学習データ１３０ａの比較が終了した後に、比較結果テーブルを参照し、「バツ」の数よりも「マル」の数の方が多い場合には、入力画像に顔画像が含まれていると判定する。一方、「バツ」の数よりも「マル」の数のほうが少ない場合には、入力画像に顔画像が含まれていないと判定する。なお、「バツ」の数と「マル」の数が等しい場合には、管理者の設定により、顔画像が含まれていると判定しても良いし、顔画像が含まれていないと判定しても良い。

なお、図１０に示す例では、顔検出処理部１４０は、８ブロック毎に変換係数値を比較する例を示しているが、これに限定されるものではない。例えば、ｎ（ｎは、自然数）変換係数毎に変換係数値を比較することも出来る。また、図１１に示すように、必ずしも検出範囲毎に比較結果を保存する必要はなく、例えば、「マル」の数および「バツ」の数を集計し、集計結果のみを比較結果テーブルに保存しても良い。

次に、本実施例にかかる画像処理装置１００の処理手順について説明する。図１３は、本実施例にかかる画像処理装置１００の処理手順を示すフローチャートである。図１３に示すように、画像処理装置１００は、入力画像データを取得し（ステップＳ１０１）、量子化処理を実行する（ステップＳ２０２）。

そして、画像処理装置１００は、比較対象データ１３０ｃと、顔学習データ１３０ａと、非顔学習データ１３０ｂとを比較して比較結果テーブルに「マル」または「バツ」を登録し（ステップＳ１０３）、「バツ」よりも「マル」の方が多いか否かを判定する（ステップＳ１０４）。

画像処理装置１００は、「バツ」よりも「マル」の方が多い場合には（ステップＳ１０５，Ｙｅｓ）、入力画像に顔画像が存在すると判定し（ステップＳ１０６）、判定結果を出力する（ステップＳ１０７）。一方、「バツ」よりも「マル」の方が少ない場合には（ステップＳ１０５，Ｎｏ）、入力画像に顔画像が存在しないと判定し（ステップＳ１０８）、ステップＳ１０７に移行する。

次に、図１３のステップＳ１０２で示した量子化処理の処理手順について説明する。図１４は、量子化処理の処理手順を示すフローチャートである。図１４に示すように、画像処理装置１００は、入力画像データを周波数変換し（ステップＳ２０１）、第１の周波数成分に対応する量子化閾値を算出する（ステップＳ２０２）。

画像処理装置１００は、第１の周波数成分に対応する量子化閾値に基づいて、残りの周波数成分に対応する量子化閾値を算出する（ステップＳ２０３）。

画像処理装置１００は、選択したブロックに対応する変換係数と量子化閾値Ｑ１、Ｑ２とを比較して、変換係数を量子化し（ステップＳ２０４）、全てのブロック（領域）を選択したか否かを判定する（ステップＳ２０５）。

画像処理装置１００は、全ての変換係数を選択した場合には（ステップＳ２０６，Ｙｅｓ）、量子化処理を終了する。一方、全ての変換係数を選択していない場合には（ステップＳ２０６，Ｎｏ）、未選択の変換係数を選択し（ステップＳ２０７）、ステップＳ２０４に移行する。
なお、前述のように、入力された顔検出対象のフレーム内にどのような大きさの顔が含まれているかはわからないので、比較対象データ（入力画像）を複数種類の大きさに変化させて、また、入力フレーム内で切り出し位置を走査するようにずらしながら切り出して、比較対象データの領域を設定することになる。
例えば、入力された顔検出対象のフレーム内から第一の大きさで比較対象データ領域を切り出しつつ、該比較対象データ領域でフレーム内を走査するように比較対象データ領域を設定する。そして第一の大きさの比較対象データによる走査が終了したら、比較対象データの大きさを第二の大きさに変更して、同様に、第二の大きさで比較対象データ領域を切り出しつつ、該比較対象データ領域でフレーム内を走査するように設定する。比較対象データを何段階の大きさにするかは、任意に設定して構わない。
そして、比較対象データの大きさおよび力された顔検出対象のフレーム内からの切り出し位置を変更するたびに、図１４に示す閾値の設定および量子化の処理を行う。

上述してきたように、本実施例にかかる画像処理装置１００は、画像データを複数の周波数成分に変換した後、所定の周波数成分に対する量子化閾値を、所定の周波数成分のヒストグラム（統計値）に基づいて算出し、その他の周波数成分のヒストグラムを算出する処理を省略する。そして、画像処理装置１００は、算出した量子化閾値に基づいて、残りの周波数成分に対する量子化閾値を算出した後に、画像データを量子化するので、量子化処理を高速化することができる。また、動的に量子化閾値を算出するので、物体検出にかかる処理の精度を向上させることができる。

なお、本実施例にかかる画像処理装置１００は、周波数変換した画像データの各周波数成分の中から、第１の周波数成分の量子化閾値を算出し、算出した量子化閾値からその他の周波数成分に対応する量子化閾値を算出していた。

ここで、画像処理装置１００は、第１の周波数成分として、検出対象となる顔の特徴を含んでいる成分を選択することが望ましい。例えば、顔において、縦方向の情報（例えば、鼻）より、横方向の情報（目、口）の方が顔情報の特徴を多く含んでいるので、画像処理装置１００は、横方向の情報を含んでいる画像データの変換係数（横方向の高周波成分）を選択する。
また、本実施例にて述べた上記の動的量子化方法を、公知の顔検出技術と組み合わせて実施することも有効である。たとえば、［非特許文献１］と組み合わせることが可能である。［非特許文献１］は、Wavelet変換係数を基準に、顔画像辞書、非顔画像辞書を用いるので、量子化処理のみを置き換えるかたちで、そのまま動作させることが可能である。上述の横方向の高周波成分を用いる方法も効果的である。
また、以上の実施例においては、辞書データ作成と検出処理を一体化した構成として示した。実施形態は、このような一体型に限られるものではなく、辞書データ作成までを行う部分と、検出処理を行う部分に分離した構成としてもよい。その場合、作成した辞書データを、検出処理を行う装置において保持する構成となる。

ところで、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

また、図６に示した画像処理装置１００の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。なお、本実施例で説明した各種の処理手順は、予め用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。

図１５は、本実施例にかかる画像処理装置１００を構成するコンピュータのハードウェア構成を示す図である。図１５に示すように、このコンピュータ（画像処理装置）３０は、入力装置３１、モニタ３２、ＲＡＭ（Random Access Memory）３３、ＲＯＭ（Read Only Memory）３４、ネットワークを介して他の装置と通信を行う通信制御装置３５、記憶媒体からデータを読み出す媒体読取装置３６、カメラ３７、ＣＰＵ（Central Processing Unit）３８、ＨＤＤ（Hard Disk Drive）３９をバス４０で接続している。

そして、ＨＤＤ３９には、上述した画像処理装置１００の機能と同様の機能を発揮する画像処理プログラム３９ｂが記憶されている。ＣＰＵ３８が、画像処理プログラム３９ｂを読み出して実行することにより、画像処理プロセス３８ａが起動される。

ここで、画像処理プロセス３８ａは、図６の変換処理部１１０ａ，１１０ｂ、分析処理部１２０ａ，１２０ｂ、顔検出処理部１４０に対応する。また、ＨＤＤ３９は、画像処理装置１００の記憶部１３０に記憶される情報に対応する各種データ３９ａを記憶する。ＣＰＵ３８は、ＨＤＤ３９に格納された各種データ３９ａを読み出して、ＲＡＭ３３に格納し、ＲＡＭ３３に格納された各種データ３３ａを利用して、画像データの量子化、物体検出を実行する。

ところで、図１５に示した画像処理プログラム３９ｂは、必ずしも最初からＨＤＤ３９に記憶させておく必要はない。たとえば、コンピュータに挿入されるフレキシブルディスク（ＦＤ）、ＣＤ−ＲＯＭ、ＤＶＤディスク、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」、または、コンピュータの内外に備えられるハードディスクドライブ（ＨＤＤ）などの「固定用の物理媒体」、さらには、公衆回線、インターネット、ＬＡＮ、ＷＡＮなどを介してコンピュータに接続される「他のコンピュータ（またはサーバ）」などに画像処理プログラム３９ｂを記憶しておき、コンピュータがこれらから画像処理プログラム３９ｂを読み出して実行するようにしてもよい。

Claims

入力画像を複数の周波数成分に変換する変換手段と、
前記変換手段により変換された前記入力画像の複数の周波数成分のうち、第１の周波数成分に対する第１の量子化閾値を、前記第１の周波数成分の統計値に基づいて算出する第１の量子化閾値算出手段と、
前記第１の量子化閾値算出手段によって算出された第１の量子化閾値に基づいて、前記複数の周波数成分のうち、前記第１の周波数成分以外の第２の周波数成分に対する第２の量子化閾値を算出する第２の量子化閾値算出手段と、
前記第１の周波数成分には前記第１の量子化閾値を用いて、前記第２の周波数成分には前記第２の量子化閾値を用いて、それぞれ量子化を行う量子化手段と、
を有することを特徴とする画像処理装置。
前記変換手段は、被写体の検出対象となる検出対象画像と、当該検出対象画像に前記被写体が含まれているか否かを判定する場合に利用する辞書画像とを複数の周波数成分に変換し、前記第１の量子化閾値算出手段は、前記検出対象画像の第１の量子化閾値と、前記辞書画像の第１の量子化閾値とをそれぞれ算出し、前記第２の量子化閾値算出手段は、前記検出対象画像の第２の量子化閾値と、前記辞書画像の第２の量子化閾値とをそれぞれ算出し、前記量子化手段は、前記検出対象画像の第１の量子化閾値および第２の量子化閾値を基にして、前記検出対象画像を量子化し、前記辞書画像の第１の量子化閾値および第２の量子化閾値を基にして、前記辞書画像を量子化し、
前記量子化手段によって量子化された検出対象画像と、量子化された辞書画像とを比較することにより、前記検出対象画像に被写体が含まれているか否かを判定する判定手段を更に有することを特徴とする請求項１に記載の画像処理装置。
前記第１の周波数成分は、前記入力画像の横方向の高周波成分であることを特徴とする請求項１または２に記載の画像処理装置。
画像処理装置が、
入力画像を、複数の周波数成分に変換する変換ステップと、
前記変換ステップにより変換された前記入力画像の複数の周波数成分のうち、第１の周波数成分に対する第１の量子化閾値を、前記第１の周波数成分の統計値に基づいて算出する第１の量子化閾値算出ステップと、
前記第１の量子化閾値算出ステップによって算出された第１の量子化閾値に基づいて、前記複数の周波数成分のうち、前記第１の周波数成分以外の第２の周波数成分に対する第２の量子化閾値を算出する第２の量子化閾値算出ステップと、
前記第１の周波数成分には前記第１の量子化閾値を用いて、前記第２の周波数成分には前記第２の量子化閾値を用いて、それぞれ量子化を行う量子化ステップと、
を含んでいることを特徴とする画像処理方法。
前記変換ステップは、被写体の検出対象となる検出対象画像と、当該検出対象画像に前記被写体が含まれているか否かを判定する場合に利用する辞書画像とを複数の周波数成分に変換し、前記第１の量子化閾値算出ステップは、前記検出対象画像の第１の量子化閾値と、前記辞書画像の第１の量子化閾値とをそれぞれ算出し、前記第２の量子化閾値算出ステップは、前記検出対象画像の第２の量子化閾値と、前記辞書画像の第２の量子化閾値とをそれぞれ算出し、前記量子化ステップは、前記検出対象画像の第１の量子化閾値および第２の量子化閾値を基にして、前記検出対象画像を量子化し、前記辞書画像の第１の量子化閾値および第２の量子化閾値を基にして、前記辞書画像を量子化し、
前記画像処理装置は、
前記量子化ステップによって量子化された検出対象画像と、量子化された辞書画像とを比較することにより、前記検出対象画像に被写体が含まれているか否かを判定する判定ステップを更に含んでいることを特徴とする請求項４に記載の画像処理方法。
コンピュータに、
入力画像を、複数の周波数成分に変換する変換手順と、
前記変換ステップにより変換された前記入力画像の複数の周波数成分のうち、第１の周波数成分に対する第１の量子化閾値を、前記第１の周波数成分の統計値に基づいて算出する第１の量子化閾値算出手順と、
前記第１の量子化閾値算出手順によって算出された第１の量子化閾値に基づいて、前記複数の周波数成分のうち、前記第１の周波数成分以外の第２の周波数成分に対する第２の量子化閾値を算出する第２の量子化閾値算出手順と、
前記第１の周波数成分には前記第１の量子化閾値を用いて、前記第２の周波数成分には前記第２の量子化閾値を用いて、それぞれ量子化を行う量子化手順と、
を実行させることを特徴とする画像処理プログラム。