JP5413267B2 - 物体検出装置および物体検出プログラム - Google Patents

物体検出装置および物体検出プログラム Download PDF

Info

Publication number
JP5413267B2
JP5413267B2 JP2010064532A JP2010064532A JP5413267B2 JP 5413267 B2 JP5413267 B2 JP 5413267B2 JP 2010064532 A JP2010064532 A JP 2010064532A JP 2010064532 A JP2010064532 A JP 2010064532A JP 5413267 B2 JP5413267 B2 JP 5413267B2
Authority
JP
Japan
Prior art keywords
quantization
image
event
object detection
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010064532A
Other languages
English (en)
Other versions
JP2011198078A (ja
Inventor
珊珊 于
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010064532A priority Critical patent/JP5413267B2/ja
Publication of JP2011198078A publication Critical patent/JP2011198078A/ja
Application granted granted Critical
Publication of JP5413267B2 publication Critical patent/JP5413267B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、物体検出装置等に関する。
カメラ等が撮影した画像データから、各種の被写体を検出する被写体検出の技術が提案されている。各種の被写体は、人物の顔や車両等に対応する。この被写体検出の技術では、被写体の特徴を学習させた学習データを作成し、作成した学習データと画像データとを比較することで、画像中に検出対象となる被写体が存在するか否かを判定する。
被写体検出の技術では、検出対象となる被写体が画像中に存在するか否かを判定出来ればよいので、画像データをそのまま利用する必要はない。このため、画像データを量子化し、画像データの情報量を削減することが行われている。
画像データの量子化の技術には、静的量子化と動的量子化とがある。静的量子化は、画像データをウェーブレット(Wavelet)変換した後に、予め定めた閾値と、変換後の画像データとを比較して、画像データを量子化する技術である。動的量子化は、画像データをウェーブレット変換した後に、変換後の画像データを基にして閾値を調整し、調整後の閾値と変換後の画像データとを比較して、画像データを量子化する技術である。
図11は、動的量子化および静的量子化の特性の違いを説明するための図である。図11の画像10a〜10cはそれぞれ同一の被写体を含む画像である。なお、各画像の明るさの関係を「画像10aの明るさ<画像10bの明るさ<画像10cの明るさ」とする。画像11a〜11cは、画像10a〜10cをそれぞれウェーブレット変換した後の画像である。
また、図11の1a、1b、1cは、それぞれ画像11a〜11cの周波数特性を示すものである。また、各Q1、Q2は、閾値を示すものであり、この閾値と周波数特性とを基にして、量子化が行われる。すでに説明したように、静的量子化では、予め設定された閾値Q1、Q2を用いて量子化を行う。動的量子化では、閾値Q1、Q2を調整した後に、調整後の閾値Q1、Q2を用いて量子化を行う。例えば、静的量子化および動的量子化では、閾値Q1未満を「0」、閾値Q1以上、Q2未満を「1」、閾値Q2以上を「2」に量子化する。
図11の(b)に示すように、画像10bに対して静的量子化を行うと画像12bとなり、動的量子化を行うと画像13bとなる。画像12bおよび画像13bを参照すると、静的量子化、動的量子化ともに良好に画像データを量子化することができる。
図11の(a)に示すように、画像10aに対して静的量子化を行うと画像12aとなり、動的量子化を行うと画像13aとなる。画像10aは、画像が暗すぎるので、静的量子化を行うと、被写体の特徴が欠落してしまう。一方、動的量子化を行うと、良好に画像データを量子化することができる。
図11の(c)に示すように、画像10cに対して静的量子化を行うと画像12cとなり、動的量子化を行うと画像13cとなる。画像10cは、画像が明るすぎるので、静的量子化を行うと、被写体にノイズが含まれてしまう。一方、動的量子化を行うと、良好に画像データを量子化することができる。
特開平11−196417号公報 特開2004−23288号公報 特開2007−189704号公報
静的量子化により画像データの量子化を行うと、閾値が予め決まっているため、量子化に要する時間を短くできる。しかし、静的量子化では、画像データの明るさ等の影響により、画像データに対する量子化を適切に実行することができない場合がある。このため、適切に量子化出来ていない画像データをもとに被写体検出を行うと、被写体の誤検出を招いてしまう。
これに対して、動的量子化により画像データの量子化を行うと、画像データの特性に合わせて閾値を調整するので、画像データの明るさ等の影響を受けることなく、画像データに対する量子化を適切に実行することができる。このため、被写体検出の検出率を高めることができる。しかし、動的量子化では、画像データ毎に閾値を調整するため、処理が重くなり、量子化に要する時間が長くなってしまう。量子化に要する時間が長くなると、画像データから被写体を検出するまでの時間も長くなってしまう。
開示の技術は、上記に鑑みてなされたものであって、動的量子化の検出率を保ちつつ、高速に被写体を検出することができる物体検出装置および物体検出プログラムを提供することを目的とする。
本願の開示する物体検出装置は、画像領域内の複数の事象のうちいずれかの事象に対して、所定の閾値を用いて量子化を行う静的量子化を実行することで、前記画像領域に所定の物体が存在する可能性があるか否かを判定する第1量子化処理部と、所定の物体が存在する可能性がある画像領域に対して、当該画像領域の画像の特徴に基づいて調整した閾値を用いて量子化を行う動的量子化を実行し、前記画像領域に所定の物体が存在するか否かを判定する第2量子化処理部とを備えたことを要件とする。
本願の開示する物体検出装置の一つの態様によれば、動的量子化の検出率を保ちつつ、高速に被写体を検出することができるという効果を奏する。
図1は、本実施例1にかかる物体検出装置の構成を示す図である。 図2は、本実施例2にかかる物体検出装置の構成を示す図である。 図3は、事象の一例を示す図である。 図4は、画像分割部の処理を説明するための図である。 図5は、学習データテーブルのデータ構造を示す図である。 図6は、静的量子化部の処理を説明するための図である。 図7は、動的量子化部による閾値調整を説明するための図である。 図8は、学習データ生成部の処理手順を示すフローチャートである。 図9は、物体検出装置の処理手順を示すフローチャートである。 図10は、物体検出プログラムを実行するコンピュータの一例を示す図である。 図11は、動的量子化および静的量子化の特性の違いを説明するための図である。
以下に、本願の開示する物体検出装置および物体検出プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
図1は、本実施例1にかかる物体検出装置100の構成を示す図である。図1に示すように、この物体検出装置100は、第1量子化部110と第2量子化部120とを有する。
第1量子化部110は、画像領域内の複数の事象のうちいずれかの事象に対して、所定の閾値を用いて量子化を行う静的量子化を実行することで、画像領域に所定の物体が存在する可能性があるか否かを判定する。
第2量子化部120は、所定の物体が存在する可能性がある画像領域に対して、この画像領域の画像の特徴に基づいて調整した閾値を用いて量子化を行う動的量子化を実行し、画像領域に所定の物体が存在するか否かを判定する。
本実施例1にかかる物体検出装置100では、画像領域に所定の物体が存在するか否かを判定するために、この画像領域に対して動的量子化を実行することで、物体の検出率を高めている。しかし、画像領域が複数ある場合には、画像領域に所定の物体が含まれている、いないに関わらず動的量子化をすべての画像領域に対して実行すると時間を要してしまう。このため、物体検出装置100は、画像領域に含まれる事象のうち、いずれかの事象に対して静的量子化を実行することで、画像領域に所定の物体が含まれている可能性があるか否かを判定する。そして、物体検出装置100は、所定の物体が含まれている可能性がある画像領域にのみ、動的量子化を実行する。したがって、本実施例1にかかる物体検出装置100によれば、動的量子化の検出率を保ちつつ、高速に所定の物体を検出することができる。
次に、本実施例2にかかる物体検出装置の構成について説明する。図2は、本実施例2にかかる物体検出装置200の構成を示す図である。図2に示すように、物体検出装置200は、デジタルカメラ等の撮影装置50に接続される。また、図2に示すように、物体検出装置200は、入力部201、学習データ生成部202、記憶部203、画像縮小部204、周波数変換部205、画像分割部206を有する。また、物体検出装置200は、静的量子化部207、動的量子化部208、物体検出部209、補正処理部210、出力部211を有する。なお、本実施例2にかかる物体検出装置200は、一例として人物の顔を検出対象とするが、検出対象を車等としてもよい。
入力部201は、撮影装置50から画像データの入力を受け付ける処理部である。入力部201は、画像データを学習データ生成部202、画像縮小部204、補正処理部210に出力する。
学習データ生成部202は、例えば、人物の顔が含まれる画像データや人物の顔が含まれない画像データを学習データとして取得し、取得した学習データを用いて、学習データテーブルを生成する処理部である。この学習データテーブルは、事象(local operator)と重要度と係数値とを対応付けたテーブルである。
ここで、事象は、画像データを複数の詳細パターンに分割したものである。図3は、事象の一例を示す図である。図3に示す例では、学習データは、事象1〜事象12までの12の領域に分割されている。なお、必ずしも画像データを事象1〜事象12に分割する必要はなく、事象をどのように分割してもよい。
重要度は、物体検出においてどの事象を選択することが効果的かを判定する尺度となる値である。重要度が大きい事象ほど、物体検出において選択することが効果的である。重要度の算出方法に関しては後述する。
係数値は、学習データが量子化されることで得られる事象の値である。例えば、学習データが量子化されると、学習データの各画素の値は「1」または「0」となる。上記事象に含まれる画素が8個の場合には、この事象に対応する係数値は「0〜2(256)」のうちいずれかの値となる。仮に、事象に含まれる画素が1個の場合には、係数値は「1」または「0」となる。本実施例2では説明の便宜上、事象の係数値を「1」または「0」とする。学習データ生成部202は、学習データテーブルを、記憶部203に出力する。
記憶部203は、学習データテーブル203aを記憶する記憶部である。画像縮小部204は、画像データを縮小する処理部である。画像縮小部204は、予め定められた縮小回数と縮小率にしたがって画像データを縮小する。画像縮小部204は、画像データを縮小した縮小画像データを周波数変換部205に出力する。
周波数変換部205は、縮小画像データに対してウェーブレット変換を実行する処理部である。以下の説明において、縮小画像データに対してウェーブレット変換を実行することで得られるデータをウェーブレット変換画像と表記する。周波数変換部205は、ウェーブレット変換画像を、画像分割部206に出力する。
画像分割部206は、ウェーブレット変換画像を複数の部分領域に分割する処理部である。部分領域の大きさは予め設定されてある。画像分割部206は、複数の部分領域に分割したウェーブレット変換画像を静的量子化部207に出力する。図4は、画像分割部206の処理を説明するための図である。図4では、大きさの異なるウェーブレット変換画像20a、20b、20cを示している。画像分割部206は、画像の大きさに関わらず部分領域の大きさを同じにする。
静的量子化部207は、部分領域の複数の事象のうち、重要度が閾値以上となる事象に対して静的量子化を実行し、部分領域に人物の顔が存在する可能性があるか否かを判定する処理部である。静的量子化部207は、学習データテーブル203aを基にして、各事象の重要度を取得し、重要度が閾値以上となる事象を判定する。静的量子化部207は、部分領域に人物の顔が含まれている可能性があると判定した場合には、この部分領域のデータを動的量子化部208に出力する。静的量子化部207の詳細な説明は後述する。
動的量子化部208は、部分領域の各事象に対して動的量子化を実行することで、事象毎の係数値を算出する処理部である。動的量子化部208は、部分領域のデータと、事象毎の係数値を物体検出部209に出力する。動的量子化部208の詳細な説明は後述する。
物体検出部209は、動的量子化部208から取得した事象毎の係数値と、学習データテーブル203aとを比較して、部分領域に人物の顔が存在するか否かを判定する処理部である。物体検出部209は、部分領域に人物の顔が存在すると判定した場合には、部分領域のデータを補正処理部210に出力する。
補正処理部210は、部分領域のデータを取得した場合に、部分画像に対応する画像データの領域を補正する。部分領域には人物の顔が含まれている。このため、補正処理部210は、画像データの該当領域のエッジを際立たせる補正や、顔の肌を美しく見せるための肌色補正を実行する。または、補正処理部210は、該当領域の顔に対して焦点が合うように、撮影装置50の焦点距離を調整してもよい。補正処理部210は、補正した画像データを出力部211に出力する。
出力部211は、ディスプレイやモニタ等の表示装置に画像データを出力する処理部である。または、出力部211は、画像データを用いて各種の処理を実行する外部装置に、画像データを出力してもよい。
次に、図2に示した学習データテーブル203aのデータ構造の一例について説明する。図5は、学習データテーブル203aのデータ構造を示す図である。図5に示すように、この学習データテーブル203aは、事象と対応付けて、顔学習データ、非顔学習データ、学習辞書、重要度、係数値を記憶する。
このうち、顔学習データは、顔を含む複数の学習データにおいて、各事象に対応する係数値が「1」となる割合aと、係数値が「0」となる割合bとを示すものである。例えば、事象1に対応する割合aは「0.7」であり、事象1に対応する割合bは「0.3」である。
非顔学習データは、顔を含まない複数の学習データにおいて、各事象に対応する係数値が「1」となる割合cと、係数値が「0」となる割合dとを示すものである。例えば、事象1に対応する割合cは「0.5」であり、事象1に対応する割合dは「0.5」である。
ここで、顔学習データおよび非顔学習データの生成過程の一例について説明する。学習データ生成部202は、同一サイズの複数の学習データを取得し、取得した各学習データをそれぞれウェーブレット変換する。学習データ生成部202は、ウェーブレット変換した後に得られるウェーブレット変換画像と所定の閾値とを比較して、事象毎の係数値を決定する。ここでは一例として、事象の係数値を「1」または「0」とする。事象毎の係数値は、学習データ毎に決定される。学習データ生成部202は、各学習データから決定した係数値を事象毎に統計し、係数値が「1」となる割合、係数値が「0」となる割合を算出することで、顔学習データおよび非顔学習データを生成する。
続いて、学習データテーブル203aの学習辞書について説明する。学習辞書は、各事象に対応する係数値が「1」である確からしさを示す演算値eと、係数値が「0」である確からしさを示す演算値fとを示すものである。具体的に、学習データ生成部202は、下記の式(1)により演算値eを算出する。また、学習データ生成部202は、下記の式(2)に演算値fを算出する。
Figure 0005413267
Figure 0005413267
学習データテーブル203aの係数値について説明する。学習データ生成部202は、例えば、顔学習データの割合aと割合bとを比較して係数値を比較して、事象毎の係数値を判定する。例えば、事象1に対応する割合aと割合bとを比較すると、割合aの方が大きい。この場合には、学習データ生成部202は、事象1の係数値を「1」とする。また、事象2に対応する割合aと割合bとを比較すると、割合bの方が大きい。この場合には、学習データ生成部202は、事象2の係数値を「0」とする。
続いて、学習データテーブル203aの重要度について説明する。学習データ生成部202は、下記の式(3)を用いて事象毎の重要度を算出する。事象が顔の検出に効果的なものであれば、重要度は大きくなる傾向がある。これに対して、事象が顔の検出に効果的なものでなければ、重要度は小さくなる傾向がある。
Figure 0005413267
式(3)の重みAおよび重みBは、学習データテーブル203aの学習辞書と、顔を含む画像データと、顔を含まない画像データとを基にして算出される値である。ここでは、「顔を含む画像データ」No1〜5、「顔を含まない画像データ」No6〜10を用いて重みAおよび重みBを算出する場合について説明する。また、説明の便宜上、事象1の重要度を算出する場合について説明する。その他の事象の重要度を算出する手法は、事象1の重要度を算出する場合と同様である。
まず、学習データ生成部202は、画像データNo1を事象1〜12に分割し、各事象の係数値を決定する。係数値の求め方は、上記の方法と同様である。学習データ生成部202は、事象1の係数値が「0」の場合には、学習辞書の演算値fの値を取得し、事象1の係数値が「1」の場合には、学習辞書の演算値eの値を取得する。例えば、事象1の係数値が「1」の場合には、演算値e「0.146」を取得し、係数値が「0」の場合には、演算値f「−0.222」を取得する。
学習データ生成部202は、取得した演算値の符号が「正」の場合には、取得した演算値を重みAに加算する。重みAの初期値を0とする。一方、学習データ生成部202は、取得した演算値の符号が「負」の場合には、取得した演算値の絶対値を重みBに加算する。重みBの初期値を0とする。学習データ生成部202は、画像データNo2〜No5に対して、画像データNo1と同様にして、重みAまたは重みBに演算値を加算していく。
学習データ生成部202は、画像データNo6を事象1〜12に分割し、各事象の係数値を決定する。係数値の求め方は、上記の方法と同様である。学習データ生成部202は、事象1の係数値が「0」の場合には、学習辞書の演算値fの値を取得し、事象1の係数値が「1」の場合には、学習辞書の演算値eの値を取得する。
学習データ生成部202は、取得した演算値の符号が「正」の場合には、取得した演算値を重みBに加算する。一方、学習データ生成部202は、取得した演算値の符号が「負」の場合には、取得した演算値の絶対値を重みAに加算する。学習データ生成部202は、画像データNo7〜No10に対して、画像データNo6と同様にして、重みAまたは重みBに演算値を加算していく。
なお、学習データ生成部202は、どのような手法によって各事象の重要度を求めてもかまわない。例えば、学習データ生成部202は、各事象の係数値の分散値を求め、かかる分散値を重要度としてもよい。
次に、静的量子化部207の処理を具体的に説明する。図6は、静的量子化部207の処理を説明するための図である。ここでは、部分領域30cが事象1〜12を含む場合について説明する。まず、静的量子化部207は、学習データテーブル203aの重要度を参照し、所定の閾値以上となる重要度に対応付けられた事象を判定する。ここでは一例として、事象4、6、8の重要度を所定の閾値以上とする。例えば、部分領域30cのほぼいっぱいの大きさに人の顔がある場合、事象4や6の部分には目が存在することが多く、また事象8には、鼻または口が存在することが多い。従って、部分領域30cが人の顔画像であれば、事象4、6、8には周波数特性が現れている可能性が高い。
静的量子化部207は、事象4、6、8に対応する周波数特性と閾値Q1、Q2とを比較して、事象4、6、8の係数値と判定する。例えば、静的量子化部207は、事象に対応する周波数特性が閾値Q1未満、閾値Q2以上の場合には、係数値を「1」と判定する。これに対して、静的量子化部207は、事象に対応する周波数特性が閾値Q1以上、閾値Q2未満の場合には、係数値を「0」と判定する。
静的量子化部207は、部分領域から求めた事象4、6、8の係数値と、学習データテーブル203aに記憶された事象4、6、8の係数値とを比較する。例えば、静的量子化部207は、部分領域から求めた事象の係数値のうち、学習データテーブル203aの事象の係数値と一つでも一致すれば、部分領域30cに人物の顔が存在する可能性があると判定する。例えば、部分領域から求めた事象4の係数値と、学習データテーブル203aの事象4の係数値が一致する場合には、部分領域30cに人物の顔が存在する可能性があると判定する。
次に、動的量子化部208の処理を具体的に説明する。まず、動的量子化部208は、部分領域の周波数特性から閾値R1、R2を調整する。図7は、動的量子化部208による閾値調整を説明するための図である。図7の横軸は変換係数であり周波数に対応する。図7の縦軸は、該当する変換係数の度数である。1Bは、曲線1Aおよび横軸に囲まれた面積を示す。2Bは、曲線1Aと、横軸と、閾値R1を通る垂線とに囲まれた面積を示す。3Bは、曲線1Aと、横軸と、閾値R2を通る垂線とに囲まれた面積を示す。
動的量子化部208は、式(4)、式(5)の関係を満たすように、閾値R1、R2を調整する。
C1=2B/1B・・・(4)
C2=3B/1B・・・(5)
式(4)のC1は、所定の定数であり、例えば0.1となる。また、式(5)のC2は所定の定数であり、例えば0.1となる。
閾値R1、R2を調整した後に、動的量子化部208は、部分領域30cの事象1〜12に対応する周波数特性と、閾値R1、R2とを比較して事象1〜12の係数値を判定する。例えば、動的量子化部208は、事象に対応する周波数特性が閾値R1未満、閾値R2以上の場合には、係数値を「1」と判定する。これに対して、動的量子化部208は、事象に対応する周波数特性が閾値R1以上、閾値R2未満の場合には、係数値を「0」と判定する。動的量子化部208は、各事象1〜12と係数値とをそれぞれ対応付けて物体検出装置に出力する。また、動的量子化部208は、部分領域のデータを物体検出部209に出力する。
なお、動的量子化部208は、事象1〜12の係数値を判定してもよいし、静的量子化部207により係数値が判定された事象を除く残りの事象に対して、係数値の判定を行ってもよい。
物体検出部209は、事象1〜12の係数値と、学習データテーブル203aの各事象の係数値とを比較する。例えば、物体検出部209は、事象1〜12のうち、所定数の事象の係数値が、学習データテーブル203aの事象の係数値と一致する場合に、部分領域に人物の顔が存在すると判定する。例えば、静的量子化部207による処理の結果として、人の顔画像であると判断された部分領域30cであっても、たまたま事象4、6、8のいずれかに周波数特性を有する顔以外の画像である可能性が残る。動的量子化部208による処理を行うことで、静的量子化部207による処理の結果として、人の顔画像であると判断されたデータから、顔以外の画像を区別することができる。
ところで、図2に示した、上記処理部201、202、204〜211は、例えば、ASIC(Application Specific Integrated Circuit)や、FPGA(Field Programmable Gate Array)などの集積装置に対応する。または、上記処理部201、202、204〜211は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等の電子回路に対応する。
また、図2に示した記憶部203は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子、またはハードディスク、光ディスクなどの記憶装置に対応する。
次に、図2に示した学習データ生成部202の処理について説明する。図8は、学習データ生成部202の処理手順を示すフローチャートである。図8の処理は、例えば、学習データ生成部202が、入力部201から複数の学習データを取得したことを契機にして実行される。
図8に示すように、学習データ生成部202は、複数の学習データを取得し(ステップS101)、学習データテーブル203aを作成する(ステップS102)。ステップS102において、学習データ生成部202は、顔学習データ、非顔学習データ、学習辞書を生成する。そして、学習データ生成部202は、重要度を算出する(ステップS103)。
次に、図2に示した物体検出装置200の処理手順について説明する。図9は、物体検出装置200の処理手順を示すフローチャートである。例えば図9の処理は、学習データテーブル203aが作成された後に、物体検出装置200が、撮影装置50から画像データを取得したことを契機にして実行される。
図9に示すように、物体検出装置200は画像データを取得し(ステップS201)、画像縮小部204が画像縮小処理を行う(ステップS202)。周波数変換部205は、ウェーブレット変換を実行し(ステップS203)、画像分割部206がウェーブレット変換画像を分割する(ステップS204)。
静的量子化部207は、重要度の高い事象に対して静的量子化処理を実行し(ステップS205)、静的量子化の結果に基づいて事象の係数値を判定する(ステップS206)。静的量子化部207は、部分領域に顔が存在する可能性がないと判定した場合には(ステップS207,No)、ステップS213に移行する。
一方、静的量子化部207が、部分領域に顔が存在する可能性があると判定した場合には(ステップS207,Yes)、動的量子化部208が閾値を算出する(ステップS208)。動的量子化部208は、部分領域に対して動的量子化処理を実行し(ステップS209)、動的量子化の結果に基づいて事象の係数値を判定する(ステップS210)。
物体検出部209は、部分領域の各事象の係数値を基にして、物体検出処理を実行する(ステップS211)。そして、物体検出装置200は、未選択の部分領域が存在する場合には(ステップS212,Yes)、ステップS205に移行する。一方、物体検出装置200は、未選択の部分領域が存在しない場合には(ステップS212,No)、未選択の縮小画像が存在するか否かを判定する(ステップS213)。物体検出装置200は、未選択の縮小画像が存在する場合には(ステップS213,Yes)、ステップS202に移行する。一方、物体検出装置200は、未選択の縮小画像が存在しない場合には(ステップS213,No)、処理を終了する。なお、図9の処理が終了した後に、補正処理部210による補正処理が実行される。
次に、本実施例2にかかる物体検出装置200の効果について説明する。物体検出装置200は、部分領域に含まれる事象のうち、いずれかの事象に対して静的量子化を実行することで、部分領域に顔が含まれている可能性があるか否かを判定する。そして、物体検出装置200は、顔が含まれている可能性がある部分領域にのみ、動的量子化を実行する。このため、本実施例2にかかる物体検出装置200によれば、動的量子化の検出率を保ちつつ、高速に所定の物体を検出することができる。
また、静的量子化部207は、重要度が閾値以上となる事象に対してのみ静的量子化を実行し、部分領域内に顔が含まれている可能性があるかを判定する。このため、必要最小限の事象を用いて、顔の存在可否の可能性を判定でき、検出速度を向上させることができる。
また、動的量子化部208は、閾値の調整を行った後に、静的量子化を行った事象を含めて、部分領域の事象の係数値を判定する。このため、部分領域に含まれる顔の検出精度を高めることができる。
ところで、上述の実施例で説明した物体検出装置200等の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することもできる。
ここで、図10を用いて、上記の実施例で説明した物体検出装置200等による処理と同様の機能を実現する物体検出プログラムを実行するコンピュータの一例を説明する。図10は、物体検出プログラムを実行するコンピュータの一例を示す図である。
図10に示すように、物体検出装置200として機能するコンピュータ300は、各種演算処理を実行するCPU(Central Processing Unit)301と、ユーザからのデータの入力を受け付ける入力装置302と、モニタ303を有する。
また、コンピュータ300は、図10に示すように、記憶媒体からプログラム等を読取る媒体読み取り装置304と、ネットワークを介して他のコンピュータとの間でデータの授受を行うネットワークインターフェース装置305とを有する。また、コンピュータ300は、カメラ306、各種情報を一時記憶するRAM(Random Access Memory)307と、ハードディスク装置308を有する。そして、各装置301〜308は、バス309に接続される。
ハードディスク装置308には、上述した物体検出装置200の機能と同様の機能を発揮する物体検出プログラム308aが記憶されている。なお、この物体検出プログラム308aを適宜分散させて、ネットワークを介して通信可能に接続された他のコンピュータの記憶部に記憶させておくこともできる。
そして、CPU301が、物体検出プログラム308aをハードディスク装置308から読み出してRAM307に展開することにより、図10に示すように、物体検出プログラム308aは物体検出プロセス307aとして機能する。また、CPU301が、学習データテーブル308bをハードディスク装置308から読み出してRAM307に展開する。物体検出プロセス307aは、例えば、図2に示した各処理部201〜211に対応する。学習データテーブル308bは、例えば、図2に示した学習データテーブル203aに対応する。物体検出プロセス307aは、RAM307に格納された学習データテーブル307bを用いて、物体検出処理を実行する。
なお、物体検出プログラム308aについては、必ずしも最初からハードディスク装置308に記憶させておく必要はない。例えば、コンピュータ300に挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ300がこれらから各プログラムを読み出して実行するようにしてもよい。
以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)画像領域内の複数の事象のうちいずれかの事象に対して、所定の閾値を用いて量子化を行う静的量子化を実行し、前記画像領域に所定の物体が存在する可能性があるか否かを判定する第1量子化処理部と、
前記所定の物体が存在する可能性がある画像領域に対して、該画像領域の画像の特徴に基づいて調整した閾値を用いて量子化を行う動的量子化を実行し、前記画像領域に所定の物体が存在するか否かを判定する第2量子化処理部と
を備えたことを特徴とする物体検出装置。
(付記2)前記事象にはそれぞれ重要度が設定されており、前記第1量子化処理部は、前記重要度に基づいて、前記静的量子化を実行する事象を判定することを特徴とする付記1に記載の物体検出装置。
(付記3)前記第2量子化処理部は、前記静的量子化を行った事象を含む画像領域に対して動的量子化を実行する場合に、前記静的量子化を実行した事象に対して再度動的量子化を実行することを特徴とする付記1または2に記載の物体検出装置。
(付記4)コンピュータに、
画像領域内の複数の事象のうちいずれかの事象に対して、所定の閾値を用いて量子化を行う静的量子化を実行し、前記画像領域に所定の物体が存在する可能性があるか否かを判定する第1量子化処理手順と、
前記所定の物体が存在する可能性がある画像領域に対して、該画像領域の画像の特徴に基づいて調整した閾値を用いて量子化を行う動的量子化を実行し、前記画像領域に所定の物体が存在するか否かを判定する第2量子化処理手順と
を実行させることを特徴とする物体検出プログラム。
(付記5)前記事象にはそれぞれ重要度が設定されており、前記第1量子化処理手順は、前記重要度に基づいて、前記静的量子化を実行する事象を判定することを特徴とする付記4に記載の物体検出プログラム。
(付記6)前記第2量子化処理手順は、前記静的量子化を行った事象を含む画像領域に対して動的量子化を実行する場合に、前記静的量子化を実行した事象に対して再度動的量子化を実行することを特徴とする付記4または5に記載の物体検出プログラム。
(付記7)物体検出装置が、
画像領域内の複数の事象のうちいずれかの事象に対して、所定の閾値を用いて量子化を行う静的量子化を実行し、前記画像領域に所定の物体が存在する可能性があるか否かを判定するステップと、
前記所定の物体が存在する可能性がある画像領域に対して、該画像領域の画像の特徴に基づいて調整した閾値を用いて量子化を行う動的量子化を実行し、前記画像領域に所定の物体が存在するか否かを判定するステップと
を含むことを特徴とする物体検出方法。
100 物体検出装置
110 第1量子化部
120 第2量子化部

Claims (6)

  1. 画像領域内の複数の事象のうちいずれかの事象に対して、所定の閾値を用いて量子化を行う静的量子化を実行し、前記画像領域に所定の物体が存在する可能性があるか否かを判定する第1量子化処理部と、
    前記所定の物体が存在する可能性がある画像領域に対して、該画像領域の画像の特徴に基づいて調整した閾値を用いて量子化を行う動的量子化を実行し、前記画像領域に所定の物体が存在するか否かを判定する第2量子化処理部と
    を備えたことを特徴とする物体検出装置。
  2. 前記事象にはそれぞれ重要度が設定されており、前記第1量子化処理部は、前記重要度に基づいて、前記静的量子化を実行する事象を判定することを特徴とする請求項1に記載の物体検出装置。
  3. 前記第2量子化処理部は、前記静的量子化を行った事象を含む画像領域に対して動的量子化を実行する場合に、前記静的量子化を実行した事象に対して再度動的量子化を実行することを特徴とする請求項1または2に記載の物体検出装置。
  4. コンピュータに、
    画像領域内の複数の事象のうちいずれかの事象に対して、所定の閾値を用いて量子化を行う静的量子化を実行し、前記画像領域に所定の物体が存在する可能性があるか否かを判定する第1量子化処理手順と、
    前記所定の物体が存在する可能性がある画像領域に対して、該画像領域の画像の特徴に基づいて調整した閾値を用いて量子化を行う動的量子化を実行し、前記画像領域に所定の物体が存在するか否かを判定する第2量子化処理手順と
    を実行させることを特徴とする物体検出プログラム。
  5. 前記事象にはそれぞれ重要度が設定されており、前記第1量子化処理手順は、前記重要度に基づいて、前記静的量子化を実行する事象を判定することを特徴とする請求項4に記載の物体検出プログラム。
  6. 前記第2量子化処理手順は、前記静的量子化を行った事象を含む画像領域に対して動的量子化を実行する場合に、前記静的量子化を実行した事象に対して再度動的量子化を実行することを特徴とする請求項4または5に記載の物体検出プログラム。
JP2010064532A 2010-03-19 2010-03-19 物体検出装置および物体検出プログラム Expired - Fee Related JP5413267B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010064532A JP5413267B2 (ja) 2010-03-19 2010-03-19 物体検出装置および物体検出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010064532A JP5413267B2 (ja) 2010-03-19 2010-03-19 物体検出装置および物体検出プログラム

Publications (2)

Publication Number Publication Date
JP2011198078A JP2011198078A (ja) 2011-10-06
JP5413267B2 true JP5413267B2 (ja) 2014-02-12

Family

ID=44876184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010064532A Expired - Fee Related JP5413267B2 (ja) 2010-03-19 2010-03-19 物体検出装置および物体検出プログラム

Country Status (1)

Country Link
JP (1) JP5413267B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4757559B2 (ja) * 2004-08-11 2011-08-24 富士フイルム株式会社 被写体の構成要素を検出する装置および方法
JP4697549B2 (ja) * 2006-12-04 2011-06-08 富士フイルム株式会社 撮影装置及びその顔検出方法

Also Published As

Publication number Publication date
JP2011198078A (ja) 2011-10-06

Similar Documents

Publication Publication Date Title
US9384531B2 (en) Image processing apparatus, image processing method, and storage medium for reducing noise in a captured image
US9390475B2 (en) Backlight detection method and device
JP6253450B2 (ja) 画像処理装置、画像処理方法及びプログラム
WO2018228310A1 (zh) 图像处理方法、装置及终端
TW201428688A (zh) 圖像相似度判斷系統及方法
JP5530399B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
CN106557729B (zh) 用于处理人脸图像的设备和方法
US9582868B2 (en) Image processing apparatus that appropriately performs tone correction in low-illuminance environment, image processing method therefor, and storage medium
WO2019102966A1 (ja) 脈波検出装置、脈波検出方法、及び記憶媒体
US20150279003A1 (en) Image processing apparatus, image processing method, and medium
JP5672527B2 (ja) 画像処理装置及び画像処理方法
US20120070084A1 (en) Image processing apparatus, image processing method, and image processing program
JP6365355B2 (ja) 画像生成装置および画像生成方法
US20150187051A1 (en) Method and apparatus for estimating image noise
CN109040579B (zh) 一种拍摄控制方法、终端及计算机可读介质
JPWO2020194378A1 (ja) 画像処理システム、画像処理装置、画像処理方法、及び画像処理プログラム
US11348205B2 (en) Image processing apparatus, image processing method, and storage medium
JP7301589B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP5413267B2 (ja) 物体検出装置および物体検出プログラム
JP6388507B2 (ja) 画像処理装置
US11798134B2 (en) Image processing device, image processing method, and image processing program
JP2013101558A (ja) 画像処理方法、画像処理装置及び画像処理プログラム
US11501417B2 (en) Image processing apparatus for estimating the number of specific objects in an image
US20200005021A1 (en) Face detection device, control method thereof, and program
CN113487562B (zh) 一种基于手持设备的皮肤光泽度检测系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131003

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131015

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131028

LAPS Cancellation because of no payment of annual fees