JPWO2012121137A1 - 画像処理装置および画像処理プログラム - Google Patents

画像処理装置および画像処理プログラム Download PDF

Info

Publication number
JPWO2012121137A1
JPWO2012121137A1 JP2013503496A JP2013503496A JPWO2012121137A1 JP WO2012121137 A1 JPWO2012121137 A1 JP WO2012121137A1 JP 2013503496 A JP2013503496 A JP 2013503496A JP 2013503496 A JP2013503496 A JP 2013503496A JP WO2012121137 A1 JPWO2012121137 A1 JP WO2012121137A1
Authority
JP
Japan
Prior art keywords
region
image
image processing
candidate
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013503496A
Other languages
English (en)
Other versions
JP6020439B2 (ja
Inventor
岳志 西
岳志 西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Corp
Original Assignee
Nikon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corp filed Critical Nikon Corp
Publication of JPWO2012121137A1 publication Critical patent/JPWO2012121137A1/ja
Application granted granted Critical
Publication of JP6020439B2 publication Critical patent/JP6020439B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

画像の中から動物の顔を検出する顔検出部と、顔検出部による顔検出結果に基づいて、画像の中の動物の体の候補領域を設定する候補領域設定部と、基準画像を取得する基準画像取得部と、候補領域設定部により設定された動物の体の候補領域を複数の小領域に分割し、複数の小領域の画像のそれぞれについて基準画像との類似度をそれぞれ演算する類似度演算部と、類似度演算部により演算された複数の小領域のそれぞれの類似度に基づいて、動物の体の候補領域の中から動物の体の領域を推定する体領域推定部とを備える。

Description

本発明は画像処理装置および画像処理プログラムに関する。
人体の顔と肌色を中心として人体位置を特定し、人体のモデルを用いて人体の姿勢を推定する方法が知られている(特許文献1参照)。
日本国特許第4295799号
しかしながら、上述した従来の方法では、肌色が検出できない場合、人体位置の検出能力が著しく低下するという問題がある。
(1) 本発明の第1の態様による画像処理装置は、画像の中から動物の顔を検出する顔検出部と、顔検出部による顔検出結果に基づいて、画像の中の動物の体の候補領域を設定する候補領域設定部と、基準画像を取得する基準画像取得部と、候補領域設定部により設定された動物の体の候補領域を複数の小領域に分割し、複数の小領域の画像のそれぞれについて基準画像との類似度をそれぞれ演算する類似度演算部と、類似度演算部により演算された複数の小領域のそれぞれの類似度に基づいて、動物の体の候補領域の中から動物の体の領域を推定する体領域推定部とを備える。
(2) 本発明の第2の態様によると、第1の態様による画像処理装置において、候補領域設定部は、顔検出部により検出された動物の顔の大きさと傾きに応じて画像の中に動物の体の候補領域を設定するのが好ましい。
(3) 本発明の第3の態様によると、第1または第2の態様による画像処理装置において、顔検出部は、画像の中の動物の顔の位置に動物の顔の大きさと傾きに応じた矩形枠を設定し、候補領域設定部は、顔検出部により設定された矩形枠と同一の矩形枠を所定個数並べて動物の体の候補領域を設定するのが好ましい。
(4) 本発明の第4の態様によると、第3の態様よる画像処理装置において、類似度演算部は、動物の体の候補領域を構成する複数の矩形枠の中をそれぞれ複数の領域に分割して複数の小領域とするのが好ましい。
(5) 本発明の第5の態様によると、第4の態様による画像処理装置において、基準画像取得部は、それぞれの矩形枠の内側に複数の小領域と同じ大きさの第2の小領域をさらに設定し、複数の第2の小領域の画像をそれぞれ基準画像として取得し、類似度演算部は、複数の小領域の画像のそれぞれと複数の第2の小領域の画像のそれぞれとの類似度をそれぞれ演算するのが好ましい。
(6) 本発明の第6の態様によると、第5の態様による画像処理装置において、基準画像処理部は、それぞれの前記矩形枠の中央に前記第2の小領域を設定するのが好ましい。
(7) 本発明の第7の態様によると、第1〜6の態様のいずれかによる画像処理装置において、類似度演算部は、動物の体の候補領域内の複数の小領域のそれぞれと顔検出部により検出された動物の顔との距離が近いほど類似度に大きな重み付けを行うのが好ましい。
(8) 本発明の第8の態様によると、第1〜7の態様のいずれかによる画像処理装置において、類似度演算部は、小領域の画像と基準画像との間で輝度、周波数、輪郭、色差、色相のいずれか1または複数を比較し、類似度を演算するのが好ましい。
(9) 本発明の第9の態様によると、第1〜8の態様のいずれかによる画像処理装置において、基準画像取得部は、予め記憶されている画像を基準画像として用いるのが好ましい。
(10) 本発明の第10の態様によると、第1〜9の態様のいずれかによる画像処理装置において、顔検出部は画像の中から動物の顔として人の顔を検出し、候補領域設定部は、顔検出部による顔検出結果に基づいて、画像の中の人の体の候補領域を動物の体の候補領域として設定し、類似度演算部は、候補領域設定部により設定された人の体の候補領域を複数の小領域に分割し、複数の小領域の画像のそれぞれと基準画像との類似度を演算し、体領域推定部は、類似度演算部により演算された複数の小領域のそれぞれの類似度に基づいて、人の体の候補領域の中から人の体の領域を動物の体の領域として推定するのが好ましい。
(11) 本発明の第11の態様によると、第10の態様による画像処理装置において、人の体の上半身の領域を推定し、上半身の領域の推定結果を用いて人の体の下半身の領域を推定するのが好ましい。
(12) 本発明の第12の態様によると、画像処理装置は、画像の中から動物の顔を検出する顔検出部と、顔検出手段による顔検出結果に基づいて、画像中の動物の体の候補領域を設定する候補領域設定部と、候補領域設定手段により設定された体の候補領域内に複数の基準領域を設定し、候補領域内の小領域の画像と、各基準領域の基準画像との類似度を演算する類似度演算部と、類似度演算手段により演算されたそれぞれの小領域の類似度に基づいて、体の候補領域の中から動物の体の領域を推定する体領域推定部とを備える。
(13) 本発明の第13の態様によると、画像処理プログラムは、画像の中から動物の顔を検出する顔検出処理と、顔検出処理による顔検出結果に基づいて、画像の中の動物の体の候補領域を設定する候補領域設定処理と、基準画像を取得する基準画像取得処理と、候補領域設定処理により設定された動物の体の候補領域を複数の小領域に分割し、複数の小領域の画像のそれぞれと基準画像との類似度をそれぞれ演算する類似度演算処理と、類似度演算処理により演算された複数の小領域のそれぞれの類似度に基づいて、動物の体の候補領域の中から動物の体の領域を推定する体領域推定処理とをコンピュータに実行させる。
本発明によれば、動物の体の領域を正確に推定することができる。
図1は、第1の実施の形態の画像処理装置の構成を示すブロック図である。 図2は、第1の実施の形態の画像処理プログラムを示すフローチャートである。 図3は、第1の実施の形態の画像処理例を示す図である。 図4は、第1の実施の形態の画像処理例を示す図である。 図5は、第1の実施の形態の画像処理例を示す図である。 図6は、第1の実施の形態の画像処理例を示す図である。 図7は、第1の実施の形態の画像処理例を示す図である。 図8は、第1の実施の形態の画像処理例を示す図である。 図9は、第1の実施の形態の画像処理例を示す図である。 図10は、第1の実施の形態の画像処理例を示す図である。 図11は、顔位置に設定された矩形ブロックと人体候補領域に並置された矩形ブロックを示す図である。 図12は、一例として矩形ブロックBs(0,0)(左上隅の矩形ブロック)を拡大してテンプレートTp(0,0)を示す図である。 図13は、第2の実施の形態の構成を示すブロック図である。 図14は、第3の実施の形態の構成を示すブロック図である。 図15は、第4の実施の形態の構成を示すブロック図である。 図16は、第5の実施の形態の構成を示すブロック図である。 図17は、第5の実施の形態の構成を示すブロック図である。 図18は、第5の実施の形態の構成を示すブロック図である。 図19は、プログラム製品を提供するために用いる機器の全体構成を説明する図である。
《発明の第1の実施の形態》
図1は第1の実施の形態の画像処理装置の構成を示すブロック図である。図2は第1の実施の形態の画像処理プログラムを示すフローチャートである。また、図3〜図10は第1の実施の形態の画像処理例を示す図である。これらの図を参照して発明の第1の実施の形態を説明する。
第1の実施の形態の画像処理装置100は、記憶装置10とCPU20を備えている。CPU(制御部,制御装置)20は、ソフトウエア形態による顔検出部21、人体候補領域生成部22、テンプレート作成部23、テンプレートマッチング部24、類似度算出部25、人体領域推定部26などを有し、記憶装置10に記憶されている画像に各種の処理を施して人体推定領域50を検出する。
記憶装置10には、図示しない入力装置により入力された画像が記憶されている。これらの画像は、カメラなどの撮像装置から直接入力した画像の他に、インターネットを介して入力した画像などが含まれる。
図2のステップS1において、CPU20の顔検出部21は顔認識アルゴリズムにより画像の中に写っている人体の顔を検出し、画像上に顔の大きさに応じた矩形のブロックを設定する。図3に画像上に顔の大きさに応じた矩形ブロックを設定した例を示す。図3において、顔検出部21は、画像に写っている2人の人物の顔を検出し、画像上の顔の大きさと顔の傾きに応じて矩形ブロック、ここでは正方形のブロックを設定する。なお、顔の大きさに応じた矩形ブロックは正方形に限定されず、長方形あるいは多角形であってもよい。
なお、顔検出部21は、顔の傾きを顔認識アルゴリズムにより検出して、その顔の傾きに応じて矩形ブロックを傾けて設定する。図3に示す例では、画像左側の人物の顔はほぼ垂直方向(画像の縦方向)に向いているため、顔の大きさに応じた矩形ブロックが垂直方向に設定されている。一方、画像右側の人物の顔は垂直方向に対して少し左に傾いているため、顔の大きさに応じた矩形ブロックが顔の傾きに応じて左に傾いて設定されている。
次に、図2のステップS2において、CPU20の人体候補領域生成部22は、ステップS1の顔検出結果を用いて人体候補領域を生成する。一般に、大凡の人体の大きさは顔の大きさに基づいて推定することができる。また顔に続く人体の向きや傾きは顔の傾きに基づいて推定することができる。そこで、この一実施の形態では、人体候補領域生成部22は、顔検出部21が顔の大きさに応じて設定した顔の矩形ブロック(図3参照)と同一の矩形ブロックを人体が存在すると想定される画像上の領域に並べる。なお、人体候補領域生成部22が生成する矩形ブロックは、顔検出部21が設定した顔の矩形ブロックと実質的に同一であればよい。
図4は、人体候補領域生成部22が図3の画像に対して人体候補領域を生成(設定)した例を示す。図4の画像上の2人の人物の内の左側の人物については、顔がほぼ垂直方向に向いているため、人体候補領域生成部22は顔の下に垂直方向に人体があると推定する。そこで、人体候補領域生成部22は、水平方向に5個、垂直方向に4個、計20個の矩形ブロックを左側の人物の顔の下に並べ、これらの20個の矩形ブロックで表す領域を人体候補領域とする。一方、図4の画像上の右側の人物は顔が垂直方向に対して少し左に傾いているため、人体候補領域生成部22は顔に続く人体も垂直方向に対して少し左に傾いていると推定する。人体候補領域生成部22は、図4に示すように顔の矩形ブロックの傾きと同じ傾きに、右上がり横方向に5個、左に傾斜した縦方向に4個、計19個の矩形ブロックを並べ(右端の矩形ブロックは画像からはみ出すので省略)、これらの19個の矩形ブロックで表す領域を人体候補領域とする。以下では、左側の人物に対する画像処理例を説明するが、右側の人物に対する画像処理も同様であり、図示と説明を省略する。
なお、上述した例では人体候補領域生成部22が顔の矩形ブロックと同一の矩形ブロックを縦横に所定個数並べて人体候補領域を生成した。上述したように、人体の領域は顔の大きさと向きに応じた位置になる確率が高いので、上記の人体候補領域の生成方法によれば、人体の領域を正しく設定できる確率が高くなる。しかし、人体候補領域に並べる矩形ブロックの大きさと形状、および個数は上述した方法に限定されるものではない。
図11は顔位置に設定された矩形ブロックと人体候補領域に並置された矩形ブロックを示す。図11に示すように、人体候補領域Bの各矩形ブロックBsに対して、左上隅の矩形ブロックBs(0,0)から右下隅の矩形ブロックBs(3,4)までアドレスを設定すると、人体候補領域Bと各矩形ブロックBs(i,j)は(1)式に示すように行列で表現することができる。
Figure 2012121137
(1)式において、Bs(i,j)は人体候補領域B内の矩形ブロックBsのアドレス(行,列)を示し、pix(a,b)は各矩形ブロックBs内の画素のアドレス(行,列)を示す。
次に、CPU20の人体候補領域生成部22は、人体候補領域Bを構成する各矩形ブロックBsを図5に示すように4分割し、各矩形ブロックBsを4個のサブブロックに分ける。
図2のステップS3において、CPU20のテンプレート作成部23は、各矩形ブロックBsの中央に上記サブブロックと同じ大きさのテンプレート領域を設定し、各矩形ブロックBsのテンプレート領域の画像データを用いてテンプレートを生成する。ここで、テンプレートとは、後述するテンプレートマッチング処理において参照される基準画像のことである。図6は、テンプレート作成部23が各矩形ブロックBsごとに設定したテンプレート領域(各矩形ブロックBsの中央にハッチングで示す矩形領域)を示す。
図12は、一例として矩形ブロックBs(0,0)(左上隅の矩形ブロック)を拡大してテンプレートTp(0,0)を示す。矩形ブロックBs(0,0)は4個の“サブブロック”BsDiv1(0,0)、BsDiv1(0,1)、BsDiv1(1,0)、BsDiv1(1,1)に分割され、さらに中央に4個のサブブロックと同じ大きさのテンプレート領域が設定され、このテンプレート領域の画像データを用いてテンプレートTp(0,0)が生成される。
テンプレートは(2)式に示すように行列で表すことができる。
Figure 2012121137
(2)式において、Tは人体候補領域Bのすべてのテンプレートの行列であり、Tp(i,j)は各矩形ブロックBsごとのテンプレートの行列である。
図2のステップS4において、CPU20のテンプレートマッチング部24は、テンプレート作成部23が作成した各テンプレートTp(i,j)を取得する。そして、テンプレートマッチング部24は、その各テンプレートTp(i,j)ごとに、すべての矩形ブロックBsのすべてのサブブロックBsDivに対してテンプレートマッチング処理を行う。テンプレートマッチング処理において、この実施の形態では、テンプレートマッチング部24はテンプレートTpとマッチング対象のサブブロックBsDivの画素ごとの輝度の差分を演算する。
例えば、図7に示すように、まずテンプレートマッチング部24は、左上隅の矩形ブロックBs(0,0)のテンプレートTp(0,0)を用いて、すべての矩形ブロックBsのすべてのサブブロックBsDivに対してテンプレートマッチング処理を行う。次に、テンプレートマッチング部24は、矩形ブロックBs(0,1)のテンプレートTp(0,1)を用いて、すべての矩形ブロックBsのすべてのサブブロックBsDivに対してテンプレートマッチング処理を行う。同様に、テンプレートマッチング部24は、テンプレートTpを変えてすべての矩形ブロックBsのすべてのサブブロックBsDivに対してテンプレートマッチング処理を行った後、図8に示すように、最後に右下隅の矩形ブロックBs(3,4)のテンプレートTp(3,4)を用いて、すべての矩形ブロックBsのすべてのサブブロックBsDivに対してテンプレートマッチング処理を行う。
図2のステップS5において、CPU20の類似度算出部25は、テンプレートマッチング処理結果の差分の絶対値を積算して類似度S(m,n)を算出するとともに、類似度の平均値Saveを算出する。
Figure 2012121137
(3)式において、Mは行方向の全体のサブブロック個数、Nは列方向の全体のサブブロック個数、Kはテンプレート個数である。
ところで、人体候補領域Bを構成する複数の矩形ブロックBsの中で、人体候補領域Bを構成する矩形ブロックBsが顔の矩形ブロックに近いほど人体候補領域である確率が高い。そこで、類似度算出部25は、顔の矩形ブロックに近い矩形ブロックBsのテンプレートマッチング処理結果に、顔の矩形ブロックから遠い位置にある矩形ブロックBsよりも大きな重み付けを行う。これにより、CPU20は、より正確な人体候補領域を識別できる。具体的には、(4)式により類似度算出部25は、類似度S(m,n)と類似度の平均値Saveを算出する。
Figure 2012121137
(4)式において、W(i,j)は重み行列である。
図9は、人体候補領域BのすべてのサブブロックBsDivに対する類似度S(m,n)の演算結果を示す。図9において、濃くハッチングされたサブブロックBsDivは人体候補領域Bの全体に対する差異が少なく、類似度が高いことを示す。
図2のステップS6において、CPU20の人体領域推定部26は、各サブブロックBsDivの類似度S(m,n)を平均値Saveと比較し、類似度S(m,n)が平均値Saveよりも低いサブブロックBsDivを人体領域と推定する。
Figure 2012121137
人体領域推定部26が類似度の平均値Saveをしきい値として人体領域を推定する場合、確率密度関数を用いてもよいし、SVM(Support Vector Machine)のような学習しきい値判別手法を用いてもよい。図10は人体領域の推定結果の一例を示す。図10において、ハッチングで示すサブブロックBsDivが人体領域と推定されたサブブロックである。
《発明の第2の実施の形態》
上述した第1の実施の形態では、テンプレートとマッチング対象のサブブロックとの間で画素ごとの輝度を比較し、テンプレートマッチング処理を行う例を示した。第2の実施の形態では、輝度の比較以外に、テンプレートとマッチング対象のサブブロックとの間で周波数スペクトラム、輪郭(エッジ)、色差、色相などを比較したり、それらの組み合わせどうしを比較してテンプレートマッチング処理を行う。
図13は第2の実施の形態の構成を示すブロック図である。図13において、図1に示す第1の実施の形態の構成要素と同様なものに対しては同一の符号を付して相違点を中心に説明する。第2の実施の形態の画像処理装置101は、記憶装置10とCPU121を備えている。CPU121は、コンピュータのソフトウエア形態による特徴量算出部31を有している。この特徴量算出部31は、テンプレートとマッチング対象のサブブロックとの間で輝度以外に周波数、輪郭(エッジ)、色差、色相などを比較し、あるいはそれらのパラメーターを複数組み合わせて比較する。そして、特徴量算出部31はテンプレートマッチング処理、すなわち上述したようにテンプレートとマッチング対象のサブブロックとの間の比較パラメーターの差分を演算する。なお、第2の実施の形態は特徴量算出部31によるテンプレートマッチング処理以外の構成および動作は上述した第1の実施の形態の構成および動作と同様であり、それらの説明を省略する。
《発明の第3の実施の形態》
上述した第1の実施の形態では人体の領域を推定する例を示した。第3の実施の形態は、人体の領域に加え、人体の重心を推定する。図14は第3の実施の形態の構成を示すブロック図である。図14において、図1に示す第1の実施の形態の構成要素と同様なものに対しては同一の符号を付して相違点を中心に説明する。第3の実施の形態の画像処理装置102は、記憶装置10とCPU122を備えている。CPU122はコンピュータのソフトウエア形態による人体推定重心算出部32を有しており、人体推定重心算出部32により推定結果の人体領域の重心を算出する。この人体推定重心51と顔の重心から人体の傾きを検出することができる。なお、第3の実施の形態は人体推定重心算出部32による人体重心算出動作以外の構成および動作については上述した第1の実施の形態の構成および動作と同様であり、それらの説明を省略する。
《発明の第4の実施の形態》
上述した第1の実施の形態では各サブブロックの中央にテンプレート領域を設定してテンプレートを生成し、これを用いてテンプレートマッチング処理を行う例を示した。第4の実施の形態は、予め人体の領域を判別するためのテンプレートを教師データとして記憶しており、このような教師データを用いてテンプレートマッチング処理を行うようにしてもよい。
図15は第4の実施の形態の構成を示すブロック図である。図15において、図1に示す第1の実施の形態の構成要素と同様なものに対しては同一の符号を付して相違点を中心に説明する。第4の実施の形態の画像処理装置103は、記憶装置10とCPU123を備えている。CPU123のテンプレートマッチング部27は、教師データ記憶装置33に予めテンプレートとして記憶されている教師データを取得する。そして、テンプレートマッチング部27は、その教師データと各サブブロックとの間でテンプレートマッチング処理を行う。なお、第4の実施の形態は、教師データ記憶装置33の教師データを用いたテンプレートマッチング処理以外の構成および動作については上述した第1の実施の形態の構成および動作と同様であり、それらの説明を省略する。
上述した各実施の形態では画像の一部をテンプレートに採用したが、このようなテンプレートによる人体領域の推定においては、人体領域を推定するための情報として画像上に存在する情報のみに限定されるため、推定精度や推定内容に限界がある。しかし、第4の実施の形態の画像処理装置103は、教師データとして多くの情報を盛り込むことができ、人体領域の推定精度を向上させることができる上に、推定内容を拡大することができる。例えば、第4の実施の形態の画像処理装置103は種々の色や形の服を着た人体領域でも正確に推定することができる。
あるいは、第4の実施の形態の画像処理装置103の適用範囲は、人体領域の推定だけに限定されず、例えば犬や猫などのペットを含む動物、自動車などの物体、ビルなどの建造物の物体領域の推定にも拡大することができる。その結果、第4の実施の形態の画像処理装置103は、あらゆる物体の領域を正確に推定することも可能になる。
《発明の第5の実施の形態》
第5の実施の形態は、顔検出結果に基づいて人体の上半身の領域を推定し、推定結果の上半身推定領域に基づいて人体の下半身の領域を推定する。図16は第5の実施の形態の構成を示すブロック図である。図16において、図1に示す第1の実施の形態の構成要素と同様なものに対しては同一の符号を付して相違点を中心に説明する。
図16は第5の実施の形態の画像処理装置104の全体構成を示すブロック図である。第5の実施の形態の画像処理装置104は、記憶装置10とCPU124とを備えている。CPU124はコンピュータのソフトウエア形態による顔検出部21、上半身推定部41および下半身推定部42を有し、人体の領域を推定する。
図17は上半身推定部41の構成を示すブロック図である。上半身推定部41は、コンピュータのソフトウエア形態による人体候補領域生成部22、テンプレート作成部23、テンプレートマッチング部24、類似度算出部25および人体領域推定部26を備え、顔検出部21により検出された顔領域情報52に基づいて人体の上半身の領域を推定し、上半身推定領域53を出力する。
図18は下半身推定部42の構成を示すブロック図である。下半身推定部42は、コンピュータのソフトウエア形態による人体候補領域生成部22、テンプレート作成部23、テンプレートマッチング部24、類似度算出部25および人体領域推定部26を備え、上半身推定部42により推定された上半身推定領域53に基づいて人体の下半身の領域を推定し、下半身推定領域54を出力する。
この第5の実施の形態は、人体の領域を推定する際に、上半身の領域の推定結果を下半身の領域の推定に用いて、人体全体の領域を正確に推定することができる。
なお、上述した各実施の形態の画像処理プログラムにおいて、人体領域が検出できなかった場合には、CPUは人体候補領域を変更または拡大して上述した処理を行うようにしてもよい。
上述した実施の形態では、顔領域検出部21が画像の中から人の顔を検出し、顔の検出結果に基づいて画像の中の人体の領域を推定する例を示したが、本発明の画像処理装置は人体領域の推定に限定されず、例えば犬や猫などのペットを含む動物、自動車などの物体、ビルなどの建造物の物体領域の推定にも適用することができる。特に、関節を持つ動物はその動きが複雑になるため、従来はそれらの体の領域や姿勢を検出することが難しいとされていた。しかし、本発明の画像処理装置によれば、画像の中から動物の顔を検出し、顔の検出結果に基づいて画像の中の動物の体の領域を正確に推定することができる。とりわけ、サル目(霊長類)ヒト科の動物である人は、手足の複雑な関節により複雑な動きをするが、本発明の画像処理装置により人体領域を正確に推定でき、その推定結果からさらに姿勢検出や重心検出なども可能になる。
上述した実施の形態とその変形例では、画像処理装置として実現する一例を示したが、一般的なパーソナルコンピュータに本発明の画像処理プログラムをインストールして実行し、パソコン上で上述した画像処理を行ってもよい。なお、本発明の画像処理プログラムはCD−ROMなどの記録媒体に記録して提供してもよいし、インターネットを介してダウンロード可能にしてもよい。あるいは、本発明の画像処理装置または画像処理プログラムをデジタルカメラやビデオカメラに搭載し、撮像した画像に対して上述した画像処理を実行するものであってもよい。図19はその様子を示す図である。パーソナルコンピュータ400は、CD−ROM404を介してプログラムの提供を受ける。また、パーソナルコンピュータ400は、通信回線401との接続機能を有する。コンピュータ402は、上記プログラムを提供するサーバコンピュータであり、ハードディスク403などの記録媒体にプログラムを格納する。通信回線401は、インターネット、パソコン通信などの通信回線、あるいは専用通信回線などである。コンピュータ402はハードディスク403を使用してプログラムを読み出し、通信回線401を介してプログラムをパーソナルコンピュータ400へ送信する。すなわち、プログラムをデータ通信(搬送波)などの種々の形態のコンピュータ読み込み可能なコンピュータプログラム製品として供給できる。
なお、上述した実施の形態とそれらの変形例において、実施の形態どうし、または実施の形態と変形例とのあらゆる組み合わせが可能である。
上述した実施の形態とその変形例によれば以下のような作用効果を奏することができる。まず、顔検出部21が画像の中から動物の顔を検出する。そして、その顔検出結果に基づいて人体候補領域生成部22が画像の中の動物(人)の体の候補領域(矩形ブロック)を設定する。テンプレートマッチング部24,27は、それぞれテンプレート作成部23または教師データ記憶装置33から基準画像(テンプレート)を取得する。そして、人体候補領域生成部22は、動物の体の候補領域を複数の小領域(サブブロック)に分割する。そして、テンプレートマッチング部24,27と類似度算出部25は、複数の小領域の画像のそれぞれについて基準画像との類似度をそれぞれ演算する。人体領域推定部26は、それら複数の小領域のそれぞれの類似度に基づいて、動物の体の候補領域の中から動物の体の領域を推定するようにした。したがって、画像処理装置は、動物の体の領域を容易かつ正確に検出することができる。
また、上述した実施の形態とその変形例によれば、図4に示すように、人体候補領域生成部22が動物の顔の大きさと傾きに応じて画像の中に動物の体の候補領域を設定するようにした。動物の体の領域は顔の大きさと傾きに応じた位置になる確率が高い。したがって、画像処理装置は、体の候補領域を真の体の領域に設定できる確率が高くなり、体の領域の推定精度を向上させることができる。
上述した実施の形態とその変形例によれば、顔検出部21が画像の中の動物の顔の位置に動物の顔の大きさと傾きに応じた矩形ブロックを設定する。そして、図4に示すように、人体候補領域生成部22がその矩形ブロックと同一の矩形ブロックを所定個数並べて動物の体の候補領域を設定するようにした。動物の体の領域は顔の大きさと傾きに応じた位置と大きさになる確率が高い。したがって、画像処理装置は、体の候補領域を真の体の領域に設定できる確率が高くなり、体の領域の推定精度を向上させることができる。
上述した実施の形態とその変形例によれば、人体候補領域生成部22が動物の体の候補領域を構成する複数の矩形ブロックの中をそれぞれ複数の領域に分割して小領域(サブブロック)とした。したがって、画像処理装置は、体の領域を推定するための類似度を正確に求めることができる。
上述した実施の形態とその変形例によれば、テンプレート作成部23がそれぞれの矩形ブロックの中央にサブブロックと同じ大きさのテンプレート領域を設定し、このテンプレート領域の画像をテンプレートとした。したがって、画像処理装置は、体の領域を推定するための類似度を正確に求めることができる。
上述した実施の形態とその変形例によれば、類似度算出部25が候補領域内のサブブロックと動物の顔との距離が近いほど類似度に大きな重み付けを行うようにした。したがって、画像処理装置は、動物の体の領域を正確に推定することができる。
上述した実施の形態とその変形例によれば、CPUがサブブロックの画像とテンプレートとの間で輝度、周波数、輪郭、色差、色相のいずれか1または複数を比較し、類似度を演算するようにした。したがって、画像処理装置は、体の領域を推定するための類似度を正確に求めることができる。
上述した第4の実施の形態とその変形例によれば、テンプレートマッチングマッチング部27がサブブロックの画像の代わりに教師データ記憶装置33に予め記憶されている画像をテンプレートとして用いるようにした。そのため、画像処理装置は体の領域を推定するための情報として画像上に存在する情報のみに制約されず、多くの情報を盛り込むことができる。その結果、画像処理装置は人体領域の推定精度を向上させることができる上に、推定内容を拡大することができる。
上述した第5の実施の形態とその変形例によれば、上半身推定部41が人の体の上半身の領域を推定する。そして、下半身推定部42が上半身の領域の推定結果を用いて人の体の下半身の領域を推定するようにした。したがって、画像処理装置は体全体の領域を正確に推定することができる。
上述した実施の形態とその変形例によれば、テンプレートマッチング部24,27は、テンプレート領域の画像または教師データをテンプレートとした。しかし、画像処理装置は人体候補領域生成部22が設定したサブブロックの画像またはサブブロックと同じ大きさの矩形ブロックの一部の画像をテンプレートとして設定してもよい。
上記では、種々の実施の形態および変形例を説明したが、本発明はこれらの内容に限定されるものではない。本発明の技術的思想の範囲内で考えられるその他の態様も本発明の範囲内に含まれる。
次の優先権基礎出願の開示内容は引用文としてここに組み込まれる。
日本国特許出願2011年第047525号(2011年3月4日出願)

Claims (13)

  1. 画像の中から動物の顔を検出する顔検出部と、
    前記顔検出部による顔検出結果に基づいて、前記画像の中の前記動物の体の候補領域を設定する候補領域設定部と、
    基準画像を取得する基準画像取得部と、
    前記候補領域設定部により設定された前記動物の体の候補領域を複数の小領域に分割し、前記複数の小領域の画像のそれぞれについて前記基準画像との類似度をそれぞれ演算する類似度演算部と、
    前記類似度演算部により演算された前記複数の小領域のそれぞれの類似度に基づいて、前記動物の体の候補領域の中から前記動物の体の領域を推定する体領域推定部とを備える画像処理装置。
  2. 請求項1に記載の画像処理装置において、
    前記候補領域設定部は、前記顔検出部により検出された前記動物の顔の大きさと傾きに応じて前記画像の中に前記動物の体の候補領域を設定する画像処理装置。
  3. 請求項1または請求項2に記載の画像処理装置において、
    前記顔検出部は、前記画像の中の前記動物の顔の位置に前記動物の顔の大きさと傾きに応じた矩形枠を設定し、
    前記候補領域設定部は、前記顔検出部により設定された前記矩形枠と同一の矩形枠を所定個数並べて前記動物の体の候補領域を設定する画像処理装置。
  4. 請求項3に記載の画像処理装置において、
    前記類似度演算部は、前記動物の体の候補領域を構成する複数の前記矩形枠の中をそれぞれ複数の領域に分割して前記複数の小領域とする画像処理装置。
  5. 請求項4に記載の画像処理装置において、
    前記基準画像取得部は、それぞれの前記矩形枠の内側に前記複数の小領域と同じ大きさの第2の小領域をさらに設定し、複数の前記第2の小領域の画像をそれぞれ前記基準画像として取得し、
    前記類似度演算部は、前記複数の小領域の画像のそれぞれと複数の前記第2の小領域の画像のそれぞれとの類似度をそれぞれ演算する画像処理装置。
  6. 請求項5に記載の画像処理装置において、
    前記基準画像取得部は、それぞれの前記矩形枠の中央に前記第2の小領域を設定する画像処理装置。
  7. 請求項1〜6のいずれか一項に記載の画像処理装置において、
    前記類似度演算部は、前記動物の体の候補領域内の前記複数の小領域のそれぞれと前記顔検出部により検出された前記動物の顔との距離が近いほど前記類似度に大きな重み付けを行う画像処理装置。
  8. 請求項1〜7のいずれか一項に記載の画像処理装置において、
    前記類似度演算部は、前記小領域の画像と前記基準画像との間で輝度、周波数、輪郭、色差、色相のいずれか1または複数を比較し、前記類似度を演算する画像処理装置。
  9. 請求項1〜8のいずれか一項に記載の画像処理装置において、
    前記基準画像取得部は、予め記憶されている画像を前記基準画像として用いる画像処理装置。
  10. 請求項1〜9のいずれか一項に記載の画像処理装置において、
    前記顔検出部は画像の中から前記動物の顔として人の顔を検出し、
    前記候補領域設定部は、前記顔検出部による顔検出結果に基づいて、前記画像の中の人の体の候補領域を前記動物の体の候補領域として設定し、
    前記類似度演算部は、前記候補領域設定部により設定された前記人の体の候補領域を複数の小領域に分割し、前記複数の小領域の画像のそれぞれと前記基準画像との類似度を演算し、
    前記体領域推定部は、前記類似度演算部により演算された前記複数の小領域のそれぞれの類似度に基づいて、前記人の体の候補領域の中から前記人の体の領域を前記動物の体の領域として推定する画像処理装置。
  11. 請求項10に記載の画像処理装置において、
    前記人の体の上半身の領域を推定し、前記上半身の領域の推定結果を用いて前記人の体の下半身の領域を推定する画像処理装置。
  12. 画像の中から動物の顔を検出する顔検出部と、
    前記顔検出手段による顔検出結果に基づいて、前記画像中の前記動物の体の候補領域を設定する候補領域設定部と、
    前記候補領域設定手段により設定された前記体の候補領域内に複数の基準領域を設定し、前記候補領域内の小領域の画像と、前記各基準領域の基準画像との類似度を演算する類似度演算部と、
    前記類似度演算手段により演算されたそれぞれの前記小領域の類似度に基づいて、前記体の候補領域の中から前記動物の体の領域を推定する体領域推定部とを備える画像処理装置。
  13. 画像の中から動物の顔を検出する顔検出処理と、
    前記顔検出処理による顔検出結果に基づいて、前記画像の中の前記動物の体の候補領域を設定する候補領域設定処理と、
    基準画像を取得する基準画像取得処理と、
    前記候補領域設定処理により設定された前記動物の体の候補領域を複数の小領域に分割し、前記複数の小領域の画像のそれぞれと前記基準画像との類似度をそれぞれ演算する類似度演算処理と、
    前記類似度演算処理により演算された前記複数の小領域のそれぞれの類似度に基づいて、前記動物の体の候補領域の中から前記動物の体の領域を推定する体領域推定処理とをコンピュータに実行させる画像処理プログラム。
JP2013503496A 2011-03-04 2012-03-02 画像処理装置、撮像装置、および画像処理プログラム Active JP6020439B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011047525 2011-03-04
JP2011047525 2011-03-04
PCT/JP2012/055351 WO2012121137A1 (ja) 2011-03-04 2012-03-02 画像処理装置および画像処理プログラム

Publications (2)

Publication Number Publication Date
JPWO2012121137A1 true JPWO2012121137A1 (ja) 2014-07-17
JP6020439B2 JP6020439B2 (ja) 2016-11-02

Family

ID=46798101

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013503496A Active JP6020439B2 (ja) 2011-03-04 2012-03-02 画像処理装置、撮像装置、および画像処理プログラム

Country Status (4)

Country Link
US (1) US20130329964A1 (ja)
JP (1) JP6020439B2 (ja)
CN (1) CN103403762A (ja)
WO (1) WO2012121137A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9349076B1 (en) * 2013-12-20 2016-05-24 Amazon Technologies, Inc. Template-based target object detection in an image
JP6362085B2 (ja) * 2014-05-21 2018-07-25 キヤノン株式会社 画像認識システム、画像認識方法およびプログラム
US10242291B2 (en) * 2017-02-08 2019-03-26 Idemia Identity & Security Device for processing images of people, the device seeking to sort these images as a function of contextual information
JP6965803B2 (ja) * 2018-03-20 2021-11-10 株式会社Jvcケンウッド 認識装置、認識方法及び認識プログラム
SG10201802532YA (en) * 2018-03-27 2019-10-30 Nec Asia Pacific Pte Ltd Method and system for identifying an individual in a crowd
CN111242117A (zh) 2018-11-28 2020-06-05 佳能株式会社 检测装置和方法及图像处理装置和系统
US11080833B2 (en) * 2019-11-22 2021-08-03 Adobe Inc. Image manipulation using deep learning techniques in a patch matching operation

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7193594B1 (en) * 1999-03-18 2007-03-20 Semiconductor Energy Laboratory Co., Ltd. Display device
KR100612842B1 (ko) * 2004-02-28 2006-08-18 삼성전자주식회사 앵커 샷 결정방법 및 결정장치
JP4706415B2 (ja) * 2005-09-27 2011-06-22 カシオ計算機株式会社 撮像装置、画像記録装置およびプログラム
GB2431717A (en) * 2005-10-31 2007-05-02 Sony Uk Ltd Scene analysis
JP5227888B2 (ja) * 2009-05-21 2013-07-03 富士フイルム株式会社 人物追跡方法、人物追跡装置および人物追跡プログラム

Also Published As

Publication number Publication date
CN103403762A (zh) 2013-11-20
US20130329964A1 (en) 2013-12-12
WO2012121137A1 (ja) 2012-09-13
JP6020439B2 (ja) 2016-11-02

Similar Documents

Publication Publication Date Title
JP6020439B2 (ja) 画像処理装置、撮像装置、および画像処理プログラム
JP6946831B2 (ja) 人物の視線方向を推定するための情報処理装置及び推定方法、並びに学習装置及び学習方法
US9607209B2 (en) Image processing device, information generation device, image processing method, information generation method, control program, and recording medium for identifying facial features of an image based on another image
JP6793151B2 (ja) オブジェクトトラッキング装置、オブジェクトトラッキング方法およびオブジェクトトラッキングプログラム
JP5836095B2 (ja) 画像処理装置、画像処理方法
CN110008806B (zh) 信息处理装置、学习处理方法、学习装置及物体识别装置
US11138419B2 (en) Distance image processing device, distance image processing system, distance image processing method, and non-transitory computer readable recording medium
JP5801237B2 (ja) 部位推定装置、部位推定方法、および部位推定プログラム
US9477880B2 (en) Behavior detection method and behavior detection apparatus
JP6708260B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2013089252A (ja) 映像処理方法及び装置
US11676362B2 (en) Training system and analysis system
JP2014093023A (ja) 物体検出装置、物体検出方法及びプログラム
US10304184B2 (en) Non-transitory computer readable recording medium storing program for patient movement detection, detection method, and detection apparatus
JP2015219868A (ja) 情報処理装置、情報処理方法、プログラム
JP7211428B2 (ja) 情報処理装置、制御方法、及びプログラム
US20240104769A1 (en) Information processing apparatus, control method, and non-transitory storage medium
JP2006215743A (ja) 画像処理装置及び画像処理方法
JP2017033556A (ja) 画像処理方法及び電子機器
JP6717049B2 (ja) 画像解析装置、画像解析方法およびプログラム
JP4505616B2 (ja) 固有空間学習装置、固有空間学習方法及び固有空間プログラム
JP5713655B2 (ja) 映像処理装置、映像処理方法及びプログラム
WO2024095584A1 (ja) 情報処理プログラム、情報処理装置及び情報処理方法
WO2023162223A1 (ja) 学習プログラム、生成プログラム、学習方法および生成方法
WO2024009744A1 (ja) 情報処理装置、情報処理方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160919

R150 Certificate of patent or registration of utility model

Ref document number: 6020439

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250