JP2014103643A - 撮像装置及び被写体認識方法 - Google Patents

撮像装置及び被写体認識方法 Download PDF

Info

Publication number
JP2014103643A
JP2014103643A JP2012256431A JP2012256431A JP2014103643A JP 2014103643 A JP2014103643 A JP 2014103643A JP 2012256431 A JP2012256431 A JP 2012256431A JP 2012256431 A JP2012256431 A JP 2012256431A JP 2014103643 A JP2014103643 A JP 2014103643A
Authority
JP
Japan
Prior art keywords
subject
imaging
recognizing
classification items
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012256431A
Other languages
English (en)
Inventor
Tsutomu Ogasawara
努 小笠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012256431A priority Critical patent/JP2014103643A/ja
Publication of JP2014103643A publication Critical patent/JP2014103643A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)

Abstract

【課題】望遠側での被写体認識の検出精度の向上と検出時間の短縮を可能とする撮像装置を提供する。
【解決手段】撮像光学系を通して得られる被写体の光学像を電気信号に変換する撮像素子14から出力される画像信号を解析し、得られた解析結果を予め準備された複数の分類項目と照合することによって被写体を認識する。被写体を認識する際の複数の分類項目の優先順位を焦点距離に応じて変更する。
【選択図】図6

Description

本発明は固体撮像素子を用いた撮像装置に関し、特に、撮像時の被写体認識技術に関する。
固体撮像素子を用いた撮像装置において、得られた画像信号の輝度成分や色差成分を抽出し、似た特徴をもつ画像領域をグルーピングすることにより画像信号内の被写体を認識する方法が知られている(特許文献1参照)。また、被写体の外形により被写体を認識する方法も知られている(特許文献2参照)。これらの方法により得られた認識情報はAE(自動露出制御)、AF(自動合焦(焦点)制御)等の撮影条件やホワイトバランス、エッジ強調等の画像処理に活用される。
特開2009−123234号公報 特開2010−045613号公報
近年、例えば、コンパクトデジタルカメラでは、ズーム倍率の高倍率化が進み、これにより広角側(Wide側)と望遠側(Tele側)とでは、撮影する構図は大きく異なるものとなる。図10は、広角側の構図例と望遠側の構図例を示す図である。広角側の構図例では、図10(a)に示されるように、主被写体(この場合、人物)のみならず、背景を含めることが多い。一方、望遠側の構図例では、図10(b)に示すように、主被写体を大きく撮影することを目的とすることが多い。そのため、被写体認識には、望遠側での撮影には、広角側での撮影よりも、主被写体を正しく捉えることが優先される。
しかし、このような要求を優先させると、望遠側では、外形で認識する主被写体が複数ある場合に、一部の被写体が認識されなくなるおそれがある。つまり、シーンを想定せずに広角側と望遠側に同じ被写体認識処理を施すと、構図の違いによって認識結果が不安定になり、誤認識が生じやすくなる。
また、認識処理が高度になると、認識する被写体の数の増加に伴って検出方法の種類が増えると共に扱うデータ量が膨大になるため、処理プロセッサが進化しているものの、検出時間や処理時間が長くなる傾向がある。特に望遠側での撮影のように手ブレや被写体の動きによる構図変化が激しい条件では、被写体を継続して捉えて認識を繰り返すことが難しいため、検出時間が長くかかることによって認識サイクルが長くなることを回避する必要がある。
本発明は、望遠側での被写体認識の検出精度の向上と検出時間の短縮を可能とする撮像装置を提供することを目的とする。
本発明に係る撮像装置は、撮像光学系を通して得られる被写体の光学像を電気信号に変換する撮像手段と、前記撮像手段から出力される画像信号を解析する解析手段と、前記解析手段により得られる解析結果を予め準備された複数の分類項目と照合することによって前記被写体を認識する認識手段と、前記認識手段が前記被写体を認識する際の前記複数の分類項目の優先順位を前記撮像手段の焦点距離に応じて変更する変更手段とを有することを特徴とする。
本発明によれば、望遠側での被写体認識の検出精度を向上させ、また、検出時間を短縮することができる。
本発明の実施形態に係るデジタルカメラの概略構成を示すブロック図である。 図1のデジタルカメラが備える画像処理回路の構成を示すブロック図である。 被写体認識方法として色差信号、エッジ信号及び輝度信号を用いる方法を説明する図である。 被写体認識方法として周波数成分と水平・垂直の特徴量を用いる方法を説明する図である。 顔検出のためのモデル(模式データ)を示す図である。 図1のデジタルカメラにおける被写体認識方法の全体フローを示すフローチャートである。 ステップS603の通常シーケンス及びステップS607の小顔シーケンスの詳細を示すフローチャートである。 ステップS608の主被写体検出シーケンス及びステップS613,S716の自然物優先シーケンスの詳細を示すフローチャートである。 ステップS614,S717の人工物優先シーケンスの詳細を示すフローチャートである。 広角側の構図例と望遠側の構図例を示す図である。
以下、本発明の実施の形態について、添付図面を参照して説明する。ここでは、本発明に係る撮像装置として、所謂、デジタルカメラを取り上げることとするが、本発明はこれに限定されるものではなく、固体撮像素子を用いて撮像を行う種々の電子機器、例えば、デジタルビデオカメラ、カメラ付きのパーソナルコンピュータや携帯電話、ゲーム機等にも適用可能である。
<デジタルカメラの概略構造>
図1は、本発明の実施形態に係るデジタルカメラ100の概略構成を示すブロック図である。
デジタルカメラ100は、撮像光学系を構成する撮影レンズ10、機械式シャッタ12及び撮像素子14と、A/D変換器16とを備える。撮影レンズ10は、ズームレンズやフォーカスレンズ等の複数のレンズで構成される。機械式シャッタ12は、絞り機能を備え、撮像素子14に対する露光量を調整する。撮像素子14は、CMOSセンサやCCDセンサ等の光電変換素子であり、被写体の光学像を電気信号に変換する。A/D変換器16は、撮像素子14から出力されるアナログ電気信号をデジタル信号(デジタルデータ)に変換する。
デジタルカメラ100は、タイミング発生回路18、画像処理回路20、メモリ制御回路22、画像表示部28、メモリ30及び圧縮・伸長回路32を備える。また、デジタルカメラ100は、露光制御回路40、測距制御回路42、ズーム制御回路44、ブレ検出回路46、ストロボ48及びシステム制御回路50を有する。
タイミング発生回路18は、撮像素子14やA/D変換器16にクロック信号や制御信号を供給し、メモリ制御回路22及びシステム制御回路50により制御される。なお、機械式シャッタ12以外にも、タイミング発生回路18による撮像素子14のリセットタイミングの制御によって、電子シャッタとして撮像素子14における蓄積時間を制御することが可能であり、この機能は、動画撮影等に使用される。
画像処理回路20は、A/D変換器16からのデータ或いはメモリ制御回路22からのデータに対して所定の画素補間処理や色変換処理を行う。また、画像処理回路20が、画像の切り出し及び変倍処理を行うことにより、電子ズーム機能が実現される。更に、画像処理回路20は、撮像した画像データを用いて所定の演算処理を行い、システム制御回路50が、こうして画像処理回路20により得られた演算結果を用いて、露光制御回路40と測距制御回路42の制御を行う。具体的には、TTL方式のAF処理、AE処理、EF処理が行われる。画像処理回路20は、撮像した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいて、TTL方式のAWB(オートホワイトバランス)処理を行う。
メモリ制御回路22は、A/D変換器16、タイミング発生回路18、画像処理回路20、メモリ30及び圧縮・伸長回路32を制御する。A/D変換器16から出力されるデジタルデータは、画像処理回路20とメモリ制御回路22を介して、或いは直接にメモリ制御回路22を介して、メモリ30に書き込まれる。
画像表示部28は、液晶(LCD)パネル等のディスプレイであり、メモリ30に書き込まれた表示用の画像データは、メモリ制御回路22を介して画像表示部28に画像として表示される。撮像した画像データを画像表示部28に逐次表示することにより、電子ファインダ機能が実現される。なお、画像表示部28における画像表示は、システム制御回路50からの指示によりON/OFFを切り替えることができ、画像表示をOFFにすることにより電力消費を大幅に低減することができる。
メモリ30は、撮影した静止画像や動画像の画像データや音声データ等を格納し、所定枚数の静止画像や所定時間の動画像を格納するのに十分な記憶容量を備えている。これにより、複数枚の静止画像を連続して撮影する連写撮影やパノラマ撮影の場合にも、高速かつ大量の画像書き込みをメモリ30に対して行うことが可能となる。なお、メモリ30は、システム制御回路50の作業領域としても使用される。
圧縮・伸長回路32は、例えば、適応離散コサイン変換(ADCT)により、メモリ30に格納された画像データを読み込んで圧縮処理或いは伸長処理を行い、処理を終えたデータをメモリ30に書き込む。露光制御回路40は、絞り機能を備える機械式シャッタ12を制御し、ストロボ48と連動することによりストロボ調光機能を実現させる。測距制御回路42は、撮影レンズ10のフォーカシングを制御する。露光制御回路40と測距制御回路42は、TTL方式を用いて制御されており、前述の通り、撮像した画像データを用いて画像処理回路20が所定の演算を行った演算結果に基づき、システム制御回路50が露光制御回路40及び測距制御回路42に対する制御を行う。
ズーム制御回路44は、撮影レンズ10のズーミングを制御する。ストロボ48は、AF補助光の投光機能とストロボ調光機能とを有する。ブレ検出回路46は、デジタルカメラ100の本体に設けられた不図示のジャイロセンサ等からの信号に基づいて、デジタルカメラ100の本体が動いているか否か、具体的には、デジタルカメラ100の本体にブレが生じているか否かを判定する。
システム制御回路50は、デジタルカメラ100の全体的動作を制御する。システム制御回路50は、CPUとFlashROM等で構成された不揮発性メモリとを備え、CPUが実行するプログラムコードは不揮発性メモリに書き込まれている。CPUは、不揮発性メモリに書き込まれたプログラムコードを逐次読み出しながら実行する。また、不揮発性メモリには、デジタルカメラ100のシステム情報を記憶する領域やユーザ設定情報を記憶する領域が設けられており、CPUは、種々の情報や設定を起動時に読み出して復元する。
デジタルカメラ100は、システム制御回路50に対する各種の動作指示を入力するための操作手段として、モードダイアルスイッチ60、シャッタスイッチSW1_62,SW2_64、表示切替スイッチ66、操作部70及びズームスイッチ72を備える。
モードダイアルスイッチ60は、電源オフ、自動撮影モード、撮影モード、HDR撮影モード、パノラマ撮影モード、動画撮影モード、再生モード、PC接続モード等の各機能モードを切り替える。シャッタスイッチSW1_62は、シャッタボタンの操作途中でONとなり、AF(オートフォーカス)処理、AE(自動露出)処理、AWB(オートホワイトバランス)処理等の動作開始をシステム制御回路50に指示する。シャッタスイッチSW2_64は、シャッタボタンの操作完了でONとなる。ストロボ撮影の場合、EF(プリ発光)処理に基づいてAE処理で決定された露光時間分だけ撮像素子14を露光させ、その露光時間の間にストロボ48を発光させ、露光時間終了と同時に露光制御回路40による遮光を行って、撮像素子14への露光を終了させる。
なお、システム制御回路50は、撮像素子14に対する露光が終了すると、撮像素子14からアナログ電気信号を読み出し、信号をA/D変換器16、メモリ制御回路22を介して、メモリ30に画像データ(デジタルデータ)として書き込む。そして、システム制御回路50は、メモリ30からの画像データの読み出し処理、画像処理回路20やメモリ制御回路22での現像処理、圧縮・伸長回路32での圧縮処理等を行い、後述する記録媒体150へ画像データの格納という一連の処理の動作を行う。
表示切替スイッチ66は、画像表示部28の表示切替を行い、後述する光学ファインダ104を用いて撮影を行う際に、画像表示部28への給電を停止することにより、省電力を図ることができる。操作部70は、各種のボタンや回転式ダイアル、タッチパネル等を含み、例えば、メニューボタン、セットボタン、マクロボタン、マルチ画面再生改ページボタン、フラッシュ設定ボタン、単写/連写/セルフタイマー切り替えボタン等を含む。また、操作部70は、メニュー移動+(プラス)ボタン、メニュー移動−(マイナス)ボタン、再生画像移動+(プラス)ボタン、再生画像−(マイナス)ボタン、撮影画質選択ボタン、露出補正ボタン、日付/時間設定ボタン等も含む。
ズームスイッチ72は、ユーザによる操作により、撮像画像の倍率変更指示をシステム制御回路50に対して行う。ズームスイッチ72は、撮像画角を望遠側に変更させるテレスイッチと、広角側に変更させるワイドスイッチとを有する。ズームスイッチ72の操作は、ズーム制御回路44に撮影レンズ10の撮像画角の変更を指示し、光学ズーム操作を行うトリガとなり、また、画像処理回路20による画像の切り出しや画素補間処理等による撮像画角の電子的なズーミング変更のトリガとなる。
デジタルカメラ100は、電源部86及び光学ファインダ104を有する。電源部86は、例えば、アルカリ電池等の一次電池、NiCd電池やNiMH電池、Liイオン電池等の二次電池、ACアダプター等であり、デジタルカメラ100に動作に必要な電力を供給する。光学ファインダ104は被写体を写し出し、光学ファインダ104を通して被写体を視認することにより、画像表示部28による電子ファインダ機能を使用することなく、所望する被写体を撮影することができる。
デジタルカメラ100には、記録媒体150との間で画像データの送受信を行うためにインタフェース(I/F)90と、記録媒体150の着脱を可能とするためのコネクタ92とが設けられている。また、デジタルカメラ100には、外部と通信を行うために、例えば、USB、IEEE1394、LAN、無線通信等の各種通信機能を有する通信部110と、外部との接続を行うためのコネクタ112とが設けられている。なお、無線通信を行う場合には、コネクタ112は、アンテナとなる。
デジタルカメラ100には、画像データを保存するための記録媒体150が着脱可能となっている。記録媒体150は、メモリカードやハードディスク等であり、コネクタ92と接続されるコネクタ156とインタフェース154とを介して、システム制御回路50との間で画像データの送受信を行う。
<画像処理回路20の構成>
図2は、画像処理回路20の構成を示すブロック図である。撮像素子14から出力されるアナログ電気信号は、A/D変換器16においてデジタル信号であるRGB信号に変換され、画像処理回路20に入力される。画像処理回路20は、入力されたRGB信号を受信する輝度生成回路201と、色差生成回路202とを有する。輝度生成回路201は、受信したRGB信号から輝度信号Yを生成し、色差生成回路202は、受信したRGB信号から色差信号CrCbを生成する。
輝度生成回路201から出力される輝度信号Yは、ハイパスフィルタ(HPF)203と、高速フーリエ変換回路(FFT)204と、顔検出回路205とに入力される。HPF203は、輝度信号Yからエッジ成分を抽出する。以下、HPF203から出力されるエッジ成分の信号をエッジ信号と称呼する。FFT204は、輝度信号Yを各周波数成分に分離する。顔検出回路205は、輝度信号Yに基づいて顔のパターン検出を行う。
FFT204から出力される周波数成分、HPF203から出力されるエッジ信号、輝度生成回路201から出力される輝度信号Y及び色差生成回路202から出力される色差信号CrC/bは、積分器206に入力され、これにより各信号の積分値が得られる。また、輝度生成回路201から出力される輝度信号Yは、後段において、HPF203から出力されるエッジ成分信号及び色差生成回路202から出力される色差信号CrCbと加算され、これにより、Y/Cr/Cb信号が得られる。
<被写体認識方法>
図3を参照して、被写体認識方法として、色差信号Cr/Cb、エッジ信号及び輝度信号Yを用いる方法について説明する。図3(a)は、撮影画像の構図の第1の例を示す図であり、この構図は、人301、道路302、地面303、山304及び空305からなる。図3(b)は、図3(a)の構図の撮影画像を元画像として、これを所定数(ここでは、5×5の25ブロックの例を示す)のブロックに分割した状態を示す図である。元画像の分割されたブロック毎に画像情報としての色差、エッジ、輝度レベルのそれぞれの積分値を求める。
得られた色差信号Cr/Cbを用い、元画像について、各画素の色分けを行う。図3(c)は、縦軸にCrを、横軸にCbを取り、色分けしたい領域を設定するためのグラフである。ここでは、青306、赤307、茶308、緑309、灰310を設定することとする。図3(d)は、図3(c)を用いて元画像の色分けを行なった結果を示す図であり、青領域311、緑領域312、茶色領域313及び灰色領域314が検出された結果が示されている。
図3(e)は、元画像にハイパスフィルタ処理を施してエッジ信号を抽出した結果を示す図である。図3(e)において白く示した画素がエッジのレベルが高い画素であり、黒く示した画素がエッジの存在しない画素であり、白から黒までの階調をもったエッジ信号を抽出する。図3(f)は、図3(e)のエッジ信号の積分値をブロック毎に求めた結果を示す図である。「大」で示すブロック315は、レベルの高いエッジを含むブロック又はエッジ成分が多く存在するブロックである。「中」で示すブロック316、「小」で示すブロック317の順で徐々にエッジ成分は減少し、「無」で示すブロック318にはエッジ成分は存在しない。
続いて、上記と同様に元画像をブロック分割し、ブロック内の輝度信号Yを積分することにより、ブロック毎に輝度信号積分値を求める。なお、本実施形態では、簡単のため色分け数やブロック分割数を粗く設定しているが、より細かな設定を行ってもよい。また、検出したブロックのうち、同じ被写体であると判断されるブロックを同一のグループとして扱ってもよく、逆に、より細かいブロックを設定して元画像の被写体の境界に合わせた領域分けを行なってもよい。さらに、本実施形態では、エッジ信号を抽出する手段としてハイパスフィルタを用いたが、これに限定されるものではない。
そして、予め準備された分類テーブルを用いて被写体を認識する。図3に示したエッジが少なく明るい青であるブロックは空である可能性が高く、エッジが少なく暗い青であるブロックは海である可能性が高い。また、エッジが少なく緑であるブロックは山である可能性が高く、エッジがあって緑であるブロックは木である可能性が高い。暗い茶色であるブロックは地面である可能性が高く、明るい茶色であるブロックは肌(人)である可能性が高く、灰色であるブロックは人工物である可能性が高い。分類テーブルとは、このように、画像信号を解析して得られる色差等の解析結果と、その解析結果から推測される被写体とを関連付けて、複数の項目に分類したテーブルである。デジタルカメラ100では、被写体の画像信号を解析して得られた解析結果と分類テーブルの分類項目との照合(解析結果がどの分類項目に該当するかの判定)を行うことによって被写体が何であるかを認識する。その具体的な認識方法については後述する。
なお、被写体を分類する際に分類項目毎に信頼度を設け、同じ青でも空と分類する可能性が高いか海と分類する可能性が高いかを信頼度の高さにより判定するようにしてもよく、また、他の分類手段と合わせて、より信頼度の高いものを判定するようにしてもよい。
次に、図4を参照して、被写体認識方法として、周波数成分と水平・垂直の特徴量を用いる方法について説明する。図4(a)は、撮影画像の構図の第2の例を示す図であり、この構図は、木401、地面402、海403、山404、空405からなる。図4(b)は、図4(a)の構図の撮影画像を元画像として、これを所定数(ここでは、5×5の25ブロックの例を示す)のブロックに分割した状態を示す図である。元画像の分割されたブロック毎に周波数成分及び水平・垂直の特徴量を抽出する。
その際、先ず、高速フーリエ変換(FFT)を用いて、画像信号の周波数成分を求める。図4(c)は、1次元のFFT結果を示す図であり、低周波信号407、中間の周波数信号408、高周波信号409が得られた結果を示している。図4(d)は、図4(c)の結果を元画像に適用した結果を示す図である。木等の複雑な形状や海に存在する細かい波は高周波となり、「細」で示すブロック410がこれに該当する。地面の凹凸等は中間の周波数となり、「中」で示すブロック411がこれに該当し、山等のなだらかな変化があるものは低周波となり、「粗」で示すブロック412がこれに該当し、「無」で示すブロック413は、青空等の平坦なものに該当する。
次に、画像信号の水平・垂直の特徴量を求める。図4(e)は、図4(b)に示す海の領域の1ブロックであるブロック406をグラフ化した図であり、ブロック406を水平方向に積分した結果414と、垂直方向に積分した結果415とを示している。垂直方向の積分結果は特徴を持たないが、水平方向の積分結果は波状となるため、ブロック406には横線(横縞)が存在していることがわかる。
図4(f)は、図4(e)の結果を元画像に適用した結果を示す図であり、海の部分でのみ横線(横縞)が検出されるため、「横」で示すブロック416の判定が得られ、それ以外の領域は不規則であるため「不」で示すブロック417となる。図3を参照して説明した手法と図4を参照して説明した手法とを合わせて、分類テーブルでは、例えば、細かく不規則な緑であるブロックは葉である可能性が高く、粗く不規則な青であるブロックは空である可能性が高いと分類する。また、細かく横線の規則性がある青は海である可能性が高く、その他縦線や横線の規則性があるブロックは人工物である可能性が高いと分類することができる。
なお、本実施形態ではブロック毎に周波数成分や縞等の特徴量の検出を行なったが、ある程度の領域を占める可能性のある被写体を想定して認識を行う場合等においては、同様のブロックをグルーピングしてより広域で検出してもよい。
<被写体認識処理フロー>
上述した分類テーブルを用いた被写体認識方法について、図6乃至図9のフローチャートを参照して説明する。ここでは、図5を用いて外形及びパターンでの認識方法の一例である顔検出方法について説明する。
図5は、顔検出のためのモデル(模式データ)を示す図である。ある程度の面積をもつ丸みをもつ平坦な領域内に、目、鼻、口に相当するエッジを検出できた場合に、その被写体は顔であると判定する。この判定結果に、角度情報や縦横判定を加味することにより、斜め顔か又は横顔か、デジタルカメラ100を縦位置に構えた状態での顔であるか否か等を判定することが可能になり、顔検出の頻度や精度を向上させることができる。なお、顔画像や図5に示した顔モデル(模式データ)をテンプレートとして記憶しておき、テンプレートマッチングにより顔検出を行ってもよい。
図6は、デジタルカメラ100における被写体認識方法の全体フローを示すフローチャートである。この被写体認識方法はライブ画像に対して行われ、認識結果は撮影条件の設定や画像処理パラメータに反映することができる。なお、図6乃至図9のフローチャートの処理は、システム制御回路50のCPUが、不揮発性メモリに書き込まれたプログラムコードを逐次読み出してメモリ30の作業領域に展開し、デジタルカメラ100の各種構成要素の動作を制御することにより実現される。
先ず、ステップS601において、撮影者がズームスイッチ72を操作することにより、ズームポジションがシステム制御回路50に入力される。そこで、システム制御回路50のCPU(以下単に「CPU」と記す)は、ステップS602においてズームポジション(焦点距離)が望遠側であるか否かを判定する。
なお、望遠側での撮影では、手ブレによりデジタルカメラ100の本体に手ブレ等の動きが生じ、また、被写体の動きによる構図変化が激しいことがある。よって、ステップ602では、望遠側であるか否かによる判定に代えて、デジタルカメラ100の本体に動きが生じているか、又は、被写体の動きによる構図変化が激しいかを判定するようにしてもよい。
CPUは、望遠側ではないと判定した場合(S602でNO)、処理をステップS603へ進め、望遠側であると判定した場合(S602でYES)、処理をステップS604へ進める。
CPUは、ステップS603において通常シーケンスを実行し、その後、処理を終了させる。なお、通常シーケンスの詳細については、図7(a)を参照して後述する。一方、CPUは、ステップS604において簡易的な顔検出処理を実行し、ステップS605においてステップS604の処理結果から撮影画像に顔が存在するか否かを判定する。顔が存在すると判定した場合(S605でYES)、CPUは、ステップS606において顔の大きさを判定する。CPUは、顔が大きいと判定した場合(S606でYES)、処理を終了させ、顔が大きくないと判定した場合(S606でNO)、ステップS607において小顔シーケンスを実行し、その後、処理を終了させる。なお、小顔シーケンスの詳細については、図7(a)を参照して後述する。
ステップS605で顔が存在しないと判定した場合(S605でNO)、CPUは、ステップS608において簡易的な主被写体検出シーケンスを実行し、続くステップS609においてステップS608の処理結果から、撮影画像に主被写体が存在するか否かを判定する。なお、主被写体検出シーケンスの詳細については、図8(a)を参照して後述する。
CPUは、主被写体が存在すると判定した場合(S609でYES)、ステップS610において、主被写体が自然物に属するか否かを判定する。CPUは、主被写体が自然物に属すると判定した場合(S610でYES)、ステップS613において自然物優先シーケンスを実行し、その後、処理を終了させる。なお、自然物優先シーケンスの詳細については、図8(b)を参照して後述する。一方、CPUは、主被写体が自然物に属さないと判定した場合(S610でNO)、ステップS614において人工物優先シーケンスを実行し、その後、処理を終了させる。なお、人工物優先シーケンスの詳細については、図9を参照して後述する。
ステップS609で主被写体が存在しないと判定した場合(S609でNO)、CPUは、ステップS611において画像全体の彩度を検出し、ステップ612においてステップS611で求めた彩度の有無を判定する。CPUは、彩度があると判定した場合(S612でYES)、ステップS613において自然物優先シーケンスを実行し、その後、処理を終了させる。一方、CPUは、彩度がないと判定した場合(S612でNO)、ステップS614において人工物優先シーケンスを実行し、その後、処理を終了させる。
図7(a)は、ステップS603の通常シーケンスの詳細を示すフローチャートである。通常シーケンスでは、CPUは、ステップS701において顔検出を行う。続いて、CPUは、ステップS702において画像を所定数のブロックに分割し、ステップS703においてブロック毎に色差、輝度、エッジの積分値を求める。
更に、CPUは、ステップS704においてブロック毎に周波数特性、縞等のパターン検出を行う。ここで、システム制御回路50は、空や地面、木、山、道路等の想定される主要被写体を、色差、輝度、エッジ、周波数特性、縞等により分類した分類テーブルを備えている。そこで、続くステップS705において、CPUは、空らしさ、地面らしさ、木らしさ、山らしさ、道路らしさ等の信頼度として、ステップS704で得たブロック毎の情報やパターン検出によりパターン認識を行い、その後、本処理を終了させる。なお、ステップS703,704の処理は、図2乃至図4を参照して説明したように、CPUからの指令を受けた画像処理回路20により実行される。
図7(b)は、ステップS607の小顔シーケンスの詳細を示すフローチャートである。小顔シーケンスでは、CPUは、ステップS711において顔周辺をブロック分割し、ステップS712において顔の周辺のエッジ検出を行い、続くステップS713において、人体を除いた周辺部におけるエッジの有無を判定する。CPUは、周辺部にエッジがないと判定した場合(S713でNO)、背景がぼやけていると推測し、人体の周辺からは情報を得られないものと判断し、本処理を終了させる。
一方、CPUは、周辺部にエッジがあると判定した場合(S713でYES)、ステップS714において人体周辺の彩度を検出し、続くステップS715において人体周辺の彩度の有無を判定する。CPUは、彩度があると判定した場合(S715でYES)、ステップS716において自然物優先シーケンスを実行し、その後、本処理を終了させる。一方、CPUは、彩度がないと判定した場合(S715でNO)、ステップS717において人工物優先シーケンスを実行し、その後、本処理を終了させる。
図8(a)は、ステップS608の主被写体検出シーケンスの詳細を示すフローチャートである。CPUは、ステップS801において画像中心領域を所定数のブロックに分割し、ステップS802においてブロック毎に色差、輝度、エッジの積分値を求める。CPUは、続くステップS803においてブロック毎に周波数特性、縞等のパターン検出を行い、更にステップS804において、認識する被写体のうち人や木等の小さい領域でも認識しやすい被写体を優先する分類テーブルを参照して、主被写体の認識処理を行う。
図8(b)は、ステップS613,S716の自然物優先シーケンスの詳細を示すフローチャートである。CPUは、ステップS811において優先順位が下位の認識処理である本処理を継続実施するか否かを判定し、CPUは、継続実施しないと判定した場合(S811でNO)、本処理を終了させる。一方、CPUは、本処理を継続実施すると判定した場合(S811でYES)、ステップS812において通常シーケンスよりも粗くブロック分割を行い、ブロック毎に色差、輝度、エッジの積分値を求める。続いて、CPUは、ステップS813においてブロック毎の周波数特性、縞等のパターン検出を行う。そして、CPUは、ステップS814において、自然物優先の分類テーブルを参照して、自然物優先の被写体認識を行い、その後、本処理を終了させる。
なお、自然物優先の分類テーブルでは、例えば、上位の認識順位となる主被写体が木である場合、下位の認識順位として草、地面、空の認識優先順位を上げる。また、上位の認識順位となる主被写体が山である場合、下位の認識順位として空、海、木、地面の認識優先順位を上げる。更に、主被写体が検出できなくても、彩度が高いと判断した場合には、自然物の優先順位を人工物よりも上げる。
図9は、ステップS614,S717の人工物優先シーケンスの詳細を示すフローチャートである。CPUは、ステップS901において優先順位が下位の認識である本処理を継続実施するか否かを判定し、CPUは、継続実施しないと判定した場合(S901でNO)、本処理を終了させる。一方、CPUは、本処理を継続実施すると判定した場合(S901でYES)、ステップS902において通常シーケンスよりも粗くブロック分割を行い、ブロック毎に色差、輝度、エッジの積分値を求める。続いて、CPUは、ステップS803においてブロック毎の周波数特性、縞等のパターン検出を行う。そして、CPUは、ステップS804において、そして、CPUは、ステップS904において、人工物優先の分類テーブルを参照して、人工物優先の被写体認識を行い、その後、本処理を終了させる。
なお、人工物優先の分類テーブルでは、例えば、上位の認識順位となる主被写体が家である場合、下位の認識順位としてビルや道路の認識優先順位を上げる。また、上位の認識順位となる主被写体が車である場合、下位の認識順位として道路やビルの認識優先順位を上げる。更に、主被写体が検出できなくても彩度が低いと判断した場合、人工物の優先順位を自然物より上げる。
以上の説明の通り、本実施形態によれば、被写体認識処理において実行される内容を望遠側であるか否かによって振り分け(S602)、優先順位を設ける。これにより、被写体認識の検出精度を向上させ、且つ、検出時間を短縮することができる。
なお、上記実施形態では、上位の認識順位となる主被写体が認識された後に、下位の被写体の認識を中止するか又は認識順位を変更するとした。しかし、これに限られず、上位の分類項目で主被写体が認識された時点で、下位の分類項目の信頼度を一律に下げ、又は主被写体との関連性が低い分類項目の信頼度を下げ、或いは、時間的に主被写体との関連性が低いものの分類項目の優先順位を下げるようにしてもよい。
<その他の実施形態>
以上、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。さらに、上述した各実施形態は本発明の一実施形態を示すものにすぎず、各実施形態を適宜組み合わせることも可能である。
本発明は以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)をネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムコードを読み出して実行する処理である。この場合、そのプログラム、及び該プログラムを記憶した記憶媒体は本発明を構成することになる。
20 画像処理回路
42 測距制御回路
44 ズーム制御回路
46 ブレ検出回路
50 システム制御回路
100 デジタルカメラ
201 輝度生成回路
202 色差生成回路
203 FPT回路
204 FFT回路
205 顔検出回路
206 積分器

Claims (13)

  1. 撮像光学系を通して得られる被写体の光学像を電気信号に変換する撮像手段と、
    前記撮像手段から出力される画像信号を解析する解析手段と、
    前記解析手段により得られる解析結果を予め準備された複数の分類項目と照合することによって前記被写体を認識する認識手段と、
    前記認識手段が前記被写体を認識する際の前記複数の分類項目の優先順位を前記撮像手段の焦点距離に応じて変更する変更手段とを有することを特徴とする撮像装置。
  2. 前記変更手段は、前記撮像手段の焦点距離が望遠側であるときに前記分類項目の優先順位を変更することを特徴とする請求項1記載の撮像装置。
  3. 前記変更手段は、前記撮像光学系のズームポジションに基づいて前記撮像手段の焦点距離が望遠側であるか否かを判断することを特徴とする請求項2記載の撮像装置。
  4. 撮像光学系を通して得られる被写体の光学像を電気信号に変換する撮像手段を備える撮像装置であって、
    前記撮像装置の動きを検出する検出手段と、
    前記撮像手段から出力される画像信号を解析する解析手段と、
    前記解析手段により得られる解析結果を予め準備された複数の分類項目と照合することによって前記被写体を認識する認識手段と、
    前記認識手段が前記被写体を認識する際の前記分類項目の優先順位を、前記撮像装置が動いていることを前記検出手段が検出したときに変更する変更手段とを有することを特徴とする撮像装置。
  5. 前記複数の分類項目のそれぞれに信頼度が設けられ、
    前記認識手段は、前記信頼度の高い分類項目を優先して前記被写体を認識することを特徴とする請求項1乃至4のいずれか1項に記載の撮像装置。
  6. 前記認識手段が前記複数の分類項目のうちの上位の分類項目で主被写体を認識した時点で、前記変更手段は、下位の分類項目の信頼度を一律に下げることを特徴とする請求項5記載の撮像装置。
  7. 前記認識手段が前記複数の分類項目のうちの上位の分類項目で主被写体を認識した時点で、前記変更手段は、前記主被写体との関連性が低い分類項目の信頼度を下げることを特徴とする請求項5記載の撮像装置。
  8. 前記認識手段が前記複数の分類項目のうちの上位の分類項目で主被写体を認識した時点で、前記変更手段は、時間的に前記主被写体との関連性が低い分類項目の優先順位を下げることを特徴とする請求項5記載の撮像装置。
  9. 前記認識手段が前記被写体として主被写体を認識した場合に、前記変更手段は、前記複数の分類項目のうちの下位の分類項目の優先順位を変更することを特徴とする請求項1乃至8のいずれか1項に記載の撮像装置。
  10. 前記変更手段は、前記下位の分類項目の優先順位を下げることを特徴とする請求項9記載の撮像装置。
  11. 前記認識手段は、前記被写体として主被写体を認識した場合に、前記複数の分類項目のうちの下位の分類項目に対する認識を中止することを特徴とする特徴とする請求項1乃至8のいずれか1項に記載の撮像装置。
  12. 撮像光学系を通して得られる被写体の光学像を電気信号に変換する撮像手段を備える撮像装置において実行される被写体認識方法であって、
    前記撮像手段から出力される画像信号を解析する解析ステップと、
    前記解析ステップで得られる解析結果を予め準備された複数の分類項目と照合することによって前記被写体を認識する認識ステップと、
    前記認識ステップで前記被写体を認識する際の前記複数の分類項目の優先順位を前記撮像手段の焦点距離に応じて変更する変更ステップとを有することを特徴とする被写体認識方法。
  13. 撮像光学系を通して得られる被写体の光学像を電気信号に変換する撮像手段を備える撮像装置において実行される被写体認識方法であって、
    前記撮像装置の動きを検出する検出ステップと、
    前記撮像手段から出力される画像信号を解析する解析ステップと、
    前記解析ステップで得られる解析結果を予め準備された複数の分類項目と照合することによって前記被写体を認識する認識ステップと、
    前記検出ステップで前記撮像装置が動いていることを検出したときに、前記認識ステップにおいて前記被写体を認識する際の前記複数の分類項目の優先順位を変更する変更ステップとを有することを特徴とする被写体認識方法。
JP2012256431A 2012-11-22 2012-11-22 撮像装置及び被写体認識方法 Pending JP2014103643A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012256431A JP2014103643A (ja) 2012-11-22 2012-11-22 撮像装置及び被写体認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012256431A JP2014103643A (ja) 2012-11-22 2012-11-22 撮像装置及び被写体認識方法

Publications (1)

Publication Number Publication Date
JP2014103643A true JP2014103643A (ja) 2014-06-05

Family

ID=51025749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012256431A Pending JP2014103643A (ja) 2012-11-22 2012-11-22 撮像装置及び被写体認識方法

Country Status (1)

Country Link
JP (1) JP2014103643A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017003709A (ja) * 2015-06-08 2017-01-05 キヤノン株式会社 撮像装置、発光制御方法、プログラム
CN110049234A (zh) * 2019-03-05 2019-07-23 努比亚技术有限公司 一种成像方法、移动终端及存储介质
WO2020230660A1 (ja) 2019-05-10 2020-11-19 ソニーセミコンダクタソリューションズ株式会社 画像認識装置、固体撮像装置、および画像認識方法
KR20220006520A (ko) 2019-05-10 2022-01-17 소니 세미컨덕터 솔루션즈 가부시키가이샤 화상 인식 장치 및 화상 인식 방법
KR20220016056A (ko) 2019-05-30 2022-02-08 소니 세미컨덕터 솔루션즈 가부시키가이샤 화상 인식 장치 및 화상 인식 방법

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017003709A (ja) * 2015-06-08 2017-01-05 キヤノン株式会社 撮像装置、発光制御方法、プログラム
CN110049234A (zh) * 2019-03-05 2019-07-23 努比亚技术有限公司 一种成像方法、移动终端及存储介质
CN110049234B (zh) * 2019-03-05 2021-08-24 努比亚技术有限公司 一种成像方法、移动终端及存储介质
WO2020230660A1 (ja) 2019-05-10 2020-11-19 ソニーセミコンダクタソリューションズ株式会社 画像認識装置、固体撮像装置、および画像認識方法
KR20220006520A (ko) 2019-05-10 2022-01-17 소니 세미컨덕터 솔루션즈 가부시키가이샤 화상 인식 장치 및 화상 인식 방법
DE112020002319T5 (de) 2019-05-10 2022-01-27 Sony Semiconductor Solutions Corporation Bilderkennungsvorrichtung und bilderkennungsverfahren
TWI800722B (zh) * 2019-05-10 2023-05-01 日商索尼半導體解決方案公司 圖像辨識裝置及圖像辨識方法
US11710291B2 (en) 2019-05-10 2023-07-25 Sony Semiconductor Solutions Corporation Image recognition device and image recognition method
US11805330B2 (en) 2019-05-10 2023-10-31 Sony Semiconductor Solutions Corporation Image recognition device, solid-state imaging device, and image recognition method
KR20220016056A (ko) 2019-05-30 2022-02-08 소니 세미컨덕터 솔루션즈 가부시키가이샤 화상 인식 장치 및 화상 인식 방법
DE112020002567T5 (de) 2019-05-30 2022-04-21 Sony Semiconductor Solutions Corporation Bilderkennungsvorrichtung und bilderkennungsverfahren

Similar Documents

Publication Publication Date Title
US9723159B2 (en) RAW camera peripheral for handheld mobile unit
WO2020038110A1 (zh) 全景拍摄方法、装置、终端及计算机可读存储介质
CN111669493A (zh) 一种拍摄方法、装置与设备
JP5833794B2 (ja) 撮像装置
US9906732B2 (en) Image processing device, image capture device, image processing method, and program
JP6460721B2 (ja) 画像処理装置、画像処理方法及びプログラム
US9485436B2 (en) Image processing apparatus and image processing method
JP6472183B2 (ja) 画像処理装置、その制御方法、プログラム
JP2006211103A (ja) 撮像装置及びその制御方法
US9871976B2 (en) Imaging apparatus, control system and control method
US8988545B2 (en) Digital photographing apparatus and method of controlling the same
JP2011182252A (ja) 撮像装置および画像撮影方法
WO2017080348A2 (zh) 一种基于场景的拍照装置、方法、计算机存储介质
US10778903B2 (en) Imaging apparatus, imaging method, and program
JP2014103643A (ja) 撮像装置及び被写体認識方法
JP2004192129A (ja) 顔領域抽出方法及び装置
JP2007081732A (ja) 撮像装置
KR102351496B1 (ko) 영상 처리 장치 및 그 동작 방법
JPWO2018235382A1 (ja) 撮像装置、撮像装置の制御方法、及び撮像装置の制御プログラム
JP2023059952A (ja) 画像処理装置、撮像装置、画像処理方法、画像処理プログラム及び記録媒体
US20120327266A1 (en) Extending a digital camera focus range
JP2016148933A (ja) 画像処理装置および画像処理方法
US20120329516A1 (en) Digital camera providing an extended focus range
JP6433177B2 (ja) 画像処理装置および画像処理方法
JP6289068B2 (ja) 撮像装置、及びその制御方法