JP2009296143A - 撮像装置 - Google Patents

撮像装置 Download PDF

Info

Publication number
JP2009296143A
JP2009296143A JP2008145846A JP2008145846A JP2009296143A JP 2009296143 A JP2009296143 A JP 2009296143A JP 2008145846 A JP2008145846 A JP 2008145846A JP 2008145846 A JP2008145846 A JP 2008145846A JP 2009296143 A JP2009296143 A JP 2009296143A
Authority
JP
Japan
Prior art keywords
sound source
sound
imaging
unit
imaging apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008145846A
Other languages
English (en)
Inventor
Takumi Uehara
匠 上原
Shuichi Kato
収一 加藤
Keita Sonoda
啓太 園田
Yuichi Nakase
雄一 中瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008145846A priority Critical patent/JP2009296143A/ja
Publication of JP2009296143A publication Critical patent/JP2009296143A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Studio Devices (AREA)

Abstract

【課題】被写体の顔が撮影画角内のどこに存在していても、顔検出処理に要する時間を低減することができる撮像装置を提供する。
【解決手段】撮像装置は、被写体像を光電変換することにより画像データを取得する撮像手段(撮像部104)と、音声を検出する音声検出手段(マイク21)とを備える。また、音声検出手段の検出結果に応じて、撮像手段にて得られた画像データに基づいて生成された画像の一部の領域を選択し、選択された領域において被写体認識を行う認識手段(システム制御部110)を備える。
【選択図】図2

Description

本発明は、入射した光を電気信号に変換する撮像素子の出力をデジタル値に変換して画像データを得る撮像装置に関する。特に、被写体の顔を検出する機能を備える撮像装置に関する。
従来、人物撮影を行う場合において、主被写体である人物とその背景のコントラストの関係から焦点が人物に合わずに、背景に合ってしまうという問題があった。このような問題を解決するために、画面内の顔を検出し、検出した顔の位置に合焦させることで、人物に焦点を合わせる撮像装置が開発されている(特許文献1参照)。
更に、画像データ中の一部の領域内のみにて顔検出処理を行うことで、顔検出にかかる時間を低減する撮像装置が開示されている(特許文献2参照)。
特許文献2には以下の撮像装置が提案されている。
即ち、画像中における複数の部分領域を示す領域データを保持する保持手段と、保持手段に保持された領域データによって示される部分領域内の画像データから顔領域を検出する検出手段とを備える。この撮像装置によって、顔検出にかかる時間を低減している。
尚、画像データからの顔検出については、非特許文献1、2に記載されたものが知られている。更に、特許文献3〜6に記載されている手法で目を検出することにより、顔の位置や大きさを推定することもできる。
特開2001−215403号公報 特開2007−81732号公報 特開平3−17696号公報 特開平4−255015号公報 特開平5−300601号公報 特開平9−251342号公報 テレビジョン学会誌Vol.49,No.6,pp.787−797(1995)、「顔領域抽出に有効な修正HSV表色系の提案」 電子情報通信学会誌Vol.74−D−II,No.11,pp.1625−1627(1991)、「静止濃淡情景画像から顔領域を抽出する手法」
特許文献1に記載の撮像装置では、画面のどこに人物がいるか判らないため、画面全体を顔検出エリアとして設定していた。このため、顔検出処理に時間が多くかかっていた。
また、特許文献2に記載の撮像装置では、顔検出エリアとして設定されている部分領域が予め決められており、顔検出エリア外に被写体の顔が存在する場合には顔検出が不可能であった。
本発明の目的は、被写体の顔が撮影画角内のどこに存在していても、顔検出処理に要する時間を低減することができる撮像装置を提供することにある。
上記目的を達成するために、請求項1記載の撮像装置は、被写体像を光電変換することにより画像データを取得する撮像手段と、音声を検出する音声検出手段と、前記音声検出手段の検出結果に応じて、前記撮像手段にて得られた画像データに基づいて生成された画像の一部の領域を選択し、選択された領域において被写体認識を行う認識手段とを備えることを特徴とする。
本発明の撮像装置によれば、被写体の顔が撮影画角内のどこに存在していても、顔検出処理に要する時間を低減することができる。
以下、本発明の実施の形態を図面を参照しながら詳細に説明する。
図1は、本発明の実施の形態に係る撮像装置としてのデジタルカメラの外観斜視図である。
装置本体1は、光学ファインダ2、電源スイッチ(ボタン)3、静止画または動画を撮影する際に押下するレリーズスイッチ4、撮影の画角を変更するためのズームレバー5、モード切替スイッチ6を備える。
モード切替スイッチ6は、装置本体1における各種モードを切り替える。より具体的には、装置本体1の背面に印刷されたアイコンマーク1aにモード切替スイッチ6を合わせると、静止画記録モードへの切り替えが可能である。また、アイコンマーク1bにモード切替スイッチ6を合わせると、動画記録モードへの切り替えが可能である。また、アイコンマーク1cにモード切替スイッチ6を合わせると、再生モードにモードの切り替えが可能である。
液晶パネル7は、装置本体1の背面に備えられた表示手段であり、撮影レンズを介して撮像素子の受光面に結像した撮影前の被写体像をスルー画像として表示し、あるいは、撮影後記録された画像を再生して表示する。
操作部8は、操作者が各種操作を行う操作スイッチであり、具体的には、液晶パネル7上の表示を切り替える表示スイッチや、メニュースイッチ、印刷スイッチ、SETスイッチである。
十字スイッチ9は、十字に配置された4方向スイッチ(上スイッチ、下スイッチ、右スイッチ、左スイッチ)である。
図2は、図1のデジタルカメラのブロック図である。
以下、その構成を動作(機能)と併せて説明する。
図2において、バリア101は、装置本体1の、撮影レンズ102を含む撮像部を覆うことにより、撮像系の汚れや破損を防止する。撮影レンズ102、絞り機能を備えるシャッター103、光学像を電気信号に変換(光電変換)するCCDやCMOS素子等で構成される撮像部(撮像素子)104がある。
A/D変換器105は、アナログ信号をデジタル信号に変換する。A/D変換器105は、撮像部104から出力されるアナログ信号をデジタル信号に変換する場合や、音声制御部106から出力されるアナログ信号をデジタル信号に変換する場合に用いられる。
タイミング発生部107は、撮像部104、A/D変換器105、音声制御部106、D/A変換器108にクロック信号や制御信号を供給する。タイミング発生部107は、メモリ制御部109及びシステム制御部110により制御される。
画像処理部111は、A/D変換器105からのデータ、または、メモリ制御部109からのデータに対し所定の画素補間、縮小といったリサイズ処理や色変換処理を行う。
また、画像処理部111では、撮影した画像データを用いて所定の演算処理が行われ、得られた演算結果に基づいてシステム制御部110が露光制御、測距制御を行う。これにより、TTL(スルー・ザ・レンズ)方式のAF(オートフォーカス)処理、AE(自動露出)処理、EF(フラッシュプリ発光)処理が行われる。
画像処理部111では更に、撮影した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてTTL方式のAWB(オートホワイトバランス)処理も行っている。
A/D変換器105からの出力データは、画像処理部111及びメモリ制御部109を介して、あるいは、直接メモリ制御部109を介して、メモリ112に書き込まれる。メモリ112は、撮像部104によって得られ、A/D変換器105によりデジタルデータに変換された画像データや、液晶パネル7を含む画像表示部23に表示するための画像データを格納する。
尚、メモリ112は、マイク21(21a、21b)において録音された音声データ、静止画像、動画像及び画像ファイルを構成する場合のファイルヘッダを格納するのにも用いられる。従って、メモリ112は、所定枚数の静止画像や所定時間の動画像及び音声を格納するのに十分な記憶容量を備えている。
システム制御部110は、音声検出手段としてのマイク21の音声検出結果に応じて、撮像部104にて得られた画像データに基づいて生成された画像の一部の領域を選択し、選択された領域において被写体認識を行う認識手段として機能する。
圧縮/伸張部113は、適応離散コサイン変換(ADCT)等により画像データを圧縮、伸張する。圧縮/伸張部113は、シャッター103をトリガにしてメモリ112に格納された撮影画像を読み込んで圧縮処理を行い、処理を終えたデータをメモリ112に書き込む。
また、圧縮/伸張部113は、記録媒体200の記録部201等からメモリ112に読み込まれた圧縮画像に対して伸張処理を行い、処理を終えたデータをメモリ112に書き込む。
圧縮/伸張部113によりメモリ112に書き込まれた画像データは、システム制御部110のファイル部においてファイル化される。そして、インターフェース(I/F)114、コネクタ115、記録媒体200側のコネクタ203、インターフェース(I/F)202を介して、記録部201に記録される。また、メモリ112は、画像表示用のメモリ(ビデオメモリ)を兼ねている。
D/A変換器108は、メモリ112に格納されている画像表示用のデータをアナログ信号に変換して画像表示部23に供給する。画像表示部23は、液晶パネル7等の表示器上に、メモリ112に書き込まれた表示用の画像データをD/A変換器108を介してアナログ信号に変換して表示を行う。
マイク21から出力された音声信号は、アンプ等で構成される音声制御部106を介してA/D変換器105に供給され、A/D変換器105においてデジタル信号に変換された後、メモリ制御部109によってメモリ112に格納される。
一方、記録媒体200に記録されている音声データは、メモリ112に読み込まれた後、D/A変換器108によりアナログ信号に変換される。音声制御部106は、このアナログ信号によりスピーカ22を駆動し、音声出力する。
不揮発性メモリ116は、電気的に消去・記録可能なメモリであり、例えばEEPROM等が用いられる。不揮発性メモリ116には、システム制御部110の動作用の定数、プログラム等が記憶(記録)される。ここでいう、プログラムとは、本実施の形態にて後述する各種フローチャートを実行するためのプログラムのことである。
システム制御部110は、不揮発性メモリ116に記憶されたプログラムを実行することで、後述する本実施の形態の各処理を実現する。システムメモリ117は、RAMが用いられる。システムメモリ117には、システム制御部110の動作用の定数、変数、不揮発性メモリ116から読み出したプログラム等を展開(記憶)する。
ズームレバー5、モード切替スイッチ6、第1シャッタースイッチ51、第2シャッタースイッチ52、操作部8及び十字スイッチ9はシステム制御部110に各種の動作指示を入力するための操作手段である。
モード切替スイッチ6は、システム制御部110の動作モードを静止画記録モード、動画記録モード、再生モード等のいずれかに切り替えることができる。第1シャッタースイッチ51は、装置本体1に設けられたレリーズスイッチ4の操作途中(半押し)でオンとなり第1シャッタースイッチ信号SW1を発生する。
システム制御部110は、第1シャッタースイッチ信号SW1により、AF処理、AE処理、AWB処理、EF処理等の動作を開始する。
第2シャッタースイッチ52は、レリーズスイッチ4の操作完了(全押し)でオンとなり、第2シャッタースイッチ信号SW2を発生する。システム制御部110は、第2シャッタースイッチ信号SW2により、撮像部104からの信号読み出しから記録媒体200に画像データを書き込むまでの一連の撮影処理の動作を開始する。
操作部8の各操作部材は、画像表示部23に表示される種々の機能アイコンを選択操作すること等により、場面毎に適宜機能が割り当てられ、各種機能スイッチとして作用する。機能スイッチとしては、例えば、終了スイッチ、戻るスイッチ、画像送りスイッチ、ジャンプスイッチ、絞込みスイッチ、属性変更スイッチ等がある。
例えば、メニュースイッチが押されると各種設定が可能なメニュー画面が画像表示部23に表示される。操作者は、画像表示部23に表示されたメニュー画面と、十字スイッチ9やSETスイッチとを用いて直感的に各種設定を行うことができる。電源スイッチ3は、電源オン、電源オフを切り替える。
電源制御部118は、電池検出回路、DC−DCコンバータ、通電するブロックを切り替えるスイッチ回路等により構成され、電池の装着の有無、電池の種類、電池残量の検出を行う。また、電源制御部118は、その検出結果及びシステム制御部110の指示に基づいてDC−DCコンバータを制御し、必要な電圧を必要な期間、記録媒体200を含む各部へ供給する。
電源部119は、アルカリ電池やリチウム電池等の一次電池やNiCd電池やNiMH電池、Li電池等の二次電池、ACアダプター等からなる。コネクタ54及び55は電源部119と電源制御部118とを接続する。
RTC(Real Time Clock)120は、日付及び時刻を計時する。RTC120は、電源制御部118とは別に内部に電源部を保持しており、電源部119が落ちた状態であっても、計時状態を続ける。システム制御部110は、起動時にRTC120より取得した日時を用いてシステムタイマを設定し、タイマ制御を実行する。
インターフェース114は、メモリカードやハードディスク等の記録媒体200またはチューナーカードと、装置本体1とのインターフェースを司る。コネクタ115は、記録媒体200やチューナーカードとインターフェース114との接続を行う。記録媒体着脱検出部121は、コネクタ115に記録媒体200やチューナーカードが装着されているか否かを検出する。
記録媒体200は、図2においてはメモリカードやハードディスク等である。記録媒体200は、半導体メモリや磁気ディスク等から構成される記録部201、装置本体1とのインターフェース202、及び、記録媒体200と装置本体1とを接続するためのコネクタ203を備えている。
また、コネクタ115、203はSDI/Oカードの拡張規格に準拠しており、先述の記録媒体の他、SDI/Oカードの拡張規格に準拠したチューナーカードが着脱可能となっている。
通信部122は、RS232CやUSB、IEEE1394、P1284、SCSI、モデム、LAN、無線通信等の各種通信処理を行う。コネクタ(無線通信の場合はアンテナ)123は、通信部122を介して装置本体1を他の機器と接続する。
図3は、図2のデジタルカメラによって実行される撮影(撮像)処理の手順を示すフローチャートである。
図3に示される処理は、システム制御部110により実行される。例えば、システム制御部110は不図示のCPUを備え、例えば、システムメモリ117に格納された制御プログラムを実行することにより図3に示される処理を実現する。
図3において撮影動作が開始されると、ステップS301において、システム制御部110は、スルー表示される画像信号中に人の顔が存在するか否かを検出する顔検出処理を行う。この顔検出処理については図4を用いて後述する。
システム制御部110は、顔検出処理において人の顔が検出された場合、画像信号中において検出した顔の位置座標、サイズ(幅、高さ)、検出個数、信頼性係数等を顔情報としてシステムメモリ117に記憶する。顔検出処理において顔が検出されなかった場合は、システムメモリ117内の位置座標、サイズ(幅、高さ)、検出個数、信頼性係数等の領域に0を設定する。
続いてステップS302において、第1シャッタースイッチ信号SW1がONされたか否か判定される。第1シャッタースイッチ信号SW1がOFFであれば、再度ステップS301の顔検出処理が実行され、ONであれば、次のステップS303に進む。
ステップS303において、システム制御部110は、測距処理を行って撮影レンズ102の焦点を被写体に合わせるとともに、測光処理を行って絞り値及びシャッター時間(シャッタースピード)を決定する。
尚、測光処理において、必要であればフラッシュの設定も行われる。このとき、ステップS301において顔が検出されていれば、検出した顔の範囲で測距を行うようにすることも可能である。
次に、ステップS304では、第2シャッタースイッチ信号SW2のON/OFF状態を判定する。第1シャッタースイッチ信号SW1がONした状態で、第2シャッタースイッチ信号SW2がONになると、処理はステップS304からステップS306へ進む。
第2シャッタースイッチ信号SW2がONせずに、更に第1シャッタースイッチ信号SW1も解除された場合(ステップS305)、処理はステップS305からステップS301へ戻る。
また、第1シャッタースイッチ信号SW1がON、第2シャッタースイッチ信号SW2がOFFの間は、ステップS303〜S305の処理が繰り返される。
第2シャッタースイッチSW2が押されると(第2シャッタースイッチ信号SW2がONされると)、ステップS306において、システム制御部110は、露光処理や現像処理を含む撮影処理(露光処理)を実行する。
尚、露光処理では、撮像部104、A/D変換器105を経て得られた画像データが、画像処理部111及びメモリ制御部109を介して、或いはA/D変換器105から直接メモリ制御部109を介して、メモリ112に書き込まれる。
また、現像処理では、システム制御部110が、メモリ制御部109そして必要に応じて画像処理部111を用いて、メモリ112に書き込まれた画像データを読み出して各種処理を行う。
撮影後、ステップS307において、システム制御部110は、撮影処理で得られた画像データを画像ファイルとして記録媒体200に対して書き込む記録処理を実行する。
次に、顔検出処理について説明する。
顔検出処理に過大な時間を要すると、シャッターチャンスを捉えるのが困難になるため、顔検出処理に要する時間を低減する必要がある。顔検出処理に要する時間を低減するには、顔検出領域を撮影範囲のうち一部領域に限定することが有効である。
しかしながら、被写体の顔は、必ずしも撮影範囲の中心付近に位置するわけではなく、撮影構図によっては撮影範囲の隅に位置する場合がある。
そこで、本実施の形態では、被写体の発する音声の音源位置を検出して、検出された音源位置を含む領域のみを顔検出処理することによって、顔検出処理に要する時間の低減と、撮影範囲内の任意の位置に存在する被写体の顔検出の両立を図る。
図4は、図3のステップS301で実行される顔検出処理の手順を示すフローチャートである。
顔検出処理がスタートすると、ステップS401において、音源方向検出処理が行われる。音源方向の検出方法は公知であり、例えば、特開平07−140527号公報に、複数マイクの位相差を利用して音源の方向を検出する技術が開示されている。
以下に、特開平07−140527号公報に開示されている音源方向検出手段について概略を説明する。
(第1の実施の形態)
第1の実施の形態は、図5の音源方向検出手段を用いて行う音源方向検出処理である。
図5は、図4のステップS401で実行される音源方向検出処理に用いられる音源方向検出手段の第1の構成例を示す図である。
図5において、マイク21a、21bは、音源501から発せられた音声を検出し、その検出信号は位相差検出回路502に入力される。
位相差検出回路502は、複数のマイク21a、21bで検出された音の位相差を検出する回路である。音源501からマイク21aまでの距離L1と、マイク21bまでの距離L2に差があると、マイク21の出力信号に位相差が生じるため、既知のマイク間距離と音速から、音源の方向を演算によって特定することが可能となる。
尚、マイクを左右に1個ずつの計2個を用いることにより、撮像装置における左右方向の音源位置を検出することができる。また、上下方向において、異なる位置に更にもう1つマイクを備えることにより、撮像装置(デジタルカメラ)における上下方向についても音源位置を検出することができる。
図4に戻り、ステップS402において、音声と音源方向の検出に成功したか否か判定される。成功した場合は、引き続きステップS403に進み、音源方向の検出に失敗した場合は、ステップS407に進む。
ステップS403では、レンズの焦点距離情報と検出された音源方向の情報にから、音源の方向が撮影画角内であるか否かについて判定される。音源の方向が撮影画角内であればステップS404に進み、撮影画角外であればステップS407に進む。
ステップS404では、顔検出処理を実行する画像領域(顔検出領域)の設定を行う。
図6は、図4のステップS404で設定される顔検出領域を示す図である。より具体的には、図6は、撮影領域に対する音源の位置と顔検出領域の関係を示す図である。
本実施の形態では、図6に示す通り、図5の音源方向検出手段によって検出された音源位置を中心とするように、撮影範囲の25%の領域を顔検出処理領域として設定する。
尚、顔検出領域の大きさは、音声信号の大きさによって変えても良いし、レンズの焦点距離によって変えても良い。また、音源方向検出手段によって複数の音源が検出された場合には、顔検出処理領域を音源の個数に合わせて複数設定しても良い。
図4に戻り、続いてステップS405にて、顔検出処理領域として設定された領域内にて公知の顔検出処理を実行する。ステップS406にて、顔検出に成功した場合は、一連の顔検出処理を終了し、顔検出に失敗した場合は、ステップS408に進む。
ステップS401での音声検出の結果、音声検出に失敗するか、あるいは検出された音源方向が画角外であった場合は、上述の通りステップS407に進む。
ステップS407では、撮影画角内の全範囲において公知の顔検出処理が実行される。これにより、被写体となる人物が音声を発していない場合、または被写体の発する音声が背景雑音に妨げられて検出できなかった場合でも、撮影画角内の全範囲を顔検出処理することによって、顔検出の検出漏れを防ぐことができる。
ステップS405における選択領域内での顔検出処理の結果、ステップS406で顔検出に失敗した場合は、上述の通りステップS408に進む。
ステップS408では、選択領域外にて顔検出処理が実行される。これにより、人物以外の音源が検出されてしまうことで主被写体である人物が顔検出領域から外れてしまった場合でも、顔検出領域外にて顔検出処理を実行するため、確実に被写体の顔を検出することができる。
以上説明した通り、本実施の形態によれば、撮影画角内のうち一部領域に限定して顔検出処理を実行するため、顔検出処理に要する時間を短縮することができる。また、顔検出処理を実行する顔検出領域は、音源方向を含む領域に自動設定されるため、被写体の顔検出は、撮影画角内の全領域において可能となり、撮影構図の自由度が確保される。
図5に示す音源方向検出手段では、音源方向を検出する際に、音声信号の周波数に関わらず検出するため、人の発声音以外の雑音を検出することがある。その場合、音源位置を含む顔検出領域内には被写体である人の顔が存在せず、顔検出領域内にて顔検出処理を行った後に改めて顔検出領域の外側で顔検出処理を実行することになる。
そこで、以下の特開平05−215833号公報にて開示されている音源方向検出手段を用いて、人の発声音の音源方向を検出して、顔検出領域を設定することを可能にする。
(第2の実施の形態)
第2の実施の形態は、図7の音源方向検出手段を用いて行う音源方向検出処理である。
図7は、図4のステップS401で実行される音源方向検出処理に用いられる音源方向検出手段の第2の構成例を示す図である。
図7において、指向性の高いマイク21aと21bの出力信号はバンドパスフィルタ(BPF)701(701a、701b)によって、特定周波数のみ減衰無く通過する。
音圧差検出回路702では、各マイクが出力した音圧レベルを比較し、音圧レベルの差値がシステム制御部110へ出力される。
音源がマイク21の指向特性パターンから離れる程、マイク21が出力する音圧レベルは下がるため、各マイク21の出力する音圧レベルに差があれば、高いレベルを出力するマイク側に音声信号を発する音源501があることが検出できる。また、両出力レベルの差が小さい程、音源501が真正面にあることが検出できる。
ここで、バンドパスフィルタ401が減衰無く通過させる特定帯域の周波数を、例えば、人の発声する周波数帯域である2KHz前後とすることで、人の発声音の音源位置を検出することが可能となる。
また、指向性のマイク21を左右に1個ずつの計2個を用いることにより、撮像装置(デジタルカメラ)における左右方向の音源位置を検出することができる。更に、上下方向において異なる位置に更にもう1つマイクを備えることにより、撮像装置(デジタルカメラ)における上下方向についても音源位置を検出することができる。マイクの数を増やせば音源位置の検出精度は更に高まる。
以上説明した通り、本実施の形態によれば、音源方向検出手段にバンドパスフィルタを備えることで、特定周波数の音源方向を検出することが可能となる。バンドパスフィルタの透過帯域を、例えば、人の発声する周波数帯域である2KHzとすることで、人の発声音の音源方向を検出することができるため、第1の実施の形態と比べて、顔検出領域を効率的に設定可能となる。
(第3の実施の形態)
第1の実施の形態で示した位相差方式の音源位置検出手段と、第2の実施の形態で示した指向性のマイクによる音圧差方式の音源位置検出手段を共に装置本体1に備え、撮影レンズ102の焦点距離によって位相差方式と音圧差方式を使い分ける。このことで、より好適に音源501の位置を検出可能になる。
具体的には、広角寄りでは、位相差方式の音源位置検出手段を用いて音源501の位置を検出し、望遠寄りでは、音圧差方式を用いて音源501の位置を検出することで、より高い精度で音源位置を検出することができる。
広角寄りでは、音源501は、装置本体1の正面から外れた位置に存在する可能性があり、その場合、複数のマイク21a、21bと音源501との距離L1、L2の差が大きくなる。そのため位相差が大きくなり、位相差方式の音源位置検出手段による音源位置の検出精度が高くなる。
一方、複数の指向性のマイクを用いた音圧差方式では、検出範囲の狭い指向性のマイクの特性により、いずれのマイクでも充分な音圧を検出できず、音圧差が小さくなるので、充分な検出精度が確保できない。
望遠寄りでは、音源501の位置は、装置本体1のほぼ正面に存在する可能性が高い。その場合、音声検出範囲の狭い指向性のマイクを用いた音圧差方式であれば、各マイク21a、21bの出力に差が生じるため、音源位置を検出し易い。
一方、音源501と各マイク21a、21bとの距離L1、L2には差が生じにくく、位相差が小さくなってしまい、位相差方式では充分な検出精度が確保できない。
従って、広角寄りでは、位相差方式の音源位置検出手段を用いて音源501の位置を検出し、望遠寄りでは音圧差方式を用いて音源501の位置を検出することで、より高い精度で音源位置を検出することができる。
本発明の実施の形態に係る撮像装置としてのデジタルカメラの外観斜視図である。 図1のデジタルカメラのブロック図である。 図2のデジタルカメラによって実行される撮影(撮像)処理の手順を示すフローチャートである。 図3のステップS301で実行される顔検出処理の手順を示すフローチャートである。 図4のステップS401で実行される音源方向検出処理に用いられる音源方向検出手段の第1の構成例を示す図である。 図4のステップS404で設定される顔検出領域を示す図である。 図4のステップS401で実行される音源方向検出処理に用いられる音源方向検出手段の第2の構成例を示す図である。
符号の説明
1 装置本体
21 マイク
104 撮像部
106 音声制御部
110 システム制御部
111 画像処理部
502 位相差検出回路
702 音圧差検出回路

Claims (12)

  1. 被写体像を光電変換することにより画像データを取得する撮像手段と、
    音声を検出する音声検出手段と、
    前記音声検出手段の検出結果に応じて、前記撮像手段にて得られた画像データに基づいて生成された画像の一部の領域を選択し、選択された領域において被写体認識を行う認識手段と、
    を備えることを特徴とする撮像装置。
  2. 前記音声検出手段は、人の発声音を検出することを特徴とする請求項1記載の撮像装置。
  3. 前記音声検出手段は、人の発声の周波数帯域の周波数を検出することで、人の発声音を検出することを特徴とする請求項2記載の撮像装置。
  4. 前記音声検出手段は、音源の方向を検出することを特徴とする請求項1乃至3のいずれかに記載の撮像装置。
  5. 前記音声検出手段は、複数のマイクの出力信号の位相差を利用して音源の方向を検出することを特徴とする請求項4記載の撮像装置。
  6. 前記音声検出手段は、複数のマイクの出力信号の音圧差を利用して音源の方向を検出することを特徴とする請求項4記載の撮像装置。
  7. 前記認識手段は、前記音声検出手段が検出した音源方向を含む領域を選択し、選択された領域において被写体認識を行うことを特徴とする請求項4乃至6のいずれかに記載の撮像装置。
  8. 前記認識手段は、前記音声検出手段が検出した音源が撮影画角外の場合は、前記撮像手段にて得られた画像データの全領域において被写体認識を行うことを特徴とする請求項4乃至7のいずれかに記載の撮像装置。
  9. 前記認識手段は、前記音声検出手段が音源の方向を検出できなかった場合は、前記撮像手段にて得られた画像データの全領域において被写体認識を行うことを特徴とする請求項4乃至7のいずれかに記載の撮像装置。
  10. 装置本体に備えられた撮影レンズの焦点距離によって、前記音源の方向を検出する方法を変更することを特徴とする請求項4記載の撮像装置。
  11. 前記撮影レンズの焦点距離が広角寄りのときは、前記音声検出手段は、複数のマイクの出力信号の位相差を利用して音源の方向を検出することを特徴とする請求項10記載の撮像装置。
  12. 前記撮影レンズの焦点距離が望遠寄りのときは、前記音声検出手段は、複数のマイクの出力信号の音圧差を利用して音源の方向を検出することを特徴とする請求項10記載の撮像装置。
JP2008145846A 2008-06-03 2008-06-03 撮像装置 Pending JP2009296143A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008145846A JP2009296143A (ja) 2008-06-03 2008-06-03 撮像装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008145846A JP2009296143A (ja) 2008-06-03 2008-06-03 撮像装置

Publications (1)

Publication Number Publication Date
JP2009296143A true JP2009296143A (ja) 2009-12-17

Family

ID=41543955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008145846A Pending JP2009296143A (ja) 2008-06-03 2008-06-03 撮像装置

Country Status (1)

Country Link
JP (1) JP2009296143A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013172313A (ja) * 2012-02-21 2013-09-02 Nikon Corp 情報処理装置及び情報処理プログラム
JP2015514239A (ja) * 2012-04-13 2015-05-18 クゥアルコム・インコーポレイテッドQualcomm Incorporated マルチモーダル整合方式を使用するオブジェクト認識

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013172313A (ja) * 2012-02-21 2013-09-02 Nikon Corp 情報処理装置及び情報処理プログラム
JP2015514239A (ja) * 2012-04-13 2015-05-18 クゥアルコム・インコーポレイテッドQualcomm Incorporated マルチモーダル整合方式を使用するオブジェクト認識
JP2018077479A (ja) * 2012-04-13 2018-05-17 クゥアルコム・インコーポレイテッドQualcomm Incorporated マルチモーダル整合方式を使用するオブジェクト認識

Similar Documents

Publication Publication Date Title
JP5173453B2 (ja) 撮像装置及び該撮像装置の表示制御方法
JP5025532B2 (ja) 撮影装置、撮像装置の制御方法及び撮像装置の制御プログラム
JP4574459B2 (ja) 撮影装置及びその制御方法及びプログラム及び記憶媒体
US20150181135A1 (en) Image capturing apparatus and control method thereof
JP5424732B2 (ja) 撮像装置、その制御方法及びプログラム
JP2012227839A (ja) 撮像装置
JP2006211103A (ja) 撮像装置及びその制御方法
JP2007232793A (ja) 撮像装置
JP2008175995A (ja) 撮像装置
JP2010193007A (ja) 撮像装置
US10075638B2 (en) Apparatus that performs zooming operation, control method therefor, and storage medium
JP2007081732A (ja) 撮像装置
JP2007281647A (ja) 電子カメラおよび画像処理装置
JP5322817B2 (ja) 3次元画像撮像装置及び3次元画像表示方法
JP4953971B2 (ja) 画像処理装置、画像処理装置の制御方法、および、これを実行させるためのプログラム
JP2005266784A (ja) 撮像装置、その制御方法、その制御プログラムおよび記憶媒体
JP5043787B2 (ja) 撮影装置及びその制御方法
JP2009296143A (ja) 撮像装置
US8810690B2 (en) Method of controlling digital photographing apparatus and digital photographing apparatus using the same
JP5004876B2 (ja) 撮像装置
JP5116494B2 (ja) 撮像装置
JP5072423B2 (ja) ノイズ除去装置、及びノイズ除去方法
JP2020043398A (ja) 撮像装置及びその制御方法、プログラム、記憶媒体
JP5178438B2 (ja) 撮像装置、撮像装置の制御方法及びプログラム
JP6346398B2 (ja) 撮像装置および撮像方法