JP5181935B2 - 画像処理装置、プログラム及び被写体検出方法 - Google Patents

画像処理装置、プログラム及び被写体検出方法 Download PDF

Info

Publication number
JP5181935B2
JP5181935B2 JP2008223731A JP2008223731A JP5181935B2 JP 5181935 B2 JP5181935 B2 JP 5181935B2 JP 2008223731 A JP2008223731 A JP 2008223731A JP 2008223731 A JP2008223731 A JP 2008223731A JP 5181935 B2 JP5181935 B2 JP 5181935B2
Authority
JP
Japan
Prior art keywords
feature data
setting
subject
detection
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008223731A
Other languages
English (en)
Other versions
JP2010062655A (ja
Inventor
賢治 吉沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2008223731A priority Critical patent/JP5181935B2/ja
Publication of JP2010062655A publication Critical patent/JP2010062655A/ja
Application granted granted Critical
Publication of JP5181935B2 publication Critical patent/JP5181935B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Devices (AREA)

Description

本発明は、画像データにおいて被写体を検出する画像処理装置、被写体検出プログラム及び被写体検出方法に関する。
従来、撮像される画像において顔部分を検出する顔検出技術が撮像装置等において用いられている。この顔検出技術は、顔画像の特徴を表すテンプレートを予め記憶しておき、撮像結果として得られるフレーム画像から抽出した画像について、前記テンプレートを用いてマッチングを行い顔画像であるか否かを判断するようにしている(例えば、特許文献1参照)。
特開2003−271933号公報
しかしながら、顔画像の特徴は人種により異なることから、人種に左右されることなく顔部分を検出可能とするためには、人種毎に顔画像の特徴を表すテンプレートを記憶しておくことが必要となる。
また、前記マッチングを行う際には、前記テンプレートをRAM内に展開して一次記憶し、この展開したテンプレートとフレーム画像から抽出した画像との比較を行うことになる。したがって、人種に左右されることなく顔部分を検出可能とするためには、前記人種毎に顔画像の特徴を表すテンプレートを全てを読み出して、RAM内に登録して展開しなければならない。よって、顔検出を行うに際しては、RAM内に全てのテンプレートを登録して、顔検出処理を実行することとなり、その結果、無用な処理負担が発生して、顔検出処理が遅延する要因となる。
また、RAMは他の処理のワークエリア等としても利用されるが、顔検出処理に多数のテンプレートが用いられると、これらテンプレートによりRAMの大部分が占有されてしまう。その結果、他の処理に必要なデータやプログラム等を当該RAMに展開することが困難となり、前述した顔検出処理のみならず、他の処理も遅延してしまうという問題があった。
本発明は、かかる従来の課題を鑑みてなされたものであり、画像データからの被写体検出処理における処理負担を軽減できるようにすることを目的とする。
前記課題を解決するため請求項1記載の発明に係る画像処理装置にあっては、予め記憶手段に記憶されている複数種の特徴データを用い、画像データにおいて被写体領域を検出する検出手段を備えた画像処理装置であって、当該装置の所定の機能を実現させるための設定項目を設定する項目設定手段と、前記記憶手段から、前記項目設定手段による設定項目の設定結果に基づき、前記被写体領域の検出に際して用いる特徴データを選択する選択手段と、 この選択手段により選択された前記特徴データに基づいて、前記検出手段による前記画像データにおいて被写体領域を検出する処理を制御する検出制御手段と、を備えることを特徴とする。
また、請求項記載の発明に係る画像処理装置にあっては、前記設定項目は、ユーザにより当該装置に設定される使用言語を示す情報の設定、ユーザによる当該装置の使用地域を示す情報の設定のうち少なくとも一つを含むことを特徴とする。
また、請求項記載の発明に係る画像処理装置にあっては、前記検出制御手段は、前記選択手段によって前記使用言語を示す情報及びユーザによる当該装置の使用地域を示す情報に基づき、複数の特徴データが選択された場合には、これら選択された全ての特徴データを用いて、前記画像データにおいて被写体領域を検出するように前記検出手段を制御することを特徴とする。
また、請求項記載の発明に係る画像処理装置にあっては、前記選択手段は、前記設定結果として前記使用言語を示す情報、及びユーザによる当該装置の使用地域を示す情報が設定された場合、予め定められた優先順位に従って、特徴データを選択することを特徴とする。
また、請求項記載の発明に係る画像処理装置にあっては、前記選択手段は、前記検出手段が前記選択された前記特徴データを用いて画像データにおいて被写体領域を検出しなかった場合、前記選択された特徴データ以外の他の特徴データを選択することを特徴とする。
また、請求項記載の発明に係る画像処理装置にあっては、前記複数種の特徴データ毎に検出のための閾値を設定する設定手段と、前記設定手段に設定されている閾値のうち、前記選択手段により選択された前記特徴データに対応する閾値を下降制御して前記設定手段に設定する閾値制御手段とを更に備え、前記検出制御手段は、前記閾値制御手段によって閾値が下降制御された特徴データを用いて、前記閾値以上で類似していると判断された領域を被写体領域として検出するように前記検出手段を制御することを特徴する。
また、請求項記載の発明に係る画像処理装置にあっては、前記特徴データは、各人種に対応する顔画像テンプレート、各人種に対応する顔における特徴点情報、各人種に対応する肌の色情報のうちの少なくとも1つを含み、前記検出手段は、前記特徴データに基づき、前記被写体領域を検出する処理を実行することを特徴とする。
また、請求項記載の発明に係る画像処理装置にあっては、前記記憶手段は、所定の特徴別に分類して前記複数種の特徴データを記憶してなることを特徴とする。
また、請求項記載の発明に係る画像処理装置にあっては、前記所定の特徴別とは、被写体の人種別であることを特徴とする。
また、請求項10記載の発明に係るプログラムにあっては、予め記憶手段に記憶されている複数種の特徴データを用い、画像データにおいて被写体領域を検出する被写体検出手段を備えた画像処理装置が有するコンピュータを、当該装置の所定の機能を実現させるための設定項目を設定する項目設定手段と、前記記憶手段から、前記項目設定手段による設定項目の設定結果に基づき、前記被写体領域の検出に際して用いる特徴データを選択する選択手段と、この選択手段により選択された前記特徴データに基づいて、前記検出手段による前記画像データにおいて被写体領域を検出する処理を制御する検出制御手段として機能させることを特徴とする。
また、請求項11記載の発明に係る被写体検出方法にあっては、予め記憶手段に記憶されている複数種の特徴データを用い、画像データにおいて被写体領域を検出する被写体検出方法であって、所定の機能を実現させるための設定項目を設定する項目設定ステップと、前記記憶手段から、前記項目設定手段による設定項目の設定結果に基づき、前記被写体の検出に際して用いる特徴データを選択する選択ステップと、この選択ステップにより選択された前記特徴データに基づいて、前記画像データにおいて被写体領域を検出する処理を制御する検出制御ステップとを含むことを特徴とする。
本発明によれば、画像データからの被写体検出処理時における処理負担を軽減することができる。
以下、本発明の一実施の形態を図に従って説明する。図1は、本発明の一実施の形態を適用したデジタルカメラ1の電子回路構成を示す図である。このデジタルカメラ1は、基本モードである撮影モードにおいて、ズームレンズ12−1を移動させて光学ズーム動作を行わせるズーム駆動部11−1、フォーカスレンズ12−2を移動させて合焦動作を行わせるAF駆動部11−2、ズームレンズ12−1及びフォーカスレンズ12−2を含む撮像レンズ2を構成するレンズ光学系12、撮像素子であるCCD13、タイミング発生器(TG)14、垂直ドライバ15、サンプルホールド回路(S/H)16、A/D変換器17、カラープロセス回路18、DMA(Direct Memory Access)コントローラ19、DRAMインターフェイス(I/F)20、DRAM21を備えていている。また、制御部22、VRAMコントローラ23、VRAM24、デジタルビデオエンコーダ25、表示部26、JPEG(Joint Photograph cording Experts Group)回路27、保存メモリ28を備えているとともに、RAM29、データベース30、及びキー入力部32を備えている。
撮影モードでのモニタリング状態においては、ズーム駆動部11−1は、光学ズーム指示があると制御部22からの制御信号に基づいて、図示しないズームレンズ駆動モータを駆動してズームレンズ12−1を光軸に沿って前後に移動させることによりCCD13に結像させる画像の倍率そのものを変化させる。また、AF駆動部11−2は図示しないフォーカスレンズ駆動モータを駆動してフォーカスレンズ12−2を移動させる。そして、前記撮像レンズ2を構成するレンズ光学系12の撮影光軸後方に配置された撮像素子であるCCD13が、タイミング発生器(TG)14、垂直ドライバ15によって走査駆動され、一定周期ごとに結像した光像に対応する光電変換出力を1フレーム分出力する。
CCD13は被写体の二次元画像を撮像する固体撮像デバイスであり、典型的には毎秒数十フレームの画像を撮像する。なお、撮像素子はCCDに限定されずCMOS(Complementary Metal Oxide Semiconductor)などの固体撮像デバイスでもよい。
この光電変換出力は、アナログ値の信号の状態でRGBの各原色成分ごとに適宜ゲイン調整された後に、サンプルホールド回路(S/H)16でサンプルホールドされ、A/D変換器17でデジタルデータ(画素)に変換され、カラープロセス回路18で画像補間処理及びγ補正処理を含むカラープロセス処理が行われて、デジタル値の輝度信号Y及び色差信号Cb、Crが生成され、DMA(Direct Memory Access)コントローラ19に出力される。
DMAコントローラ19は、カラープロセス回路18の出力する輝度信号Y及び色差信号Cb、Crを、同じくカラープロセス回路18からの複合(composite)同期信号、メモリ書き込みイネーブル信号、及びクロック信号を用いてDRAMインターフェイス(I/F)20を介してバッファメモリとして使用されるDRAM21にDMA転送する。
制御部22は、このデジタルカメラ1全体の制御動作を司るものであり、CPU若しくはMPU(以下、CPU)と、後述するフローチャートに示す処理を実行するためのプログラム等を記憶したフラッシュメモリ等のプログラム格納メモリ等により構成される。そして、前記輝度及び色差信号のDRAM21へのDMA転送終了後に、この輝度及び色差信号をDRAMインターフェイス20を介してDRAM21から読出し、VRAMコントローラ23を介してVRAM24に書き込む。
また、制御部22は、キー入力部32からの状態信号に対応してフラッシュメモリ等のプログラム格納用メモリに格納されている各モードに対応の処理プログラムやメニューデータを取り出して、デジタルカメラ1の各機能の実行制御、具体的には撮影動作や、光学ズーム時のズームレンズの動作制御や、デジタルズーム、ライブビュー表示、自動合焦、撮影、記録、及び記録した画像の再生・表示等の実行制御等や機能選択時の機能選択メニューの表示制御、操作ガイドの表示制御、現在時刻の表示制御等を行う。
なお、これらの機能選択メニューの表示制御、操作ガイドの表示制御は、後述するように日本語、英語、フランス語、イタリア語、オランダ語、ポルトガル語、中国語のいずれによっても表示可能である。また、現在時刻は、後述するワールドタイムのいずれによっても表示可能である。
デジタルビデオエンコーダ25は、ライブビュー表示状態にあっては、前記輝度及び色差信号をVRAMコントローラ23を介してVRAM24から定期的に読み出し、これらのデータを基に表示部26が備える解像度に対応するビデオ信号を生成して前記表示部26に出力する。表示部26は、上述したように撮影モード時にはモニタ表示部(電子ファインダ)として機能するもので、デジタルビデオエンコーダ25からのビデオ信号に基づいたライブビュー画像データの表示を行うことで、その時点でVRAMコントローラ23から取り込んでいる画像情報に基づく画像をリアルタイムに表示する。
制御部22は撮影指示に応じてその時点でCCD13から取り込んでいる1フレーム分の輝度及び色差信号のDRAM21へのDMA転送の終了後、直ちにCCD13からのDRAM21への経路を停止し、記録保存の状態に遷移する。
この保存記録の状態では、制御部22がDRAM21に書き込まれている1フレーム分の輝度及び色差信号をDRAMインターフェイス20を介してY、Cb、Crのコンポーネントごとに縦8画素×横8画素の基本ブロックと呼称される単位で読み出してJPEG回路27に書込み、このJPEG回路27でADCT(Adaptive Discrete Cosine Transform:適応離散コサイン変換)、エントロピー符号化方式であるハフマン符号化等の処理によりデータ圧縮する。そして得た符号データを1画像のデータファイルとしてJPEG回路27から読出し、保存メモリ28に記録保存する。また、1フレーム分の輝度及び色差信号の圧縮処理及び保存メモリ28への全圧縮データの書込み終了に伴って、制御部22はCCD13からDRAM21への経路を再び起動する。
基本モードである再生モード時には、制御部22が保存メモリ28に記録されている画像データを選択的に読出し、JPEG回路27で画像撮影モード時にデータ圧縮した手順と全く逆の手順で圧縮されている画像データを伸張し、伸張した画像データを、VRAMコントローラ23を介してVRAM24に展開して記憶させた上で、このVRAM24から定期的に読出し、これらの画像データを元にビデオ信号を生成して表示部26で再生出力させる。
なお、表示部26には、透明のタッチパネル31が積層されており、タッチパネル31はタッチ位置を検出して制御部22に入力する。
前記JPEG回路27は複数の圧縮率に対応しており、圧縮率に対応させて記憶するモードには圧縮率の低い高解像度(一般に、高精細、ファイン、ノーマルなどと呼ばれる)に対応するモードと、圧縮率の高い低解像度(一般にエコノミーなどと呼ばれる)モードがある。また、高画素数から低画素数にも対応している。
保存メモリ28は、内蔵メモリ(フラッシュメモリ)やハードディスク、あるいは着脱可能なメモリカード等の記録媒体からなり画像データや撮影情報等を保存記録する。
RAM29は、前記制御部22が有するCPUのワークメモリとして使用されるとともに、データベース30に記憶されているデータを選択して使用する際のワークメモリとして使用される。
データベース30には、図2に示すメニュー画面等各言語テーブル301、図3に示す特徴データテーブル302、図4に示す設定言語対応テーブル303、及び図5に示すワールドタイム対応テーブル304が予め記憶されている。
図2示すメニュー画面等各言語テーブル301には、各々同一内容のメニューの表示制御データ、操作ガイド等の表示制御データが、「日本語」、「英語」、「フランス語」、「イタリア語」、「オランダ語」、「ポルトガル語」、「中国語」で表示可能に格納されている。したがって、このメニュー画面等各言語テーブル301から、対応する設定された言語に対応するメニューの表示制御データ、操作ガイドの表示制御データを読み出すことにより、デジタルカメラ1において、設定された言語でメニュー表示等を行うことが可能となる。
図3に示す特徴データテーブル302には、「白人」、「黒人」、「アフリカ人」、「日本人」、「東アジア人」、「西アジア人」、「中南米人」の人種毎に骨格や肌の色等、顔の特徴を表す特徴データ格納されている。
顔の特徴データとしては、下記(1)(2)(3)の少なくともいずれか1つが用いられて、記憶されている。
(1)顔の特徴データは、各人種に対応する顔画像テンプレートであり、顔検出は顔画像テンプレートとのマッチングによって行われる。したがって、この場合の処理内容は、画像データとこれら登録されている顔画像テンプレートとのマッチング処理であるから、比較的簡単な処理で顔検出を行うことができる。
(2)顔の特徴データは、各人種に対応する顔における目、鼻、口などの特徴点情報であり、顔検出は顔特徴点情報によって行われる。したがって、この場合の処理内容は、画像データから、登録されている目、鼻、口などの特徴点の検出であるから、精度よく顔検出を行うことができる。
(3)顔の特徴データは、各人種に対する肌の色情報であり、顔検出は肌色検出によって行われる。したがって、この場合の処理内容は、画像データから登録されている人種に対する肌の色領域の検出処理であるから、比較的簡単な処理で顔検出を行うことができる。また、肌色検出によれば顔以外の被写体領域についても検出可能である。
図4に示す設定言語対応テーブル303には、後述するようにして選択される言語設定「日本語」、「英語」、「フランス語」、「イタリア語」、「オランダ語」、「ポルトガル語」、「中国語」に対応して、特徴データグループ、つまり図3に示した特徴データテーブル302に記憶された特徴を示す人種名「白人」、「黒人」、「アフリカ人」、「日本人」、「東アジア人」、「西アジア人」、「中南米人」のいずれかが単数又は複数記憶されている。したがって、「日本語」〜「中国語」のいずれかが言語設定された際には、この設定言語対応テーブル303より「日本語」〜「中国語」に対応する特徴データグループ「日本人」・・・を特定し、この特定した特徴データグループ「日本人」・・・に対応する特徴データを図3の特徴データテーブル302から読み出すことができる。
図5に示すワールドタイム対応テーブル304には、表示部26の一部に表示させる現在時刻をワールドタイムで表示させる際に当該ワールドタイムとして選択可能な状態な都市名「東京」、「ニューヨーク」、「パリ」、「カイロ」、「シドニー」、「リオ・デ・ジャネイロ」、「ペキン」が記憶されているとともに、これらに対応して、特徴データグループ、つまり図3に示した特徴データテーブル302に記憶された特徴を示す人種名「日本人」、「白人、黒人」、「白人、黒人」、「白人、アフリカ人」、「白人」、「中南米人」、「東アジア人」が記憶されている。したがって、ワールドタイム「東京」〜「ペキン」のいずれかが表示時刻として設定された際には、このワールドタイム対応テーブル304より「東京」〜「ペキン」に対応する特徴データグループ「日本人」・・・を特定し、この特定した特徴データグループ「日本人」・・・に対応する特徴データを図3の特徴データテーブル302から読み出すことができる。
キー入力部32は、モードダイアル、カーソルキー、SETキー、ズームボタン(Wボタン、Tボタン)、シャッターキー、及び電源ボタン等と、それらのキーが操作されると操作されたキーの操作信号を生成して制御部22に送出するキー処理部(図示せず)等から構成されている。
モードダイアルは撮影モードや再生モードの選択を行うものである。カーソルキーはモード設定やメニュー選択等に際して表示部26に表示されるメニューやアイコン等をカーソルでポイントを指定する際に操作するキーであり、カーソルキーの操作によりカーソルを上下又は左右に移動させることができる。また、SETキーはカーソルキーによってカーソル表示されている項目を選択設定する際に押されるキーである。ズームボタンは、ズーム操作に用いられ、光学ズームの場合はズームボタン(Wボタン又はTボタン)の操作に対応してズームレンズ(可変焦点距離レンズ)12−1がワイド側またテレ側に移動されズームボタンの操作に対応してズーム値が決定され、ズーム値の変化に追従して画角が実際に変化し、表示部26にはワイド(広角)画像又はテレ(望遠)画像が表示される。
シャッターキーは、撮影時にレリーズ操作を行うもので、2段階のストロークを有しており、1段目の操作(半押し状態)でオートフォーカス(AF)と自動露出(AE)を行わせるための合焦指示信号を発生し、2段目の操作(全押し状態)で撮影処理を行うための撮影指示信号を発生する。
(第1の実施の形態)
以上の構成に係る本実施の形態において、言語設定モードに移行すると制御部22は、プログラムに従って図6のフローチャートに示すように処理を実行する。すなわち、ユーザがキー入力部32にて、言語設定モードを設定すると、制御部22は言語設定表示処理を開始して、その旨のガイダンスを表示部26表示させる(ステップS101)。引き続き、言語選択画面表示を実行する(ステップS102)。この言語選択画面表示に際して制御部22は、図4に示した設定言語対応テーブル303の「設定言語」欄から設定可能な言語種を読み出して、表示部26に表示する。これにより、表示部26には「日本語」、「英語」、「フランス語」、「イタリア語」、「オランダ語」、「ポルトガル語」、「中国語」からなる選択肢が表示される。
次に、この表示された選択肢のいずれかが選択されたか否かを判断する(ステップS103)。選択されたならば、選択された言語種をRAM29に記憶して、言語設定モードを終了する(ステップS104)。
次に、言語設定モードにおいて設定言語が選択された後に撮影モードへ移行すると制御部22は、プログラムに従って図7のフローチャートに示すように処理を実行する。撮影モードへの移行に伴って、言語設定モードで選択された言語種に基づいて、対応する特徴データグループを検索する(ステップS105)。つまり、前記ステップS103で選択された言語種に対応する特徴データグループを、設定言語対応テーブル303において検索する。したがって、設定言語対応テーブル303において、例えば設定言語として「英語」が選択されたとすると、ステップS105での処理により対応する特徴グループとして「白人 黒人」が検索されることとなる。
次に、このステップS105で検索した特徴データグループに対応する特徴データのみを、特徴データテーブル302から読み出して、RAM29に登録する(ステップS106)。つまり、前記ステップS105での処理により、特徴データを用いる特徴データグループは決定済みであることから、この決定済みの特徴データグループ(人種)に対応する特徴データのみを特徴データテーブル302から読み出す。そして、この読み出した特徴データを後述する顔検出処理に使用すべく、RAM29に登録して展開する。
したがって、本例においては、前述のように「英語」に対応する「白人 黒人」が特徴データを用いる特徴データグループとして決定されたことから、ステップS106においては、特徴データテーブル302から「白人」と「黒人」の顔の特徴データのみが読み出されて、RAM29に登録されることとなる。
しかる後に、表示部26においてライブビュー画像を表示するためのライブビュー画像データがCCD13から取り込まれる(ステップS107)。そして、RAM29に登録した顔の特徴データを用いてステップS107にて取り込まれたライブビュー画像データに対して顔検出処理を実行する(ステップS108)。このとき、図3に示したように、本実施の形態においては特徴データテーブル302には、「白人」〜「中南米人」の7種の人種毎に顔の特徴を表す特徴データ格納されているが、実際にRAM29に登録して顔検出処理に用いるのは、「白人」と「黒人」の特徴データのみである。
したがって、顔検出処理(ステップS108)を実行する際に、顔検出処理に必要な特徴データのみを選択してRAM29内にて用いることができ、顔検出処理時における処理負担を軽減することができる。
しかも、本実施の形態によれば、当該デジタルカメラ1に表示させる言語設定を有効利用して、必要な特徴データのみをRAM29に登録することができる。
引き続き、前記RAM29に登録された全特徴データに基づく画像データからの顔の検出が終了したか否を判断し(ステップS109)、終了するまで顔検出処理を繰り返す。そして、全特徴データについての検出処理が終了したならば、画像データから顔が検出されたか否かを判断し(ステップS110)、顔が検出された場合、つまり前記ステップS106でRAM29に登録された特徴データにより顔が検出された場合には、表示部26に表示されたライブビュー画像において検出された顔に顔枠等の指標(アイコン)を重畳表示させ、ステップS111に進む。
そして、キー入力部32のシャッター全押し検出等により記録指示が検出されたか否かを判断し(ステップS111)、記録指示が検出された場合は、検出された顔をフォーカスポイントとして合焦処理を行い、記録指示検出時に撮像された画像データを記録する(ステップS112)。また、記録指示が検出されなかった場合は、ステップS113に進む。
ステップS110にて顔が検出されなかった場合(ステップS110→No)、若しくは、ステップS111にて、例えば顔検出後、所定時間内に記録指示が検出されなかった場合(ステップS111→No)、ユーザが所望する特徴データでは満足な顔の検出結果が得られなかったことになるので、今回のライブビュー画像について、顔の検出を目的として、これら特徴データ以外の全ての他の特徴データを登録したか否かを判断する(ステップS113)。そして、全ての他の特徴データを登録した場合には(ステップS113→Yes)、登録すべき特徴データは無いことになるので、キー入力部32のシャッター全押し検出等により記録指示が検出されたか否かを判断し(ステップS114)、記録指示が検出された場合は(ステップS114→Yes)、例えばコントラストAF方式による通常の合焦処理を行い、記録指示検出時に撮像された画像データを記録する(ステップS115)。
一方、ステップS113の判断処理により、未だ他の特徴データを登録していなければ(ステップS113→No)、登録していない他の特徴データ(本例の場合、「白人」、「黒人」以外の特徴データ)を、既に登録されている特徴データと差し替えてRAM29に登録し(ステップS116)、再度ステップS108の処理に戻り、顔の検出を試みる。 したがって、前記ステップS106で登録された特徴データでは顔を検出できなかった場合であっても、データベース30に記憶されている他の特徴データを用いて、確実に顔を検出することができる。
尚、制御部22は、表示輝度を調整するためのプログラムを読み出してRAM29に登録することにより、上述の顔検出処理と並行してライブビュー画像を表示する表示部26の明るさ(輝度)を取り込んだビデオ信号の明るさに応じて逐次変更する処理を行う(ステップS117〜S118)。
したがって、上述の顔検出処理と並行して表示輝度の調整処理を実行することにより。ユーザは使用する環境の明暗に左右されず顔の検出結果を確認することができる。
また、上述の顔検出処理においては、RAM29には顔検出処理に用いるに特徴データのみを登録されるので、上記の表示輝度の調整処理に負担がかかることがないという効果が得られる。
(第2の実施の形態)
図8は、本発明の第2の実施の形態におけるワールドタイム設定モードの処理手順を示すフローチャートである。すなわち、ユーザがキー入力部32にて、ワールドタイム設定モードを設定すると、制御部22はワールドタイム設定表示処理を開始して、その旨のガイダンスを表示部26表示させる(ステップS201)。引き続き、ワールドタイム選択画面表示を実行する(ステップS202)。このワールドタイム選択画面表示に際して制御部22は、図5に示したワールドタイム対応テーブル304の「都市名」欄から設定可能な都市を読み出して、表示部26に表示する。これにより、表示部26には、「東京」、「ニューヨーク」、「パリ」、「カイロ」、「シドニー」、「リオ・デ・ジャネイロ」、「ペキン」からなる選択肢が表示される。
次に、この表示された選択肢のいずれかが選択されたか否かを判断する(ステップS203)。選択されたならば、選択された都市をRAM29に記憶して、ワールドタイム設定モードを終了する(ステップS204)。
次に、ワールドタイム設定モードにおいて設定都市が選択された後に撮影モードへ移行する。本第2の実施の形態においては、先ず、撮影モードへの移行に伴って、ワールドタイム設定モードで選択された設定に基づいて、対応する特徴データグループを検索し(ステップS205)、このステップS205で検索した特徴データグループに対応する特徴データのみを、特徴データテーブル302から読み出して、RAM29に登録する(ステップS206)。つまり、ワールドタイム対応テーブル304から設定された都市名に対応する対応する特徴データグループ「日本人」〜「東アジア人」を検索する。この場合、例えばワールドタイムとして「パリ」が設定されたとすると、「パリ」に対応する特徴データグループは「白人 黒人」であることから、特徴データテーブル302から「白人」と「黒人」の顔の特徴データが検索されることになる。
そして検索した後は、上記第1の実施の形態における図7のステップS106の処理に移行する。したがって、本実施の形態によれば、当該デジタルカメラ1に表示させるワールドタイム設定を有効利用して、必要な特徴データのみをRAM29に登録することができる。
(第3の実施の形態)
本発明の第3の実施の形態においては、言語及びワールドタイムが共に設定されている場合で、且つ、設定言語に基づいた検索対象となる特徴データの数(種類の数)と、設定されたワールドタイムに基づいた検索対象となる特徴データの数(種類の数)とが不一致となる場合が生ずる。
例えば、「フランス語」が選択されたとすると、「白人」、「黒人」、「アフリカ人」の特徴データ(3種類の特徴データ)が検索対象となり、ワールドタイム「パリ」が選択されたとすると、「白人」、「黒人」の特徴データ(2種類の特徴データ)が検索対象となる。
そして、上記2つの検索により登録すべき特徴データの数が異なる場合には、例えば、より少ない種類の数の特徴データを優先して顔検出処理を行う等の優先順位を予め設定することにより、この設定に基づいて顔検出処理を行う。
また、以上とは逆に全ての特徴データを使用するようにしてもよい。すなわち、前述と同様に、設定言語「フランス語」が選択されて図7のフローチャートによる処理が実行されたとすると、「白人」、「黒人」、「アフリカ人」の特徴データ(3種類の特徴データ)が登録されることとなり、ワールドタイム「パリ」が選択されて図9のフローチャートによる処理が実行されたとすると、「白人」、「黒人」の特徴データ(2種類の特徴データ)が登録されることとなる。
そして、このように登録される特徴データの数が異なる場合には、全ての特徴データを差し替えて使用する。つまり、本例の場合、「白人」、「黒人」、「アフリカ人」の特徴データが全てであることから、これらを全てを差し替えて使用して顔検出処理を実行する。これにより、より確実に顔検出を行うことが可能となる。
(その他の実施の形態)
なお、本発明の他の実施の形態としては、さらに下記のものを挙げることができる。
(1)重み付け等
ユーザの設定に応じて、顔を検出する人種(特徴データ)を制限したり、人種別の特徴データを重み付けし、あるいは閾値を設定して用いるようにしてもよい。このとき、使用する人種別の特徴データを制限すると、予め記憶させてある複数人種の特徴データを全て用いることが不可能となり、特徴データが無意味となる場合があるので、重み付けや閾値により使用する人種別の特徴データの差別化を図ることが好ましい。このように、人種別の特徴データを重み付けしたり閾値を設定することによっても、処理を軽減することができることから、所期の目的を達成することができる。
(2)直接設定
前述の実施の形態においては、言語設定やワールドタイム設定を有効利用して特徴データをRAM29に登録するようにしたが、ユーザが直接的に特徴データを選択してRAM29に登録できるようにしてもよく、ユーザ自身の人種の特徴データを登録できるようにしてもよい。このように、ユーザ自身の人種の特徴データを登録できるようにすれば、ユーザ自身が被写体となる可能性が高いことから、撮影時における顔検出精度を恒常的に高く維持することができる。
なお、このように直接設定することなく、ユーザ自身の人種等が推定できる項目の設定に応じて特徴データを登録するようにしてもよい。
(3)他の設定形態
前述の実施の形態においては、言語設定により設定された使用言語、ワールドタイム設定により設定された都市に基づき、RAM29に登録する特徴データを決定するようにした。しかし、当該ユーザの「自宅」として設定された都市等、当該機器(デジタルカメラ1)の使用地域として設定された地域等、設定されたユーザの人種、被写体の人種に基づき、RAM29に登録する特徴データを決定するようにしてもよい。
また、人工衛星から送信される情報を受信するためのアンテナを備えさせ、GPSシステムにより特定される当該機器(デジタルカメラ1)の使用地域からRAM29に登録する特徴データを決定しても良いし、移動体通信システム用のアンテナを備えさせ、移動体通信サービスにおけるサービス地域を特定する情報を受信することにより当該機器(デジタルカメラ1)が存在する地域を特定し、RAM29に登録する特徴データを決定してもよい。
更に、デジタルカメラ1が撮影モードで撮影した、風景に含まれる特徴的な人工構造物や地形(ランドマーク)や看板や広告に印刷された言語体系を認識する機能を備えさせ、この認識結果に基づいて、当該機器(デジタルカメラ1)が存在する地域を特定し、RAM29に登録する特徴データを決定しても良い。
このようにすれば、ユーザが言語やワールドタイムを設定することなく自動的に使用地域に沿った顔検出のための特徴データを登録することができる。
また、このように、使用言語、自宅、使用地域等の複数の要素に基づきRAM29に登録する特徴データを決定した場合には、その全てを満足する特徴データ、つまり各要素に対応する特徴データを全てRAM29に登録して用いる。これにより、前記複数の要素に対応する特徴データを欠落させることなく、顔の特徴抽出を行うことができる。
また、使用言語、自宅、使用地域等の複数の要素に基づきRAM29に登録する特徴データを決定するに際しては、前記複数の要素に優先順位を設定する。そして、この設定した優先順位に従って順次RAM29に登録して、顔検出処理を行う。これにより、優先順位に従って早期に顔の検出が可能となる。
さらに、設定されたユーザの年齢や性別に基づき、RAM29に登録する特徴データを決定するようにしてもよく、この場合、データベースには年齢層別、老若男女別で顔の特徴データが記憶されていること好ましい。
(4)データベース等
また、前述した実施の形態においては、予めデータベースも複数種の特徴データを記憶させておくようにしたが、ネットワークを介してユーザ設定に適した特徴データをダウンロードするようにしてもよい。また、ユーザの設定によることなく、メーカの出荷時の設定により、出荷先の情報(言語や地域)を設定し、使用時において適切な特徴データがRAM29に登録されるようにしてもよい。
なお、実施の形態では、この発明をデジタルカメラに適用した場合を例にして説明しているが、デジタルカメラばかりでなく、光学系及び撮像素子を介して取り込んだ画像データを記録する機能を備えた装置、例えば、カメラ付携帯電話や撮像機能を備えた電子機器にも適用できる。
本発明の各実施の形態に共通するデジタルカメラの電子回路構成を示す図である。 メニュー画面等各言語テーブルを示す概念図である。 特徴データテーブルを示す概念図である。 設定言語対応テーブルを示す概念図である。 ワールドタイム対応テーブルを示す概念図である。 本発明の第1の実施の形態における言語設定モードでの処理手順を示すフローチャートである。 本発明の第1の実施の形態における言語設定後の撮影モードでの処理手順を示すフローチャートである。 本発明の第2の実施の形態におけるワールドタイム設定モードでの処理手順を示すフローチャートである。 本発明の第2の実施の形態におけるワールドタイム設定後の撮影モードでの処理手順を示すフローチャートである。
符号の説明
1 デジタルカメラ
13 CCD
15 垂直ドライバ
17 A/D変換器
18 カラープロセス回路
19 DMAコントローラ
21 DRAM
22 制御部
24 VRAM
25 デジタルビデオエンコーダ
26 表示部
28 保存メモリ
29 RAM
30 データベース
301 メニュー画面等各言語テーブル
302 特徴データテーブル
303 設定言語対応テーブル
304 ワールドタイム対応テーブル

Claims (11)

  1. 予め記憶手段に記憶されている複数種の特徴データを用い、画像データにおいて被写体領域を検出する検出手段を備えた画像処理装置であって、
    当該装置の所定の機能を実現させるための設定項目を設定する項目設定手段と、
    前記記憶手段から、前記項目設定手段による設定項目の設定結果に基づき、前記被写体領域の検出に際して用いる特徴データを選択する選択手段と、
    この選択手段により選択された前記特徴データに基づいて、前記検出手段による前記画像データにおいて被写体領域を検出する処理を制御する検出制御手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記設定項目は、ユーザにより当該装置に設定される使用言語を示す情報の設定、ユーザによる当該装置の使用地域を示す情報の設定のうち少なくとも一つを含むことを特徴とする請求項記載の画像処理装置。
  3. 前記検出制御手段は、前記選択手段によって前記使用言語を示す情報及びユーザによる当該装置の使用地域を示す情報に基づき、複数の特徴データが選択された場合には、これら選択された全ての特徴データを用いて、前記画像データにおいて被写体領域を検出するように前記検出手段を制御することを特徴とする請求項記載の画像処理装置。
  4. 前記選択手段は、前記設定結果として前記使用言語を示す情報、及びユーザによる当該装置の使用地域を示す情報が設定された場合、予め定められた優先順位に従って、特徴データを選択することを特徴とする請求項記載の画像処理装置。
  5. 前記選択手段は、前記検出手段が前記選択された前記特徴データを用いて画像データにおいて被写体領域を検出しなかった場合、前記選択された特徴データ以外の他の特徴データを選択することを特徴とする請求項1からのいずれかに記載の画像処理装置。
  6. 前記複数種の特徴データ毎に検出のための閾値を設定する設定手段と、前記設定手段に設定されている閾値のうち、前記選択手段により選択された前記特徴データに対応する閾値を下降制御して前記設定手段に設定する閾値制御手段とを更に備え、
    前記検出制御手段は、前記閾値制御手段によって閾値が下降制御された特徴データを用いて、前記閾値以上で類似していると判断された領域を被写体領域として検出するように前記検出手段を制御することを特徴する請求項1からのいずれかに記載の画像処理装置。
  7. 前記特徴データは、各人種に対応する顔画像テンプレート、各人種に対応する顔における特徴点情報、各人種に対応する肌の色情報のうちの少なくとも1つを含み、
    前記検出手段は、前記特徴データに基づき、前記被写体領域を検出する処理を実行することを特徴とする請求項1からのいずれかに記載の画像処理装置。
  8. 前記記憶手段は、所定の特徴別に分類して前記複数種の特徴データを記憶してなることを特徴とする請求項1からのいずれかに記載の画像処理装置。
  9. 前記所定の特徴別とは、被写体の人種別であることを特徴とする請求項記載の画像処理装置。
  10. 予め記憶手段に記憶されている複数種の特徴データを用い、画像データにおいて被写体領域を検出する被写体検出手段を備えた画像処理装置が有するコンピュータを、
    当該装置の所定の機能を実現させるための設定項目を設定する項目設定手段と、
    前記記憶手段から、前記項目設定手段による設定項目の設定結果に基づき、前記被写体領域の検出に際して用いる特徴データを選択する選択手段と、
    この選択手段により選択された前記特徴データに基づいて、前記検出手段による前記画像データにおいて被写体領域を検出する処理を制御する検出制御手段と
    して機能させることを特徴とする被写体検出プログラム。
  11. 予め記憶手段に記憶されている複数種の特徴データを用い、画像データにおいて被写体領域を検出する被写体検出方法であって、
    所定の機能を実現させるための設定項目を設定する項目設定ステップと、
    前記記憶手段から、前記項目設定手段による設定項目の設定結果に基づき、前記被写体の検出に際して用いる特徴データを選択する選択ステップと、
    この選択ステップにより選択された前記特徴データに基づいて、前記画像データにおいて被写体領域を検出する処理を制御する検出制御ステップと、
    を含むことを特徴とする被写体検出方法。
JP2008223731A 2008-09-01 2008-09-01 画像処理装置、プログラム及び被写体検出方法 Expired - Fee Related JP5181935B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008223731A JP5181935B2 (ja) 2008-09-01 2008-09-01 画像処理装置、プログラム及び被写体検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008223731A JP5181935B2 (ja) 2008-09-01 2008-09-01 画像処理装置、プログラム及び被写体検出方法

Publications (2)

Publication Number Publication Date
JP2010062655A JP2010062655A (ja) 2010-03-18
JP5181935B2 true JP5181935B2 (ja) 2013-04-10

Family

ID=42189024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008223731A Expired - Fee Related JP5181935B2 (ja) 2008-09-01 2008-09-01 画像処理装置、プログラム及び被写体検出方法

Country Status (1)

Country Link
JP (1) JP5181935B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011239314A (ja) * 2010-05-13 2011-11-24 Sanyo Electric Co Ltd 撮像装置、画像処理方法、画像処理プログラム
JP7532042B2 (ja) 2020-02-03 2024-08-13 キヤノン株式会社 撮像制御装置、撮像制御装置の制御方法、プログラム及び記憶媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003208611A (ja) * 2002-01-15 2003-07-25 Fuji Photo Film Co Ltd 画像処理装置、画像処理方法、及びプログラム
JP2003271944A (ja) * 2002-03-14 2003-09-26 Ricoh Co Ltd 画像処理装置
JP4207980B2 (ja) * 2006-06-09 2009-01-14 ソニー株式会社 撮像装置、および撮像装置制御方法、並びにコンピュータ・プログラム

Also Published As

Publication number Publication date
JP2010062655A (ja) 2010-03-18

Similar Documents

Publication Publication Date Title
JP4645685B2 (ja) カメラ、カメラ制御プログラム及び撮影方法
US8599251B2 (en) Camera
JP4577252B2 (ja) カメラ、ベストショット撮影方法、プログラム
JP4702401B2 (ja) カメラ、カメラ制御プログラム及びカメラ制御方法
JP4623193B2 (ja) 撮像装置、撮像方法、及びプログラム
JP5050465B2 (ja) 撮像装置、撮影制御方法、およびプログラム
US20100329552A1 (en) Method and apparatus for guiding user with suitable composition, and digital photographing apparatus
US8412031B2 (en) Camera with a function of automatically setting shooting conditions and shooting method
JP4474885B2 (ja) 画像分類装置及び画像分類プログラム
JP2007249132A (ja) 撮像装置、自動焦点調整方法、およびプログラム
US8237802B2 (en) Method and apparatus for determining shaken image by using auto focusing
JP2006025311A (ja) 撮像装置、及び画像取得方法
JP5181841B2 (ja) 撮影装置、撮影制御プログラム、並びに画像再生装置、画像再生プログラム
JP5168320B2 (ja) カメラ、ベストショット撮影方法、プログラム
JP4609315B2 (ja) 撮像装置、ズーム時の画角枠表示方法、およびプログラム
JP5181935B2 (ja) 画像処理装置、プログラム及び被写体検出方法
JP5267645B2 (ja) 撮像装置、撮影制御方法、およびプログラム
JP2009111827A (ja) 撮影装置及び画像ファイル提供システム
JP5170217B2 (ja) カメラ、カメラ制御プログラム及び撮影方法
KR101477535B1 (ko) 이미지 검색 방법 및 장치, 이를 이용한 디지털 촬영 장치
JP2006237963A (ja) 画像表示装置、撮影装置及び画像表示方法
JP2009088749A (ja) 撮像装置、シナリオによる画像撮影方法、およびプログラム
JP2008098739A (ja) 撮像装置、撮像装置に用いられる画像処理方法および当該画像処理方法をコンピュータに実行させるプログラム
JP2010039795A (ja) 認識用データ生成装置及び電子カメラ、認識用データ生成プログラム、並びに認識用データ生成方法
JP2007288409A (ja) 画像データ分類機能を備えた撮像装置およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110803

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120911

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121231

R150 Certificate of patent or registration of utility model

Ref document number: 5181935

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees