JP4742642B2 - 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム - Google Patents

画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム Download PDF

Info

Publication number
JP4742642B2
JP4742642B2 JP2005094814A JP2005094814A JP4742642B2 JP 4742642 B2 JP4742642 B2 JP 4742642B2 JP 2005094814 A JP2005094814 A JP 2005094814A JP 2005094814 A JP2005094814 A JP 2005094814A JP 4742642 B2 JP4742642 B2 JP 4742642B2
Authority
JP
Japan
Prior art keywords
image
face
image processing
area
cpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005094814A
Other languages
English (en)
Other versions
JP2006277274A (ja
Inventor
正年 松平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2005094814A priority Critical patent/JP4742642B2/ja
Priority to US11/391,203 priority patent/US7869630B2/en
Publication of JP2006277274A publication Critical patent/JP2006277274A/ja
Priority to US12/824,735 priority patent/US20100260423A1/en
Application granted granted Critical
Publication of JP4742642B2 publication Critical patent/JP4742642B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像処理装置、印刷装置、画像処理方法、および、画像処理プログラムに関する。
近年、ディジタルカメラ等によって撮像された画像を簡易に印刷できる印刷装置が普及している。最近では、ディジタルカメラの普及に伴い、メモリカードが挿着できるスロットを有する印刷装置、あるいはディジタルカメラとの接続のためのインタフェースを有する高解像度の印刷装置も市販されるようになっている。この種の印刷装置には、プリントエンジンとして、インクジェット式、あるいは昇華式のものがあり、高い解像度での印刷が可能となっている。
ところで、例えば、ディジタルカメラによって撮像された画像は、カメラ自体の特性等によって、例えば、露出値が適切でなかったり、色かぶりが発生したりする場合があるため、これらを補正するための技術が提案されている(特許文献1参照)。
特開2000−165647号公報(要約書、請求項)
ところで、前述したような補正は、被写体の種類(例えば、風景、または、人物等)に応じて行うことが望ましいが、特許文献1に示す技術では、被写体に応じて補正を行うことができないという問題点がある。
また、近年、パーソナルコンピュータを接続せずに、印刷装置自体に画像データを読み取る手段と、画像処理を行う手段とを有し、印刷装置単独で画像を印刷できるいわゆるスタンドアローンプリンタが流通しているが、このようなスタンドアローンプリンタでは、中央処理装置の処理速度がパーソナルコンピュータに比較して遅いため、被写体に応じて複雑な補正処理を施そうとすると、印刷を開始するまでに長い時間を要するという問題点がある。
本発明は、上記の事情に基づきなされたもので、その目的とするところは、被写体に応じた最適な補正を短時間で行うことが可能な画像処理装置、印刷装置、画像処理方法、および、画像処理プログラムを提供しよう、とするものである。
上述の目的を達成するため、本発明の画像処理装置は、画像の中央領域を抽出する抽出手段と、前記中央領域内に顔領域が含まれているか否か判定する判定手段と、前記中央領域内の顔領域の画素値に基づいて前記画像を補正する補正手段と、を有し、前記判定手段は、前記中央領域内に、定められた数の顔領域が含まれていると判定した場合、判定を終了する、特徴を有する。
また、前記判定手段は、前記中央領域内において、テンプレートを所定ステップで走査させるマッチング処理により前記判定を行い、前記ステップは前記中央領域の外側にいくほど大きくなるとしてもよい。
さらに、前記判定手段により前記中央領域内に複数の顔領域が含まれると判定された場合、前記補正手段はそれぞれの顔領域の画素値の中央値または平均値に基づいて前記画像を補正するとしてもよい。
このため、被写体に応じた最適な補正を短時間で行うことが可能な画像処理装置を提供することができる。
また、他の発明の画像処理装置は、前述の発明に加えて、抽出手段が、画像データの中央に存在する一部の領域を抽出するようにしている。このため、中央付近に位置するように撮像されることが多い人物の画像を迅速かつ確実に抽出することが可能になる。
また、他の発明の画像処理装置は、前述の発明に加えて、抽出手段によって抽出された領域の画像データを拡大する拡大手段をさらに有するようにしている。このため、顔の特徴部分を拡大することにより、顔が含まれているか否かの判定を正確に行うことができる。
また、他の発明の画像処理装置は、前述の発明に加えて、抽出手段によって抽出された領域の画像データを縮小する縮小手段をさらに有するようにしている。このため、縮小および拡大を行うことにより、画像に含まれているノイズ成分を除去し、顔が含まれているか否かの判断をさらに正確に行うことができる。
また、他の発明の印刷装置は、前述の画像処理装置を有している。このため、画像データに顔が含まれている場合には、正確に画像を抽出し、当該顔の撮影状態に応じて、画像データを適切に補正して印刷することが可能になる。
また、本発明の画像処理方法は、画像データの一部の領域を抽出する抽出ステップと、抽出ステップによって抽出された領域内に人物の顔が含まれているか否か判定する判定ステップと、判定ステップによって顔が含まれていると判定された場合には、顔の状態に基づいて画像データを補正する補正ステップと、を有する。
このため、被写体に応じた最適な補正を短時間で行うことが可能な画像処理方法を提供することができる。
また、本発明の画像処理プログラムは、画像データの一部の領域を抽出する抽出手段、抽出手段によって抽出された領域内に人物の顔が含まれているか否か判定する判定手段、判定手段によって顔が含まれていると判定された場合には、顔の状態に基づいて画像データを補正する補正手段、としてコンピュータを機能させる。
このため、被写体に応じた最適な補正を短時間で行うことが可能な画像処理プログラムを提供することができる。
以下、本発明の一実施の形態について、図面を参照して説明する。
図1は、本発明の実施の形態に係る画像処理装置を用いた印刷装置の構成例を示す図である。以下、本発明の一実施の形態について、図1から図11に基づいて説明する。図1は、本実施の形態に係る印刷装置11の基本構成を示す斜視図である。この図1に示すように、印刷装置11は、ロール紙対応型のインクジェット式印刷装置であり、装置全体を覆うケース12と、印刷媒体としてのロール紙Rおよび印刷用紙(不図示)を供給する給紙装置13と、ロール紙Rまたは印刷用紙に対して印刷を行う印刷部とを備える。
ケース12は、略四角形状の箱体であり、上面右側に操作パネル部15を備え、操作パネル部15は、LCD(Liquid Crystal Display)17と、操作ボタン18とを備える。LCD17には、印刷装置11のメニュー機能、動作内容、動作状況、エラー内容などが表示され、操作ボタン18は、印刷装置11のメニュー選択等を行う時に押されるようになっている。そして、これらLCD17および操作ボタン18により、カット位置調整等の各種操作が行えるようになっている。
ケース12は、前面下部に、排出口12aを備え、印刷されたロール紙Rまたは印刷用紙が排出されるようになっている。また、ケース12の前面右側には、カードスロット21が設けられており、例えばディジタルカメラなどによって撮影された画像データを記録するメモリカードMが、取り外し自在に収納されるようになっている。
給紙装置13は、ケース12の背面側に設けられており、ケース12に対して固定されているホルダー22と、ロール紙軸23とを備える。そして、同ロール紙軸23には、ロール紙Rの基端(終端)が連結され巻回されており、この状態で、ホルダー22に対して回転可能に支持されている。そして、ユーザーがロール紙軸23の両端部を掴んでロール紙軸23を正回転、あるいは、逆回転させると、ロール紙Rは給紙装置13から送り出されたり、巻き取られたりするようになっている。
つぎに、図1に示す印刷装置の制御系について説明する。図2は、図1に示す印刷装置の制御系を示すブロック図である。この図に示すように、印刷装置の制御系は、CPU(Central Processing Unit)50、ROM(Read Only Memory)51、RAM(Random Access Memory)52、EEPROM(Electrically Erasable and Programmable ROM)53、GP(Graphic Processor)54、I/F(Interface)55、バス56、LCD17、操作ボタン18、カードMが挿入されるカードスロット21、カードI/F回路60、プリンタエンジンコントローラ62、紙送りモータ63、ローラ64、キャリッジモータ65、駆動ベルト66、キャリッジ67、および、記録ヘッド68を有している。
ここで、抽出手段、判定手段、補正手段、拡大手段、および、縮小手段としてのCPU50は、ROM51およびEEPROM53に格納されているプログラムに応じて各種演算処理を実行するとともに、紙送りモータ63およびキャリッジモータ65をはじめとする装置の各部を制御する。
ROM51は、CPU50が実行する各種プログラムや各種データを格納している半導体メモリである。RAM52は、CPU50が実行対象とするプログラムやデータを一時的に格納する半導体メモリである。
EEPROM53は、CPU50における演算処理結果の所定のデータ等が格納され、印刷装置の電源が切断された後も該データを保持する半導体メモリである。
GP54は、CPU50から供給されが描画命令に基づいて描画処理を実行し、得られた画像データをLCD17に供給して表示させる。
I/F55は、操作ボタン18、カードI/F回路60、および、プリンタエンジンコントローラ62の間で情報を授受する際に、データの表現形式を適宜変換する装置である。
バス56は、CPU50、ROM51、RAM52、EEPROM53、GP54、および、I/F55、を相互に接続し、これらの間で情報の授受を可能とするための信号線群である。
操作ボタン18は、前述したように、メニュー選択等を行う場合に操作される。メモリカードMは、前述したように、ディジタルカメラによって撮像された画像データが格納されている不揮発メモリである。
カードスロット21は、前述したように印刷装置11のケース12の前面右側に設けられており、当該部分にメモリカードMが挿入される。カードI/F回路60は、メモリカードMとの間で情報を読み書きするためのインタフェースである。
プリンタエンジンコントローラ62は、紙送りモータ63、キャリッジモータ65、および、記録ヘッド68を制御するための制御装置である。紙送りモータ63は、ローラ64を回転させることにより印刷用紙またはロール紙Rを副走査方向に移動させる。ローラ64は、円柱状の部材によって構成され、印刷用紙またはロール紙Rを副走査方向に移動させる。
キャリッジモータ65は、キャリッジ67に一端が固定されている駆動ベルト66に駆動力を与えることにより、キャリッジ67を主走査方向に往復動させる。記録ヘッド68は、印刷用紙に対向する面に複数のノズルが形成されており、当該複数のノズルからインクを吐出させることにより情報を印刷用紙に記録する。
つぎに、以上の実施の形態の動作について説明する。
図3は、以上の実施の形態の動作を説明するためのフローチャートである。このフローチャートの処理が開始されると、以下のステップが実行される。なお、この処理は、メモリカードMがカードスロット21に挿入された後、所定の画像または画像群を印刷することが指示された場合に、ROM51に格納されているプログラムを読み出して実行することにより、実現される。
ステップS10:CPU50は、印刷の対象となる画像ファイルをメモリカードMから取得し、ハフマン解凍処理を実行し、量子化DCT(Discrete Cosine Transform)係数を得る。図4に示すように、画像ファイル70は、ヘッダ情報71、テーブル72、および、圧縮データ73によって構成されている。ここで、ヘッダ情報71は、例えば、ファイル名、圧縮方式、画像サイズ、密度単位等の情報を有している。テーブル72は、例えば、量子化テーブルおよびエントロピー符号化テーブル等によって構成されている。圧縮データ73は、JPEG(Joint Photographic Coding Experts Group)方式により圧縮された画像データによって構成されている。CPU50は、図4に示す画像ファイル70のテーブル72からエントロピー符号化テーブルを取得し、圧縮データ73に含まれているY(輝度)成分、Cr(色差成分)、および、Cb(色差成分)のそれぞれのブロックのDC係数と、AC係数とを復号する。なお、この際、最小符号化単位であるMCU単位で復号を行う。
ステップS11:CPU50は、ステップS11において得られた量子化DCT係数を逆量子化する。具体的には、CPU50は、図4に示す画像ファイル70のテーブル72から量子化テーブルを取得し、ステップS11において得られた量子化DCT係数に乗じることにより(逆量子化することにより)、DCT係数を得る。
ステップS12:CPU50は、印刷する際に画像を回転させる必要がある場合には、画像を回転させる(例えば、右に90度回転させる)ために必要な情報を、例えば、RAM52にキャッシュする。具体的には、JPEG方式によって圧縮された画像を回転させる場合、MCUのDC成分(直流成分)とAC成分(交流成分)のそれぞれを一度ハフマン展開しなければならない。ここで、DC成分については隣接するDC成分値の差分をハフマン符号化することから、隣接するMCUとの相関関係が問題となる。また、AC成分ではハフマン符号化処理によりそのデータ長が各MCUで一定にならず、JPEGデータのビットストリーム中のどのデータが求めるMCUのAC成分値であるかが不明となることが問題となる。そこで、ステップS12の処理では、各MCUのDC成分値とAC成分のアドレスを求めてキャッシュしておくことにより、ローテート処理を可能とする。
ステップS13:CPU50は、ステップS11で得られたDCT係数に対して逆DCT演算を施すことによりもとの画素値を得る。
ステップS14:CPU50は、ステップS13の処理によって得られたYCC方式の画像をRGB(Red Green Blue)方式の画像と、HSB(Hue Saturation Brightness)方式の画像に変換する。
ステップS15:CPU50は、ステップS13およびステップS14の処理において得られたYCC,RGB,HSBのそれぞれの画像をRAM52に格納して保持する。なお、このとき、データ量を削減するために画素を所定の割合で間引きした後にRAM52に格納してもよい。
ステップS16:CPU50は、ステップS15においてRAM52に格納されたYCC,RGB,HSBそれぞれの画像の成分について、ヒストグラムを計算する。具体的には、RGB画像については、R,G,Bそれぞれの画像についてヒストグラムを計算する。その結果、画像を構成する各成分の分布を得る。
ステップS17:CPU50は、全てのMCUについての処理が終了したか否かを判定し、終了した場合にはステップS18に進み、それ以外の場合にはステップS10に戻って同様の処理を繰り返す。
ステップS18:CPU50は、ステップS13の処理によって得られた画像の中央部をズームする処理を実行する。なお、この処理の詳細については、図6を参照して後述するが、概略を説明すると、つぎの通りである。すなわち、メインの被写体が人物である場合には、通常は、画像の中央部に人物像が存在している場合が多く、また、中央部分以外に存在する人物像については主な被写体でない場合が多い。そこで、画像から中央部分を抽出することにより、データ量を減らして、処理速度を向上させることができる。また、ズーム処理をすることにより、ステップS19の顔抽出の対象となる目、口等の部分が拡大され、また、拡大によって画素値が平均化されてノイズ成分が減少するので、顔抽出処理の精度を向上させることができる。
ステップS19:CPU50は、ステップS18において抽出された画像に含まれている顔の画像を抽出する処理を実行する。なお、この処理の詳細については、図8を参照して後述するが、概略を説明するとつぎの通りである。すなわち、この処理では、ステップS18において抽出された画像に顔画像が含まれているか否かを判定するために、例えば、顔画像のテンプレートを利用し、当該テンプレートと相関が高い領域を顔画像が含まれている領域(以下、「顔領域」と称する)として特定する。なお、含まれている顔画像の大きさは、被写体とディジタルカメラの距離によって変化し、また、被写体が複数である場合も想定されるので、ステップS19の処理では、大きさの異なる複数のテンプレートを用いて顔画像の検出を行うとともに、10人分の顔領域が発見されるまで処理を繰り返すようにしている。なお、特定された顔領域については、例えば、その中心部分の座標または左上端の座標がRAM52に格納される。
ステップS20:CPU50は、ステップS19の処理において顔画像が特定された場合にはステップS21に進み、それ以外の場合にはステップS23に進む。
ステップS21:CPU50は、ステップS19において特定された顔領域から顔色を取得する。具体的には、顔領域を構成する所定の画素を抽出してR,G,Bそれぞれの値を取得する。このとき、複数の画素を抽出して平均値または中央値を計算し、これらの値を用いるようにしてもよい。なお、複数の顔領域が特定された場合にはそれぞれの顔領域から顔色を取得し、例えば、中央値または平均値を計算する。
ステップS22:CPU50は、ステップS21において取得された顔色が、正常な顔色となる補正パラメータを算出する。具体的には、R,G,Bのバランスが適正値からずれている場合には、色かぶりが生じているとして、正常値に補正するための補正パラメータをR,G,Bそれぞれについて算出する。また、R,G,Bのトータル値がずれている場合には、露光が適正でないとして、露光を適正とするための補正パラメータをR,G,Bそれぞれについて算出する。
なお、顔色は、人種および光源の種類によって異なる。そこで、ROM51に格納されているテーブル(図5参照)を参照して、取得したR,G,Bから適正な補正パラメータを算出する。図5の例では、第1〜第3の肌色が列挙してある。ここで、第1の肌色は白色系、第2の肌色は黄色系、第3の肌色は黒色系の肌色となっている。図5では、第1から第3の肌色のそれぞれについて、太陽光、蛍光灯、白熱光を光源とした場合のR,G,Bそれぞれの値の範囲が列挙されている。ステップS22の処理では、顔領域の複数のポイントから画素をサンプリングし、サンプリングされた画素のR,G,B値の平均値または中央値を算出し、図5に示すテーブルと比較することにより、対象となる顔の肌色の種類と、光源の種類を特定する。そして、画素の平均値のR,G,Bのそれぞれの値が図5に示すテーブルの中央値(適正値)となるような補正パラメータを求める。なお、複数人の顔領域が特定された場合には、それぞれの顔領域から複数点におけるサンプリングを行い、得られた複数人分の画素の平均値または中央値を算出し、これらの値に基づいて、補正パラメータを算出する。
ステップS23:CPU50は、印刷対象となる画像ファイルにおいて、解凍処理の対象となる位置を示すファイルポインタをリセットし、処理位置を画像ファイルの先頭に復元する。
ステップS24:CPU50は、RAM52にキャッシュされた1MCUライン分の画像データにハフマン解凍処理を施し、量子化DCT係数を得る。ここで、1MCUラインとは、画像を回転させる場合には、画像を構成する列方向に1列のMCU群をいい、回転させない場合には、画像を構成する行方向に1列のMCU群をいう。
ステップS25:CPU50は、ステップS24の処理において得られた量子化DCT係数を逆量子化する。
ステップS26:CPU50は、ステップS25で得られたDCT係数に対して逆DCT演算を施すことによりもとのデータを得る。
ステップS27:CPU50は、ステップS26の処理によって得られたYCC方式の画像をRGB方式の画像に変換する。
ステップS28:CPU50は、ステップS27において得られたRGB方式の画像を構成する各画素に対して補正処理を施す。具体的には、それぞれの画素に対して、ステップS22において算出した補正パラメータを適用することにより、色かぶりを解消するとともに、露出が適正となるように補正する。
ステップS29:CPU50は、補正処理の結果得られた画像データを、プリンタエンジンコントローラ62の図示せぬバンドバッファに供給し、印刷処理を実行させる。この結果、プリンタエンジンコントローラ62は、記録ヘッド68を制御して画像データに対応するインクを吐出させ、キャリッジモータ65を駆動して記録ヘッド68を主走査方向に移動させるとともに、紙送りモータ63を駆動して副走査方向に移動させ、画像を印刷する。
ステップS30:CPU50は、RAM52にキャッシュされている画像データを、つぎの処理に備えて更新する。
ステップS31:CPU50は、処理を終了するか否かを判定し、終了しない場合にはステップS24に戻って同様の処理を繰り返し、それ以外の場合には処理を終了する。
つぎに、図6を参照して、図3のステップS18の詳細な処理について説明する。図6の処理が開始されると、以下のステップが実行される。
ステップS40:CPU50は、ステップS15の処理により、RAM52に保持されている画像データを所定の割合で間引きして縮小する処理を実行する。例えば、間引き後の画像がQVGA(Quarter Video Graphics Array)サイズの画像となるように間引き処理を実行する。なお、処理の対象となる画像データとしては、例えば、Y(輝度)成分画像を用いることができる。すなわち、画像データに顔領域が含まれているか否か検索する場合には、後述する白黒濃淡画像であるテンプレートとの類比を判断するので、検索対象となる画像データについても白黒濃淡画像である輝度成分であるY成分画像を利用する。
ステップS41:CPU50は、ステップS40において間引きされて得られた画像データを所定の大きさに拡大する処理を実行する。例えば、図7(A)に示すように、実線で示す画像データよりも上下にd1画素(例えば、10画素)、左右にd2画素(例えば、10画素)だけ大きい破線で示す領域まで拡大する。なお、拡大処理の方法としては、例えば、最近傍補間、双一次補間、双三次補間、または、線形補間等を用いることができる。
ステップS42:CPU50は、ステップS41において拡大された画像データから、もとの大きさの画像データを切り出す処理を実行し、もとの処理に復帰する。例えば、図7(B)に示すように、ステップS41で拡大された画像データからもとの大きさの画像データを切り出す。
以上の処理によれば、被写体である人物が写されている可能性が高い領域(中央部分の領域)の画像を抽出することができる。なお、以上の実施の形態では、画像を拡大した後に中央部分の領域を抽出するようにしたが、例えば、画像の中央部分の領域を抽出した後に、抽出した領域を拡大することも可能である。例えば、図8(A)に示すように、画像から破線で示す領域を切り出した後、図8(B)に示すように、切り出した領域を拡大するようにしてもよい。このような方法によれば、処理コストを要する拡大処理の対象となる領域を狭くすることができるので、図7の場合に比較して、処理速度を短縮することができる。
つぎに、図9を参照して、図3のステップS19に示す顔抽出処理の詳細について説明する。図9に示す処理が開始されると、以下のステップが実行される。
ステップS50:CPU50は、テンプレートを指定する変数nに値“1”を初期設定し、テンプレートの走査位置を指定する変数x,yに値“0”をそれぞれ初期設定する。
ステップS51:CPU50は、変数nによって指定される第n番目のテンプレート(詳細は後述する)をROM51から選択する。第1回目の処理では、変数nには値“1”が設定されているので、第1番目のテンプレートが選択される。図10(A)は、第1〜第5のテンプレートの一例を示している。この図に示すように、テンプレートは顔の特徴点(目、鼻、口等)を含む画像であり、第1〜第5の順でそのサイズが小さくなっている。なお、テンプレートの画像の解像度が高い場合には、各個人の顔の特徴に影響を受けてマッチング処理の精度が低下するので、図10(B)に示すように、テンプレートにモザイク処理を施すことにより、各個人の特徴に影響を受けにくくしている。
ステップS52:CPU50は、ステップS18の処理によってズームされた画像データからx,yを左上端とし、ステップS51で選択したテンプレートに対応するサイズの領域を抽出する。なお、以下では、抽出された画像データを抽出画像データと称する。いまの例では、x,y=0であり、第1のテンプレートが選択されているので、x,y=0を左上端とし、第1のテンプレートと同じサイズの領域が抽出画像データとして抽出される。
ステップS53:CPU50は、ステップS51において選択したテンプレートと、ステップS52において抽出された抽出画像データとのマッチング処理を実行する。マッチング方法としては、例えば、抽出画像データと、テンプレートの各画素の差分の2乗を累積加算し、所定の閾値以下になった場合には、これらの類似性が高い(顔が含まれている)と判断することができる。なお、これ以外にも、例えば、ニューラルネットワークを利用することも可能である。その場合、例えば、入力層、中間層、および、出力層の3層構造を有するニューラルネットワークを利用し、入力層にテンプレートの画像を、例えば、位置等をずらしながら入力して学習を行い、十分に学習を積んだニューラルネットワークを用いてマッチング処理を行うことが可能である。
また、ニューラルネットワークではなく、例えば、ジェネティックアルゴリズム(遺伝的アルゴリズム)を用いてマッチング処理を行うことも可能である。例えば、テンプレートを原画像に重ねる際のパラメータとして、テンプレートの種類n、左上端のx,y座標を定義し、各固体の染色体をこれらのパラメータに基づいて決定し、マッチング率を固体の適応度とみなして個体集団を進化させることにより、最適な個体をマッチング処理の結果とすることができる。
ステップS54:CPU50は、ステップS53の処理の結果に基づいて、ステップS52で抽出された抽出画像データに顔が含まれているか否かを判定し、含まれていると判定した場合にはステップS55に進み、それ以外の場合にはステップS56に進む。例えば、前述した差分の2乗を計算するマッチング処理の場合には、累積加算値が所定の閾値よりも小さい場合には顔が含まれていると判定する。
ステップS55:CPU50は、顔が存在すると判定された領域の中心の座標をRAM52に記憶する。なお、中心座標を求めるには、現在選択されているテンプレートのサイズの半分の長さを、現在のx,y座標に加算すればよい。
ステップS56:CPU50は、それまでの処理で合計して10人分の顔を検出したか否かを判定し、10人分の顔を検出した場合には処理を終了してもとの処理に復帰し、それ以外の場合にはステップS57に進む。例えば、第1のテンプレートで、3人の顔が検出され、第3のテンプレートで7人の顔が検出された場合には処理を終了してもとの処理に復帰する。
ステップS57:CPU50は、抽出画像データが抽出される領域が画像データの右端に到達したか否かを判定し、到達した場合にはステップS59に進み、それ以外の場合にはステップS58に進む。すなわち、本発明の実施の形態では、図11(A)に示すように、画像データからテンプレートに対応した大きさの画像データを抽出し、図11(B)に示す順序で抽出を繰り返す。このとき、画像を抽出する領域が右端に到達した場合には、ステップS59に進む。
ステップS58:CPU50は、左上端のx座標に対してΔxを加算する。なお、Δxは、選択されているテンプレートのサイズに応じて最適な値を決定する。例えば、テンプレートのサイズが小さい場合にはΔxの値を小さくし、サイズが大きい場合にはΔxの値を大きくする。
ステップS59:CPU50は、左上端のy座標に対してΔyを加算する。なお、Δyは、前述のΔxの場合と同様に、テンプレートのサイズに応じて決定する。
ステップS60:CPU50は、左上端のx座標を“0”に設定する。その結果、画像を抽出する領域が画像の左端に復帰する。
ステップS61:CPU50は、所定のテンプレートについて、全領域に対する処理が完了したか否かを判定し、終了したと判断した場合にはステップS62に進み、それ以外の場合にはステップS52に戻って同様の処理を繰り返す。
ステップS62:CPU50は、x,yのそれぞれに対して値“0”を設定する。その結果、画像を抽出する領域が画像データの左上端にリセットされる。
ステップS63:CPU50は、テンプレートを選択するための変数nを“1”だけインクリメントする。いまの例では、変数nには初期値“1”が設定されているので、変数nの値はこの処理により“2”となる。その結果、ステップS51の処理では第2のテンプレートが選択されることになる。
ステップS64:CPU50は、変数nの値がテンプレートの最大値を示す値Nよりも大きいか否かを判定し、大きい場合には処理を終了する。いまの例では、図10に示すように、N=5であるので、n>5である場合には処理を終了してもとの処理に復帰し、それ以外の場合にはステップS51に戻って同様の処理を繰り返す。
以上に説明したように、本発明の実施の形態によれば、画像データの中央部の領域を抽出して顔の有無を判定するようにしたので、処理の対象となる画像データを絞り込むことにより、処理速度を向上させることが可能になる。また、被写体となる人物は、画像の中央付近に存在する場合が多く、また、中央以外に存在する人物は主たる被写体ではない場合が多いので、処理の対象を効率よく絞り込むことが可能になる。
また、本発明の実施の形態によれば、対象となる画像を間引きにより縮小した後に、拡大するようにしたので、画像に含まれているノイズを除去し、マッチングの精度を向上させることができる。また、原画像よりも拡大することにより、特徴部分となる目、口、鼻等の要素を見つけ出しやすくすることができる。
なお、以上の実施の形態では、スタンドアロン型の印刷装置を例に挙げて説明を行ったが通常の印刷装置(パーソナルコンピュータと接続して使用するタイプの印刷装置)に対して本発明を適用することができる。また、図12に示す、スキャナ装置、印刷装置、および、コピー装置が一体となったいわゆる複合型の印刷装置に対して本発明を適用することも可能である。
図12の例では、印刷装置211は、装置全体を覆うケース212と、印刷媒体としての印刷用紙を供給する給紙装置213と、紙媒体等に印刷された画像を読み取るスキャナ部230と、印刷用紙に対して印刷を行う印刷部(不図示)とを備える。
ケース212は、略四角形状の箱体であり、上面にスキャナ部230が設けられており、また、前面中央部には、LCD217と、各種操作ボタン218とを備える。LCD217には、図1の場合と同様に、印刷装置211のメニュー機能、動作内容、動作状況、エラー内容などが表示され、操作ボタン218は、印刷装置211のメニュー選択等を行う時に押されるようになっている。
ケース212は、前面下部に、排出口212aを備え、印刷された印刷用紙が排出されるようになっている。また、ケース212の前面右側には、カードスロット221が設けられており、例えばディジタルカメラなどによって撮影された画像データを記録するメモリカードMが、取り外し自在に収納されるようになっている。
給紙装置213は、ケース212の背面側に設けられており、印刷用紙をストックするとともに、必要に応じて印刷装置211の内部に一枚ずつ供給する。
図13は、図12に示す複合型の印刷装置210の制御系の構成例を示す図である。なお、この図において、図2の場合と対応する部分には同一の符号を付してその説明を省略する。図13の例では、図2の場合と比較して、操作ボタン18が操作ボタン218に置換され、また、スキャナ部230が新たに付加されている。なお、その他の構成は、図2の場合と同様である。
ここで、操作ボタン218としては、スキャナ装置およびコピー装置を制御するためのボタンが新たに追加されている。スキャナ部230は、紙媒体に印刷されている画像を読み取るための光学系、撮像系、および、これらを制御するための制御系によって構成されており、CPU50の制御に応じて紙媒体に印刷された画像を読み取って、対応する画像データに変換して出力する。
このような複合型の印刷装置211では、メモリカードMから読み込んだ画像データに対して、前述したような処理を実行することにより、画像に含まれている顔に応じて補正処理を行うことが可能となる。
また、図12に示す実施の形態では、メモリカードMのみならず、スキャナ部230によって読み込まれた画像に含まれている顔に応じて、補正処理を実行することも可能になる。すなわち、スキャナ部230に、例えば、写真等を配置してスキャンすることにより、画像を画像データに変換して読み込み、当該画像データに対して、前述の場合と同様の処理を実行することにより、人物の顔色に応じて補正処理を実行することができる。
なお、以上の実施の形態は、一例であって、これ以外にも種々の変形実施態様が存在する。例えば、以上の実施の形態では、画像データの抽出する領域は固定としたが、例えば、過去の処理に基づいて学習を行い、最適な範囲を設定するようにしてもよい。具体的には、画像データにおける顔が存在する確率が高い部分を過去のデータから特定し、当該部分を含むように領域を設定するようにすればよい。そのような方法によれば、最小限のコストで顔を発見することが可能になる。
また、以上の実施の形態では、中央部分の切り出す領域としては、略矩形形状の領域を設定するようにしたが、これ以外の形状に領域を切り出すようにしてもよい。例えば、台形形状、三角形状、あるいは、円形形状であってもよい。
また、以上の実施の形態では、中央部分の領域を拡大または縮小するようにしたが、拡大または縮小をせずに、切り出した領域の画像をそのまま用いて認識処理を実行するようにしてもよい。また、縮小および拡大を何度か繰り返すことにより、ノイズ成分を減少させ、認識精度を向上させることも可能である。さらに、切り出した画像についてもモザイク処理を施した後に顔が含まれているか否かの検出処理を行うこともできる。
また、以上の実施の形態では、YCC方式の画像のY画像を利用して顔を検出するようにしたが、例えば、RGB方式の画像から黒白濃淡画像を生成し、当該白黒濃淡画像から顔を検出することも可能である。
また、以上の実施の形態では、顔の大きさに拘わらず、10人検出した場合に、処理を終了するようにしたが、例えば、小さい顔については重要度が低いと考えることができることから、大きい顔が所定の個数見つかった場合には、処理を終了するようにしてもよい。そのような実施の形態によれば、処理速度を向上させることができる。また、それぞれの大きさについて、個数を定めておき、定められた個数の顔が検出された場合には処理を終了するようにしてもよい。例えば、第1のテンプレートでは1つ、第2のテンプレートでは2つ、といった具合である。そのような処理によれば、主な被写体と考えられる大きな顔が検出された場合には、迅速に処理を終了することにより、処理時間を短縮することができる。
また、以上の実施の形態では、正面を向いた顔に対応するテンプレートを使用するようにしたが、例えば、上、下、右、および、左を向いたテンプレートを用いるようにしてもよい。その場合、正面と上、下、右、左の中間の段階のテンプレートを複数用意し、それぞれのテンプレートとのマッチング処理を実行してもよい。そのような実施の形態によれば、被写体の人物が正面以外の方向を向いている場合であっても、顔として認識される確率を向上させることができる。
また、以上の実施の形態では、図11(B)に示す順序で顔を検出するようにしたが、例えば、顔が含まれている蓋然性が最も高い、画面の中央から外側に向かって、螺旋状に旋回しながら検出するようにしてもよい。なお、そのとき、画面の中央部分では、抽出範囲の移動ステップを小さくし、外側に行くほどステップを大きくするようにしてもよい。そのような実施の形態によれば、例えば、顔が存在する蓋然性に応じたステップで検出処理を実行することができる。また、前述の大きい顔が見つかった場合には処理を終了する実施の形態と併せて実施するようにすれば、処理速度を向上させることが可能になる。
また、以上の実施の形態では、抽出画像データを拡大する方法としては、線形補間を利用するようにしたが、これ以外の処理によって拡大処理することも可能である。例えば、補間点から最も近くにある画像構成点の色をそのまま補間点の色とするニアレストネーバー法、補間点の周囲にある4画像構成点の色の加重平均値を補間点の色とするバイリニア法、および、補間点の周囲にある4×4=16画像構成点をキュービックスプライン法により補間した結果を補間点の色とするバイキュービック法等を用いることができる。
また、以上の実施の形態では、図3,6,9に示す処理を、印刷装置11または印刷装置211において実行するようにしたが、例えば、印刷装置11または印刷装置211に接続されているホストコンピュータにおいて実行することも可能である。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、画像処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD(Digital Versatile Disk)、DVD−RAM、CD−ROM(Compact Disk ROM)、CD−R(Recordable)/RW(ReWritable)などがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。
プログラムを流通させる場合には、たとえば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、たとえば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。
本発明の実施の形態に係る印刷装置の構成例を示す図である。 図1に示す印刷装置の制御系の構成例を示す図である。 図1に示す印刷装置において実行される処理を説明する図である。 図1に示す印刷装置の印刷対象となるファイルを示す図である。 顔色と光源との関係を示す図である。 図3に示すステップS18の処理の詳細を示す図である。 図6に示す処理の詳細を説明する図である。 拡大処理の他の処理方法を示す図である。 図3に示すステップS19の処理の詳細を示す図である。 図9に示す処理において利用されるテンプレートを示す図である。 図9に示す処理による顔検出の流れを示す図である。 複合型の印刷装置の外観を示す図である。 複合型の印刷装置の制御系の構成例を示す図である。
符号の説明
50 CPU(抽出手段、判定手段、補正手段、拡大手段、縮小手段)、51 ROM、52 RAM、 62 プリンタエンジンコントローラ

Claims (5)

  1. 画像の中央領域を抽出する抽出手段と、
    前記中央領域内に顔領域が含まれているか否か判定する判定手段と、
    前記中央領域内の顔領域の画素値に基づいて前記画像を補正する補正手段と、
    を有し、
    前記判定手段は、前記中央領域内に、定められた数の顔領域が含まれていると判定した場合、判定を終了する、
    画像処理装置。
  2. 請求項1に記載の画像処理装置であって、
    前記判定手段は、前記中央領域内において、テンプレートを所定ステップで走査させるマッチング処理により前記判定を行い、
    前記ステップは前記中央領域の外側にいくほど大きくなる、
    画像処理装置。
  3. 請求項1又は請求項のいずれか1項に記載の画像処理装置であって、
    前記判定手段により前記中央領域内に複数の顔領域が含まれると判定された場合、前記補正手段はそれぞれの顔領域の画素値の中央値または平均値に基づいて前記画像を補正する、
    画像処理装置。
  4. 画像の中央領域を抽出する抽出ステップと、
    前記中央領域内に顔領域が含まれているか否か判定する判定ステップと、
    前記中央領域内の顔領域の画素値に基づいて前記画像を補正する補正ステップと、
    を有し、
    前記判定ステップにおいて、前記中央領域内に、定められた数の顔領域が含まれていると判定した場合、判定を終了する、
    画像処理方法。
  5. 画像の中央領域を抽出する抽出手段、
    前記中央領域内に顔領域が含まれているか否か判定する判定手段、
    前記中央領域内の顔領域の画素値に基づいて前記画像を補正する補正手段、
    としてコンピュータを機能させ、
    前記判定手段は、前記中央領域内に、定められた数の顔領域が含まれていると判定した場合、判定を終了する、
    コンピュータ読取可能な画像処理プログラム。
JP2005094814A 2005-03-29 2005-03-29 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム Active JP4742642B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005094814A JP4742642B2 (ja) 2005-03-29 2005-03-29 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム
US11/391,203 US7869630B2 (en) 2005-03-29 2006-03-29 Apparatus and method for processing image
US12/824,735 US20100260423A1 (en) 2005-03-29 2010-06-28 Apparatus and method for processing image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005094814A JP4742642B2 (ja) 2005-03-29 2005-03-29 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010280209A Division JP2011061868A (ja) 2010-12-16 2010-12-16 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2006277274A JP2006277274A (ja) 2006-10-12
JP4742642B2 true JP4742642B2 (ja) 2011-08-10

Family

ID=37211982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005094814A Active JP4742642B2 (ja) 2005-03-29 2005-03-29 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム

Country Status (1)

Country Link
JP (1) JP4742642B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8977064B2 (en) 2008-02-13 2015-03-10 Qualcomm Incorporated Rotational transcoding for JPEG or other coding standards
JP5256974B2 (ja) * 2008-10-01 2013-08-07 セイコーエプソン株式会社 画像処理装置、画像処理方法、及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003099777A (ja) * 2001-09-21 2003-04-04 Victor Co Of Japan Ltd 顔画像検索装置
JP2004240829A (ja) * 2003-02-07 2004-08-26 Olympus Corp 顔写真画像調整システム
JP4277534B2 (ja) * 2003-02-12 2009-06-10 オムロン株式会社 画像編集装置および画像編集方法

Also Published As

Publication number Publication date
JP2006277274A (ja) 2006-10-12

Similar Documents

Publication Publication Date Title
US7869630B2 (en) Apparatus and method for processing image
US9137417B2 (en) Systems and methods for processing video data
US6735341B1 (en) Image processing device and method and recording medium for recording image processing program for same
JP4924727B2 (ja) 画像処理装置及び画像処理プログラム
US20040095477A1 (en) ROI setting method and apparatus, electronic camera apparatus, program, and recording medium
JP2007087234A (ja) 画像処理方法および装置ならびにプログラム
JP2012027687A (ja) 画像処理装置及びプログラム
JP2006343863A (ja) 画像処理装置及びその方法
JPH11215498A (ja) 画像処理装置および画像処理方法およびプログラム記憶媒体
US20060109488A1 (en) Method of setting background picture in image printer having display unit
JP2006279460A (ja) 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム
JP4742642B2 (ja) 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム
JP3820751B2 (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JP4636786B2 (ja) 撮影画像投影装置、撮影画像投影装置の画像処理方法及びプログラム
JP2011118944A (ja) 画像処理装置、印刷装置、画像処理方法、及びコンピュータープログラム
JP5609555B2 (ja) 画像処理装置、プログラムおよび画像処理方法
JP4770231B2 (ja) 画像処理装置、画像処理方法および、画像処理プログラム
JP2008028802A (ja) 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム
JP2011061868A (ja) 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム
JP2006306045A (ja) 印刷装置、画像印刷方法、および、画像印刷プログラム
JP2007200091A (ja) 画像処理装置
JP2007274702A (ja) 画像撮影システム
JP2008165734A (ja) ぼやけ判定装置、ぼやけ判定方法および印刷装置
JP2008090399A (ja) 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム
JP2005202834A (ja) 文字認識システム、文字認識方法及び文字認識プログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070404

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100818

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100921

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101216

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110425

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4742642

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250