JP2010166263A - 画像処理装置および画像処理方法、ならびにプログラム - Google Patents

画像処理装置および画像処理方法、ならびにプログラム Download PDF

Info

Publication number
JP2010166263A
JP2010166263A JP2009006116A JP2009006116A JP2010166263A JP 2010166263 A JP2010166263 A JP 2010166263A JP 2009006116 A JP2009006116 A JP 2009006116A JP 2009006116 A JP2009006116 A JP 2009006116A JP 2010166263 A JP2010166263 A JP 2010166263A
Authority
JP
Japan
Prior art keywords
skin color
face
detection
image
color detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009006116A
Other languages
English (en)
Other versions
JP5153660B2 (ja
Inventor
Fumitaka Nakayama
文貴 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009006116A priority Critical patent/JP5153660B2/ja
Publication of JP2010166263A publication Critical patent/JP2010166263A/ja
Application granted granted Critical
Publication of JP5153660B2 publication Critical patent/JP5153660B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Abstract

【課題】肌色検出の精度を向上し、高画質化を実現する。
【解決手段】画像中に含まれる肌色領域を検出し、当該肌色領域の符号量を増やして高画質に符号化処理する画像処理装置であって、画像信号を入力する画像入力手段と、前記画像信号に係る入力画像から人物の顔領域を検出する顔検出手段と、前記検出された顔領域の顔特徴量を抽出する特徴量抽出手段と、前記検出された顔領域に応じて前記入力画像から肌色領域を検出する肌色検出手段と、前記抽出された顔特徴量に基づいて、前記肌色検出手段により肌色領域を検出するための閾値を設定する設定手段と、を有する。
【選択図】図2

Description

本発明は、画像から人物の肌色領域を検出する画像処理技術に関する。
近年のマルティメディアの発展に伴い様々な動画像圧縮符号化方式が提案されており、代表的なものに、MPEG−1,2,4やH.26Lがある。MPEG方式に準拠して画像の圧縮・符号化を行う場合、その符号量は、画像自体の特性である空間周波数特性やシーン及び量子化パラメータに応じて大きく異なる場合が多い。このような符号化特性を実現する上で良好な画質の復号化画像を得られるようにするための重要な技術が符号量制御や量子化制御であり、TM5(Test Model 5)と呼ばれる方式が一般的に使用されている。
TM5方式は、大きく3つのステップに分けて実行される。ステップ1は、今から符号化を行うピクチャの目標符号量を決定する。ステップ2は、ピクチャ内で実際の発生符号量が目標符号量に近づくように、マクロブロックについて、量子化パラメータの参照値を設定する。
ステップ3は、視覚特性、即ち、復号化された画像の画質が良好になるように、符号化対象のマクロブロックの空間アクティビティに基づいて、量子化パラメータを決定する処理を実行する。具体的には、マクロブロックにおける8x8のサブブロックにおける空間アクティビティを算出し、ステップ2で算出した量子化パラメータの参照値に乗ずることで量子化に使用する量子化パラメータを決定する。この処理により、視覚的劣化が目立ちやすい平坦部(空間アクティビティが低い)に符号量が多く割り当てられるため、画質の劣化を抑えた符号量制御ならびに量子化制御が実現できる。
一方、ステップ3に、人物の肌色を検出して、肌色と検出された領域に対して多くの符号量を割り当てる処理を組み入れることで注視領域に対する画質の向上を図る手法も提案されている。
肌色検出手法に関しては、その多くは閾値を用いた検出方法であり、過去に様々な提案がされている。その理由は、人物の肌色は色領域の中でも特定の領域に存在することがわかっているためである。以下に肌色検出の一例について説明する。
一般的な肌色検出手法として、所定サイズのブロックに含まれる各画素の色差の平均値を算出し、閾値(th0〜th1)内に含まれる場合、そのブロックを肌色であると判定する手法がある。
また、他の肌色検出手法として、ブロック内の各画素が持つ色差の値が所定の閾値内(th2〜th3)に含まれるか判定して、th1〜th2にある画素が別の閾値(th4)を超えた場合、ブロックは肌色が多く含まれていると判定する手法がある。なお、このブロックは符号化(量子化)との整合性を利用してマクロブロックとしてもよい。
また、別の手法として色情報をRGB空間からHI(V)空間に変換し、HとIで予め決められた閾値により肌色を抽出する方法(特許文献1参照)や、この手法の応用としてデジタルカメラによるホワイトバランス設定や美肌処理がある。
特開2000−048184号公報
しかしながら、上記閾値を用いた肌色検出では、照明条件や気候の変化等の影響によって人物の肌色を正確に検出することが難しくなる。暗い室内や曇りの日には撮像装置に入力される光信号が弱いため、装置内部で信号の増幅(ゲインアップ)を行うので、実際の肌色とは異なる色空間となる場合がある。
また、自然界には木目の机や紅葉といった人物の目には肌色に見えなくても、人物の肌色に近い色空間を持つ物体が数多く存在する。このため、本来肌色として検出したい領域が検出できなかったり、肌色でない領域を肌色と誤検出してしまうことで、肌色の領域よりも肌色以外の領域に符号量が多く割り当てられてしまい、画質低下を引き起こすおそれもある。
本発明は、上記課題に鑑みてなされ、肌色検出の精度を向上し、高画質化を実現するものである。
上記課題を解決するために、本発明に係る画像処理装置は、画像中に含まれる肌色領域を検出し、当該肌色領域の符号量を増やして高画質に符号化処理する画像処理装置であって、画像信号を入力する画像入力手段と、前記画像信号に係る入力画像から人物の顔を検出する顔検出手段と、前記検出された顔の顔特徴量を抽出する特徴量抽出手段と、前記検出された顔に応じて前記入力画像から肌色領域を検出する肌色検出手段と、前記抽出された顔特徴量に基づいて、前記肌色検出手段により肌色領域を検出するための閾値を設定する設定手段と、を有する。
また、本発明に係る画像処理方法は、画像中に含まれる肌色領域を検出し、当該肌色領域の符号量を増やして高画質に符号化処理する画像処理方法であって、画像信号を入力する画像入力工程と、前記画像信号に係る入力画像から人物の顔を検出する顔検出工程と、前記検出された顔の顔特徴量を抽出する特徴量抽出工程と、前記検出された顔に応じて前記入力画像から肌色領域を検出する肌色検出工程と、前記抽出された顔特徴量に基づいて、前記肌色検出工程にて肌色領域を検出するための閾値を設定する設定工程と、を有する。
本発明によれば、肌色検出に用いる閾値を顔検出結果から得られる顔特徴量を用いてダイナミックに変化させることで、肌色検出精度を向上し、高画質化を実現できる。
以下に、添付図面を参照して本発明を実施するための最良の形態について詳細に説明する。
尚、以下に説明する実施の形態は、本発明を実現するための一例であり、本発明が適用される装置の構成や各種条件によって適宜修正又は変更されるべきものであり、本発明は以下の実施の形態に限定されるものではない。
[第1の実施形態]
先ず、本発明に係る第1の実施形態について図1〜図5を参照して説明する。
図1は、本発明に係る第1の実施形態の画像処理装置の全体構成を示すブロック図である。図2は本実施形態の画像処理装置による画像処理方法示すフローチャートである。図3は顔検出処理と肌色検出処理について説明する図である。図4は顔検出されない画像を例示する図である。図5は肌色検出領域の設定方法について説明する図である。
本実施形態の画像処理装置は、符号化方式としてMPEG(Moving Pictures of Experts Group)やH.264/AVC(Advanced Video Coding)を適用するデジタルビデオカメラである。また、本実施形態に係る画像処理装置は、画像中に含まれる肌色領域を検出し、当該肌色領域の符号量を増やして高画質に符号化処理する機能を有する。
図1において、100〜110が主にカメラ処理系を構成するブロックであり、120〜137が主に記録処理系を構成するブロックである。
カメラ処理系のうち、フォーカスレンズを含む結像光学系100により、被写体の光学像がCCDやCMOSなどの撮像素子101の受光面に結像され、撮像素子101により光電変換されて画像信号が生成される。撮像素子101から出力される画像信号はカメラ信号処理部102で色分離、ガンマ補正、ホワイトバランス調整等の必要な信号処理が施され、輝度・色差信号を形成してフレームメモリ103に格納される。フレームメモリ103に格納された輝度・色差信号は、画像変倍部104により、任意の画像範囲が読み出され、所定の画素補間処理により、画像の拡大/縮小処理を行うと共に、所定の記録フォーマットに変換される。
また、カメラ処理系には顔検出部106が設けられ、カメラ信号処理部102からの出力信号ならびに画像変倍部104で所定の記録フォーマットに変換された信号のいずれかが第1のセレクタ105によって選択的に入力される。
第1のセレクタ105は顔検出部106の性能に依存して入力を切り替えるためにあり、画像変倍部104で変換された画像サイズがカメラ信号処理部102の出力画像サイズよりも小さいと仮定する。顔検出部106の処理性能が十分高い場合や高精度で顔検出を行う場合は、入力画像をそのまま顔検出に使用するため、カメラ信号処理部102からの出力信号を第1のセレクタ105に入力する。逆に、顔検出部106の処理性能が十分ではない場合や高い精度が必要ない場合は画像変倍部104で所定の記録フォーマットに変換された信号を第1のセレクタ105に入力する。本実施形態では、どちらの信号を選択しても良いし、検出する顔の個数などからダイナミックに切り替えても良く、本発明はこの選択方法について特に限定されるものではない。
顔検出部106により顔が検出された場合、検出された顔のサイズや位置情報を顔特徴量抽出部109に出力する。顔特徴量抽出部109では、検出した顔の色情報を抽出してカメラ系コントローラ110に出力する。また、上記顔のサイズや位置情報もカメラ系コントローラ110に出力され、肌色検出領域の設定に使用される。ここでの処理の詳細は、後段の記録処理系の肌色検出部135と合わせて後述する。
なお、顔検出部106の検出結果がカメラ処理系のレンズ制御部107に出力され、顔領域にピントを合わせるために結像光学系100を制御する。同様に、カメラ制御部108にも顔検出結果が出力され、顔の画質を向上させるための露出補正や美肌処理も合わせて実行する。ただし、本発明を実現する上で、この機能は必須ではない。
次に、記録処理系のうち、カメラ処理系で所定の記録フォーマットに変換された信号が記録処理系の入力部であるフレームメモリ120に保持される。フレームメモリ120に保持された信号は、フレーム並べ替え部121により所定の符号化フォーマットに準拠した順序で符号化ピクチャタイプに応じた並べ替えが実行される。フレーム並べ替え部121による並べ替えが終了した画像はブロックに分割される。その後、符号化ピクチャがフレーム内符号化(イントラ符号化)方式の場合は、直交変換部123にてマクロブロック内の信号に対して直交変換処理が実行され、量子化部124で直交変換係数が量子化される。また、符号化ピクチャがフレーム間符号化ピクチャ(インター符号化)方式の場合は、既に符号化されたピクチャに対して逆量子化部125にて逆量子化、逆直交変換部126にて逆直交変換処理が実行されたローカルデコード画像を作成する。
次に、動き予測/動き補償部127により、これから符号化するピクチャとの動き予測ならびに動き補償が実行され、ローカルデコード画像との差分値が加減算部122により算出される。算出された差分値は、直交変換部123にて直交変換処理が実行され、量子化部124にて直交変換係数が量子化される。
フレーム内符号化およびフレーム間符号化に関わらず量子化部124で量子化された量子化信号は可変長符号化部131で符号化され、符号化された信号がストリームバッファ132で一旦保持された後、HDDや光ディスク等の記録媒体136に記録される。
一方、符号量制御部133は、GOP内の各ピクチャに対する割り当てビット量を、割り当て対象ピクチャを含めてGOP内でまだ符号化されていないピクチャに対するビット量に応じて割り当てる。この割り当てをGOP内の符号化ピクチャ順に繰り返し、ピクチャごとにピクチャ目標符号量が設定される。
量子化制御部134は、各ピクチャに対する目標符号量と可変長符号化部131から出力される発生符号量とを一致させるための仮想バッファの容量に基づき、フィードバック制御により量子化パラメータを算出する。そして、肌色検出部135で肌色と検出したマクロブロックを、上記算出された量子化パラメータよりも小さくするように制御する。量子化パラメータを小さくすることによって、肌色と検出されたマクロブロックでは符号量が増え、高画質となる。
次に、本実施形態における顔検出処理と肌色検出処理について図2のフローと図3〜図5を参照して説明する。
図2において、AC電源やバッテリーなどから電力が供給され、画像処理装置が起動されると、S201において、先ず、顔検出部106が連続して顔を検出しないフレーム数であるMの値をゼロにリセットする。この時点でカメラ処理系、記録処理系を含む装置の各ブロックが記録スタンバイ状態に移行する。
S202では、画像入力処理として、結像光学系100、撮像素子101、カメラ信号処理部102を介して顔検出部106に画像が入力される。なお、顔検出部106以外の画像信号の流れは上述した通りである。
S203では、顔検出部106で顔検出処理を行う。S203で顔を検出した場合はS204に移行する。顔を検出しなかった場合はS212に移行するが、ここでの処理は後述する。
S204では、現在のフレームで顔を検出したので連続して顔を検出しないフレーム数Mをゼロにリセットする。
S205では、顔検出部106で顔と検出された領域に対して、顔のサイズと位置情報から肌色検出を行う肌色検出領域(AM0)を設定する。この設定方法について図5を参照して説明する。
図5において、501は入力画像、502は顔検出部106で顔と検出された領域である。503は入力画像501に対して顔のサイズと位置情報から肌色検出領域の設定を行った画像である。504は領域設定を行う過程の領域であり、505が肌色検出領域である。
入力画像501に対して、顔と検出された領域502のサイズと位置情報から、504のように顔の位置を基準として下方向に肌色検出領域が設定される。また、一般的に人物の胴体は顔よりも横方向に広いため、505のように顔より下の領域を肌色検出領域504よりも横方向に広く設定する。なお、肌色検出領域の形状は、505のような四角形に限らず、506のような台形でも良く、顔のサイズ等に応じて任意に設定可能である。また、顔検出結果から人物の胴体を検出する機能を有していれば、胴体に対して肌色検出領域を設定しても良い。また、本発明は、上述した肌色検出領域の設定方法に限定されない。
図2の説明に戻り、S206aにおいて、顔検出部106で顔と検出された領域に対して顔特徴量抽出部109が顔に含まれる色情報を抽出し、S206bにおいて、顔特徴量抽出部109での抽出結果から肌色検出部135に用いる閾値を設定する。ここでの色情報は、YUV(YCbCr)、RGB、HSV等の色空間情報である。
ここで、色空間としてYCbCrを一例とした顔特徴量抽出処理および肌色検出処理について図3を参照して説明する。
図3において、301は入力画像であり、入力画像301に対して顔検出を行った結果、図5の501,502と同様に、顔検出領域302で顔が検出されたとする。次に、顔検出領域302に含まれるCb値のヒストグラムの中で最も多くの画素数を占めるCb値(ピーク値)をCbtopとする。Cbtopは、顔検出領域302にある顔を構成する肌色に最も近い色であると考えられる。これより、顔検出領域302に含まれる顔だけでなく、人物の首、手、足といった肌色もCbtopを中心として構成されていると考えられる。よって、Cbtopから所定の範囲内にあるCb値はこの人物の肌色であるとして、肌色検出部135で用いるCb値の閾値としてCbLM0、CbHM0を設定する(303)。ここでの所定の範囲は任意に決定できるものである。また、Cr値もCb値と同様に閾値としてCrLM0、CrHM0を設定する(303)。なお、色空間としてYCbCrを例示したが、他の色空間の場合はその空間に応じた閾値を設定すればよい。
次に、S207に移行して、顔のサイズと位置情報から設定された肌色検出領域に対して、S206bで設定された肌色検出閾値を用いて肌色検出を行う(図3の304)。また、肌色検出領域以外の領域に対しては肌色検出を行わない。これにより、肌色が存在しない可能性が高い領域での肌色の誤検出が発生しにくくなる。
一方、S203において顔を検出しなかった場合、S212に移行して顔を検出しないフレーム数であるMに1を加算して更新する。
S213において、顔を検出しないフレーム数Mが所定の期間T0よりも短い場合はS214aに移行し、T0よりも長い場合はS215に移行する。
S214a,214bでは、直近の顔検出時(つまりM=0)の肌色検出領域および肌色検出閾値に設定し、S207に移行して肌色検出を行う。これは、図4の401のように人物が一時的に横を向いた場合や下を向いた場合、あるいは顔検出部106の処理量等の関係で一瞬だけ顔が検出されなかったのであれば、人物自体は画像内に存在すると考えられるためである。
一方、顔を検出しないフレーム数Mが所定の期間TOより長い場合は、S215に移行して肌色検出を行わない。これは、図4の402のように人物の顔が一瞬だけ検出されなかったのではなく、画像内に人物が存在しないと考えられるためである。
S208において、顔を検出した場合または顔を検出しないフレーム数Mが期間TOより短かい場合には、S206bまたはS214bで設定された肌色検出閾値に応じて肌色検出を行い、その結果に基づいて入力画像を符号化する。ここでは、量子化制御部134は、肌色領域の符号量を肌色以外の領域よりも多く割り当てるように量子化パラメータを決定する。
次に、S209において、符号化された画像信号は記録媒体136に保存され、S210において、記録終了が行われない、つまりそのまま記録を継続する場合は、S211に移行する。S211では、現在の肌色検出閾値を保持した上でS202に移行し、次フレームの画像の入力を受けて上記S202以降の処理を繰り返し実行する。
一方、S210において、記録終了が行われたならば本処理を終了する。
[第2の実施形態]
第2の実施形態は、入力画像内に複数の人物が存在した場合である。
なお、本実施形態の画像処理装置の構成は図1と同様であるので説明は省略する。
図6は第2の実施形態の画像処理方法を説明する図であり、図5の画像内の人物が複数になったものである。
図6において、601は入力画像であり、人物Aと人物Bが存在するものとする。602は人物Aに対して顔検出部106で顔と検出された領域であり、603は入力画像601に対して顔のサイズと位置情報から設定された人物Aの肌色検出領域である。同様に、604は人物Bに対して顔検出部106で顔と検出された領域であり、605は入力画像601に対して顔のサイズと位置情報から設定された人物Bの肌色検出領域である。
第1の実施形態と同様の方法により、入力画像601に対して、人物Aの顔と検出された領域602のサイズと位置情報から、603のように人物Aに対する肌色検出領域が設定される。同様に、人物Bの顔と検出された領域604のサイズと位置情報から、605のように人物Bに対する肌色検出領域が設定される。
次に、人物Aの顔に対して顔特徴量抽出部109が顔に含まれる色情報を抽出し、肌色検出領域603に対して肌色検出閾値の設定を行う。同様に、人物Bの顔に対しても肌色検出領域605に対して肌色検出に用いる閾値の設定を行う。なお、これら肌色検出領域と閾値の各設定方法は第1の実施形態と同様であるが、これらに限ったものではない。
次に、顔のサイズと位置情報から設定された肌色検出領域に対して、顔の肌色情報から設定された肌色検出閾値を用いて肌色検出を行う(606)。また、肌色検出領域以外の領域に対しては肌色検出を行わないようにする。これにより肌色が存在しない可能性が高い領域での肌色誤検出を発生しにくくなる。
その他の処理は第1の実施形態と同様である。また、第2の実施形態では2人の人物を例示したが、3人以上でも良く、顔検出部106により検出可能な顔の数に依存するものとする。
[第3の実施形態]
第3の実施形態は、入力画像内に複数の人物が存在しかつ顔検出結果から設定された肌色検出領域が互いに重複している場合である。
なお、本実施形態の画像処理装置の構成は図1と同様であるので説明は省略する。
図7は第3の実施形態の画像処理方法を説明する図であり、図5の画像内の人物について肌色検出領域が重複したものである。
図7において、701は入力画像であり、人物Aと人物Bが存在するものとする。702は人物Aに対して顔検出部106で顔と検出された領域であり、703は入力画像701に対して顔のサイズと位置情報から設定された人物Aの肌色検出領域である。同様に、704は人物Bに対して顔検出部106で顔と検出された領域であり、705は入力画像701に対して顔のサイズと位置情報から設定された人物Bの肌色検出領域である。また、706は人物Aの肌色検出領域703と人物Bの肌色検出領域705が重複した領域である。
第1の実施形態と同様に、入力画像701に対して、人物Aの顔と検出された領域702のサイズと位置情報から、703のように人物Aに対する肌色検出領域が設定される。同様に、人物Bの顔と検出された領域704のサイズと位置情報から、705のように人物Bに対する肌色検出領域が設定される。
次に、人物Aの顔に対して顔特徴量抽出部109が顔に含まれる色情報を抽出し、肌色検出領域703に対して肌色検出閾値の設定を行う。同様に、人物Bの顔に対しても肌色検出領域705に対して肌色検出に用いる肌色検出閾値の設定を行う。なお、これらの肌色検出領域と閾値の各設定方法は第1の実施形態と同様であるが、これらに限ったものではない。
次に、重複した領域706に関する肌色検出閾値の設定方法について説明する。
第1の方法を説明する。711は人物Aの肌色検出領域703に設定された肌色検出閾値、712は人物Bの肌色検出領域705に設定された肌色検出閾値、713は重複領域706に設定された肌色検出閾値をそれぞれ示している。なお、色情報としてCb値を用いている。この場合、肌色検出領域703に設定された閾値711が、肌色検出領域705に設定された閾値712よりも広い範囲の肌色を検出できる可能性が高いため、重複領域706に設定する肌色検出閾値は、712よりも検出範囲が広い711と同じ値にする。
第2の方法を説明する。人物Aの肌色検出領域703と人物Bの肌色検出領域705を比較すると人物Aの肌色検出領域703の方が広い。この場合、重複領域706は人物Aの肌色が占めている可能性が高いため、重複領域706に設定する閾値は711と同じ値にする。
第3の方法を説明する。721は人物Aの肌色検出領域703に設定された肌色検出閾値、722は人物Bの肌色検出領域705に設定された肌色検出閾値、723は重複領域706に設定された肌色検出閾値をそれぞれ示している。なお、色情報としてCb値を用いている。この場合、肌色検出領域703に設定された閾値721と肌色検出領域705に設定された閾値722の両方を含むように、重複領域706に対する肌色検出閾値723を設定する。これにより人物Aと人物Bの両方の肌色を検出できる可能性が高くなる。
上記重複領域に対する肌色検出閾値の設定方法や個々の肌色検出領域に対する肌色検出閾値の設定方法は特に上述した方法に限定されるものではない。
また、第3の実施形態では2人の人物を例示したが、3人以上でも良く、顔検出部106が検出可能な顔の数に依存するものとする。
[他の実施形態]
尚、上述した各実施形態における各処理は、各処理の機能を実現する為のプログラムをメモリから読み出してコンピュータのCPU(中央演算装置)が実行することによりその機能を実現させるものであってもよい。
また、CPUがアクセスするメモリとしては、HDD、光ディスク、フラッシュメモリ等の不揮発性のメモリや、CD−ROM等の読み出しのみが可能な記録媒体、RAM以外の揮発性のメモリが含まれる。あるいは、これらの組合せによるコンピュータ読み取り、書き込み可能な記録媒体から構成されてもよい。
また、上述した各実施形態における各処理の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各処理を行っても良い。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。具体的には、記憶媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含む。
また、「コンピュータ読み取り可能な記録媒体」とは、CD−ROMやDVD等の光ディスクや半導体メモリカードといった可搬媒体、或いはコンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発メモリ(RAM)も含む。つまり、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムに既に記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
また、上記のプログラムを記録したコンピュータ読み取り可能な記録媒体等のプログラムプロダクトも本発明の実施形態として適用することができる。上記のプログラム、記録媒体、伝送媒体およびプログラムプロダクトは、本発明の範疇に含まれる。
以上、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
本発明に係る第1の実施形態の画像処理装置の全体構成を示すブロック図である。 本実施形態の画像処理装置による画像処理方法を示すフローチャートである。 顔検出処理と肌色検出処理について説明する図である。 顔検出されない画像を例示する図である。 肌色検出領域の設定方法について説明する図である。 第2の実施形態の画像処理方法を説明する図である。 第3の実施形態の画像処理方法を説明する図である。
100 結像光学系
101 撮像素子
102 カメラ信号処理部
103 フレームメモリ(カメラ処理系)
104 画像変倍部
105 第1のセレクタ
106 顔検出部
107 レンズ制御部
108 カメラ制御部
109 顔特徴量抽出部
110 カメラ処理系コントローラ
120 フレームメモリ(記録処理系)
121 フレーム並べ替え部
122 加減算部
123 直交変換部
124 量子化部
125 逆量子化部
126 逆直交変換部
127 動き予測/動き補償部
128 加減算部
129 フレームメモリ(記録処理系)
130 第2のセレクタ
131 可変長符号化部
132 バッファメモリ
133 符号量制御部
134 量子化制御部
135 肌色検出部
136 記録媒体
137 記録処理系コントローラ

Claims (16)

  1. 画像中に含まれる肌色領域を検出し、当該肌色領域の符号量を増やして高画質に符号化処理する画像処理装置であって、
    画像信号を入力する画像入力手段と、
    前記画像信号に係る入力画像から人物の顔を検出する顔検出手段と、
    前記検出された顔の顔特徴量を抽出する特徴量抽出手段と、
    前記検出された顔に応じて前記入力画像から肌色領域を検出する肌色検出手段と、
    前記抽出された顔特徴量に基づいて、前記肌色検出手段により肌色領域を検出するための閾値を設定する設定手段と、を有することを特徴とする画像処理装置。
  2. 前記顔検出手段は、前記入力画像から人物の顔ならびに前記顔のサイズと位置情報を検出し、
    前記顔特徴量は、前記顔検出手段により検出された顔に含まれる色情報を含み、
    前記肌色検出手段は、前記顔ごとに顔のサイズと位置情報とを用いて肌色検出を行うことを特徴とする請求項1に記載の画像処理装置。
  3. 前記肌色検出手段は、前記色情報の値が所定の範囲にある領域を肌色領域として検出することを特徴とする請求項2に記載の画像処理装置。
  4. 前記肌色検出手段は、前記顔検出手段により顔が検出されない期間が所定の期間より短い場合は、直近の顔検出時に設定された閾値を用いて肌色検出を行うことを特徴とする請求項1に記載の画像処理装置。
  5. 前記肌色検出手段は、前記顔検出手段により顔が検出されない期間が所定の期間より長い場合、肌色検出を行わないことを特徴とする請求項1に記載の画像処理装置。
  6. 前記色情報は、画素が持つ色空間情報であることを特徴とする請求項2に記載の画像処理装置。
  7. 前記肌色検出に用いる閾値は、前記顔に含まれる色空間情報のヒストグラムにおけるピーク値から算出されることを特徴とする請求項6に記載の画像処理装置。
  8. 前記顔検出手段により前記入力画像から複数の顔が検出された場合、前記設定手段は、検出されたそれぞれの顔から抽出された顔特徴量に基づいて、前記肌色検出手段により肌色領域を検出するための閾値を設定し、
    前記肌色検出手段は、前記閾値に基づいて顔ごとに肌色領域を検出することを特徴とする請求項1に記載の画像処理装置。
  9. 肌色の検出領域が重複する場合、重複する各検出領域の肌色検出に用いる閾値のいずれか1つを選択し、前記選択した閾値を用いて前記重複する検出領域の肌色検出を行うことを特徴とする請求項8に記載の画像処理装置。
  10. 肌色の検出領域が重複する場合、重複する各検出領域の肌色検出に用いる閾値から検出範囲が最も広くなる閾値を選択し、前記選択した閾値を用いて前記重複する検出領域の肌色検出を行うことを特徴とする請求項8に記載の画像処理装置。
  11. 肌色の検出領域が重複する場合、重複する各検出領域の肌色検出に用いる閾値から検出領域が最も広い領域の閾値を選択し、前記選択した閾値を用いて前記重複する検出領域の肌色検出を行うことを特徴とする請求項8に記載の画像処理装置。
  12. 肌色の検出領域が重複する場合、重複する各検出領域の肌色検出に用いる閾値から新たな閾値を設定し、前記新たに設定した閾値を用いて前記重複する検出領域の肌色検出を行うことを特徴とする請求項8に記載の画像処理装置。
  13. 肌色の検出領域が重複する場合、重複する各検出領域の肌色検出に用いる閾値から検出範囲が最も広くなる新たな閾値を設定し、前記新たに設定した閾値を用いて前記重複する検出領域の肌色検出を行うことを特徴とする請求項8に記載の画像処理装置。
  14. 被写体の光学像から画像信号を生成する撮像手段と、
    前記撮像された画像から検出された肌色領域に対する符号量を肌色以外の領域に対する符号量より多く割り当てて符号化および記録を行う記録手段と、をさらに有することを特徴とする請求項1に記載の画像処理装置。
  15. 画像中に含まれる肌色領域を検出し、当該肌色領域の符号量を増やして高画質に符号化処理する画像処理方法であって、
    画像信号を入力する画像入力工程と、
    前記画像信号に係る入力画像から人物の顔を検出する顔検出工程と、
    前記検出された顔の顔特徴量を抽出する特徴量抽出工程と、
    前記検出された顔に応じて前記入力画像から肌色領域を検出する肌色検出工程と、
    前記抽出された顔特徴量に基づいて、前記肌色検出工程にて肌色領域を検出するための閾値を設定する設定工程と、を有することを特徴とする画像処理方法。
  16. 請求項15に記載の画像処理方法を画像処理装置のコンピュータに実行させるためのプログラム。
JP2009006116A 2009-01-14 2009-01-14 画像処理装置および画像処理方法、ならびにプログラム Expired - Fee Related JP5153660B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009006116A JP5153660B2 (ja) 2009-01-14 2009-01-14 画像処理装置および画像処理方法、ならびにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009006116A JP5153660B2 (ja) 2009-01-14 2009-01-14 画像処理装置および画像処理方法、ならびにプログラム

Publications (2)

Publication Number Publication Date
JP2010166263A true JP2010166263A (ja) 2010-07-29
JP5153660B2 JP5153660B2 (ja) 2013-02-27

Family

ID=42582094

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009006116A Expired - Fee Related JP5153660B2 (ja) 2009-01-14 2009-01-14 画像処理装置および画像処理方法、ならびにプログラム

Country Status (1)

Country Link
JP (1) JP5153660B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017041791A (ja) * 2015-08-20 2017-02-23 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
JP2017130976A (ja) * 2017-04-17 2017-07-27 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
JP2021152741A (ja) * 2020-03-24 2021-09-30 株式会社フジタ 発話制御装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220309713A1 (en) 2021-03-26 2022-09-29 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339471A (ja) * 1999-05-31 2000-12-08 Matsushita Electric Ind Co Ltd 画像抽出方法およびその装置
JP2001016606A (ja) * 1999-06-29 2001-01-19 Sharp Corp 動作認識システムおよび動作認識プログラムを記録した記録媒体
JP2002238060A (ja) * 2001-02-07 2002-08-23 Sony Corp 画像符号化方法、画像符号化装置、プログラムおよび記録媒体
JP2004206665A (ja) * 2002-10-30 2004-07-22 Japan Science & Technology Agency 顔検出方法及び顔検出装置
JP2005218016A (ja) * 2004-02-02 2005-08-11 Canon Inc 画像処理装置及び方法
JP2007257087A (ja) * 2006-03-20 2007-10-04 Univ Of Electro-Communications 肌色領域検出装置及び肌色領域検出方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339471A (ja) * 1999-05-31 2000-12-08 Matsushita Electric Ind Co Ltd 画像抽出方法およびその装置
JP2001016606A (ja) * 1999-06-29 2001-01-19 Sharp Corp 動作認識システムおよび動作認識プログラムを記録した記録媒体
JP2002238060A (ja) * 2001-02-07 2002-08-23 Sony Corp 画像符号化方法、画像符号化装置、プログラムおよび記録媒体
JP2004206665A (ja) * 2002-10-30 2004-07-22 Japan Science & Technology Agency 顔検出方法及び顔検出装置
JP2005218016A (ja) * 2004-02-02 2005-08-11 Canon Inc 画像処理装置及び方法
JP2007257087A (ja) * 2006-03-20 2007-10-04 Univ Of Electro-Communications 肌色領域検出装置及び肌色領域検出方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017041791A (ja) * 2015-08-20 2017-02-23 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
US10348958B2 (en) 2015-08-20 2019-07-09 Casio Computer Co., Ltd. Image processing apparatus for performing predetermined processing on a captured image
JP2017130976A (ja) * 2017-04-17 2017-07-27 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
JP2021152741A (ja) * 2020-03-24 2021-09-30 株式会社フジタ 発話制御装置
JP7430088B2 (ja) 2020-03-24 2024-02-09 株式会社フジタ 発話制御装置

Also Published As

Publication number Publication date
JP5153660B2 (ja) 2013-02-27

Similar Documents

Publication Publication Date Title
CN110139035B (zh) 用于热管理和功率管理的方法和电子装置
RU2512130C2 (ru) Устройство и способ получения изображений с более высоким разрешением во встроенном устройстве
KR101528895B1 (ko) 관심 특성 색 모델 변수의 적응성 추정을 위한 방법 및 장치
US20180176573A1 (en) Apparatus and methods for the encoding of imaging data using imaging statistics
JP4682102B2 (ja) 画像符号化装置及び画像符号化方法
JP4804107B2 (ja) 画像符号化装置、画像符号化方法及びそのプログラム
JP6961443B2 (ja) 画像処理装置、画像処理方法、及びプログラム
KR20080085182A (ko) 비디오 프레임들로부터 키 프레임들의 선택
JP5421727B2 (ja) 画像処理装置およびその制御方法
CN104160703A (zh) 经对象检测所通知的编码
JP6149707B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、及び動画像撮影装置
JP6726060B2 (ja) 画像処理装置およびその制御方法ならびにプログラム
JP2008193530A (ja) 画像記録装置、画像記録方法、及びプログラム
CN113068034B (zh) 视频编码方法及装置、编码器、设备、存储介质
JP5153660B2 (ja) 画像処理装置および画像処理方法、ならびにプログラム
WO2016197323A1 (zh) 视频编解码方法和视频编解码器
JP5256496B2 (ja) 画像処理システム、画像処理方法、およびプログラム
WO2022252222A1 (zh) 编码方法和编码装置
JP5847569B2 (ja) 画像圧縮方法及び撮像装置
CN116847087A (zh) 视频处理方法、装置、存储介质及电子设备
CN112153317A (zh) 一种图像质量控制方法及其系统和设备
KR100771138B1 (ko) 촬영 장치 및 영상 보정 방법
JP2023030585A (ja) 画像符号化装置及び方法及びプログラム
JP2012138648A (ja) 画像処理装置及び画像処理プログラム
JP2009017450A (ja) 画像処理装置、画像処理方法および画像処理プログラム、ならびに、再生装置、再生方法および再生プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120814

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120820

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121204

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5153660

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees