JPH0981732A - 領域抽出装置及びそれを用いた方向検出装置 - Google Patents

領域抽出装置及びそれを用いた方向検出装置

Info

Publication number
JPH0981732A
JPH0981732A JP7266407A JP26640795A JPH0981732A JP H0981732 A JPH0981732 A JP H0981732A JP 7266407 A JP7266407 A JP 7266407A JP 26640795 A JP26640795 A JP 26640795A JP H0981732 A JPH0981732 A JP H0981732A
Authority
JP
Japan
Prior art keywords
area
image
energy
net
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7266407A
Other languages
English (en)
Other versions
JP3272584B2 (ja
Inventor
Ryushi Funayama
竜士 船山
Naokazu Yokoya
直和 横矢
Haruo Takemura
治雄 竹村
Hidehiko Iwasa
英彦 岩佐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP26640795A priority Critical patent/JP3272584B2/ja
Publication of JPH0981732A publication Critical patent/JPH0981732A/ja
Application granted granted Critical
Publication of JP3272584B2 publication Critical patent/JP3272584B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 照明条件や入力画像の大きさ、画像中の顔位
置や大きさ、回転、背景などの変化に左右されることな
く、顔領域を抽出する。 【解決手段】 顔領域を表す確率密度分布が格納された
確率密度関数格納部7を参照することにより、入力装置
1により入力された人物画像の顔領域確率画像を生成す
る領域確率計算装置5と、画像全体を覆うように設けら
れる仮想的な網を構成する格子点の位置関係に基づく内
部エネルギーと、顔領域確率画像上の格子点が位置する
ピクセル色の確からしさに基づく画像エネルギーとをそ
れぞれ計算するエネルギー計算装置6とを有する。2つ
のエネルギーの合計値が小さくなる方向へ網を収縮変形
させることにより、顔領域を抽出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された画像か
ら、顔が存在している位置、顔の輪郭、及び顔部品など
を検出する領域抽出装置、及びそれを用いて頭の方向や
視線方向を検出する方向検出装置に関するものである。
【0002】
【従来の技術】顔に関する画像処理は、20数年来とい
う非常に長い間多くの研究がなされてきた。顔に関する
画像処理は、顔の特徴点抽出による個人同定、テンプレ
ートマッチングなどによる顔部品抽出、色情報を利用し
たデータ圧縮、モーフィングなどのアニメーション応
用、位相情報の適用など、非常に広範囲に渡る。その中
でも、入力された画像中で、顔がどこにあるか、そし
て、顔画像から、目、鼻、口といった顔部品を抽出する
問題は、最も基本的、かつ非常に応用範囲の広い有用な
技術である。これは、顔画像処理の最初のキーポイント
であり、従来から様々な手法が提案されてきた。
【0003】入力画像から顔位置を検出する手法は、画
像の解像度を落として濃淡画像でテンプレートマッチン
グを行う手法や、色情報とセグメンテーションを利用す
る手法などがある。これらのいずれの手法も、光軸方向
の回転やノイズなどに弱く、誤抽出を起こしやすい。
【0004】顔部品の抽出に関しては、投影を用いる方
法が最もアルゴリズムが単純かつ高速な抽出手法である
が、この方法は照明の強度及び方向、画像中の顔の位置
や大きさや回転などの変動に対して非常に弱く、照明の
被写体までの距離や画質などがかなり制約された環境内
で撮像された画像に対してでないと有効でないことがわ
かっている。また、テンプレートマッチングを利用した
顔部品の抽出法も提案されているが、これは投影を用い
る方法と同様に、照明の変動などにより影が生じたり、
顔の方向、回転の変更や個人差による変動などに非常に
弱いということが言える。以下に投影とテンプレートマ
ッチングについて詳しく説明する。
【0005】投影とはある画像をある方向から見た画像
へ変換することである。この場合の方向とは3次元的な
方向とは異なる。例えば、本実施の形態の説明に用いる
図8に示す入力顔画像があるとする。これを水平方向に
微分して2値化すると図47(a)に示すようになる。
水平方向に微分するとは、図48に示すように、ピクセ
ルの明るさを横方向に順に見ていき、あるピクセルの明
るさと、その前のピクセルの明るさとの差を新しいピク
セルの明るさとすることである。従って、明るさが急激
に変化している画像を微分すると、その変化していると
ころで微分値が大きくなっているため、エッジの抽出な
どを行うことができる。
【0006】この2値化された水平方向の微分画像を水
平方向に投影すると図47(b)、垂直方向に投影する
と図47(c)に示すようになる。このとき、水平方向
に投影するとは、2値化した微分画像のピクセルを水平
方向に見ていき、ONになっているピクセル(図47
(a)では黒いピクセル)の数を数えてそれをグラフに
したものである。垂直方向への投影は、2値化した微分
画像のピクセルを垂直に見ていき、ONになっているピ
クセルの数を数えてそれをグラフにしたものである。こ
の投影画像を調べることにより、顔領域や顔部品領域を
抽出することができる。例えば、図47(b)の水平方
向の投影画像のピークを調べることにより、目の垂直位
置がわかる。また、図47(c)の垂直方向の投影画像
の左右のピークを調べることにより、顔領域の左右の端
を調べることができる。
【0007】しかしながら、この手法は、照明条件が変
わると影のでき方が変わるので微分画像が大きく変化す
ると共に、雑音や背景、顔の回転などにより投影画像が
変化するという問題がある。従って、投影の手法では非
常に限られた条件で撮影された画像でないと、顔領域や
顔部品の抽出ができないということがわかる。即ち、照
明や画像の大きさ、画像中の顔位置や大きさ、顔の向き
などが厳密にコントロールされた環境で撮影された画像
に対してでないと、投影の手法は有効でない。
【0008】次にテンプレートマッチングについて説明
する。テンプレートとは、例えば図49に示す目の画像
のように、抽出すべき領域の画像を予め記憶させたもの
である。テンプレートマッチングは、テンプレートと入
力画像の対応する領域を比べて、最も点数の高い領域を
そのテンプレートにマッチする領域として抽出するとい
うものである。
【0009】テンプレートは、入力画像より小さく適当
な大きさの画像である。図50に示すように、テンプレ
ートの大きさが5×5だとすると、まず、入力画像の左
上の5×5領域と、テンプレートとを比較して評価値を
付ける。比較の方法は、例えば、テンプレートとそれに
対応する入力画像の領域とで、対応するピクセルの明る
さの2乗和の差を点数とする。これは以下のような式と
なる。
【0010】
【数1】 ここで、V(p)はあるピクセルPの明るさ、Tijはテ
ンプレートの座標(i,j)におけるピクセル、Iij
テンプレートに対応する領域の座標(i,j)における
ピクセルである。
【0011】図51に示すように、入力画像左上の5×
5領域について評価値を計算したら、次に1ピクセル水
平方向にずらした5×5領域について同じように評価値
を計算する。同様にして、右下の5×5領域まで、入力
画像のすべての5×5領域とテンプレートとの間で評価
値を計算する。そして、すべての評価値の中で最も点数
の高いものがテンプレートと最も似ている領域として抽
出される。
【0012】しかしながら、この手法は、抽出しようと
している領域がテンプレートとずれる場合、例えばテン
プレートより大きかったり小さかったりした場合、ま
た、雑音や背景などの影響でテンプレートに似た領域な
どができた場合に誤った抽出を起こしやすい。この手法
も投影を用いた手法と同様に、照明や画像の大きさ、画
像中の顔位置や大きさ、向きなどが厳密にコントロール
された画像に対してでないと有効でない。
【0013】上記投影やテンプレートマッチングの欠点
である照明や画像の大きさ、画像中の顔位置や大きさ、
向きなどが厳密にコントロールされた環境で撮像された
画像という前提条件をある程度緩和するものとして、De
formable template と呼ばれる手法を用いた顔部品の抽
出が提案されている。
【0014】これは、図52に示すように、抽出しよう
とする領域の特徴を単純な数学的な図形関数の組み合わ
せで表現したテンプレート(図中の点線)と、そのテン
プレートに対応する画像との間でエネルギーを計算し
て、最もエネルギーが小さくなるようにテンプレートを
変形、移動させることによって領域を抽出しようという
ものである。
【0015】テンプレートは、例えば、次のように設定
されている。図53に示すように、中心xc ・半径rの
円が瞳に相当する。円周は瞳と白目のエッジに引き寄せ
られる一方、円内部は明るさの落ち込んだ領域に引き寄
せられるようにエネルギーの定義を行う。
【0016】目の境界は、焦点をxe に持つ上下に凸の
2つの放物線の一部が合わさって形成される。焦点xe
から目の片端までのまでの幅をb’、即ち目の幅を2
b’、上に凸の放物線の高さをa’、下に凸の放物線の
高さをc’、焦点xe を通る水平線と目の中心線(図
中、焦点xe を通る点線)とのなす角を回転角θとす
る。エネルギーは、目の境界がエッジに引き寄せられる
ように定義する。
【0017】瞳により2分割された白目領域のそれぞれ
の中心は、xe +p1( cosθ, sinθ)、及びxe +p
2( cosθ, sinθ)で表される(p1 ≧0,p2
0)。2つの白目領域の中心が近傍画素の中で最も明る
い領域の中心に引き寄せられるようにエネルギーの定義
を行う。
【0018】目の境界と瞳の間は白目に相当し、明度の
大きい領域に引き寄せられるようにエネルギーの定義を
行う。
【0019】これらの要素には、中心xc と焦点xe
とは互いに引き寄せ合い、一致したときにエネルギーが
最小となる、目の幅2b’はほぼ半径rの4倍とな
る、白目領域の2つの中心点は目の中心線上に乗るよ
うな力が作用する。
【0020】以上のパラメータを少しずつ変化させ、エ
ネルギー関数Ec (xc ,xe ,p1,p2,r,a',b',c',θ)が最
小となるようにテンプレートが変形することにより目に
マッチングする。エネルギー関数Ec は以下の式で表さ
れる。
【0021】
【数2】 ここで、Ev は谷エネルギー、Ee はエッジエネルギ
ー、Ei は画像エネルギー、Ep はピークエネルギー、
int は内部エネルギーであり、次のように定義され
る。
【0022】
【数3】
【0023】
【数4】
【0024】
【数5】
【0025】
【数6】
【0026】
【数7】
【0027】
【数8】 上記の式は、幾何的な構成が最適になったときにそれぞ
れのエネルギーが最小になるように定義されている。こ
の方法は、画像の大きさ、画像面に平行な回転、頭の回
転や照明の影響を受けにくいという特徴がある。
【0028】上記のように顔領域や顔部品を検出する以
外に、頭部方向や視線方向を検出する技術も開示されて
いる。
【0029】頭部方向を検出する方法としては、磁気セ
ンサなどを用いた方法がある。これは、図54に示すよ
うに、利用者が頭部に3つ以上の電磁波を放射する電磁
波放射装置を装着すると共に、電磁波放射装置からの電
磁波を受信する電磁波受信機を床面などに3箇所以上設
置する構成である。これによれば、1つの電磁波放射装
置につき3箇所以上の電磁波受信機が受信する信号の位
相差を利用して、各電磁波放射装置の3次元位置を検出
し、電磁波放射装置が取り付けられている頭部の向きを
検出することができる。
【0030】また、専用ハードウェアを用いずに頭部位
置を検出する方法もある。これは、図55に示すよう
に、利用者が頭部の適当な位置に3箇所以上、目立つ色
のシールなどを貼るか、あるいはシールを貼ったヘッド
ギアなどをかぶると共に、2つ以上の撮像装置を備える
構成である。これによれば、シールを撮影した2つ以上
の画像からシールの3次元位置を測定し、頭部の方向を
検出することができる。
【0031】また、視線を検出するには、普通、装着型
の視線トラッカーを用いる。視線トラッカーには、常に
眼球を捉えて眼球の画像を撮影するために、眼球のすぐ
近くにCCDなどの撮像装置が配置されている。
【0032】
【発明が解決しようとする課題】しかしながら、上記De
formable template の手法は、抽出しようとしている部
品を表すテンプレートの初期位置を別手法を用いて設定
しなければならないという問題がある。これは、初期位
置として抽出したい領域近くにテンプレートを位置させ
ないと誤抽出が多くなると共に、計算量が莫大になるか
らである。別手法としては上述の投影やテンプレートマ
ッチングなどがあげられるが、テンプレートマッチング
のような従来手法の欠点を克服するための手法が、前提
としてそのような従来技術を用いなければならないこと
が大きな矛盾となっている。
【0033】結果として、Deformable template の手法
による顔輪郭・顔部品の抽出も、投影やテンプレートマ
ッチングの手法と同じような問題が発生する。即ち、De
formable template の手法は、その抽出の精度と、照明
条件や画像の大きさ、画像中の顔位置や大きさ、回転、
背景などの変化に対して弱く、厳密にコントロールされ
た環境で撮影された画像に対してでないと有効でない。
つまり、普通の環境で人物を撮影する場合、常に同じ照
明を用い、常に同じ背景・方向・向きに設定されている
ことはあり得ず、従って、通常の状態で撮影された画像
に対してそれらの技術を適用すると、誤った領域の抽出
を起こしかねない。また、エネルギーの定義を部品ごと
に定義しなければならないという問題も有している。
【0034】また、電磁波放射装置を用いて頭部方向を
検出する方法は、電磁波放射装置を頭部に動かないよう
にしっかり固定する必要があり、また、そこに電源を供
給する仕組みも必要となる。さらに、電磁波放射装置か
ら一定距離以上離れた床などに電磁波受信機を固定して
置かなくてはならない。この結果、頭部にハードウェア
を装着しなければならないとうい煩わしさと、コストが
かかるという欠点がある。一方、頭部にシールなどのマ
ーカーを貼る方法は低コストで実現できるが、シールを
貼ったり、あるいはヘッドギア状のものを被ったりとい
う煩わしさを除去することはできないという問題を有し
ている。
【0035】さらに、視線方向を検出する方法は、顔に
固定して動かないような堅固な構造を持つ視線トラッカ
ーを装着するために、装着感が非常に悪く、また、コス
トもかかるという問題を有している。
【0036】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明の請求項1記載の領域抽出装置は、対象物
を撮像してカラーデジタル画像とする撮像手段(例え
ば、撮像装置)と、上記カラーデジタル画像において均
一に同様の色を持つ所望領域を示す確率密度関数を予め
記憶しておく確率密度関数格納手段(例えば、確率密度
関数格納部)と、上記所望領域を構成する各画素(ピク
セル)の色に基づいて上記確率密度関数を計算すること
により、各画素の色の確からしさを算出する領域確率計
算手段(例えば、領域確率計算装置)と、上記カラーデ
ジタル画像上の任意の3つ以上の点(例えば、格子点)
を接続することにより形成され画像全体を覆うように設
けられる仮想的な網の情報を記憶しておく網情報格納手
段(例えば、顔領域抽出用網情報格納部)と、上記点の
位置関係に基づいて定義される網の内部エネルギーと、
点が位置する画素の色の確からしさに基づいて定義され
る網の画像エネルギーとをそれぞれ計算するエネルギー
計算手段(例えば、エネルギー計算装置)とを有し、1
つの点を移動させたときの網の内部エネルギーと画像エ
ネルギーとの合計値を、上記点を移動させる前の合計値
と比較し、合計値が変化するときは網が収縮する方向へ
点の移動を行い、合計値が変化しなくなった時点で点の
移動を停止することを特徴としている。
【0037】上記構成によれば、まず、撮像手段により
対象物が撮影され、対象物のカラーデジタル画像が得ら
れる。そして、領域確率計算手段が確率密度関数格納手
段を参照し、カラーデジタル画像における抽出したい領
域を構成する各画素の色の値を確率密度関数に代入して
計算することにより、各画素の色の確からしさが算出さ
れる。このとき、所望領域は均一に同様の色で形成され
ており、かつ確率密度関数も所望領域であることを表す
関数であるので、所望領域の色の確からしさが大きくな
る。
【0038】次に、入力されたカラーデジタル画像全体
を覆うように設けられた仮想的な網を構成する点を1つ
ずつ移動させ、点を移動する前と後とで網のエネルギー
に変化があるかどうかを調べる。ここで、網のエネルギ
ーとは、エネルギー計算手段により求められた、網の形
状を反映する内部エネルギーと網を構成する点が位置す
る画素の色を反映する画像エネルギーとの合計値であ
る。
【0039】このエネルギーの合計値に変化がある場合
には網が収縮する方向へ点を移動させ、合計値に変化が
なくなると点の移動を停止させる。即ち、初めに画像全
体を覆っていた網は、色の確からしさが大きい所望領域
に向かって収縮変形し、最終的に所定領域を囲んで停止
することになる。従って、所望領域を抽出することがで
きる。
【0040】これにより、本領域抽出装置は照明条件の
変化に強い色の確からしさに基づいて所望領域を抽出す
ることができるので、撮影する場所、時間、補助照明の
有無、方向などに左右されることがなくなる。また、網
はどのような形状にもなり得るので、入力画像の大き
さ、及び画像中の顔位置や大きさなどに制限されること
がなくなる。これらの結果、撮影の自由度を増大させる
ことができる。
【0041】請求項2記載の領域抽出装置は、請求項1
記載の構成に加えて、上記対象物は人物であり、上記所
望領域は人物の顔の領域であることを特徴としている。
【0042】上記構成によれば、まず、撮像手段により
人物を撮影することにより人物画像が得られる。この画
像に対して仮想的な網を用いると、顔領域に網が収縮し
て顔領域を抽出することができる。
【0043】これにより、さまざまな家電製品などの機
器に利用することができる。即ち、機器に備えられた領
域抽出装置が顔領域を抽出することにより、機器と利用
者とがどのような位置関係にあるのかを判断することが
できる。そして、機器の前に利用者が存在するか否か、
また存在するのならばどの辺りにいるのかの情報を得る
ことができる。これらの情報を利用して、利用者の位置
による機器の制御を行うことが可能となる。
【0044】請求項3記載の領域抽出装置は、請求項1
または2記載の構成に加えて、確率密度関数格納手段に
は上記所望領域と異なる色を持つ部分領域を示す確率密
度関数が予め記憶されると共に、網情報格納手段には上
記所望領域を囲んで停止した網の情報が部分領域を抽出
するための部分領域抽出用網の初期値として記憶され、
上記所望領域内に部分領域が1つある場合に、領域確率
計算手段が上記部分領域を構成する各画素の色に基づい
て上記確率密度関数を計算することにより各画素の色の
確からしさを算出して、エネルギー計算手段が部分領域
抽出用網の内部エネルギー及び画像エネルギーと、部分
領域に収束されるように定義された移動エネルギーとを
それぞれ計算することにより、部分領域を抽出すること
を特徴としている。
【0045】上記構成によれば、請求項1または2にお
いて所定領域(顔領域)を囲んで停止した網の情報が部
分領域を抽出する部分領域抽出用網の初期値として網情
報格納手段に記憶される。また、確率密度関数格納手段
には上記所望領域と異なる色を持つ部分領域を示す確率
密度関数が予め記憶されている。そして、所望領域内に
部分領域が1つある場合に、部分領域の各画素の色の確
からしさを求めた後、部分領域に収束されるように定義
された移動エネルギーを持つ網を動かすことで部分領域
を抽出する。即ち、初めに所定領域を覆っていた網は、
色の確からしさが大きい部分領域に向かって収縮変形・
移動し、最終的に部分領域を囲んで停止することにな
る。
【0046】これにより、最初の抽出領域に用いた網
を、さらに領域内の別の領域の抽出に用いることができ
るので、領域毎に網の設定を変える必要がない。また、
請求項2においては、顔領域が抽出されると、顔領域と
色の異なる口唇領域や目領域が抽出できる。
【0047】請求項4記載の領域抽出装置は、請求項3
記載の構成に加えて、部分領域抽出用網の外周を形成す
る点からフレーム重心を求めると共に、画像の明るさを
重みとした部分領域抽出用網が囲む領域の重心を求める
重心計算手段(例えば、重心計算装置)を有し、上記移
動エネルギーを、上記フレーム重心が領域の重心の方向
に引き寄せられるように定義することを特徴としてい
る。
【0048】上記構成によれば、部分領域抽出用が囲む
領域の重心が画像の明るさを重みとしているので、領域
重心の位置はフレーム重心の位置に比べて抽出したい領
域近くに位置することになる。このとき、フレーム重心
が領域重心の方向に引き寄せられるように移動エネルギ
ーが設定されているので、網は部分領域に向かって移動
する。これにより、所定領域内に部分領域に似た色を持
つ領域があったとしても、その領域に引き寄せられるこ
となく、部分領域を抽出することができる。この結果、
処理速度が速く、高精度の部分領域の抽出が可能とな
る。
【0049】請求項5記載の領域抽出装置は、請求項2
記載の構成に加えて、網の外周を形成する点からフレー
ム重心を求めると共に、画像の明るさを重みとして網が
囲む領域の重心を求める重心計算手段を有し、確率密度
関数格納手段には口唇領域を示す確率密度関数が予め記
憶されると共に、網情報格納手段には上記顔領域を囲ん
で停止した網の情報が口唇領域及び左右の目領域を抽出
するための網の初期値として記憶され、領域確率計算手
段が、上記口唇領域を構成する各画素の色に基づいて上
記確率密度関数を計算することにより各画素の色の確か
らしさを算出すると共に、上記左右の目領域を構成する
各画素の色に基づいて顔領域あるいは口唇領域の確率密
度関数を計算することにより各画素の色の確からしさを
算出して、エネルギー計算手段が、各領域の内部エネル
ギー及び画像エネルギーと、各々のフレーム重心が各々
の領域重心の方向へ引き寄せられ、かつ、3つの領域の
重心の位置関係が予め測定され記憶された口唇及び左右
の目の位置関係と等しくなるように定義されたバランス
エネルギーとを計算することにより、口唇及び左右の目
領域を抽出することを特徴としている。
【0050】上記構成によれば、請求項2において顔領
域を囲んで停止した網の情報が口唇領域及び左右の目領
域を抽出するための網の初期値として網情報格納手段に
記憶される。また、確率密度関数格納手段には口唇領域
の確からしさを示す確率密度関数が予め記憶されてい
る。そして、口唇領域の各画素の色の確からしさと、左
右の目領域の各画素の色の確からしさとを求めた後、内
部エネルギー、画像エネルギー、及びバランスエネルギ
ーを持つ3つの網を動かすことで口唇及び左右の目領域
を抽出する。即ち、初めに顔領域を覆っていた網は、色
の確からしさが大きい3つの領域に向かってそれぞれ収
縮変形・移動し、最終的に各領域を囲んで停止すること
になる。
【0051】これにより、顔領域抽出用網を、口唇領域
抽出用網及び左右の目領域抽出用網とすることができる
ので、領域毎に網の設定を変える必要がない。
【0052】また、顔領域に対する顔部品の位置がわか
るので、顔の回転角(顔の傾き)を認識することができ
る。顔の回転角がわかると、例えば、人物データベース
を作る際に、写真をスキャナなどで読み込む場合に、写
真の方向などを気にせずに入力することができ、手間が
大いに軽減する。この結果、撮影時、及び処理時の自由
度が増大する。
【0053】さらに、顔領域と口唇領域とのバランスに
より、顔のおおよその方向を推定することができる。即
ち、口唇領域の中心が顔領域の主軸に近い位置にあるな
らば、利用者は撮像手段の方向を向いており、左右のど
ちらかにずれていればそれぞれの方向に向いていること
になる。
【0054】請求項6記載の方向検出装置は、請求項5
記載の領域抽出装置を用いて、上記撮像手段が複数個設
けられ、複数の撮像手段から同時に得られる複数の画像
から口唇領域及び左右の目領域をそれぞれ抽出し、互い
に比較することにより口唇及び目の3次元位置情報を導
出することを特徴としている。
【0055】上記構成によれば、複数の撮像手段により
同時に同じ人物を撮影すると、画面上で人物の位置が異
なる複数の画像が得られる。そして、請求項5記載の構
成の領域抽出装置により複数の画像における口唇領域及
び目領域がそれぞれ抽出される。それらの複数の画像に
おいて、対応する顔部品どうしを互いに比較すると、画
像どうしのずれにより口唇、左目、及び右目それぞれの
3次元空間上の3点が決まる。これにより、頭部がどの
方向に向いているかを検出することが可能となる。
【0056】このようにして、従来のような専用のハー
ドウェアを用いなくとも、容易に頭部方向を検出するこ
とができる。この結果、ハードウェアなどを装着する煩
わしさを除去することができると共に、装置の低コスト
化が可能となる。
【0057】請求項7記載の方向検出装置は、請求項6
記載の構成に加えて、抽出された目の画像と、予め測定
して視線方向の情報が付加されて記憶された目の画像と
を比較することにより推定視線方向を算出し、さらに推
定視線方向と検出された頭部の向きとを比較することに
より真の視線方向を検出することを特徴としている。
【0058】上記構成によれば、予めの測定により黒目
の位置と視線方向との関係がある程度わかっているの
で、請求項6記載の構成にて抽出された目の画像を用い
て、推定視線方向を算出することができる。推定視線方
向が得られると、それをさらに頭部の向きと比較して補
正を行い、真の視線方向を検出することができる。
【0059】これにより、従来のような専用のハードウ
ェアを用いなくとも、容易に視線方向を検出することが
できる。この結果、ハードウェアなどを装着する煩わし
さを除去することができると共に、装置の低コスト化が
可能となる。
【0060】
【発明の実施の形態】
〔実施の形態1〕本発明の実施の一形態について図1な
いし図9、図11ないし図19に基づいて説明すれば、
以下の通りである。
【0061】本実施の形態にかかる領域抽出装置は、カ
ラーデジタル画像上の任意の点(ピクセル)を結ぶこと
によって形成される仮想的な網のモデルを用いることに
より、顔領域を抽出する装置である。
【0062】上記領域抽出装置は、図1に示すように、
人物などの対象物を撮像してカラーデジタル画像とする
CCDなどの撮像装置(撮像手段)である入力装置1、
各種計算処理を行う演算装置2、データを予め記憶した
り、一時的にデータを記憶する記憶装置3、及び網が目
的の領域に収束した時点の結果を出力する出力装置4に
より構成される。
【0063】上記演算装置2は、領域確率計算装置(領
域確率計算手段)5及びエネルギー計算装置(エネルギ
ー計算手段)6を有する。領域確率計算装置5は、入力
された画像において目的の領域を抽出する前段階とし
て、後述の確率密度関数格納部7を参照することによ
り、色情報としての領域の確率密度関数を導出し後述の
領域確率画像を生成する装置である。エネルギー計算装
置6は、後述の顔領域抽出用網情報格納部9を参照する
ことにより網の内部エネルギー(Eint )を計算すると
共に、顔領域抽出用網情報格納部9及び領域確率画像格
納部8を参照することにより画像エネルギー
(Eimage )を計算する。
【0064】記憶装置3は、確率密度関数格納部(確率
密度関数格納手段)7、領域確率画像格納部8、及び顔
領域抽出用網情報格納部(網情報格納手段)9を有す
る。
【0065】確率密度関数格納部7には予めサンプリン
グすることにより求められた顔領域の肌の色の確率密度
関数が格納されている。領域確率画像格納部8には上記
領域確率計算装置5で生成された領域確率画像が格納さ
れる。
【0066】顔領域抽出用網情報格納部9には、入力画
像上の複数の点を接続することにより形成され画像全体
を覆うように設けられる仮想的な網の情報が記憶されて
いる。即ち、仮想的な網を構成する格子点の初期座標が
予め格納されている。この初期座標は、入力された画像
に対して均等に位置するように自動的に計算されて設定
される。また、理論的には格子点が3点あれば領域を形
成することができるが、抽出する精度や抽出しようとす
る形、画像の大きさに合わせて格子点の数は設定され
る。また、顔領域抽出用網情報格納部9には網が移動す
ることにより変化した後の格子点の座標も記憶される。
さらに、顔領域抽出用網情報格納部9にはエネルギー計
算装置6により計算され求められた内部エネルギー(E
int )及び画像エネルギー(Eimage )が格納される。
【0067】以下に、上記構成による領域抽出装置の動
作、及び網の定義の仕方などを具体的に説明する。
【0068】まず、顔領域を表す確率密度関数を算出す
るために、人間の顔の皮膚の色分布を調べる。この作業
の工程を図2のフローチャートに基づいて説明する。統
計をとるためにより多くの人物顔の画像を撮影し、手作
業で顔の皮膚だけの画像を作成する(S1)。例えば、
図3(a)に示す入力人物画像に対して、図3(b)の
Aに示すように、顔の肌色部分のみを取り出す。顔領域
だけを切り出したデジタル画像から適当な数のピクセル
(画素)をランダムに選ぶ。そのピクセルの色をHSV
表色系で表した場合のH(色相)及びS(彩度)の出現
回数をカウントし、それらの度数分布を得る(S2)。
【0069】色相は、赤・青・黄といった色の違いを区
別する属性で、照明などによる反射や陰影の影響を受け
にくいという特徴がある。また、彩度は色の鮮やかな程
度を表す指標である。人間の顔は比較的彩度が高く、一
方、室内などは比較的彩度が低いもので構成されている
ことが多い。
【0070】図4は、24人の人物画像データにより、
1画像につき1000ピクセルの点をサンプリングした
ときの顔領域の色相の色度数分布を示す。図の縦軸は顔
領域である確からしさを示す確率密度(0〜1の範囲で
示される)である。また、横軸は色相であり、赤を0°
とし、黄・緑の方向を正として+180°まで、マゼン
ダ・青の方向を負として−180°までとっている。図
5は、同様にサンプリングしたときの顔領域の彩度の色
度数分布を示す。図の縦軸は顔領域である確からしさを
示す確率密度(0〜1の範囲で示される)であり、横軸
は無彩色を0とし、単色を100としたときの彩度であ
る。
【0071】顔領域における色相及び彩度の色度数分布
を得ると、色相と彩度とのバラツキが正規分布に従って
いると仮定して、顔領域を表す2次元の正規確率密度関
数を導出する(S3)。即ち、μ1 を色相の平均値、μ
2 を彩度の平均値とし、σijを色相と彩度の分布の分散
共分散行列とすると、まず、手作業で切り出してカウン
トした色の分布からこれらの値を計算する。
【0072】2次元の正規確率密度関数は、
【0073】
【数9】 で表されるので、求められたμ1 ,μ2 ,σijを(1)
式に代入することにより顔領域を表す確率密度関数を導
出することができる。この確率密度関数を予め前記確率
密度関数格納部7に記憶させておく。図4及び図5の色
度数分布に基づいて求められた確率密度関数をプロット
したものを図6に示す。図の高さ軸は確率密度、左側軸
は色相、右側軸は彩度を表している。
【0074】領域確率計算装置5が、求められた確率密
度関数の、x1 に色相値、x2 に彩度を代入して計算す
ることにより、入力デジタル画像のすべてのピクセルに
ついて、顔の色の確からしさが0〜1の範囲で求められ
る。そして、そのピクセルの色相と彩度とにより求めた
確からしさの値(0〜1)をピクセルの新しい値とする
ような画像を生成する。このようにして求められた画像
を領域確率画像と称することにする。
【0075】領域確率画像の生成の過程を図7のフロー
チャートに基づいて説明する。画像が入力されると(S
11)、入力画像の左上から順に1つずつピクセルを取
り出す(S12)。取り出したピクセルの色相と彩度と
を求め(S13)、先に求めた確率密度関数の引数とし
てその色相と彩度を用いて、領域の確からしさを計算す
る。その確からしさの値をピクセルの新しい値とする
(S14)。そして、すべてのピクセルの新しい値が得
られたかどうかを判断し(S15)、すべてのピクセル
についてまだ計算されていない場合には上記S12〜S
14の工程を繰り返し、すべてのピクセルに対して計算
が行われたら処理を終了する。これにより、領域確率画
像が生成される。図9は、図8に示される入力画像から
生成された顔領域確率画像を示す。これは、明るいピク
セルほど顔領域である可能性が高いことを表している。
【0076】次に網のモデルについて説明する。網は、
図11に示すように、デジタル画像上のピクセルに相当
する黒点を結ぶことにより形成される。この網を形作る
黒点を格子点と呼ぶ。この格子点の位置関係によって網
のエネルギーが定義される。網のエネルギーは、網自身
の形状から生じる内部エネルギーと、網とそれが覆う画
像とで決まる画像エネルギーとの2つのエネルギーを持
っている。この2つのエネルギーの合計値が小さくなる
ように格子点を移動させて網を変形させることにより目
的の領域を抽出する。
【0077】ある格子点は隣り合う別の格子点と接続関
係を持っており、この点どうしの位置関係によって網の
内部エネルギーが定義される。網の内部エネルギーは、
格子点の距離が小さければ小さいほどエネルギーも小さ
く、また、格子点どうしを結ぶ網を構成するラインが滑
らかであればあるほどエネルギーが小さくなるように、
格子点どうしを結んで構成される格子の向かい合う辺が
平行になるように定義する。また、格子点でのピクセル
の明るさにより画像エネルギーを定義する。つまり、格
子点上にあるピクセルの状態をエネルギーに反映するこ
とにより領域の抽出を行うのである。
【0078】領域の抽出は、上記のような網のモデルを
前記領域確率計算装置5によって生成された領域確率画
像に対して適用することにより行われる。図12(a)
〜(d)は、網のモデルを用いてある領域を抽出するよ
うすを示している。図12(a)に示す入力画像から領
域確率画像を算出し、同図(b)に示すように、画像全
体を覆うような網をかぶせる。すると、網は目的の領域
に向かって収縮し(同図(c)参照)、最終的にその領
域を囲んで停止する(同図(d)参照)。顔領域を抽出
する場合には、図13(a)〜(d)に示すようにな
る。即ち、顔領域確率画像に対して、画像全体を覆うよ
うな網をまずかぶせる。そして、この網のエネルギーが
小さくなるように格子点を移動させていき、エネルギー
の変化がなくなったところで、格子点の移動を停止させ
る。すると、網は顔領域を囲むような形に変形してい
る。
【0079】(1)網の形状 上記網の形状は図14に示すように定義される。ある点
を中心に半径を次第に大きくしていき複数の同心円を作
る。そして、その中心点から放射状に線分を伸ばし、最
も外側の同心円まで伸ばす。同心円の円周と、その放射
状に伸びた線分との交点を格子点とする。従って、格子
点の数は、同心円の数をT、放射状線分の数をSとする
と、T×S+1個になる。ここで、同心円をレイヤー、
放射状線分をスポークと呼ぶことにする。また、一番外
側のレイヤーをレイヤー0とし、内側に向かってレイヤ
ー1、レイヤー2、…とする。一番外側のレイヤー0と
各スポークとの交点を最外郭格子点と呼び、それ以外の
格子点を内部格子点と呼ぶ。なお、網の形状は円形とし
ているが、図15に示すように、長方形に変形しても格
子点どうしの接続関係は変わらず、同じように扱うこと
ができる。
【0080】(2)網の内部エネルギー あるレイヤーtとスポークsとにより形成される格子点
をp(t,s) と表すことにする。あるレイヤーtより1つ
内側のレイヤーをレイヤー(t+1)、1つ外側のレイ
ヤーをレイヤー(t−1)とする。もちろん、最外郭格
子点においては、レイヤー(t−1)は存在しない。同
様に、あるスポークsより時計回り方向の次のスポーク
をスポーク(s+1)、反時計回り方向の次のスポーク
をスポーク(s−1)とする。
【0081】格子点p(t,s) の内部エネルギーE
int (t,s) は、次のように表される。なお、本文中及び
図16のpはベクトルを表す。
【0082】
【数10】
【0083】
【数11】
【0084】
【数12】
【0085】
【数13】
【0086】
【数14】
【0087】
【数15】 上記Et は、図16(a)に示すように、同一スポーク
s上にある隣り合う格子点p(t,s) とp(t+1,s)との距
離を表す。距離が小さいほどEt は小さくなり、p(t,
s) とp(t+1,s)とが一致するとEt =0となる。
【0088】Es は、同一レイヤーt上にある隣り合う
格子点p(t,s) とp(t,s+1)との距離を表す。距離が小
さいほどEs は小さくなり、p(t,s) とp(t,s+1)とが
一致するとEs =0となる。
【0089】Ettは、図16(b)に示すように、p
(t,s) と、同一スポークs上でp(t,s) の前後の格子点
p(t−1,s)及びp(t+1,s)とが滑らかに接続されている
かどうかを表す。3つの格子点が直線となる場合、Ett
=0となる。
【0090】Essは、p(t,s) と、同一レイヤーt上で
p(t,s) の左右の格子点p(t,s−1)及びp(t,s+1)とが
滑らかに接続されているかどうかを表す。3つの格子点
が直線となる場合、Ess=0となる。
【0091】Etsは、p(t,s−1)−p(t,s) と、p(t−
1, s−1)−p(t−1,s)とが同じベクトルである、即ち互
いに平行で大きさが同じであるときにEts=0となる。
【0092】ある格子点p(t,s) に注目し、その周囲の
格子点の位置から、上で求められるEint (t,s) を計算
する。これがその格子点の持つ内部エネルギーである。
これをすべての格子点について計算しその和を求める
と、網の内部エネルギーEintが算出される。なお、
(2)式におけるEint (t,s) を構成する各項につい
て、画像の大きさと格子点の数との比や色の確からしさ
の範囲によっては、適当に重みを決めてやってもよい。
【0093】(3)網の画像エネルギー ある格子点p(t,s) の画像エネルギーEimage (t,s)
は、その格子点上のピクセルの状態として、以下のよう
に定義される。
【0094】
【数16】 ここで、FRPI(t,s) は、領域確率画像における格子点p
(t,s) 上のピクセルの明るさ(領域の確からしさ)を示
している。即ち、内部格子点(t>1)においては領域
確率画像における格子点p(t,s) 上のピクセルの明るさ
にマイナス符号を付け、最外郭格子点 (t=0)におい
ては符号を付けずにそのまま格子点p(t,s) の画像エネ
ルギーとする。
【0095】ある格子点p(t,s) に注目し、上で求めら
れるEimage (t,s) を計算する。これがその格子点の持
つ画像エネルギーである。これをすべての格子点につい
て計算しその和を求めると、網の画像エネルギーE
image が算出される。なお、(3)式におけるEimage
(t,s) を構成する各項については、(2)式の場合と同
様に、適当に重みを決めてやってもよい。
【0096】任意の格子点p(t,s) のエネルギーEnet
(t,s) は、格子点の持つ内部エネルギーEint (t,s) と
画像エネルギーEimage (t,s) との和で表される。
【0097】
【数17】 網全体のエネルギーEnet は、(4)式をすべての格子
点について計算し、合計したものであり、次のように表
される。
【0098】
【数18】 このようにして、定義した網全体のエネルギーEnet
計算し、このエネルギーの大きさが小さくなるように格
子点を移動させる。エネルギーの変化がなくなった時点
で格子点の動きを止めると、網は顔領域を囲んで収束し
ている(図13参照)。
【0099】(4)格子点の移動 次に、格子点をどのように移動させていくかを図17の
フローチャートに基づいて説明する。
【0100】まず、上述のように、領域確率計算装置5
により顔領域確率画像を生成する(S21)。次に、初
期状態の網を設定する。この設定は、図13に示すよう
に、入力画像全体を覆うように設定する(S22)。最
初に最外郭格子点の中から1つの格子点を選び、その格
子点のエネルギーEnet (t,s) を計算する(S23)。
そして、図18に示すように、この格子点が位置するピ
クセルの周りに配置されている8つのピクセル(以下、
8近傍と称する)のいずれかに格子点を移動させる。こ
のとき、格子点を8近傍のそれぞれに移動したときのエ
ネルギーを計算し(S24)、その中で最もエネルギー
が小さくなるピクセルに格子点を移動させる(S2
5)。最初の格子点の位置でのエネルギーが最も小さい
場合は、格子点を移動させる必要はない。
【0101】最外郭格子点から内部格子点に順に格子点
を1つずつ、すべての格子点について8近傍のどこに移
動させればエネルギーが最も小さくなるかを調べて、そ
こに格子点を移動させる。すべての格子点についてピク
セル1つ分移動させる移動処理(以下、1単位変形と称
する)が終了したかどうかを調べ(S26)、処理が終
了していない場合にはS23の工程に戻り、終了した場
合にはS27の工程へ進む。
【0102】S27では、各格子点でのエネルギーを合
計した網全体のエネルギーEnet が、格子点を移動する
前のエネルギーEnet と比較してその大きさに変化が生
じているかどうかを調べる。S27で網全体のエネルギ
ーEnet に変化がある場合にはS23の工程に戻って再
び上S23〜S26の処理を行い、S27で網全体のエ
ネルギーEnet に変化がない場合には格子点の移動を終
了する。格子点の移動が終了したときには、網は顔領域
全体を囲んでいる(図13参照)。
【0103】以上により、本実施の形態における領域抽
出装置は、格子点の位置関係に基づく網の内部エネルギ
ーと、格子点が位置するピクセルの色の確からしさに基
づく画像エネルギーとの合計値が変化しなくなるまで網
を収縮変形させ、合計値が変化しなくなった時点で格子
点の移動を停止する構成である。
【0104】従って、入力画像全体を覆っていた網は、
色の確からしさが大きい顔領域に向かって収縮し、最終
的に顔領域を囲んで停止する。この結果、顔領域を抽出
することができる。
【0105】このとき、顔領域の色の確からしさは照明
条件に左右されない色相に基づいて求められるので、本
領域抽出装置では常に同じ照明条件で撮影する必要がな
い。即ち、本領域抽出装置は照明条件の変化に強いの
で、撮影する場所、時間、補助照明の有無、方向などを
気にしなくてもよい。なお、従来では採光窓のない室内
の同じ位置で、同じ照明器具を用い、同じ方向から人物
を撮影することによって常に同じ照明条件を設定しなけ
ればならなかった。
【0106】また、本領域抽出装置は、網はどのような
形状にもなり得るので、入力画像の大きさがどんなもの
でも対応することができる。一般に領域抽出の処理を行
うためには、画像をデジタルで扱う必要がある。1次的
に入力される画像は、デジタルイメージであっても通常
のフィルム写真であってもどのような形態でもかまわな
いのだが、抽出処理を行う段階ではデジタルイメージで
ある必要がある。従って、入力された画像の形態がいか
なるものであれ、領域抽出処理をする前段階として、デ
ジタルイメージへの変換が必要である。
【0107】このとき、画像の大きさによらないという
ことは、例えば1枚のデジタル画像が100×100ド
ットでも512×512ドットでも全く関係ないという
ことである。従来のテンプレートマッチングのような手
法を用いると、抽出しようとしている部品の大きさに合
わせてテンプレートを設定しなければならないので、画
像の大きさにおのずと制限がついてしまう。また、Defo
rmable template による手法でも設定されたテンプレー
トに対応する部品のみしか抽出できない。
【0108】一方、本領域抽出装置は画像の大きさによ
らないので、どのような大きさの画像に対してでも対応
することができる。従って、どのような解像度の撮像装
置を用いてもよく、また、アナログ画像をサンプリング
するときにどのようなレートでもよいので、撮影の自由
度が増える。
【0109】同様に、本領域抽出装置は画像中の顔位置
や大きさによらないので、顔が映っていれば、人物が画
面いっぱいに映っていたとしても、あるいは、画面の隅
に小さく映っていても顔を抽出することができる。この
結果、人物を好きな位置から好きな構図で撮影すること
ができるので、撮影の自由度が向上する。なお、従来の
テンプレートマッチングの手法では、前述したように、
抽出しようとしている領域に合わせてテンプレートを設
定するため、入力画像の大きさだけでなく、画像中の顔
の大きさにも制限がついてしまう。また、投影を用いる
方法においても、画像中の顔の大きさがある程度わかっ
ていないと、部品の抽出の精度は極端に落ちてしまう。
【0110】また、顔領域が抽出されることにより、こ
れを情報圧縮に利用することが可能となる。例えば、顔
領域以外の領域の解像度を下げたり、また、色数を落と
すなどして情報を圧縮し、少ない記憶容量で多くの人物
画像を保存することができる。これは、人物データベー
スなどを作成する際に大きなメリットとなる。また、単
位時間当たりの電送容量が少ない回線で人物中心の画像
を転送する際、人物以外の情報を荒くすることによって
情報量を減らし、狭い回線でもコマ数の多い滑らかな画
像を送ったり、その他の多くの情報を送ることが可能と
なる。これは、テレビ会議、テレビ電話、電子秘書、及
びナビゲーションシステムなどで人物による説明などが
入るようなアプリケーションに適用可能である。
【0111】また、本領域抽出装置は、家電製品などの
さまざまな機器の制御などに利用することができる。図
19は、本領域抽出装置11を機器13の制御に適用し
た場合の基本的なブロック図である。機器13に取り付
けられた撮像装置12が利用者の姿を捉え、そのデジタ
ル画像を領域抽出装置11に送る。領域抽出装置11
は、画像から利用者の顔領域を抽出し、その情報を制御
装置14に送る。制御装置14は機器13に接続されて
おり、領域抽出装置11から送られてきた情報をもとに
機器13を制御する。この一連の作業を短時間で繰り返
すことにより、実時間で機器13の制御を行うことので
きるシステムを構築することができる。
【0112】このようにして、機器13に備えられた領
域抽出装置11が顔領域を抽出することにより、機器1
3と利用者とがどのような位置関係にあるのかを判断す
ることができる。そして、機器13の前に利用者が存在
するか否か、また存在するのならばどの辺りにいるのか
の情報を得ることができる。
【0113】これにより、家電製品などを人物の向いて
いる方向に向かって制御することが可能となる。例え
ば、エアコンに領域抽出装置を取り付けることにより、
部屋のどの位置に人間がいて、どの位置にいないかを検
出することができるため、人間に向かって風を送った
り、逆に人間を避けて風を送ったりといった制御が可能
となる。また、人間がいないことを検知して、送風をス
トップさせることも可能である。
【0114】さらに、テレビやオーディオ製品などに適
用した場合、画面の方向や音の方向を利用者の方向に向
けて制御したり、音量やステレオの場合の左右の音量の
バランスを調整したり、人がいないときにスイッチを切
ると共に人が現れたらスイッチを入れたりするというこ
とも可能となる。
【0115】このように、利用者が機器の近くに来るこ
とによって機器のスイッチをON/OFFしたり、利用
者の位置によって機器を制御することは、ほとんどの電
気製品に適用することが可能である。これにより、スイ
ッチの入切の手間や、スイッチの切り忘れ、機器の調整
の手間を低減することができる。
【0116】なお、電気製品などの人のいる/いないに
あわせて制御するようなアプリケーションにおいては、
従来では人間がスイッチをいちいちオン/オフしたり、
赤外線画像を用いて人のいる/いないを判断したりして
いたが、前者の場合は操作の煩わしさがあり、後者の場
合は認識の精度をあげようとすると、高価な赤外線撮像
装置などを用いなければならず高コストになってしまう
問題があった。本領域抽出装置を用いれば、低コストで
人のいる/いないに関する電気製品の制御が可能とな
る。
【0117】〔実施の形態2〕本発明の他の実施の形態
について図3、図8ないし図10、図20ないし図31
に基づいて説明すれば、以下の通りである。なお説明の
便宜上、前記の実施の形態の図面に示した部材と同一の
部材には同一の符号を付記し、その説明を省略する。
【0118】本実施の形態にかかる領域抽出装置は、入
力された人物画像により顔領域、及び口唇領域を抽出す
るものである。ここでは、顔領域を抽出した後、その抽
出された顔領域を初期状態とした口唇領域抽出用網を設
定し、それを移動させて口唇領域を抽出する。
【0119】上記領域抽出装置は、図20に示すよう
に、実施の形態1の構成に加えて、演算装置2に重心計
算装置(重心計算手段)21を、記憶装置3に口唇領域
抽出用網情報格納部(網情報格納手段)22を有してい
る。
【0120】重心計算装置21は、最外郭格子点の座標
を平均することにより求められる最外郭フレームの重心
(g)と、網内部のピクセルの座標を口唇領域の画像の
明るさを重みとして平均することにより求められる網が
囲む領域の重心(G)とを算出する装置である。
【0121】顔領域抽出用網情報格納部9には重心計算
装置21により求められた顔領域抽出用網の2つの重心
と、実施の形態1と同様に顔領域抽出用網の内部エネル
ギー(Eint )及び画像エネルギー(Eimage )とが格
納される。また、口唇領域抽出用網情報格納部22に
は、初期状態として顔領域に収縮した網の座標が格納さ
れる。さらに、口唇領域抽出用網の2つの重心と、口唇
領域抽出用網の内部エネルギー(Eint )及び画像エネ
ルギー(Eimage )と、後述の形状エネルギー
(Eform)と、上記2つの重心から求められる移動エネ
ルギー(Emove)とが格納される。また、確率密度関数
格納部7には、顔領域を表す確率密度関数に加えて、口
唇領域を表す確率密度関数が予め格納されている。
【0122】上記構成によれば、領域確率計算装置5が
領域確率画像格納部8を参照して、顔領域及び口唇領域
を構成する各ピクセルの色に基づいて確率密度関数を計
算することにより各ピクセルの色の確からしさを算出
し、顔領域確率画像及び口唇領域確率画像を生成する。
次に、実施の形態1と同様に、エネルギー計算装置6が
顔領域抽出用網の内部エネルギー(Eint )と画像エネ
ルギー(Eimage )を計算し、それを顔領域抽出用網情
報格納部9に格納する。これらのエネルギーの合計が小
さくなるように網を収縮変形・移動させ、まず顔領域を
抽出する。この結果が出力装置4に出力される。
【0123】重心計算装置21が、顔領域抽出用網情報
格納部9に格納されている網の座標を参照して最外郭フ
レームの重心(g)を、上記網の座標と領域確率画像格
納部8に格納された顔領域確率画像とを参照して顔領域
抽出用網の囲む領域の重心(G)を計算し、それぞれ顔
領域抽出用網情報格納部9に格納する。同様にして、重
心計算装置21が、口唇領域抽出用網情報格納部22に
格納されている口唇領域抽出用網の座標を参照して最外
郭フレームの重心(g)を、上記網の座標と領域確率画
像格納部8に格納された口唇領域確率画像とを参照して
口唇領域抽出用網の囲む領域の重心(G)を計算し、そ
れぞれ口唇領域抽出用網情報格納部22に格納する。
【0124】また、エネルギー計算装置6が口唇領域抽
出用網の内部エネルギー(Eint )、画像エネルギー
(Eimage )、形状エネルギー(Eform)、及び移動エ
ネルギー(Emove)を計算し、それらを口唇領域抽出用
網情報格納部22に格納する。これらの口唇領域抽出用
網のエネルギーの合計値が小さくなるように口唇領域抽
出用網を変形収縮・移動し、口唇領域を抽出する。その
結果が出力装置4に出力される。
【0125】以下に、上記構成による領域抽出装置の動
作、及び網の定義の仕方などを具体的に説明する。
【0126】まず、口唇領域を表す確率密度関数の算出
するために、実施の形態1と同様にして、例えば、図3
(a)に示す入力人物画像に対して図3(b)のBに示
すように口唇のみを取り出して、口唇の色分布を調べ
る。図21は、24人の人物画像データにより、1画像
につき100ピクセルの点をサンプリングしたときの口
唇領域の色相の色度数分布を示す。図22は、同様にサ
ンプリングしたときの口唇領域の彩度の色度数分布を示
す。なお、各図の縦軸及び横軸は、実施の形態1の図4
及び図5と同じである。
【0127】そして、実施の形態1と同様にして求めた
口唇領域を表す2次元の正規確率密度関数をプロットし
たものを図23に示す。図の高さ軸は確率密度、左側軸
は色相、右側軸は彩度を表している。
【0128】前記領域確率計算装置5が、求められた確
率密度関数に色相値及び彩度を代入して計算することに
より、入力デジタル画像のすべてのピクセルについて、
口唇の色の確からしさが0〜1の範囲で求められる。そ
して、そのピクセルの色相と彩度とにより求めた確から
しさの値(0〜1)をピクセルの新しい値とする口唇領
域確率画像を生成する。図10は、図8に示される入力
画像から生成された口唇領域確率画像であり、明るいピ
クセルほど口唇領域である可能性が高いことを示してい
る。
【0129】次に、(1)最外郭フレーム、(2)最外
郭フレームの重心、及び(3)網が囲む領域の重心を定
義する。
【0130】最外郭フレームとは、図24に示すよう
に、最外郭格子点を順に結んでできる輪郭のことであ
り、レイヤー0のことである。即ち、網の外形を表して
いる。
【0131】最外郭フレームの重心とは、最外郭格子点
の座標を平均したものである。即ち、最外郭格子点の数
をn、i番目の最外郭格子点を表すベクトルをpiとす
ると、重心を表すベクトルgは、次のように表される。
【0132】
【数19】 網が囲む領域の重心とは、図25に示すように、網内部
のピクセルの座標をその明るさの重みとして平均したも
のである。即ち、網内部にあるピクセルの数をN、網内
部のピクセルjを表すベクトルをpj、ピクセルjにお
ける明るさをI(pj)とすると、網が囲む領域の重心G
は、次のように定義される。なお、Σは網内部のすべて
のピクセルについて合計している。
【0133】
【数20】 (1)網の内部エネルギー 口唇領域を抽出するための網の内部エネルギーの定義は
以下の通りである。本実施の形態の内部エネルギーは、
実施の形態1の内部エネルギーに、顔幅から推定される
口唇の平均的な形状と大きさとに網が収縮するようなエ
ネルギーを加える。このエネルギーを形状エネルギーE
form(t,s) と呼ぶことにする。
【0134】具体的には、まず、図26に示すように、
顔領域抽出用網の最外郭フレームFf の重心gf と、口
唇領域抽出用網が囲む領域Am の重心Gm を結ぶ線に直
角で、重心gf を通る直線を引く。これを顔幅直線と呼
ぶ。顔幅直線と最外郭フレームFf との2つの交点Fa
・Fb を結ぶ線分の長さを顔幅の推定値Fabとする。顔
幅の推定値Fabに一定の比率を掛けることによって、顔
幅に対する口唇の平均的な大きさ、即ち口唇の幅及び高
さを推定する。
【0135】そして、図27に示すように、口唇の形状
を楕円に近いものとして、重心Gmを中心とし、推定し
た口唇の幅を長径、推定した口唇の高さを短径とし、長
径が顔幅直線と同じ傾きをもつ楕円em を考える。
【0136】最外郭格子点の形状エネルギーEform(t,
s) は、この楕円em の中心(重心Gm )から口唇領域
抽出用網の最外郭格子点m1 の一つに向かって直線を引
いたとき、その直線と楕円em との交点と、最外郭格子
点m1 との距離として計算される。また、内部格子点m
2 についても最外郭格子点m1 と同様に、形状エネルギ
ーEform(t,s) が計算されるが、内部格子点m2 が楕円
m の内側にあるときにはEform(t,s) =0とする。こ
のようにして求められた形状エネルギーEform(t,s) を
実施の形態1の(1)式に加えたものを口唇領域抽出用
網の内部エネルギーとする。
【0137】(2)網の画像エネルギー 画像エネルギーは、口唇領域確率差分画像のピクセルの
明るさ用いる。口唇領域確率差分画像とは、領域確率計
算装置5で生成された口唇領域確率画像と顔領域確率画
像との対応するピクセルの明るさの差をとったものであ
る。口唇領域確率画像のピクセルが顔領域確率画像のピ
クセルより明るい場合には、その明るさの差をとり、そ
うでない場合には0とする。即ち、図28に示すよう
に、座標(x,y)における口唇領域確率画像のピクセ
ルの明るさをIm (x,y) 、顔領域確率画像のピクセルの
明るさをIf (x,y) 、口唇領域確率差分画像のピクセル
の明るさをImf(x,y) とすると、次のようになる。
【0138】
【数21】 実際の画像では、図9に示す顔領域確率画像と図10に
示す口唇領域確率画像との差分をとると、図29に示す
口唇領域確率差分画像が得られる。このようにして生成
した口唇領域確率差分画像のピクセルの明るさに−1を
掛けたものを内部格子点でのエネルギーとする。最外郭
格子点のエネルギーは、顔領域確率画像のピクセルの明
るさに−1を掛けたものを用いる。即ち、口唇領域抽出
用網の格子点p(t,s) での画像エネルギーは、以下のよ
うになる。
【0139】
【数22】 ここで、MFDRPI(t,s) は口唇領域確率差分画像での格子
点p(t,s) での明るさ、FRPI(t,s) は顔領域確率画像で
の格子点p(t,s) での明るさである。
【0140】(3)移動エネルギー 口唇領域抽出用網を動かすために、網の内部エネルギー
及び画像エネルギーの他に網の移動エネルギーを定義す
る。これは、口唇領域を抽出するための網が、精度良く
口唇領域を抽出するために、網全体を口唇領域の方へ動
かすためのエネルギーである。この移動エネルギーE
moveは、以下のように定義する。
【0141】
【数23】 ここで、Gnet は口唇領域抽出用網が囲む領域の重心を
表すベクトル、gnetは口唇領域抽出用網の最外郭フレ
ームの重心を表すベクトルである。即ち、Emo veは、2
つの重心が重なるように網を移動させる力をもたらす。
なお、口唇領域抽出用網の最外郭フレームの重心は初期
状態では、顔領域抽出用網の最外郭フレームの重心と一
致している。
【0142】次に、上記のように定義された口唇領域抽
出用網が口唇領域を抽出するプロセスを図30のフロー
チャートに基づいて説明する。
【0143】まず、実施の形態1と同様にして顔領域抽
出用網により顔領域を抽出する(S31)。従って、仮
想的な網は、図31の上段に示すように、顔領域を囲む
ような形・大きさになっている。口唇領域は、顔領域の
内部にあるのだから、顔領域が抽出されたときの網を口
唇領域抽出用網の初期値として、口唇領域抽出用網を動
かし始める(S32)。顔領域抽出用網のときと同じよ
うにして、すべての格子点について8近傍を移動させ、
網を1単位変形させる(S33)。次に、先に挙げた口
唇領域抽出用網が囲む領域の重心Gnet と、口唇領域抽
出用網の最外郭フレームの重心gnet を計算し、それら
の距離が小さくなる方向に網を移動させる(S34)。
網全体のエネルギーに変化があるかどうかを調べ(S3
5)、S35でエネルギー変化がある場合にはS33の
工程へ戻り、S35でエネルギーに変化がなくなったら
網の変形を停止させる。網が停止したときに網は図31
の下段に示すように、口唇領域を囲っている。
【0144】以上により、本実施の形態における領域抽
出装置は、顔領域を囲む網を初期値とした口唇領域抽出
用網を設定し、格子点の位置関係に基づく網の内部エネ
ルギーと、格子点が位置するピクセルの色の確からしさ
に基づく画像エネルギーと、口唇領域抽出用網の最外郭
フレームの重心と網が囲む領域の重心とが一致するよう
に定義された移動エネルギーとの合計値が変化しなくな
るまで網を収縮変形・移動させ、合計値が変化しなくな
った時点で格子点の移動を停止する構成である。
【0145】従って、顔領域を覆っていた網は、色の確
からしさが大きい口唇領域に向かって収縮し、最終的に
口唇領域を囲んで停止する。この結果、口唇領域を抽出
することができる。
【0146】また、実施の形態1の効果に加えて、顔領
域の最外郭フレームの重心と口唇領域抽出用網の囲む領
域の重心とを結ぶ直線と、垂直軸とのなす角を求めるこ
とにより、顔の回転角を認識することができる。ここ
で、顔の回転とは顔の傾きのことであり、即ち、撮像装
置から撮影方向に延びた軸の回りの回転を示す。
【0147】顔の回転角がわかると、例えば、人物デー
タベースを作る際に、写真をスキャナなどで読み込む場
合に、写真の方向などをきにせずに入力することがで
き、手間が大いに軽減する。また、同様にして、バラバ
ラになった写真の方向を揃えるような装置に適用するこ
とが可能である。さらに、撮影時のブレやフィルムイメ
ージをデジタル化するときなどの方向の間違いを気にし
なくてもよくなる。この結果、撮影時、及び処理時の自
由度が増大する。
【0148】さらに、顔領域と口唇領域とのバランスに
より、顔のおおよその方向を推定することができる。即
ち、口唇領域の中心が顔領域の主軸に近い位置にあるな
らば、利用者は撮像装置の方向を向いており、左右のど
ちらかにずれていればそれぞれの方向に向いていること
になる。
【0149】また、動画像から口唇領域を連続的に抽出
することにより口唇の動きを検出することができ、マイ
クなどと組み合わせて音声認識の認識精度をあげたり、
マイクが拾った音が利用者が喋っているのか別のところ
から聞こえてきたものかを判断したりすることが可能と
なる。
【0150】さらに、本領域抽出装置は、実施の形態1
と同様にさまざまな機器の制御などに利用することがで
きる。
【0151】例えば、テレビに本領域抽出装置を取り付
けて、利用者の顔の向きを検出することにより、利用者
がテレビの方を向いていないときだけ画面を暗くして表
示面を保護したり、音センサと組み合わせ、単純な発生
によってスイッチのON/OFFを行ったり、単純な機
器の制御を行ったりすることができる。さらに、マイク
で拾った声が利用者のものかどうかを判断できるので、
誤った検出で制御されることを防ぐことができる。
【0152】〔実施の形態3〕本発明のその他の実施の
形態について図32ないし図38に基づいて説明すれ
ば、以下の通りである。なお説明の便宜上、前記の実施
の形態の図面に示した部材と同一の部材には同一の符号
を付記し、その説明を省略する。
【0153】本実施の形態にかかる領域抽出装置は、入
力された人物画像により顔領域、口唇領域、及び左右の
目領域を抽出するものである。ここでは、顔領域を抽出
した後、その抽出された顔領域を初期状態とした口唇領
域抽出用網、左目領域抽出用網、及び右目領域抽出用網
を設定し、それぞれの網の位置関係を考慮に入れながら
それらの網を同時に移動させて口唇領域、及び左右の目
領域を同時に抽出する。
【0154】上記領域抽出装置は、図32に示すよう
に、実施の形態2の構成に加えて、記憶装置3に左目領
域抽出用網情報格納部23、右目領域抽出用網情報格納
部24、バランスエネルギー(Ebalance )格納部2
5、及び顔部品位置関係格納部26を有している。
【0155】左・右目領域抽出用網情報格納部23・2
4には初期状態として顔領域に収縮した網の座標がそれ
ぞれ格納される。また、左・右目領域抽出用網の2つの
重心と、網の内部エネルギー(Eint )、画像エネルギ
ー(Eimage )、及び形状エネルギー(Eform)とがそ
れぞれ格納される。バランスエネルギー格納部25には
3つの網の位置関係の制御を行うバランスエネルギー
(Ebalance )が格納される。顔部品位置関係格納部2
6にはサンプリングにより予め求められた顔部品の位置
関係が予め格納されている。
【0156】上記構成によれば、実施の形態2と同様
に、領域確率計算装置5が領域確率画像格納部8を参照
して、顔領域及び口唇領域を構成する各ピクセルの色に
基づいて確率密度関数を計算することにより各ピクセル
の色の確からしさを算出し、顔領域確率画像及び口唇領
域確率画像を生成する。次に、エネルギー計算装置6が
顔領域抽出用網の内部エネルギー(Eint )と画像エネ
ルギー(Eimage )を計算し、それを顔領域抽出用網情
報格納部9に格納する。これらのエネルギーの合計が小
さくなるように網を収縮変形・移動させ、まず顔領域を
抽出する。この結果が出力装置4に出力される。
【0157】重心計算装置21が、顔領域抽出用網情報
格納部9・口唇領域抽出用網情報格納部22・左目領域
抽出用網情報格納部23・右目領域抽出用網情報格納部
24にそれぞれ格納されている網の座標を参照して最外
郭フレームの重心(g)を計算し、それぞれ格納する。
また、各々の網の座標と領域確率画像格納部8に格納さ
れた顔領域確率画像とを参照して顔領域抽出用網・口唇
領域抽出用網・左右の目領域抽出用網の囲む領域の重心
(G)をぞれぞれ計算し、顔領域抽出用網情報格納部9
・口唇領域抽出用網情報格納部22・左目領域抽出用網
情報格納部23・右目領域抽出用網情報格納部24に各
々格納する。
【0158】また、エネルギー計算装置6が口唇領域抽
出用網・左右の目領域抽出用網の内部エネルギー(E
int )、画像エネルギー(Eimage )、及び形状エネル
ギー(Eform)を計算し、それらを口唇領域抽出用網情
報格納部22・左目領域抽出用網情報格納部23・右目
領域抽出用網情報格納部24に格納する。さらに、エネ
ルギー計算装置6が顔部品位置関係格納部26と4つの
網情報格納部に格納されている重心(g・G)とを比較
することによりバランスエネルギー(Ebalance)を計
算し、格納する。
【0159】口唇領域抽出用網・左右の目領域抽出用網
のエネルギーの合計値がそれぞれ小さくなるように3つ
の網を変形収縮・移動し、口唇領域及び左右の目領域を
抽出する。その結果が出力装置4に出力される。
【0160】次に、口唇領域抽出用網、左目領域抽出用
網、及び右目領域抽出用網のエネルギーについて説明す
る。口唇領域抽出用網のエネルギーは実施の形態2と同
様である。
【0161】(1)目領域抽出用網の内部エネルギー 左右の目領域抽出用網のエネルギーの内部エネルギーに
ついては、口唇領域抽出用網と同様に、顔幅から推定さ
れる目の平均的な形状と大きさとに網が収縮するような
エネルギーを加える。即ち、顔幅に対して一定の比率を
乗ずることによって得られる長径及び短径を持つ楕円を
想定することによって得られる形状エネルギーEform
実施の形態1の(1)式に加えられることにより目領域
抽出用網の内部エネルギーが定義される。
【0162】(2)目領域抽出用網の画像エネルギー 左右の目領域抽出用網のエネルギーの画像エネルギー
は、目領域抽出画像のピクセルの明るさを用いる。目領
域抽出画像とは、領域確率計算装置5で生成された口唇
領域確率画像と顔領域確率画像との対応するピクセルの
明るさの大きいほうをとったものである。即ち、図33
に示すように、座標(x,y)における口唇領域確率画
像のピクセルの明るさをIm (x,y) 、顔領域確率画像の
ピクセルの明るさをIf (x,y) 、目領域抽出画像のピク
セルの明るさをIe (x,y) とすると、次のようになる。
【0163】
【数24】 このようにして生成された目領域抽出画像のピクセルの
明るさを内部格子点での画像エネルギーとする。最外郭
格子点の画像エネルギーは、顔領域確率画像のピクセル
の明るさに−1を掛けたものを用いる。即ち、目領域抽
出用網のある格子点p(t,s) での画像エネルギーは、以
下のようになる。
【0164】
【数25】 ここで、ERPI(t,s) は、目領域抽出画像での格子点p
(t,s) での明るさ、FRPI(t,s) は顔領域確率画像での格
子点p(t,s) での明るさである。
【0165】以上のようにして、目領域抽出画像の内部
エネルギーと画像エネルギーとが定義される。
【0166】(3)網のバランスエネルギー これら左右の目領域抽出用網及び口唇領域抽出用網の3
つの網が協調しながら動くように定義した網のバランス
エネルギーについて説明する。
【0167】通常、人間の左右の目と口唇との位置関係
は同じであり、個人差はあるものの例えば、両目の間の
距離や、目及び口唇の高さなどは顔幅に対して一定の比
率を持っている。従って、これらの顔部品の位置関係に
関する先見的知識を用いて、それぞれの領域を抽出する
網の位置関係を制御する。
【0168】表1は24人のサンプルデータより測定し
た顔部品の大きさ及び位置関係に関するデータである。
これは、図34(a)及び(b)に示すように、顔幅h
を1としたときの各測定幅a〜lの値の平均、分散、及
び標準偏差を示している。各々のデータは、図34に示
す箇所を測定している。これらのデータにより算出され
た顔部品の位置関係は、前記顔部品位置関係格納部26
に格納される。
【0169】
【表1】 バランスエネルギーEbalance は、内部エネルギー及び
画像エネルギーに加えてそれぞれの網の位置関係を特定
の制約条件に拘束するように定義される。バランスエネ
ルギーEbalance は、次のように表される。
【0170】
【数26】 図35に示すように、Emgは、口唇領域抽出用網の最外
郭格子点の重心gm が、その網が囲む領域の重心Gm
引き寄せられるようなエネルギーである。
【0171】Eleg は、左の目領域抽出用網の最外郭格
子点の重心gleが、その網が囲む領域の重心Gleに引き
寄せられるようなエネルギーである。
【0172】 reg は、右の目領域抽出用網の最外郭格
子点の重心greが、その網が囲む領域の重心Greに引き
寄せられるようなエネルギーである。なお、上記重心g
m 、重心gle、及び重心greは、初期状態では顔領域抽
出用網の最外郭格子点の重心gf に一致している。
【0173】 iod は、左右の目領域抽出用網が囲む領
域の重心Gle・Gre間の距離が、顔幅に対する特定の比
になろうとするエネルギーである。
【0174】Eemh は、左右の目領域抽出用網が囲む領
域の重心GleとGreとを結ぶ線分の中点と口唇領域抽出
用網が囲む領域の重心Gm との距離が顔幅に対する特定
の比率になろうとするエネルギーである。
【0175】Efaは、左右の目領域抽出用網が囲む領域
の重心GleとGreとを結ぶ線分の中点と口唇領域抽出用
網が囲む領域の重心Gm とを結ぶ軸と、顔の傾きを表す
軸とのなす角が0になろうとするエネルギーである。
【0176】Eema は、左右の目領域抽出用網が囲む領
域の重心GleとGreとを結ぶ線分と、その線分の中点と
口唇領域抽出用網が囲む領域の重心Gm とを結ぶ軸との
なす角が直角になろうとするエネルギーである。
【0177】以上のように、口唇・左目・右目領域抽出
用網の内部エネルギー及び画像エネルギーは網を収縮さ
せ、かつ滑らかに保とうとしながら、各領域の画像の特
徴にあわせて各領域に縮んで生き、バランスエネルギー
balance はそれそれの網のバランスを一定の平行状態
に保つ。3つの網がそれぞれの領域に向かって変形・収
縮し、網の位置関係が一定の平衡状態を保つように移動
することにより、それぞれの網は最終的に個々の領域を
囲むように収束する。図36に、入力画像に対して本領
域抽出装置を適用した結果を示す。同図(a)〜(c)
の順に、口唇、左目、及び右目領域抽出用網が各領域を
抽出する様子を示している。
【0178】次に、口唇・左目・右目領域抽出用網がそ
れぞれの領域を抽出するプロセスを図37のフローチャ
ートに基づいて説明する。
【0179】まず、実施の形態1と同様にして顔領域抽
出用網により顔領域を抽出する(S41)。従って、図
38の上段に示すように、仮想的な網は、顔領域を囲む
ような形・大きさになっている。口唇領域及び左右の目
領域は、顔領域の内部にあるのだから、顔領域が抽出さ
れたときの網を口唇・左目・右目領域抽出用網の初期値
として、各網を動かし始める(S42)。顔領域抽出用
網のときと同じようにして、口唇領域抽出用網のすべて
の格子点について8近傍を移動させ、網が収束している
かどうかを調べ(S43)、S43で網が収束していな
ければ網を1単位変形させ(S44)、S43で収束し
ていれば次に左右の目領域抽出用網について同様に調べ
る(S45〜S48)。
【0180】各網が1単位変形変形した後、バランスエ
ネルギーを計算して各網を移動させる(S49)。そし
て、口唇領域抽出用網のエネルギーに変化があるかどう
かを調べ(S50)、変化がない場合には口唇領域抽出
用網の収束済フラグをONにする(S51)。同様にし
て、左右の目領域抽出用網についても調べる(S52〜
S55)。その後、すべての網のエネルギーに変化があ
るかどうかを調べ(S56)、エネルギー変化がある場
合にはS43の工程へ戻り、すべての網のエネルギーに
変化がなくなったら網の変形を停止させる。すべての網
が停止したときには、図38の下3段に示すように、各
網は各領域を囲っている。
【0181】以上により、本実施の形態における領域抽
出装置は、顔領域を囲む網を初期値とした口唇・左右の
目領域抽出用網を設定し、格子点の位置関係に基づく網
の内部エネルギーと、格子点が位置するピクセルの色の
確からしさに基づく画像エネルギーと、3つの領域の重
心の位置関係が予め測定され記憶された口唇及び左右の
目の位置関係と等しくなるように定義されたバランスエ
ネルギーとの合計値が変化しなくなるまで網を収縮変形
・移動させ、合計値が変化しなくなった時点で格子点の
移動を停止する構成である。
【0182】従って、顔領域を覆っていた網は、色の確
からしさが大きい口唇・左右の目領域に向かってそれぞ
れ収縮し、最終的に各領域を囲んで停止する。この結
果、口唇及び左右の目領域を抽出することができる。
【0183】これにより、実施の形態1及び2の効果に
加えて、口唇・目の形を認識することができ、これらは
個人によって特有な値を持つので、これを利用して個人
同定を行うことができる。即ち、予め複数の人物の画像
を入力しておき、領域抽出装置により各領域を抽出、そ
れぞれの部品の相対位置関係や大きさ、形状を数値化し
て、各人ごとにデータベースに記憶しておく。データベ
ース検索装置に撮像装置と領域抽出装置を取り付けるこ
とにより、撮像装置に映された人物の顔領域、口唇領
域、目領域を抽出して、同じように各部品の位置関係や
大きさを数量化する。得られた数値とデータベースの数
値とでマッチングを取り、入力画像がデータベース中の
どの人物であるかを判断する。これにより、来客の多い
企業の受付やホテルなどで予めデータベースを作ってお
き、来客人物を撮影してデータベースからその人物のプ
ロフィールなどを自動検索し、それによってスムースな
対応をするアプリケーションを想定することができる。
【0184】また、顔輪郭だけでなく、顔部品の抽出ま
で行えるようになると、情報の圧縮率はさらに高まるこ
とになる。実施の形態1で述べたように、顔領域を抽出
し、顔以外の解像度や色数を落としたりすることで情報
を圧縮できるが、さらに、顔領域の中で、顔部品の領域
を最も高い解像度・色数にし、次いで顔領域、顔領域以
外、という順序で解像度・色数を落とすことにより、画
像の顔領域の劣化を少なく保ちつつ情報を圧縮すること
が可能となる。さらに、顔部品及び顔領域で利用される
色数は限られており、それぞれ独自の色コードを持つこ
とにより、さらなる情報の圧縮が可能となる。これによ
り、実施の形態1や2よりも少ない容量でより多くの画
像を保存でき、あるいは、狭い帯域幅でよりコマ数の多
い滑らかな画像を電送することが可能となる。
【0185】また、人物データベースなどのように、画
像を多くファイリングするような必要があるアプリケー
ションにおいては、ひとつひとつの画像の大きさがその
装置に記憶することのできる画像の数に大きく関わって
くる。上述のように、1枚の人物画像をより少ない容量
で保存することができるなら、低コストで多くの画像を
記憶することのできるデータベースを作成することがで
きる。また、帯域幅を広くしなくとも人物画像を電送で
きるようになる。従って、テレビ会議、テレビ電話、及
び電子秘書などの低コスト化が実現できる。
【0186】また、人物データベースを作成する際に、
今までは画像と一緒に検索のためのキーとなるその個人
を表すデータを人間が手作業で単語として登録し、検索
する際もそのキーワードを手で入力したり、あるいは、
データベースを最初から順番に見つかるまで方端から見
なければならなかったが、本領域抽出装置では画像から
顔領域及び顔部品が自動的に抽出できるので、データベ
ースを登録する際に顔部品を抽出して、装置自身がデー
タベース検索装置に接続された撮像装置に映すだけでよ
くなる。この結果、来客や久しぶりに会った人が誰であ
るかを瞬時に見つけ出すといったアプリケーションが可
能となる。
【0187】さらに、目や口唇の領域が抽出されると、
表情の認識を行うことが可能となる。人間の表情は、目
や口などの顔部品に特徴が現れるため、目や口の形を領
域抽出することにより調べることによって、その人がど
のような表情をしているのかを判定できるようになる。
これは、人の感情にあわせて対応を変化させるロボット
や精神分析などの自動化などを行うことが可能にする。
【0188】同様に、表情の認識ができるということ
は、表情の生成をもできるということになる。目や口の
領域が抽出されると、その領域を感情特有の形に変形さ
せることにより表情を作り出せる。例えば、人が笑って
いるときの典型的な目と口の形状を予め測定してデータ
ベース化しておき、入力画像から抽出された目や口の領
域をそのデータベースにしたがって変形させれば、その
画像中の表情を笑わせることができる。さまざまな表情
を予めデータベース化しておけば、撮像した画像の顔を
自由自在に笑わせたり、怒らせたりといったことが可能
となる。
【0189】これは、人間的なやさしいインターフェイ
スを持った機器を開発することを可能にする。従って、
機器の操作説明などで現れる顔の表情を自在に変化さ
せ、利用者にとって親しみ易い機器の提供などを行うこ
とが可能となる。また、ある人間を別の人間、あるい
は、他の動物などに連続的に変化させるアニメーション
など、映像作品における特殊効果的な利用もこの技術を
用いれば全自動で行うことができる。来るべきマルチメ
ディア時代のエンターテイメントコンテンツとしての利
用価値は大きい。
【0190】また、表情生成、似顔絵作成などが自動的
にできるようになることは、エンターテイメント分野で
のマルチメディアコンテンツ供給の低コスト化を実現で
きる。従来では手作業と独特のセンス、技術を要求され
るものであったものが、自動的にできるようになるた
め、将来的に増大するであろう需要に対しても対応する
ことが可能となる。
【0191】また、実施の形態1及び2と同様に、リア
ルタイムに顔領域及び顔部品を抽出することにより、よ
り細かな機器の制御を行うことが可能となる。例えば、
顔部品の位置関係により顔の傾きを精度良く検出するこ
とが可能となる。顔の傾きの大きさによって、オーディ
オ装置の音量をコントロールしたり、照明の明るさを制
御したりすることが可能となる。あるいは、瞬きなどを
検出して両手が使えない状態、例えば、車の運転中にラ
ジオのチューニングを変えるということが可能となる。
【0192】あるいは、顔部品を抽出し個人同定を行う
ことにより、個人の好みに合わせたエアコンの強弱やテ
レビ、オーディオなどの音量などの自動制御や、パソコ
ンのログインや電子ロックといったセキュリティ方面へ
の応用も可能となる。これにより、そのつど機器を調整
しなければならない手間やパスワード入力をする手間、
入力間違いなどが削減される。
【0193】なお、上記実施の形態1ないし3では、領
域確率計算装置5により一旦領域確率画像を生成し、こ
の領域確率画像を用いて画像エネルギーを計算している
が、これは、処理が簡単になると共に処理が高速化でき
るという効果がある。しかしながら、画像エネルギーを
計算する際に、格子点上にあるピクセルの色から各領域
の確からしさをそのつど計算することによっても画像エ
ネルギーを計算することができる。この場合は、領域確
率画像を生成しなくてもよいため必要なメモリを減らす
ことができるというメリットがある反面、格子点上のピ
クセルの領域の確からしさをそのつど計算する必要があ
るので処理速度が低下する。
【0194】また、上記実施の形態の網のエネルギーは
網の形が顔領域及び顔部品を囲むようになったときにエ
ネルギーが最も小さくなるように定義されているが、網
の形が顔領域及び顔部品を囲むようになったときにエネ
ルギーが最も大きくなるように定義しても同様の効果が
得られる。
【0195】また、本実施の形態の網の形状は放射状と
しているが、エネルギーの設定次第で格子状など他の形
状とすることもできる。即ち、点と点との接続関係の情
報があればどのような形状とすることもできる。ただ
し、本実施の形態のように楕円に近い形状を持つ顔、口
唇、目領域などを抽出する場合にはエネルギー設定が行
いやすいので放射状が好ましい。
【0196】また、本実施の形態では、格子点を移動さ
せる際に最外郭格子点から移動させているが、これに限
られることはなく、どの格子点から移動させてもよい。
ただし、すべての格子点が1単位移動するまで、同じ格
子点が二重に動かないようにする必要がある。
【0197】また、本実施の形態では格子点の移動を8
近傍としているが、これに限られることはなく、例えば
4近傍としてもよい。さらに、隣接するピクセルではな
く、離れたピクセルに移動してもよいが、この場合は、
抽出したい領域の境界部分を飛び越えてしまわない程度
の移動距離にする必要がある。
【0198】なお、実施の形態2及び3における内部エ
ネルギーには、楕円を想定することにより得られる形状
エネルギーが設定されているが、抽出しようとする物の
形状がわからない場合には設定しなくともよい。ただ
し、本実施の形態のように、抽出対象の形状がわかって
いる場合は、形状エネルギーを設定した方が精度があが
るので望ましい。
【0199】また、実施の形態2における移動エネルギ
ーについても同様に設定しなくてもよいが、設定したほ
うが精度が良くなるので望ましい。
【0200】〔実施の形態4〕本発明のその他の実施の
形態について図39ないし図43に基づいて説明すれ
ば、以下の通りである。なお説明の便宜上、前記の実施
の形態の図面に示した部材と同一の部材には同一の符号
を付記し、その説明を省略する。
【0201】本実施の形態に係る方向検出装置は、実施
の形態3の領域抽出装置を利用すると共に2つの撮像装
置を用いて、各撮像装置に映った人物画像よりそれぞれ
顔部品を抽出した後、各画像に映っている顔部品の位置
のずれを調べることにより、頭部の3次元方向を検出す
るものである。
【0202】図39に示すように、機器43に取り付け
られた撮像装置(撮像手段)42L・42Rが利用者の
姿を捉え、そのデジタル画像を領域抽出装置41に送
る。領域抽出装置41は、それぞれの画像から利用者の
顔領域を抽出し、その情報を頭部方向検出装置45に送
る。頭部方向検出装置45は2つの画像から顔部品の3
次元情報検出することにより頭部の方向を検出し、その
情報を制御装置44に送る。制御装置44は機器43に
接続されており、頭部方向検出装置45から送られてき
た情報をもとに機器43を制御する。
【0203】上記2つの撮像装置42L・42Rを用い
て頭部方向を検出する方法は以下の通りである。まず、
撮像装置42L・42Rの配置はエピポーラ拘束に従
う。エピポーラ拘束とは、図40に示すように、一方の
撮像装置42Lのデジタル画像Lに映っているものが、
他方の撮像装置42Rのデジタル画像Rにて、走査線に
平行に映っているような制約のことである。即ち、撮像
装置を2台設置する際には、同様の特性を持つ撮像装置
を光軸が同一平面上にのるように設置しなければならな
い。
【0204】まず、図41に示すように、2つの人物画
像である画像L・Rからそれぞれ口唇領域、左右の目領
域を抽出する。次に、画像Lにおける3つの顔部品が画
像Rにおいてどの位置にあるかを調べる。画像Lにおけ
る口唇位置の、画像Rにおける口唇位置の水平方向のず
れをdm、画像Lにおける左目位置の、画像Rにおける
左目位置の水平方向のずれをdle、画像Lにおける右
目位置の、画像Rにおける右目位置の水平方向のずれを
dreとする。これらの2つの画像L・Rでの顔部品の
ずれの逆数が、画像面からの顔部品の相対的な距離に相
当する。
【0205】そこで、図42に示すように、画像面の各
顔部品から画像面奥の方へ垂直に向かってそれぞれ1/
dm、1/dle、1/dreだけ離れた距離にある点
をそれぞれpm、ple、preとすると、頭部の3次
元向きはpleとpreとを結ぶ線分の中点と、pmと
を通る直線でpmから中点に向かう方向となる。
【0206】上記方向検出装置のプロセスを図43のフ
ローチャートに基づいて説明する。まず、2つの撮像装
置42L・42Rにより利用者の画像を撮影する(S6
1)。そして、領域抽出装置41により各画像から口唇
・左右目領域を抽出する(S62)。2つの画像間での
口唇・左目・右目それぞれの顔部品の水平位置のずれを
算出する(S63)。各顔部品の画像面からの距離を計
算する(S64)。そして、頭部の3次元方向を計算す
る(S65)。このプロセスを繰り返すことにより、撮
像装置前の利用者の頭部方向をリアルタイムに検出する
ことが可能となる。
【0207】即ち、2つの撮像装置42L・42Rによ
り顔画像を同時に撮影し、それぞれの画像の顔領域及び
顔部品を抽出することにより、それぞれの画像の視差に
より口唇、左目、右目、それぞれの3次元空間上の3点
が決まるため、頭部がどの方向を向いているかを検出す
ることができる。
【0208】これにより、専用の装置を頭部に装着しな
ければ頭部の方向を検出できなかった従来のものと比較
して、本方向検出装置は専用のハードウェアを用いなく
てもよいので、低コストで製品が実現できると共に装着
する際の煩わしさなどを除去することができる。また、
専用のハードウェアを用いなくても済むので応用範囲が
広がる。
【0209】また、顔の方向を検知して利用者が自分の
方を向いているときだけ作動するような仕組みを提供し
たり、例えば、顔の向きでチャンネルや音量が変えられ
るようなテレビやオーディオ製品が可能となる。
【0210】また、バーチャルリアリティに応用するこ
とも可能である。即ち、撮像装置の前の人物の頭の位置
・方向に合わせて、コンピュータ上で表現された仮想世
界での仮想的な利用者の位置・方向を決めることがで
き、実際の利用者の頭部の動きと、仮想世界での利用者
の頭部の動きを、特殊なヘッドギアなどを用いずに同調
させることが可能となる。また、3次元CADにおい
て、特定の3次元位置の点を指定したり、複数の属性を
持つものを同時に調節、例えば、テレビの色合い、コン
トラスト、明るさなどを同時に調整することも可能とな
る。
【0211】なお、撮像装置は2つに限られることはな
く、3つ以上とすることも可能である。この場合、撮像
装置の配置はエピポーラ拘束に従う必要はない。
【0212】〔実施の形態5〕本発明のその他の実施の
形態について図44ないし図46に基づいて説明すれ
ば、以下の通りである。なお説明の便宜上、前記の実施
の形態の図面に示した部材と同一の部材には同一の符号
を付記し、その説明を省略する。
【0213】本実施の形態にかかる方向検出装置は、図
44に示すように、実施の形態4の構成に加えて、頭部
方向検出装置45により検出された頭部方向の情報が入
力される視線方向検出装置46を有する。
【0214】視線方向を検出する方法は以下の通りであ
る。まず、実験として、視線の検出精度を設定する。そ
の精度から検出しようとしている方向の数を決め、例え
ば図45(a)〜(f)に示すように、その数だけ被験
者にその方向を注視してもらう。そして、その注視して
いる時の目の画像を撮影する。この目の画像は、人間が
ある方向を見た時に、瞳がどの位置にくるかを示してい
る視線データベースとなる。領域抽出装置によって検出
された目の画像を、この視線データベースと比較するこ
とにより、利用者の視線の方向を推定することができ
る。そして、実施の形態4の頭部方向検出装置45で検
出された頭部の3次元方向の情報と、この視線方向の情
報とを組み合わせることにより、真の視線方向を検出す
ることが可能となる。
【0215】上記方向検出装置のプロセスを図46のフ
ローチャートに基づいて説明する。まず、頭部検出装置
により、頭部の3次元方向を検出する(S71)。この
時点で目の領域はすでに検出されているため、抽出され
た目の領域を視線データベースにある画像にあわせてサ
イズを変更する。そして、変更された目の領域の画像
と、視線データベースの画像との間でマッチングをとる
(S72)。このマッチングにはデンプレートマッチン
グなどの手法を用いる。そして、2つの画像の差を取
り、差が最も小さくなるものを選択することにより、視
線方向を推定する(S73)。すでに検出されている頭
部の3次元方向と、推定された視線方向とを合わせるこ
とにより、真の視線方向を検出する(S74)。
【0216】これにより、本方向検出装置は、特別な装
置を用いずに視線方向を検出することができる。この結
果、ハードウェアなどを装着する煩わしさを除去するこ
とができると共に、装置の低コスト化が可能となる。ま
た、情報機器などのポインティングデバイスの代用、例
えば、コンピュータディスプレイの任意の一点をマウス
やペン、あるいは、現存するアイトラッカーのような大
がかりな装置を使用することなく指定することができ、
さまざまな電子機器の制御を行うことが可能となる。ま
た、キーボードを操作しながら注目点を目で追跡したり
することができ、機器の作業の効率をあげることができ
る。さらに、両手が塞がった状態でも他の操作を行うこ
とが可能となる。また、体の不自由な人への適用も考え
られる。
【0217】
【発明の効果】以上のように、本発明の請求項1記載の
領域抽出装置は、対象物を撮像してカラーデジタル画像
とする撮像手段と、上記カラーデジタル画像において均
一に同様の色を持つ所望領域を示す確率密度関数を予め
記憶しておく確率密度関数格納手段と、上記所望領域を
構成する各画素の色に基づいて上記確率密度関数を計算
することにより、各画素の色の確からしさを算出する領
域確率計算手段と、上記カラーデジタル画像上の任意の
3つ以上の点を接続することにより形成され画像全体を
覆うように設けられる仮想的な網の情報を記憶しておく
網情報格納手段と、上記点の位置関係に基づいて定義さ
れる網の内部エネルギーと、点が位置する画素の色の確
からしさに基づいて定義される網の画像エネルギーとを
それぞれ計算するエネルギー計算手段とを有し、1つの
点を移動させたときの網の内部エネルギーと画像エネル
ギーとの合計値を、上記点を移動させる前の合計値と比
較し、合計値が変化するときは網が収縮する方向へ点の
移動を行い、合計値が変化しなくなった時点で点の移動
を停止する構成である。
【0218】これにより、本領域抽出装置は照明条件の
変化に強い色の確からしさに基づいて所望領域を抽出す
ることができるので、撮影する場所、時間、補助照明の
有無、方向などに左右されることがなくなる。また、網
はどのような形状にもなり得るので、入力画像の大き
さ、及び画像中の顔位置や大きさなどに制限されること
がなくなる。これらの結果、撮影の自由度を増大させる
ことができるという効果を奏する。
【0219】請求項2記載の領域抽出装置は、請求項1
記載の構成に加えて、上記対象物は人物であり、上記所
望領域は人物の顔の領域である構成である。
【0220】これにより、顔領域を抽出することができ
るので、さまざまな家電製品などの機器の制御に利用す
ることができる。即ち、利用者の位置による機器の制御
を行うことが可能となるという効果を奏する。
【0221】請求項3記載の領域抽出装置は、請求項1
または2記載の構成に加えて、確率密度関数格納手段に
は上記所望領域と異なる色を持つ部分領域を示す確率密
度関数が予め記憶されると共に、網情報格納手段には上
記所望領域を囲んで停止した網の情報が部分領域を抽出
するための部分領域抽出用網の初期値として記憶され、
上記所望領域内に部分領域が1つある場合に、領域確率
計算手段が上記部分領域を構成する各画素の色に基づい
て上記確率密度関数を計算することにより各画素の色の
確からしさを算出して、エネルギー計算手段が部分領域
抽出用網の内部エネルギー及び画像エネルギーと、部分
領域に収束されるように定義された移動エネルギーとを
それぞれ計算することにより、部分領域を抽出する構成
である。
【0222】これにより、最初の領域抽出に用いた網
を、さらに領域内の別の領域の抽出に用いることができ
るので、領域毎に網の設定を変える必要がないという効
果を奏する。
【0223】請求項4記載の領域抽出装置は、請求項3
記載の構成に加えて、部分領域抽出用網の外周を形成す
る点からフレーム重心を求めると共に、画像の明るさを
重みとした部分領域抽出用網が囲む領域の重心を求める
重心計算手段を有し、上記移動エネルギーを、上記フレ
ーム重心が領域の重心の方向に引き寄せられるように定
義する構成である。
【0224】これにより、フレーム重心が領域重心の方
向に引き寄せられるように移動エネルギーが設定されて
いるので、部分領域に似た色を持つ領域があったとして
も、その領域に引き寄せられることなく、部分領域を抽
出することができる。この結果、処理速度が速く、高精
度の部分領域の抽出が可能となるという効果を奏する。
【0225】請求項5記載の領域抽出装置は、請求項2
記載の構成に加えて、網の外周を形成する点からフレー
ム重心を求めると共に、画像の明るさを重みとして網が
囲む領域の重心を求める重心計算手段を有し、確率密度
関数格納手段には口唇領域を示す確率密度関数が予め記
憶されると共に、網情報格納手段には上記顔領域を囲ん
で停止した網の情報が口唇領域及び左右の目領域を抽出
するための網の初期値として記憶され、領域確率計算手
段が、上記口唇領域を構成する各画素の色に基づいて上
記確率密度関数を計算することにより各画素の色の確か
らしさを算出すると共に、上記左右の目領域を構成する
各画素の色に基づいて顔領域あるいは口唇領域の確率密
度関数を計算することにより各画素の色の確からしさを
算出して、エネルギー計算手段が、各領域の内部エネル
ギー及び画像エネルギーと、各々のフレーム重心が各々
の領域重心の方向へ引き寄せられ、かつ、3つの領域の
重心の位置関係が予め測定され記憶された口唇及び左右
の目の位置関係と等しくなるように定義されたバランス
エネルギーとを計算することにより、口唇及び左右の目
領域を抽出する構成である。
【0226】これにより、顔領域抽出用網を、口唇領域
抽出用網及び左右の目領域抽出用網とすることができる
ので、領域毎に網の設定を変える必要がない。また、顔
領域に対する顔部品の位置がわかるので、顔の回転角
(顔の傾き)を認識することができ、撮影時、及び処理
時の自由度が増大する。さらに、顔のおおよその方向を
推定することができるという効果を奏する。
【0227】請求項6記載の方向検出装置は、請求項5
記載の領域抽出装置を用いて、上記撮像手段が複数個設
けられ、複数の撮像手段から同時に得られる複数の画像
から口唇領域及び左右の目領域をそれぞれ抽出し、互い
に比較することにより口唇及び目の3次元位置情報を導
出する構成である。
【0228】これにより、従来のような専用のハードウ
ェアを用いなくとも、容易に頭部方向を検出することが
できる。この結果、ハードウェアなどを装着する煩わし
さを除去することができると共に、装置の低コスト化が
可能となるという効果を奏する。
【0229】請求項7記載の方向検出装置は、請求項6
記載の構成に加えて、抽出された目の画像と、予め測定
して視線方向の情報が付加されて記憶された目の画像と
を比較することにより推定視線方向を算出し、さらに推
定視線方向と検出された頭部の向きとを比較することに
より真の視線方向を検出する構成である。
【0230】これにより、従来のような専用のハードウ
ェアを用いなくとも、容易に視線方向を検出することが
できる。この結果、ハードウェアなどを装着する煩わし
さを除去することができると共に、装置の低コスト化が
可能となるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の実施の一形態にかかる領域抽出装置の
構成を示すブロック図である。
【図2】上記領域抽出装置における領域確率計算装置の
動作を示すフローチャートである。
【図3】(a)は入力画像を示し、(b)は入力画像か
ら顔の肌色部分と口唇部分とを取り出した状態を示す説
明図である。
【図4】顔領域の色相の色度数分布を示すグラフであ
る。
【図5】顔領域の彩度の色度数分布を示すグラフであ
る。
【図6】顔領域を表す2次元の正規確率密度関数を示す
グラフである。
【図7】領域確率画像の生成の過程を表すフローチャー
トである。
【図8】入力装置に入力される画像を表し、ディスプレ
ー上に表示された中間調画像を示す図面代用写真であ
る。
【図9】図8に示された入力画像から生成された顔領域
確率画像を表し、ディスプレー上に表示された中間調画
像を示す図面代用写真である。
【図10】図8に示された入力画像から生成された口唇
領域確率画像を表し、ディスプレー上に表示された中間
調画像を示す図面代用写真である。
【図11】網を形成する格子点を示す説明図である。
【図12】網のモデルを用いて領域を抽出する様子を示
す説明図であり、(a)は入力画像、(b)は網の初期
状態、(c)は収束中の網の状態、(d)は収束後の網
の状態をそれぞれ示す。
【図13】網のモデルを用いて顔領域を抽出する様子を
示す説明図であり、(a)は入力画像、(b)は網の初
期状態、(c)は収束中の網の状態、(d)は収束後の
網の状態をそれぞれ示す。
【図14】網の形状を示す説明図である。
【図15】他の網の形状を示す説明図である。
【図16】(a)(b)は、網の内部エネルギーを構成
する各エネルギーの定義を示す説明図である。
【図17】格子点の移動の仕方を示すフローチャートで
ある。
【図18】あるピクセルの8近傍を示す説明図である。
【図19】上記領域抽出装置を機器に利用したときの構
成を示すブロック図である。
【図20】本発明の他の実施の形態にかかる領域抽出装
置の構成を示すブロック図である。
【図21】口唇領域の色相の色度数分布を示すグラフで
ある。
【図22】口唇領域の彩度の色度数分布を示すグラフで
ある。
【図23】口唇領域を表す2次元の正規確率密度関数を
示すグラフである。
【図24】最外郭フレーム及び最外郭フレームの重心を
示す説明図である。
【図25】網が囲む領域の重心を示す説明図である。
【図26】形状エネルギーの定義に必要な各パラメータ
を示す説明図である。
【図27】形状エネルギーの定義を示す説明図である。
【図28】口唇領域確率差分画像の求め方を示す説明図
である。
【図29】図9に示す顔領域確率画像と図10に示す口
唇領域確率画像とにより算出された口唇領域確率差分画
像を表し、ディスプレー上に表示された中間調画像を示
す図面代用写真である。
【図30】口唇領域抽出用網が口唇領域を抽出する過程
を示すフローチャートである。
【図31】口唇領域抽出用網が口唇領域を抽出する過程
を示す模式図である。
【図32】本発明のその他の実施の形態にかかる領域抽
出装置の構成を示すブロック図である。
【図33】目領域抽出画像の求め方を示す説明図であ
る。
【図34】顔部品の大きさ及び位置関係に関するデータ
を測定したときのデータ測定箇所を示す説明図である。
【図35】バランスエネルギーの定義に必要な各パラメ
ータを示す説明図である。
【図36】(a)は口唇領域抽出用網、(b)は左目領
域抽出用網、及び(c)は右目領域抽出用網がそれぞれ
収縮する様子を示す説明図である。
【図37】口唇及び左右の目領域抽出用網が各領域を抽
出する過程を示すフローチャートである。
【図38】口唇及び左右の目領域抽出用網が各領域を抽
出する過程を示す模式図である。
【図39】本発明のその他の実施の形態にかかる、領域
抽出装置を利用した方向検出装置の構成を示すブロック
図である。
【図40】エピポーラ拘束の状態を示す説明図である。
【図41】2つの画像における顔部品のずれを算出する
過程を示す説明図である。
【図42】上記ずれの値から算出される顔部品の3次元
位置情報を示す説明図である。
【図43】上記方向検出装置の頭部検出動作を示すフロ
ーチャートである。
【図44】本発明のその他の実施の形態にかかる、領域
抽出装置を利用した方向検出装置の構成を示すブロック
図である。
【図45】(a)〜(f)は、視線データベースの一例
を示す説明図である。
【図46】上記方向検出装置の視線検出動作を示すフロ
ーチャートである。
【図47】従来の投影による抽出手法を示すものであ
り、(a)は図8に示す入力画像を水平方向に微分した
状態を示す説明図、(b)は(a)の画像を水平方向へ
投影したときのピクセル数をカウントしたグラフ、
(c)は(a)の画像を垂直方向へ投影したときのピク
セル数をカウントしたグラフをそれぞれ示す。
【図48】上記水平方向の微分処理を示す説明図であ
る。
【図49】従来のテンプレートによる抽出方法に用いら
れる入力画像とテンプレートとを示す説明図である。
【図50】5×5の大きさのテンプレートと入力画像と
の比較の状態を示す説明図である。
【図51】テンプレートと入力画像との比較の順序を示
す説明図である。
【図52】従来のDeformable template による抽出方法
を用いて目を抽出する様子を示す説明図である。
【図53】上記抽出方法におけるテンプレートの定義に
必要な各パラメータを示す説明図である。
【図54】従来の頭部方向の検出方法を示す説明図であ
る。
【図55】従来の他の頭部方向の検出方法を示す説明図
である。
【符号の説明】
1 入力装置(撮像手段) 5 領域確率計算装置(領域確率計算手段) 6 エネルギー計算装置(エネルギー計算手段) 7 確率密度関数格納部(確率密度関数格納手段) 9 顔領域抽出用網情報格納部(網情報格納手段) 21 重心計算装置(重心計算手段) 22 口唇領域抽出用網情報格納部(網情報格納手
段) 23 左目領域抽出用網情報格納部(網情報格納手
段) 24 右目領域抽出用網情報格納部(網情報格納手
段)

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】対象物を撮像してカラーデジタル画像とす
    る撮像手段と、 上記カラーデジタル画像において均一に同様の色を持つ
    所望領域を示す確率密度関数を予め記憶しておく確率密
    度関数格納手段と、 上記所望領域を構成する各画素の色に基づいて上記確率
    密度関数を計算することにより、各画素の色の確からし
    さを算出する領域確率計算手段と、 上記カラーデジタル画像上の任意の3つ以上の点を接続
    することにより形成され画像全体を覆うように設けられ
    る仮想的な網の情報を記憶しておく網情報格納手段と、 上記点の位置関係に基づいて定義される網の内部エネル
    ギーと、点が位置する画素の色の確からしさに基づいて
    定義される網の画像エネルギーとをそれぞれ計算するエ
    ネルギー計算手段とを有し、 1つの点を移動させたときの網の内部エネルギーと画像
    エネルギーとの合計値を、上記点を移動させる前の合計
    値と比較し、合計値が変化するときは網が収縮する方向
    へ点の移動を行い、合計値が変化しなくなった時点で点
    の移動を停止することを特徴とする領域抽出装置。
  2. 【請求項2】上記対象物は人物であり、上記所望領域は
    人物の顔の領域であることを特徴とする請求項1記載の
    画像処理装置。
  3. 【請求項3】確率密度関数格納手段には上記所望領域と
    異なる色を持つ部分領域を示す確率密度関数が予め記憶
    されると共に、網情報格納手段には上記所望領域を囲ん
    で停止した網の情報が部分領域を抽出するための部分領
    域抽出用網の初期値として記憶され、 上記所望領域内に部分領域が1つある場合に、領域確率
    計算手段が上記部分領域を構成する各画素の色に基づい
    て上記確率密度関数を計算することにより各画素の色の
    確からしさを算出して、エネルギー計算手段が部分領域
    抽出用網の内部エネルギー及び画像エネルギーと、部分
    領域に収束されるように定義された移動エネルギーとを
    それぞれ計算することにより、部分領域を抽出すること
    を特徴とする請求項1または2記載の領域抽出装置。
  4. 【請求項4】部分領域抽出用網の外周を形成する点から
    フレーム重心を求めると共に、画像の明るさを重みとし
    た部分領域抽出用網が囲む領域の重心を求める重心計算
    手段を有し、 上記移動エネルギーを、上記フレーム重心が領域の重心
    の方向に引き寄せられるように定義することを特徴とす
    る請求項3記載の領域抽出装置。
  5. 【請求項5】網の外周を形成する点からフレーム重心を
    求めると共に、画像の明るさを重みとして網が囲む領域
    の重心を求める重心計算手段を有し、 確率密度関数格納手段には口唇領域を示す確率密度関数
    が予め記憶されると共に、網情報格納手段には上記顔領
    域を囲んで停止した網の情報が口唇領域及び左右の目領
    域を抽出するための網の初期値として記憶され、 領域確率計算手段が、上記口唇領域を構成する各画素の
    色に基づいて上記確率密度関数を計算することにより各
    画素の色の確からしさを算出すると共に、上記左右の目
    領域を構成する各画素の色に基づいて顔領域あるいは口
    唇領域の確率密度関数を計算することにより各画素の色
    の確からしさを算出して、 エネルギー計算手段が、各領域の内部エネルギー及び画
    像エネルギーと、各々のフレーム重心が各々の領域重心
    の方向へ引き寄せられ、かつ、3つの領域の重心の位置
    関係が予め測定され記憶された口唇及び左右の目の位置
    関係と等しくなるように定義されたバランスエネルギー
    とを計算することにより、口唇及び左右の目領域を抽出
    することを特徴とする請求項2記載の領域抽出装置。
  6. 【請求項6】上記撮像手段が複数個設けられ、複数の撮
    像手段から同時に得られる複数の画像から口唇領域及び
    左右の目領域をそれぞれ抽出し、互いに比較することに
    より口唇及び目の3次元位置情報を導出することを特徴
    とする請求項5記載の領域抽出装置を用いた方向検出装
    置。
  7. 【請求項7】抽出された目の画像と、予め測定して視線
    方向の情報が付加されて記憶された目の画像とを比較す
    ることにより推定視線方向を算出し、さらに推定視線方
    向と検出された頭部の向きとを比較することにより真の
    視線方向を検出することを特徴とする請求項6記載の領
    域抽出装置を用いた方向検出装置。
JP26640795A 1995-09-19 1995-09-19 領域抽出装置及びそれを用いた方向検出装置 Expired - Fee Related JP3272584B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26640795A JP3272584B2 (ja) 1995-09-19 1995-09-19 領域抽出装置及びそれを用いた方向検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26640795A JP3272584B2 (ja) 1995-09-19 1995-09-19 領域抽出装置及びそれを用いた方向検出装置

Publications (2)

Publication Number Publication Date
JPH0981732A true JPH0981732A (ja) 1997-03-28
JP3272584B2 JP3272584B2 (ja) 2002-04-08

Family

ID=17430510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26640795A Expired - Fee Related JP3272584B2 (ja) 1995-09-19 1995-09-19 領域抽出装置及びそれを用いた方向検出装置

Country Status (1)

Country Link
JP (1) JP3272584B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000082147A (ja) * 1998-09-05 2000-03-21 Sharp Corp ヒトの顔を検出する方法および装置、ならびに観察者トラッキングディスプレイ
JP2000132693A (ja) * 1998-10-27 2000-05-12 Sony Corp 画像処理装置および方法、並びに提供媒体
KR100327485B1 (ko) * 1999-03-17 2002-03-13 윤종용 칼라 이미지로 부터의 얼굴 검출 장치 및 그 방법
JP2003271932A (ja) * 2002-03-14 2003-09-26 Nissan Motor Co Ltd 視線方向検出装置
JP2004289850A (ja) * 1997-11-27 2004-10-14 Matsushita Electric Ind Co Ltd 制御方法、機器制御装置、及びプログラム記録媒体
JP2007172224A (ja) * 2005-12-21 2007-07-05 Sony Corp 画像処理方法、その装置およびそのプログラム
JP2008148089A (ja) * 2006-12-12 2008-06-26 Nikon Corp 投影装置およびカメラ
JP4916548B2 (ja) * 2006-07-31 2012-04-11 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 画像のドミナントライン(dominantline)の確定及び使用
US8787629B2 (en) 2011-04-21 2014-07-22 Canon Kabushiki Kaisha Image processing based on line-of-sight of a person
JP2014164573A (ja) * 2013-02-26 2014-09-08 Nippon Telegr & Teleph Corp <Ntt> 画像処理装置、画像処理方法、及び画像処理プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2395780A (en) * 2002-11-29 2004-06-02 Sony Uk Ltd Face detection

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004289850A (ja) * 1997-11-27 2004-10-14 Matsushita Electric Ind Co Ltd 制御方法、機器制御装置、及びプログラム記録媒体
JP2000082147A (ja) * 1998-09-05 2000-03-21 Sharp Corp ヒトの顔を検出する方法および装置、ならびに観察者トラッキングディスプレイ
JP2000132693A (ja) * 1998-10-27 2000-05-12 Sony Corp 画像処理装置および方法、並びに提供媒体
KR100327485B1 (ko) * 1999-03-17 2002-03-13 윤종용 칼라 이미지로 부터의 얼굴 검출 장치 및 그 방법
JP2003271932A (ja) * 2002-03-14 2003-09-26 Nissan Motor Co Ltd 視線方向検出装置
JP2007172224A (ja) * 2005-12-21 2007-07-05 Sony Corp 画像処理方法、その装置およびそのプログラム
JP4916548B2 (ja) * 2006-07-31 2012-04-11 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 画像のドミナントライン(dominantline)の確定及び使用
JP2008148089A (ja) * 2006-12-12 2008-06-26 Nikon Corp 投影装置およびカメラ
US8787629B2 (en) 2011-04-21 2014-07-22 Canon Kabushiki Kaisha Image processing based on line-of-sight of a person
JP2014164573A (ja) * 2013-02-26 2014-09-08 Nippon Telegr & Teleph Corp <Ntt> 画像処理装置、画像処理方法、及び画像処理プログラム

Also Published As

Publication number Publication date
JP3272584B2 (ja) 2002-04-08

Similar Documents

Publication Publication Date Title
JP7482181B2 (ja) 画像処理装置、画像処理方法
WO2019128508A1 (zh) 图像处理方法、装置、存储介质及电子设备
WO2019128507A1 (zh) 图像处理方法、装置、存储介质及电子设备
CN103383723B (zh) 用于生物特征验证的电子欺骗检测的方法和系统
JP7020626B2 (ja) メイクアップ評価システム及びその動作方法
WO2020125499A1 (zh) 一种操作提示方法及眼镜
US7305106B2 (en) Object detection apparatus, object detection method and recording medium
CN107256377A (zh) 用于检测视频中的对象的方法、设备和系统
US20040218788A1 (en) Three-dimensional ear biometrics system and method
CN109919141A (zh) 一种基于骨架姿态的行人再识别方法
US20140254939A1 (en) Apparatus and method for outputting information on facial expression
JP2019009752A (ja) 画像処理装置
JP2000306095A (ja) 画像照合・検索システム
KR20140010541A (ko) 이미지 내 사용자의 시선 보정 방법, 기계로 읽을 수 있는 저장 매체 및 통신 단말
JP2005157906A (ja) 物体検出装置、物体検知方法、およびコンピュータプログラム
KR101943433B1 (ko) 몽타주 인식을 통한 실시간 수배자 검출 시스템
JP2015019162A (ja) 会議支援システム
JP3272584B2 (ja) 領域抽出装置及びそれを用いた方向検出装置
JP2015106252A (ja) 顔向き検出装置及び3次元計測装置
CN109274883A (zh) 姿态矫正方法、装置、终端及存储介质
CN114905512B (zh) 一种智能巡检机器人全景追踪及避障方法及系统
US20150016673A1 (en) Image processing apparatus, image processing method, and program
CN112464012A (zh) 可自动筛选照片的景区自动拍照系统及景区自动拍照方法
CN106156739B (zh) 一种基于脸部轮廓分析的证件照耳朵检测与提取方法
Yang et al. Development of a fast panoramic face mosaicking and recognition system

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees