JP2003187247A - 口唇形状特定プログラム,発話意図検出プログラム及び顔認識用画像生成プログラム - Google Patents

口唇形状特定プログラム,発話意図検出プログラム及び顔認識用画像生成プログラム

Info

Publication number
JP2003187247A
JP2003187247A JP2001381054A JP2001381054A JP2003187247A JP 2003187247 A JP2003187247 A JP 2003187247A JP 2001381054 A JP2001381054 A JP 2001381054A JP 2001381054 A JP2001381054 A JP 2001381054A JP 2003187247 A JP2003187247 A JP 2003187247A
Authority
JP
Japan
Prior art keywords
pixels
pixel
extracted
image
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001381054A
Other languages
English (en)
Inventor
Yasuyuki Nakada
康之 中田
Toru Kamata
徹 鎌田
Koichi Oikawa
浩一 及川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001381054A priority Critical patent/JP2003187247A/ja
Publication of JP2003187247A publication Critical patent/JP2003187247A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】顔を撮影して得られる画像の中から口唇部分の
みを抽出して口唇形状を特定できる口唇形状特定プログ
ラムを、提供する。 【解決手段】コンピュータシステム10は、マイク10
b,スピーカ10c,CCDカメラ10dに繋がれてお
り、本体10eのHDD17には、発話意図検出プログ
ラム21が格納されている。発話意図検出プログラム2
1がCPU11に読み込まれて実行される発話意図検出
処理は、CCDカメラ10dにより生成された画像か
ら、人間の肌色の色空間に含まれる画素を抽出させ、抽
出した画素を取り囲む顔領域内の画素から、口唇の色空
間に含まれる画素を抽出させ、抽出した画素のうち、最
も左右側にある画素(最左右端点)と、これら画素の中
間にある画素(中点)と、最も下側にある画素(最下端
点)とを抽出し、中点と最下端点との間の縦距離と最左
右端点間の横距離との縦横比率が所定値以上であるか否
かにより、口の開閉状態を検出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、顔を撮影して得ら
れる画像を用いて口唇の形状を特定する口唇形状特定プ
ログラムと、このような口唇形状特定プログラムを利用
した発話意図検出プログラム及び顔認識用画像生成プロ
グラムとに、関する。
【0002】
【従来の技術】近年、顔を撮影して得られる画像の中か
ら顔の部分だけを取り込む手法(顔認識)が、様々な分
野に広く活用されている。例えば人物認証が、その分野
のうちの1つである。人物認証では、利用者が何等かの
サービスを享受しようとする際、その利用者の顔部分画
像がコンピュータに取り込まれ、その顔部分画像が事前
に登録されている顔部分画像と比較され、その類似度に
よって利用者が登録ユーザであるか否かが判定され、登
録ユーザであると判定されれば利用者に当該サービスが
提供される。このような顔認識を利用した人物認証装置
は、多くの者によって開発されており、例えば特開平5-
225344号,特開平8-339445号,特開平9-251534号など、
多くの先行例が存在する。
【0003】これら従来の人物認証装置では、表色系の
色成分(H成分やQ成分)の上下限値を設定しておい
て、画像内の各画素からこれら上下限値の間に色成分値
が含まれる画素群を複数抽出したり(特開平5-225344号
など)、画像内の各画素から相対的に暗い(輝度値の低
い)画素群を複数抽出し(特開平9-251534号など)、抽
出した画素群が占める領域を夫々顔部品(眉,目,鼻,
口など)候補として設定し、これら各顔部品候補の位置
関係を標準テンプレートや辞書画像と比較することによ
り正しい顔部品の組み合わせを決定し、各顔部品若しく
は各顔部品のうちの特徴点の位置情報に基づいて顔部分
画像を元の画像から切り出すことにより、顔部分画像を
取得している。
【0004】一方で、顔認識を他の分野に使えないかと
いった要望もある。その分野のうちの1つに発話意図検
出がある。従来、コマンド入力手段としての音声認識機
能を備えるコンピュータシステムでは、システムがスピ
ーカーから発した合成音声と操作者が発した声とが同時
にマイクに入力されてしまう(この現象はダブルトーク
と称される)という問題があったため、操作者が発話し
た意図を検出する機能をこのコンピュータシステムに組
み込んで合成音声の出力(又はマイク入力)の開始又は
停止を制御できないかといった要請があった。そこで、
従来の人物認証装置と同様の顔部品抽出処理を用いるこ
とによって動画の各コマから顔部分画像を取得すること
により、顔認識を発話意図検出に利用できるのではない
かと考えられていた。
【0005】
【発明が解決しようとする課題】しかしながら、顔認識
を利用する分野の目的如何では、顔全体の認識は、必ず
しも必要ではない。例えば、上述したダブルトーク防止
では、口が開いているか閉じているかが分かれば十分で
ある。また、本発明者が鋭意研究したところによると、
口唇の形状の個人差を利用した個人識別も可能である。
その場合には、従来の顔部品抽出方法では余計な処理が
含まれるので、処理全体のレスポンスが悪化する。
【0006】本発明は、このような事情に鑑みてなされ
たものであり、その課題は、発話意図検出や個人識別な
ど様々な分野に応用可能なプログラムとして画像内から
口唇形状を特定する口唇形状特定プログラムと、この口
唇形状特定プログラムを利用した発話意図検出プログラ
ム及び顔認識用画像生成プログラムとを、提供すること
である。
【0007】
【課題を解決するための手段】上記の課題を解決するた
めに構成された本発明の口唇形状特定プログラムは、被
写体像を撮影するテレビカメラに繋がれたコンピュータ
に対し、前記テレビカメラから入力される画像データに
基づく画像の各画素から、肌色の色空間を定義する色成
分値の範囲にその色成分値が含まれる画素を、抽出さ
せ、抽出した画素により囲まれる領域の内側にある画素
から、口唇の色空間を定義する色成分値の範囲にその色
成分値が含まれる画素を、抽出させることを、特徴とす
る。
【0008】このように構成されると、テレビカメラに
より生成された画像のうち、口唇の色空間に含まれる画
素のみが、抽出される。これにより、画像1コマから複
数の顔部品を同時に抽出してから口唇部分を抽出するよ
りも、口唇部分の特定処理を高速で実行することができ
る。
【0009】なお、肌色又は口唇の色空間を定義する色
成分値の範囲を決定する上下限値は、輝度値の変化に対
して一定であっても良いし、輝度値の変化に対して変化
しても良い。後者の場合には、画像の各画素が肌色又は
口唇の色空間に含まれるか否かを判定する際に、各画素
の輝度値に基づいて色成分値の上下限値を決定する。こ
れにより、肌色及び口唇の色空間に含まれる画素をより
精度良く抽出することができる。
【0010】また、本発明の発話意図検出プログラム
は、被写体像を撮影するテレビカメラに繋がれたコンピ
ュータに対し、前記テレビカメラから入力される画像デ
ータに基づく画像の各画素から、肌色の色空間を定義す
る色成分値の範囲に色成分値が含まれる画素を、抽出さ
せ、抽出した画素により囲まれる領域の内側にある画素
から、口唇の色空間を定義する色成分値の範囲に色成分
値が含まれる画素を、抽出させ、抽出した画素のうち、
最も左側にある第1の画素,最も右側にある第2の画
素,これら第1及び第2の画素の中間位置にある第3の
画素,及び、最も下側にある第4の画素を、夫々抽出さ
せ、前記第1及び第2の画素の間の距離である横距離
と、前記第3及び第4の画素の間の距離である縦距離と
の縦横比率を算出させ、前記縦横比率が所定の値より大
きい場合には、口の開閉状態に対応するために利用され
る状態情報を開口状態に切り替えさせ、前記縦横比が所
定の値より小さい場合には、前記状態情報を閉口状態に
切り替えさせることを、特徴とする。
【0011】このように構成されると、テレビカメラに
より生成された画像のうち、口唇の色空間に含まれる画
素が抽出されるとともに、更に、口唇の左右端と左右端
の中点と下端とを特徴点として示す画素として、第1乃
至第4の画素が抽出される。そして、第1及び第2の画
素の間の横距離と第3及び第4の画素の間の縦距離との
縦横比率が所定の値以上であるか否かが判定され、縦横
比率が所定の値以上であった場合には、開口状態として
検出される。このように、画像から口唇部分のみを抽出
して口の開閉状態を検出しているので、画像1コマから
複数の顔部品を同時に抽出してから口唇部分を抽出する
よりも、発話意図検出処理を高速で実行することができ
る。また、動画の各コマにおける口の開閉状態を高速で
検出できる結果、ダブルトークを回避することもでき
る。
【0012】さらに、本発明の顔認識用画像生成プログ
ラムは、被写体像を撮影するテレビカメラに繋がれたコ
ンピュータに対し、前記テレビカメラから入力される画
像データに基づく画像の各画素から、肌色の色空間を定
義する色成分値の範囲にその色成分値が含まれる画素
を、抽出させ、抽出した画素により囲まれる領域の内側
にある画素から、口唇の色空間を定義する色成分値の範
囲にその色成分値が含まれる画素を、抽出させ、抽出し
た画素のうち、最も左側にある第1の画素,最も右側に
ある第2の画素,及び、これら第1及び第2の画素の中
間位置にある第3の画素を、夫々抽出させ、前記第3の
画素を挟んで左右に区分される領域のうちの左側の領域
において、前記第1の画素よりも上側にある画素のう
ち、所定の輝度値よりも小さい輝度値の画素を抽出さ
せ、抽出した画素のうち、最も下側にある画素を第5の
画素として抽出させ、前記第3の画素を挟んで左右に区
分される領域のうちの右側の領域において、前記第2の
画素よりも上側にある画素のうち、所定の輝度値よりも
小さい輝度値の画素を抽出させ、抽出した画素のうち、
最も下側にある画素を第6の画素として抽出させ、前記
第1及び第2の画素並びに前記第5及び第6の画素の前
記画像内での位置に基づいて、前記画像から顔部分画像
を切り出させることを、特徴とする。
【0013】このように構成されると、テレビカメラに
より生成された画像のうち、口唇の色空間に含まれる画
素が抽出されるとともに、更に、口唇の左右端を特徴点
として示す画素として第1及び第2の画素が抽出され、
左右眼目の下端を特徴点として示す画素として第5及び
第6の画素が抽出される。そして、第1及び第2の画素
並びに第5及び第6の画素の画像内での位置に基づい
て、画像から顔部分画像が切り出される。これにより切
り出された顔部分画像は、例えば人物認証における登録
ユーザの顔部分画像との比較対象として、利用すること
ができる。
【0014】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図面に基づいて説明する。なお、本実施形態は、本
発明の口唇形状特定プログラムを、発話意図検出及び顔
認識に適用したものである。
【0015】
【実施形態1】第1の実施形態であるコンピュータシス
テムの全体図を、図1に示す。このコンピュータシステ
ム10は、各種画面を表示するためのディスプレイ10
a,音声を電気的な音声信号に変換するマイク10b,
各種音声を出力するためのスピーカ10c,被写体像を
撮像してアナログビデオ信号に変換するCCDカメラ1
0d,及び、これらに繋がれた本体10eを、備える。
なお、本体10eは、キーボードやマウスなどの入力装
置に繋がれていても良い。
【0016】この本体10eの内部回路の概略構成を、
図2に示す。本体10eは、CPU11,RAM12,
サウンド制御回路13,ビデオ制御回路14,FDD1
5,CD−ROMドライブ16,及びHDD17等のハ
ードウエアを、主要な構成として内部に有している。
【0017】CPU11は、各ハードウエア12〜17
を含むデバイス全体を統合的に制御する中央処理装置で
ある。RAM12は、CPU11が読み出した各種のプ
ログラムをキャッシュするとともに、このCPU11に
よる作業領域が展開されるランダムアクセスメモリであ
る。
【0018】サウンド制御回路13は、マイク10bか
ら入力された音声信号をA/D変換してデジタル音声デ
ータとして取り込んだりデジタル合成音声データをD/
A変換して音声信号をスピーカ10cに出力する回路で
ある。ビデオ制御回路14は、CCDカメラ10dから
入力されたアナログビデオ信号を一定の時間間隔毎(例
えば33ms毎)にサンプリングし、1コマ毎のデータ
量を圧縮してなるデジタル動画像データを生成する回路
である。
【0019】FDD15及びCD−ROMドライブ16
には、各種のプログラムやデータ、若しくはそのバージ
ョンアップ版をインストールする際に、新たなプログラ
ムが格納されたコンピュータ可読媒体であるフレキシブ
ルディスクFDやCD−ROMディスクCDが夫々セッ
トされ、これらフレキシブルディスクFDやCD−RO
MディスクCDからプログラムやデータが読み出され
る。このようにして読み出されたプログラムやデータ
は、HDD17等の記憶装置にインストールされる。
【0020】HDD17には、種々の機能を実現するた
めにCPU11が実行するアプリケーションプログラム
や、CPU11が実行する処理において利用されるデー
タや、アプリケーションプログラムの実行管理やネット
ワーク管理などのシステム管理をCPU11に行わせる
ためのOS(Operating System)プログラムが、格納さ
れている。
【0021】なお、このHDD17に格納されるアプリ
ケーションプログラムには、発話意図検出プログラム2
1が、含まれている。この発話意図検出プログラム21
は、CPU11に対し、1画像を構成する画素群から、
人肌の色空間を定義する色成分値の範囲にその色成分値
が含まれる画素群を抽出させ、抽出した画素群が占める
領域の輪郭を顔輪郭として決定させ、決定した顔輪郭内
の画素群から、口唇の色空間を定義する色成分値の範囲
にその色成分値が含まれる画素群を抽出させ、抽出した
画素群が占める領域の左右幅と上下幅(後述するように
正確にはその略半分)との縦横比率に応じてマイク10
b入力及びスピーカ10c出力の開始又は停止を制御さ
せるプログラムである。
【0022】上述したような構成を有するコンピュータ
システム10では、所定の指示入力がなされると、発話
意図検出プログラム21がCPU11によって読み込ま
れ、発話意図検出処理の実行が開始される。この発話意
図検出処理の内容を、図3に示す。
【0023】発話意図検出処理の開始後、最初のS10
1では、CPU11は、ビデオ制御回路14により生成
された動画像データのうち、1コマ目の画像データを、
読み込む。なお、読み込んだ画像データがm×nの二次元
格子画素からなる画像のデータであるとし、i,jが、 i=1,2,3,…,m j=1,2,3,…,n であるとすると、この画像の座標(i,j)の画素は、赤
(R)成分のデジタル階調値R(i,j),緑(G)成分のデ
ジタル階調値G(i,j),又は、青(B)成分のデジタル階
調値B(i,j)により、表現される。
【0024】次のS102では、CPU11は、肌色領
域抽出処理サブルーチンを実行する。この肌色領域抽出
処理サブルーチンは、1画像の中から人間の顔の肌の部
分にあたる領域を抽出し、その領域の輪郭に関するデー
タを生成する処理である。この肌色領域抽出処理サブル
ーチンの内容を、図4に示す。
【0025】肌色領域抽出処理サブルーチンにおける最
初のS121では、CPU11は、S101において読
み込んだ画像データを構成する全画素のRGB成分(デ
ジタル階調)値に基づいて、全画素についての輝度(デ
ジタル階調)値を、夫々算出する。具体的には、CPU
11は、次の式、 Y(i,j)=0.299×R(i,j)+0.587×G(i,j)+0.114×B(i,j) を用いて、全画素についての輝度値Y(i,j)を算出する。
【0026】次のS122では、CPU11は、全画素
について夫々算出した輝度値Y(i,j)のデータを、HDD
17内に格納する。
【0027】次のS123では、CPU11は、S10
1において読み込んだ全画素についてのRGB成分値に
基づいて、全画素についてのHSV(Hue:色相,Satura
tion:彩度,Value:明度)表色系のH成分値を算出す
る。具体的には、CPU11は、以下のようにして全画
素のH成分値を算出する。
【0028】即ち、座標(i,j)の位置にある3つのRG
B画素の中で最大及び最小のデジタル階調値MX(i,j),M
N(i,j)を、 MX(i,j)=max[R(i,j),G(i,j),B(i,j)] MN(i,j)=min[R(i,j),G(i,j),B(i,j)] とし、更に、 a=[MX(i,j)-R(i,j)]/[MX(i,j)-MN(i,j)] b=[MX(i,j)-G(i,j)]/[MX(i,j)-MN(i,j)] c=[MX(i,j)-B(i,j)]/[MX(i,j)-MN(i,j)] とすると、座標(i,j)の画素のH成分値H(i,j)は、 MX(i,j)-MN(i,j)=0の場合は、H(i,j)=0 MX(i,j)=R(i,j)の場合は、 H(i,j)=60×(c-b) MX(i,j)=G(i,j)の場合は、 H(i,j)=60×(2+a-c) MX(i,j)=B(i,j)の場合は、 H(i,j)=60×(4+b-a) と求められる。
【0029】そして、CPU11は、このようにして全
画素についてH成分値H(i,j)を算出した後、処理をS1
24に進める。
【0030】S124では、CPU11は、全画素につ
いて算出したH成分値H(i,j)のデータを、HDD17内
に格納する。
【0031】次のS125では、CPU11は、S12
1及びS123において算出したH成分値H(i,j)及び輝
度値Y(i,j)に基づいて、全画素の中から、人間の肌の色
を示すH成分の範囲の上限値と下限値との間にH成分値
が存在する画素を、抽出する。なお、このS125で
は、輝度値を変数とする閾値関数を利用して、各輝度値
でのH成分の上下限値を決定している。この閾値関数
は、輝度を横軸に取りH成分を縦軸に取った二次元座標
に、人間の肌の色の各輝度値でのH成分値を実際にプロ
ットすることにより、獲得されたものである。図5に、
人間の肌の色の各輝度値でのH成分値がプロットされた
グラフを示す。図5に示すように、人間の肌の色のH成
分の上下限値は、輝度値の変化に対して一定ではなく、
増減している。従って、人間の肌の色を示すH成分の範
囲の上下限値が輝度値の変化に対して一定であるとする
よりも、肌色を示す画素をより正確に抽出できる。そし
て、CPU11は、肌色の色空間にH成分値が含まれる
画素を抽出した後、処理をS126に進める。
【0032】S126では、CPU11は、S125に
おいて抽出された画素により形成される幾つかの画素塊
(互いに接触している画素の集合)のうち、占める面積
が最大である画素塊を抽出する。なお、このS126で
は、占める面積が最大である画素塊を幾つかの画素塊の
中から抽出するために、画像解析において行われている
ラベリング処理が、実行される。このラベリング処理に
ついて、図6(a)〜(c)に基づいて簡単に説明する。
【0033】先ず、二値化画像(図6(a))があると仮
定して、その二値化画像の第1行目の左から右へ順に走
査し、「1」値が最初に現れたらその画素にラベルAを
与え、以後「1」値が続く場合にはそれらの画素にラベ
ルAを与える。次に、同一行内で「1」値が途切れ、再
び「1」値が現れたらその画素にラベルBを与え、以後
「1」値が続く場合にはそれらの画素にラベルBを与え
る。このような操作を行の終わりまで続ける。また、第
二行目以後を走査する場合には、下記の条件(1)〜(3)の
通りにする。
【0034】即ち、走査中に「1」値の画素が現れた際
に、(1)その画素が、ラベルが与えられている(前行
の)画素と全く隣接していないときには、当該画素に新
しいラベルを与え、(2)その画素が、ラベルが与えられ
ている1つ又は複数の(前行の)画素と隣接していて、
その隣接する前行の画素(群)には一種類のラベルのみ
が与えられているときには、当該画素には、前行の画素
(群)と同じラベルを与え、(3)その画素が、ラベルが
与えられている複数の(前行の)画素と隣接していて、
その隣接する前行の画素群には二種類以上のラベルが与
えられているときには、これらのラベル同士は同じラベ
ルであるべきものとして記憶し、当該画素には、前行の
画素群に与えられたラベルのうちの一番若いラベルを与
える。そして、上記の操作を最後の行まで繰り返す(図
6(b))。
【0035】さらに、再度、二値化画像を左上から右下
まで順に走査し、上記の条件(3)で記憶しておいたラベ
ル同士を若い方のラベル(例えば、ラベルAとラベルB
ならラベルA)に置き換える(図6(c))。このように
して、互いに接触している「1」値の画素塊に、同じラ
ベル(A,C,D,…)を与える。最後に、同じラベル
に属する画素数をラベル毎に計数し、最大画素数をもつ
ラベルに含まれる画素の集まりを、占める面積が最大で
ある画素塊として、認識する。
【0036】そして、CPU11は、このようなラベリ
ング処理を実行することにより、占める面積が最大であ
る画素塊を抽出し、その後、処理をS127に進める。
【0037】S127では、CPU11は、S126に
おいて抽出した画素塊の最も外周縁にある画素の位置デ
ータを、顔輪郭情報として決定する。
【0038】次のS128では、CPU11は、S12
7において決定された顔輪郭情報をHDD17内に格納
した後、肌色領域抽出処理サブルーチンを終了し、図3
のメインルーチンにおけるS103の処理に進む。
【0039】S103では、CPU11は、色ヒストグ
ラム重心差エッヂ検出処理サブルーチンを実行する。こ
の色ヒストグラム重心差エッヂ検出処理サブルーチン
は、1画像の中において口唇が占める領域のうちの縦方
向の範囲を検出する処理である。この色ヒストグラム重
心差エッヂ検出処理サブルーチンの内容を、図7に示
す。
【0040】色ヒストグラム重心差エッヂ検出処理サブ
ルーチンにおける最初のS131では、CPU11は、
全画素のH成分値データ(図4のS124参照)と顔輪
郭情報(図4のS128参照)とを、HDD17内から
読み出す。
【0041】次のS132では、CPU11は、顔輪郭
情報に基づいて、顔輪郭内部に属する画素群のH成分値
H(i,j)を抽出する。なお、この顔輪郭により囲まれる領
域を、以下、顔領域という。
【0042】次のS133では、CPU11は、図8に
示すように、顔領域を格子状に区分し、各格子(矩形領
域)内のH成分値の重心値を算出する。なお、1つの矩
形領域のH成分値の重心値gは、以下のように求められ
る。
【0043】即ち、H成分が採り得る値(例えばH成分
が−40から+40までの値を取り得るとする)を幾つ
かの区間に等間隔に区分し(例えば10ずつ8つの区間
に区分する)、1つの矩形領域に含まれる各画素を、夫
々、そのH成分値が含まれる区間に振り分け、区間内に
含まれるH成分値を持つ画素が幾つあるかを、各区間毎
に計数する(各区間毎の画素数を棒グラフで表したもの
がヒストグラムである)。このとき、i番目の区間の画
素数をni個とし、i番目の区間のH成分値をHiとする
と、重心値gは、Σ(ni×Hi)/Σniにより求ま
る。
【0044】そして、CPU11は、このような処理を
各矩形領域について行って夫々の重心値gを算出した
後、処理をS134に進める。
【0045】S134では、CPU11は、ある矩形領
域とその下の矩形領域との重心値差を、全ての上下部矩
形領域の組み合わせについて、算出する。なお、以下、
この矩形領域の組み合わせにおいては、上側にある矩形
領域を上部矩形領域といい、下側のを下部矩形領域とい
う。
【0046】次のS135では、CPU11は、所定の
閾値よりも大きい重心値差を有する上下部矩形領域の組
み合わせを、抽出する。
【0047】次のS136では、CPU11は、S13
5において抽出した上下部矩形領域の組み合わせの中か
ら、一方の矩形領域の重心値が肌の色空間(図5参照)
に含まれ、もう一方の矩形領域の重心値が唇の色空間
(図9参照)に含まれる上下部矩形領域の組み合わせ
を、抽出する。
【0048】次のS137では、CPU11は、S13
6において抽出した上下部矩形領域の組み合わせの中か
ら、局所最大となる組み合わせを、抽出する。なお、局
所最大とは、左からx番目で上からy番目の矩形領域
(x,y)とその下の矩形領域との重心差をgdiff(x,y)とす
ると、以下の条件、 gdiff(x,y)>gdiff(x-1,y) gdiff(x,y)>gdiff(x+1,y) gdiff(x,y)>gdiff(x,y-1) gdiff(x,y)>gdiff(x,y+1) を満たすもののことをいう。
【0049】次のS138では、CPU11は、S13
7において抽出した上下部矩形領域の組み合わせに基づ
いて、顔領域の二値化画像を生成する。具体的には、上
部矩形領域の重心値が肌の色空間内にあって下部矩形領
域の重心値が口唇の色空間内にある場合(図8の(b)の
組み合わせ)には、上部矩形領域内の画素の全てを
「0」値(黒)にするとともに、下部矩形領域内の画素
の全てを「1」値(白)にする。また、これとは逆に、
上部矩形領域の重心値が口唇の色空間内にあって下部矩
形領域の重心値が肌の色空間内にある場合(図8の(c)
の組み合わせ)には、上部矩形領域内の画素の全てを
「1」値にするとともに、下部矩形領域内の画素の全て
を「0」値にする。更に、残りの矩形領域の画素は、全
て「0」値にする。このようにして、CPU11は、顔
領域の二値化画像(以下、顔二値化画像という)を生成
する。なお、図10に、1画像から顔領域に含まれる部
分を抜き出した画像(顔画像)に対して上記二値化画像
を重ね合わせた例を、示している。
【0050】次のS139では、CPU11は、顔二値
化画像の画像データをHDD17内に格納した後、色ヒ
ストグラム重心差エッヂ検出処理サブルーチンを終了
し、図3のメインルーチンにおけるS104の処理に進
む。
【0051】S104では、CPU11は、明暗補正処
理サブルーチンを実行する。この明暗補正処理サブルー
チンは、撮影時の照明の影響により画像内の顔の明るさ
が各コマ毎に変化する場合でもS105以後の処理がそ
の明暗に左右されないようにするために、顔領域内の画
素の輝度の平均値が常に一定値(これを以下では正規化
輝度値Ynormとして扱う)となるように補正する処理で
ある。この明暗補正処理サブルーチンの内容を、図11
に示す。
【0052】明暗補正処理サブルーチンにおける最初の
S141では、CPU11は、全画素の輝度値データ
(図4のS122参照)と顔輪郭情報(図4のS128
参照)とを、HDD17内から読み出す。
【0053】次のS142では、CPU11は、顔輪郭
情報に基づいて、顔輪郭内部に属する(肌色条件を満た
す)画素の輝度値Y(i,j)を抽出する。
【0054】次のS143では、CPU11は、S14
2において抽出した輝度値Y(i,j)の平均値Yavgを算出す
る。
【0055】次のS144では、CPU11は、S14
2において算出した平均値Yavgと上述した正規化輝度値
Ynormとの差(Yavg-Ynorm)を算出する。
【0056】次のS145では、CPU11は、顔領域
に属する各画素の輝度値Y(i,j)から、S144において
算出した差(Yavg-Ynorm)を、差し引くことにより、各画
素の補正輝度値Yadjust(i,j)を算出する。
【0057】次のS146では、CPU11は、顔領域
の画素の補正輝度値Yadjust(i,j)データをHDD17内
に格納した後、明暗補正処理サブルーチンを終了し、図
3のメインルーチンにおけるS105の処理に進む。
【0058】S105では、CPU11は、白黒濃淡エ
ッヂ検出処理サブルーチンを実行する。この白黒濃淡エ
ッヂ検出処理サブルーチンは、1画像の中において口唇
が占める領域のうちの横方向の範囲を検出する処理であ
る。この白黒濃淡エッヂ検出処理サブルーチンの内容
を、図12に示す。
【0059】白黒濃淡エッヂ検出処理サブルーチンにお
ける最初のS151では、CPU11は、顔二値化画像
の画像データ(図7のS139参照)を、HDD17内
から読み出す。
【0060】次のS152では、CPU11は、二値化
画像において「1」値の画素が存在する上下方向の範囲
を、探索範囲として設定する。
【0061】次のS153では、CPU11は、顔領域
の補正輝度値データ(図11のS146参照)を、HD
D17内から読み出す。
【0062】次のS154では、CPU11は、顔領域
のうち、探索範囲内を格子状に区分し、各格子(矩形領
域)内の補正輝度値Yadjust(i,j)の平均値を算出する。
【0063】次のS155では、CPU11は、ある矩
形領域の平均値とその下の矩形領域の平均値との差を、
探索範囲内における全ての組み合わせについて、算出す
る。なお、この矩形領域の組み合わせにおいては、S1
34と同様に、上側の矩形領域を上部矩形領域といい、
下側のを下部矩形領域という。
【0064】次のS156では、CPU11は、所定の
閾値よりも大きい平均値の差を有する上下部矩形領域の
組み合わせを、抽出する。
【0065】次のS157では、CPU11は、S15
6において抽出した上下部矩形領域の組み合わせの中か
ら、局所最大となる組み合わせを、抽出する。なお、S
137において説明したのと同様に、局所最大とは、左
からx番目で上からy番目の矩形領域(x,y)の平均値と
その下の矩形領域の平均値との差をYdiff(x,y)とする
と、以下の条件、 Ydiff(x,y)>Ydiff(x-1,y) Ydiff(x,y)>Ydiff(x+1,y) Ydiff(x,y)>Ydiff(x,y-1) Ydiff(x,y)>Ydiff(x,y+1) を満たすもののことをいう。
【0066】次のS158では、CPU11は、S15
7において抽出した上下部矩形領域の組み合わせに基づ
いて、顔領域のうちの探索範囲の部分だけの二値化画像
を生成する。具体的には、上下部矩形領域のうち、平均
値が小さい方の矩形領域の画素を全て「0」値(黒)に
するとともに、平均値が大きい方の矩形領域の画素を全
て「1」値(白)にする。このようにして、CPU11
は、顔領域のうちの探索範囲の二値化画像(以下、口唇
二値化画像という)を生成する。なお、図13に、顔画
像に対して上記口唇二値化画像を重ね合わせた例を、示
している。
【0067】次のS159では、CPU11は、口唇二
値化画像の画像データをHDD17内に格納した後、白
黒濃淡エッジ検出処理サブルーチンを終了し、図3のメ
インルーチンにおけるS106の処理に進む。
【0068】S106では、CPU11は、口端点検出
処理サブルーチンを実行する。この口端点検出処理サブ
ルーチンは、口唇二値化画像から、口唇の最左右端点と
中心点と最下端点とを検出する処理である。この口端点
検出処理サブルーチンの内容を、図14に示す。
【0069】口端点検出処理サブルーチンにおける最初
のS161では、CPU11は、口唇二値化画像の画像
データ(図12のS159参照)を読み出す。
【0070】次のS162では、CPU11は、口唇二
値化画像内における「1」値の画素塊のうち、占める面
積が最大である画素塊を、抽出する。このS162で
は、S126において説明したのと同様に、ラベリング
処理が、実行される。
【0071】次のS163では、CPU11は、S16
2において抽出した画素塊に含まれる画素のうち、最も
左側にある画素(第1の画素に相当),最も右側にある
画素(第2の画素に相当),及び、最も下側にある画素
(第4の画素に相当)を、夫々、「最左端点」,「最右
端点」,及び「最下端点」として、決定する。また、C
PU11は、最左端点と最右端点との間の中心にある画
素(第3の画素に相当)を「中点」として決定する。な
お、図15に、上記最左右端点と最下端点と中点とを顔
画像上に記した例を、示している。
【0072】次のS164では、CPU11は、最左右
端点と最下端点と中点の位置データをHDD17内に格
納した後、口端点検出処理サブルーチンを終了し、図3
のメインルーチンにおけるS107の処理に進む。
【0073】S107では、CPU11は、口唇の最左
右端点と最下端点と中点の位置データを、HDD17内
から読み出す。
【0074】次のS108では、CPU11は、最左右
端点の間の距離Dhを算出する。なお、以下、この距離
を、横距離という。
【0075】次のS109では、CPU11は、中点と
最下端点の距離Dvを算出する。なお、以下、この距離
を、縦距離という。
【0076】次のS110では、CPU11は、縦距離
Dvと横距離Dhとの比Iaspect=Dv/Dhを、算出する。な
お、以下、この比を、縦横比という。
【0077】次のS111では、CPU11は、縦横比
Iaspectが開口条件を満たすか否か、即ち、所定の閾値I
thよりも大きいか否かをチェックする。そして、縦横比
Ias pectが開口条件を満たしていなかった(Iaspect<I
th)場合(S111:NO)、CPU11は、処理をS
112に進める。
【0078】S112では、CPU11は、マイク10
bからの音声信号のデジタル音声データへの変換を停止
させるマイク入力停止処理を、実行する。なお、このマ
イク入力停止処理の具体的な説明は省略するが、その概
略は、この時点でデジタル音声データへの変換を停止し
ている状態であった場合には、その停止状態を継続し、
逆にこの時点でその変換を実行している状態であった場
合には、その実行状態を停止状態に切り替える。
【0079】次のS113では、CPU11は、デジタ
ル合成音声データのスピーカ10c出力用の合成音声信
号への変換を実行させる合成音声出力開始処理を、実行
する。なお、この合成音声出力開始処理の具体的な説明
は省略するが、その概要は、この時点でアナログ信号へ
の変換を実行している状態であった場合には、その実行
状態を継続し、逆にこの時点でその変換を停止している
状態であった場合には、その停止状態を実行状態に切り
替える。
【0080】次のS114では、CPU11は、次コマ
の画像データを読み込み、S102の処理に進む。
【0081】一方、S111において、縦横比Iaspect
が開口条件を満たしていた(Iaspect≧Ith)場合(S1
11:YES)、CPU11は、処理をS115に進め
る。
【0082】S115では、CPU11は、デジタル合
成音声データをスピーカ10c出力用の合成音声信号に
変換不可能な状態に切り替える合成音声出力停止処理
を、実行する。なお、この合成音声出力停止処理は、S
113において説明した合成音声出力開始処理とは逆に
機能し、合成音声信号への変換を停止状態にする。
【0083】次のS116では、CPU11は、マイク
10bからの音声信号のデジタル音声データへの変換を
開始するマイク入力開始処理を、実行する。なお、この
マイク入力開始処理は、S112において説明したマイ
ク入力停止処理とは逆に機能し、デジタル音声データへ
の変換を実効状態にする。そして、CPU11は、この
マイク入力開始処理を実行した後、S114の処理に進
み、次コマの画像データを読み込む。
【0084】以上に示した発話意図検出処理により、動
画の1コマ毎に、顔の輪郭が検出され(S102)、口
唇の輪郭が検出され(S103〜S105)、口唇の最
左右端点と最下端点と中点とが検出され(S106)、
縦横比Iaspectが開口条件を満たしているかがチェック
される(S111)。
【0085】そして、何れかのコマにおいて、縦横比I
aspectが開口条件を満たしていなければ(S111:N
O)、発話意図がない閉口状態として、マイク10b入
力を実行不能にするとともにスピーカ10c出力を実行
可能にする処理(S112,113)が、実行される。
一方、縦横比Iaspectが開口条件を満たしていれば(S
111:YES)、発話意図のある開口状態として、ス
ピーカ10c出力を実行不能にするとともにマイク10
b入力を実行可能にする処理(S115,S116)
が、実行される。
【0086】上述したように、第1の実施形態のコンピ
ュータシステム10によれば、動画の1コマ1コマか
ら、眉や目や鼻などの複数の顔部品を一度に抽出するこ
となく、口唇部分のみを抽出するので、発話意図検出の
際の処理速度を向上させることができる。また、発話意
図を検出した際には、スピーカ10c出力が停止される
とともにマイク10b入力が開始されるので、ダブルト
ークが回避される。
【0087】
【実施形態2】第2の実施形態のコンピュータシステム
は、図16に示すように、第1の実施形態のコンピュー
タシステムと同じハードウエアを、備えている。但し、
HDD17内には、顔認識プログラム22が、格納され
ている。
【0088】この顔認識プログラム22は、CPU11
に対し、1画像を構成する画素群から、肌の色空間を定
義する色成分値の範囲にその色成分値が含まれる画素群
を抽出させ、抽出した画素群が占める領域の輪郭を顔輪
郭として決定させ、決定した顔輪郭内の画素群から、口
唇の色空間を定義する色成分値の範囲にその色成分値が
含まれる画素群を抽出させ、その口唇の画素群が占める
領域の最左右端点を検出させ、その最左右端点に基づい
て左右眼を示す画素群を探索させ、探索した画素群が占
める領域(眼領域)の最下端点を検出させ、口唇の最左
右端点と左右眼領域の最下端点の4点に基づいて顔認識
用の顔部分画像を生成させ、顔認識の手法として一般的
な固有空間法に基づいて顔部分画像の固有画像への射影
ベクトルを算出させるプログラムである。
【0089】上述したような構成を有するコンピュータ
システムでは、所定の指示入力がなされると、顔認識プ
ログラム22がCPU11によって読み込まれ、顔認識
処理の実行が開始される。この顔認識処理の内容を、図
17に示す。
【0090】顔認識処理の開始後、最初のS201で
は、CPU11は、ビデオ制御回路14により生成され
たデジタル動画像データのうちの1コマの画像データ
を、読み込む。
【0091】次のS202からS206においては、C
PU11は、図4の肌色領域抽出処理サブルーチン,図
7の色ヒストグラム重心差エッヂ検出処理サブルーチ
ン,図11の明暗補正処理サブルーチン,図12の白黒
濃淡エッヂ検出処理サブルーチン,及び、図14の口端
点検出処理サブルーチンを、この順に実行する。
【0092】次のS207では、CPU11は、輝度閾
値算出処理サブルーチンを実行する。この輝度閾値算出
処理サブルーチンは、画像の中から左右眼による暗部を
抽出するための輝度閾値を算出する処理である。この輝
度閾値算出処理サブルーチンの内容を、図18に示す。
【0093】輝度閾値算出処理サブルーチンにおける最
初のS211では、CPU11は、補正輝度値データ
(図11のS146参照)と、口唇の最左右端点及び中
点の位置データ(図14のS164参照)とを、読み出
す。
【0094】次のS212では、CPU11は、画像の
縦方向と平行で最左右端点を通る直線LsLeft,LsRight
上にある画素列の補正輝度値を、抽出する。なお、図1
9に、これら画素列の補正輝度値をプロットしたグラフ
の一例を示す。このグラフに示された輝度プロファイル
曲線には、3箇所だけ輝度の低い領域が、形成されてい
る。これら輝度の低い領域は、夫々、眉と眼と口唇の部
分に当たり、その他の輝度の高い領域は、額や頬に当た
る。また、抽出された画素列の中では、眼の部分に当た
る画素の輝度値が、眉や口唇のそれに較べると一番低
い。
【0095】次のS213では、CPU11は、両方の
画素列の補正輝度値の平均値Y'Lavg,Y'Ravgを算出し、
最小値Y'Lmin,Y'Rminを決定する。
【0096】次のS214では、CPU11は、両方の
画素列の輝度閾値Y'Lth,Y'Rthを、算出する。なお、輝
度閾値Y'Lth,Y'Rthは、平均値と最小値との和を半分に
する([(Y'Lavg+Y'Lmin)/2],[(Y'Ravg+Y'Rmin)/2])こ
とにより、算出される。
【0097】次のS215では、CPU11は、両方の
画素列の輝度閾値Y'Lth,Y'RthデータをHDD17内に
格納した後、輝度閾値算出処理サブルーチンを終了し、
図17のメインルーチンにおけるS208に進む。
【0098】S208では、CPU11は、目領域検出
処理サブルーチンを実行する。この目領域検出処理サブ
ルーチンは、顔領域内の画素の中から目領域を示す画素
を抽出する処理である。この目領域検出処理サブルーチ
ンの内容を、図20に示す。
【0099】目領域検出処理サブルーチンにおける最初
のS221では、CPU11は、補正輝度値データ(図
11のS146参照)と、輝度閾値データ(図18のS
215参照)と、口唇の最左右端点及び中点の位置デー
タ(図14のS164参照)とを、読み出す。
【0100】次のS222では、CPU11は、顔領域
を上下左右に4等分したときの左上の領域の画素の中か
ら、輝度閾値Y'Lthよりも補正輝度値Yadjust(i,j)の小
さい画素を、また、右上の領域の画素の中から、輝度閾
値Y'Rthよりも補正輝度値Yad just(i,j)の小さい画素
を、夫々、抽出する。
【0101】次のS223では、CPU11は、S22
2において抽出した画素を「1」値(白)とし、残りの
画素を「0」値(黒)とした二値化画像を、生成する。
【0102】次のS224では、CPU11は、S22
3において生成した二値化画像において、所定の大きさ
以下の画素塊を、「0」値に変換する(変換後の二値化
画像を、以下、目二値化画像という)。なお、このS2
24では、画素塊を抽出する際に、S133において説
明したラベリング処理が、実行される。
【0103】次のS225では、CPU11は、口唇の
最左右端点を通る直線LsLeft,LsRi ghtを基線とし、こ
の基線と平行な幾本かの平行線を、目領域探索線として
目二値化画像上に設定する。なお、図21に、顔画像に
目二値化画像を重ね合わせて目領域探索線を描画した状
態を示す。
【0104】次のS226では、CPU11は、目領域
探索線と接触又は交差する「1」値画素塊を、目領域候
補として残し、その他の「1」値画素塊を、目二値化画
像から削除する。例えば、図21の例で言えば、顔画像
の右側にある2つの画素塊(白い部分)が、削除対象と
なり、何れかの目領域探索線に掛かっている3つの画素
塊(白い部分)が、目領域候補として残される。
【0105】次のS227では、CPU11は、目領域
候補の画素塊の中で、最下端点の画素の位置を認識す
る。なお、図21の例には、各目領域候補の最下端点
が、黒点により示されている。
【0106】次のS228では、CPU11は、口唇の
最左右端点の垂直二等分線Lsymを、設定する。
【0107】次のS229では、CPU11は、S22
8において設定された垂直二等分線の左側にある目領域
候補の最下端点を認識し、垂直二等分線を挟んでこの最
下端点とは反対側の対称な位置に、仮想点を設定する。
【0108】次のS230では、CPU11は、S22
9において設定した仮想点を中心とし、所定の半径を有
する仮想円を設定する。
【0109】次のS231では、CPU11は、S23
0において設定した仮想円内に最下点が含まれる目領域
候補を残し、その他の目領域候補を削除する。また、こ
のS231の処理では、仮想円内に2つ以上の最下点が
あった場合には、口唇の最左右端点に近い方の目領域候
補を残し、残りの目領域候補を削除する処理も、行う。
これらの処理により眉による画素塊が除外される。以
下、抽出された両方の目領域候補を「左右目領域」とい
う。なお、図22に、口唇の最左右端点と左右目領域の
最下端点(第5及び第6の画素に相当)とを顔画像上に
重ね合わせた状態を示す。
【0110】次のS232では、CPU11は、左右目
領域の最下端点の位置データをHDD17内に格納した
後、目領域検出処理サブルーチンを終了し、図17のメ
インルーチンにおけるS209に進む。
【0111】S209では、CPU11は、顔部分画像
抽出処理サブルーチンを実行する。この顔部分画像抽出
処理サブルーチンは、S201において読み込んだ画像
から目鼻口を含む画像を切り出す処理である。この顔部
分画像抽出処理サブルーチンの内容を、図23に示す。
【0112】顔部分画像抽出処理サブルーチンにおける
最初のS241では、CPU11は、口唇の最左右端点
と中点の位置データ(図14のS164参照)と、左右
目領域の最下端点の位置データ(図20のS232参
照)とを、読み出す。なお、以下では、口唇の最左右端
点の座標を(PLeftMouthX,PLeftMouthY)とし、口唇の最
右端点の座標を(PRightMouthX,PRightMouthY)とし、口
唇の中点の座標を(PCMout hX,PCMouthY)とし、左右目領
域の最下端点の座標を(PLeftEyeX,PLeftEyeY)及び(P
LRightEyeX,PRightEyeY)とする。
【0113】次のS242では、CPU11は、顔画像
から一部を切り出して拡縮する際の拡縮率rsizeを、算
出する。なお、拡縮率rsizeは、切り出した画像を拡縮
した後において、左右目領域候補の最下端点の平均の高
さから口唇の中点までの上下方向の距離を基準距離dsy
に一致させるための比率であり、次の式、 rsize=dsy/|[PCMouthY-(PLeftEyeY+PLRightEyeY)/2]| により求められる。
【0114】次のS243では、CPU11は、顔部分
画像として切り出す際の中心となる基準位置(PbaseX,P
baseY)を、決定する。なお、基準位置(PbaseX,PbaseY)
は、次の式、 PbaseX=(PLeftEyeX+PRightEyeX+PCMouthX)/3 PbaseY=(PLeftEyeY+PRightEyeY+PCMouthY)/3 により求められる。
【0115】次のS244では、CPU11は、S20
1において読み込んだ画像のうち、口唇の最左右端点と
左右目領域の最下端点との4点に基づいて所定のロジッ
クに従って決定した範囲を、基準位置(PbaseX,PbaseY)
を中心として、切り出す。
【0116】次のS245では、CPU11は、S24
2において算出した拡縮率rsizeに従って、S244に
おいて切り出した画像を拡縮する。なお、図24及び図
25に、切り出す前の元の画像(原画像)と、この原画
像から切り出されて拡縮された画像の一例とを示す。
【0117】次のS146では、CPU11は、S24
5において拡縮した画像を顔部分画像としてHDD17
内に格納した後、顔部分画像抽出処理サブルーチンを終
了し、図17のメインルーチンにおけるS210に進
む。
【0118】S210では、CPU11は、認識処理を
実行する。この認識処理は、本出願人が先にした特許出
願(特願2001-100023)において詳細に説明されている
ものと同じであるので、その説明は省略するが、その概
要は、以下の通りである。
【0119】即ち、いわゆる固有空間法を利用して、事
前に、複数の登録ユーザの顔部分画像に基づいて固有ベ
クトル(固有画像)を求めておくとともに、各登録ユー
ザの顔部分画像の固有ベクトルへの射影ベクトルを求め
ておき、S245において生成した顔部分画像の固有ベ
クトルへの射影ベクトルを算出する。そして、この射影
ベクトルと各登録ユーザの射影ベクトルとの距離を算出
し、この距離が最も小さく且つ所定の閾値よりも小さか
った場合に、S245で生成した顔部分画像がその登録
ユーザのものであると認識し、所定の画面出力をする。
【0120】そして、CPU11は、このS210の認
識処理の終了後、図17に示す顔認識処理を終了する。
【0121】以上に示した顔認識処理により、CCDカ
メラ10dにより顔を撮影して得られる画像からは、顔
の輪郭が検出され(S202)、口唇の輪郭が検出され
(S203〜S205)、口唇の最左右端点と最下端点
と中点とが検出され(S206)、左右目領域の最下点
が検出され(S207,S208)、顔認識に必要な顔
部分画像が生成され(S209)、顔部分画像が登録ユ
ーザのものであるか否かが判定される(S210)。
【0122】上述したように、第2の実施形態のコンピ
ュータシステム10によれば、顔を撮影して得られる画
像において、先ず口唇の位置を特定してからその他の顔
部品(目,鼻)を特定して顔認識用の顔部分画像を生成
する。このため、この顔認識機能が、特に、音声をマイ
クから入力することによりコマンド入力が行えるコンピ
ュータシステムに組み込まれていれば、人物認証や操作
者に合ったコンテンツの提供などに応用できる。
【0123】
【発明の効果】以上に説明したように、本発明によれ
ば、顔を撮影して得られる画像の中から口唇部分のみを
抽出して口唇形状を特定できる。また、このように特定
された口唇形状から抽出された口唇の特徴点に基づいて
口の開閉状態を検出することができる。さらに、口唇の
特徴点とこれら特徴点に基づいて抽出された左右眼目の
特徴点とに基づいて、顔部分画像を元の画像から切り出
すことができる。
【図面の簡単な説明】
【図1】 第1の実施形態のコンピュータシステムの斜
視図
【図2】 コンピュータシステムの内部回路の概略構成
【図3】 コンピュータシステムにおいて実行される発
話意図検出処理の内容を示すフローチャート
【図4】 コンピュータシステムにおいて実行される肌
色領域抽出処理サブルーチンの内容を示すフローチャー
【図5】 人間の肌色を示すH成分値の上下限値の輝度
値に対する変化を示すグラフ
【図6】 ラベリング処理の説明に用いる説明図
【図7】 コンピュータシステムにおいて実行される色
ヒストグラム重心差エッヂ検出処理サブルーチンの内容
を示すフローチャート
【図8】 顔領域を格子状に区分した状態を示す説明図
【図9】 人間の口唇の色を示すH成分値の上下限値の
輝度値に対する変化を示すグラフ
【図10】 顔画像に二値化画像を重ね合わせた状態を
示す例示図
【図11】 コンピュータシステムにおいて実行される
明暗補正処理サブルーチンの内容を示すフローチャート
【図12】 コンピュータシステムにおいて実行される
白黒濃淡エッヂ検出処理サブルーチンの内容を示すフロ
ーチャート
【図13】 顔画像に口唇二値化画像を重ね合わせた状
態を示す例示図
【図14】 コンピュータシステムにおいて実行される
口端点検出処理サブルーチンの内容を示すフローチャー
【図15】 顔画像に口唇の最左右端点と中点と最下点
とを記した状態を示す例示図
【図16】 第2の実施形態のコンピュータシステムの
内部回路の概略構成図
【図17】 コンピュータシステムにおいて実行される
顔認識処理の内容を示すフローチャート
【図18】 コンピュータシステムにおいて実行される
輝度閾値算出処理サブルーチンの内容を示すフローチャ
ート
【図19】 口唇の左右端点を通る直線上にある各画素
の補正輝度値をプロットしたグラフの概略図
【図20】 コンピュータシステムにおいて実行される
目領域検出処理サブルーチンの内容を示すフローチャー
【図21】 顔画像に目二値化画像を重ね合わせた状態
を示す例示図
【図22】 顔画像に口唇の最左右端点と左右眼目の最
下端点を記した状態を示す例示図
【図23】 コンピュータシステムにおいて実行される
顔部分画像抽出処理サブルーチンの内容を示すフローチ
ャート
【図24】 CCDカメラにより撮影されて得られる画
像の例示図
【図25】 顔認識処理により図24の画像から切り出
された顔部分画像の例示図
【符号の説明】
10 コンピュータシステム 10a ディスプレイ 10b マイク 10c スピーカ 10d CCDカメラ 10e 本体 11 CPU 12 RAM 13 サウンド制御回路 14 ビデオ制御回路 15 フレキシブルディスクドライブ(FDD) 16 CD−ROMドライブ 17 ハードディスクドライブ(HDD) 21 発話意図検出プログラム 22 顔認識プログラム
フロントページの続き (72)発明者 及川 浩一 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社 Fターム(参考) 5B057 CA01 CA08 CA12 CA16 CB01 CB08 CB12 CB16 CE09 CE16 DA08 DA12 DB02 DB06 DB09 DC14 DC16 DC23 5L096 AA02 AA06 BA18 EA12 EA43 FA06 FA15 FA32 FA37 FA66 GA34 GA51

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】被写体像を撮影するテレビカメラに繋がれ
    たコンピュータに対し、 前記テレビカメラから入力される画像データに基づく画
    像の各画素から、肌色の色空間を定義する色成分値の範
    囲にその色成分値が含まれる画素を、抽出させ、 抽出した画素により囲まれる領域の内側にある画素か
    ら、口唇の色空間を定義する色成分値の範囲にその色成
    分値が含まれる画素を、抽出させることを特徴とする口
    唇形状特定プログラム。
  2. 【請求項2】前記コンピュータに対し、 前記肌色の色空間の色成分値の範囲を、輝度値の変化に
    対して変化する上下限値により定義させ、 前記各画素について、その色成分値がその輝度値に対応
    する上下限値の間にあるか否かを、判定させることを特
    徴とする請求項1記載の口唇形状特定プログラム。
  3. 【請求項3】前記コンピュータに対し、 前記口唇の色空間の色成分値の範囲を、輝度値の変化に
    対して変化する上下限値により定義させ、 前記各画素について、その色成分値がその輝度値に対応
    する上下限値の間にあるか否かを、判定させることを特
    徴とする請求項1又は2記載の口唇形状特定プログラ
    ム。
  4. 【請求項4】被写体像を撮影するテレビカメラに繋がれ
    たコンピュータに対し、 前記テレビカメラから入力される画像データに基づく画
    像の各画素から、肌色の色空間を定義する色成分値の範
    囲にその色成分値が含まれる画素を、抽出させ、 抽出した画素により囲まれる領域の内側にある画素か
    ら、口唇の色空間を定義する色成分値の範囲にその色成
    分値が含まれる画素を、抽出させ、 抽出した画素のうち、最も左側にある第1の画素,最も
    右側にある第2の画素,これら第1及び第2の画素の中
    間位置にある第3の画素,及び、最も下側にある第4の
    画素を、夫々抽出させ、 前記第1及び第2の画素の間の距離である横距離と、前
    記第3及び第4の画素の間の距離である縦距離との縦横
    比率を算出させ、 前記縦横比率が所定の値より大きい場合には、口の開閉
    状態に対応するために利用される状態情報を開口状態に
    切り替えさせ、前記縦横比が所定の値より小さい場合に
    は、前記状態情報を閉口状態に切り替えさせることを特
    徴とする発話意図検出プログラム。
  5. 【請求項5】被写体像を撮影するテレビカメラに繋がれ
    たコンピュータに対し、 前記テレビカメラから入力される画像データに基づく画
    像の各画素から、肌色の色空間を定義する色成分値の範
    囲にその色成分値が含まれる画素を、抽出させ、 抽出した画素により囲まれる領域の内側にある画素か
    ら、口唇の色空間を定義する色成分値の範囲にその色成
    分値が含まれる画素を、抽出させ、 抽出した画素のうち、最も左側にある第1の画素,最も
    右側にある第2の画素,及び、これら第1及び第2の画
    素の中間位置にある第3の画素を、夫々抽出させ、 前記第3の画素を挟んで左右に区分される領域のうちの
    左側の領域において、前記第1の画素よりも上側にある
    画素のうち、所定の輝度値よりも小さい輝度値の画素を
    抽出させ、 抽出した画素のうち、最も下側にある画素を第5の画素
    として抽出させ、 前記第3の画素を挟んで左右に区分される領域のうちの
    右側の領域において、前記第2の画素よりも上側にある
    画素のうち、所定の輝度値よりも小さい輝度値の画素を
    抽出させ、 抽出した画素のうち、最も下側にある画素を第6の画素
    として抽出させ、 前記第1及び第2の画素並びに前記第5及び第6の画素
    の前記画像内での位置に基づいて、前記画像から顔部分
    画像を切り出させることを特徴とする顔認識用画像生成
    プログラム。
JP2001381054A 2001-12-14 2001-12-14 口唇形状特定プログラム,発話意図検出プログラム及び顔認識用画像生成プログラム Pending JP2003187247A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001381054A JP2003187247A (ja) 2001-12-14 2001-12-14 口唇形状特定プログラム,発話意図検出プログラム及び顔認識用画像生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001381054A JP2003187247A (ja) 2001-12-14 2001-12-14 口唇形状特定プログラム,発話意図検出プログラム及び顔認識用画像生成プログラム

Publications (1)

Publication Number Publication Date
JP2003187247A true JP2003187247A (ja) 2003-07-04

Family

ID=27591859

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001381054A Pending JP2003187247A (ja) 2001-12-14 2001-12-14 口唇形状特定プログラム,発話意図検出プログラム及び顔認識用画像生成プログラム

Country Status (1)

Country Link
JP (1) JP2003187247A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006025129A1 (ja) * 2004-08-30 2006-03-09 Toyama-Prefecture 個人認証装置
KR100680278B1 (ko) 2005-12-28 2007-02-07 고려대학교 산학협력단 입술모양 추출방법 및 그 장치
US7848547B2 (en) 2006-03-07 2010-12-07 Kabushiki Kaisha Toshiba Apparatus for detecting feature point and method of detecting feature point
KR20230106281A (ko) 2022-01-06 2023-07-13 (주)키미티즈 스마트 캐릭터 디자인 제작시스템 및 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006025129A1 (ja) * 2004-08-30 2006-03-09 Toyama-Prefecture 個人認証装置
KR100680278B1 (ko) 2005-12-28 2007-02-07 고려대학교 산학협력단 입술모양 추출방법 및 그 장치
US7848547B2 (en) 2006-03-07 2010-12-07 Kabushiki Kaisha Toshiba Apparatus for detecting feature point and method of detecting feature point
KR20230106281A (ko) 2022-01-06 2023-07-13 (주)키미티즈 스마트 캐릭터 디자인 제작시스템 및 방법

Similar Documents

Publication Publication Date Title
Adeyanju et al. Machine learning methods for sign language recognition: A critical review and analysis
US7035461B2 (en) Method for detecting objects in digital images
US8861845B2 (en) Detecting and correcting redeye in an image
JP4861806B2 (ja) 赤目の検出及び補正
JP3999964B2 (ja) 目を検出するマルチモードデジタル画像処理方法
US7689033B2 (en) Robust multi-view face detection methods and apparatuses
JP5538909B2 (ja) 検出装置およびその方法
JP4408784B2 (ja) 赤目軽減方法
US8660323B2 (en) Image Preprocessing
US8325998B2 (en) Multidirectional face detection method
US20050058340A1 (en) Red-eye detection based on red region detection with eye confirmation
JP2003030667A (ja) イメージ内で目を自動的に位置決めする方法
JP2007097178A (ja) 顔検出による赤目の除去方法
Le Meur et al. Relevance of a feed-forward model of visual attention for goal-oriented and free-viewing tasks
JPH1153525A (ja) 顔器官検出装置及び媒体
JP2002342756A (ja) デジタル画像において目と口の位置を検出する方法
Zhang et al. Automated red-eye detection and correction in digital photographs
JP2007047965A (ja) デジタル画像の対象物検出方法および装置並びにプログラム
KR20070106015A (ko) 원격 홍채 인식 시스템
CN108446642A (zh) 一种快速人脸识别系统
CN114360039A (zh) 一种智能眼睑检测方法及系统
Gasparini et al. Automatic red-eye removal for digital photography
JP2003187247A (ja) 口唇形状特定プログラム,発話意図検出プログラム及び顔認識用画像生成プログラム
Gasparini et al. A review of redeye detection and removal in digital images through patents
JP4789526B2 (ja) 画像処理装置、画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070807

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080422