JP2000348173A - 唇抽出方法 - Google Patents

唇抽出方法

Info

Publication number
JP2000348173A
JP2000348173A JP11158597A JP15859799A JP2000348173A JP 2000348173 A JP2000348173 A JP 2000348173A JP 11158597 A JP11158597 A JP 11158597A JP 15859799 A JP15859799 A JP 15859799A JP 2000348173 A JP2000348173 A JP 2000348173A
Authority
JP
Japan
Prior art keywords
lip
color component
candidate area
image
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11158597A
Other languages
English (en)
Other versions
JP3902887B2 (ja
Inventor
Hiroshi Furuyama
浩志 古山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP15859799A priority Critical patent/JP3902887B2/ja
Publication of JP2000348173A publication Critical patent/JP2000348173A/ja
Application granted granted Critical
Publication of JP3902887B2 publication Critical patent/JP3902887B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Spectrometry And Color Measurement (AREA)

Abstract

(57)【要約】 【課題】 照明など周囲の条件または、話者の個
人差などに依存せずに顔画像から唇部分を精度よく抽出
すること。 【解決手段】 顔画像から第1の唇候補領域を決定す
る工程と、顔画像から第1の唇候補領域の全ての領域と
その周辺の領域を含む第2の唇候補領域を決定する工程
と、第1の唇候補領域の色成分ヒストグラムを作成する
工程と、第2の唇候補領域の色成分ヒストグラムとを作
成する工程と、第1の唇候補領域の色成分ヒストグラム
と第2の唇候補領域の色成分ヒストグラムの差分ヒスト
グラムから唇部分を抽出するための閾値を設定する工程
と、閾値を第1の唇候補領域の色成分ヒストグラムに用
いて色成分による閾値処理を行うことにより第1の唇候
補領域から唇部分を抽出する工程と、を具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、人物の顔を含む画
像から唇部分を抽出する方法に関する。
【0002】
【従来の技術】従来より、話者の唇の動き情報を検知
し、この検知結果を利用して音声認識の認識精度を向上
する試みがなされている。そして、唇の動き情報を検出
するためには、話者の顔画像から唇部分を精度よく抽出
する必要がある。
【0003】顔画像から唇部分を抽出する方法として
は、1990年電子情報通信学会春期全国大会、D−3
29、p7−81、「顔画像からの唇特徴点の抽出法」
などが知られている。
【0004】図10は、従来の唇画像抽出装置の概要を
示すブロック図である。
【0005】まず、話者の顔画像が背景分離部1001
に入力される。背景分離部1001は、入力された顔画
像に、その輝度情報を用いてSobel(エッジ抽出)
オペレータをかることによりエッジを抽出する。次に背
景分離部1001は、顔画像から、顔画像の最も外側の
エッジよりも外側の部分を背景として分離し、顔面画像
とする。背景を分離された顔面画像は、YIQ表色系変
換部1002に入力される。
【0006】YIQ表色系変換部1002は、唇候補領
域の決定するために、背景を分離された顔画像をYIQ
表色系へ色変換する。この色変換された画像は、唇候補
領域決定部1003に入力される。
【0007】唇候補領域決定部1003は、通常は、顔
画面中の色の中で唇部分を示す色が、最も大きなQ軸値
を示すことを考慮に入れて、Q軸に関して濃度値の累積
ヒストグラムをとる。次に、唇候補領域決定部1003
は、この累積ヒストグラムに、濃度値の高い方からx%
の値で閾値処理を行うことで、唇候補領域を決定する。
この、唇候補領域内の画像は唇抽出部1004に入力さ
れる。
【0008】このときxは(式1)から自動的に設定さ
れる。 x=(s/(m+n))×ratio×100(%) …(式1) ここで、m×nは原画像の画素数、sは背景分離画像の
画素数で、ratioは顔の面積に対する唇部分の面積
比を表すもので、経験的に定められる。
【0009】唇抽出部1004は、唇候補領域内の画像
から唇部分を抽出するため、Q軸に関して濃度値の累積
ヒストグラムをとり、Q軸値により再度閾値処理を行
う。このようにして唇画像が抽出される。
【0010】このときの閾値は、同様に累積ヒストグラ
ムから(式2)で与えられるy%の値とする。 y=(s’/(m+n))×level×100(%) …(式2) ここで、s'は唇候補領域内の画素数、levelは唇
候補領域の面積に対する唇部分の面積比を表し、これも
経験的に定められる。
【0011】以上のようにして、色成分ヒストグラムと
閾値処理により、入力した話者の顔画像から唇部分を抽
出することが可能である。
【0012】
【発明が解決しようとする課題】しかしながら、従来の
唇抽出方法では、色成分を用いて唇を抽出しているが、
色成分は照明条件の影響を受けやすいという問題があ
る。
【0013】また、閾値設定のためにあらかじめ設定し
た係数を用いているため、男女差および化粧の有無など
話者の個人差により、唇抽出の精度は影響を受けやすい
という問題もある。
【0014】本発明はかかる点に鑑みてなされたもので
あり、照明など周囲の条件または、話者の個人差などに
依存せずに顔画像から唇部分を精度よく抽出することを
目的とする。
【0015】
【課題を解決するための手段】そこで、本発明の唇抽出
方法では、顔画像から第1の唇候補領域を抽出した後
に、顔画像から、第1の唇候補領域の全ての領域とその
周辺を含む領域を第2の唇候補領域を新たに決定し、第
1の唇候補領域の色成分ヒストグラムと第2の唇候補領
域の色成分ヒストグラムと第1の唇候補領域の色成分ヒ
ストグラムと第2の唇候補領域の色成分ヒストグラムと
の差分ヒストグラムとを作成し、この差分ヒストグラム
から唇部分抽出のための閾値を設定し、この閾値を用い
て第1の唇候補領域の色成分ヒストグラムを閾値処理を
行うことにより唇部分を抽出するものである。
【0016】このように構成することで、第1の唇候補
領域と第2の唇候補領域は共に唇部分を含み、第2の唇
候補領域は第1の唇候補領域よりも広い範囲で唇周辺に
おける肌色部分を含む。このため、前述の差分ヒストグ
ラムは唇周辺の肌色部分の色成分ヒストグラムとなる。
従って、差分ヒストグラムの分布から閾値を設定するこ
とにより、対象とする話者の肌と唇部分の色成分の境界
を精度よく抽出することが可能となる。
【0017】また、閾値設定のために抽出する第1の唇
候補領域、第2の唇候補領域ともに同じ画像を用いるた
め、照明など周囲の条件によって生じる、唇部分抽出精
度の劣化も防ぐことも可能となる。
【0018】
【発明の実施の形態】本発明の第1の態様にかかる唇抽
出方法は、顔画像から第1の唇候補領域を決定する工程
と、顔画像から第1の唇候補領域の全ての領域とその周
辺の領域を含む第2の唇候補領域を決定する工程と、第
1の唇候補領域の色成分ヒストグラムを作成する工程
と、第2の唇候補領域の色成分ヒストグラムとを作成す
る工程と、第1の唇候補領域の色成分ヒストグラムと第
2の唇候補領域の色成分ヒストグラムの差分ヒストグラ
ムから唇部分を抽出するための閾値を設定する工程と、
閾値を第1の唇候補領域の色成分ヒストグラムに用いて
色成分による閾値処理を行うことにより第1の唇候補領
域から唇部分を抽出する工程と、を具備する。
【0019】このように差分ヒストグラムの分布から閾
値を設定することにより、対象とする話者の肌と唇部分
の色成分の境界を精度よく抽出することが可能となる。
また、閾値設定のために抽出する第1の唇候補領域、第
2の唇候補領域ともに同じ画像を用いるため、照明など
周囲の条件によって生じる、唇部分抽出精度の劣化も防
ぐことも可能となる。
【0020】本発明の第2の態様は、第1の態様にかか
る唇抽出方法において、予め設定した係数をa、bとし
て、作成するヒストグラムの色成分がRGB表色系の (R−a・G−b・B) である。
【0021】このように構成することにより、入力する
顔画像のRGB成分から容易に色成分ヒストグラムを作
成することができる。
【0022】本発明の第3の態様は、第1の態様または
第2の態様にかかる唇抽出方法において、第1の唇候補
領域と第2の唇候補領域の面積比が1対1よりも大き
く、1対3よりも小さい。
【0023】このような面積比にすることで、精度の高
い閾値を設定できるので、唇の抽出も精度高くできる。
【0024】本発明の第4の態様は、第1の態様から第
3の態様のいずれかにかかる唇抽出方法において、第1
の唇候補領域を決定する工程は、顔画像から仮唇候補領
域を決定する工程と、仮唇候補領域の色成分ヒストグラ
ムを作成する工程と、予め作成した複数の話者の顔画像
から唇部分を切り出す際に使用した複数の閾値の平均値
である閾値を、仮唇候補領域の色成分ヒストグラムに用
いて色成分による閾値処理を行うことにより、仮唇候補
領域から唇部分を抽出し、2値化を行う工程と、抽出さ
れた唇部分を含む長方形の領域を切り出すことで決定し
た新たな唇候補領域を第1の唇候補領域とする工程と、
を具備する。
【0025】以上のようにして、仮唇候補領域を使用し
て第1の唇候補領域を決定することにより、第1の唇候
補領域を精度よく抽出することが可能となる。さらに、
このように精度よく抽出された第1の唇候補領域を使用
して唇画像を抽出するため、唇を精度よく抽出すること
ができる。
【0026】本発明の第5の態様は、第1の態様から第
3の態様のいずれかにかかる唇抽出方法において、第1
の唇候補領域を決定する工程は、顔画像から仮唇候補領
域を決定する工程と、仮唇候補領域の色成分ヒストグラ
ムを作成する工程と、予め複数の話者の顔画像から唇部
分を切り出して作成した唇抽出用テンプレートの色成分
ヒストグラムと前記仮唇候補領域の色成分ヒストグラム
を比較し、類似度のもっとも高い唇抽出用テンプレート
の閾値を仮唇候補領域の色成分ヒストグラムに用いて色
成分による閾値処理を行うことにより、仮唇候補領域か
ら唇部分を抽出し、2値化を行う工程と、抽出された唇
部分を含む長方形の領域を切り出すことで決定した新た
な唇候補領域を第1の唇候補領域とする工程と、を具備
する。
【0027】以上のようにして、仮唇候補領域を使用し
て第1の唇候補領域を決定することにより、第1の唇候
補領域を精度よく抽出することが可能となる。さらに、
このように精度よく抽出された第1の唇候補領域を使用
して唇画像を抽出するため、唇を精度よく抽出すること
ができる。
【0028】本発明の第6の態様は、第1の態様から第
5の態様のいずれかにかかる唇抽出方法において、抽出
した唇部分の色成分の分布と抽出した唇周辺部分の色分
布に対し、RGB色空間上で唇部分と唇周辺部分を2分
する関数 a・R+b・G+c・B+d=0 を求め、唇抽出のために作成するヒストグラムの色成分
を a・R+b・G+c・B とする。
【0029】このように唇部分と唇周辺部分を2分する
関数により、抽出した唇部分の色成分の分布と抽出した
唇周辺部分の色分布を唇部分と唇周辺部分とに簡単に2
分することができる。また、唇部分と唇周辺部分を2分
する関数から、閾値を設定するための色成分(a・R+
b・G+c・B)の係数(a、b、c)を決定し、この
係数により色成分ヒストグラムを作成することにより、
より精度よく唇部分を抽出することが可能になる。
【0030】本発明の第7の態様は、第1の態様から第
6の態様のいずれかにかかる唇抽出方法において、第1
の唇候補領域の画像を輝度成分に変換し、エッジ抽出
し、2値化した画像と、色成分により唇部分を抽出した
画像の論理和を取った画像を唇抽出画像として出力す
る。
【0031】このように色成分と輝度成分による唇抽出
を行うことにより、より精度の高い唇部分の抽出が可能
となる。
【0032】以下、本発明の実施の形態について図を用
いて詳細に説明する。
【0033】(実施の形態1)図1は、本発明にかかる
音声認識装置の構成を示すブロック図である。この図を
使用して、実施の形態1にかかる音声認識装置ついて説
明する。
【0034】音声認識装置101は、画像入力部102
と画像処理部103と音声入力部104と音声認識部1
05とを有する構成になっている。
【0035】画像入力部102は、話者の顔を撮影する
ことによって得られた顔画像を出力する。画像入力部1
02としては、CCDカメラなどが考えられる。
【0036】画像処理部103は、画像入力部102か
ら入力された顔画像から唇画像を抽出して出力する。画
像処理部103は、顔面画像抽出部106と唇画像抽出
部107とを有する構成になっている。
【0037】顔面画像抽出部106は、画像入力部10
2から入力された顔画像に、その輝度情報を用いてSo
bel(エッジ抽出)オペレータをかけてエッジを抽出
する。次に顔面画像抽出部106は、最も外側のエッジ
よりも外側の部分顔画像の画像情報を背景として顔画像
から分離し、顔面画像を作成する。顔面画像抽出部10
6は、顔面画像をYIQ表色系変換に変換し、唇画像抽
出部107に入力する。
【0038】なお、本実施の形態では、顔面画像抽出部
106が顔画像から顔面画像を抽出する方法として、顔
画像の輝度情報を用いてSobel(エッジ抽出)オペ
レータをかけてエッジを抽出する方法を用いたが、これ
以外の方法を用いてもよく、これ以外の方法を用いた形
態も本発明に包含される。
【0039】唇画像抽出部107は、入力された顔面画
像から唇画像を抽出して音声認識部105に出力する。
【0040】音声入力部104は、マイクなどの集音装
置により集音された音声を音声認識部105に出力す
る。
【0041】音声認識部105は、画像処理部103か
ら入力された唇画像を用いて、音声入力部104から入
力された音声認識をして、認識結果を出力する。
【0042】以下、本発明の特徴である唇抽出精度が高
められた唇画像抽出部107の説明を詳細に行う。
【0043】図2は、実施の形態1にかかる唇画像抽出
部の構成を示すブロック図である。
【0044】第1の唇候補領域決定部201は、入力さ
れた話者の顔面画像と唇を抽出するための情報から第1
の唇候補領域を決定する。第1の唇候補領域の決定方法
としては、前述の従来例における方法や、第2回画像セ
ンシングシンポジウム講演論文集、A−1、p1〜6、
「色情報とGAを用いた顔画像抽出と個人照合の応用」
に示されているような、予め用意された顔(または唇)
抽出用テンプレートベクトル集合と遺伝的アルゴリズム
を用いたパターンマッチングによる領域抽出法などが考
えられる。なお、第1の唇候補領域の決定方法として、
これら以外の技術を用いることも可能であり、これら以
外の技術を使用して第1の唇候補領域の決定してもよ
い。
【0045】第2の唇候補領域決定部202は、入力さ
れた顔面画像から第1の唇候補領域の全てとその周辺を
含むように決定された第2の唇候補領域を決定する。第
1の唇候補領域と第2の唇候補領域の面積比は、1対1
よりも大きく、1対3よりも小さくなっている。
【0046】色成分ヒストグラム作成部203は、第1
の唇候補領域の色成分ヒストグラムおよび第2の唇候補
領域の色成分ヒストグラムを作成する。色成分としてR
GB表色系における(R−G−B)成分を横軸として示
している。しかし、色成分として、このほかにも(R−
G)成分、R/G成分、R/(G・B)成分、予め設定
した係数をa、bとして、(R−a・G−b・B)成分
を算出して用いることで入力する顔画像のRGB成分か
ら容易に色成分ヒストグラムを作成できるようにするこ
とや、前述の従来例に示されているYIQ表色系におけ
るQ成分や、HSV表色系におけるH成分、S成分など
を利用することで効果を上げることも可能である。
【0047】閾値設定部204は、第1の唇候補領域の
ヒストグラムと第2の唇候補領域のヒストグラムとの差
分を取った差分ヒストグラムを作成し、この差分ヒスト
グラムのピーク値と予め設定された係数を掛けることに
より得られる値に対応する色成分値を閾値として設定す
る。
【0048】唇抽出部205は、第1の唇候補領域のヒ
ストグラムと閾値設定部204で決定した閾値から唇部
分を抽出し、唇画像として出力する。
【0049】図3は、実施の形態1にかかる第1の唇候
補領域および第2の唇候補領域を説明するための概略図
である。
【0050】301は、唇部分であり、302は第1の
唇候補領域決定部201により決定された第1の唇候補
領域であり、303は第1の唇候補領域の全てとその周
辺を含むように決定された第2の唇候補領域である。
【0051】図4は、実施の形態1にかかる第1の唇候
補領域の色成分ヒストグラム(度数分布)と、第2の唇
候補領域の色成分ヒストグラムと、第1の唇候補領域の
色成分ヒストグラムと第2の唇候補領域の色成分ヒスト
グラムとの差分ヒストグラムと、を示す図である。
【0052】横軸は色成分(RGB表色系における、
(R−G−B)成分)、縦軸は色成分の度数である。4
01は第1の唇候補領域302の色成分ヒストグラム、
402は第2の唇候補領域303の色成分ヒストグラ
ム、403は第1の唇候補領域302の色成分ヒストグ
ラムと第2の唇候補領域303の色成分ヒストグラムと
の差分ヒストグラムである。また、404は、第2の唇
候補領域の色成分ヒストグラムの第1のピークであり、
405は、第2の唇候補領域の色成分ヒストグラムの第
2のピークである。
【0053】以下、実施の形態1にかかる唇画像抽出部
の動作について図2、図3および図4を使用して説明す
る。
【0054】初めに、第1の唇候補領域決定部201に
話者の顔面画像と唇を抽出するための情報が入力され
る。第1の唇候補領域決定部201は、この顔面画像か
ら第1の唇候補領域302を決定し、色成分ヒストグラ
ム作成部203に出力する。
【0055】続いて、第2の唇候補領域決定部202
が、入力された話者の顔面画像から、第1の唇候補領域
302の全てとその周辺を含む領域を第2の唇候補領域
303として新たに決定し、色成分ヒストグラム作成部
203に出力する。
【0056】色成分ヒストグラム作成部203は、抽出
した第1の唇候補領域302の色成分ヒストグラム40
1および第2の唇候補領域303の色成分ヒストグラム
402を作成する。
【0057】図3からも明らかなように、第2の唇候補
領域303の色成分ヒストグラムには402、第1のピ
ーク404と第2のピーク405の2つのピークがあ
る。また、第1の唇候補領域302の色成分ヒストグラ
ム401には第2のピーク405と同じ位置にピークが
ある。
【0058】第1の唇候補領域302の色成分ヒストグ
ラム401と第2の唇候補領域303の色成分ヒストグ
ラム402とが共にピークを現わしている第2のピーク
405は唇部分301の色成分によるものである。ま
た、第1の唇候補領域302の色成分ヒストグラム40
1にのみはっきりと現れている第1のピーク404は、
唇周辺の肌色部分の色成分によるものである。
【0059】従って、第1の唇候補領域302の色成分
ヒストグラム401と第2の唇候補領域303の色成分
ヒストグラム402との差分ヒストグラム403を作成
することにより、唇周辺の肌色成分ヒストグラムを抽出
することが可能となる。
【0060】閾値設定部204は、この肌色成分ヒスト
グラムである差分ヒストグラム403を作成し、そのピ
ーク値を求め、このピーク値に対応する色成分値を求め
る。さらに、閾値設定部204は、このピーク値に対応
する色成分値に予め設定された係数を掛けることにより
得られる色成分値を閾値として設定し、唇抽出部205
に出力する。
【0061】唇抽出部205は、第1の唇候補領域の色
成分ヒストグラム401の色成分のうち閾値設定部20
4で決定した閾値よりも第2のピーク405側にある色
成分の領域を唇部分として抽出し、唇画像を出力する。
【0062】また、第1の唇候補領域302と第2の唇
候補領域303の面積比が1対1よりも大きく、1対3
よりも小さい面積比になっている。このような面積比に
することで、精度よく閾値を求めることができるので、
唇を精度よく抽出することができる。なお、面積比はこ
の比率以外でも周囲の環境および個人差によって変更し
ても構わない。
【0063】このように、実施の形態1にかかる唇画像
抽出部によれば、第1の唇候補領域と第2の唇候補領域
は共に唇部分を含み、第2の唇候補領域は第1の唇候補
領域よりも広い範囲で唇周辺における肌色部分を含む。
このため、差分ヒストグラムは唇周辺の肌色部分の色成
分ヒストグラムとなる。従って、差分ヒストグラムの分
布から閾値を設定することにより、対象とする話者の肌
と唇部分の色成分の境界を精度よく抽出することが可能
となる。
【0064】また、閾値設定のために抽出する第1の唇
候補領域、第2の唇候補領域ともに同じ画像を用いるた
め、照明など周囲の条件によって生じる、唇部分抽出精
度の劣化も防ぐことも可能となる。
【0065】よって、実施の形態1にかかる唇画像抽出
部によれば、照明などの条件や、男女差、化粧(口紅)
の有無など話者の個人差により、色成分ヒストグラムの
分布が異なっても、これらの影響を受けることなく唇部
分の抽出が可能となる。
【0066】(実施の形態2)図5は、本発明の実施の
形態2にかかる唇画像抽出部の構成を示すブロック図で
ある。この図を使用して、唇画像抽出部の構成について
詳細に説明する。
【0067】実施の形態2にかかる唇画像抽出部は、実
施の形態1にかかる唇画像抽出部において、第1の唇候
補領域決定方法として仮唇候補領域を用いる点が異なる
のみである。また、既に説明した部分と同じ部分につい
ては同一の符号を付与してある。
【0068】仮唇候補領域決定部501は、実施の形態
1で説明した第1の唇候補領域決定部201と同じ動作
をし、唇候補領域を抽出し、この領域を仮唇候補領域と
する。
【0069】色成分ヒストグラム作成部502は、仮唇
候補領域の色成分(R−G−B)のヒストグラムを作成
する。なお、色成分ヒストグラム作成部203と同様に
この色成分以外の色成分を使用しても良い。
【0070】閾値記憶部503は、実施の形態1にかか
る唇画像抽出部により、予め複数の話者の複数の話者の
顔画像から唇画像部分を抽出し、その際に用いた唇画像
抽出のための閾値(色成分)の平均値を算出した閾値を
記憶している。
【0071】唇抽出部504は、仮唇候補領域の色成分
ヒストグラムと閾値記憶部503に記憶された閾値を用
いて唇部分を抽出し、2値化し、唇画像として出力す
る。
【0072】第1の唇候補領域決定部505は、唇抽出
部504から入力せれた唇部分を含む長方形の領域を切
り出し、この領域をあらたに第1の唇候補領域として決
定する。
【0073】以下に、実施の形態2にかかる唇画像抽出
部の動作について説明する。
【0074】まず、仮唇候補領域決定部501に唇抽出
の対象となる話者の顔面画像と唇情報が入力される。仮
唇候補領域決定部501は、唇抽出の対象となる話者の
顔面画像に対して、仮唇候補領域を決定し、色成分ヒス
トグラム作成部502に出力する。
【0075】続いて、色成分ヒストグラム作成部502
が、入力された仮唇候補領域の色成分(R−G−B)の
ヒストグラムを作成し、唇抽出部504に出力する。
【0076】唇抽出部504は、色成分ヒストグラム作
成部502から入力された仮唇候補領域の色成分ヒスト
グラムと閾値記憶部503に記憶されている閾値を用い
て唇部分を抽出し2値化し、第1の唇候補領域決定部5
05に出力する。
【0077】第1の唇候補領域決定部505は、抽出さ
れた唇部分を含む長方形を切り出し、この領域を第1の
唇候補領域として決定する。
【0078】以下の動作については実施の形態1と同じ
なので説明を省略する。
【0079】以上のように、実施の形態2にかかる唇画
像抽出部によれば、仮唇候補領域を使用して第1の唇候
補領域を決定することにより、精度よく第1の唇候補領
域を抽出することが可能となる。さらに、このように精
度よく抽出された第1の唇候補領域を使用して唇画像を
抽出するため、唇画像を精度よく抽出することができ
る。
【0080】(実施の形態3)図6は、本発明の実施の
形態3にかかる唇画像抽出部の構成を示すブロック図で
ある。この図を使用して実施の形態3にかかる唇画像抽
出部の構成を説明する。なお、すでに説明した部分と同
一の部分については同一の符号を付与してある。
【0081】実施の形態3にかかる唇画像抽出部は、実
施の形態1にかかる唇画像抽出部おいて、第1の唇候補
領域決定方法として仮唇候補領域を用いる点が異なるの
みである。また、既に説明した部分と同じ部分について
は同一の符号を付与してある。
【0082】唇抽出用テンプレート601は、予め複数
の話者の顔画像から唇部分を切り出して作成した色成分
ヒストグラムと閾値が記憶している。
【0083】唇抽出部602は、唇抽出用テンプレート
601の色成分ヒストグラムと仮唇候補領域の色成分ヒ
ストグラムを比較する。そして、次に、唇抽出部602
は、比較した結果、類似度のもっとも高い唇抽出用テン
プレートの閾値を用いて仮唇候補領域の画像に対して唇
部分の画像を抽出する。
【0084】以下、実施の形態3にかかる唇抽出部の動
作について説明する。
【0085】まず、前述の実施の形態2と同じ方法によ
り、仮唇候補領域の色成分ヒストグラムが作成され、唇
抽出部602に入力される。
【0086】続いて、唇抽出部602は、唇抽出用テン
プレート601の色成分ヒストグラムと仮唇候補領域の
色成分ヒストグラムを比較する。そして、唇抽出部60
2は、比較した結果、類似度の最も高い唇抽出用テンプ
レート601の閾値を用いて仮唇候補領域の画像に対し
て唇部分を抽出し、出力する。
【0087】以下の動作については、実施の形態1また
は実施の形態2と同様なので説明を省略する。
【0088】以上のように、実施の形態3にかかる唇画
像抽出部によれば、仮唇候補領域と唇抽出用テンプレー
トを使用して第1の唇候補領域を決定することにより、
精度よく第1の唇候補領域を抽出することが可能とな
る。さらに、このように精度よく抽出された第1の唇候
補領域を使用して唇画像を抽出するため、唇画像を精度
よく抽出することができる。
【0089】(実施の形態4)図7は本発明の実施の形
態4にかかる唇画像抽出部の構成を示すブロック図であ
る。この図を使用して実施の形態4にかかる唇画像抽出
部の構成を説明する。なお、すでに説明した部分と同一
の部分については同一の符号を付与してある。
【0090】仮唇部分の色成分分布作成部701は、唇
抽出された部分の色成分の分布をRGBの空間上で作成
する。
【0091】仮唇周辺部分の色成分分布作成部702
は、唇周辺部分の色成分の分布をRGBの空間上で作成
する。
【0092】色成分パラメータ決定部703は、ある与
えられた色成分(R、G、B)が唇抽出された部分の色
成分の分布と唇周辺部分の色成分の分布のいずれに属す
るかをRGB色空間上で判別するために用いる判別関数 a・R+b・G+c・B+d=0 を求める。また、判別関数は判別分析により求めること
ができる。判別関数の係数(a、b、c)を用いて第1
の唇候補領域302と第2の唇候補領域303の色成分
パラメータ((a・R+b・G+c・B)を決定する。
なお、実施の形態1に示した色成分(R−G−B)はa
=1、b=−1、c=−1の場合に相当する。
【0093】色成分ヒストグラム作成部704は、係数
(a、b、c)を用いて第1の唇候補領域302の色成
分(a・R+b・G+c・B)ヒストグラムと、第2の
唇候補領域303の色成分ヒストグラムを作成する。
【0094】図8は、実施の形態4にかかる唇抽出され
た部分の色成分の分布と唇周辺部分の色成分の分布をR
GBの色空間上に示した図である。
【0095】801は抽出された仮唇部分の色成分の分
布をRGBの色空間上に示したものであり、802は仮
唇周辺部分の色成分の分布をRGBの色空間上に示した
ものである。803は、ある与えられた色成分(R、
G、B)が仮唇部分の集合と仮唇周辺部分の集合のいず
れに属するかを判別するための判別関数(a・R+b・
G+c・B+d=0)を示す平面である。
【0096】以下、実施の形態4にかかる唇画像抽出部
の動作について説明する。
【0097】まず、実施の形態1と同様な手順で唇部分
を抽出する。
【0098】つぎに、仮唇部分の色成分分布作成部70
1がこの唇部分を仮唇部分とし、仮唇部分の色成分分布
を作成し、出力する。同様に、仮唇周辺部分の色成分分
布作成部702は、仮唇周辺の色成分分布を作成し、出
力する。
【0099】次に、色成分パラメータ決定部703は、
入力された仮唇部分の色成分の分布801と仮唇周辺部
分の色成分の分布802に対して(RGB)色空間上で
判別分析を行い判別関数 a・R+b・G+c・B+d=0 を求め、この係数(a、b、c)を用いて第1の唇候補
領域302と第2の唇候補領域303の色成分パラメー
タ(a・R+b・G+c・B)を決定し、出力する。
【0100】色成分ヒストグラム作成部704は、この
ようにして得られた、係数(a、b、c)を用いて第1
の唇候補領域302の色成分ヒストグラムを作成し、出
力する。さらに、色成分ヒストグラム作成部704は、
第2の唇候補領域303の色成分(a・R+b・G+c
・B)ヒストグラムを作成し、出力する。
【0101】以下の動作については、既に説明した動作
と同じであるので説明を省略する。
【0102】以上のように、実施の形態4にかかる唇画
像抽出部によれば、判別分析の判別関数により閾値を設
定するための色成分(a・R+b・G+c・B)の係数
(a、b、c)を決定し、この色成分を使用して色成分
ヒストグラムを作成することにより、より精度よく唇部
分を抽出することが可能となる。
【0103】なお、実施の形態4では、唇部分と唇周辺
部分を2分する関数として、判別分析によって求められ
た判別関数を使用したが、判別関数以外の関数、例えば
唇抽出された仮唇部分の色成分分布801と仮唇周辺部
分の色成分の分布802、それぞれの重心間の中点を通
り、重心を結ぶ直線に直交する平面を表わす関数(a・
R+b・G+c・B+d=0)等を使用することも可能
である。また、これらの判別関数以外の関数の係数
(a、b、c)を用いることも当然のことながら可能で
ある。
【0104】(実施の形態5)図9は、本発明の実施の
形態5にかかる唇画像抽出部の構成を示すブロック図で
ある。この図を使用して実施の形態5にかかる唇画像抽
出部について詳細に説明する。なお、既に説明した部分
と同一の部分については同一の符号が付与してある。
【0105】輝度値変換部901は、第1の唇候補領域
の画像データを輝度値で表わされる画像データに変換す
る。
【0106】エッジ抽出部902は、輝度値で表わされ
た画像データにエッジオペレーターをかけることにより
エッジを抽出し、さらに2値化する。
【0107】画像合成部903は、色成分ヒストグラム
を用いて抽出した唇画像とエッジ抽画像の論理和をと
り、唇画像として出力する。
【0108】以下、実施の形態5にかかる唇画像抽出部
の動作について説明する。
【0109】色成分ヒストグラムを用いて唇抽出する部
分の処理は実施の形態1と同様であるので、説明を省略
する。
【0110】第1の唇候補領域決定部201が第1の唇
候補領域抽出した後、輝度値変換部901は、第1の唇
候補領域の画像データを輝度値で表わされる画像データ
に変換し、出力する。
【0111】次に、エッジ抽出部902が、輝度値に変
換された画像データにエッジオペレーターをかけること
によりエッジを抽出し、さらに2値化して出力する。
【0112】そして、画像合成部903が、実施の形態
1と同様に色成分ヒストグラムを用いて抽出した唇画像
とエッジ抽出部902から入力されたエッジ抽出画像の
論理和をとり、これを唇画像として出力する。
【0113】以上のようにして、実施の形態5にかかる
唇画像抽出部によれば、色成分による唇抽出だけでなく
輝度成分による唇抽出も行うことにより、より精度の高
い唇部分の抽出が可能となる。
【0114】以上説明してきたように、本発明の唇抽出
方式では、照明などの条件や話者の個人差に影響を受け
ることなく、唇部分を精度よく抽出することが可能とな
る。
【0115】また、実施の形態1から実施の形態5を適
宜組み合わせることにより、さらに精度を上げることも
可能である。
【0116】さらに、本発明にかかる唇画像抽出部の構
成は、図2、図5〜7、図9に限定されるものではな
く、各処理部、例えば色成分ヒストグラム作成部を設け
る数を増やす等して並列化し、処理を高速化することも
できる。また、本発明にかかる唇画像抽出部の各処理
部、例えば閾値設定部、色成分ヒストグラム作成部など
に複数回の処理をさせることにより、小型化することも
できる。
【0117】また、本発明の説明では、唇画像抽出部を
音声認識装置に適用したが、唇画像抽出部をこれ以外の
装置に適用することも可能であり、本発明に含まれる。
【0118】
【発明の効果】以上説明したように、本発明によれば、
照明などの条件や話者の個人差に影響を受けることな
く、唇部分を精度よく抽出することが可能となる。
【図面の簡単な説明】
【図1】本発明にかかる音声認識装置の構成を示すブロ
ック図
【図2】本発明の実施の形態1にかかる唇画像抽出部の
構成を示すブロック図
【図3】実施の形態1にかかる第1の唇候補領域および
第2の唇候補領域を説明するための概略図
【図4】実施の形態1にかかる第1の唇候補領域の色成
分ヒストグラムと、第2の唇候補領域の色成分ヒストグ
ラムと、第1の唇候補領域の色成分ヒストグラムと第2
の唇候補領域の色成分ヒストグラムとの差分ヒストグラ
ムを示す図
【図5】本発明の実施の形態2にかかる唇画像抽出部の
構成を示すブロック図
【図6】本発明の実施の形態3にかかる唇画像抽出部の
構成を示すブロック図
【図7】本発明の実施の形態4にかかる唇画像抽出部の
構成を示すブロック図
【図8】実施の形態4にかかる唇抽出された部分の色成
分の分布と唇周辺部分の色成分の分布をRGBの色空間
上に示した図
【図9】本発明の実施の形態5にかかる唇画像抽出部の
構成を示すブロック図
【図10】従来の唇画像抽出装置の概要を示すブロック
【符号の説明】
101 音声認識装置 102 画像入力部 103 画像処理部 104 音声入力部 105 音声認識部 106 顔面画像抽出部 107 唇画像抽出部 201、505 第1の唇候補領域決定部 202 第2の唇候補領域決定部 203、502 色成分ヒストグラム作成部 204 閾値設定部 205、504、602 唇抽出部 501 仮唇候補領域決定部 503 閾値記憶部 601 唇抽出用テンプレート 701 仮唇部分の色成分分布作成部 702 仮唇周辺部分の色成分分布作成部 703 色成分パラメータ決定部 704 色成分ヒストグラム作成部 901 輝度値変換部 902 エッジ抽出部 903 画像合成部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 15/70 310 410 Fターム(参考) 2G020 AA08 DA02 DA12 DA35 DA66 4C038 VA04 VB05 VC05 5B057 BA29 DA08 DB02 DB06 DC16 DC19 DC25 5L096 AA02 BA18 EA35 EA43 FA15 FA35 GA51 JA09 9A001 GG19 HH17 HH23 HH28 HH30

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 顔画像から第1の唇候補領域を決定する
    工程と、前記顔画像から前記第1の唇候補領域の全ての
    領域とその周辺の領域を含む第2の唇候補領域を決定す
    る工程と、前記第1の唇候補領域の色成分ヒストグラム
    を作成する工程と、前記第2の唇候補領域の色成分ヒス
    トグラムとを作成する工程と、前記第1の唇候補領域の
    色成分ヒストグラムと前記第2の唇候補領域の色成分ヒ
    ストグラムの差分ヒストグラムから唇部分を抽出するた
    めの閾値を設定する工程と、前記閾値を前記第1の唇候
    補領域の色成分ヒストグラムに用いて色成分による閾値
    処理を行うことにより前記第1の唇候補領域から唇部分
    を抽出する工程と、を具備することを特徴とする唇抽出
    方法。
  2. 【請求項2】 予め係数a,bを設定し、作成する色成
    分ヒストグラムの色成分がRGB表色系の(R−a・G
    −b・B)であることを特徴とする請求項1記載の唇抽
    出方法。
  3. 【請求項3】 前記第1の唇候補領域と前記第2の唇候
    補領域の面積比が1対1よりも大きく、1対3よりも小
    さいことを特徴とする請求項1又は請求項2に記載の唇
    抽出方法。
  4. 【請求項4】 前記第1の唇候補領域を決定する工程
    は、前記顔画像から仮唇候補領域を決定する工程と、前
    記仮唇候補領域の色成分ヒストグラムを作成する工程
    と、予め作成した複数の話者の顔画像から唇部分を切り
    出す際に使用した複数の閾値の平均値である閾値を、前
    記仮唇候補領域の色成分ヒストグラムに用いて色成分に
    よる閾値処理を行うことにより、前記仮唇候補領域から
    唇部分を抽出し、2値化を行う工程と、前記抽出された
    唇部分を含む長方形の領域を切り出すことで決定した新
    たな唇候補領域を前記第1の唇候補領域とする工程と、
    を具備することを特徴とする請求項1から請求項3のい
    ずれかに記載の唇抽出方法。
  5. 【請求項5】 前記第1の唇候補領域を決定する工程
    は、前記顔画像から仮唇候補領域を決定する工程と、前
    記仮唇候補領域の色成分ヒストグラムを作成する工程
    と、予め複数の話者の顔画像から唇部分を切り出して作
    成した唇抽出用テンプレートの色成分ヒストグラムと前
    記仮唇候補領域の色成分ヒストグラムを比較し、類似度
    のもっとも高い唇抽出用テンプレートの閾値を前記仮唇
    候補領域の色成分ヒストグラムに用いて色成分による閾
    値処理を行うことにより、前記仮唇候補領域から唇部分
    を抽出し、2値化を行う工程と、前記抽出された唇部分
    を含む長方形の領域を切り出すことで決定した新たな唇
    候補領域を前記第1の唇候補領域とする工程と、を具備
    することを特徴とする請求項1から請求項3のいずれか
    に記載の唇抽出方法。
  6. 【請求項6】 前記抽出した唇部分の色成分の分布と前
    記抽出した唇周辺部分の色分布に対し、RGB色空間上
    で唇部分と唇周辺部分を2分する関数 a・R+b・G+c・B+d=0 を求め、唇抽出のために作成するヒストグラムの色成分
    を a・R+b・G+c・B とすることを特徴とする請求項1から請求項5のいずれ
    かに記載の唇抽出方法。
  7. 【請求項7】 前記第1の唇候補領域の画像を輝度成分
    に変換し、エッジ抽出し、2値化した画像と、前記色成
    分により唇部分を抽出した画像の論理和を取った画像を
    唇抽出画像として出力することを特徴とする請求項1か
    ら請求項6のいずれかに記載の唇抽出方法。
JP15859799A 1999-06-04 1999-06-04 唇抽出方法 Expired - Fee Related JP3902887B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15859799A JP3902887B2 (ja) 1999-06-04 1999-06-04 唇抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15859799A JP3902887B2 (ja) 1999-06-04 1999-06-04 唇抽出方法

Publications (2)

Publication Number Publication Date
JP2000348173A true JP2000348173A (ja) 2000-12-15
JP3902887B2 JP3902887B2 (ja) 2007-04-11

Family

ID=15675175

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15859799A Expired - Fee Related JP3902887B2 (ja) 1999-06-04 1999-06-04 唇抽出方法

Country Status (1)

Country Link
JP (1) JP3902887B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006170669A (ja) * 2004-12-13 2006-06-29 Mitsui Mining & Smelting Co Ltd 青果物の品質検査装置
JP2006172381A (ja) * 2004-12-20 2006-06-29 Dkk Toa Corp 画像観測方法およびこの方法を実施する装置
KR100680278B1 (ko) 2005-12-28 2007-02-07 고려대학교 산학협력단 입술모양 추출방법 및 그 장치
JP2007047949A (ja) * 2005-08-08 2007-02-22 Advanced Telecommunication Research Institute International 口トラッキング装置及びコンピュータプログラム
JP2008090792A (ja) * 2006-10-05 2008-04-17 Yamaguchi Univ 遺伝的アルゴリズムを用いた眼球検出法
JP2008125696A (ja) * 2006-11-20 2008-06-05 Yamaguchi Univ 食事支援システム
KR100957194B1 (ko) 2008-06-24 2010-05-11 동명대학교산학협력단 인간과 단말기간의 마우스 인터페이스 시스템 및 제어방법
KR101035768B1 (ko) * 2009-01-02 2011-05-20 전남대학교산학협력단 립 리딩을 위한 입술 영역 설정 방법 및 장치
KR101554403B1 (ko) 2011-03-10 2015-09-18 오므론 가부시키가이샤 화상 처리 장치, 화상 처리 방법, 및 제어 프로그램이 기록된 기억 매체
JP2017126221A (ja) * 2016-01-14 2017-07-20 富士通株式会社 画像処理プログラム、画像処理装置、および画像処理方法
WO2018139242A1 (ja) * 2017-01-27 2018-08-02 パナソニック株式会社 画像解析システム、画像解析方法及びプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006170669A (ja) * 2004-12-13 2006-06-29 Mitsui Mining & Smelting Co Ltd 青果物の品質検査装置
JP2006172381A (ja) * 2004-12-20 2006-06-29 Dkk Toa Corp 画像観測方法およびこの方法を実施する装置
JP2007047949A (ja) * 2005-08-08 2007-02-22 Advanced Telecommunication Research Institute International 口トラッキング装置及びコンピュータプログラム
KR100680278B1 (ko) 2005-12-28 2007-02-07 고려대학교 산학협력단 입술모양 추출방법 및 그 장치
JP2008090792A (ja) * 2006-10-05 2008-04-17 Yamaguchi Univ 遺伝的アルゴリズムを用いた眼球検出法
JP2008125696A (ja) * 2006-11-20 2008-06-05 Yamaguchi Univ 食事支援システム
KR100957194B1 (ko) 2008-06-24 2010-05-11 동명대학교산학협력단 인간과 단말기간의 마우스 인터페이스 시스템 및 제어방법
KR101035768B1 (ko) * 2009-01-02 2011-05-20 전남대학교산학협력단 립 리딩을 위한 입술 영역 설정 방법 및 장치
US8290277B2 (en) 2009-01-02 2012-10-16 Samsung Electronics Co., Ltd. Method and apparatus for setting a lip region for lip reading
KR101554403B1 (ko) 2011-03-10 2015-09-18 오므론 가부시키가이샤 화상 처리 장치, 화상 처리 방법, 및 제어 프로그램이 기록된 기억 매체
JP2017126221A (ja) * 2016-01-14 2017-07-20 富士通株式会社 画像処理プログラム、画像処理装置、および画像処理方法
WO2018139242A1 (ja) * 2017-01-27 2018-08-02 パナソニック株式会社 画像解析システム、画像解析方法及びプログラム

Also Published As

Publication number Publication date
JP3902887B2 (ja) 2007-04-11

Similar Documents

Publication Publication Date Title
US11282185B2 (en) Information processing device, information processing method, and storage medium
KR100480781B1 (ko) 치아영상으로부터 치아영역 추출방법 및 치아영상을이용한 신원확인방법 및 장치
WO2017190656A1 (zh) 行人再识别方法和装置
JP4597391B2 (ja) 顔領域検出装置およびその方法並びにコンピュータ読み取り可能な記録媒体
JP2017531883A (ja) 画像の主要被写体を抽出する方法とシステム
JP2004348674A (ja) 領域検出方法及びその装置
JP2011141622A (ja) 検出装置およびその方法
JP2007257087A (ja) 肌色領域検出装置及び肌色領域検出方法
KR101606760B1 (ko) 영상 내 객체 기반 영상 감정 변환 장치 및 그 방법
JP3902887B2 (ja) 唇抽出方法
KR20150007880A (ko) 영상 화질 개선 방법, 장치 및 기록 매체
Alabbasi et al. Human face detection from images, based on skin color
Arsic et al. Improved lip detection algorithm based on region segmentation and edge detection
JP2007115109A (ja) 画像処理装置および方法、プログラム、並びに記録媒体
JP2004246424A (ja) 肌色領域の抽出方法
JPH10149449A (ja) 画像分割方法、画像識別方法、画像分割装置および画像識別装置
JP2000339471A (ja) 画像抽出方法およびその装置
Youlian et al. Face detection method using template feature and skin color feature in rgb color space
JP4439829B2 (ja) データ分析装置およびデータ認識装置
JP3480408B2 (ja) 物体抽出システムと方法並びに物体抽出用プログラムを記憶した記憶媒体
Dave A lip localization based visual feature extraction method
Nath et al. Lip contour extraction scheme using morphological reconstruction based segmentation
Parente et al. Assessing facial image accordance to ISO/ICAO requirements
JP2022147713A (ja) 画像生成装置、学習装置、及び、画像生成方法
Juneja et al. A hybrid mathematical model for face localization over multi-person images and videos

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060926

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070105

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 3

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 3

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130112

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees