JP2000348173A - 唇抽出方法 - Google Patents
唇抽出方法Info
- Publication number
- JP2000348173A JP2000348173A JP11158597A JP15859799A JP2000348173A JP 2000348173 A JP2000348173 A JP 2000348173A JP 11158597 A JP11158597 A JP 11158597A JP 15859799 A JP15859799 A JP 15859799A JP 2000348173 A JP2000348173 A JP 2000348173A
- Authority
- JP
- Japan
- Prior art keywords
- lip
- color component
- candidate area
- image
- histogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- Spectrometry And Color Measurement (AREA)
Abstract
人差などに依存せずに顔画像から唇部分を精度よく抽出
すること。 【解決手段】 顔画像から第1の唇候補領域を決定す
る工程と、顔画像から第1の唇候補領域の全ての領域と
その周辺の領域を含む第2の唇候補領域を決定する工程
と、第1の唇候補領域の色成分ヒストグラムを作成する
工程と、第2の唇候補領域の色成分ヒストグラムとを作
成する工程と、第1の唇候補領域の色成分ヒストグラム
と第2の唇候補領域の色成分ヒストグラムの差分ヒスト
グラムから唇部分を抽出するための閾値を設定する工程
と、閾値を第1の唇候補領域の色成分ヒストグラムに用
いて色成分による閾値処理を行うことにより第1の唇候
補領域から唇部分を抽出する工程と、を具備する。
Description
像から唇部分を抽出する方法に関する。
し、この検知結果を利用して音声認識の認識精度を向上
する試みがなされている。そして、唇の動き情報を検出
するためには、話者の顔画像から唇部分を精度よく抽出
する必要がある。
は、1990年電子情報通信学会春期全国大会、D−3
29、p7−81、「顔画像からの唇特徴点の抽出法」
などが知られている。
示すブロック図である。
に入力される。背景分離部1001は、入力された顔画
像に、その輝度情報を用いてSobel(エッジ抽出)
オペレータをかることによりエッジを抽出する。次に背
景分離部1001は、顔画像から、顔画像の最も外側の
エッジよりも外側の部分を背景として分離し、顔面画像
とする。背景を分離された顔面画像は、YIQ表色系変
換部1002に入力される。
域の決定するために、背景を分離された顔画像をYIQ
表色系へ色変換する。この色変換された画像は、唇候補
領域決定部1003に入力される。
画面中の色の中で唇部分を示す色が、最も大きなQ軸値
を示すことを考慮に入れて、Q軸に関して濃度値の累積
ヒストグラムをとる。次に、唇候補領域決定部1003
は、この累積ヒストグラムに、濃度値の高い方からx%
の値で閾値処理を行うことで、唇候補領域を決定する。
この、唇候補領域内の画像は唇抽出部1004に入力さ
れる。
れる。 x=(s/(m+n))×ratio×100(%) …(式1) ここで、m×nは原画像の画素数、sは背景分離画像の
画素数で、ratioは顔の面積に対する唇部分の面積
比を表すもので、経験的に定められる。
から唇部分を抽出するため、Q軸に関して濃度値の累積
ヒストグラムをとり、Q軸値により再度閾値処理を行
う。このようにして唇画像が抽出される。
ムから(式2)で与えられるy%の値とする。 y=(s’/(m+n))×level×100(%) …(式2) ここで、s'は唇候補領域内の画素数、levelは唇
候補領域の面積に対する唇部分の面積比を表し、これも
経験的に定められる。
閾値処理により、入力した話者の顔画像から唇部分を抽
出することが可能である。
唇抽出方法では、色成分を用いて唇を抽出しているが、
色成分は照明条件の影響を受けやすいという問題があ
る。
た係数を用いているため、男女差および化粧の有無など
話者の個人差により、唇抽出の精度は影響を受けやすい
という問題もある。
あり、照明など周囲の条件または、話者の個人差などに
依存せずに顔画像から唇部分を精度よく抽出することを
目的とする。
方法では、顔画像から第1の唇候補領域を抽出した後
に、顔画像から、第1の唇候補領域の全ての領域とその
周辺を含む領域を第2の唇候補領域を新たに決定し、第
1の唇候補領域の色成分ヒストグラムと第2の唇候補領
域の色成分ヒストグラムと第1の唇候補領域の色成分ヒ
ストグラムと第2の唇候補領域の色成分ヒストグラムと
の差分ヒストグラムとを作成し、この差分ヒストグラム
から唇部分抽出のための閾値を設定し、この閾値を用い
て第1の唇候補領域の色成分ヒストグラムを閾値処理を
行うことにより唇部分を抽出するものである。
領域と第2の唇候補領域は共に唇部分を含み、第2の唇
候補領域は第1の唇候補領域よりも広い範囲で唇周辺に
おける肌色部分を含む。このため、前述の差分ヒストグ
ラムは唇周辺の肌色部分の色成分ヒストグラムとなる。
従って、差分ヒストグラムの分布から閾値を設定するこ
とにより、対象とする話者の肌と唇部分の色成分の境界
を精度よく抽出することが可能となる。
候補領域、第2の唇候補領域ともに同じ画像を用いるた
め、照明など周囲の条件によって生じる、唇部分抽出精
度の劣化も防ぐことも可能となる。
出方法は、顔画像から第1の唇候補領域を決定する工程
と、顔画像から第1の唇候補領域の全ての領域とその周
辺の領域を含む第2の唇候補領域を決定する工程と、第
1の唇候補領域の色成分ヒストグラムを作成する工程
と、第2の唇候補領域の色成分ヒストグラムとを作成す
る工程と、第1の唇候補領域の色成分ヒストグラムと第
2の唇候補領域の色成分ヒストグラムの差分ヒストグラ
ムから唇部分を抽出するための閾値を設定する工程と、
閾値を第1の唇候補領域の色成分ヒストグラムに用いて
色成分による閾値処理を行うことにより第1の唇候補領
域から唇部分を抽出する工程と、を具備する。
値を設定することにより、対象とする話者の肌と唇部分
の色成分の境界を精度よく抽出することが可能となる。
また、閾値設定のために抽出する第1の唇候補領域、第
2の唇候補領域ともに同じ画像を用いるため、照明など
周囲の条件によって生じる、唇部分抽出精度の劣化も防
ぐことも可能となる。
る唇抽出方法において、予め設定した係数をa、bとし
て、作成するヒストグラムの色成分がRGB表色系の (R−a・G−b・B) である。
顔画像のRGB成分から容易に色成分ヒストグラムを作
成することができる。
第2の態様にかかる唇抽出方法において、第1の唇候補
領域と第2の唇候補領域の面積比が1対1よりも大き
く、1対3よりも小さい。
い閾値を設定できるので、唇の抽出も精度高くできる。
3の態様のいずれかにかかる唇抽出方法において、第1
の唇候補領域を決定する工程は、顔画像から仮唇候補領
域を決定する工程と、仮唇候補領域の色成分ヒストグラ
ムを作成する工程と、予め作成した複数の話者の顔画像
から唇部分を切り出す際に使用した複数の閾値の平均値
である閾値を、仮唇候補領域の色成分ヒストグラムに用
いて色成分による閾値処理を行うことにより、仮唇候補
領域から唇部分を抽出し、2値化を行う工程と、抽出さ
れた唇部分を含む長方形の領域を切り出すことで決定し
た新たな唇候補領域を第1の唇候補領域とする工程と、
を具備する。
て第1の唇候補領域を決定することにより、第1の唇候
補領域を精度よく抽出することが可能となる。さらに、
このように精度よく抽出された第1の唇候補領域を使用
して唇画像を抽出するため、唇を精度よく抽出すること
ができる。
3の態様のいずれかにかかる唇抽出方法において、第1
の唇候補領域を決定する工程は、顔画像から仮唇候補領
域を決定する工程と、仮唇候補領域の色成分ヒストグラ
ムを作成する工程と、予め複数の話者の顔画像から唇部
分を切り出して作成した唇抽出用テンプレートの色成分
ヒストグラムと前記仮唇候補領域の色成分ヒストグラム
を比較し、類似度のもっとも高い唇抽出用テンプレート
の閾値を仮唇候補領域の色成分ヒストグラムに用いて色
成分による閾値処理を行うことにより、仮唇候補領域か
ら唇部分を抽出し、2値化を行う工程と、抽出された唇
部分を含む長方形の領域を切り出すことで決定した新た
な唇候補領域を第1の唇候補領域とする工程と、を具備
する。
て第1の唇候補領域を決定することにより、第1の唇候
補領域を精度よく抽出することが可能となる。さらに、
このように精度よく抽出された第1の唇候補領域を使用
して唇画像を抽出するため、唇を精度よく抽出すること
ができる。
5の態様のいずれかにかかる唇抽出方法において、抽出
した唇部分の色成分の分布と抽出した唇周辺部分の色分
布に対し、RGB色空間上で唇部分と唇周辺部分を2分
する関数 a・R+b・G+c・B+d=0 を求め、唇抽出のために作成するヒストグラムの色成分
を a・R+b・G+c・B とする。
関数により、抽出した唇部分の色成分の分布と抽出した
唇周辺部分の色分布を唇部分と唇周辺部分とに簡単に2
分することができる。また、唇部分と唇周辺部分を2分
する関数から、閾値を設定するための色成分(a・R+
b・G+c・B)の係数(a、b、c)を決定し、この
係数により色成分ヒストグラムを作成することにより、
より精度よく唇部分を抽出することが可能になる。
6の態様のいずれかにかかる唇抽出方法において、第1
の唇候補領域の画像を輝度成分に変換し、エッジ抽出
し、2値化した画像と、色成分により唇部分を抽出した
画像の論理和を取った画像を唇抽出画像として出力す
る。
を行うことにより、より精度の高い唇部分の抽出が可能
となる。
いて詳細に説明する。
音声認識装置の構成を示すブロック図である。この図を
使用して、実施の形態1にかかる音声認識装置ついて説
明する。
と画像処理部103と音声入力部104と音声認識部1
05とを有する構成になっている。
ことによって得られた顔画像を出力する。画像入力部1
02としては、CCDカメラなどが考えられる。
ら入力された顔画像から唇画像を抽出して出力する。画
像処理部103は、顔面画像抽出部106と唇画像抽出
部107とを有する構成になっている。
2から入力された顔画像に、その輝度情報を用いてSo
bel(エッジ抽出)オペレータをかけてエッジを抽出
する。次に顔面画像抽出部106は、最も外側のエッジ
よりも外側の部分顔画像の画像情報を背景として顔画像
から分離し、顔面画像を作成する。顔面画像抽出部10
6は、顔面画像をYIQ表色系変換に変換し、唇画像抽
出部107に入力する。
106が顔画像から顔面画像を抽出する方法として、顔
画像の輝度情報を用いてSobel(エッジ抽出)オペ
レータをかけてエッジを抽出する方法を用いたが、これ
以外の方法を用いてもよく、これ以外の方法を用いた形
態も本発明に包含される。
像から唇画像を抽出して音声認識部105に出力する。
置により集音された音声を音声認識部105に出力す
る。
ら入力された唇画像を用いて、音声入力部104から入
力された音声認識をして、認識結果を出力する。
められた唇画像抽出部107の説明を詳細に行う。
部の構成を示すブロック図である。
れた話者の顔面画像と唇を抽出するための情報から第1
の唇候補領域を決定する。第1の唇候補領域の決定方法
としては、前述の従来例における方法や、第2回画像セ
ンシングシンポジウム講演論文集、A−1、p1〜6、
「色情報とGAを用いた顔画像抽出と個人照合の応用」
に示されているような、予め用意された顔(または唇)
抽出用テンプレートベクトル集合と遺伝的アルゴリズム
を用いたパターンマッチングによる領域抽出法などが考
えられる。なお、第1の唇候補領域の決定方法として、
これら以外の技術を用いることも可能であり、これら以
外の技術を使用して第1の唇候補領域の決定してもよ
い。
れた顔面画像から第1の唇候補領域の全てとその周辺を
含むように決定された第2の唇候補領域を決定する。第
1の唇候補領域と第2の唇候補領域の面積比は、1対1
よりも大きく、1対3よりも小さくなっている。
の唇候補領域の色成分ヒストグラムおよび第2の唇候補
領域の色成分ヒストグラムを作成する。色成分としてR
GB表色系における(R−G−B)成分を横軸として示
している。しかし、色成分として、このほかにも(R−
G)成分、R/G成分、R/(G・B)成分、予め設定
した係数をa、bとして、(R−a・G−b・B)成分
を算出して用いることで入力する顔画像のRGB成分か
ら容易に色成分ヒストグラムを作成できるようにするこ
とや、前述の従来例に示されているYIQ表色系におけ
るQ成分や、HSV表色系におけるH成分、S成分など
を利用することで効果を上げることも可能である。
ヒストグラムと第2の唇候補領域のヒストグラムとの差
分を取った差分ヒストグラムを作成し、この差分ヒスト
グラムのピーク値と予め設定された係数を掛けることに
より得られる値に対応する色成分値を閾値として設定す
る。
ストグラムと閾値設定部204で決定した閾値から唇部
分を抽出し、唇画像として出力する。
補領域および第2の唇候補領域を説明するための概略図
である。
唇候補領域決定部201により決定された第1の唇候補
領域であり、303は第1の唇候補領域の全てとその周
辺を含むように決定された第2の唇候補領域である。
補領域の色成分ヒストグラム(度数分布)と、第2の唇
候補領域の色成分ヒストグラムと、第1の唇候補領域の
色成分ヒストグラムと第2の唇候補領域の色成分ヒスト
グラムとの差分ヒストグラムと、を示す図である。
(R−G−B)成分)、縦軸は色成分の度数である。4
01は第1の唇候補領域302の色成分ヒストグラム、
402は第2の唇候補領域303の色成分ヒストグラ
ム、403は第1の唇候補領域302の色成分ヒストグ
ラムと第2の唇候補領域303の色成分ヒストグラムと
の差分ヒストグラムである。また、404は、第2の唇
候補領域の色成分ヒストグラムの第1のピークであり、
405は、第2の唇候補領域の色成分ヒストグラムの第
2のピークである。
の動作について図2、図3および図4を使用して説明す
る。
話者の顔面画像と唇を抽出するための情報が入力され
る。第1の唇候補領域決定部201は、この顔面画像か
ら第1の唇候補領域302を決定し、色成分ヒストグラ
ム作成部203に出力する。
が、入力された話者の顔面画像から、第1の唇候補領域
302の全てとその周辺を含む領域を第2の唇候補領域
303として新たに決定し、色成分ヒストグラム作成部
203に出力する。
した第1の唇候補領域302の色成分ヒストグラム40
1および第2の唇候補領域303の色成分ヒストグラム
402を作成する。
領域303の色成分ヒストグラムには402、第1のピ
ーク404と第2のピーク405の2つのピークがあ
る。また、第1の唇候補領域302の色成分ヒストグラ
ム401には第2のピーク405と同じ位置にピークが
ある。
ラム401と第2の唇候補領域303の色成分ヒストグ
ラム402とが共にピークを現わしている第2のピーク
405は唇部分301の色成分によるものである。ま
た、第1の唇候補領域302の色成分ヒストグラム40
1にのみはっきりと現れている第1のピーク404は、
唇周辺の肌色部分の色成分によるものである。
ヒストグラム401と第2の唇候補領域303の色成分
ヒストグラム402との差分ヒストグラム403を作成
することにより、唇周辺の肌色成分ヒストグラムを抽出
することが可能となる。
グラムである差分ヒストグラム403を作成し、そのピ
ーク値を求め、このピーク値に対応する色成分値を求め
る。さらに、閾値設定部204は、このピーク値に対応
する色成分値に予め設定された係数を掛けることにより
得られる色成分値を閾値として設定し、唇抽出部205
に出力する。
成分ヒストグラム401の色成分のうち閾値設定部20
4で決定した閾値よりも第2のピーク405側にある色
成分の領域を唇部分として抽出し、唇画像を出力する。
候補領域303の面積比が1対1よりも大きく、1対3
よりも小さい面積比になっている。このような面積比に
することで、精度よく閾値を求めることができるので、
唇を精度よく抽出することができる。なお、面積比はこ
の比率以外でも周囲の環境および個人差によって変更し
ても構わない。
抽出部によれば、第1の唇候補領域と第2の唇候補領域
は共に唇部分を含み、第2の唇候補領域は第1の唇候補
領域よりも広い範囲で唇周辺における肌色部分を含む。
このため、差分ヒストグラムは唇周辺の肌色部分の色成
分ヒストグラムとなる。従って、差分ヒストグラムの分
布から閾値を設定することにより、対象とする話者の肌
と唇部分の色成分の境界を精度よく抽出することが可能
となる。
候補領域、第2の唇候補領域ともに同じ画像を用いるた
め、照明など周囲の条件によって生じる、唇部分抽出精
度の劣化も防ぐことも可能となる。
部によれば、照明などの条件や、男女差、化粧(口紅)
の有無など話者の個人差により、色成分ヒストグラムの
分布が異なっても、これらの影響を受けることなく唇部
分の抽出が可能となる。
形態2にかかる唇画像抽出部の構成を示すブロック図で
ある。この図を使用して、唇画像抽出部の構成について
詳細に説明する。
施の形態1にかかる唇画像抽出部において、第1の唇候
補領域決定方法として仮唇候補領域を用いる点が異なる
のみである。また、既に説明した部分と同じ部分につい
ては同一の符号を付与してある。
1で説明した第1の唇候補領域決定部201と同じ動作
をし、唇候補領域を抽出し、この領域を仮唇候補領域と
する。
候補領域の色成分(R−G−B)のヒストグラムを作成
する。なお、色成分ヒストグラム作成部203と同様に
この色成分以外の色成分を使用しても良い。
る唇画像抽出部により、予め複数の話者の複数の話者の
顔画像から唇画像部分を抽出し、その際に用いた唇画像
抽出のための閾値(色成分)の平均値を算出した閾値を
記憶している。
ヒストグラムと閾値記憶部503に記憶された閾値を用
いて唇部分を抽出し、2値化し、唇画像として出力す
る。
部504から入力せれた唇部分を含む長方形の領域を切
り出し、この領域をあらたに第1の唇候補領域として決
定する。
部の動作について説明する。
の対象となる話者の顔面画像と唇情報が入力される。仮
唇候補領域決定部501は、唇抽出の対象となる話者の
顔面画像に対して、仮唇候補領域を決定し、色成分ヒス
トグラム作成部502に出力する。
が、入力された仮唇候補領域の色成分(R−G−B)の
ヒストグラムを作成し、唇抽出部504に出力する。
成部502から入力された仮唇候補領域の色成分ヒスト
グラムと閾値記憶部503に記憶されている閾値を用い
て唇部分を抽出し2値化し、第1の唇候補領域決定部5
05に出力する。
れた唇部分を含む長方形を切り出し、この領域を第1の
唇候補領域として決定する。
なので説明を省略する。
像抽出部によれば、仮唇候補領域を使用して第1の唇候
補領域を決定することにより、精度よく第1の唇候補領
域を抽出することが可能となる。さらに、このように精
度よく抽出された第1の唇候補領域を使用して唇画像を
抽出するため、唇画像を精度よく抽出することができ
る。
形態3にかかる唇画像抽出部の構成を示すブロック図で
ある。この図を使用して実施の形態3にかかる唇画像抽
出部の構成を説明する。なお、すでに説明した部分と同
一の部分については同一の符号を付与してある。
施の形態1にかかる唇画像抽出部おいて、第1の唇候補
領域決定方法として仮唇候補領域を用いる点が異なるの
みである。また、既に説明した部分と同じ部分について
は同一の符号を付与してある。
の話者の顔画像から唇部分を切り出して作成した色成分
ヒストグラムと閾値が記憶している。
601の色成分ヒストグラムと仮唇候補領域の色成分ヒ
ストグラムを比較する。そして、次に、唇抽出部602
は、比較した結果、類似度のもっとも高い唇抽出用テン
プレートの閾値を用いて仮唇候補領域の画像に対して唇
部分の画像を抽出する。
作について説明する。
り、仮唇候補領域の色成分ヒストグラムが作成され、唇
抽出部602に入力される。
プレート601の色成分ヒストグラムと仮唇候補領域の
色成分ヒストグラムを比較する。そして、唇抽出部60
2は、比較した結果、類似度の最も高い唇抽出用テンプ
レート601の閾値を用いて仮唇候補領域の画像に対し
て唇部分を抽出し、出力する。
は実施の形態2と同様なので説明を省略する。
像抽出部によれば、仮唇候補領域と唇抽出用テンプレー
トを使用して第1の唇候補領域を決定することにより、
精度よく第1の唇候補領域を抽出することが可能とな
る。さらに、このように精度よく抽出された第1の唇候
補領域を使用して唇画像を抽出するため、唇画像を精度
よく抽出することができる。
態4にかかる唇画像抽出部の構成を示すブロック図であ
る。この図を使用して実施の形態4にかかる唇画像抽出
部の構成を説明する。なお、すでに説明した部分と同一
の部分については同一の符号を付与してある。
抽出された部分の色成分の分布をRGBの空間上で作成
する。
は、唇周辺部分の色成分の分布をRGBの空間上で作成
する。
えられた色成分(R、G、B)が唇抽出された部分の色
成分の分布と唇周辺部分の色成分の分布のいずれに属す
るかをRGB色空間上で判別するために用いる判別関数 a・R+b・G+c・B+d=0 を求める。また、判別関数は判別分析により求めること
ができる。判別関数の係数(a、b、c)を用いて第1
の唇候補領域302と第2の唇候補領域303の色成分
パラメータ((a・R+b・G+c・B)を決定する。
なお、実施の形態1に示した色成分(R−G−B)はa
=1、b=−1、c=−1の場合に相当する。
(a、b、c)を用いて第1の唇候補領域302の色成
分(a・R+b・G+c・B)ヒストグラムと、第2の
唇候補領域303の色成分ヒストグラムを作成する。
た部分の色成分の分布と唇周辺部分の色成分の分布をR
GBの色空間上に示した図である。
布をRGBの色空間上に示したものであり、802は仮
唇周辺部分の色成分の分布をRGBの色空間上に示した
ものである。803は、ある与えられた色成分(R、
G、B)が仮唇部分の集合と仮唇周辺部分の集合のいず
れに属するかを判別するための判別関数(a・R+b・
G+c・B+d=0)を示す平面である。
の動作について説明する。
を抽出する。
1がこの唇部分を仮唇部分とし、仮唇部分の色成分分布
を作成し、出力する。同様に、仮唇周辺部分の色成分分
布作成部702は、仮唇周辺の色成分分布を作成し、出
力する。
入力された仮唇部分の色成分の分布801と仮唇周辺部
分の色成分の分布802に対して(RGB)色空間上で
判別分析を行い判別関数 a・R+b・G+c・B+d=0 を求め、この係数(a、b、c)を用いて第1の唇候補
領域302と第2の唇候補領域303の色成分パラメー
タ(a・R+b・G+c・B)を決定し、出力する。
ようにして得られた、係数(a、b、c)を用いて第1
の唇候補領域302の色成分ヒストグラムを作成し、出
力する。さらに、色成分ヒストグラム作成部704は、
第2の唇候補領域303の色成分(a・R+b・G+c
・B)ヒストグラムを作成し、出力する。
と同じであるので説明を省略する。
像抽出部によれば、判別分析の判別関数により閾値を設
定するための色成分(a・R+b・G+c・B)の係数
(a、b、c)を決定し、この色成分を使用して色成分
ヒストグラムを作成することにより、より精度よく唇部
分を抽出することが可能となる。
部分を2分する関数として、判別分析によって求められ
た判別関数を使用したが、判別関数以外の関数、例えば
唇抽出された仮唇部分の色成分分布801と仮唇周辺部
分の色成分の分布802、それぞれの重心間の中点を通
り、重心を結ぶ直線に直交する平面を表わす関数(a・
R+b・G+c・B+d=0)等を使用することも可能
である。また、これらの判別関数以外の関数の係数
(a、b、c)を用いることも当然のことながら可能で
ある。
形態5にかかる唇画像抽出部の構成を示すブロック図で
ある。この図を使用して実施の形態5にかかる唇画像抽
出部について詳細に説明する。なお、既に説明した部分
と同一の部分については同一の符号が付与してある。
の画像データを輝度値で表わされる画像データに変換す
る。
た画像データにエッジオペレーターをかけることにより
エッジを抽出し、さらに2値化する。
を用いて抽出した唇画像とエッジ抽画像の論理和をと
り、唇画像として出力する。
の動作について説明する。
分の処理は実施の形態1と同様であるので、説明を省略
する。
候補領域抽出した後、輝度値変換部901は、第1の唇
候補領域の画像データを輝度値で表わされる画像データ
に変換し、出力する。
換された画像データにエッジオペレーターをかけること
によりエッジを抽出し、さらに2値化して出力する。
1と同様に色成分ヒストグラムを用いて抽出した唇画像
とエッジ抽出部902から入力されたエッジ抽出画像の
論理和をとり、これを唇画像として出力する。
唇画像抽出部によれば、色成分による唇抽出だけでなく
輝度成分による唇抽出も行うことにより、より精度の高
い唇部分の抽出が可能となる。
方式では、照明などの条件や話者の個人差に影響を受け
ることなく、唇部分を精度よく抽出することが可能とな
る。
宜組み合わせることにより、さらに精度を上げることも
可能である。
成は、図2、図5〜7、図9に限定されるものではな
く、各処理部、例えば色成分ヒストグラム作成部を設け
る数を増やす等して並列化し、処理を高速化することも
できる。また、本発明にかかる唇画像抽出部の各処理
部、例えば閾値設定部、色成分ヒストグラム作成部など
に複数回の処理をさせることにより、小型化することも
できる。
音声認識装置に適用したが、唇画像抽出部をこれ以外の
装置に適用することも可能であり、本発明に含まれる。
照明などの条件や話者の個人差に影響を受けることな
く、唇部分を精度よく抽出することが可能となる。
ック図
構成を示すブロック図
第2の唇候補領域を説明するための概略図
分ヒストグラムと、第2の唇候補領域の色成分ヒストグ
ラムと、第1の唇候補領域の色成分ヒストグラムと第2
の唇候補領域の色成分ヒストグラムとの差分ヒストグラ
ムを示す図
構成を示すブロック図
構成を示すブロック図
構成を示すブロック図
分の分布と唇周辺部分の色成分の分布をRGBの色空間
上に示した図
構成を示すブロック図
図
Claims (7)
- 【請求項1】 顔画像から第1の唇候補領域を決定する
工程と、前記顔画像から前記第1の唇候補領域の全ての
領域とその周辺の領域を含む第2の唇候補領域を決定す
る工程と、前記第1の唇候補領域の色成分ヒストグラム
を作成する工程と、前記第2の唇候補領域の色成分ヒス
トグラムとを作成する工程と、前記第1の唇候補領域の
色成分ヒストグラムと前記第2の唇候補領域の色成分ヒ
ストグラムの差分ヒストグラムから唇部分を抽出するた
めの閾値を設定する工程と、前記閾値を前記第1の唇候
補領域の色成分ヒストグラムに用いて色成分による閾値
処理を行うことにより前記第1の唇候補領域から唇部分
を抽出する工程と、を具備することを特徴とする唇抽出
方法。 - 【請求項2】 予め係数a,bを設定し、作成する色成
分ヒストグラムの色成分がRGB表色系の(R−a・G
−b・B)であることを特徴とする請求項1記載の唇抽
出方法。 - 【請求項3】 前記第1の唇候補領域と前記第2の唇候
補領域の面積比が1対1よりも大きく、1対3よりも小
さいことを特徴とする請求項1又は請求項2に記載の唇
抽出方法。 - 【請求項4】 前記第1の唇候補領域を決定する工程
は、前記顔画像から仮唇候補領域を決定する工程と、前
記仮唇候補領域の色成分ヒストグラムを作成する工程
と、予め作成した複数の話者の顔画像から唇部分を切り
出す際に使用した複数の閾値の平均値である閾値を、前
記仮唇候補領域の色成分ヒストグラムに用いて色成分に
よる閾値処理を行うことにより、前記仮唇候補領域から
唇部分を抽出し、2値化を行う工程と、前記抽出された
唇部分を含む長方形の領域を切り出すことで決定した新
たな唇候補領域を前記第1の唇候補領域とする工程と、
を具備することを特徴とする請求項1から請求項3のい
ずれかに記載の唇抽出方法。 - 【請求項5】 前記第1の唇候補領域を決定する工程
は、前記顔画像から仮唇候補領域を決定する工程と、前
記仮唇候補領域の色成分ヒストグラムを作成する工程
と、予め複数の話者の顔画像から唇部分を切り出して作
成した唇抽出用テンプレートの色成分ヒストグラムと前
記仮唇候補領域の色成分ヒストグラムを比較し、類似度
のもっとも高い唇抽出用テンプレートの閾値を前記仮唇
候補領域の色成分ヒストグラムに用いて色成分による閾
値処理を行うことにより、前記仮唇候補領域から唇部分
を抽出し、2値化を行う工程と、前記抽出された唇部分
を含む長方形の領域を切り出すことで決定した新たな唇
候補領域を前記第1の唇候補領域とする工程と、を具備
することを特徴とする請求項1から請求項3のいずれか
に記載の唇抽出方法。 - 【請求項6】 前記抽出した唇部分の色成分の分布と前
記抽出した唇周辺部分の色分布に対し、RGB色空間上
で唇部分と唇周辺部分を2分する関数 a・R+b・G+c・B+d=0 を求め、唇抽出のために作成するヒストグラムの色成分
を a・R+b・G+c・B とすることを特徴とする請求項1から請求項5のいずれ
かに記載の唇抽出方法。 - 【請求項7】 前記第1の唇候補領域の画像を輝度成分
に変換し、エッジ抽出し、2値化した画像と、前記色成
分により唇部分を抽出した画像の論理和を取った画像を
唇抽出画像として出力することを特徴とする請求項1か
ら請求項6のいずれかに記載の唇抽出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15859799A JP3902887B2 (ja) | 1999-06-04 | 1999-06-04 | 唇抽出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15859799A JP3902887B2 (ja) | 1999-06-04 | 1999-06-04 | 唇抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000348173A true JP2000348173A (ja) | 2000-12-15 |
JP3902887B2 JP3902887B2 (ja) | 2007-04-11 |
Family
ID=15675175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15859799A Expired - Fee Related JP3902887B2 (ja) | 1999-06-04 | 1999-06-04 | 唇抽出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3902887B2 (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006170669A (ja) * | 2004-12-13 | 2006-06-29 | Mitsui Mining & Smelting Co Ltd | 青果物の品質検査装置 |
JP2006172381A (ja) * | 2004-12-20 | 2006-06-29 | Dkk Toa Corp | 画像観測方法およびこの方法を実施する装置 |
KR100680278B1 (ko) | 2005-12-28 | 2007-02-07 | 고려대학교 산학협력단 | 입술모양 추출방법 및 그 장치 |
JP2007047949A (ja) * | 2005-08-08 | 2007-02-22 | Advanced Telecommunication Research Institute International | 口トラッキング装置及びコンピュータプログラム |
JP2008090792A (ja) * | 2006-10-05 | 2008-04-17 | Yamaguchi Univ | 遺伝的アルゴリズムを用いた眼球検出法 |
JP2008125696A (ja) * | 2006-11-20 | 2008-06-05 | Yamaguchi Univ | 食事支援システム |
KR100957194B1 (ko) | 2008-06-24 | 2010-05-11 | 동명대학교산학협력단 | 인간과 단말기간의 마우스 인터페이스 시스템 및 제어방법 |
KR101035768B1 (ko) * | 2009-01-02 | 2011-05-20 | 전남대학교산학협력단 | 립 리딩을 위한 입술 영역 설정 방법 및 장치 |
KR101554403B1 (ko) | 2011-03-10 | 2015-09-18 | 오므론 가부시키가이샤 | 화상 처리 장치, 화상 처리 방법, 및 제어 프로그램이 기록된 기억 매체 |
JP2017126221A (ja) * | 2016-01-14 | 2017-07-20 | 富士通株式会社 | 画像処理プログラム、画像処理装置、および画像処理方法 |
WO2018139242A1 (ja) * | 2017-01-27 | 2018-08-02 | パナソニック株式会社 | 画像解析システム、画像解析方法及びプログラム |
-
1999
- 1999-06-04 JP JP15859799A patent/JP3902887B2/ja not_active Expired - Fee Related
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006170669A (ja) * | 2004-12-13 | 2006-06-29 | Mitsui Mining & Smelting Co Ltd | 青果物の品質検査装置 |
JP2006172381A (ja) * | 2004-12-20 | 2006-06-29 | Dkk Toa Corp | 画像観測方法およびこの方法を実施する装置 |
JP2007047949A (ja) * | 2005-08-08 | 2007-02-22 | Advanced Telecommunication Research Institute International | 口トラッキング装置及びコンピュータプログラム |
KR100680278B1 (ko) | 2005-12-28 | 2007-02-07 | 고려대학교 산학협력단 | 입술모양 추출방법 및 그 장치 |
JP2008090792A (ja) * | 2006-10-05 | 2008-04-17 | Yamaguchi Univ | 遺伝的アルゴリズムを用いた眼球検出法 |
JP2008125696A (ja) * | 2006-11-20 | 2008-06-05 | Yamaguchi Univ | 食事支援システム |
KR100957194B1 (ko) | 2008-06-24 | 2010-05-11 | 동명대학교산학협력단 | 인간과 단말기간의 마우스 인터페이스 시스템 및 제어방법 |
KR101035768B1 (ko) * | 2009-01-02 | 2011-05-20 | 전남대학교산학협력단 | 립 리딩을 위한 입술 영역 설정 방법 및 장치 |
US8290277B2 (en) | 2009-01-02 | 2012-10-16 | Samsung Electronics Co., Ltd. | Method and apparatus for setting a lip region for lip reading |
KR101554403B1 (ko) | 2011-03-10 | 2015-09-18 | 오므론 가부시키가이샤 | 화상 처리 장치, 화상 처리 방법, 및 제어 프로그램이 기록된 기억 매체 |
JP2017126221A (ja) * | 2016-01-14 | 2017-07-20 | 富士通株式会社 | 画像処理プログラム、画像処理装置、および画像処理方法 |
WO2018139242A1 (ja) * | 2017-01-27 | 2018-08-02 | パナソニック株式会社 | 画像解析システム、画像解析方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3902887B2 (ja) | 2007-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11282185B2 (en) | Information processing device, information processing method, and storage medium | |
KR100480781B1 (ko) | 치아영상으로부터 치아영역 추출방법 및 치아영상을이용한 신원확인방법 및 장치 | |
WO2017190656A1 (zh) | 行人再识别方法和装置 | |
JP4597391B2 (ja) | 顔領域検出装置およびその方法並びにコンピュータ読み取り可能な記録媒体 | |
JP2017531883A (ja) | 画像の主要被写体を抽出する方法とシステム | |
JP2004348674A (ja) | 領域検出方法及びその装置 | |
JP2011141622A (ja) | 検出装置およびその方法 | |
JP2007257087A (ja) | 肌色領域検出装置及び肌色領域検出方法 | |
KR101606760B1 (ko) | 영상 내 객체 기반 영상 감정 변환 장치 및 그 방법 | |
JP3902887B2 (ja) | 唇抽出方法 | |
KR20150007880A (ko) | 영상 화질 개선 방법, 장치 및 기록 매체 | |
Alabbasi et al. | Human face detection from images, based on skin color | |
Arsic et al. | Improved lip detection algorithm based on region segmentation and edge detection | |
JP2007115109A (ja) | 画像処理装置および方法、プログラム、並びに記録媒体 | |
JP2004246424A (ja) | 肌色領域の抽出方法 | |
JPH10149449A (ja) | 画像分割方法、画像識別方法、画像分割装置および画像識別装置 | |
JP2000339471A (ja) | 画像抽出方法およびその装置 | |
Youlian et al. | Face detection method using template feature and skin color feature in rgb color space | |
JP4439829B2 (ja) | データ分析装置およびデータ認識装置 | |
JP3480408B2 (ja) | 物体抽出システムと方法並びに物体抽出用プログラムを記憶した記憶媒体 | |
Dave | A lip localization based visual feature extraction method | |
Nath et al. | Lip contour extraction scheme using morphological reconstruction based segmentation | |
Parente et al. | Assessing facial image accordance to ISO/ICAO requirements | |
JP2022147713A (ja) | 画像生成装置、学習装置、及び、画像生成方法 | |
Juneja et al. | A hybrid mathematical model for face localization over multi-person images and videos |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060914 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060926 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070105 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100112 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100112 Year of fee payment: 3 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100112 Year of fee payment: 3 |
|
R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100112 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100112 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100112 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110112 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120112 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120112 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130112 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |