JP2000076459A - 人物同定方法及び装置 - Google Patents

人物同定方法及び装置

Info

Publication number
JP2000076459A
JP2000076459A JP10250014A JP25001498A JP2000076459A JP 2000076459 A JP2000076459 A JP 2000076459A JP 10250014 A JP10250014 A JP 10250014A JP 25001498 A JP25001498 A JP 25001498A JP 2000076459 A JP2000076459 A JP 2000076459A
Authority
JP
Japan
Prior art keywords
image
face
person
same person
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10250014A
Other languages
English (en)
Inventor
Makoto Fujimoto
良 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP10250014A priority Critical patent/JP2000076459A/ja
Publication of JP2000076459A publication Critical patent/JP2000076459A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Collating Specific Patterns (AREA)

Abstract

(57)【要約】 【課題】音声を利用して人物の同定の能力を向上させ
る。 【解決手段】音声付き画像データベース101には、顔
画像101iとその人物の声の特徴パラメータを含むタ
グ101tとを含むエントリ101aが登録されてい
る。人物判定システム102は、新規画像データが入力
されると、データベース101からエントリを取り込
み、入力画像に顔が含まれていれば、その入力画像とと
もに入力された音声がタグの特徴パラメータと一致する
か判定する。一致すれば同一の人物と判定して、その入
力画像にデータベースから読み込まれたエントリのタグ
と同じタグを付けてデータベースに登録する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えばデジタルカ
メラ等により撮影された音声付きの顔画像における人物
の同定についての方法及び装置に関する。
【0002】
【従来の技術】画像の入力手段として、いわゆる写真の
他にも、デジタルカメラやカムコーダといった、画像と
音声とを同時にデジタル画像として記録できる装置があ
る。
【0003】コンピュータでの画像処理の1つには、こ
のような装置で撮影された顔画像の人物同定がある。こ
れは画像中に撮影されている人間の顔について、それが
誰の顔であるか、又ある画像中のある顔が別の画像中の
ある顔と同一であるかどうか、といった判定を行うもの
である。ある人物について、その人物の顔を色々な向
き、色々な表情の画像を複数準備されている場合は、あ
る1枚の顔画像がその人であるかどうかの判定はかなり
の程度で可能となる。
【0004】この場合まずある画像中から顔の部分をと
り出し、しかる後にとり出した顔画像の人物同定を行う
ことになる。その具体的方法であるが、まず顔の部分の
抽出については次の文献の方法などがすぐれている。 「複数人物画像からの人物個別抽出に関する検討」平山
泰崇他 1997年電子情報通信学会総合大会D−12
−71 この様な方法により顔を含む画像から注目すべき顔をと
り出し、大きさ、角度、輝度などを正規化した後、フー
リエスペクトルのKL展開法で人物の固有を行う。これ
は技術的には、例えば複数枚の顔画像をもとにKL(カ
ルーネン・レーベ)変換し、KL空間(固有空間)上へ
の写像という形で人物同定するものである。この方法に
ついて、より詳細には、例えば次の文献を参照された
い。 「固有空間法を用いた濃淡画像からの顔の向きの推定
法」信学技法IE97−40P111〜 渡辺彰裕他 「濃淡画像マッチングによるロバストな正面顔の識別
法」(フーリエスペクトルのKL展開の応用)電子情報
通信学会論文誌’93/7Vol.J76−D−IIN
o.7P1363〜 赤松茂他 「動画像を用いた顔認識システム」信学技法PRMU9
7−50(1997−06)P17〜 山口修他 また、固有空間を用いなくとも、画像データベースがた
くさんあればパターンマッチという方法等も考えられ
る。同一人物の写った複数の画像を最初に人間が入力す
るシステムであるならば(一定の人の人物同定システ
ム、監視システムなど)、KL変換やパターンマッチの
方法を用いることにより人物同定が可能である。
【0005】このほか、重ね合わせにより顔画像の類似
度を求めてもよい。即ち、抽出され、正規化された顔画
像をブロック化してその輝度間の距離を求める。この手
法については次の文献が詳しい。 「コンピュータによる顔の認識の研究動向」赤松茂 電
子情報通信学会誌Vol80No.3P257〜266
1997年3月 又、輝度が形成する等濃度曲線を利用してもよい。この
手法については次の文献が詳しい。 「等濃線分布に基づく正面顔画像の識別」上野邦和他
電子情報通信学会論文誌D−IINo.3P494〜50
6 1993年3月
【発明が解決しようとする課題】しかしながら、同一人
物であることが予め判っている複数の画像が用意されて
いない場合には、2つの画像に写っている人物の顔が同
一であるか判定することは難しい。すなわち、同一人物
の画像であっても、画像撮影時の照明条件の違い、顔の
軸の角度の違い、顔の向きの違い、表情の違い、髪形等
の変化などにより、その画像データからそれらが同一人
物であるということをコンピュータで判定するのは非常
に困難である。現状では、1枚の顔画像だけから別の同
一人物の顔画像で同一性を判定することは、上記の各種
条件が比較的一致してる場合を除いては、全く不可能と
いって良い状況にある。
【0006】すなわち、上述したパターンマッチやKL
展開法を用いて、ある顔画像を、多くの顔画像データベ
ースに基づいて同定することは現状でも可能であるが、
その顔画像データベースを構築するためには、人手によ
って同一人物の画像であるか判定し、同一であれば、そ
れらの顔画像を同一人物の顔画像としてデータベースに
登録する作業が必要となる。
【0007】また、登録された顔画像が少ない段階で
は、パターンマッチやKL展開法を用いても高精度で人
物を同定することは難しい。
【0008】本発明は上記従来例に鑑みてなされたもの
で、集積された顔画像が少なくとも、高率で人物を同定
できる人物同定方法及び装置を提供することを目的とす
る。
【0009】
【課題を解決するための手段】上記目的を達成するため
に、本発明は次のような構成からなる。すなわち、音声
と対応づけられた画像を用いた人物同定方法であって、
第1の画像中に写っている顔と、第2の画像に写ってい
る顔とが同一人物かどうかを判定する第1の判定工程
と、前記第1及び第2の画像に付随している音声が同一
人物のものであるかどうかを判定する第2の判定工程
と、前記第1の判定工程あるいは第2の判定工程のいず
れかにより同一人物と判定された画像を、同一の人物で
あると判定する第3の判定工程とを有する。
【0010】あるいは、音声と対応づけられた画像を用
いた人物同定方法であって、第1の画像中に写っている
顔と、第2の画像に写っている顔との画像の類似度を算
出する第1の算出工程と、前記第1及び第2の画像に付
随している音声の類似度を算出する第2の算出工程と、
前記画像の類似度と音声の類似度との二乗和が所定値以
上である場合に、前記第1の画像の顔と第2の画像の顔
とは同一人物であると判定する判定工程とを有する。
【0011】あるいは、音声と対応づけられた画像を用
いた人物同定装置であって、第1の画像中に写っている
顔と、第2の画像に写っている顔とが同一人物かどうか
を判定する第1の判定手段と、前記第1及び第2の画像
に付随している音声が同一人物のものであるかどうかを
判定する第2の判定手段と、前記第1の判定手段あるい
は第2の判定手段のいずれかにより同一人物と判定され
た画像を、同一の人物であると判定する第3の判定手段
とを有する。
【0012】あるいは、音声と対応づけられた画像を用
いた人物同定装置であって、第1の画像中に写っている
顔と、第2の画像に写っている顔との画像の類似度を算
出する第1の算出手段と、前記第1及び第2の画像に付
随している音声の類似度を算出する第2の算出手段と、
前記画像の類似度と音声の類似度との二乗和が所定値以
上である場合に、前記第1の画像の顔と第2の画像の顔
とは同一人物であると判定する判定手段とを有する。
【0013】あるいは、コンピュータに、第1の画像中
に写っている顔と、第2の画像に写っている顔とが同一
人物かどうかを判定する第1の判定手段と、前記第1及
び第2の画像に付随している音声が同一人物のものであ
るかどうかを判定する第2の判定手段と、前記第1の判
定手段あるいは第2の判定手段のいずれかにより同一人
物と判定された画像を、同一の人物であると判定する第
3の判定手段として機能させるプログラムを格納するコ
ンピュータ可読記憶媒。
【0014】あるいは、コンピュータに、第1の画像中
に写っている顔と、第2の画像に写っている顔との画像
の類似度を算出する第1の算出手段と、前記第1及び第
2の画像に付随している音声の類似度を算出する第2の
算出手段と、前記画像の類似度と音声の類似度との二乗
和が所定値以上である場合に、前記第1の画像の顔と第
2の画像の顔とは同一人物であると判定する判定手段と
して機能させるプログラムを格納するコンピュータ可読
記憶媒。
【0015】
【発明の実施の形態】[第1の実施の形態]図1は、本
発明の特徴をよく表わす、音声付き顔画像データベース
へと顔画像を登録したり、あるいは顔画像を検索するデ
ータベース管理システムのブロック図である。
【0016】音声付画像データベース101には、人物
ごとの声の特徴パラメータが含まれたタグ101tと顔
画像データ101iとが含まれたエントリ101aが格
納されている。なお、タグには音声の特徴パラメータが
含まれていないエントリもある。新たな顔画像をデータ
ベースに登録する際には、まずデータベース101から
人物判定システムに(音声付)画像データが送付され
る。人物判定システム102では以下に詳細に述べる様
にして新規の顔画像とデータベースから送付されたエン
トリとの同一人物性を判定する。
【0017】同一人物(既に登録済みの人物と同一人
物)の際には、新規画像データを含むエントリにその人
物のコードをタグとしてデータに付与し、そのエントリ
をデータベース101に追加する。したがって、同一人
物の顔画像が複数入力されると、同じタグを有するエン
トリが複数登録されている状態となりえる。タグのコー
ドは例えばナンバーとする。もし同一人物がデータベー
スに登録されておらず、全く新しい人物であると判定さ
れた場合には、顔画像に付随する音声データから特徴パ
ラメータを抽出して、その特徴パラメータと新たなコー
ドとをタグに付与し、そのタグを取り付けた新規画像デ
ータを新たなエントリとしてデータベース101に登録
する。以上を人物判定システム102により行うことに
より、自動的に新規の顔画像と登録済みの顔画像との同
一人物の判定が行われる。
【0018】次に、人物判定システムにおける上記処理
手順について説明する。図2は、人物判定システムによ
る、人物の同定の手順を示すフローチャートである。
【0019】まず、音声付画像データベース101に新
たに登録される画像データは、ステップS201におい
て、この人物判定システムにより受けとられる。図1で
は、新規画像データはデータベース101とは関係なく
人物判定システム102に入力されているが、新規画像
の登録はデータベース101で受け付けられ、新規の画
像データもデータベース101から入力されてもよい。
【0020】人物判定システム201に入力された新規
の音声付画像データに対して、その画像中に人間の顔が
含まれているかどうかという顔認定がステップS202
で行われる。この具体的方法は、従来の技術の欄の示し
た通り、既に知られている技術を用いることができる。
ここで、顔画像が含まれていなければ処理は終りであ
る。
【0021】顔画像が含まれている場合は、その画像に
音声データが付いているかどうかをステップS203に
て検出する。音声がついているか否かは、例えば画像デ
ータの入力時に、音声データが付随することを示すコー
ドも同時に入力させることで、そのコードに基づいて判
定できる。音声データが付いている場合はステップS2
04へ、付いていない場合はステップS205へ進む。
【0022】ステップS204では、条件αが満たされ
ているかが判定される。条件αとは次のようなものであ
る。
【0023】条件α:「入力画像中の最大の顔面積を持
つ顔の顔面積が所定値以上であり、その画像に含まれて
いる他の顔の顔面積(0も含む)が最大の面積を持つ顔
の面積に対して一定比率以下である。」 この条件を満たさないと、入力画像において、どの顔を
新規登録すべき顔として位置づけるかが不明確になって
しまったり、顔画像が小さすぎて顔の詳細が不明瞭にな
ってしまうからである。したがって、この条件αが満た
されなければ処理は終了する。
【0024】条件αが満たされた場合、入力画像中の最
大の顔がこの画像中の同定されるべき人物の顔となる。
その後ステップS206に進み、音声による話者認識を
行う。この話者認識の具体的な方法については次の論文
に記載されている。 「単文中の母音を用いた話者照合」長内隆他 日本音響
学会講演論文集P71〜72平成9年3月 「韻律情報を用いた話者認識」早川昭二他 日本音響学
会講演論文集P67〜68平成9年3月 ここで、例えば音声を同時に記録できるデジタルカメラ
で撮影した場合など、1つの画像に多くの人が写ってい
る場合は、その画像とともに録音された音声が画像中の
誰の声であるのかの判定が難しい。しかしながら、条件
αが満たされている場合には、その画像に付随する音声
は画像中の最大の顔の人物の声であるものとして、話者
認識による人物の同定を行うものとする。
【0025】ステップS266においては、データベー
ス101に既に登録されているエントリを1つずつとり
出し、各エントリのタグに含まれる音声の特徴パラメー
タと、入力画像に付随する音声データから抽出した特徴
パラメータとを比較して、それらが同一人物の声である
か同定する。すなわち、音声が一致するか比較してその
話者を認識する。
【0026】入力された顔画像の人物が、データベース
101に既に登録されているいずれかの人物と同一人物
であると認定された場合は、ステップS208で、入力
顔画像に、同一であると認定された人物のエントリのタ
グを付けて、ステップS210でデータベースに登録す
る。この際、タグには抽出した音声パラメータを付与す
る。これにより、既に登録されている人物と同一人物の
顔画像が、それらが同一であることが識別可能なように
新たに登録される。
【0027】一方、ステップS203で、顔画像データ
に音声が付いていないと判定された場合は、ステップS
205で先に述べた条件αの判定を行い、注目顔画像の
存在を確認する。存在する場合はステップS207へと
進む。ステップS207では、従来の技術の欄で述べた
様に、複数枚の画像データがあるものについてはKL変
換法やパターンマッチング法などを用いて、画像だけに
よる同一人物性の判定を行う。既にデータベース101
に登録されている人物であれば、ステップS208へ進
む。
【0028】同一人物が登録されていなければ、入力さ
れた顔画像は新しい人物なので、ステップS209でそ
の画像に新しいタグを付与し、ステップS210でデー
タベースに戻す。ステップS209で新しいタグを付与
する際には、その画像に付随する音声データがあれば、
その特徴パラメータを抽出してそれをタグに付与してお
く。
【0029】またステップS206で、音声の特徴パラ
メータが一致しない場合はステップS207に進む。
【0030】以上の様にして、データベースに登録済み
の人物と入力された人物とが同一であるかの判定が自動
的に行われる。それと共に、同一であると判定された場
合は、同一コードの付与されたタグを付して登録される
ために、同一の人物の画像であることが識別できる形式
で、その人についての顔画像データが増加していくこと
になる。このため、KL変換法やパターンマッチングと
いった複数の画像に基づく顔の同定が、より一層しやす
くなる。
【0031】以上説明したように、顔画像から人物を同
定する際に、顔画像に対応する音声を利用することによ
り、画像だけからでは不可能であった人物の同定が可能
になる。
【0032】また、顔画像を検索する場合にも、上述の
手順で顔画像が同一人物のものであるか判定して検索す
ることが可能である。
【0033】[第2の実施の形態]図3は、画像データ
が登録された音声付き画像データベース101を、顔画
像及び音声をキーとして検索したり、あるいは新たな画
像データを登録するためのデータベース管理システムの
ブロック図である。データベース101は、第1の実施
の形態で説明したものと同一である。すなわち、音声デ
ータ(音声の特徴パラメータ)を付すことが可能な画像
データが、音声付画像データベース101に蓄積されて
いる。
【0034】画像の登録時には、登録しようとする顔画
像の含まれた画像データと音声データが、それぞれ人物
判定システム103の顔画像判定部103aと音声判定
部103bとに入力される。その後、データベース10
1から登録されたエントリが読み出され、顔画像,音声
それぞれによる同一人物の判定がおこなされる。ただ
し、入力画像データに音声がついていない場合や、デー
タベースのエントリに音声データ(特徴パラメータ)が
含まれていない場合には、音声の判定は行わない。
【0035】顔画像判定部103aでは、顔画像による
同一人物の判定がおこなわれる。まず、入力画像データ
から顔領域を抽出する(方法については既述)。そし
て、この画像が第1実施形態と同じ条件αを満たすか否
か、すなわち、入力画像中の最大の顔面積を持つ顔の顔
面積が所定値以上であり、その画像に含まれている他の
顔の顔面積(0も含む)が最大の面積を持つ顔の面積に
対して一定比率以下であるかを判定する。条件αに適合
すると、画像中の最大の顔を注目顔画像として、その顔
と同一人物がデータベース101に含まれているか判定
される。なお、ある人物の顔としてデータベースに登録
される画像を注目顔画像だけとしておけば、データベー
スからとり出した画像について顔領域を抽出する手間が
省ける。
【0036】この様にして入力画像から抽出された画像
と、データベースから取り込んだ画像との間で、顔画像
の類似度を求める。この方法としては、既存のパターン
マッチング法等を用いる。ここで得られた類似度をα
(0≦α≦1)とする。類似度αは合成判定部104へ
と送付される。なお、類似度α(0≦α≦1)は、α=
1が完全に同一人物、0が完全に別人、0<α<1がそ
の中間であることを示す。
【0037】音声判定部103bは、顔画像判定部10
3aで比較される顔画像に付随している音声について、
その話者が、データベースから読み込まれたエントリの
人物と同一人物かどうかの類似性の判定を行う。この方
法としては、第1の実施の形態で述べた話者認識を適用
できる。すなわち、データベースの各エントリには、第
1の実施の形態と同じく音声の特徴パラメータが付され
ているので、画像データとともに入力された音声から抽
出した特徴パラメータと、タグに付された特徴パラメー
タとを比較して音声の類似度を求める。この音声の類似
度をβ(0≦β≦1)とする。類似度βは合成判定部1
04へと送付される。なお、類似度β(0≦β≦1)
は、β=1が完全に同一人物、β=φが完全に別人、0
<β<1がその中間であることを示す。
【0038】合成判定部104では、顔画像判定部10
3aから送付されてきた画像類似度αと、音声判定部1
03bから送付されてきた音声類似度βとからそれらの
二乗和(α^2+β^2,ただしx^yはxのy乗を表す)を
求め、その値を所定の閾値kと比較する。その結果、類
似どの二乗和が所定値よりも大きい場合には、2つの画
像の顔の人物が同一人物であると判定する。その結果は
結果出力部105に送付される。なお、より一般に、類
似度のn乗和(α^n+β^n)を所定の閾値>kと比較し
ても良い。
【0039】一致が確認された場合、顔画像の登録であ
れば、入力顔画像に一致した顔画像を含むエントリと同
一のタグを取り付け、データベースに登録する。ただ
し、音声データについては、入力画像に付随した音声か
ら抽出した特徴パラメータを付す。ただし、入力顔画像
に一致した顔画像を含むエントリのタグに含まれる特徴
パラメータを付しても良い。
【0040】また、一致が確認された場合、顔画像の検
索であれば、一致したエントリを検索結果として出力す
る。
【0041】なお、類似度の二乗和あるいはn乗和を判
定基準にする理由は、「音声も画像も大体似てる」もの
より「少なくともどちらか一方が非常に似ている」もの
を重視するためである。例えば、α=0.5,β=0.
5のケースでは、α+β=1.0,α^2+β^2=(0.
5)^2+(0.5)^2=0.5である。
【0042】一方α=0.9,β=0.1のケースで
は、α+β=1.0,α^2+β^2=(0.9)^2+
(0.1)^2=0.82である。
【0043】両ケースとも、α+β=1.0でありこれ
は一致するが、α^2+β^2は、後者のほうが大きくな
る。0≦α^2+β^2≦2であることを考えるなら、その
差は大きい。
【0044】これは例えば次のケースを考えるとわか
る。 (ケース1)音声はそっくりであるが顔画像が随分と異
なる場合 先にも述べた様に向きや表情が大きく違ってしまうと画
像自体による判定では随分違う画像という判断を下して
しまいがちである。しかし、音声が十分似ていればむし
ろ同一人物である可能性が高い。 (ケース2)画像はそっくりであるが音声が非常に異な
る場合 違う人の音声が入っていた可能性が高い。
【0045】従って上記の様な考察により、α+βで判
定するのでなくα^2+β^2の値(より正確にはα^n+β
^n(n>1)の値)で、一致の判定をすることが好まし
い。
【0046】図4は、図3の構成をプログラムにより実
現するための手順を示すフローチャートである。このフ
ローチャート及び図2のフローチャートは、図5に示す
コンピュータシステムによりこれらの図の手順のプログ
ラムを実行することで実現できる。
【0047】図4において、入力画像データ及びデータ
ベース101から取り込んだ画像データから、条件αを
満足する注目顔画像を抽出する。ただし、データベース
には注目顔画像だけを登録している場合には、データベ
ースから取り込んだ画像についてはこの処理は不要であ
る。ステップS402ではm顔画像の類似度αを算出
し、ステップS403では画像に付随する音声の類似度
βを判定する。ステップS404デ、二乗和が所定の閾
値よりも大きいか判定し、大きければ同一と判定し(ス
テップS406)、小さければ比同一と判定する(ステ
ップS405)。最後に結果を出力し(ステップS40
7)、必要に応じて新規エントリの登録や検索画像の出
力を行う。
【0048】図5は、第1の実施形態及び第2の実施形
態に共通に用い得る、データベースシステムと接続され
たコンピュータシステムのブロック図である。図2ある
いは図4の手順のプログラムは、プログラムファイルと
して固定あるいは取り外し可能な記憶媒体を含む2次記
憶部110cに格納され、メモリ110bにロードされ
る。それをCPU110aにより実行して、図2あるい
は図4の手順が実現される。入力される画像は画像入力
部110dから読み込まれ、音声があればその音声とと
もに二次記憶部110cなどに格納される。新規エント
リの追加や検索の際には、その格納されたデータと、デ
ータベースシステム101から順次読み出されるエント
リとに対して、図2あるいは図4のプログラムにより処
理が行われる。
【0049】
【他の実施形態】なお、本発明は、複数の機器(例えば
ホストコンピュータ,インタフェイス機器,リーダ,プ
リンタなど)から構成されるシステムに適用しても、一
つの機器からなる装置(例えば、複写機,ファクシミリ
装置など)に適用してもよい。
【0050】また、本発明の目的は、前述した実施形態
の機能を実現する図2あるいは図4の手順のプログラム
コードを記録した記憶媒体を、システムあるいは装置に
供給し、そのシステムあるいは装置のコンピュータ(ま
たはCPUやMPU)が記憶媒体に格納されたプログラ
ムコードを読出し実行することによっても達成される。
【0051】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0052】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0053】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれる。
【0054】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれる。
【0055】
【発明の効果】以上説明したように、本発明によれば、
顔画像からその顔の人物を同定する際に音声を利用する
ことにより、人物の同定の能力を向上させることができ
る。
【0056】また、画像による類似度と音声による類似
度とのn乗和を同一の判定に用いることにより、いずれ
か一方でも一致すれば同一と判定でき、より精度の高い
同定が可能となる。
【0057】
【図面の簡単な説明】
【図1】第1の実施例に係るブロック図である。
【図2】第1の実施例に係るフローチャート図である。
【図3】第2の実施例に係るブロック図である。
【図4】第2の実施例に係るフローチャート図である。
【図5】第1及び第2の実施例に係るフローチャートを
実現するコンピュータシステムのブロック図である。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 音声と対応づけられた画像を用いた人物
    同定方法であって、 第1の画像中に写っている顔と、第2の画像に写ってい
    る顔とが同一人物かどうかを判定する第1の判定工程
    と、 前記第1及び第2の画像に付随している音声が同一人物
    のものであるかどうかを判定する第2の判定工程と、 前記第1の判定工程あるいは第2の判定工程のいずれか
    により同一人物と判定された画像を、同一の人物である
    と判定する第3の判定工程とを有することを特徴とする
    人物同定方法。
  2. 【請求項2】 前記第3の判定工程により同一と判定さ
    れた画像を同一人物であることを示すタグを付して格納
    する格納工程を更に有することを特徴とする請求項1に
    記載の人物同定方法。
  3. 【請求項3】 音声と対応づけられた画像を用いた人物
    同定方法であって、 第1の画像中に写っている顔と、第2の画像に写ってい
    る顔との画像の類似度を算出する第1の算出工程と、 前記第1及び第2の画像に付随している音声の類似度を
    算出する第2の算出工程と、 前記画像の類似度と音声の類似度との二乗和が所定値以
    上である場合に、前記第1の画像の顔と第2の画像の顔
    とは同一人物であると判定する判定工程とを有すること
    を特徴とする人物同定方法。
  4. 【請求項4】 音声と対応づけられた画像を用いた人物
    同定装置であって、 第1の画像中に写っている顔と、第2の画像に写ってい
    る顔とが同一人物かどうかを判定する第1の判定手段
    と、 前記第1及び第2の画像に付随している音声が同一人物
    のものであるかどうかを判定する第2の判定手段と、 前記第1の判定手段あるいは第2の判定手段のいずれか
    により同一人物と判定された画像を、同一の人物である
    と判定する第3の判定手段とを有することを特徴とする
    人物同定装置。
  5. 【請求項5】 前記第3の判定手段により同一と判定さ
    れた画像を同一人物であることを示すタグを付して格納
    する格納手段を更に有することを特徴とする請求項4に
    記載の人物同定装置。
  6. 【請求項6】 音声と対応づけられた画像を用いた人物
    同定装置であって、 第1の画像中に写っている顔と、第2の画像に写ってい
    る顔との画像の類似度を算出する第1の算出手段と、 前記第1及び第2の画像に付随している音声の類似度を
    算出する第2の算出手段と、 前記画像の類似度と音声の類似度との二乗和が所定値以
    上である場合に、前記第1の画像の顔と第2の画像の顔
    とは同一人物であると判定する判定手段とを有すること
    を特徴とする人物同定装置。
  7. 【請求項7】 コンピュータに、 第1の画像中に写っている顔と、第2の画像に写ってい
    る顔とが同一人物かどうかを判定する第1の判定手段
    と、 前記第1及び第2の画像に付随している音声が同一人物
    のものであるかどうかを判定する第2の判定手段と、 前記第1の判定手段あるいは第2の判定手段のいずれか
    により同一人物と判定された画像を、同一の人物である
    と判定する第3の判定手段として機能させるプログラム
    を格納することを特徴とするコンピュータ可読記憶媒。
  8. 【請求項8】 コンピュータに、 第1の画像中に写っている顔と、第2の画像に写ってい
    る顔との画像の類似度を算出する第1の算出手段と、 前記第1及び第2の画像に付随している音声の類似度を
    算出する第2の算出手段と、 前記画像の類似度と音声の類似度との二乗和が所定値以
    上である場合に、前記第1の画像の顔と第2の画像の顔
    とは同一人物であると判定する判定手段として機能させ
    るプログラムを格納することを特徴とするコンピュータ
    可読記憶媒。
JP10250014A 1998-09-03 1998-09-03 人物同定方法及び装置 Withdrawn JP2000076459A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10250014A JP2000076459A (ja) 1998-09-03 1998-09-03 人物同定方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10250014A JP2000076459A (ja) 1998-09-03 1998-09-03 人物同定方法及び装置

Publications (1)

Publication Number Publication Date
JP2000076459A true JP2000076459A (ja) 2000-03-14

Family

ID=17201570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10250014A Withdrawn JP2000076459A (ja) 1998-09-03 1998-09-03 人物同定方法及び装置

Country Status (1)

Country Link
JP (1) JP2000076459A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004062868A (ja) * 2002-07-10 2004-02-26 Hewlett-Packard Development Co Lp 画像内の人物を識別するデジタル・カメラ及び方法
JP2005347873A (ja) * 2004-05-31 2005-12-15 Matsushita Electric Works Ltd 撮像装置
JP2006099687A (ja) * 2004-09-30 2006-04-13 Mitsubishi Electric Corp 利用者認証装置
JP2010004543A (ja) * 2009-07-13 2010-01-07 Panasonic Electric Works Co Ltd 撮像装置
JP2010239992A (ja) * 2009-03-31 2010-10-28 Sogo Keibi Hosho Co Ltd 人物同定装置、人物同定方法、及び人物同定プログラム
JP2015026315A (ja) * 2013-07-29 2015-02-05 オムロン株式会社 プログラマブル表示器、制御方法、およびプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004062868A (ja) * 2002-07-10 2004-02-26 Hewlett-Packard Development Co Lp 画像内の人物を識別するデジタル・カメラ及び方法
US7843495B2 (en) 2002-07-10 2010-11-30 Hewlett-Packard Development Company, L.P. Face recognition in a digital imaging system accessing a database of people
JP2005347873A (ja) * 2004-05-31 2005-12-15 Matsushita Electric Works Ltd 撮像装置
JP4572583B2 (ja) * 2004-05-31 2010-11-04 パナソニック電工株式会社 撮像装置
US7948524B2 (en) 2004-05-31 2011-05-24 Panasonic Electric Works Co., Ltd. Image processor and face detector using the same
JP2006099687A (ja) * 2004-09-30 2006-04-13 Mitsubishi Electric Corp 利用者認証装置
JP2010239992A (ja) * 2009-03-31 2010-10-28 Sogo Keibi Hosho Co Ltd 人物同定装置、人物同定方法、及び人物同定プログラム
JP2010004543A (ja) * 2009-07-13 2010-01-07 Panasonic Electric Works Co Ltd 撮像装置
JP4577446B2 (ja) * 2009-07-13 2010-11-10 パナソニック電工株式会社 撮像装置
JP2015026315A (ja) * 2013-07-29 2015-02-05 オムロン株式会社 プログラマブル表示器、制御方法、およびプログラム

Similar Documents

Publication Publication Date Title
CN112037791B (zh) 会议纪要转录方法、设备和存储介质
US8762659B2 (en) Storage apparatus and method, program, and playback apparatus and method
US7239725B2 (en) Face image recognition apparatus
US20030108240A1 (en) Method and apparatus for automatic face blurring
US6606398B2 (en) Automatic cataloging of people in digital photographs
JP5801601B2 (ja) 画像認識装置、画像認識装置の制御方法、およびプログラム
CN110675433A (zh) 视频处理方法、装置、电子设备及存储介质
JPS63223965A (ja) 知的ワ−クステ−シヨン
US10216786B2 (en) Automatic identity enrolment
CN110196914A (zh) 一种将人脸信息录入数据库的方法和装置
CN112771522A (zh) 生物体认证装置、生物体认证方法以及生物体认证程序
JP2000076459A (ja) 人物同定方法及び装置
CN110457712A (zh) 一种英语翻译系统
JP5320913B2 (ja) 撮像装置およびキーワード作成プログラム
KR20080046490A (ko) 몽타주 얼굴 영상을 이용한 얼굴 인식 방법 및 그 장치
JP5751889B2 (ja) 顔画像認証装置
JP2005301861A (ja) 出入管理システム
KR100421683B1 (ko) 영상정보를이용한사람식별방법
JPH06180751A (ja) 顔画像撮影装置
Mok et al. Lip features selection with application to person authentication
JPH11283033A (ja) 画像識別のための特徴量の利用方法およびそのプログラムを格納した記録媒体
CN112699720A (zh) 基于人物信息集的监控方法、设备、存储介质及装置
JP2003323619A (ja) 受付補助システム
JP2000137818A (ja) パターン認識方式
JP2575676B2 (ja) 指紋照合における照合点自動追尾方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060110