JPH07191691A - 自動話者照合におけるカーボン/エレクトレット電話機の変化性に対する適応方法 - Google Patents

自動話者照合におけるカーボン/エレクトレット電話機の変化性に対する適応方法

Info

Publication number
JPH07191691A
JPH07191691A JP6284651A JP28465194A JPH07191691A JP H07191691 A JPH07191691 A JP H07191691A JP 6284651 A JP6284651 A JP 6284651A JP 28465194 A JP28465194 A JP 28465194A JP H07191691 A JPH07191691 A JP H07191691A
Authority
JP
Japan
Prior art keywords
microphone
matching
pattern
sample
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6284651A
Other languages
English (en)
Other versions
JP3478884B2 (ja
Inventor
Richard M Sachs
エム.サッチズ リチャード
Max S Schoeffler
エス.ショフラー マックス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
American Telephone and Telegraph Co Inc
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by American Telephone and Telegraph Co Inc, AT&T Corp filed Critical American Telephone and Telegraph Co Inc
Publication of JPH07191691A publication Critical patent/JPH07191691A/ja
Application granted granted Critical
Publication of JP3478884B2 publication Critical patent/JP3478884B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/20Pattern transformations or operations aimed at increasing system robustness, e.g. against channel noise or different working conditions

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 【目的】 話者照合の正確さを向上させるための、種々
の形式の電話ハンドセットの変化性への適応方法を提供
する。 【構成】 話者照合装置において、種々の形式のマイク
ロフォンの使用に起因する、登録中に得られる言語サン
プルと照合中に得られる言語サンプルの相違の補償方法
が、2つのサンプルの類似点が増すようにサンプルのう
ちの少なくとも1つをろ波することによって提供され
る。ろ波されたサンプルは話者照合整合工程に用いられ
る。二者間比較が開示されており、ここでは、照合言語
サンプルと基準サンプルが共に、カーボンマイクロフォ
ン特性のような非直線のマイクロフォン特性を用いてろ
波される。また、四者間比較も開示されており、ここで
は、ろ波されていない照合及び基準サンプルから生成さ
れたパターンと、ろ波された照合及び基準サンプルから
生成されたパターンが、整合を確認するために比較され
る。各比較に関する点数が確認される。最高点を持つ比
較が、整合が起きたかどうかを確認するために用いられ
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は一般に話者照合に向けら
れ、特に、話者照合の正確さを向上させるための、種々
の形式の電話ハンドセットの変化性への適応方法に向け
られるものである。
【0002】
【従来の技術及び発明が解決しようとする課題】話者照
合(SV)は、照合のために提供される加入者の言語サ
ンプルを処理して照合パターンを生成する、話者依存パ
ターンの整合処理である。この照合パターンは、典型的
にいわゆる登録期間中に前もって与えられた言語サンプ
ルから生成されるSV基準パターンと比較される。照合
パターンと基準パターンの“整合”は、それらの特性が
実質的に同一である場合に生じる。さもなければ、“不
整合”が生じたものと判断される。
【0003】SVの典型的な用途は、電話をベースにし
たセキュリティシステムである。加入者は、電話連動装
置を介して言語サンプルを供給することによってセキュ
リティシステムに“登録”し、SV基準パターンが生成
される。続いて、例えばサービスまたは何かの秘密保持
データにアクセスしようとする呼出者は、前記システム
を呼出し、上述のような照合のために自分の言語サンプ
ルを与える。整合が生じると、希望したアクセスが許可
される。不整合ならば、呼出者はいわゆる(加入者のふ
りをしている)詐欺師と推定されてアクセスが拒絶され
る。
【0004】例として種々の形式の電話ハンドセットマ
イクロフォン、例えば直線性のもの(例えばエレクトレ
ット)や非直線性のもの(例えばカーボン)の使用など
の環境に起因して、照合パターンがSV基準パターンと
相違するという事により、SVは幾度となく困難になっ
ている。他の例は種々の周辺雑音や種々の発声レベルを
含む。これらの相違は、登録中に供給される言語サンプ
ルの特性と特定のSV照合期間中に供給される言語サン
プルの特性を互いに異なったものにし得る。したがっ
て、対応するパターンも違ったものになり、その結果
“不整合”という不正確な決定をしてしまうかもしれな
い。
【0005】特に、エレクトレットマイクロフォンは、
入ってくる言語サンプルのかなり直線的な変換を行な
い、それ自体としては最小限度の歪を与える。一方、カ
ーボンマイクロフォンは、例えば高音量の言語レベルを
圧縮して低い周辺雑音レベルを抑圧することにより言語
サンプルの非直線変換を行なう。後者は技術上“増強”
と呼ばれることがある。カーボンマイクロフォンはそれ
自体としてはかなりの程度の歪みを言語サンプルに与え
る。これらの種々の形式のマイクロフォンが言語サンプ
ルに対して持つ効果の変化性のため、種々の形式のマイ
クロフォンを用いることで生じる不整合と、詐欺師によ
って与えられた言語サンプルから生成される照合パター
ンとSV基準パターンを比較することで生じる不整合を
区別するのは困難である。
【0006】したがって、ある形式の電話ハンドセット
マイクロフォンを用いて登録し、他の形式のハンドセッ
トマイクロフォンを用いて“照合されよう”とする加入
者は、同一形式のハンドセットマイクロフォンを用いて
登録しかつ照合されようとする加入者よりもアクセスを
拒絶されてしまうだろう。
【0007】
【課題を解決するための手段】本発明によれば、種々の
形式のマイクロフォンの使用に起因する言語サンプルの
変化性の補償という問題は、1つのマイクロフォン型式
の特性に従って少なくとも1つのサンプルをろ波し、整
合処理にこのろ波されたサンプルを用いることにより解
決される。
【0008】一般に、特定の言語サンプルがどのような
特定の形式のマイクロフォンから生じたかを確認するの
は不可能である。したがって、好適な実施例では、照合
言語サンプルとSV基準サンプルの両方が、典型的なカ
ーボンマイクロフォン特性でろ波される。その結果、種
々の形式のマイクロフォンを用いることから生じること
があった変化性は減少する。また、増加する周辺雑音や
電話通信網の歪または変わりやすい発声レベルのような
他の言語サンプル特性から生じる変化性も減少する。例
えば、サンプルがエレクトレットマイクロフォンで生成
される場合、ろ波は、カーボンマイクロフォンで生成さ
れるサンプルと同じ同じ特性をサンプルに持たせる。サ
ンプルがカーボンマイクロフォンで生成される場合は、
ろ波は、今は違っているが、カーボンマイクロフォン言
語サンプルとしての必須の特性を保有するサンプルを生
じさせる。したがって、2つのサンプルを提供するため
に、たとえどんな形式のマイクロフォンが用いられたと
しても、それらのろ波された変形は共にカーボンマイク
ロフォンのような特性を持つ。
【0009】前記のことの重要な結果は、本発明は異な
るマイクロフォン形式を用いて与えられるサンプルの変
化性を減少させるので、“整合”が起こる基準を設ける
時にその変化性を考慮に入れる必要がないということに
なる。確かに、本発明は前記基準をより厳密なものにさ
せると同時に不正確な拒絶レベルを増加させない(後者
は、呼出者が実際に加入者である時の不整合の宣言にな
る)。
【0010】本発明の他の実施例では、照合及び基準サ
ンプルのろ波されていない変形から生成されるパターン
が、上述のような照合及び基準サンプルのろ波された変
形から生成されるパターンと共に用いられる。照合パタ
ーンの各変形と基準パターンの各変形の比較が行なわれ
る。そして、その比較結果が、整合が起きたかどうかを
確認するために用いられる。このアプローチは、理論
上、下記に詳細に説明される理由のためにシステム全体
の性能を向上させる。
【0011】パターンの変化性は、マイクロフォン形式
の違い以外の要因から起こることがある。例えば、音響
的にまたは電話通信網に基づく回路網から得られる周辺
雑音がパターンに変化性を持ち込むことがある。また、
変わりやすい発声レベルすなわち話者の違いに関連しな
い他の発声特性から起こる変化性のような他の要因も、
結果的に不整合の決定になることがある変化性を持ち込
み得る。
【0012】確かに、本発明の原理は前記の他の変化性
に対処するために用いることができる。詳細には、本発
明は、一般に、少なくとも1つの確認及び照合言語サン
プルの処理という概念を包含し、そのため、処理済言語
サンプルを特徴づける特性は、処理されていない言語サ
ンプルよりも他の言語サンプルの特性と似たものにな
る。したがって、前記処理は雑音減少処理または音量正
規化処理でも良く、換言すれば、どんな処理も、同一加
入者の確認及び照合パターンを互いに近似したものにす
るのに役立つ。
【0013】
【実施例】図1は、本発明の原理を実行するコンピュー
タシステムサービスプラットホーム10を示す。サービ
スプラットフーム10の心臓部には、マイクロプロセッ
サ11と、バス13を介してやり取りする多数の標準的
な周辺装置がある。周辺装置は、ランダムアクセスメモ
リ(RAM)12、リードオンリーメモリ14、ハード
ディスクメモリ16、電話インターフェース18、デジ
タルシグナルプロセッサ(DSP)19、及び15で示
される多数の他の周辺装置を含む。(図示されていない
が、DSP19は、それ自身のメモリ素子、及び/また
はシステム内の種々のメモリ素子、例えばディスクメモ
リ16、との直接接続を持つことができる。)
【0014】サービスプラットホーム10には、ここで
は“加入者”と呼ばれる加入する人だけがアクセスでき
る。加入者になる方法は、基準言語サンプルに変換され
る発声を復誦するように加入者に求める“登録”工程を
含む。これは、例えば、中央電話交換局(CO)20
と、CO20から電話インターフェース18まで伸びた
電話線21とを経由して回転式電話機31からシステム
に対して行なわれる電話呼出し中に実行される。基準言
語サンプルは各登録加入者用の話者照合(SV)基準パ
ターンを生成するために用いられ、このパターンはディ
スクメモリ16のデータ区域に記憶され、データベース
168として示されている。言語サンプルから基準パタ
ーンを生成するルーチンはパターン生成ルーチン163
である。
【0015】次に、あとで、加入者が、回転式電話機3
1、または同様にCO20に接続されたタッチトーン式
電話機32、または実はどこか他の中央交換局に接続さ
れた他の電話機からサービスプラットホーム10につな
がれると仮定しよう。その電話がサービスプラットホー
ム10で応答されると、加入者を照合する工程が開始さ
れる。この工程はSVルーチン161に入っており、そ
の電話を、タッチトーン入力または話者独自の数字決定
のどちらかにより入力することができる加入者識別番号
について促す。これは、プラットホームに当の加入者用
に記憶されている基準パターンを読み出させる。加入者
は望ましい発声を復誦するように促される。登録中の場
合だった時、復誦された発声は一組の言語サンプルに変
換され、このサンプルからパターン生成ルーチン163
を用いて照合パターンが再び生成される。2つのパター
ンの比較が、呼出者が本当に加入者であることを示して
いれば、呼出者はサービスプラットホーム10へのアク
セスを許可される。サービスプラットホーム10は、例
えば、加入者だけがアクセス権を持つ情報源として役立
つことができる。ボイスメールは典型的な例である。換
言すれば、プラットホームは、外国向けの電話サービス
の出入口になったり、人の同一性の照合を必要とする他
のサービスで用いられる供給源になったりすることがで
きる。
【0016】例として種々の形式の電話ハンドセットマ
イクロフォンの使用などの環境に起因して、照合パター
ンがSV基準パターンと相違するという事により、SV
は幾度となく困難になっている。この実施例では、例え
ば、回転式電話機31は非直線性を有するカーボンマイ
クロフォンであり、タッチトーン式電話機32は直線性
を有するエレクトレットマイクロフォンである。この違
いは、登録中に与えられる言語サンプルと特定のSV照
合期間中に与えられる言語サンプルを互いに異なるもに
にし得る。したがって、対応するパターンも違ったもの
になり、その結果“不整合”という不正確な決定をする
ことになる。
【0017】パターンの変化性はさらに他の要因から起
こることもある。音響的にすなわち電話通信網に基づく
回路網から得られる周辺雑音がパターンに変化性を持ち
込むことがある。また、変わりやすい発声レベルすなわ
ち呼出者の同一性に関連しない発声の他の特性から起こ
る変化性のような要因も、不整合の決定に至ることがあ
る変化性を持ち込み得る。
【0018】これらの問題は図2を考察することによっ
てより十分に認識することができる。この図は、特性の
加入者が話すことによりエレクトレットマイクロフォン
で生じた発声から生成された基準パターン201と、同
じ加入者が同じ発声をした場合であるがカーボンマイク
ロフォンを持った電話機から生成された照合パターン2
02の図を示す。技術上周知であり、図に示されるよう
に、これらのパターンは特徴ベクトルの時間シーケンス
と考えられ、各パターンについてそのうちの1つだけが
明確に示されている。2つのマイクロフォン形式の異な
る特性から生じるパターンが異なっていることに注目さ
れたい。これらのパターンの相違はSV不整合になるこ
とがある。従来技術では、照合合格の特定の望ましいレ
ベルを得るためには、整合が確認される基準をこの現象
を補償するために十分に緩和しなければならない。しか
し、不都合にも、前記緩和は、詐欺者がアクセスを得る
のをより容易にしてしまう。
【0019】本発明はこの問題を軽減する。詳細には、
種々の形式のマイクロフォンの使用に起因する言語サン
プルの変化性は、マイクロフォン形式のうちの1つの形
式の特性に従って少なくとも1つのサンプルをろ波し、
このろ波されたサンプルを整合工程に用いることによっ
て処理される。しかし、上記に説明した一般的な方法を
用いて、言語サンプルのいくつかの特性から起こり得る
他の形式の変化性を減少させることもできる。この形式
のろ波を行なうルーチンは図1の164に示され、フィ
ルタ特性を定義するデータは167に示される。
【0020】したがって、図2にさらに示されるよう
に、エレクトレットで生じたパターン201はカーボン
マイクロフォン特性に従ってろ波され、その同一性がパ
ターン2101よりもパターン202に近い、カーボン
でろ波されたパターン203になる。したがって、不正
確な拒絶レベルを増加させることなく、以前よりも厳密
な合格基準を作ることできる。さらに、より厳密な基準
の使用は、詐欺者を排除する能力を増大させることを意
味する。
【0021】一般に、特定の言語サンプルがどの特定の
形式のマイクロフォンから生じたものかを確認すること
は不可能である。したがって、好適な実施例では、照合
言語サンプルとSV基準サンプルの両方がろ波される。
その結果、異なる形式のハンドセットマイクロフォンの
使用から生じることがあった変化性は全て軽減される。
例えば、サンプルがエレクトレットマイクロフォンで生
成された場合は、ろ波は、前記サンプルにカーボンマイ
クロフォンで生成されるサンプルと同じ特性を持たせ
る。このことは、パターン201、202及び203と
関連して今説明されたばかりである。サンプルがカーボ
ンマイクロフォンで生成された場合は、ろ波は、前記サ
ンプルを、今は違っているが、カーボンマイクロフォン
言語サンプルとして必須の特性を保有するものにする。
これは、カーボンマイクロフォン特定を有するろ波パタ
ーンで生じるパターンであるパターン204で示され
る。したがって、たとえどんな形式のマイクロフォンが
基準及び照合サンプルを提供するのに用いられたとして
も、それらのろ波された変形は共にカーボンマイクロフ
ォンと同じ特性を持つ。不都合にも、これは正に、上述
のように、プラットホーム10により厳密な整合基準を
作る能力を与える。
【0022】今説明したばかりの全工程は図4及び図5
のフローチャートで表わされる。特に、図4は登録工程
を表わす。401に示されているように、加入者は発声
の復誦を促される。基準言語サンプルは受け入れた発声
から生成される(402)。それらのサンプルは本発明
に従ってカーボンでろ波され(404)、基準パターン
が生成され(406)、そしてデータベース168の一
部に記憶される(407)。図4に示されているよう
に、データベースのその一部はDB(407)と呼ばれ
る。
【0023】図5は、これから明らかになる理由のため
一方比較工程と呼ばれる照合工程を表わす。照合パター
ンは、図4のステップ401、402、404及び40
6にそれぞれ対応するステップ501、502、504
及び507で生成される。(明示しないが、促しステッ
プ501は上述の識別番号について呼出者を促すことを
含む。)ステップ511で、ステップ507で生成され
た照合パターンが(加入者識別番号に基づく)DB(4
07)から読み出された基準パターンと比較される。ス
テップ514で、2つのパターンが互いに“十分に近
似”している場合は、−−周知の言語照合方法に基づい
て−−プラットホームで与えられるサービスへのアクセ
スが許可され(521)、サービスが始まり(52
2)、処理が終わる(524)。
【0024】一方、2つのパターンが互いに“十分に近
似”していない場合であって、これが、515で確認さ
れるようにこの呼出中にアクセスを得るための呼出者の
2回目の試みでない場合は、工程はステップ501に復
帰し、それにより呼出者に“2回目の試み”を与える。
それが2回目の試みならば、アクセスは否定され(51
7)、プラットホームは呼出を終わらせる(電話を切
る)。呼出者が実際に加入者なのに、多数ある理由のう
ちの何かのため不注意にもアクセスを否定されることが
起こり得る。それに応じて、呼出を終わらせる代わりの
ものは、呼出者の母親の結婚前の姓のような、利用でき
るかもしれない情報を用いて呼出者の同一性を照合でき
る本物の操作者に呼出を転送することである。
【0025】本発明の他の実施例では、パターンは照合
及び基準サンプルのろ波されていない変形から生成さ
れ、上述のようにろ波された変形から生成されたパター
ンと共に用いられる。ろ波されていないパターンは、D
B(412)で示されるデータベース168の一部に記
憶される(412)。ステップ401、402、40
4、406及び407において上記に示されたように、
加入者は発声を復誦することを促され、この発声から基
準パターンのろ波された変形が最終的に生成され、デー
タベースDB(407)に記憶される。
【0026】図6は、これから明らかになる理由のため
四者間比較工程と呼ばれる照合工程を表わす。基準パタ
ーンのろ波されていない変形は、図4のステップ40
1、402及び409にそれぞれ対応するステップ60
1、604及び609で生成される。照合パターンのろ
波された変形は、図4のステップ401、402、40
4及び406にそれぞれ対応するステップ601、60
4、606及び611で生成される。(明示されていな
いが、促し工程601は上述した識別番号について呼出
者を促すことを含むことができる。)ステップ613
で、四者間比較が行なわれ、ここで、ステップ609及
び611で生成された照合パターンの各変形が、(加入
者識別番号に基づいて)DB(407)及びDB(41
2)から読み出された基準パターンの各変形と比較され
る。それぞれの比較に関する点数が、照合パターンと基
準パターンの特性の同一性の関数として周知の方法を用
いて計算される。“最高”点を持つ比較すなわち同一性
の最も高い度合いを持つ比較が選ばれる(617)。最
高点を持つ比較を構成する2つのパターンが互いに“十
分に近似”していれば、−−周知の言語照合方法に基づ
いて−−プラットホームで与えられるサービスへのアク
セスが許可され(624)、サービスが始まり(63
3)、そして工程が終わる(635)。
【0027】一方、最高点を持つ2つのパターンが互い
に“十分に近似”しておらず、しかもこれが622で確
認されるようにこの呼出中にアクセスを得ようとする呼
出者の2回目の試みでない場合は、工程はステップ60
1に復帰し、それにより呼出者に“2回目の試み”を与
える。それが2回目の試みならば、アクセスは拒絶され
(627)、プラットホームは呼出を終わらせる。上記
に説明したように、呼出者が実際に加入者なのに、ある
理由でアクセスが拒絶されることが起こり得る。それに
応じて、加入者を照合するために他の方法を用いること
ができる。
【0028】四者間比較の場合のパラメータは図3に示
される。各ライン入力は、ろ波された基準サンプル及び
ろ波されていない基準サンプルと、ろ波された照合サン
プル及びろ波されていない照合サンプルとから生成され
たパターンの4つの組み合わせのうちの1つを表わす。
基準サンプルを生成するためにどんな形式のマイクロフ
ォンがどの特定の場合に用いられたかと、照合サンプル
を生成するためにどんな形式のマイクロフォンがどの特
定の場合に用いられたかとに依存して、4つの組み合わ
せのうちの特定のものが、図の3番目の列に示されるよ
うな最も近似した整合になると予測される。4つの組み
合わせの全部が有効であると仮定すれば、合法のアクセ
スの試みが異なるマイクロフォン形式の使用にもかかわ
らず許可されることを確実にもたらすために、従来技術
のように整合基準を緩和する必要はない。おそらく、4
つの組み合わせのうちの1つか2つが良好な整合を作り
出すだろう。
【0029】四者間比較アプローチが1比較アプローチ
より望ましいとする理論は、パターンのうちの1つがカ
ーボンマイクロフォンで生じたサンプルから生じた場合
に、それらのサンプルの二重にろ波された変形を含まな
い比較を行なうことができることである。また、それ
は、両方ともエレクトレットマイクロフォンからの言語
サンプルから生成された照合パターンと基準パターンの
比較を考慮しており、この場合は、カーボンマイクロフ
ォン特性を用いたろ波は、少なくとも理論上は必要とさ
れないかまたは役に立たない。このように、四者間比較
アプローチは理論上システム全体の性能を向上させるこ
とができる。
【0030】図7はフローチャートに用いられるカーボ
ンフィルタ工程の概念図である。言語サンプルはメモリ
レス伝達関数701で処理される。伝達関数701は非
直線であり、そのため、重要な周波数帯域−−例えば3
00〜3300Hz−−外のエネルギーが作り出される
ことがある。このエネルギーはバンドパスフィルタ70
2で除去される。
【0031】図8はメモリレス伝達関数701を示す。
図は、どの時間点においても、言語サンプルの瞬時振幅
の関数としての出力である値を示す。伝達関数は、伸張
領域、直線領域及び圧縮領域という3つの領域を持って
いる。中断点Le 及びLc と勾配Se 及びSc は経験的
に決定される。特に、カーボンマイクロフォンとエレク
トレットマイクロフォンの両方で生じる言語に関する言
語サンプルエネルギーレベルのヒストグラムが得られ、
4つの伝達関数パラメータが、一度この伝達関数で処理
されたエレクトレットで生じた言語のヒストグラムがカ
ーボンで生じた言語のヒストグラムに可能な限りほぼ整
合するような方法で、それらのヒストグラムに基づいて
選択される。
【0032】前記のことは単に本発明の原理を示し、し
たがって、当業者は、ここに明確に説明されていないが
本発明の原理を具体化し、その範囲と精神内にある多く
の他の変形を工夫できることがわかる。
【図面の簡単な説明】
【図1】本発明によるコンピュータシステムサービスプ
ラットフームのブロック図を示す。
【図2】カーボンマイクロフォン特性でろ波されたエレ
クトレットマイクロフォン及びカーボンマイクロフォン
で生成された基準パターン及び照合パターンの立体図を
示す。
【図3】最も近似した整合が基準パターン及び照合パタ
ーンの関数として生じる条件を表わす表を示す。
【図4】基準言語サンプルの登録方法を示すフローチャ
ートである。
【図5】本発明による一方比較を用いて照合言語サンプ
ルを照合する方法を示すフローチャートである。
【図6】本発明による四者間比較を用いて照合言語サン
プルを照合する方法を示すフローチャートである。
【図7】本発明によるカーボンフィルタ処理を示すブロ
ック図である。
【図8】図7のカーボンフィルタのメモリレス伝達関数
を示す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 マックス エス.ショフラー アメリカ合衆国 07747 ニュージャーシ ィ,マタワン,ケンウッド レーン 17

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 話者照合に用いられる言語サンプルの処
    理方法であって、 種々の形式のマイクロフォンで発生する言語サンプルを
    受け入れる工程と、 マイクロフォン形式の1つで発生する少なくとも1つの
    前記言語サンプルを他の1つのマイクロフォン形式の特
    性を用いてろ波する工程と、 前記ろ波された言語サンプルから、話者照合に用いるこ
    とができるパターンを生成する工程とからなることを特
    徴とする処理方法。
  2. 【請求項2】 請求項1記載の処理方法において、前記
    言語サンプルは基準言語サンプルである処理方法。
  3. 【請求項3】 請求項1記載の処理方法において、前記
    言語サンプルは照合言語サンプルである処理方法。
  4. 【請求項4】 請求項1記載の処理方法において、前記
    他の1つのマイクロフォン形式の特性は非直線である処
    理方法。
  5. 【請求項5】 請求項4記載の処理方法において、前記
    マイクロフォンはカーボンマイクロフォンである処理方
    法。
  6. 【請求項6】 請求項1記載の処理方法において、前記
    1つののマイクロフォン形式の特性は直線である処理方
    法。
  7. 【請求項7】 請求項6記載の処理方法において、前記
    マイクロフォンはエレクトレットマイクロフォンである
    処理方法。
  8. 【請求項8】 1つの形式のマイクロフォンから照合の
    ために供給される言語サンプルを受け入れる工程と、 前記照合言語サンプルを、他のマイクロフォン形式の特
    性を用いてろ波する工程と、 ろ波された照合言語サンプルから照合パターンを生成す
    る工程と、 前記照合パターンを、登録期間中に供給される基準言語
    サンプルから生成される生成基準パターンと比較する工
    程と、 前記基準パターン及び照合パターンの関数として話者の
    同一性を照合する工程とからなることを特徴とする話者
    の照合方法。
  9. 【請求項9】 請求項8記載の照合方法において、前記
    生成基準パターンは、前記基準言語サンプルを前記他の
    マイクロフォン形式の特性を用いてろ波することにより
    生成される照合方法。
  10. 【請求項10】 請求項9記載の照合方法において、前
    記比較工程は、さらに、ろ波された基準パターンとろ波
    された照合パターンを比較する工程を含む照合方法。
  11. 【請求項11】 請求項8記載の照合方法において、さ
    らに、 ろ波されなかった照合言語サンプルからろ波されていな
    い照合パターンを生成する工程と、 ろ波されなかった基準言語サンプルからろ波されていな
    い基準パターンを生成する工程と、 各照合パターンを各基準パターンと比較する工程とを含
    み、前記生成基準パターンは、前記基準言語サンプルを
    前記他のマイクロフォン形式の特性を用いてろ波するこ
    とにより生成される、ろ波された基準パターンからなる
    照合方法。
  12. 【請求項12】 請求項11記載の照合方法において、
    前記決定工程は、さらに、 各比較に関する照合パターンと基準パターンの類似点を
    表わす点数を計算する工程と、 予め決められた基準に基づいてどの比較が最高点数かを
    決定する工程を含む照合方法。
  13. 【請求項13】 請求項8記載の照合方法において、前
    記他のマイクロフォン形式の特性は非直線である照合方
    法。
  14. 【請求項14】 請求項9記載の照合方法において、前
    記他のマイクロフォン形式の特性は非直線である照合方
    法。
  15. 【請求項15】 請求項13記載の照合方法において、
    前記マイクロフォンはカーボンマイクロフォンである照
    合方法。
  16. 【請求項16】 請求項14記載の照合方法において、
    前記マイクロフォンはカーボンマイクロフォンである照
    合方法。
  17. 【請求項17】 話者照合に用いられる言語サンプルの
    処理方法であって、 種々の特性で特徴づけられる要因で影響を受けた言語サ
    ンプルを受け入れる工程と、 話者の相違に関連しない、処理済言語サンプルを特徴づ
    ける特性が、少なくとも1つの他の言語サンプルを特徴
    づける特性により類似したものになるように、前記言語
    サンプルのうちの少なくとも1つを処理する工程と、 前記処理済言語サンプルから、話者照合に用いることが
    できるパターンを生成する工程とからなることを特徴と
    する処理方法。
  18. 【請求項18】 請求項17記載の処理方法において、
    前記1つの言語サンプルを特徴づける前記特性はマイク
    ロフォンの直線特性である処理方法。
  19. 【請求項19】 請求項18記載の処理方法において、
    前記マイクロフォンの直線特性はエレクトレットマイク
    ロフォンの特性である処理方法。
  20. 【請求項20】 請求項17記載の処理方法において、
    前記他の言語サンプルを特徴づける前記特性はマイクロ
    フォンの非直線特性である処理方法。
  21. 【請求項21】 請求項20記載の処理方法において、
    前記マイクロフォンの非直線特性はカーボンマイクロフ
    ォンの特性である処理方法。
JP28465194A 1993-11-19 1994-11-18 自動話者照合におけるカーボン/エレクトレット電話機の変化性に対する適応方法 Expired - Fee Related JP3478884B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US155973 1988-02-16
US08/155,973 US5528731A (en) 1993-11-19 1993-11-19 Method of accommodating for carbon/electret telephone set variability in automatic speaker verification

Publications (2)

Publication Number Publication Date
JPH07191691A true JPH07191691A (ja) 1995-07-28
JP3478884B2 JP3478884B2 (ja) 2003-12-15

Family

ID=22557533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28465194A Expired - Fee Related JP3478884B2 (ja) 1993-11-19 1994-11-18 自動話者照合におけるカーボン/エレクトレット電話機の変化性に対する適応方法

Country Status (7)

Country Link
US (1) US5528731A (ja)
EP (1) EP0654781B1 (ja)
JP (1) JP3478884B2 (ja)
BR (1) BR9404467A (ja)
CA (1) CA2133787C (ja)
DE (1) DE69425717T2 (ja)
ES (1) ES2149846T3 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002014934A (ja) * 2000-04-26 2002-01-18 Semiconductor Energy Lab Co Ltd 本人認証システム、本人認証方法またはビジネス方法
JP2012033179A (ja) * 2000-04-26 2012-02-16 Semiconductor Energy Lab Co Ltd 本人認証システム

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6567778B1 (en) 1995-12-21 2003-05-20 Nuance Communications Natural language speech recognition using slot semantic confidence scores related to their word recognition confidence scores
JPH10105191A (ja) * 1996-09-30 1998-04-24 Toshiba Corp 音声認識装置及びマイクロホン周波数特性変換方法
US6539352B1 (en) * 1996-11-22 2003-03-25 Manish Sharma Subword-based speaker verification with multiple-classifier score fusion weight and threshold adaptation
DE19811879C1 (de) * 1998-03-18 1999-05-12 Siemens Ag Einrichtung und Verfahren zum Erkennen von Sprache
US6233556B1 (en) 1998-12-16 2001-05-15 Nuance Communications Voice processing and verification system
US6570964B1 (en) 1999-04-16 2003-05-27 Nuance Communications Technique for recognizing telephone numbers and other spoken information embedded in voice messages stored in a voice messaging system
US7058573B1 (en) * 1999-04-20 2006-06-06 Nuance Communications Inc. Speech recognition system to selectively utilize different speech recognition techniques over multiple speech recognition passes
US6766295B1 (en) * 1999-05-10 2004-07-20 Nuance Communications Adaptation of a speech recognition system across multiple remote sessions with a speaker
US6751588B1 (en) * 1999-11-23 2004-06-15 Sony Corporation Method for performing microphone conversions in a speech recognition system
US6804647B1 (en) * 2001-03-13 2004-10-12 Nuance Communications Method and system for on-line unsupervised adaptation in speaker verification
EP1399915B1 (en) * 2001-06-19 2009-03-18 Speech Sentinel Limited Speaker verification
US6778957B2 (en) * 2001-08-21 2004-08-17 International Business Machines Corporation Method and apparatus for handset detection
US7031499B2 (en) * 2002-07-22 2006-04-18 Mitsubishi Electric Research Laboratories, Inc. Object recognition system
US20070239441A1 (en) * 2006-03-29 2007-10-11 Jiri Navratil System and method for addressing channel mismatch through class specific transforms
US8140325B2 (en) * 2007-01-04 2012-03-20 International Business Machines Corporation Systems and methods for intelligent control of microphones for speech recognition applications

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4631749A (en) * 1984-06-22 1986-12-23 Heath Company ROM compensated microphone
JP2776848B2 (ja) * 1988-12-14 1998-07-16 株式会社日立製作所 雑音除去方法、それに用いるニューラルネットワークの学習方法
US5125022A (en) * 1990-05-15 1992-06-23 Vcs Industries, Inc. Method for recognizing alphanumeric strings spoken over a telephone network
CA2042926C (en) * 1990-05-22 1997-02-25 Ryuhei Fujiwara Speech recognition method with noise reduction and a system therefor
US5206913A (en) * 1991-02-15 1993-04-27 Lectrosonics, Inc. Method and apparatus for logic controlled microphone equalization

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002014934A (ja) * 2000-04-26 2002-01-18 Semiconductor Energy Lab Co Ltd 本人認証システム、本人認証方法またはビジネス方法
JP2012033179A (ja) * 2000-04-26 2012-02-16 Semiconductor Energy Lab Co Ltd 本人認証システム

Also Published As

Publication number Publication date
CA2133787C (en) 1997-12-16
EP0654781B1 (en) 2000-08-30
ES2149846T3 (es) 2000-11-16
EP0654781A3 (en) 1997-04-16
DE69425717D1 (de) 2000-10-05
JP3478884B2 (ja) 2003-12-15
EP0654781A2 (en) 1995-05-24
US5528731A (en) 1996-06-18
BR9404467A (pt) 1995-07-11
DE69425717T2 (de) 2001-02-01
CA2133787A1 (en) 1995-05-20

Similar Documents

Publication Publication Date Title
JP3478884B2 (ja) 自動話者照合におけるカーボン/エレクトレット電話機の変化性に対する適応方法
JP3904608B2 (ja) 話者確認法
US9762731B1 (en) Determining and denying call completion based on detection of robocall or unsolicited advertisement
US6327345B1 (en) Method and system therefor of establishing an acceptance threshold for controlling fraudulent telephone calls
US6078807A (en) Telephony fraud detection using voice recognition techniques
CA2105034C (en) Speaker verification with cohort normalized scoring
US9407765B2 (en) Automated passcode recovery in an interactive voice response system
US8842886B2 (en) Adaptive tuning of biometric engines
EP1019904B1 (en) Model enrollment method for speech or speaker recognition
KR100386044B1 (ko) 음성 트랜잭션을 보안하기 위한 시스템 및 방법
US5845246A (en) Method for reducing database requirements for speech recognition systems
US7920680B2 (en) VoIP caller authentication by voice signature continuity
US6246987B1 (en) System for permitting access to a common resource in response to speaker identification and verification
US10614813B2 (en) System and method for performing caller identity verification using multi-step voice analysis
WO2006054205A1 (en) Audio device for and method of determining biometric characteristincs of a user.
KR100418113B1 (ko) 음성인식을 이용한 별정통신 시스템 및 그를 이용한별정통신 서비스 제공방법
KR20190138085A (ko) 고유음성 인식을 이용한 본인인증 이어폰 장치
JP7334780B2 (ja) 通信端末、情報処理装置、情報処理システム、情報処理方法およびプログラム
KR20030001669A (ko) 음성인식을 이용한 보안 방법
EP4002900A1 (en) Method and device for multi-factor authentication with voice based authentication
JPH09244684A (ja) 本人認証装置
CN115424619A (zh) 号码状态识别方法及装置、计算机可读存储介质、终端
Fogel A Commercial Implementation of a Free-Speech Speaker Verification System in a Call Center

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030901

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081003

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091003

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees