JPH1020883A - ユーザ認証装置 - Google Patents

ユーザ認証装置

Info

Publication number
JPH1020883A
JPH1020883A JP8172559A JP17255996A JPH1020883A JP H1020883 A JPH1020883 A JP H1020883A JP 8172559 A JP8172559 A JP 8172559A JP 17255996 A JP17255996 A JP 17255996A JP H1020883 A JPH1020883 A JP H1020883A
Authority
JP
Japan
Prior art keywords
user
unit
phoneme
voice
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8172559A
Other languages
English (en)
Inventor
Tatsuro Matsumoto
達郎 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP8172559A priority Critical patent/JPH1020883A/ja
Publication of JPH1020883A publication Critical patent/JPH1020883A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】本発明は、ユーザにより発音された音声を入力
し、入力された音声に基づいてそのユーザがあらかじめ
登録された正当なユーザであるか否かの認証を行なうユ
ーザ認証装置に関し、ユーザ登録時にユーザに過大な負
担を強いることなく、極めてバリエーションに富んだ単
語(1つもしくは複数)をユーザに呈示して発音させ
る。 【解決手段】ユーザの発音による音声を音素単位に分割
し各音素の特徴量を抽出して記憶しておき、ユーザ認証
時に、一方ではユーザに単語を呈示して発音させて第1
の特徴量配列データを作成し、他方では、ユーザに呈示
した単語の読みと記憶された特徴量とに基づいて第2の
特徴量配列データを作成し、これら第1の特徴量配列デ
ータと第2の特徴量配列データとの間の距離を算出し、
その算出された距離に基づいてユーザ認証を行なう。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ユーザにより発音
された音声を入力し、入力された音声に基づいてそのユ
ーザがあらかじめ登録された正当なユーザであるか否か
の認証を行なうユーザ認証装置に関する。
【0002】
【従来の技術】セキュリティ強化や課金のために、アク
セスするユーザがあらかじめ登録された正当なユーザで
あるか否かを認証する必要を生じる場合があり、例えば
機密が保たれなければならない部屋に入室する場合や電
話を用いた情報システムにアクセスする場合などにユー
ザ認証が必要となる。
【0003】このようなユーザ認証を行なう装置の1つ
として、ユーザが発音する音声に基づいてユーザ認証を
行なう装置が知られている。図5は、音声を用いてユー
ザ認証を行なう、従来のユーザ認証装置の一例を示すブ
ロック図である。ここには、ユーザを特定するユーザ情
報の集まりからなるユーザ情報データベースを記憶する
ユーザ情報データベース記憶部51が備えられており、
ユーザ情報入力部52により入力されたユーザ情報が、
ユーザ登録部53により、ユーザ情報データベース51
に登録される。
【0004】また、ここには、ユーザ別の音声データも
しくは音声の特徴量の集合からなる音声辞書を記憶する
音声辞書記憶部54が備えられている。この音声辞書に
は、ユーザに発音させようとする単語があらかじめいく
つか登録されており、ユーザに発音させるにあたって
は、単語選択部55により、登録されている単語が1つ
ずつ選択され、単語呈示部56に送られて、登録しよう
とするユーザに呈示される。ユーザは、マイクロホン7
に向って、呈示された単語を発音する。マイクロホン上
に向って発音した音声が音声入力部57により入力さ
れ、情報量抽出部58によりその入力された音声の特徴
量が抽出され、その特徴量が、音声登録部59により、
ユーザ情報データベースに登録されたユーザ情報に対応
づけられるとともにユーザに呈示した単語に対応づけ
て、音声辞書に登録される。
【0005】以上のようにして、いくつかの単語が順次
ユーザに呈示され、ユーザは呈示された単語を順次発音
し、これにより、音声辞書には、そのユーザの、いくつ
かの単語についての特徴量が、それらの単語と対応づけ
られて登録される。これらの操作により、ユーザの登録
が完了する。ユーザの認証にあたっては、単語選択部5
5により、音声辞書にあらかじめ登録されていたいくつ
かの単語のうちの1つの単語が選択され、単語呈示部5
6によりその選択された単語がユーザに呈示される。
【0006】ユーザはマイクロホンに向かって呈示され
た単語を発音する。その発音された音声は音声入力部5
7により入力され、特徴量抽出部58によりその入力さ
れた音声の特徴量が抽出され、距離算出部60に入力さ
れる。距離算出部60には、音声辞書に登録された、ユ
ーザに呈示された単語の特徴量も入力され、距離算出部
60では、2つの特徴量どうしの相違が定量化されてな
る距離が、その距離算出部60に入力された2つの特徴
量どうしの相違について算出される。その算出された距
離は認証結果通知部61に送られ、認証結果通知部61
では、その距離に基づいて、今回入力された音声を発音
したユーザが登録されたユーザであるか否かの認証を行
ない、その認証の結果を所定の通知先に通知する。
【0007】従来、音声を用いたユーザ認証装置の場
合、例えばこのような方式により、ユーザの認証が行な
われている。尚、音声辞書にはユーザが発音した音声の
特徴量を登録する旨説明したが、特徴量抽出部9を省略
し、ユーザが発音した音声そのものを、ユーザに呈示し
た単語と対応づけて、音声辞書に登録しておく方式もあ
る。
【0008】
【発明が解決しようとする課題】ところが、上記のユー
ザ認証装置の場合、ユーザ認証の際にユーザに呈示され
る単語はユーザ登録時にユーザに発音させた単語の中の
いずれか1つもしくは複数の単語であって、ユーザ登録
時にユーザが発音させた単語以外の単語を呈示してユー
ザ認証に用いることはできない。
【0009】ユーザ登録時にユーザにできるだけ多くの
単語を発音させるにしてもおのずと限界があり、かなり
少ない数の単語の中から呈示する単語を選択することに
なる。このため、例えばユーザ登録時やユーザ認証時
に、あるいはその他の機会に、ユーザが発音した音声を
録音しておいて、ユーザ認証時にその録音しておいた音
声を再生することにより、そのユーザ認証装置を簡単に
欺くことが可能である。
【0010】特開平4−218860号公報には、ユー
ザの発音による単語を登録しておくことまでは上記のユ
ーザ認証装置と同じであるが、ユーザ認証時に、登録さ
れた単語を組み合わせた文章をユーザに呈示して、ユー
ザにその文章を発音させる方式のユーザ認証装置が提案
されている。このユーザ認証装置の場合は、ユーザに文
章を呈示することから、登録された単語の中から単純に
1つの単語を選択して呈示する方式と比べれば、格段に
多数の文章の中から選択した文章をユーザに呈示するこ
とができ、その分、そのユーザ認証装置を欺くことも難
しくなる。しかしながら、このユーザ認証装置の場合
も、基本的には、ユーザの発音に基づいて登録された単
語の中から選択された複数の単語を並べるだけであっ
て、ユーザに呈示することのできる文章のバリエーショ
ンもおのずと限界があり、そのシステムが欺かれやす
く、文章のバリエーションを大きく増加させようとする
とユーザ登録時にユーザに極めて多数の単語の発音を強
いることになり、またそれら発音された音声ないしその
音声から抽出された特徴量を各単語別に記憶しておくた
めの記憶部も膨大な容量のものが必要となり、現実的で
はない。
【0011】本発明は、上記事情に鑑み、ユーザ登録時
にユーザに過大な負担を強いることなく、極めてバリエ
ーションに富んだ単語(1つもしくは複数)をユーザに
呈示して発音させることができ、これにより欺かれる確
率が極めて低いレベルに押えられるユーザ認証装置を提
供することを目的とする。
【0012】
【課題を解決するための手段】上記目的を達成する本発
明のユーザ認証装置は、ユーザにより発音された音声を
入力し、入力された音声に基づいてそのユーザがあらか
じめ登録されたユーザであるか否かの認証を行なうユー
ザ認証装置において、 (1)音声としての特徴量の抽出が可能な微小音響単位
別の特徴量の各ユーザ別の集合からなる音素辞書を登録
されたユーザ分記憶する音素辞書記憶部 (2)複数の単語とそれらの単語の読みの集合からなる
単語辞書を記憶する単語辞書記憶部 (3)単語の読みを、その読みに対応する微小音響単位
の系列からなる音素ネットワークに変換するための音素
変形規則を記憶する音素変形規則記憶部 (4)単語辞書から単語を選択する単語選択部 (5)単語選択部により選択された単語を、認証を受け
ようとするユーザに向けて呈示する単語呈示部 (6)上記音素変形規則を用いて、上記単語選択部によ
り選択された単語の読みに対応する音素ネットワークを
生成する音素ネットワーク生成部 (7)ユーザにより発音された音声を入力する音声入力
部 (8)音声入力部により入力された音声が時系列的に分
解されてなる複数の微小音響単位別の特徴量を抽出する
ことにより複数の特徴量が配列されてなる第1の特徴量
配列データを生成する特徴量抽出部 (9)上記音素辞書を用いて、音素ネットワーク生成部
で生成された音素ネットワークを特徴量の配列に変換す
ることにより第2の特徴量配列データを生成し、2つの
特徴量配列データどうしの相違が定量化されてなる距離
を、上記第1の特徴量配列データと上記第2の特徴量配
列データとの相違について算出する距離算出部 (10)距離算出部により算出された距離に基づいて、
音声入力部により入力された音声を発音したユーザが登
録されたユーザであるか否かの認証を行ない、その認証
の結果を通知する認証結果通知部を備えたことを特徴と
する。
【0013】ここで、上記「音声としての特徴量の抽出
が可能な微小音響単位」は、基本的には音素程度のもの
を指し、ただし音素に限定されるものではなく、例えば
特徴量の定義の仕方、特徴量の抽出の仕方等に応じて適
切な音響単位が選択されるが、従来例のように単語単位
ではなく、その音響単位1つずつでは、基本的には言葉
としての意味をなさない程度に微小に分割されたものを
いう。
【0014】また、上記(4)の単語選択部は、単語辞
書の中から単語を1つのみ選択するものに限られるもの
ではなく、例えば複数の単語をランダムに選択するもの
であてもよく、配列に意味のある複数の単語(すなわち
文章)を選択するものであってもよい。また、上記
(5)の単語呈示部は、ユーザに単語を呈示する態様の
如何を問うものではなく、例えば画面上に単語を表示す
ることによって呈示してもよく、単語をプリントアウト
することによって呈示してもよく、単語を音声に変換し
て呈示してもよく、あるいは、このユーザ認証装置自体
ではその単語をあらわす信号のみを送信し、ユーザにど
のような形式で呈示するかを、ユーザ側の装置に委ねる
ものであってもよい。
【0015】さらに、上記(10)の認証結果通知部に
よる認証結果の通知先は、特に限定されるものではな
く、そのユーザ認証装置の用途等によって異なる。例え
ば、このユーザ認証装置を特定の人のみ立入が許された
部屋のドアの開閉用に用いたときは、その認証結果の通
知先は、例えばそのドアの自動開閉を担う装置に通知さ
れ、あるいは、監視人が常駐する部屋に通知される。
【0016】本発明のユーザ認証装置によれば、ユーザ
の発音による音声が音素等の微小音響単位毎に分割さ
れ、各微小音響単位毎の特徴量がそのユーザの音素辞書
として記憶される。また、この音素辞書とは別に、単語
とその単語の読みの集合からなる単語辞書、および単語
の読みを微小音響単位の系列からなる音響ネットワーク
に変換する音素変形規則とを記憶しておき、ユーザ認証
時には、ユーザの発音による音声から第1の特徴量配列
データが生成されるとともに、呈示した単語の読みが音
素ネットワークに変換されさらにその音素ネットワーク
が第2の特徴量配列データに変換されて、それら第1の
特徴量配列データと第2の特徴量配列データとの間の距
離が求められる。したがって、ユーザ登録にあたってユ
ーザに発音させる必要のある単語の数は、微小音響単位
が1とおり網羅される程度の少数でよく、ユーザ認証に
あたっては、極めて多数の単語の中から、ユーザに呈示
する単語を選択することができる。
【0017】上記本発明のユーザ認証装置は、ユーザ登
録は行わずに、ユーザ認証のみを行なうもの、すなわ
ち、例えば、ユーザ登録は別のシステムを行ない、その
登録された結果としての音素辞書を上記(1)の音素辞
書記憶部に記憶させるものであってもよいが、このユー
ザ認証装置自体でユーザ登録を行なうものであってもよ
い。このような構成は、上記のユーザ認証装置におい
て、 (11)ユーザを特定するユーザ情報の集まりからなる
ユーザ情報データベースを記憶するユーザ情報データベ
ース記憶部 (12)ユーザ情報を入力するユーザ情報入力部 (13)ユーザ情報入力部により入力されたユーザ情報
をユーザ情報データベースに登録するユーザ登録部 (14)音声入力部により入力された所定の単語が発音
されてなる音声に基づいて特徴量抽出部により抽出され
た特徴量を、ユーザ情報入力部により入力されたユーザ
情報に対応づけて上記音素辞書に登録する音声登録処理
部を備えることによって達成される。
【0018】上記本発明のユーザ認証装置において、さ
らに、 (15)登録されたユーザ別に発行されたユーザIDを
入力するユーザID入力部 (16)距離算出部においてユーザID入力部により入
力されたユーザIDにより特定されるユーザ用の音素辞
書が用いられるように音素辞書を切り替えるユーザ辞書
切替部を備えることが好ましい。
【0019】ユーザIDを入力しないときは、登録され
たユーザの人数分、上記の第2の特徴量配列データを生
成し、それら複数の第2の特徴量配列データそれぞれと
第1の特徴量配列データとの距離をそれぞれ算出し、そ
れら複数算出された距離のうちの最も短い距離に基づい
てユーザ認証を行なう必要ああるが、ユーザIDを入力
することにより、その入力されたユーザIDが指し示す
ユーザの音素辞書を用いて第2の特徴量配列データを1
つだけ生成して第1の特徴量配列データと比較すればよ
く、したがってユーザ認証処理を高速化することができ
る。
【0020】また、上記本発明のユーザ認証装置におい
て、上記(15),(16)のユーザID入力部および
ユーザ辞書切替部に代えて、 (17)音声入力部から入力された音声に基づいて、登
録されたユーザ別に発行されたユーザIDを認識するユ
ーザID認識部 (18)距離算出部において、ユーザID認識部により
認識されたユーザIDにより特定されるユーザ用の音素
辞書が用いられるように音素辞書を切り替えるユーザ辞
書切替部を備えてもよい。
【0021】ユーザIDは、例えば数字のみ、あるいは
英数字等、比較的少ない文字あるいは数字の組み合わせ
で構成することができ、したがってその音声認識は比較
的容易である。そこで、ユーザID入力部を音声入力部
とは別に備えることなく、ユーザID自体も音声で入力
するように構成してもよい。さらに、上記本発明のユー
ザ認証装置において、上記(7)の音声入力部が、電話
回線を経由して入力された音声を入力するものであり、
上記の(5)単語呈示部が、上記(6)の単語選択部に
より選択された単語の読みを音声に変換し電話回線を経
由させて、その単語をユーザに呈示するものであっても
よい。
【0022】音声を伝達する手段として電話回線が広範
に用いられており、したがって本ユーザ認証装置におい
ても電話回線と接続すると便利なことが多い。
【0023】
【発明の実施の形態】以下、本発明の実施形態について
説明する。図1は、本発明のユーザ認証装置の基本的な
実施形態である第1の実施形態を示すブロック図であ
る。ここでは説明の都合上、ユーザ登録時の各ブロック
の作用とユーザ認証時の各ブロックの作用のうち、ユー
ザ認証時のものを先に説明する。
【0024】この図1に示すユーザ認証装置には、認証
時に必要とするブロックとして、音素辞書記憶部1、単
語辞書記憶部2、音素変形規則記憶部3、単語選択部
4、単語呈示部5、音素ネットワーク生成部6、音声入
力部7、特徴量抽出部8、距離算出部9、および認証結
果通知部10が備えられている。音素辞書記憶部1は、
音声としての特徴量の抽出が可能な微小音響単位別の特
徴量の各ユーザ別の集合からなる音素辞書を、登録され
たユーザ分、記憶するものである。
【0025】また、単語辞書記憶部2は、複数の単語の
表記(漢字等)とそれらの単語の読み(ローマ字)の集
合からなる単語辞書を記憶するものである。さらに、音
素変形規則記憶部3は、単語の読みを、その読みに対応
する微小音響単位の系列からなる音素ネットワークに変
換するための音素変形規則を記憶するものである。
【0026】ユーザの認証にあたっては、先ず単語選択
部4により、単語辞書から、例えば不規則的に単語が選
択され、その選択された単語は、単語呈示部5により、
認証を受けようとするユーザに向けて呈示される。ま
た、単語選択部4により選択された単語の読みが音素ネ
ットワーク生成部6に入力され、音素ネットワーク生成
部6では、音素変形規則を用いて、単語選択部4により
選択された単語の読みに対応する音素ネットワークが生
成される。
【0027】単語呈示部5により単語の呈示を受けたユ
ーザは、マイクロホンに向ってその呈示された単語を発
音する。この発音により得られた音声は音声入力部7に
より入力されて特徴量抽出部8に伝えられ、特徴量抽出
部8では、音声入力部7により入力された音声が時系列
的に分解されてなる複数の微小音響単位別の特徴量が抽
出され、これにより複数の特徴量が配列されてなる第1
の特徴量配列データが生成される。
【0028】特徴量抽出部8で生成された第1の特徴量
配列データは距離算出部9に入力される。距離算出部9
では、音素辞書を用いて、音素ネットワーク生成部6で
生成された音素ネットワークを特徴量の配列に変換する
ことにより第2の特徴量配列データを生成し、特徴量抽
出部8から送られてきた第1の特徴量配列データと音素
ネットワーク生成部6で生成された音素ネットワークに
基づいて作成された第2の特徴量配列データとの相違に
ついて「距離」が算出される。ここで「距離」は、2つ
の特徴量配列データどうしの相違を定量化したものをい
う。
【0029】この算出された距離は、認証結果通知部1
0に入力され、認証結果通知部10は、この距離に基づ
いて、音声入力部7により入力された音声を発音したユ
ーザが登録されたユーザであるか否かの認証を行ない、
その認証の結果を外部に向けて通知する。以上のように
して、極めて多数の単語の中からユーザ認証のための単
語がユーザに呈示され、ユーザの発音に基づいてユーザ
の認証が行なわれる。
【0030】尚、音声認識の分野では、単語辞書に格納
された単語つづりに対して音素変形規則を適用して、音
素ネットワークを生成し、入力音声とのマッチングを行
なう手法が、例えば、「木村,“音声中の音響セグメン
ト長の変動調査”,日本音響学会講演論文集1−2−1
4,1988年3月」、「木村,真田,岩見田,“音響
セグメントネットワークを用いた単語音声認識における
ルールの評価”日本音響学会講演論文集1−3−20,
1988年10月」、「木村,“音響セグメントネット
ワークによる単語候補選択”,日本音響学会講演論文集
2−P−7,1989年10月」、「山崎,木村,音響
セグメントネットワークを用いた10万単語認識”,日
本音響学会講演論文集1−3−24,1990年3
月」、および「山崎,木村,“大語彙音声認識における
処理量削減の検討”,日本音響学会講演論文集2−8−
6,1990年9月」等に提案があり、本装置を用いた
ユーザ認証に適用することができる。
【0031】図1に示すユーザ認証装置には、ユーザ登
録時に必要となるブロックとして、上記のユーザ認証時
の説明で参照したブロックのほか、ユーザ情報データベ
ース記憶部11、ユーザ情報入力部12、ユーザ登録部
13、および音声登録処理部14が備えられている。ユ
ーザ情報データベース記憶部11には、ユーザを特定す
るユーザ情報の集まりからなるユーザ情報データベース
が記憶される。
【0032】ユーザ登録を行なうにあたっては、先ず、
ユーザ情報入力部12から、登録しようとするユーザを
特定するためのユーザ情報が入力される。ユーザ情報入
力部12により入力されたユーザ情報は、ユーザ登録部
13により、前記ユーザ情報データベースに登録され
る。次いで、ユーザは特定のいくつかの単語をマイクロ
ホンに向って発音する。その発音により得られた音声は
音声入力部7により入力され、特徴量抽出部8により、
その入力された音声の、各微小音響単位毎の特徴量が抽
出される。抽出された各微小音響単位毎の特徴量は、音
声登録部14により、ユーザ情報入力部12により入力
されたユーザ情報に対応づけられて、かつ微小音響単位
の種別を示す音素ラベルが付されて、音素辞書に登録さ
れる。ユーザに特定のいくつかの単語を発音させるにあ
たっては、発音すべき単語があらかじめ指定されていて
もよいが、誤りの防止の点、および発音のタイミングの
調整の点から、単語選択部4によりその特定のいくつか
の単語を1つずつ選択し、単語呈示部5によりその選択
した単語をユーザに呈示して、その呈示した単語をユー
ザに発音させることが好ましい。
【0033】図2は、本発明のユーザ認証装置の第2実
施形態のブロック図である。図1に示す実施形態におけ
るブロックと同一の作用をなすブロックには図1に付し
た符号と同一の符号を付して示し相違点について説明す
る。この図2に示す第2実施形態には、ユーザID入力
部15、ユーザID発行部25、およびユーザ辞書切替
部16が備えられており、さらに音素辞書が登録された
各ユーザ別に示されている。
【0034】図1を参照して説明したようにしてユーザ
登録が行なわれると、ユーザID発行部は、その登録し
たユーザに向けて、そのユーザを特定するためのユーザ
IDを発行する。ユーザ認証にあたっては、認証を受け
ようとするユーザは、先ずユーザID入力部15より、
ユーザIDを入力する。ユーザID入力部15は、ユー
ザIDが入力されるとその入力されたユーザIDをユー
ザ辞書切替部16に伝える。ユーザ辞書切替部16は、
ユーザ登録時には、音声登録処理部14から入力された
登録ユーザを特定する情報に基づいて音素辞書をそのユ
ーザ用の音素辞書に切り替え、ユーザ認証時には、ユー
ザID入力部15から入力されたユーザIDに基づいて
そのユーザIDにより特定されるユーザの音素辞書が距
離算出部9から参照されるように音素辞書を切り替え
る。
【0035】これにより、前述したように高速のユーザ
認証が可能となる。図3は、本発明のユーザ認証装置の
第3実施形態のブロック図である。この図3に示す第3
実施形態には、図2に示す実施形態と同様、ユーザID
発行部25およびユーザ辞書切替部18が備えられてお
り、かつ音素辞書が各登録ユーザ別に示されているが、
図2に示す第2実施形態におけるID入力部は備えられ
ておらず、それに代わり、不特定話者用音声辞書を記憶
する不特定話者用音声辞書記憶部27と、不特定話者英
数字認識部17とが備えられている。不特定話者用音声
辞書12は、話者を特定せず、不特定の話者による英数
字の発音による音声からその発音された英数字を認識す
るためのデータが格納されている。
【0036】ユーザは、認証を受けるにあたり、マイク
ロホンに向って、英数字からなる自分のユーザIDを発
音する。そのユーザIDの音声は音声入力部7を経由し
て不特定話者英数字認識部17に入力され、不特定話者
英数字認識部17では、不特定話者用音声辞書が参照さ
れ、英数字からなるユーザIDが認識される。この認識
されたユーザIDは、図2に示す第2実施形態の場合と
同様、ユーザ辞書切替部18に送られ音声辞書の切り替
えに用いられる。
【0037】ユーザIDが例えば英数字等比較的少ない
数の単語であらわされる場合は、この第3実施形態のよ
うにユーザID自体を音声で入力することもできる。図
4は、本発明のユーザ認証装置の第4実施形態のブロッ
ク図である。この図4に示す第4実施形態には電話回線
制御部30が備えられており、外部に備えられた電話7
0と、内部の、音声入力部7および音声合成部35との
間の中継の役割りを担っている。音声合成部35は、本
発明にいう単語呈示部の一態様であり、単語選択部4に
より選択された単語の読みを音声信号に変換して電話回
線制御部30に送り、電話回線制御部30はその音声信
号を外部の電話に向けて電話回線に送り出す。また電話
回線制御部30は、外部の電話70からの音声信号を音
声入力部7に伝える。
【0038】このように電話回線を介して音声信号を入
出力するように構成すると、汎用性が大きく広がること
になる。
【0039】
【発明の効果】以上説明したように、本発明のユーザ認
証装置によれば、ユーザ登録時にユーザに過大な負担を
強いることなく、極めてバリエーションに富んだ単語
(1つもしくは複数)をユーザに呈示して発音させるこ
とができ、欺かれる確率が極めて低いレベルに押えられ
る。
【図面の簡単な説明】
【図1】本発明のユーザ認証装置の基本的な実施形態で
ある第1実施形態を示すブロック図である。
【図2】本発明のユーザ認証装置の第2実施形態のブロ
ック図である。
【図3】本発明のユーザ認証装置の第3実施形態のブロ
ック図である。
【図4】本発明のユーザ認証装置の第4実施形態のブロ
ック図である。
【図5】音声を用いてユーザ認証を行なう、従来のユー
ザ認証装置の一例を示すブロック図である。
【符号の説明】 1 音素辞書記憶部 2 単語辞書記憶部 3 音素変形規則記憶部 4 単語選択部 5 単語呈示部 6 音素ネットワーク生成部 7 音声入力部 8 特徴量抽出部 9 距離算出部 10 認証結果通知部 11 ユーザ情報データベース記憶部 12 ユーザ情報入力部 12 不特定話者用音声辞書 13 ユーザ登録部 14 音声登録処理部 15 ユーザID入力部 16 ユーザ辞書切替部 17 不特定話者英数字認識部 18 ユーザ辞書切替部 25 ユーザID発行部 27 不特定話者用音声辞書記憶部 30 電話回線制御部 35 音声合成部 70 電話

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 ユーザにより発音された音声を入力し、
    入力された音声に基づいて該ユーザがあらかじめ登録さ
    れたユーザであるか否かの認証を行なうユーザ認証装置
    において、 音声としての特徴量の抽出が可能な微小音響単位別の特
    徴量の各ユーザ別の集合からなる音素辞書を登録された
    ユーザ分記憶する音素辞書記憶部と、 複数の単語と該単語の読みの集合からなる単語辞書を記
    憶する単語辞書記憶部と、 単語の読みを、該読みに対応する微小音響単位の系列か
    らなる音素ネットワークに変換するための音素変形規則
    を記憶する音素変形規則記憶部と、 前記単語辞書から単語を選択する単語選択部と、 前記単語選択部により選択された単語を、認証を受けよ
    うとするユーザに向けて呈示する単語呈示部と、 前記音素変形規則を用いて、前記単語選択部により選択
    された単語の読みに対応する音素ネットワークを生成す
    る音素ネットワーク生成部と、 ユーザにより発音された音声を入力する音声入力部と、 前記音声入力部により入力された音声が時系列的に分解
    されてなる複数の微小音響単位別の特徴量を抽出するこ
    とにより複数の特徴量が配列されてなる第1の特徴量配
    列データを生成する特徴量抽出部と、 前記音素辞書を用いて、前記音素ネットワーク生成部で
    生成された音素ネットワークを特徴量の配列に変換する
    ことにより第2の特徴量配列データを生成し、2つの特
    徴量配列データどうしの相違が定量化されてなる距離
    を、前記第1の特徴量配列データと前記第2の特徴量配
    列データとの相違について算出する距離算出部と、 前記距離算出部により算出された距離に基づいて、前記
    音声入力部により入力された音声を発音したユーザが登
    録されたユーザであるか否かの認証を行ない該認証の結
    果を通知する認証結果通知部とを備えたことを特徴とす
    るユーザ認証装置。
  2. 【請求項2】 登録されたユーザ別に発行されたユーザ
    IDを入力するユーザID入力部と、 前記距離算出部において前記ユーザID入力部により入
    力されたユーザIDにより特定されるユーザ用の音素辞
    書が用いられるように音素辞書を切り替えるユーザ辞書
    切替部とを備えたことを特徴とする請求項1記載のユー
    ザ認証装置。
  3. 【請求項3】 前記音声入力部から入力された音声に基
    づいて、登録されたユーザ別に発行されたユーザIDを
    認識するユーザID認識部と、 前記距離算出部において前記ユーザID認識部により認
    識されたユーザIDにより特定されるユーザ用の音素辞
    書が用いられるように音素辞書を切り替えるユーザ辞書
    切替部とを備えたことを特徴とする請求項1記載のユー
    ザ認証装置。
  4. 【請求項4】 ユーザを特定するユーザ情報の集まりか
    らなるユーザ情報データベースを記憶するユーザ情報デ
    ータベース記憶部と、 ユーザ情報を入力するユーザ情報入力部と、 前記ユーザ情報入力部により入力されたユーザ情報を前
    記ユーザ情報データベースに登録するユーザ登録部と、 前記音声入力部により入力された所定の単語が発音され
    てなる音声に基づいて前記特徴量抽出部により抽出され
    た特徴量を、前記ユーザ情報入力部により入力されたユ
    ーザ情報に対応づけて前記音素辞書に登録する音声登録
    処理部とを備えたことを特徴とする請求項1記載のユー
    ザ認証装置。
JP8172559A 1996-07-02 1996-07-02 ユーザ認証装置 Pending JPH1020883A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8172559A JPH1020883A (ja) 1996-07-02 1996-07-02 ユーザ認証装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8172559A JPH1020883A (ja) 1996-07-02 1996-07-02 ユーザ認証装置

Publications (1)

Publication Number Publication Date
JPH1020883A true JPH1020883A (ja) 1998-01-23

Family

ID=15944107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8172559A Pending JPH1020883A (ja) 1996-07-02 1996-07-02 ユーザ認証装置

Country Status (1)

Country Link
JP (1) JPH1020883A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001099096A1 (fr) * 2000-06-20 2001-12-27 Sharp Kabushiki Kaisha Systeme de communication a entree vocale, terminal d'utilisateur et systeme central
WO2005119654A1 (ja) * 2004-06-01 2005-12-15 Toshiba Tec Kabushiki Kaisha 話者認識装置、プログラム及び話者認識方法
WO2016103415A1 (ja) * 2014-12-25 2016-06-30 日立マクセル株式会社 ヘッドマウントディスプレイシステム及びヘッドマウントディスプレイ装置の操作方法
KR20160110085A (ko) * 2015-03-13 2016-09-21 삼성전자주식회사 음성 인식 시스템 및 방법
JP2017010511A (ja) * 2015-06-25 2017-01-12 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 声紋認証方法および装置
JP2017049600A (ja) * 2014-04-01 2017-03-09 グーグル インコーポレイテッド 動的に生成された句を使用するセグメントベースの話者検証
KR20170105034A (ko) * 2015-02-05 2017-09-18 베이징 디-이어 테크놀로지스 씨오., 엘티디. 동적 패스워드 음성에 기반한 자체 학습 기능을 구비한 신분 인증 시스템 및 방법
WO2020054002A1 (ja) * 2018-09-12 2020-03-19 マクセル株式会社 情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法
JP2022116097A (ja) * 2018-09-12 2022-08-09 マクセル株式会社 情報処理装置
KR102579130B1 (ko) * 2023-01-30 2023-09-18 주식회사 퍼즐에이아이 다중경로 ctc 정렬 기반의 음성 인식 및 본인 검증을 지원하는 시스템 및 방법

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7225134B2 (en) 2000-06-20 2007-05-29 Sharp Kabushiki Kaisha Speech input communication system, user terminal and center system
WO2001099096A1 (fr) * 2000-06-20 2001-12-27 Sharp Kabushiki Kaisha Systeme de communication a entree vocale, terminal d'utilisateur et systeme central
WO2005119654A1 (ja) * 2004-06-01 2005-12-15 Toshiba Tec Kabushiki Kaisha 話者認識装置、プログラム及び話者認識方法
CN110827833B (zh) * 2014-04-01 2023-08-15 谷歌有限责任公司 使用动态生成的短语的基于段的说话者验证
KR20200120765A (ko) * 2014-04-01 2020-10-21 구글 엘엘씨 동적으로 발생된 어구들을 사용하는 세그먼트 기반 화자 검증
CN110827833A (zh) * 2014-04-01 2020-02-21 谷歌有限责任公司 使用动态生成的短语的基于段的说话者验证
JP2017049600A (ja) * 2014-04-01 2017-03-09 グーグル インコーポレイテッド 動的に生成された句を使用するセグメントベースの話者検証
JP2017058689A (ja) * 2014-04-01 2017-03-23 グーグル インコーポレイテッド 動的に生成された句を使用するセグメントベースの話者検証
US9741348B2 (en) 2014-04-01 2017-08-22 Google Inc. Segment-based speaker verification using dynamically generated phrases
US10037760B2 (en) 2014-04-01 2018-07-31 Google Llc Segment-based speaker verification using dynamically generated phrases
WO2016103415A1 (ja) * 2014-12-25 2016-06-30 日立マクセル株式会社 ヘッドマウントディスプレイシステム及びヘッドマウントディスプレイ装置の操作方法
JPWO2016103415A1 (ja) * 2014-12-25 2017-11-09 日立マクセル株式会社 ヘッドマウントディスプレイシステム及びヘッドマウントディスプレイ装置の操作方法
US10613826B2 (en) 2014-12-25 2020-04-07 Maxell, Ltd. Head-mounted display system and operating method for head-mounted display device
KR20170105034A (ko) * 2015-02-05 2017-09-18 베이징 디-이어 테크놀로지스 씨오., 엘티디. 동적 패스워드 음성에 기반한 자체 학습 기능을 구비한 신분 인증 시스템 및 방법
KR20160110085A (ko) * 2015-03-13 2016-09-21 삼성전자주식회사 음성 인식 시스템 및 방법
JP2017010511A (ja) * 2015-06-25 2017-01-12 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 声紋認証方法および装置
US9792913B2 (en) 2015-06-25 2017-10-17 Baidu Online Network Technology (Beijing) Co., Ltd. Voiceprint authentication method and apparatus
WO2020054002A1 (ja) * 2018-09-12 2020-03-19 マクセル株式会社 情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法
JPWO2020054002A1 (ja) * 2018-09-12 2021-09-24 マクセル株式会社 情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法
JP2022116097A (ja) * 2018-09-12 2022-08-09 マクセル株式会社 情報処理装置
KR102579130B1 (ko) * 2023-01-30 2023-09-18 주식회사 퍼즐에이아이 다중경로 ctc 정렬 기반의 음성 인식 및 본인 검증을 지원하는 시스템 및 방법

Similar Documents

Publication Publication Date Title
JP4672003B2 (ja) 音声認証システム
US7124082B2 (en) Phonetic speech-to-text-to-speech system and method
CN101154380B (zh) 说话人认证的注册及验证的方法和装置
JPS63223965A (ja) 知的ワ−クステ−シヨン
JP3280825B2 (ja) 音声特徴分析装置
JPH0916602A (ja) 翻訳装置および翻訳方法
US20070088547A1 (en) Phonetic speech-to-text-to-speech system and method
JP2003058190A (ja) 個人認証方式
JPH06175680A (ja) 最も近い隣接距離を使用した発声者確認装置
JP2008309856A (ja) 音声認識装置及び会議システム
JPH1020883A (ja) ユーザ認証装置
US10957318B2 (en) Dynamic voice authentication
JP2008275987A (ja) 音声認識装置および会議システム
JPS62502571A (ja) 音声分析による個人の識別
JP2021064110A (ja) 音声認証装置、音声認証システム、および音声認証方法
JP4245948B2 (ja) 音声認証装置、音声認証方法及び音声認証プログラム
JP3818063B2 (ja) 個人認証装置
Wu et al. Speech activated telephony email reader (SATER) based on speaker verification and text-to-speech conversion
WO2006027844A1 (ja) 話者照合装置
JPH09179578A (ja) 単音節認識装置
JPH10116093A (ja) 音声認識装置
KR20090081046A (ko) 인터넷을 이용한 언어 학습 시스템 및 방법
JPH06337700A (ja) 音声合成装置
JPS6386652A (ja) 電話着呼情報提供システム
JPH11344992A (ja) 音声辞書作成方法、個人認証装置および記録媒体

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040210