JP3818063B2

JP3818063B2 - 個人認証装置

Info

Publication number: JP3818063B2
Application number: JP2001016662A
Authority: JP
Inventors: 利幸森井
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2001-01-25
Filing date: 2001-01-25
Publication date: 2006-09-06
Anticipated expiration: 2021-01-25
Also published as: JP2002221990A

Description

【０００１】
【発明の属する技術分野】
本発明は、銀行やパソコンのセキュリティーシステムに用いられる個人を認証する装置に関するものである。
【０００２】
【従来の技術】
以下では、従来の個人認証技術を説明する。
【０００３】
近年情報関連技術の進歩により、ネットワーク、コンピュータ等による産業、生活の情報化が著しい。その中で、情報の保全を目的としたセキュリティー技術の需要が急速に高まっている。特に、個人の認証技術は人間そのものを鍵とする暗号技術であり、最も基本的且つますます必要になるセキュリティー技術である。
【０００４】
これまで、暗証番号、サイン、指紋、アイリス（虹彩）等が検討され商用化されている。最近では、指紋の１０^-6という誤り率の高精度認証技術が確立されパソコンのインターフェース等に利用され商用化されようとしており、また、アイリスによる認証は１０^-4の誤り率の精度が得られるとされ、一部の銀行において利用されている。その中で、音声による個人の認証技術はNTT、東工大等によって１０年以上前から研究されてきたが、テキスト依存型でも精度は９５〜９８％であるとされ、他の技術と比較して格段に精度が悪い。
【０００５】
しかし、音声は人がコミュニケーションに使用する自然なインターフェースであり、その手軽さから利用の道が開かれることが強く望まれている。しかしこれまでにない性能を実現しなければ音声による個人認証を実現することはできなかった。
【０００６】
【発明が解決しようとする課題】
以上のように、従来から音声による個人認証は研究されてきたがその精度は９５〜９８％と指紋やアイリスと比較して格段に性能が悪かった。しかし、音声は人がコミュニケーションに使用する自然なインターフェースであり、その手軽さから利用の道が開かれることが強く望まれており、これまでにない性能を実現することが大きな課題となっていた。
【０００７】
【課題を解決するための手段】
この問題を解決するために、請求項１記載の発明は、話者認識部と発声内容認識部と認識結果統合部とを備え、話者の認識と発声内容の認識の両方を行い、それらの結果を統合することによって個人認証を行うことを特徴とするように構成した個人認証装置である。
【０００８】
これにより、話者認識部の認識結果と発声内容の認識結果を統合することができることから従来は話者認識のみで実現されていた個人認証技術よりも高精度な個人認証を実現することが可能になる。
【０００９】
また、請求項２記載の発明は、認証用言語が、音響的情報及び内容間類似度に基づき、言語の意味内容は問わずに生成されたことを特徴とする。
【００１０】
これにより、まず音響的情報に基づいているため、高い話者認識精度が得られ、また、内容間類似度に基づいているため高い内容認識精度が得られ、それらを統合するのでより高い個人認証精度を得ることが出来る。
【００１１】
【発明の実施の形態】
本発明の請求項１に記載の発明は、話者認識部と発声内容認識部と認識結果統合部とを備えることを特徴とした個人認証装置であり、さらに発声内容として本発明の請求項２に記載の発明を採用することにより従来よりも格別の認証精度を得ることが可能になるという作用を有する。以下の説明では、本発明の請求項２記載の３つの特徴を持つ発声内容を仮に「呪文」（認証用言語を指す）と呼ぶこととする。
【００１２】
以下に本発明の実施の形態について説明する。
【００１３】
図１は、本実施の形態における個人認証装置の機能ブロック図である。
【００１４】
図１において、１００はマイク、１０１は音声入力部、１０２はキーボード、１０３はキー入力部、１０４は話者登録部、１０５は個人性格納部、１０６は話者認識部、１０７は登録Ｎｏ格納部、１０８は発声内容認識部、１０９は呪文格納部、１１０は認識結果統合部、１１１は認証結果、１１２はスイッチである。以下に図１を用いて個人認証アルゴリズムを説明する。
【００１５】
まず、認証させたい使用者（認証者と呼ぶ）の登録方法から説明する。
【００１６】
この時、スイッチ１１２を話者登録部１０４から話者認識部１０６と発声内容認識部１０８へつながるように切り替える。この切替は、例えば、人間（認証者）がおこなう。
【００１７】
予め呪文格納部１０９に格納している呪文は、３つの特徴、（１）内容自身に意味はなく、また、（２）個人を識別するのに十分な音響的情報を含んでおり、また、十分なロバスト性（環境、個人の状態）を持ち、個人の認識精度が極めて高く、また、（３）内容の群（予め決められた十分多くの集まり）を有している。
【００１８】
この呪文は、内容間類似度の最大値が極めて低く、誰が発声しても認識率が極めて高くなる、を有している）のリストを用意しておき、認証者はその中から任意の呪文を記憶する。呪文のリストの例を以下の図２に示す。図２に示すように、各呪文には番号が付けられている。また、世界共通で使用する場合は各国の音韻の呪文を格納する。内容間類似度とは、登録されている文字列と文字列との類似度をいう。
【００１９】
そして、認証者は覚えた呪文を登録する。まず、キーボード１０２によって呪文の番号を入力する。キー入力部１０３は入力された番号を話者登録部１０４へ送る。また、認証者は覚えた呪文をマイク１００に発声する。音声入力部１０１は入力された音声信号を話者登録部１０４へ送る。話者登録部１０４は、まず、キー入力部１０３から送られてきた呪文の番号を発声内容認識部１０８へ送る。
【００２０】
この時、発声内容認識部１０８は登録モードであることをスイッチ１１２の状態から認識し、送られてきた番号を登録Ｎｏ格納部１０７へ格納する。次に、話者登録部１０４は、音声入力部１０１から送られてきた音声信号を話者認識部１０６に送る。話者認識部１０６は登録モードであることをスイッチ１１２の状態から認識し、送られてきた音声信号を分析し認証者の個人性パターン（話者音韻モデル）を作成して個人性格納部１０５へ格納する。個人性パターンとは、話者の識別に用いる個人の特徴をあらわしたパラメータであって、例えば、下記文献Ａの話者音韻モデルが相当する。
【００２１】
この個人性パターンの作成方法としては様々な方法が研究されている。文献Ａ（松井他「テキスト指定型話者認識」、電子情報通信学会論文誌Ｄ−ＩＩ、Ｖｏｌ．Ｊ７９−Ｄ−ＩＩ、Ｎｏ．５、ｐｐ．６４７−６５６、１９９６年５月）の「話者音韻モデル」に開示されているように、話者隠れマルコフモデルを基本とし、各話者の学習データ及び不特定話者の隠れマルコフモデルを用いて、話者隠れマルコフモデルを学習させて、個人性パラメータを生成する。
【００２２】
なお、個人性パターンとは、話者の識別に用いる個人の特徴を表したパラメータであって、例えば、上記文献の「話者音韻モデル」に相当する。
【００２３】
以上で認証者の登録は終了である。なお、認証者は呪文の番号を記憶しておく必要はない。
【００２４】
次に認証時の機能について詳細に説明する。
【００２５】
認証時には、予め、スイッチ１１２は音声入力部１０１が話者認識部１０６と発声内容認識部１０８とにつながるように切り替えておく。
【００２６】
まず、認証される人物（被験者と呼ぶ）はマイク１００に向かって呪文を発声する。（もちろん、被験者が認証者で、認証者と認識されたい場合は、記憶しておいた呪文を発声する。）音声入力部１０１は入力された音声を、話者認識部１０６と発声内容認識部１０８へ送る。話者認識部１０６はスイッチが認証時の状態になっていることを認識し、送られてきた音声信号を分析し被験者の個人性パターンを抽出する。
【００２７】
そして、この個人性パターンと個人性格納部１０５内に格納された認証者の個人性パターンとの照合を行い、被験者が認証者であるかどうかを示す度合いを求め、認識結果統合部１１０へ送る。具体的照合方法については上記（文献Ａ）に開示されている。また、発声内容認識部１０８では、送られてきた音声信号と呪文格納部１０９に格納されたパターンとの照合を行う。
【００２８】
具体的な照合方法については、ＨＭＭやモデル音声法やＣｏｍｐａｔｓ法やＣＬＭ法等様々な方法が既に研究されている。一例として、上記文献に記載の通り、話者音韻モデルを連結して、そのテキストのモデルを作成し、入力音声をそのテキストのモデルに与えたときのゆう度を計算し、話者及びテキストの判定をおこなう。
【００２９】
また、ＣＬＭ法については研究会資料：文献Ｂ（平岡他「ワードスポッティング手法を用いた不特定話者・少数語向け音声認識装置」、電子情報通信学会、音声研究会資料、ＳＰ８８−１８、１９８８年６月）に開示されている。
【００３０】
また、モデル音声法については、研究会資料：文献Ｃ（宮田他「ＣＶ・ＶＣ・ＶＣＶを単位としたモデル音声法による不特定話者音声認識」、電子情報通信学会、音声研究会資料、ＳＰ９１−８３、１９９１年１２月）に開示されている。そして、照合結果（「どの呪文にどれだけ近かったか」や「登録Ｎｏ格納部１０７に格納された番号の呪文とはどれだけ近かったか」といった類似度情報）を認識結果統合部１１０へ送る。
【００３１】
なお、呪文格納部１０９に呪文を格納する形態は発声内容認識部１０８の照合方法によって様々な構造をとる。例えば、（文献Ｂ）のように、音声信号を統計的に分析して選られるパラメータの時系列モデルで認識する場合は、呪文を表わす時系列パターンの形態で格納する。
【００３２】
また、（文献Ｃ）のように、音声片を認識の単位とする場合はテキストの形態で格納する。そして、認識結果統合部１１０では、話者認識部１０６と発声内容認識部１０８から送られてきた結果を基に総合的な判断を行い、被験者が認証者か否かの判断を認証結果１１１として出力する。
【００３３】
総合的な判断の方法としては様々な方法があるが、一例としては、「どれだけ認証者に近いか（類似度）」の値Ｓ１と「登録Ｎｏ格納部１０７に格納された番号の呪文とはどれだけ近かったか（類似度）」の値Ｓ２と「登録Ｎｏ格納部１０７に格納された番号以外で最も近かった呪文の類似度」の値をＳ３として以下の（数１）で判断する方法が挙げられる。
【００３４】
【数１】

【００３５】
以上の構成により高い個人認証精度を得ることが出来る。
【００３６】
なお、定数ａ，ｂ，ｔは、認証者であるかないか既知の教師データ（様々な人が被験者として発声して得られる話者認識部１０６の出力と発声内容認識部１０８の出力を記録したものにその被験者が認証者であるかないかを併せて記録したデータベース）に基づく学習（最も認証精度が上がるような境界面（直線）を求めること）により求める。学習方法の一例を以下に示す。まず、教師データを以下の（数２）に示す。
【００３７】
【数２】

【００３８】
まず、定数ａ、ｂを定める。これらは、以下のコスト関数（数３）を最小にするように求める。
【００３９】
【数３】

【００４０】
そこで、定数ａ、ｂは、上記コスト関数をａ、ｂで偏微分することにより得られる２つのａ、ｂを変数とした１次式を、連立方程式として解くことにより求めることができる。これにより認証者である集合と認証者でない集合の境界線の傾きを定めることができる。
【００４１】
次に定数ｔの学習であるが、本実施例では一例として、目標となる２つの誤認証率（認証者でない者を認証者と間違えてしまう率（誤許容率）、認証者を認証者でないと間違えてしまう率（誤拒否率））の要求基準を反映しながら、両者を小さくするような逐次近似アルゴリズムで求める。アルゴリズムの手順を以下に示す。
（１）初期値としてｔ＝０とする。（これは、（数２）のＴｎの設定に依存する。）
（２）教師データの各サンプルに対して（数１）の判定を行い、教師データについて誤許容率Ｐと誤拒否率Ｑを計算する。
（３）以下の（数４）の値Ｒを計算する。
【００４２】
【数４】

【００４３】
（４）予め定めた固定の微小量ｘを用いて、ｔ＋ｘ、ｔ−ｘの２つの場合について上記（２）（３）と同様の処理を行い、それぞれの値（Ｒ＋、Ｒ−と呼ぶ）を求める。
（５）Ｒ＜Ｒ＋且つＲ＜Ｒ− の時終了、その時のｔを使用する。
【００４４】
Ｒ＞Ｒ＋且つＲ＜Ｒ− の時、ｔ＝ｔ＋ｘとして（２）へ。
【００４５】
Ｒ＜Ｒ＋且つＲ＞Ｒ− の時、ｔ＝ｔ―ｘとして（２）へ。
【００４６】
Ｒ＞Ｒ＋且つＲ＞Ｒ− 且つＲ＋＜Ｒ− の時、ｔ＝ｔ＋ｘとして（２）へ。
【００４７】
Ｒ＞Ｒ＋且つＲ＞Ｒ− 且つＲ＋＞Ｒ− の時、ｔ＝ｔ―ｘとして（２）へ。
【００４８】
上記アルゴリズムにより定数ａ、ｂ、ｔが学習できる。この他にもニューラルネットの学習アルゴリズムや、最尤降下法、遺伝的アルゴリズムなどのアルゴリズムでも学習できる。また、上記アルゴリズムにおいて変化量Ｘを適応的に徐々に変化させていく方法も有効である。
【００４９】
ここで、本発明の２の重要な特徴である「呪文群」の作成方法の一例を述べる。まず、呪文の定義を以下に示す。
（１）内容自身に意味はない。
（２）個人を識別するのに十分な音響的情報を含んでおり、また、十分なロバスト性（環境、個人の状態）を持ち、個人の認識精度が極めて高くなる。
（３）内容の群（予め決められた十分多くの集まり）は、内容間類似度の最大値が極めて低く、誰が発声しても認識率が極めて高くなる。
【００５０】
以下、呪文群の作成方法について述べる。なお、音韻の単位としては、音素、半音節、音節等様々であり、外国語も含めると更に多種多様なものがあるが、本実施例の説明では分かりやすくするために「仮名」を単位とする。
【００５１】
まず、上記特徴の（２）を満たすために、呪文を構成する最低限の仮名を設定し、乱数を用いて、十分多数の呪文候補集団（「母集団Ａ」と呼ぶ）を作成する。個人性が特にどの音韻や周波数に含まれているかという研究もなされているが、ここでは一例として音韻バランスを考慮した方法を用いる。
【００５２】
例えば、ロバスト性（環境、個人の状態）も考慮して、「母音」「有声子音」「無声子音」「半母音」「濁音」の５種類は必ず含むようにし、その間に任意の仮名が入るように構成する。
【００５３】
やり方としては、まず文字数を乱数で決定（５文字以上。一般の人が簡単に覚えられる数を考慮しあまり長くならないように設定。）し、その何文字目に上記５種類の仮名が来るかかを乱数で決定し、更にそれぞれの種類のどの仮名を使用するかを乱数で決定し、最後に残りの場所の仮名を全ての仮名の集合から乱数で抽出して決定するという方法が挙げられる。
【００５４】
この方法で膨大な数の要素からなる母集団Ａを作成することができる。これらは、個人を識別するのに十分な音響的情報を含んでおり、上記（２）の特徴を持つ。なお、母集団Ａ作成時には、簡単な規則によって常識的拘束を与えることが有効である。
【００５５】
例えば、「「ん」は先頭に来ない」や「「ん」や「っ」は２つ続かない」や「「っ」は語尾に来ない」や「「ん」の後に母音は来ない」や「「っ」の後に母音、半母音は来ない」や「同音は３つ続かない」等である。
【００５６】
次に、上記母集団Ａから上記特徴の（３）を持つものを自動的に選択し、新たな母集団（「母集団Ｂ」と呼ぶ）を作成する。まず、各仮名の標準パターンと、仮名の類似度、内容間類似度について、その一例を述べる。
【００５７】
まず、仮名のラベル付けされた（時間的にどこからどこまでがどの仮名なのかが記述され音声データに付加されている）多くの話者の単語集団から各仮名の音響パラメータの時系列を切り出し、それらの多くの集合（仮名データと呼ぶ）から平均と分散を求めることにより各仮名の標準パターンを求めることができる。
【００５８】
そして、各仮名の標準パターンと上記多くの仮名データとをマッチングすることによって得られる類似度を平均化（パターンとデータの関係を換えて再度マッチングして全ての平均をとる）することにより、仮名同士の類似度を求める。例えば以下の（表１）の様な表が作成できる。なお、上記マッチング方法については、（文献Ｂ）に開示されている。（「単語マッチング」を「仮名マッチング」に応用すればよい。）
【００５９】
【表１】

【００６０】
（表１）を利用すれば各仮名同士の類似度が求められる。そこで、この表を用いて内容間類似度を求める。この際のマッチングの方法としては、ＤＰ（動的計画法）や部分スポッティングを用いたもの等が挙げられる。本実施の形態では、最も基本的な例として、１つの仮名の位置のずれを考慮して最も類似度が大きくなる時の各仮名の類似度の合計類似度を求めるというアルゴリズムを採用する。
【００６１】
例えば「アイウエオ」と「エンキッカウイオー」の内容間類似度の求め方を以下の（図３）に示す。（実際は呪文の特徴（２）より上記２つの内容は存在しないが、（表１）を用いて説明するためにこれらの内容を使用することに注意されたい。また、類似度は（表１）を参照している。）
図３のように、上記２つの内容の場合は内容間類似度は（表１）を利用してもとめた相互の類似度の和を求め「７５」という値になる。このようにして、２つの内容の内容間類似度を求めることができる。
【００６２】
なお、上記アルゴリズムに、上記値を仮名の数で割って正規化するという方法で内容間類似度を求めるという方法を追加すれば、より仮名文字数に依存しない類似度が得られる。
【００６３】
また、文字列が部分的に似ているという場合も考えられるので、比較する２つの文字列のうち短い文字列の前後に「っ」を付加した文字列（長い文字列の文字数と短い文字列の文字数の差の数だけ場合が存在する）でマッチングをとることによりより確実な内容間類似度を得ることができる。
【００６４】
例えば、「アイウエオ」と「ガピアイウエオートル」のマッチングでは、「アイウエオッッッッッ」と「ッアイウエオッッッッ」と「ッッアイウエオッッッ」と「ッッッアイウエオッッ」と「ッッッッアイウエオッ」と「ッッッッッアイウエオ」とマッチングを取り、最大の類似度を内容間類似度とすればよい。この工夫により、部分的に近い場合にも高い類似度が確実に得られる。以上で内容間類似度の求め方の説明を終わる。
【００６５】
そこで、母集団Ａの各要素に対して、上記内容間類似度を用いた自動選択を行い、母集団Ｂを作成する。自動選択アルゴリズムについて以下に示す。本実施の形態では、予め指定した数の要素まで母集団Ａの要素を間引くことによって母集団Ｂを作成するというアルゴリズムである。
（０）予め母集団Ｂの要素数の目標値を定めておく。
（１）母集団Ａの要素に全てに番号（順番）をつける。
（２）ｎを１から母集団Ａの要素数まで１つづつ動かし、（３）を行う。
（３）番号ｎの要素と母集団Ａの要素全てとマッチングを行い、その内容間類似度の最大値と次に大きな値（準最大値）を求め、これらを番号ｎの要素の総合類似度とする。
（４）母集団Ａの要素すべての総合類似度を調べ、総合類似度（最大値の方）が最大となる２つの要素を特定する。
（５）２つの要素のうち、準最大値が大きい方の要素を母集団Ａから削除する。
【００６６】
（６）母集団Ａの要素数が予め指定しておいた目標値になったとき、これを母集団Ｂとして、終了する。それ以外の場合は（１）にいく。
【００６７】
上記アルゴリズムによって、最適ではないが、相互の内容間類似度の比較的低い、呪文の定義の（３）の特徴を持つ母集団が作成できる。なお、選択アルゴリズムとしては、この他にも、逆に要素を増やしていくようなアルゴリズム等、様々なものが存在する。
【００６８】
そして、最後に人が母集団Ｂの要素（呪文候補）を吟味し、発声できないものや、鍵とするのに適当でないものを削除する。以下のような場合が考えられる。（１）発声し難いもの。（「イアヘッホロピビヒ」等）安定した発声ができないものは除く。
（２）意味のある文字列を含むもの。特に口にして問題のある単語を含む場合は除く。
【００６９】
上記の作業によって「呪文群」が完成する。以上で呪文群の作成法の説明を終わる。
【００７０】
そして、呪文群を利用して、認証者の登録のために「呪文群の番号付きリスト」を作成し用意し、また認証のために呪文格納部１０９に格納する呪文パターンを作成する。
【００７１】
ここで、呪文格納部１０９に格納するパターンの作成方法について述べる。文献Ｂに開示されている不特定話者の音声認識技術を用いる場合は、老若男女沢山の話者に呪文群の呪文を発声してもらい、これを録音・音声区間の切り出しを行い、各呪文の音声データベースを作成し、これを用いて呪文の標準パターンを作成し、これを格納することによって呪文格納部１０９を準備する。このアルゴリズムは文献Ｂに開示されている。
【００７２】
また、呪文の数が多い場合は、多くの話者の音声データベースから各音韻（半音節、音節など）の標準パターンを作成して用いる場合もある。このアルゴリズムは文献Ｃに開示されている。この場合、呪文はテキストで記述していればよく、認識の際に音韻標準パターンを接続することによって呪文の標準パターンを作成する。また、ＨＭＭや他の認識方法を用いる場合には、上記２つとはまた異なる形態の標準パターンが呪文格納部１０９に格納される。
【００７３】
以上で認証方法の全説明を終わる。
【００７４】
さて、上記認証方法の説明で述べた、認証結果１１１を実際の鍵に伝え、被験者が認証者であるという結果の場合に鍵を開けるようにすれば、音声を利用した部屋や金庫のセキュリティーシステムが構築出来る。またこの認証結果１１１と他の認証（指紋、アイリス、顔認識、サイン認識など）を併用することにより、さらに高精度なセキュリティーシステムも実現できる。
【００７５】
また、本発明の個人認証装置のアルゴリズムをプログラムとしてＨＤ、ＲＯＭ等の記録媒体に記録すれば、パソコンや携帯電話など広い応用範囲で音声を利用した高精度の個人認証が実現出来、様々なセキュリティーシステムを構築できる。
【００７６】
図４に、個人認証装置を用いた無線通信装置の一例を示す。２０１はマイク、２０２は通信部、２０３はアンテナ、２０４はスピーカ、２０５はキーボード、２０６は制御部、２０７は個人認証装置、２０８はハンドスイッチ、２０９はスイッチ、２１０は電源である。
【００７７】
本発明の無線通信装置の実施の形態の説明を行う。
【００７８】
まず、従来から携帯電話等に用いられてきた従来の通話機能について説明する。マイク２０１から入力された音声は通信部２０２で符号化、変調、高周波変換されてアンテナ２０３から送信される。また、アンテナ２０３で受信した電波は通信部２０２において、低周波変換、復調、復号化されてスピーカ２０４から音声出力される。
【００７９】
その他に通信部２０２はリングトーン（デュアルトーン）を検出してスピーカ２０４から着信を知らせるメロディを出力するという機能も有する。キーボード２０５は電話番号の入力や電源のオンオフを入力し、制御部２０６は、キーボード２０５の入力を受けて、宛先番号符号化を行い通信部２０２へ送る。以上の機能は全て電源２１０から供給される電気によって実現される。
【００８０】
次に、実使用時の機能について説明する。まず、ハンドスイッチ２０８とスイッチ２０９は始めオフの状態になっている。ここで、ハンドスイッチ２０８が押されると、マイク２０１とキーボード２０５と個人認証装置２０７に電源２１０から電気が供給され、個人認証ができるモードになる。
【００８１】
個人認証装置２０７は実施の形態１に記載した内容の構成と機能を持っており、そこで個人認証を行い、認証結果をスイッチ２０９に送る。スイッチ２０９は発声者が認証者と認めた時のみオンの状態になり、マイク２０１、通信部２０２、スピーカ２０４、キーボード２０５、制御部２０６へ電気が供給されるようにする。
【００８２】
これで、通常の無線通信装置として使用できるようになる。したがって、個人認証装置２０７からスイッチ２０９に送られてきた認証結果が「認証者でない」であった場合はスイッチ２０９はオフの状態のままであり、無線通信装置として使用できない状態のままを維持する。
【００８３】
また、ハンドスイッチは指を離すとオフの状態に戻るような機能を持ち、無駄な電気を消費しないようになっている。またキーボード２０５についている電源スイッチをオフにすることによりスイッチ２０９はオフの状態になり、次に認証者が認証されない限り動作しないことになる。
【００８４】
なお、認証者の登録はハンドスイッチをオンにしながら、マイクとキーボードを使用することにより行う。この機能については実施の形態１に記載した。また、非認証者が悪意で登録してしまうのを避けるために、一度登録を行ったら、認証者と認証しない限り再登録は行えないという機能を個人認証装置に追加すれば、更にセキュリティ度は向上する。
【００８５】
本発明は、上記実施の形態により、音声による個人認証機能により特定の人しか使用することができない無線通信装置を実現することができるという効果を有する。
【００８６】
図５に、個人認証装置を用いたセキュリティーシステムを示す。３０１はマイク、３０２は個人認証装置、３０３は鍵、３０４はキーボードである。なお、上記「鍵」はシステムを使用可能にする鍵であり、部屋や金庫のドアや、パソコン、銀行の端末、車のエンジンなどを使用可能にする鍵を示しており、そのいずれにも応用可能である。
【００８７】
本発明のセキュリティーシステムの実施の形態について以下に示す。
【００８８】
鍵３０３がかかった状態にあるとする。まず、使用者はマイク３０１に発声を行う。個人認証装置３０２は入力された音声から、使用者が認証者であるかどうかを認証し、認証結果を鍵３０３に出力する。鍵３０３は使用者が認証者である場合、鍵を解く。
【００８９】
これで、鍵の付いたシステムを使用することが出来る。なお、認証方法については実施の形態１に開示した。鍵は手動でかけることが出来るが解くことができないようになっており、声による認証によってのみ解くことができる。
【００９０】
以上によりシステムの使用に関するセキュリティーを保つことができる。なお、認証者の登録はマイク３０１、キーボード３０４、個人認証装置３０２を用いて事前に行う。登録方法については実施の形態１に記載した。また、一度登録したら認証者しか再登録ができないようにすればセキュリティー度を更に向上させることができる。
【００９１】
また、「鍵をかける」という行為を、手動でなく個人認証装置を利用して行うようにすることも可能である。この時、鍵の開閉を異なる発声内容で行うようにすれば、認証者しか開閉できない鍵が実現できる。
【００９２】
本発明は、上記実施の形態により、音声による個人認証機能により特定の人しか使用することができないシステムを実現することができるという効果を有する。
【００９３】
【発明の効果】
以上のように、話者認識部と発声内容認識部と認識結果統合部とを備える特徴により、話者認識部の認識結果と発声内容の認識結果を統合することができることから従来は話者認識のみで実現されていた個人認証技術よりも高精度な個人認証を実現することが可能になり、
また、本発明の２の発声する内容の特徴により、まず（２）の特徴からより高い話者認識精度が得られ、また（３）の特徴からより高い内容認識精度が得られ、それらを統合するのでより高い個人認証精度を得ることが出来、また、本発明の３の特徴により、高精度の個人認証を実現することが出来、音声を利用した安全なセキュリティーシステムが構築出来、従来得られなかった格別の効果を得ることができる。
【図面の簡単な説明】
【図１】本発明の実施の形態による個人認証装置の機能ブロック図
【図２】呪文リストの一例を示した図
【図３】内容間類似度の計算方法の一例を示した図
【図４】個人認証装置を用いた無線通信装置の構成を示した図
【図５】個人認証装置を用いたセキュリティーシステムを示した図
【符号の説明】
１００マイク
１０１音声入力部
１０２キーボード
１０３キー入力部
１０４話者登録部
１０５個人性格納部
１０６話者認識部
１０７登録Ｎｏ格納部
１０８発声内容認識部
１０９呪文格納部
１１０認識結果統合部
１１１認証結果
１１２スイッチ

Claims

話者が発した音声信号を分析し、個人性パターンを抽出し、予め格納されている認証者の個人性パターンとの照合を行う話者認識部と、
前記音声信号と予め格納されている認証用言語の複数の音声パターンとの照合を行い、前記音声信号が前記認証用言語のどれに近いのかの認識を行う発声内容認識部と、
前記話者認識部から求められた、前記認証者である類似度と、前記発声内容認識部から求められた、上記音声信号と予め格納されている前記認証者に対応付けられている認証用言語の音声パターンとの照合結果に基づく類似度と、前記発声内容認識部から求められた、上記音声信号と予め格納されている前記認証者に対応付けられている認証用言語の音声パターン以外の音声パターンとの照合結果に基づく類似度と、に基づいて、前記話者の個人認証をおこなう認識結果統合部と、
を有する個人認証装置。
前記認証用言語は、音響的情報及び内容間類似度に基づき、言語の意味内容は問わずに生成されたことを特徴とする請求項１に記載の個人認証装置。
請求項１または請求項２に記載の個人認証装置を備えるセキュリティーシステム。