JP3818063B2 - 個人認証装置 - Google Patents

個人認証装置 Download PDF

Info

Publication number
JP3818063B2
JP3818063B2 JP2001016662A JP2001016662A JP3818063B2 JP 3818063 B2 JP3818063 B2 JP 3818063B2 JP 2001016662 A JP2001016662 A JP 2001016662A JP 2001016662 A JP2001016662 A JP 2001016662A JP 3818063 B2 JP3818063 B2 JP 3818063B2
Authority
JP
Japan
Prior art keywords
speaker
authentication
similarity
recognition
personal authentication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001016662A
Other languages
English (en)
Other versions
JP2002221990A (ja
Inventor
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2001016662A priority Critical patent/JP3818063B2/ja
Publication of JP2002221990A publication Critical patent/JP2002221990A/ja
Application granted granted Critical
Publication of JP3818063B2 publication Critical patent/JP3818063B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、銀行やパソコンのセキュリティーシステムに用いられる個人を認証する装置に関するものである。
【0002】
【従来の技術】
以下では、従来の個人認証技術を説明する。
【0003】
近年情報関連技術の進歩により、ネットワーク、コンピュータ等による産業、生活の情報化が著しい。その中で、情報の保全を目的としたセキュリティー技術の需要が急速に高まっている。特に、個人の認証技術は人間そのものを鍵とする暗号技術であり、最も基本的且つますます必要になるセキュリティー技術である。
【0004】
これまで、暗証番号、サイン、指紋、アイリス(虹彩)等が検討され商用化されている。最近では、指紋の10-6という誤り率の高精度認証技術が確立されパソコンのインターフェース等に利用され商用化されようとしており、また、アイリスによる認証は10-4の誤り率の精度が得られるとされ、一部の銀行において利用されている。その中で、音声による個人の認証技術はNTT、東工大等によって10年以上前から研究されてきたが、テキスト依存型でも精度は95〜98%であるとされ、他の技術と比較して格段に精度が悪い。
【0005】
しかし、音声は人がコミュニケーションに使用する自然なインターフェースであり、その手軽さから利用の道が開かれることが強く望まれている。しかしこれまでにない性能を実現しなければ音声による個人認証を実現することはできなかった。
【0006】
【発明が解決しようとする課題】
以上のように、従来から音声による個人認証は研究されてきたがその精度は95〜98%と指紋やアイリスと比較して格段に性能が悪かった。しかし、音声は人がコミュニケーションに使用する自然なインターフェースであり、その手軽さから利用の道が開かれることが強く望まれており、これまでにない性能を実現することが大きな課題となっていた。
【0007】
【課題を解決するための手段】
この問題を解決するために、請求項1記載の発明は、話者認識部と発声内容認識部と認識結果統合部とを備え、話者の認識と発声内容の認識の両方を行い、それらの結果を統合することによって個人認証を行うことを特徴とするように構成した個人認証装置である。
【0008】
これにより、話者認識部の認識結果と発声内容の認識結果を統合することができることから従来は話者認識のみで実現されていた個人認証技術よりも高精度な個人認証を実現することが可能になる。
【0009】
また、請求項2記載の発明は、認証用言語が、音響的情報及び内容間類似度に基づき、言語の意味内容は問わずに生成されたことを特徴とする。
【0010】
これにより、まず音響的情報に基づいているため、高い話者認識精度が得られ、また、内容間類似度に基づいているため高い内容認識精度が得られ、それらを統合するのでより高い個人認証精度を得ることが出来る。
【0011】
【発明の実施の形態】
本発明の請求項1に記載の発明は、話者認識部と発声内容認識部と認識結果統合部とを備えることを特徴とした個人認証装置であり、さらに発声内容として本発明の請求項2に記載の発明を採用することにより従来よりも格別の認証精度を得ることが可能になるという作用を有する。以下の説明では、本発明の請求項2記載の3つの特徴を持つ発声内容を仮に「呪文」(認証用言語を指す)と呼ぶこととする。
【0012】
以下に本発明の実施の形態について説明する。
【0013】
図1は、本実施の形態における個人認証装置の機能ブロック図である。
【0014】
図1において、100はマイク、101は音声入力、102はキーボード、103はキー入力、104は話者登録部、105は個人性格納部、106は話者認識部、107は登録No格納部、108は発声内容認識部、109は呪文格納部、110は認識結果統合部、111は認証結果、112はスイッチである。以下に図1を用いて個人認証アルゴリズムを説明する。
【0015】
まず、認証させたい使用者(認証者と呼ぶ)の登録方法から説明する。
【0016】
この時、スイッチ112を話者登録104から話者認識106と発声内容認識108へつながるように切り替える。この切替は、例えば、人間(認証者)がおこなう。
【0017】
予め呪文格納109に格納している呪文は、3つの特徴、(1)内容自身に意味はなく、また、(2)個人を識別するのに十分な音響的情報を含んでおり、また、十分なロバスト性(環境、個人の状態)を持ち、個人の認識精度が極めて高く、また、(3)内容の群(予め決められた十分多くの集まり)を有している。
【0018】
この呪文は、内容間類似度の最大値が極めて低く、誰が発声しても認識率が極めて高くなる、を有している)のリストを用意しておき、認証者はその中から任意の呪文を記憶する。呪文のリストの例を以下の図2に示す。図2に示すように、各呪文には番号が付けられている。また、世界共通で使用する場合は各国の音韻の呪文を格納する。内容間類似度とは、登録されている文字列と文字列との類似度をいう。
【0019】
そして、認証者は覚えた呪文を登録する。まず、キーボード102によって呪文の番号を入力する。キー入力103は入力された番号を話者登録部104へ送る。また、認証者は覚えた呪文をマイク100に発声する。音声入力部101は入力された音声信号を話者登録部104へ送る。話者登録部104は、まず、キー入力部103から送られてきた呪文の番号を発声内容認識部108へ送る。
【0020】
この時、発声内容認識部108は登録モードであることをスイッチ112の状態から認識し、送られてきた番号を登録No格納部107へ格納する。次に、話者登録部104は、音声入力部101から送られてきた音声信号を話者認識部106に送る。話者認識部106は登録モードであることをスイッチ112の状態から認識し、送られてきた音声信号を分析し認証者の個人性パターン(話者音韻モデル)を作成して個人性格納部105へ格納する。個人性パターンとは、話者の識別に用いる個人の特徴をあらわしたパラメータであって、例えば、下記文献Aの話者音韻モデルが相当する。
【0021】
この個人性パターンの作成方法としては様々な方法が研究されている。文献A(松井他「テキスト指定型話者認識」、電子情報通信学会論文誌D−II、Vol.J79−D−II、No.5、pp.647−656、1996年5月)の「話者音韻モデル」に開示されているように、話者隠れマルコフモデルを基本とし、各話者の学習データ及び不特定話者の隠れマルコフモデルを用いて、話者隠れマルコフモデルを学習させて、個人性パラメータを生成する。
【0022】
なお、個人性パターンとは、話者の識別に用いる個人の特徴を表したパラメータであって、例えば、上記文献の「話者音韻モデル」に相当する。
【0023】
以上で認証者の登録は終了である。なお、認証者は呪文の番号を記憶しておく必要はない。
【0024】
次に認証時の機能について詳細に説明する。
【0025】
認証時には、予め、スイッチ112は音声入力部101が話者認識部106と発声内容認識部10とにつながるように切り替えておく。
【0026】
まず、認証される人物(被験者と呼ぶ)はマイク100に向かって呪文を発声する。(もちろん、被験者が認証者で、認証者と認識されたい場合は、記憶しておいた呪文を発声する。)音声入力部101は入力された音声を、話者認識部106と発声内容認識108へ送る。話者認識部106はスイッチが認証時の状態になっていることを認識し、送られてきた音声信号を分析し被験者の個人性パターンを抽出する。
【0027】
そして、この個人性パターンと個人性格納部105内に格納された認証者の個人性パターンとの照合を行い、被験者が認証者であるかどうかを示す度合いを求め、認識結果統合部110へ送る。具体的照合方法については上記(文献A)に開示されている。また、発声内容認識部108では、送られてきた音声信号と呪文格納部109に格納されたパターンとの照合を行う。
【0028】
具体的な照合方法については、HMMやモデル音声法やCompats法やCLM法等様々な方法が既に研究されている。一例として、上記文献に記載の通り、話者音韻モデルを連結して、そのテキストのモデルを作成し、入力音声をそのテキストのモデルに与えたときのゆう度を計算し、話者及びテキストの判定をおこなう。
【0029】
また、CLM法については研究会資料:文献B(平岡他「ワードスポッティング手法を用いた不特定話者・少数語向け音声認識装置」、電子情報通信学会、音声研究会資料、SP88−18、1988年6月)に開示されている。
【0030】
また、モデル音声法については、研究会資料:文献C(宮田他「CV・VC・VCVを単位としたモデル音声法による不特定話者音声認識」、電子情報通信学会、音声研究会資料、SP91−83、1991年12月)に開示されている。そして、照合結果(「どの呪文にどれだけ近かったか」や「登録No格納部107に格納された番号の呪文とはどれだけ近かったか」といった類似度情報)を認識結果統合部110へ送る。
【0031】
なお、呪文格納部109に呪文を格納する形態は発声内容認識部108の照合方法によって様々な構造をとる。例えば、(文献B)のように、音声信号を統計的に分析して選られるパラメータの時系列モデルで認識する場合は、呪文を表わす時系列パターンの形態で格納する。
【0032】
また、(文献C)のように、音声片を認識の単位とする場合はテキストの形態で格納する。そして、認識結果統合部110では、話者認識部106と発声内容認識部108から送られてきた結果を基に総合的な判断を行い、被験者が認証者か否かの判断を認証結果111として出力する。
【0033】
総合的な判断の方法としては様々な方法があるが、一例としては、「どれだけ認証者に近いか(類似度)」の値S1と「登録No格納部107に格納された番号の呪文とはどれだけ近かったか(類似度)」の値S2と「登録No格納部107に格納された番号以外で最も近かった呪文の類似度」の値をS3として以下の(数1)で判断する方法が挙げられる。
【0034】
【数1】
Figure 0003818063
【0035】
以上の構成により高い個人認証精度を得ることが出来る。
【0036】
なお、定数a,b,tは、認証者であるかないか既知の教師データ(様々な人が被験者として発声して得られる話者認識部106の出力と発声内容認識部108の出力を記録したものにその被験者が認証者であるかないかを併せて記録したデータベース)に基づく学習(最も認証精度が上がるような境界面(直線)を求めること)により求める。学習方法の一例を以下に示す。まず、教師データを以下の(数2)に示す。
【0037】
【数2】
Figure 0003818063
【0038】
まず、定数a、bを定める。これらは、以下のコスト関数(数3)を最小にするように求める。
【0039】
【数3】
Figure 0003818063
【0040】
そこで、定数a、bは、上記コスト関数をa、bで偏微分することにより得られる2つのa、bを変数とした1次式を、連立方程式として解くことにより求めることができる。これにより認証者である集合と認証者でない集合の境界線の傾きを定めることができる。
【0041】
次に定数tの学習であるが、本実施例では一例として、目標となる2つの誤認証率(認証者でない者を認証者と間違えてしまう率(誤許容率)、認証者を認証者でないと間違えてしまう率(誤拒否率))の要求基準を反映しながら、両者を小さくするような逐次近似アルゴリズムで求める。アルゴリズムの手順を以下に示す。
(1)初期値としてt=0とする。(これは、(数2)のTnの設定に依存する。)
(2)教師データの各サンプルに対して(数1)の判定を行い、教師データについて誤許容率Pと誤拒否率Qを計算する。
(3)以下の(数4)の値Rを計算する。
【0042】
【数4】
Figure 0003818063
【0043】
(4)予め定めた固定の微小量xを用いて、t+x、t−xの2つの場合について上記(2)(3)と同様の処理を行い、それぞれの値(R+、R−と呼ぶ)を求める。
(5)R<R+ 且つ R<R− の時終了、その時のtを使用する。
【0044】
R>R+ 且つ R<R− の時、t=t+xとして(2)へ。
【0045】
R<R+ 且つ R>R− の時、t=t―xとして(2)へ。
【0046】
R>R+ 且つ R>R− 且つ R+<R− の時、t=t+xとして(2)へ。
【0047】
R>R+ 且つ R>R− 且つ R+>R− の時、t=t―xとして(2)へ。
【0048】
上記アルゴリズムにより定数a、b、tが学習できる。この他にもニューラルネットの学習アルゴリズムや、最尤降下法、遺伝的アルゴリズムなどのアルゴリズムでも学習できる。また、上記アルゴリズムにおいて変化量Xを適応的に徐々に変化させていく方法も有効である。
【0049】
ここで、本発明の2の重要な特徴である「呪文群」の作成方法の一例を述べる。まず、呪文の定義を以下に示す。
(1)内容自身に意味はない。
(2)個人を識別するのに十分な音響的情報を含んでおり、また、十分なロバスト性(環境、個人の状態)を持ち、個人の認識精度が極めて高くなる。
(3)内容の群(予め決められた十分多くの集まり)は、内容間類似度の最大値が極めて低く、誰が発声しても認識率が極めて高くなる。
【0050】
以下、呪文群の作成方法について述べる。なお、音韻の単位としては、音素、半音節、音節等様々であり、外国語も含めると更に多種多様なものがあるが、本実施例の説明では分かりやすくするために「仮名」を単位とする。
【0051】
まず、上記特徴の(2)を満たすために、呪文を構成する最低限の仮名を設定し、乱数を用いて、十分多数の呪文候補集団(「母集団A」と呼ぶ)を作成する。個人性が特にどの音韻や周波数に含まれているかという研究もなされているが、ここでは一例として音韻バランスを考慮した方法を用いる。
【0052】
例えば、ロバスト性(環境、個人の状態)も考慮して、「母音」「有声子音」「無声子音」「半母音」「濁音」の5種類は必ず含むようにし、その間に任意の仮名が入るように構成する。
【0053】
やり方としては、まず文字数を乱数で決定(5文字以上。一般の人が簡単に覚えられる数を考慮しあまり長くならないように設定。)し、その何文字目に上記5種類の仮名が来るかかを乱数で決定し、更にそれぞれの種類のどの仮名を使用するかを乱数で決定し、最後に残りの場所の仮名を全ての仮名の集合から乱数で抽出して決定するという方法が挙げられる。
【0054】
この方法で膨大な数の要素からなる母集団Aを作成することができる。これらは、個人を識別するのに十分な音響的情報を含んでおり、上記(2)の特徴を持つ。なお、母集団A作成時には、簡単な規則によって常識的拘束を与えることが有効である。
【0055】
例えば、「「ん」は先頭に来ない」や「「ん」や「っ」は2つ続かない」や「「っ」は語尾に来ない」や「「ん」の後に母音は来ない」や「「っ」の後に母音、半母音は来ない」や「同音は3つ続かない」等である。
【0056】
次に、上記母集団Aから上記特徴の(3)を持つものを自動的に選択し、新たな母集団(「母集団B」と呼ぶ)を作成する。まず、各仮名の標準パターンと、仮名の類似度、内容間類似度について、その一例を述べる。
【0057】
まず、仮名のラベル付けされた(時間的にどこからどこまでがどの仮名なのかが記述され音声データに付加されている)多くの話者の単語集団から各仮名の音響パラメータの時系列を切り出し、それらの多くの集合(仮名データと呼ぶ)から平均と分散を求めることにより各仮名の標準パターンを求めることができる。
【0058】
そして、各仮名の標準パターンと上記多くの仮名データとをマッチングすることによって得られる類似度を平均化(パターンとデータの関係を換えて再度マッチングして全ての平均をとる)することにより、仮名同士の類似度を求める。例えば以下の(表1)の様な表が作成できる。なお、上記マッチング方法については、(文献B)に開示されている。(「単語マッチング」を「仮名マッチング」に応用すればよい。)
【0059】
【表1】
Figure 0003818063
【0060】
(表1)を利用すれば各仮名同士の類似度が求められる。そこで、この表を用いて内容間類似度を求める。この際のマッチングの方法としては、DP(動的計画法)や部分スポッティングを用いたもの等が挙げられる。本実施の形態では、最も基本的な例として、1つの仮名の位置のずれを考慮して最も類似度が大きくなる時の各仮名の類似度の合計類似度を求めるというアルゴリズムを採用する。
【0061】
例えば「アイウエオ」と「エンキッカウイオー」の内容間類似度の求め方を以下の(図3)に示す。(実際は呪文の特徴(2)より上記2つの内容は存在しないが、(表1)を用いて説明するためにこれらの内容を使用することに注意されたい。また、類似度は(表1)を参照している。)
図3のように、上記2つの内容の場合は内容間類似度は(表1)を利用してもとめた相互の類似度の和を求め「75」という値になる。このようにして、2つの内容の内容間類似度を求めることができる。
【0062】
なお、上記アルゴリズムに、上記値を仮名の数で割って正規化するという方法で内容間類似度を求めるという方法を追加すれば、より仮名文字数に依存しない類似度が得られる。
【0063】
また、文字列が部分的に似ているという場合も考えられるので、比較する2つの文字列のうち短い文字列の前後に「っ」を付加した文字列(長い文字列の文字数と短い文字列の文字数の差の数だけ場合が存在する)でマッチングをとることによりより確実な内容間類似度を得ることができる。
【0064】
例えば、「アイウエオ」と「ガピアイウエオートル」のマッチングでは、「アイウエオッッッッッ」と「ッアイウエオッッッッ」と「ッッアイウエオッッッ」と「ッッッアイウエオッッ」と「ッッッッアイウエオッ」と「ッッッッッアイウエオ」とマッチングを取り、最大の類似度を内容間類似度とすればよい。この工夫により、部分的に近い場合にも高い類似度が確実に得られる。以上で内容間類似度の求め方の説明を終わる。
【0065】
そこで、母集団Aの各要素に対して、上記内容間類似度を用いた自動選択を行い、母集団Bを作成する。自動選択アルゴリズムについて以下に示す。本実施の形態では、予め指定した数の要素まで母集団Aの要素を間引くことによって母集団Bを作成するというアルゴリズムである。
(0)予め母集団Bの要素数の目標値を定めておく。
(1)母集団Aの要素に全てに番号(順番)をつける。
(2)nを1から母集団Aの要素数まで1つづつ動かし、(3)を行う。
(3)番号nの要素と母集団Aの要素全てとマッチングを行い、その内容間類似度の最大値と次に大きな値(準最大値)を求め、これらを番号nの要素の総合類似度とする。
(4)母集団Aの要素すべての総合類似度を調べ、総合類似度(最大値の方)が最大となる2つの要素を特定する。
(5)2つの要素のうち、準最大値が大きい方の要素を母集団Aから削除する。
【0066】
(6)母集団Aの要素数が予め指定しておいた目標値になったとき、これを母集団Bとして、終了する。それ以外の場合は(1)にいく。
【0067】
上記アルゴリズムによって、最適ではないが、相互の内容間類似度の比較的低い、呪文の定義の(3)の特徴を持つ母集団が作成できる。なお、選択アルゴリズムとしては、この他にも、逆に要素を増やしていくようなアルゴリズム等、様々なものが存在する。
【0068】
そして、最後に人が母集団Bの要素(呪文候補)を吟味し、発声できないものや、鍵とするのに適当でないものを削除する。以下のような場合が考えられる。(1)発声し難いもの。(「イアヘッホロピビヒ」等)安定した発声ができないものは除く。
(2)意味のある文字列を含むもの。特に口にして問題のある単語を含む場合は除く。
【0069】
上記の作業によって「呪文群」が完成する。以上で呪文群の作成法の説明を終わる。
【0070】
そして、呪文群を利用して、認証者の登録のために「呪文群の番号付きリスト」を作成し用意し、また認証のために呪文格納部109に格納する呪文パターンを作成する。
【0071】
ここで、呪文格納部109に格納するパターンの作成方法について述べる。文献Bに開示されている不特定話者の音声認識技術を用いる場合は、老若男女沢山の話者に呪文群の呪文を発声してもらい、これを録音・音声区間の切り出しを行い、各呪文の音声データベースを作成し、これを用いて呪文の標準パターンを作成し、これを格納することによって呪文格納部109を準備する。このアルゴリズムは文献Bに開示されている。
【0072】
また、呪文の数が多い場合は、多くの話者の音声データベースから各音韻(半音節、音節など)の標準パターンを作成して用いる場合もある。このアルゴリズムは文献Cに開示されている。この場合、呪文はテキストで記述していればよく、認識の際に音韻標準パターンを接続することによって呪文の標準パターンを作成する。また、HMMや他の認識方法を用いる場合には、上記2つとはまた異なる形態の標準パターンが呪文格納部109に格納される。
【0073】
以上で認証方法の全説明を終わる。
【0074】
さて、上記認証方法の説明で述べた、認証結果111を実際の鍵に伝え、被験者が認証者であるという結果の場合に鍵を開けるようにすれば、音声を利用した部屋や金庫のセキュリティーシステムが構築出来る。またこの認証結果111と他の認証(指紋、アイリス、顔認識、サイン認識など)を併用することにより、さらに高精度なセキュリティーシステムも実現できる。
【0075】
また、本発明の個人認証装置のアルゴリズムをプログラムとしてHD、ROM等の記録媒体に記録すれば、パソコンや携帯電話など広い応用範囲で音声を利用した高精度の個人認証が実現出来、様々なセキュリティーシステムを構築できる。
【0076】
図4に、個人認証装置を用いた無線通信装置の一例を示す。201はマイク、202は通信部、203はアンテナ、204はスピーカ、205はキーボード、206は制御部、207個人認証装置、208はハンドスイッチ、209はスイッチ、210は電源である。
【0077】
本発明の無線通信装置の実施の形態の説明を行う。
【0078】
まず、従来から携帯電話等に用いられてきた従来の通話機能について説明する。マイク201から入力された音声は通信部202で符号化、変調、高周波変換されてアンテナ203から送信される。また、アンテナ203で受信した電波は通信部202において、低周波変換、復調、復号化されてスピーカ204から音声出力される。
【0079】
その他に通信部202はリングトーン(デュアルトーン)を検出してスピーカ204から着信を知らせるメロディを出力するという機能も有する。キーボード205は電話番号の入力や電源のオンオフを入力し、制御部206は、キーボード205の入力を受けて、宛先番号符号化を行い通信部202へ送る。以上の機能は全て電源210から供給される電気によって実現される。
【0080】
次に、実使用時の機能について説明する。まず、ハンドスイッチ208とスイッチ209は始めオフの状態になっている。ここで、ハンドスイッチ208が押されると、マイク201とキーボード205と個人認証装置207に電源210から電気が供給され、個人認証ができるモードになる。
【0081】
個人認証装置207は実施の形態1に記載した内容の構成と機能を持っており、そこで個人認証を行い、認証結果をスイッチ209に送る。スイッチ209は発声者が認証者と認めた時のみオンの状態になり、マイク201、通信部202、スピーカ204、キーボード205、制御部206へ電気が供給されるようにする。
【0082】
これで、通常の無線通信装置として使用できるようになる。したがって、個人認証装置207からスイッチ209に送られてきた認証結果が「認証者でない」であった場合はスイッチ209はオフの状態のままであり、無線通信装置として使用できない状態のままを維持する。
【0083】
また、ハンドスイッチは指を離すとオフの状態に戻るような機能を持ち、無駄な電気を消費しないようになっている。またキーボード205についている電源スイッチをオフにすることによりスイッチ209はオフの状態になり、次に認証者が認証されない限り動作しないことになる。
【0084】
なお、認証者の登録はハンドスイッチをオンにしながら、マイクとキーボードを使用することにより行う。この機能については実施の形態1に記載した。また、非認証者が悪意で登録してしまうのを避けるために、一度登録を行ったら、認証者と認証しない限り再登録は行えないという機能を個人認証装置に追加すれば、更にセキュリティ度は向上する。
【0085】
本発明は、上記実施の形態により、音声による個人認証機能により特定の人しか使用することができない無線通信装置を実現することができるという効果を有する。
【0086】
図5に、個人認証装置を用いたセキュリティーシステムを示す。301はマイク、302は個人認証装置、303は鍵、304はキーボードである。なお、上記「鍵」はシステムを使用可能にする鍵であり、部屋や金庫のドアや、パソコン、銀行の端末、車のエンジンなどを使用可能にする鍵を示しており、そのいずれにも応用可能である。
【0087】
本発明のセキュリティーシステムの実施の形態について以下に示す。
【0088】
鍵303がかかった状態にあるとする。まず、使用者はマイク301に発声を行う。個人認証装置302は入力された音声から、使用者が認証者であるかどうかを認証し、認証結果を鍵303に出力する。鍵303は使用者が認証者である場合、鍵を解く。
【0089】
これで、鍵の付いたシステムを使用することが出来る。なお、認証方法については実施の形態1に開示した。鍵は手動でかけることが出来るが解くことができないようになっており、声による認証によってのみ解くことができる。
【0090】
以上によりシステムの使用に関するセキュリティーを保つことができる。なお、認証者の登録はマイク301、キーボード304、個人認証装置302を用いて事前に行う。登録方法については実施の形態1に記載した。また、一度登録したら認証者しか再登録ができないようにすればセキュリティー度を更に向上させることができる。
【0091】
また、「鍵をかける」という行為を、手動でなく個人認証装置を利用して行うようにすることも可能である。この時、鍵の開閉を異なる発声内容で行うようにすれば、認証者しか開閉できない鍵が実現できる。
【0092】
本発明は、上記実施の形態により、音声による個人認証機能により特定の人しか使用することができないシステムを実現することができるという効果を有する。
【0093】
【発明の効果】
以上のように、話者認識部と発声内容認識部と認識結果統合部とを備える特徴により、話者認識部の認識結果と発声内容の認識結果を統合することができることから従来は話者認識のみで実現されていた個人認証技術よりも高精度な個人認証を実現することが可能になり、
また、本発明の2の発声する内容の特徴により、まず(2)の特徴からより高い話者認識精度が得られ、また(3)の特徴からより高い内容認識精度が得られ、それらを統合するのでより高い個人認証精度を得ることが出来、また、本発明の3の特徴により、高精度の個人認証を実現することが出来、音声を利用した安全なセキュリティーシステムが構築出来、従来得られなかった格別の効果を得ることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態による個人認証装置の機能ブロック図
【図2】呪文リストの一例を示した図
【図3】内容間類似度の計算方法の一例を示した図
【図4】個人認証装置を用いた無線通信装置の構成を示した図
【図5】個人認証装置を用いたセキュリティーシステムを示した図
【符号の説明】
100 マイク
101 音声入力
102 キーボード
103 キー入力
104 話者登録部
105 個人性格納部
106 話者認識部
107 登録No格納部
108 発声内容認識部
109 呪文格納部
110 認識結果統合部
111 認証結果
112 スイッチ

Claims (3)

  1. 話者が発した音声信号を分析し、個人性パターンを抽出し、予め格納されている認証者の個人性パターンとの照合を行う話者認識部と、
    前記音声信号と予め格納されている認証用言語の複数の音声パターンとの照合を行い、前記音声信号が前記認用言語のどれに近いのかの認識を行う発声内容認識部と、
    前記話者認識部から求められた前記認証者である類似度と前記発声内容認識部から求められた、上記音声信号と予め格納されている前記認証者に対応付けられている認証用言語の音声パターンとの照合結果に基づく類似度と、前記発声内容認識部から求められた、上記音声信号と予め格納されている前記認証者に対応付けられている認証用言語の音声パターン以外の音声パターンとの照合結果に基づく類似度と、に基づいて、前記話者の個人認証をおこなう認識結果統合部と
    を有する個人認証装置。
  2. 前記認証用言語は、音響的情報及び内容間類似度に基づき、言語の意味内容は問わずに生成されたことを特徴とする請求項1に記載の個人認証装置。
  3. 請求項1または請求項2に記載の個人認証装置を備えるセキュリティーシステム。
JP2001016662A 2001-01-25 2001-01-25 個人認証装置 Expired - Lifetime JP3818063B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001016662A JP3818063B2 (ja) 2001-01-25 2001-01-25 個人認証装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001016662A JP3818063B2 (ja) 2001-01-25 2001-01-25 個人認証装置

Publications (2)

Publication Number Publication Date
JP2002221990A JP2002221990A (ja) 2002-08-09
JP3818063B2 true JP3818063B2 (ja) 2006-09-06

Family

ID=18882989

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001016662A Expired - Lifetime JP3818063B2 (ja) 2001-01-25 2001-01-25 個人認証装置

Country Status (1)

Country Link
JP (1) JP3818063B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006126558A (ja) * 2004-10-29 2006-05-18 Asahi Kasei Corp 音声話者認証システム
WO2008018136A1 (fr) * 2006-08-10 2008-02-14 Pioneer Corporation dispositif de reconnaissance d'un individu en fonction de sa voix, procédé de reconnaissance d'un individu en fonction de sa voix, etc.
JP5646675B2 (ja) * 2013-03-19 2014-12-24 ヤフー株式会社 情報処理装置及び方法
KR102371697B1 (ko) * 2015-02-11 2022-03-08 삼성전자주식회사 음성 기능 운용 방법 및 이를 지원하는 전자 장치
WO2020045204A1 (ja) 2018-08-31 2020-03-05 日本電気株式会社 生体認証装置、生体認証方法および記録媒体

Also Published As

Publication number Publication date
JP2002221990A (ja) 2002-08-09

Similar Documents

Publication Publication Date Title
JP4672003B2 (ja) 音声認証システム
Naik Speaker verification: A tutorial
JP4213716B2 (ja) 音声認証システム
Campbell Speaker recognition: A tutorial
Reynolds An overview of automatic speaker recognition technology
Reynolds Automatic speaker recognition: Current approaches and future trends
JP2007133414A (ja) 音声の識別能力推定方法及び装置、ならびに話者認証の登録及び評価方法及び装置
Campbell Speaker recognition
JP4318475B2 (ja) 話者認証装置及び話者認証プログラム
Pandey et al. Multilingual speaker recognition using ANFIS
Ozaydin Design of a text independent speaker recognition system
JP3818063B2 (ja) 個人認証装置
US10957318B2 (en) Dynamic voice authentication
JPH1173196A (ja) 話者の申し出識別を認証する方法
Maes et al. Open sesame! Speech, password or key to secure your door?
KR20200032935A (ko) 음성인식장치 및 음성인식방법
JP4163979B2 (ja) 話者認証装置
JP4245948B2 (ja) 音声認証装置、音声認証方法及び音声認証プログラム
JP4440414B2 (ja) 話者照合装置及び方法
KR100673834B1 (ko) 문맥 요구형 화자 독립 인증 시스템 및 방법
Rao et al. Text-dependent speaker recognition system for Indian languages
WO2006027844A1 (ja) 話者照合装置
Singh et al. Underlying text independent speaker recognition
JPH10116093A (ja) 音声認識装置
KR100553224B1 (ko) 음성암호를 이용한 잠금장치 개폐 방법

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050630

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060523

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060605

R151 Written notification of patent or utility model registration

Ref document number: 3818063

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100623

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100623

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110623

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120623

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120623

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130623

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term