JP2004309779A - Voice authentication device - Google Patents
Voice authentication device Download PDFInfo
- Publication number
- JP2004309779A JP2004309779A JP2003102976A JP2003102976A JP2004309779A JP 2004309779 A JP2004309779 A JP 2004309779A JP 2003102976 A JP2003102976 A JP 2003102976A JP 2003102976 A JP2003102976 A JP 2003102976A JP 2004309779 A JP2004309779 A JP 2004309779A
- Authority
- JP
- Japan
- Prior art keywords
- registered
- voice
- registered voice
- selecting
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
【0001】
【発明の属する技術の分野】
本発明は、音声を認証するための装置、及び認証方法に関する。
【0002】
【従来の技術】
音声認証は、あらかじめシステムに個人の音声を登録しておき、新たに入力された音声が、登録音声と同一人物かどうかを判断する。そのため、音声からフーリエ変換(FFT:Fast Fourier Transform)やケプストラム変換などの特徴抽出を行い、二つの音声(登録音声と新規入力音声)の特徴量を比較し、それがどの程度似ているかによって同一人物の発生した音声であるかどうかを判断している。図1はその例である。マイク10より音声が入力されると、音声入力器11でマイク10から入力された音声をアナログ信号からデジタル信号に変換する。音声入力器11でデジタル信号化された音声データは、音声照合器12でフーリエ変換、ケプストラム変換の手法により音声特徴が抽出され、あらかじめ登録しておいた登録音声13の音声特徴とDPマッチング等の手法を用いて比較を行い、マイク10からの入力された音声情報と登録音声13に登録されている音声情報が一致するかを判別し、その結果を出力する。このような技術に関しては、特許文献に開示されている(例えば、特許文献1参照)。
【0003】
【特許文献1】特開2002−244697
【0004】
【発明が解決しようとする課題】
しかし、音声には、経時変化があるため、登録音声を登録してから日が経つにつれ、登録者本人の声が変成し、認証に通りづらくなってくるという問題がある。一方、音声の経時変化に対応するために、認証に成功した音声を常に登録音声として登録或は更新し、新たに登録或は更新された登録音声を次回の認証に利用することも考えられるが、登録音声の登録或は更新の際にたまたま調子の悪いときの声や、ノイズの多い音声が登録されてしまう事があり、やはり認証性能に悪影響を及ぼし易い。
【0005】
以上のような問題は、音声認証において特に顕著に生じるが、指紋認証や網膜認証等、その他の情報認証においてもほぼ同様に生じることが考えられる。
本発明は、上記の問題点に鑑みてなされたものであり、情報認証(特には音声認証)時に、その認証の対象となる入力情報(音声認証の場合は入力音声)の経時変化に対応でき、かつ経時変化に対応することによって認証率を高め、一方で他人受入率を低く抑えた認証を可能にすることを目的とする。
【0006】
【課題を解決するための手段】
請求項1記載の発明は、複数の登録音声を登録音声群として記憶する登録音声記憶手段と、該登録音声記憶手段によって記憶された登録音声の中から認証に適している音声を選択する選択手段と、該選択手段により選択された登録音声と認証対象となる入力音声とを照合する照合手段と、該照合手段による照合の結果に応じて前記入力音声を新たな登録音声として前記登録音声記憶手段に記憶させる登録手段と、を有することを特徴とする音声認証装置である。
【0007】
請求項2記載の発明は、前記選択手段は、前記登録音声記憶手段に登録音声群として記憶された複数の登録音声のそれぞれについて、該登録音声群に含まれる他の全ての登録音声との類似度を算出する類似度算出手段と、該類似度算出手段により算出された類似度に基づいて、前記登録音声群の複数の登録音声のなかから前記照合手段における照合で用いられる登録音声を選択する登録音声選択手段と、を有することを特徴とする請求項1記載の音声認証装置である。
【0008】
請求項3記載の発明は、前記登録手段は、前記登録音声記憶手段に登録音声群として記憶された複数の登録音声のそれぞれについて、ノイズ部分を検出してそのノイズ部分のエネルギーを算出するノイズエネルギー算出手段と、該ノイズエネルギー算出手段により算出されたノイズ部分のエネルギーの値に基づいて、前記登録音声群の複数の登録音声のなかから前記照合手段における照合で用いられる登録音声を選択する登録音声選択手段と、を有することを特徴とする請求項1記載の音声認識装置である。
【0009】
請求項4記載の発明は、複数の登録音声を登録音声群として記憶する登録音声記憶ステップと、該登録音声記憶ステップによって記憶された登録音声の中から認証に適している音声を選択する選択ステップと、該選択ステップにより選択された登録音声と認証対象となる入力音声とを照合する照合ステップと、該照合ステップによる照合の結果に応じて前記入力音声を前記登録音声群の新たな登録音声として記憶させる登録ステップと、を有することを特徴とする音声認証方法である。
【0010】
請求項5記載の発明は、前記選択ステップは、前記登録音声記憶ステップにおいて登録音声群として記憶された複数の登録音声のそれぞれについて、該登録音声群に含まれる他の全ての登録音声との類似度を算出する類似度算出ステップと、該類似度算出ステップにより算出された類似度に基づいて、前記登録音声群の複数の登録音声のなかから前記照合ステップにおける照合で用いられる登録音声を選択する登録音声選択ステップと、を有することを特徴とする請求項4記載の音声認証方法である。
【0011】
請求項6記載の発明は、前記登録ステップは、前記登録音声記憶ステップに登録音声群として記憶された複数の登録音声のそれぞれについて、ノイズ部分を検出してそのノイズ部分のエネルギーを算出するノイズエネルギー算出ステップと、該ノイズエネルギー算出ステップにより算出されたノイズ部分のエネルギーの値に基づいて、前記登録音声群の複数の登録音声のなかから前記照合ステップにおける照合で用いられる登録音声を選択する登録音声選択ステップと、を有することを特徴とする請求項4記載の音声認識方法である。
【0012】
以上請求項1から請求項6記載の発明は、音声の経時変化に対応するため、入力情報を新たな登録情報として登録すると、ノイズ等を含んだ新たな入力情報も登録されてしまうという問題を解決するために、入力情報に基づいて登録された複数の情報の中から、認証に適している登録情報を、照合に利用する情報として選択する手段及び手法を設けたものである。これにより、新たな入力情報を登録することにより、音声の経時変化等に対応しかつ入力情報のノイズ等の影響を受けないようにすることができる。
【0013】
請求項7記載の発明は、複数の登録情報を登録情報群として記憶する登録情報記憶手段と、該登録情報記憶手段によって記憶された登録情報の中から認証に適している情報を選択する選択手段と、該選択手段により選択された登録情報と認証対象となる入力情報とを照合する照合手段と、該照合手段による照合の結果に応じて前記入力情報を新たな登録情報として前記登録情報記憶手段に記憶させる登録手段と、を有することを特徴とする情報認証装置である。
【0014】
請求項8記載の発明は、複数の登録情報を登録情報群として記憶する登録情報記憶ステップと、該登録情報記憶ステップによって記憶された登録情報の中から認証に適している情報を選択する選択ステップと、該選択ステップにより選択された登録情報と認証対象となる入力情報とを照合する照合ステップと、該照合ステップによる照合の結果に応じて前記入力情報を前記登録情報群の新たな登録情報として記憶させる登録ステップと、を有することを特徴とする情報認証方法である。
【0015】
請求項7及び請求項8記載の登録情報には、音声の情報の他に指紋の情報、網膜の情報、静脈の情報、手相の情報が考えられ、前記請求項1から請求項6と同様に、これら音声等の情報の経時変化等に対応し、かつ入力情報のノイズ等の影響を受けない認証装置を実現することができる。
【0016】
【発明の実施の形態】
以下、図を参照しながら本発明の実施形態を詳細に説明する。
図2は、本発明の音声認証装置の構成を示す機能ブロック図である。
音声認証を受けようとする場合、マイク20より音声を入力する。マイク20に入力された音声は、音声入力器21により音声データとして情報処理装置に入力される。一方、利用登録音声選出部25において、あらかじめ登録しておいた登録音声群24より最も素性の良い登録音声データ(素性の良い登録音声については後述)を選出する。音声入力器21より入力された音声データと、利用登録音声選出部25より選出された登録音声データを音声照合器22により照合する。
【0017】
認証が成功した入力音声は、登録更新制御部23により登録音声群24に登録される。登録更新制御部23、及び利用登録音声選出部25の動作について以下に詳細に説明をする。
利用登録音声選出部25には、例えば以下の2つの方法が考えられる。
(1) 登録音声の相互類似度を利用する方法。
(2) ノイズのエネルギーを用いる方法。
【0018】
まず、上記の(1)の方法を用いた場合の実施例について説明をする。例えば、二つの音声の類似度は、各音声の特徴ベクトル群をDPマッチングした場合の距離D(F)で表され、類似度が高いほど値が小さくなる。これを利用した場合、各登録音声について、その音声と他の全ての登録音声との類似度を算出する。この値が最も小さいものが、最も平均的な(素性の良い)音声データであると考えられるので、その音声データを認証時の登録音声として選択する。
【0019】
図3は、図2の利用登録音声選出部25に登録音声の類似度を利用して、認証のために最も平均的な音声データを登録音声群24の中から選出する処理を示すフローチャートである。登録音声群24に登録可能な最大登録音声数をNとする。また、登録音声群24に登録されている1つの登録音声iと、登録音声群24に登録されている他の1つの登録音声jに対する相対類似度をsijとする。さらに、登録音声群24に登録されている1つの登録音声iと、登録音声群24に登録されている他の全ての登録音声j(j=1..N、ただしj≠i)に対する相対類似度の総和を登録音声iの類似度s[i]とする。
【0020】
登録音声データをi(i=0..N―1)とした時、ステップS301において、各登録音声の類似度を保存するためのメモリ領域s[0..N−1]を確保し、それぞれ0に初期化する。ステップS302でi=0とし、まず登録音声群24の登録音声データを1つ決める。ステップS302では、jを「i+1」に設定する。ステップS304では、ステップS302とステップS303で決めた登録音声データの相対類似度sijを計算する。ステップS305では、ステップS304で計算した相対類似度を順次類似度s[i]に加える。なお、登録音声データiと登録音声データjの相対類似度sij、および登録音声データjと登録音声iの相対類似度sjiは同じ値(sij=sji)であることから、図3の計算では相対類似度s[i]と相対類似度s[j]を同時に計算し、無駄な計算を省略している。ステップS306では、登録音声iと登録音声群24に登録された他の登録音声データの相対類似度を計算するために、jに1を加算したものを次の登録音声データとする。ステップS307にて登録音声群24に登録されている他の登録音声データ全てに対して相対類似度sijを計算したかチェックする。まだ相対類似度を計算していない登録音声データがある場合には、ステップS304に戻り相対類似度を計算する。全ての登録音声データと相対類似度を計算し、登録音声データの類似度s[i]の計算が終了した場合には、ステップS308で次に類似度を計算する登録音声データを決め、ステップS303に戻り、類似度を計算する。ステップS309で、登録音声群24に登録されている登録音声データの類似度が全て計算されたかを判断する。全ての類似度が計算されると、ステップS310で、計算した類似度s[i]の中で最小の値となる登録音声データを選出し、認証に利用する音声とする。
【0021】
図4は、図2の登録更新制御部23の処理を示すフローチャートである。ステップS41では、入力音声データが認証に成功したかを判別する。入力音声データが認証に通った場合(認証に成功した場合)は、登録音声データが登録音声群24に登録可能な登録音声データの最大件数であるかをステップS42で判別する。登録音声群24に登録可能な最大件数分の登録音声データが登録されている場合には、ステップS43にて、登録音声群24に登録されている登録音声データのうち、最も過去に登録された登録音声データを削除する。登録音声群24に登録登録されている登録音声データの件数が最大登録件数未満の場合、あるいはステップS43により最も過去に登録された登録音声データが削除された後に、ステップS44にて入力音声データが登録音声群24に登録される。以上のようにして、図2の登録更新制御部23を実行する。
【0022】
次に、登録音声群24から認証に利用する音声データを1つを選択する際に、ノイズのエネルギーを用いる場合について説明する。
登録音声群24に登録されている登録音声データにも登録時の背景ノイズなどは含まれている。利用登録音声選出の方法(2)は、この登録音声群24への音声データ登録時に入ってしまった背景ノイズを算出し、最もノイズの少ない登録音声を選出して音声認証に利用することを特徴とする音声認識装置である。例えば特許文献によれば、入力音声データから音声部分だけを切り出すことが出来るので、切り出されなかった残りの部分には、ノイズだけが録音されていると考えられる。そのノイズ部分のエネルギーを算出し、各登録音声ごとに比較する事で背景ノイズが最小の登録音声を発見できる。
【0023】
図5は、図2の利用登録音声選出部25に登録音声のノイズ部分のエネルギーを計算し、最もノイズ部分のエネルギーの小さい登録音声データを選出する処理を示すフローチャートである。
登録音声群24に登録可能な最大登録音声数をNとする。また、登録音声群24に登録されている1つの登録音声iのノイズ部分のエネルギーの合計をノイズのサンプル数で割った値をs[i]とする。ステップS501で、ノイズエネルギーs[i]を保存するためのメモリ領域s[0..N−1]を確保し、それぞれ0に初期化する。ステップS503で、i番目の登録音声データのノイズ部分を切り出す。ステップS504では、ステップS503で切り出したノイズ部分のエネルギーの合計をノイズ部分のサンプル数で割った値をs[i]として代入する。ステップS505で、次の登録音声データを選択し、ステップS506で、全ての登録音声データに対してノイズ部分のエネルギーを計算したかを判別する。まだ、全ての登録音声データについてノイズ部分のエネルギーを計算していない場合には、ステップS503に戻り計算を続ける。全ての登録音声データについてノイズ部分のエネルギーの計算を終了した場合には、ステップS507で、ノイズ部分のエネルギーs[0..N−1]のうち最小の値の登録音声データを選択し、音声認証に利用する。これにより、登録時の背景ノイズが最も少ない音声データを選択することが可能となる。
【0024】
図6は、本発明の音声認証装置に用いる情報処理装置の構成図である。本実施の形態において音声認証装置は、CPU(Central Processing Unit)61、メモリ62、外部記憶装置63、媒体駆動装置64、可搬記憶媒体65、入力装置66、出力装置67、ネットワーク接続装置68によって構成されており、可搬記憶媒体65以外の各装置はバス69で接続されている。CPU61は、外部記憶装置63や可搬記憶媒体65内に格納されている音声認証を実現するために必要なプログラムをメモリ62にロードする。さらに、CPU61は、入力装置66から入力された音声データに対して、メモリ62に格納されたプログラム命令に従って各種の処理を実行し、音声認証処理を実施する。実行された処理の結果は、外部記憶装置63に保存され、あるいは出力装置67から出力される。
【0025】
なお、上記各実施形態の説明では、利用登録音声選出部25において、登録音声群24から一つの音声のみを選択する場合を例示して説明したが、例えば複数の登録音声を選択してこれらの平均を求めて音声照合器22での照合に用いるといった構成をとることも可能である。この場合、利用登録音声選出部25において、例えば、登録音声の相互類似度の値の小さいものから所定個数の登録音声を選択したり、あるいはノイズのエネルギーの小さいものから所定個数の登録音声を選択して、その選択された複数の音声の特徴ベクトルの要素毎に平均値を求めて、実際の照合に用いるデータを求めるようにすることが可能である。
【0026】
また、以上の各実施形態の説明は、音声認証における本発明の実施例であるが、指紋認証や網膜認証等、その他の情報認証においても同様に実施可能である。また、上述した本発明の各実施形態は、コンピュータに実行させることのできるプログラムとして、例えば磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリなどの記録媒体に書き込んで各種装置に適用することも可能である。本装置を実現するコンピュータは、記録媒体に記録されたプログラムを読み込み、このプログラムによって動作が制御されることにより、上述した処理を実行する。
【0027】
また、図2中に記載されている各構成要素20から25は、全てが1つの装置内に収納されていなくても良い。したがって、例えば、サーバと複数の音声認証用端末とがネットワークで接続されているようなシステムにおいて、各端末内に20と21(及び、認証結果を表示する表示部等)が設けられ、サーバ内に22から25が設けられているような構成であっても良い。
【0028】
また、本発明の各実施形態に示した記憶手段としては、上記で既に説明したCD−ROMやDVD−ROM等の記憶手段の例の他にも、例えば、Blue−ray Disc(R)やAOD(Advanced Optical Disc)などの青色レーザを用いた次世代光ディスク記憶媒体、赤色レーザを用いるHD−DVD9、青紫色レーザーを用いるBlue Laser DVDなど、今後開発される種々の大容量記憶媒体を用いて本発明を実施することが可能である。
【0029】
【発明の効果】
請求項1から請求項2、及び請求項4から請求項5記載の発明によれば、登録音声を複数用意し、時系列にそって認証されたデータを入れ換えて行くことによって、入力音声が経時変化した場合に対応する事が可能となった。また、照合時には登録音声の中から認証に適したものを選択することで、経時変化に対応するために逐次登録音声データを更新することによる認証精度への悪影響を抑えることが出来るようになった。さらに、請求項3、請求項6記載の発明によれば、登録音声群から認証に利用する1つの登録音声データを選択する際に、相互類似度やノイズエネルギーを利用することで、最も素性の良い音声を選ぶことが可能となり、経時変化に対応し、経時変化に対応するために逐次登録音声データを更新することによる認証精度への悪影響も抑えることができるようになった。さらに、本発明を音声以外の他の認証技術に適用することにより、音声以外の情報認証においても上記と同様の効果を得ることが可能となった。
【図面の簡単な説明】
【図1】音声認証システムの一般的な構成図である。
【図2】本発明の音声認証システムの構成図である。
【図3】登録音声の相互類似度を計算し、最小の類似度となる登録音声を選出する処理を示すフローチャートである。
【図4】本発明の音声登録処理を示すフローチャートである。
【図5】登録音声のノイズの平均を計算し、最小のノイズとなる登録音声を選出する処理を示すフローチャートである。
【図6】情報処理装置の構成図である。
【符号の説明】
20…マイク
21…音声入力器
22…音声照合器
23…登録更新制御部
24…登録音声群
25…利用登録音声選出部
61…CPU
62…メモリ
63…外部記憶装置
64…媒体駆動装置
65…可搬記憶媒体
66…入力装置
67…出力装置
68…ネットワーク接続装置
69…バス[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an apparatus for authenticating voice and an authentication method.
[0002]
[Prior art]
In voice authentication, a personal voice is registered in the system in advance, and it is determined whether the newly input voice is the same person as the registered voice. Therefore, features such as Fourier transform (FFT: Fast Fourier Transform) and cepstrum transform are extracted from the speech, and the features of the two speeches (registered speech and new input speech) are compared, and the same is determined depending on how similar they are. It is determined whether the voice is generated by a person. FIG. 1 is an example. When voice is input from the
[0003]
[Patent Document 1] JP-A-2002-244697
[0004]
[Problems to be solved by the invention]
However, there is a problem in that the voice of the registrant is altered as time passes after the registered voice is registered because the voice has a temporal change, and it becomes difficult to pass the authentication. On the other hand, in order to cope with a temporal change of the voice, it is conceivable that the voice that has been successfully authenticated is always registered or updated as a registered voice, and the newly registered or updated registered voice is used for the next authentication. When the registered voice is registered or updated, a voice when the condition is bad or a noisy voice may be registered, which also has a bad influence on the authentication performance.
[0005]
The above-mentioned problem occurs particularly remarkably in voice authentication, but it can be considered that similar problems occur in other information authentication such as fingerprint authentication and retinal authentication.
The present invention has been made in view of the above-described problems, and can cope with a temporal change of input information to be authenticated (input voice in the case of voice authentication) at the time of information authentication (in particular, voice authentication). It is another object of the present invention to increase the authentication rate by responding to changes over time, and to enable authentication with a low false acceptance rate.
[0006]
[Means for Solving the Problems]
According to a first aspect of the present invention, there is provided a registered voice storing means for storing a plurality of registered voices as a registered voice group, and a selecting means for selecting a voice suitable for authentication from the registered voices stored by the registered voice storing means. Matching means for comparing the registered voice selected by the selecting means with the input voice to be authenticated; and the registered voice storing means as the new registered voice based on the result of the matching by the matching means. And a registering means for storing in the voice authentication device.
[0007]
According to a second aspect of the present invention, the selecting unit is configured to select, for each of the plurality of registered voices stored as the registered voice group in the registered voice storage unit, a similarity to all other registered voices included in the registered voice group. A similarity calculating means for calculating a degree, and a registered voice used for matching by the matching means is selected from a plurality of registered voices of the registered voice group based on the similarity calculated by the similarity calculating means. The voice authentication device according to
[0008]
The invention according to claim 3, wherein the registration unit detects a noise portion and calculates an energy of the noise portion for each of the plurality of registered voices stored as a registered voice group in the registered voice storage unit. Calculating means for selecting a registered voice to be used in the matching by the matching means from a plurality of registered voices of the registered voice group based on the energy value of the noise portion calculated by the noise energy calculating means; The voice recognition device according to
[0009]
According to a fourth aspect of the present invention, a registered voice storing step of storing a plurality of registered voices as a registered voice group, and a selecting step of selecting a voice suitable for authentication from the registered voices stored in the registered voice storing step A collating step of collating the registered voice selected by the selecting step with the input voice to be authenticated; and, according to a result of the collation by the collating step, the input voice is used as a new registered voice of the registered voice group. And a registration step of storing.
[0010]
According to a fifth aspect of the present invention, in the selecting step, each of the plurality of registered voices stored as the registered voice group in the registered voice storing step is similar to all other registered voices included in the registered voice group. A similarity calculating step of calculating a degree, and a registered voice used in the matching in the matching step is selected from a plurality of registered voices of the registered voice group based on the similarity calculated in the similarity calculating step. 5. The voice authentication method according to claim 4, comprising a registration voice selection step.
[0011]
The invention according to claim 6, wherein the registering step detects a noise portion and calculates an energy of the noise portion for each of the plurality of registered voices stored as the registered voice group in the registered voice storing step. A registered voice for selecting a registered voice to be used in the matching in the matching step from a plurality of registered voices of the registered voice group based on the calculating step and the energy value of the noise portion calculated in the noise energy calculating step 5. The speech recognition method according to claim 4, comprising a selecting step.
[0012]
As described above, the first to sixth aspects of the present invention have a problem that when input information is registered as new registration information, new input information including noise or the like is also registered in order to cope with a temporal change of voice. In order to solve the problem, there is provided a means and a method for selecting registration information suitable for authentication from a plurality of pieces of information registered based on input information as information used for collation. Thereby, by registering new input information, it is possible to cope with a temporal change of voice and the like and not to be affected by noise or the like of the input information.
[0013]
According to a seventh aspect of the present invention, there is provided a registration information storage means for storing a plurality of registration information as a registration information group, and a selection means for selecting information suitable for authentication from the registration information stored by the registration information storage means. Matching means for matching the registered information selected by the selecting means with the input information to be authenticated; and the registered information storing means as the new registered information based on the result of the matching by the matching means. And a registration means for storing the information in the information authentication device.
[0014]
An invention according to claim 8 is a registration information storage step of storing a plurality of registration information as a registration information group, and a selection step of selecting information suitable for authentication from the registration information stored in the registration information storage step. A collation step of collating the registration information selected by the selection step with input information to be authenticated; and, according to a result of the collation by the collation step, the input information as new registration information of the registration information group. And a registration step of storing the information.
[0015]
The registration information according to claims 7 and 8 may include fingerprint information, retinal information, vein information, and palm information in addition to audio information. Thus, it is possible to realize an authentication apparatus that can cope with a temporal change of information such as voice and is not affected by noise of input information.
[0016]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 2 is a functional block diagram showing the configuration of the voice authentication device of the present invention.
To receive voice authentication, voice is input from the
[0017]
The input voice that has been successfully authenticated is registered in the registered
For example, the following two methods are conceivable for the use registration
(1) A method using mutual similarity of registered voices.
(2) A method using energy of noise.
[0018]
First, an embodiment using the above method (1) will be described. For example, the similarity between two voices is represented by a distance D (F) when the feature vector group of each voice is subjected to DP matching, and the value decreases as the similarity increases. When this is used, for each registered voice, the similarity between the voice and all other registered voices is calculated. Since the voice data with the smallest value is considered to be the average voice data (having good characteristics), the voice data is selected as the registered voice at the time of authentication.
[0019]
FIG. 3 is a flowchart showing a process of selecting the most average voice data from the registered
[0020]
Assuming that the registered voice data is i (i = 0..N-1), in step S301, a memory area s [0... . N-1], and each is initialized to 0. In step S302, i = 0, and one registered voice data of the registered
[0021]
FIG. 4 is a flowchart showing the processing of the registration
[0022]
Next, a case where noise energy is used to select one piece of voice data to be used for authentication from the registered
The registered voice data registered in the registered
[0023]
FIG. 5 is a flowchart showing a process of calculating the energy of the noise portion of the registered voice in the use registered
Let N be the maximum number of registered voices that can be registered in the registered
[0024]
FIG. 6 is a configuration diagram of an information processing device used for the voice authentication device of the present invention. In the present embodiment, the voice authentication device includes a CPU (Central Processing Unit) 61, a
[0025]
In the description of each of the above embodiments, the case where only one voice is selected from the registered
[0026]
Further, the above embodiments are examples of the present invention in voice authentication, but the present invention can be similarly applied to other information authentication such as fingerprint authentication and retinal authentication. Each of the embodiments of the present invention described above can be executed by a computer as a program, for example, a recording medium such as a magnetic disk (flexible disk, hard disk, etc.), an optical disk (CD-ROM, DVD, etc.), a semiconductor memory, or the like. It is also possible to write and apply to various devices. The computer that realizes the present apparatus reads the program recorded on the recording medium, and executes the above-described processing by controlling the operation of the program.
[0027]
Further, all of the
[0028]
As the storage means shown in each embodiment of the present invention, in addition to the examples of the storage means such as the CD-ROM and the DVD-ROM described above, for example, a Blue-ray Disc (R) or an AOD (Advanced Optical Disc), a next-generation optical disk storage medium using a blue laser, an HD-DVD9 using a red laser, and a Blue Laser DVD using a blue-violet laser. It is possible to carry out the invention.
[0029]
【The invention's effect】
According to the invention described in
[Brief description of the drawings]
FIG. 1 is a general configuration diagram of a voice authentication system.
FIG. 2 is a configuration diagram of a voice authentication system of the present invention.
FIG. 3 is a flowchart illustrating a process of calculating a mutual similarity between registered voices and selecting a registered voice having a minimum similarity.
FIG. 4 is a flowchart showing a voice registration process according to the present invention.
FIG. 5 is a flowchart showing a process of calculating an average of noise of a registered voice and selecting a registered voice having the minimum noise.
FIG. 6 is a configuration diagram of an information processing apparatus.
[Explanation of symbols]
20
62
Claims (8)
該登録音声記憶手段によって記憶された登録音声の中から認証に適している音声を選択する選択手段と、
該選択手段により選択された登録音声と認証対象となる入力音声とを照合する照合手段と、
該照合手段による照合の結果に応じて前記入力音声を新たな登録音声として前記登録音声記憶手段に記憶させる登録手段と、
を有することを特徴とする音声認証装置。Registered voice storage means for storing a plurality of registered voices as a registered voice group;
Selecting means for selecting a voice suitable for authentication from among the registered voices stored by the registered voice storage means;
Collating means for collating the registered voice selected by the selecting means with the input voice to be authenticated,
Registration means for storing the input voice as a new registered voice in the registered voice storage means in accordance with the result of the verification by the verification means;
A voice authentication device comprising:
該類似度算出手段により算出された類似度に基づいて、前記登録音声群の複数の登録音声のなかから前記照合手段における照合で用いられる登録音声を選択する登録音声選択手段と、
を有することを特徴とする請求項1記載の音声認証装置。A selecting unit configured to calculate, for each of a plurality of registered voices stored as a registered voice group in the registered voice storing unit, a similarity with all other registered voices included in the registered voice group; When,
Based on the similarity calculated by the similarity calculating means, a registered voice selecting means for selecting a registered voice used in matching by the matching means from a plurality of registered voices of the registered voice group,
The voice authentication device according to claim 1, further comprising:
該ノイズエネルギー算出手段により算出されたノイズ部分のエネルギーの値に基づいて、前記登録音声群の複数の登録音声のなかから前記照合手段における照合で用いられる登録音声を選択する登録音声選択手段と、
を有することを特徴とする請求項1記載の音声認識装置。The registration means, for each of a plurality of registered voices stored as a registered voice group in the registered voice storage means, noise energy calculation means for detecting a noise portion and calculating the energy of the noise portion,
Based on the energy value of the noise portion calculated by the noise energy calculating means, a registered voice selecting means for selecting a registered voice used in matching by the matching means from a plurality of registered voices of the registered voice group,
The voice recognition device according to claim 1, comprising:
該登録音声記憶ステップによって記憶された登録音声の中から認証に適している音声を選択する選択ステップと、
該選択ステップにより選択された登録音声と認証対象となる入力音声とを照合する照合ステップと、
該照合ステップによる照合の結果に応じて前記入力音声を前記登録音声群の新たな登録音声として記憶させる登録ステップと、
を有することを特徴とする音声認証方法。A registered voice storing step of storing a plurality of registered voices as a registered voice group;
A selecting step of selecting a voice suitable for authentication from the registered voices stored by the registered voice storing step;
A matching step of matching the registered voice selected by the selecting step with the input voice to be authenticated,
A registration step of storing the input voice as a new registered voice of the registered voice group according to a result of the verification by the verification step;
A voice authentication method comprising:
該類似度算出ステップにより算出された類似度に基づいて、前記登録音声群の複数の登録音声のなかから前記照合ステップにおける照合で用いられる登録音声を選択する登録音声選択ステップと、
を有することを特徴とする請求項4記載の音声認証方法。The selecting step is a similarity calculating step of calculating, for each of the plurality of registered voices stored as the registered voice group in the registered voice storing step, a similarity to all other registered voices included in the registered voice group. When,
Based on the similarity calculated by the similarity calculation step, a registered voice selection step of selecting a registered voice used in the matching in the matching step from a plurality of registered voices of the registered voice group;
5. The voice authentication method according to claim 4, comprising:
該ノイズエネルギー算出ステップにより算出されたノイズ部分のエネルギーの値に基づいて、前記登録音声群の複数の登録音声のなかから前記照合ステップにおける照合で用いられる登録音声を選択する登録音声選択ステップと、
を有することを特徴とする請求項4記載の音声認識方法。The registration step, for each of the plurality of registered voices stored as a registered voice group in the registered voice storage step, a noise energy calculation step of detecting a noise portion and calculating the energy of the noise portion,
A registered voice selecting step of selecting a registered voice to be used in the matching in the matching step from a plurality of registered voices of the registered voice group based on the energy value of the noise portion calculated in the noise energy calculating step;
5. The speech recognition method according to claim 4, comprising:
該登録情報記憶手段によって記憶された登録情報の中から認証に適している情報を選択する選択手段と、
該選択手段により選択された登録情報と認証対象となる入力情報とを照合する照合手段と、
該照合手段による照合の結果に応じて前記入力情報を新たな登録情報として前記登録情報記憶手段に記憶させる登録手段と、
を有することを特徴とする情報認証装置。Registration information storage means for storing a plurality of registration information as a registration information group,
Selecting means for selecting information suitable for authentication from the registered information stored by the registered information storing means;
Collation means for collating the registration information selected by the selection means with input information to be authenticated,
Registration means for storing the input information as new registration information in the registration information storage means in accordance with the result of the matching by the matching means;
An information authentication device, comprising:
該登録情報記憶ステップによって記憶された登録情報の中から認証に適している情報を選択する選択ステップと、
該選択ステップにより選択された登録情報と認証対象となる入力情報とを照合する照合ステップと、
該照合ステップによる照合の結果に応じて前記入力情報を前記登録情報群の新たな登録情報として記憶させる登録ステップと、
を有することを特徴とする情報認証方法。A registration information storage step of storing a plurality of registration information as a registration information group;
A selection step of selecting information suitable for authentication from the registration information stored by the registration information storage step;
A collation step of collating the registration information selected by the selection step with input information to be authenticated,
A registration step of storing the input information as new registration information of the registration information group according to a result of the comparison by the comparison step;
An information authentication method, comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003102976A JP2004309779A (en) | 2003-04-07 | 2003-04-07 | Voice authentication device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003102976A JP2004309779A (en) | 2003-04-07 | 2003-04-07 | Voice authentication device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004309779A true JP2004309779A (en) | 2004-11-04 |
Family
ID=33466261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003102976A Pending JP2004309779A (en) | 2003-04-07 | 2003-04-07 | Voice authentication device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004309779A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008064928A (en) * | 2006-09-06 | 2008-03-21 | Yamaha Corp | Biometrics authentication device and method, and program |
JP4854732B2 (en) * | 2006-03-24 | 2012-01-18 | パイオニア株式会社 | Speaker model registration apparatus and method in speaker recognition system, and computer program |
JP2015175915A (en) * | 2014-03-13 | 2015-10-05 | 綜合警備保障株式会社 | Speaker recognition device, speaker recognition method, and speaker recognition program |
-
2003
- 2003-04-07 JP JP2003102976A patent/JP2004309779A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4854732B2 (en) * | 2006-03-24 | 2012-01-18 | パイオニア株式会社 | Speaker model registration apparatus and method in speaker recognition system, and computer program |
JP2008064928A (en) * | 2006-09-06 | 2008-03-21 | Yamaha Corp | Biometrics authentication device and method, and program |
JP2015175915A (en) * | 2014-03-13 | 2015-10-05 | 綜合警備保障株式会社 | Speaker recognition device, speaker recognition method, and speaker recognition program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017215558A1 (en) | Voiceprint recognition method and device | |
US11727942B2 (en) | Age compensation in biometric systems using time-interval, gender and age | |
US6205424B1 (en) | Two-staged cohort selection for speaker verification system | |
JP5172973B2 (en) | Voice recognition device | |
US10733986B2 (en) | Apparatus, method for voice recognition, and non-transitory computer-readable storage medium | |
WO2017162053A1 (en) | Identity authentication method and device | |
US9646613B2 (en) | Methods and systems for splitting a digital signal | |
US20070219792A1 (en) | Method and system for user authentication based on speech recognition and knowledge questions | |
JP2007249179A (en) | System, method and computer program product for updating biometric model based on change in biometric feature | |
WO2019136911A1 (en) | Voice recognition method for updating voiceprint data, terminal device, and storage medium | |
EP3989217B1 (en) | Method for detecting an audio adversarial attack with respect to a voice input processed by an automatic speech recognition system, corresponding device, computer program product and computer-readable carrier medium | |
KR101888058B1 (en) | The method and apparatus for identifying speaker based on spoken word | |
KR20210050884A (en) | Registration method and apparatus for speaker recognition | |
TW200828267A (en) | Voice authentication apparatus | |
CN113870860A (en) | End-to-end voiceprint recognition method and voiceprint recognition device | |
Weng et al. | The sysu system for the interspeech 2015 automatic speaker verification spoofing and countermeasures challenge | |
JP2016166927A (en) | Parameter learning device, speaker recognition device, parameter learning method, speaker recognition method, and program | |
JP2004309779A (en) | Voice authentication device | |
Portêlo et al. | Privacy-preserving speaker verification using secure binary embeddings | |
JP4440414B2 (en) | Speaker verification apparatus and method | |
JP6571587B2 (en) | Voice input device, method thereof, and program | |
CN111798844A (en) | Artificial intelligent speaker customized personalized service system based on voiceprint recognition | |
JP2002244697A (en) | Device and method for voice authentication, and program | |
TWI817897B (en) | Low-noise voiceprint identification device for financial transaction system and method thereof | |
CN115331673B (en) | Voiceprint recognition household appliance control method and device in complex sound scene |