JP2004094158A

JP2004094158A - 母音検索を利用した声紋認証装置

Info

Publication number: JP2004094158A
Application number: JP2002258798A
Authority: JP
Inventors: Hironobu Mitani; 三谷　裕信; Minehiro Takekoshi; 竹腰　峰大; Yoshisato Furukawa; 古川　嘉識; Hiroshi Moriyama; 森山　寛
Original assignee: NTT Comware Corp
Current assignee: NTT Comware Corp
Priority date: 2002-09-04
Filing date: 2002-09-04
Publication date: 2004-03-25

Abstract

【課題】照合にかかる時間を短縮させることができる母音検索を利用した声紋認証装置を提供する。
【解決手段】発音された音声によって認証を行う母音検索を利用した声紋認証装置であって、前記音声から声紋データを生成する声紋データ生成部と、前記音声からテキストデータを生成するテキストデータ生成部と、前記テキストデータ生成部が生成したテキストデータに含まれる母音を抽出して母音キー情報を生成する母音抽出部と、母音データと声紋データとを対応付けて予め記憶する声紋データベースと、前記母音抽出部が生成した母音キー情報に一致する母音データを前記声紋データベースから検索する検索部と、前記検索部の検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記声紋データ生成部が生成した声紋データとを照合して認証を行う声紋照合部と、を有する。
【選択図】　図１

Description

【０００１】
【発明の属する技術分野】
この発明は、音声によって認証を行う母音検索を利用した声紋認証装置に関するものである。
【０００２】
【従来の技術】
従来、音声を利用して認証を行う音声認証が利用されつつある。この音声認証を利用した本人性確認には、電話番号や暗証番号などの数字列によって構成されるパスワードを利用していた。すなわち、発話者から数字列を発話してもらい、発話された音声から数字の文字列のデータを生成し、予め登録されている暗証番号と一致している場合に認証を成立させる（例えば、非特許文献１参照。）。
【０００３】
【非特許文献１】
著者不明、“オルフェス（Ｏｒｐｈｅｕｓ）”、［ｏｎｌｉｎｅ］、掲載年月不明、パーセイ（Ｐｅｒｓａｙ）、［平成１４年９月３日検索］、インターネット〈ｈｔｔｐ：／／ｐｅｒｓａｙ．ｃｏｍ／ｐａｇｅｓ／Ｐｏｒｐｈｅｕｓ．ａｓｐ〉
【０００４】
この場合、発話者の発話内容を音声認識する際の誤認識を防止するために、音声パスワードには主に音声認識率の高い数字列（電話番号など）が利用されていた。また、音声を用いて認証を行う方法として、認証する対象のユーザの声紋を声紋データとして予め登録しておき、認証時にユーザに発話してもらい、声紋が一致するか否かの照合して認証する方法がある。
【０００５】
【発明が解決しようとする課題】
しかしながら、数字列などの暗証番号をパスワードとして利用する場合、発話したパスワードを他人に聞き取られてしまうと、その他人も認証されてしまう可能性があり、セキュリティレベルが低下してしまうという問題点があった。また、暗証番号そのものを発話者が忘れてしまう可能性があり、利用者の利便性が低下してしまうという問題点があった。
さらに、パスワードとして暗証番号を利用すると、ひらがなやカタカナの文字列に比べ、音声を誤認識してしまうことを防止できるが、上述のように、ユーザが暗証番号を忘れてしまうという問題があるので、暗証番号以外のキーワードをパスワードとして用いる場合においても、音声の誤認識を低減できることが望ましい。
また、声紋を利用して認証を行うと、セキュリティを向上させることができるが、予め登録された声紋データが多数存在する場合、声紋照合時において、全ての声紋データと発話された声紋とを比較すると、照合にかかる時間が長くなってしまうという問題点がある。
【０００６】
本発明は、このような事情に鑑みてなされたもので、その目的は、照合にかかる時間を短縮させることができる母音検索を利用した声紋認証装置を提供することにある。
また、本発明は、誤認識を低減させることができる母音検索を利用した声紋認証装置を提供することにある。
また、本発明は、発話者にとって利便性の高い母音検索を利用した声紋認証装置を提供することにある。
【０００７】
【課題を解決するための手段】
上記目的を達成するために、本発明は、発音された音声によって認証を行う母音検索を利用した声紋認証装置であって、前記音声から声紋データを生成する声紋データ生成部と、前記音声からテキストデータを生成するテキストデータ生成部と、キーワードと声紋データとを対応付けて予め記憶する声紋データベースと、前記テキストデータ生成部が生成したテキストデータに一致するキーワードを前記声紋データベースから検索する検索部と、前記検索部の検索結果に基づいて、前記テキストデータに一致するキーワードに対応付けられている声紋データと、前記声紋データ生成部が生成した声紋データとを照合して認証を行う声紋照合部と、を有することを特徴とする。
【０００８】
また、本発明は、発音された音声によって認証を行う母音検索を利用した声紋認証装置であって、前記音声から声紋データを生成する声紋データ生成部と、前記音声からテキストデータを生成するテキストデータ生成部と、前記テキストデータ生成部が生成したテキストデータに含まれる母音を抽出して母音キー情報を生成する母音抽出部と、母音データと声紋データとを対応付けて予め記憶する声紋データベースと、前記母音抽出部が生成した母音キー情報に一致する母音データを前記声紋データベースから検索する検索部と、前記検索部の検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記声紋データ生成部が生成した声紋データとを照合して認証を行う声紋照合部と、を有することを特徴とする。
【０００９】
また、本発明は、発音された音声によって認証を行う音声認証方法であって、前記音声から声紋データを生成し、前記音声からテキストデータを生成し、前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うことを特徴とする。
【００１０】
また、本発明は、発音された音声によって認証を行う音声認証方法であって、前記音声から声紋データを生成し、前記音声からテキストデータを生成し、前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成し、前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行う、ことを特徴とする。
【００１１】
また、本発明は、発音された音声によって認証を行う音声認証プログラムであって、前記音声から声紋データを生成するステップと、前記音声からテキストデータを生成するステップと、前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、をコンピュータに実行させることを特徴とする。
【００１２】
また、本発明は、発音された音声によって認証を行う音声認証プログラムであって、前記音声から声紋データを生成するステップと、前記音声からテキストデータを生成するステップと、前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成するステップと、前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、をコンピュータに実行させることを特徴とする。
【００１３】
また、本発明は、発音された音声によって認証を行う音声認証プログラムを記憶したコンピュータ読み取り可能な記録媒体であって、前記音声から声紋データを生成するステップと、前記音声からテキストデータを生成するステップと、前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、をコンピュータに実行させる音声認証プログラムを記憶したことを特徴とする。
【００１４】
また、本発明は、発音された音声によって認証を行う音声認証プログラムを記録したコンピュータ読み取り可能な記録媒体であって、前記音声から声紋データを生成するステップと、前記音声からテキストデータを生成するステップと、前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成するステップと、前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、をコンピュータに実行させる音声認証プログラムを記録したことを特徴とする。
【００１５】
上述した構成によれば、氏名（フルネーム）の中から母音を抽出し、それをキーとして声紋データベースから照合対象の顧客を絞り込んでおき、絞り込まれた顧客の声紋の中から照合するユーザを検出することができ、全ての声紋データの中から発話者の声紋を検索して照合する場合に比べて、照合にかかる時間を短縮することができる。
【００１６】
【発明の実施の形態】
以下、本発明の一実施形態による母音検索を利用した声紋認証装置を図面を参照して説明する。
図１は、この発明の一実施形態による母音検索を利用した声紋認証装置を適用した音声認証システムの構成を示す概略構成図である。
音声認証システムは、対話型音声応答装置１と音声認識サーバ２と声紋認証サーバ３と顧客管理サーバ５とがネットワーク７を介して接続される。対話型音声応答装置（ＩＶＲ）１は、音声ガイダンス（コールフロー）の送出と、通話者からの音声情報（名前）の入力により、発信者８との対話処理を行う。また、音声認識サーバ２から出力される名前のテキストデータから、名前に含まれる母音を抽出し、その結果のテキストデータを声紋認証サーバ３に出力する。音声認識サーバ２は、発信者から入力された音声情報を規定された文法や認識辞書に従って認識し、名前のテキストデータを対話型音声応答装置１に出力する。声紋認証サーバ３は、対話型音声応答装置１で録音された音声ファイルと名前の母音をキーとして、声紋データベース３２に登録されている声紋データと照合を実施し、その結果を対話型音声応答装置１に出力する。顧客管理サーバ５は、顧客管理データベース５１が接続される。発信者８は、電話機などの通信端末を利用して対話型音声応答装置１に接続する。
【００１７】
次に、上述した音声認証システムについてさらに説明する。図２は、音声認証システムの構成を示す概略ブロック図である。この図に示す対話型音声応答装置１において、ガイダンスデータベース１１は、発信者に送出する音声ガイダンスとなる音声ガイダンスデータを記憶する。音声ガイダンス対話部１２は、発信者からの発信に応じて、ガイダンスデータベース１１に記憶されている音声ガイダンスデータを読み出して発信者に送出し、対話処理を行う。音声ファイル生成部１３は、音声ガイダンス対話部１２から出力される発信者から発声された音声を録音し、音声ファイルを作成する。声紋データ生成部１４は、音声ファイル生成部１３によって作成された音声ファイルから声紋データを生成する。
【００１８】
母音抽出部１５は、テキストデータ生成部２２が生成したテキストデータに含まれる母音を抽出して母音キー情報を生成する。ここでいう母音キー情報とは、音声認識されたテキストデータに含まれている氏名から抽出される母音である。ここで、氏名と母音キー情報との関係の一例を図３に示す。この図に示すように、氏名が「石津　悟」である場合、氏名に含まれる母音が「ＩＩＵ　ＡＯＵ」であるので、母音キー情報が「ＩＩＵ　ＡＯＵ」となる。また、「西津　悟」の氏名についても母音キー情報は、「ＩＩＵ　ＡＯＵ」である。
【００１９】
顧客検索部１６は、母音抽出部１５によって生成された母音キー情報と一致する母音データが顧客データベース５１に記憶されているか否かを検出することによって予め登録された顧客であるか否かを検索し、予め登録された顧客である場合、母音キー情報に対応する顧客ＩＤを顧客管理データベースから読み出し、読み出した顧客ＩＤと声紋データ生成部１４によって生成された声紋データとを検索部３３に出力する。
【００２０】
次に、音声認識サーバ２において、辞書データベース２１は、音声ファイルからテキストデータを生成するための文法や辞書に関するデータを記憶する。
テキストデータ生成部２２は、辞書データベース２１を参照し、音声ファイル生成部１３から出力される音声ファイルからテキストデータを生成する。
【００２１】
声紋認証サーバ３において、声紋データベース３１は、図４に示すように、顧客ＩＤとその顧客ＩＤによって特定される顧客が自分の氏名（フルネーム）を発音した際の音声の声紋データとを対応付けて予め記憶する。検索部３２は、顧客検索部１６から出力される顧客ＩＤに対応する声紋データを声紋データベース３１から読み出す。声紋照合部３３は、検索部３２が読み出した声紋データと、顧客検索部１６から出力された声紋データとを照合して認証を行う。
【００２２】
顧客管理サーバ５における顧客データベース５１は、図５に示すように、母音キー情報と顧客ＩＤとを対応付けて記憶する。ここでは、複数の顧客の母音キー情報が同じである場合、１つの母音キー情報に、複数の顧客ＩＤが対応付けられて記憶される。
【００２３】
次に、図２の構成における対話型音声応答システムの動作について図６のフローチャートを用いて説明する。電話機を介して発信者から発信されると、対話型音声応答装置１は着呼し（ステップＳ１０１）、音声ガイダンス対話部１２が「いらっしゃいませ。お客様のお名前をフルネームでお話下さい。」という音声ガイダンスを発信者の電話機に送出する（ステップＳ１０２）。そして、発信者から氏名が発話されると（ステップＳ１０３）、発話された氏名に基づいて声紋照合を行い、照合が成立すると、音声ガイダンス対話部１２は、「西津さまですね。いつもご利用ありがとうございます。」という認証が成立されたこと通知する音声ガイダンスを送出する。
【００２４】
次に、図６のステップＳ１０３からステップＳ１０５までの処理について、図７のフローチャートを用いてさらに説明する。発信者から発話された氏名を音声ガイダンス対話部１２によって受信すると、音声ファイル生成部１３は、音声ファイルを生成し、テキストデータ生成部２２に出力する。一方、声紋データ生成部１４は、音声ファイル生成部１３によって生成された音声ファイルから声紋データを生成する。テキストデータ生成部２２は、音声ファイルが生成されると、音声ファイルの音声認識を実施し、辞書データベース２１を参照して音声ファイルからテキストデータを生成する（ステップＳ２）。ここでは、テキストデータとして「にしづさとる」が生成される。そして、生成されたテキストデータが音声認識結果として、テキストデータ生成部２２から対話型音声応答装置１の母音抽出部１５に出力される（ステップＳ３）。
【００２５】
母音抽出部１５は、テキストデータ生成部２２から出力されたテキストデータ生成部２２から母音キー情報を抽出し（ステップＳ４）、抽出された母音キー情報を顧客検索部１６に出力する。ここで抽出される母音キー情報は、「ＩＩＵ　ＡＯＵ」である。顧客検索部１６は、母音抽出部１５から出力された母音キー情報に対応する顧客ＩＤを検索する（ステップＳ５）。ここでは、「石津　悟」と「西津　悟」との顧客の顧客ＩＤが顧客データベース５１に記憶されているので、顧客ＩＤとして「Ａ１００」と「Ａ１１０」とが検出される。そして、該当する顧客ＩＤが対話型音声応答装置１に出力されると（ステップＳ６）、顧客検索部１６は、検索された顧客ＩＤと声紋データ生成部１３によって生成された声紋データを声紋照合部３３に出力する。声紋照合部３３は、顧客ＩＤに対応する声紋データを検索部３２によって、声紋データベース３１から読み出し、読み出した声紋データと、顧客検索部１６から出力された声紋データとを照合を行い（ステップＳ７）、声紋データの一致の度合いに応じて、照合スコアを生成する（ステップＳ８）。そして、声紋照合部３３は、顧客検索部１６から複数の顧客ＩＤが出力された場合、ステップＳ７とステップＳ８とを実行し、各顧客ＩＤに対応する声紋データ毎に照合スコアを生成する（ステップＳ９）。ここでは、顧客ＩＤが「Ａ１００」と「Ａ１１０」とが顧客検索部１６から出力されているので、それぞれについて照合スコアを生成し、図８に示すような照合スコアのテーブルを作成する。ここでいう照合スコアとは、生成された声紋データが予め登録されている声紋データにどれほど似ているかを示す値であり、例えば、０から１００までの範囲の数値によって表現され、１００の場合に完全一致していることを示す。
【００２６】
照合スコアのテーブルが作成されると、声紋照合部３３は、予め設定された基準照合スコア以上であって、最も高い照合スコアの顧客（照合スコアが「９８」の顧客ＩＤ「Ａ１１０」の顧客「西津　悟」）であると判定し、認証を成立させ（ステップＳ１０）、音声ガイダンス対話部１２に認証成立を指示する。音声ガイダンス対話部１２は、認証成立が指示されると、認証が成立されたこと通知する音声ガイダンスを送出する（ステップＳ１１）。
【００２７】
一方、照合スコアが全て基準照合スコアに達していない場合、声紋照合部３３は、再録音の指示を音声ガイダンス対話部１２に出力する。音声ガイダンス対話部１２は、再録音の指示に基づいて、「認証できませんでした。もうはっきりとお客様のお名前をフルネームでお話下さい。」という音声ガイダンスを電話機に送出する。そして、発信者が再度氏名を発声した場合に、ステップＳ１の処理から繰り返して行う。
【００２８】
以上説明した実施形態によれば、照合スコアが基準照合スコア以下である場合、発信者に再度氏名を発声してもらうようにしたので、発信者が氏名の言い方を変えたり、アクセント、話す速度を変えたりして発声してもらうことが可能であるので、音声からテキストデータを生成する認識率を向上させ、照合率を向上させることができる。
また、バイオメトリクス承認のように特別な装置が不要であり、音声を検出することにより実現することが可能である。
【００２９】
また、上述した音声認証システムを用いて認証を行い、通信販売、株取引、バンキングなどのサービスの提供を行うことができる。また、従来のパスワードを発声する場合では、セキュリティレベルの関係から、取扱商品が低額なものが主流であったが、従来に比べてセキュリティを向上させることができるので、なりすまし等を防止することができ、これにより、販売商品を低額の商品だけでなく、高額の商品を取り扱うことも可能である。
また、上述した音声認証システムをネットワーク側に設置しているので、声紋認証をＡＳＰサービスにて提供する個ことが可能である。
【００３０】
なお、上述した実施形態において、対話型音声応答装置１と音声認識サーバ２と声紋認証サーバ３と顧客管理サーバ５とが別々の装置である場合について説明したが、各部を１つの装置内に設けるようにしてもよい。また、上述した実施形態において、声紋データベース３１に記憶される声紋データは、認証対象の顧客の氏名のフルネームであったが、声紋データは、必ずしも氏名のフルネームに限られるものではなく、暗証番号や合い言葉など、氏名以外の文字や数字が組み合わされたキーワードであってもよい。
【００３１】
また、上述した実施形態において、声紋データベース３１には、顧客ＩＤと声紋データとを対応付けて記憶する場合について説明したが、母音データと声紋データとを対応付けて記憶しておき、顧客データベース５１には、母音データのみ記憶しておく。そして、母音キー情報が顧客データベース５１に記憶されているか否かを顧客検索部１６によって検出し、母音キー情報が顧客データベース５１に記憶されている場合に、この母音キー情報に対応する声紋データを声紋照合部３３が照合するようにしてもよい。また、上述した実施形態において、発信者が発話する端末として、電話機である場合について説明したが、認証対象のユーザの音声を検出できるものであれば、電話機に限られることなく、例えば、インターホン等であってもよい。これにより、建物の入り口や、金庫などの施錠が必要となる箇所を鍵ではなく、音声によって施錠・解錠を行うことができる。
【００３２】
また、上述した実施形態においては、声紋データベース３１に記憶された声紋データは、認証する対象となるユーザの氏名が該ユーザによって発音された場合における声紋の声紋データを利用するようにした。これにより、従来技術においては、ユーザがパスワードを忘れてしまった場合、パスワードの再登録作業が必要となり、認証処理のサービス提供業者側にとって業務内容が増大してしまうという問題点が生じてしまうが、上述した実施形態においては、暗証番号などのパスワードを利用する場合に比べて発話者が忘れてしまうことを防止でき、また、慣れ親しんだ自分の氏名を利用できるので、利便性を向上させることができる。また、ユーザがパスワードを忘れてしまうことを防止できるので、認証処理のサービス提供業者側にとって、パスワード忘れによるパスワード変更にかかる業務内容の増大を防止することができる。
【００３３】
また、図２における音声ガイダンス対話部１２、音声ファイル生成部１３、声紋データ生成部１４、母音抽出部１５、顧客検索部１６、テキストデータ生成部２２、検索部３２、声紋照合部３３の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより音声認証処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウェアを含むものとする。
【００３４】
また、「コンピュータシステム」は、ＷＷＷシステムを利用している場合であれば、ホームページ提供環境（あるいは表示環境）も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ−ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【００３５】
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【００３６】
【発明の効果】
以上説明したように、この発明によれば、音声から声紋データとテキストデータとを生成し、生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、検索した検索結果に基づいて、テキストデータに一致する文字データに対応付けられている声紋データと、生成された声紋データとを照合して認証を行うようにしたので、声紋データが予め登録されているユーザの中から該当するユーザの候補を抽出することにより照合する可能性があるユーザを絞り込み、その候補の中から声紋データによって照合させることができ、これにより、予め記憶された全ての声紋データと生成された声紋データとを比較する場合に比べて、照合にかかる時間を短縮させることができる。
【００３７】
また、これにより、キーワードが他人に聞き取られても、本人以外に認証されてしまう可能性を低減させることができ、これにより、セキュリティを向上させることができる効果が得られる。
【００３８】
また、本発明によれば、生成されたテキストデータに含まれる母音を抽出し、抽出された母音に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、検索した検索結果に基づいて、母音キー情報に一致する母音データに対応付けられている声紋データと、生成された声紋データとを照合するようにしたので、キーワードとなる文字列をすべて検索に利用する場合に比べて、母音のみを用いるようにしたので、キーワードが一致しているか否かの照合にかかる時間を短縮させることができるとともに、暗証番号以外のキーワードをパスワードとして用いる場合においても、音声を誤認識してしまうことを低減させることができる。
【図面の簡単な説明】
【図１】この発明の一実施形態による音声認証システムの構成を示す概略構成図である。
【図２】音声認証システムの構成を示す概略ブロック図である。
【図３】氏名と母音キー情報との関係の一例を説明するための図面である。
【図４】声紋データベース３１に記憶される情報の一例を示す図面である。
【図５】顧客データベース５１に記憶される情報の一例を示す図面である。
【図６】図２の構成における対話型音声応答システムの動作について説明するためのフローチャートである。
【図７】対話型音声応答システムの動作について説明するためのフローチャートである。
【図８】照合スコアのテーブルの一例を示す図面である。
【符号の説明】
１　対話型音声応答装置　　　　　　　　　　　２　音声認識サーバ
３　声紋認証サーバ　　　　　　　　　　　　　５　顧客管理サーバ
１１　ガイダンスデータベース　　　　　　　　１２　音声ガイダンス対話部
１３　音声ファイル生成部　　　　　　　　　　１４　声紋データ生成部
１５　母音抽出部　　　　　　　　　　　　　　１６　顧客検索部
２２　テキストデータ生成部　　　　　　　　　３２　検索部
３３　声紋照合部　　　　　　　　　　　　　　５１　顧客データベース

Claims

発音された音声によって認証を行う母音検索を利用した声紋認証装置であって、
前記音声から声紋データを生成する声紋データ生成部と、
前記音声からテキストデータを生成するテキストデータ生成部と、
キーワードと声紋データとを対応付けて予め記憶する声紋データベースと、
前記テキストデータ生成部が生成したテキストデータに一致するキーワードを前記声紋データベースから検索する検索部と、
前記検索部の検索結果に基づいて、前記テキストデータに一致するキーワードに対応付けられている声紋データと、前記声紋データ生成部が生成した声紋データとを照合して認証を行う声紋照合部と、
を有することを特徴とする母音検索を利用した声紋認証装置。
発音された音声によって認証を行う母音検索を利用した声紋認証装置であって、
前記音声から声紋データを生成する声紋データ生成部と、
前記音声からテキストデータを生成するテキストデータ生成部と、
前記テキストデータ生成部が生成したテキストデータに含まれる母音を抽出して母音キー情報を生成する母音抽出部と、
母音データと声紋データとを対応付けて予め記憶する声紋データベースと、
前記母音抽出部が生成した母音キー情報に一致する母音データを前記声紋データベースから検索する検索部と、
前記検索部の検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記声紋データ生成部が生成した声紋データとを照合して認証を行う声紋照合部と、
を有することを特徴とする母音検索を利用した声紋認証装置。
発音された音声によって認証を行う音声認証方法であって、
前記音声から声紋データを生成し、
前記音声からテキストデータを生成し、
前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、
前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行う
ことを特徴とする音声認証方法。
発音された音声によって認証を行う音声認証方法であって、
前記音声から声紋データを生成し、
前記音声からテキストデータを生成し、
前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成し、
前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、
前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行う、
ことを特徴とする音声認証方法。
発音された音声によって認証を行う音声認証プログラムであって、
前記音声から声紋データを生成するステップと、
前記音声からテキストデータを生成するステップと、
前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、
前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、
をコンピュータに実行させる音声認証プログラム。
発音された音声によって認証を行う音声認証プログラムであって、
前記音声から声紋データを生成するステップと、
前記音声からテキストデータを生成するステップと、
前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成するステップと、
前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、
前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、
をコンピュータに実行させる音声認証プログラム。
発音された音声によって認証を行う音声認証プログラムを記憶したコンピュータ読み取り可能な記録媒体であって、
前記音声から声紋データを生成するステップと、
前記音声からテキストデータを生成するステップと、
前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、
前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、
をコンピュータに実行させる音声認証プログラムを記憶した記録媒体。
発音された音声によって認証を行う音声認証プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記音声から声紋データを生成するステップと、
前記音声からテキストデータを生成するステップと、
前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成するステップと、
前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、
前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、
をコンピュータに実行させる音声認証プログラムを記録した記録媒体。