JP2004094158A - 母音検索を利用した声紋認証装置 - Google Patents
母音検索を利用した声紋認証装置 Download PDFInfo
- Publication number
- JP2004094158A JP2004094158A JP2002258798A JP2002258798A JP2004094158A JP 2004094158 A JP2004094158 A JP 2004094158A JP 2002258798 A JP2002258798 A JP 2002258798A JP 2002258798 A JP2002258798 A JP 2002258798A JP 2004094158 A JP2004094158 A JP 2004094158A
- Authority
- JP
- Japan
- Prior art keywords
- data
- voiceprint
- voice
- vowel
- authentication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】照合にかかる時間を短縮させることができる母音検索を利用した声紋認証装置を提供する。
【解決手段】発音された音声によって認証を行う母音検索を利用した声紋認証装置であって、前記音声から声紋データを生成する声紋データ生成部と、前記音声からテキストデータを生成するテキストデータ生成部と、前記テキストデータ生成部が生成したテキストデータに含まれる母音を抽出して母音キー情報を生成する母音抽出部と、母音データと声紋データとを対応付けて予め記憶する声紋データベースと、前記母音抽出部が生成した母音キー情報に一致する母音データを前記声紋データベースから検索する検索部と、前記検索部の検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記声紋データ生成部が生成した声紋データとを照合して認証を行う声紋照合部と、を有する。
【選択図】 図1
【解決手段】発音された音声によって認証を行う母音検索を利用した声紋認証装置であって、前記音声から声紋データを生成する声紋データ生成部と、前記音声からテキストデータを生成するテキストデータ生成部と、前記テキストデータ生成部が生成したテキストデータに含まれる母音を抽出して母音キー情報を生成する母音抽出部と、母音データと声紋データとを対応付けて予め記憶する声紋データベースと、前記母音抽出部が生成した母音キー情報に一致する母音データを前記声紋データベースから検索する検索部と、前記検索部の検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記声紋データ生成部が生成した声紋データとを照合して認証を行う声紋照合部と、を有する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
この発明は、音声によって認証を行う母音検索を利用した声紋認証装置に関するものである。
【0002】
【従来の技術】
従来、音声を利用して認証を行う音声認証が利用されつつある。この音声認証を利用した本人性確認には、電話番号や暗証番号などの数字列によって構成されるパスワードを利用していた。すなわち、発話者から数字列を発話してもらい、発話された音声から数字の文字列のデータを生成し、予め登録されている暗証番号と一致している場合に認証を成立させる(例えば、非特許文献1参照。)。
【0003】
【非特許文献1】
著者不明、“オルフェス(Orpheus)”、[online]、掲載年月不明、パーセイ(Persay)、[平成14年9月3日検索]、インターネット〈http://persay.com/pages/Porpheus.asp〉
【0004】
この場合、発話者の発話内容を音声認識する際の誤認識を防止するために、音声パスワードには主に音声認識率の高い数字列(電話番号など)が利用されていた。また、音声を用いて認証を行う方法として、認証する対象のユーザの声紋を声紋データとして予め登録しておき、認証時にユーザに発話してもらい、声紋が一致するか否かの照合して認証する方法がある。
【0005】
【発明が解決しようとする課題】
しかしながら、数字列などの暗証番号をパスワードとして利用する場合、発話したパスワードを他人に聞き取られてしまうと、その他人も認証されてしまう可能性があり、セキュリティレベルが低下してしまうという問題点があった。また、暗証番号そのものを発話者が忘れてしまう可能性があり、利用者の利便性が低下してしまうという問題点があった。
さらに、パスワードとして暗証番号を利用すると、ひらがなやカタカナの文字列に比べ、音声を誤認識してしまうことを防止できるが、上述のように、ユーザが暗証番号を忘れてしまうという問題があるので、暗証番号以外のキーワードをパスワードとして用いる場合においても、音声の誤認識を低減できることが望ましい。
また、声紋を利用して認証を行うと、セキュリティを向上させることができるが、予め登録された声紋データが多数存在する場合、声紋照合時において、全ての声紋データと発話された声紋とを比較すると、照合にかかる時間が長くなってしまうという問題点がある。
【0006】
本発明は、このような事情に鑑みてなされたもので、その目的は、照合にかかる時間を短縮させることができる母音検索を利用した声紋認証装置を提供することにある。
また、本発明は、誤認識を低減させることができる母音検索を利用した声紋認証装置を提供することにある。
また、本発明は、発話者にとって利便性の高い母音検索を利用した声紋認証装置を提供することにある。
【0007】
【課題を解決するための手段】
上記目的を達成するために、本発明は、発音された音声によって認証を行う母音検索を利用した声紋認証装置であって、前記音声から声紋データを生成する声紋データ生成部と、前記音声からテキストデータを生成するテキストデータ生成部と、キーワードと声紋データとを対応付けて予め記憶する声紋データベースと、前記テキストデータ生成部が生成したテキストデータに一致するキーワードを前記声紋データベースから検索する検索部と、前記検索部の検索結果に基づいて、前記テキストデータに一致するキーワードに対応付けられている声紋データと、前記声紋データ生成部が生成した声紋データとを照合して認証を行う声紋照合部と、を有することを特徴とする。
【0008】
また、本発明は、発音された音声によって認証を行う母音検索を利用した声紋認証装置であって、前記音声から声紋データを生成する声紋データ生成部と、前記音声からテキストデータを生成するテキストデータ生成部と、前記テキストデータ生成部が生成したテキストデータに含まれる母音を抽出して母音キー情報を生成する母音抽出部と、母音データと声紋データとを対応付けて予め記憶する声紋データベースと、前記母音抽出部が生成した母音キー情報に一致する母音データを前記声紋データベースから検索する検索部と、前記検索部の検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記声紋データ生成部が生成した声紋データとを照合して認証を行う声紋照合部と、を有することを特徴とする。
【0009】
また、本発明は、発音された音声によって認証を行う音声認証方法であって、前記音声から声紋データを生成し、前記音声からテキストデータを生成し、前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うことを特徴とする。
【0010】
また、本発明は、発音された音声によって認証を行う音声認証方法であって、前記音声から声紋データを生成し、前記音声からテキストデータを生成し、前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成し、前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行う、ことを特徴とする。
【0011】
また、本発明は、発音された音声によって認証を行う音声認証プログラムであって、前記音声から声紋データを生成するステップと、前記音声からテキストデータを生成するステップと、前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、をコンピュータに実行させることを特徴とする。
【0012】
また、本発明は、発音された音声によって認証を行う音声認証プログラムであって、前記音声から声紋データを生成するステップと、前記音声からテキストデータを生成するステップと、前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成するステップと、前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、をコンピュータに実行させることを特徴とする。
【0013】
また、本発明は、発音された音声によって認証を行う音声認証プログラムを記憶したコンピュータ読み取り可能な記録媒体であって、前記音声から声紋データを生成するステップと、前記音声からテキストデータを生成するステップと、前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、をコンピュータに実行させる音声認証プログラムを記憶したことを特徴とする。
【0014】
また、本発明は、発音された音声によって認証を行う音声認証プログラムを記録したコンピュータ読み取り可能な記録媒体であって、前記音声から声紋データを生成するステップと、前記音声からテキストデータを生成するステップと、前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成するステップと、前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、をコンピュータに実行させる音声認証プログラムを記録したことを特徴とする。
【0015】
上述した構成によれば、氏名(フルネーム)の中から母音を抽出し、それをキーとして声紋データベースから照合対象の顧客を絞り込んでおき、絞り込まれた顧客の声紋の中から照合するユーザを検出することができ、全ての声紋データの中から発話者の声紋を検索して照合する場合に比べて、照合にかかる時間を短縮することができる。
【0016】
【発明の実施の形態】
以下、本発明の一実施形態による母音検索を利用した声紋認証装置を図面を参照して説明する。
図1は、この発明の一実施形態による母音検索を利用した声紋認証装置を適用した音声認証システムの構成を示す概略構成図である。
音声認証システムは、対話型音声応答装置1と音声認識サーバ2と声紋認証サーバ3と顧客管理サーバ5とがネットワーク7を介して接続される。対話型音声応答装置(IVR)1は、音声ガイダンス(コールフロー)の送出と、通話者からの音声情報(名前)の入力により、発信者8との対話処理を行う。また、音声認識サーバ2から出力される名前のテキストデータから、名前に含まれる母音を抽出し、その結果のテキストデータを声紋認証サーバ3に出力する。音声認識サーバ2は、発信者から入力された音声情報を規定された文法や認識辞書に従って認識し、名前のテキストデータを対話型音声応答装置1に出力する。声紋認証サーバ3は、対話型音声応答装置1で録音された音声ファイルと名前の母音をキーとして、声紋データベース32に登録されている声紋データと照合を実施し、その結果を対話型音声応答装置1に出力する。顧客管理サーバ5は、顧客管理データベース51が接続される。発信者8は、電話機などの通信端末を利用して対話型音声応答装置1に接続する。
【0017】
次に、上述した音声認証システムについてさらに説明する。図2は、音声認証システムの構成を示す概略ブロック図である。この図に示す対話型音声応答装置1において、ガイダンスデータベース11は、発信者に送出する音声ガイダンスとなる音声ガイダンスデータを記憶する。音声ガイダンス対話部12は、発信者からの発信に応じて、ガイダンスデータベース11に記憶されている音声ガイダンスデータを読み出して発信者に送出し、対話処理を行う。音声ファイル生成部13は、音声ガイダンス対話部12から出力される発信者から発声された音声を録音し、音声ファイルを作成する。声紋データ生成部14は、音声ファイル生成部13によって作成された音声ファイルから声紋データを生成する。
【0018】
母音抽出部15は、テキストデータ生成部22が生成したテキストデータに含まれる母音を抽出して母音キー情報を生成する。ここでいう母音キー情報とは、音声認識されたテキストデータに含まれている氏名から抽出される母音である。ここで、氏名と母音キー情報との関係の一例を図3に示す。この図に示すように、氏名が「石津 悟」である場合、氏名に含まれる母音が「IIU AOU」であるので、母音キー情報が「IIU AOU」となる。また、「西津 悟」の氏名についても母音キー情報は、「IIU AOU」である。
【0019】
顧客検索部16は、母音抽出部15によって生成された母音キー情報と一致する母音データが顧客データベース51に記憶されているか否かを検出することによって予め登録された顧客であるか否かを検索し、予め登録された顧客である場合、母音キー情報に対応する顧客IDを顧客管理データベースから読み出し、読み出した顧客IDと声紋データ生成部14によって生成された声紋データとを検索部33に出力する。
【0020】
次に、音声認識サーバ2において、辞書データベース21は、音声ファイルからテキストデータを生成するための文法や辞書に関するデータを記憶する。
テキストデータ生成部22は、辞書データベース21を参照し、音声ファイル生成部13から出力される音声ファイルからテキストデータを生成する。
【0021】
声紋認証サーバ3において、声紋データベース31は、図4に示すように、顧客IDとその顧客IDによって特定される顧客が自分の氏名(フルネーム)を発音した際の音声の声紋データとを対応付けて予め記憶する。検索部32は、顧客検索部16から出力される顧客IDに対応する声紋データを声紋データベース31から読み出す。声紋照合部33は、検索部32が読み出した声紋データと、顧客検索部16から出力された声紋データとを照合して認証を行う。
【0022】
顧客管理サーバ5における顧客データベース51は、図5に示すように、母音キー情報と顧客IDとを対応付けて記憶する。ここでは、複数の顧客の母音キー情報が同じである場合、1つの母音キー情報に、複数の顧客IDが対応付けられて記憶される。
【0023】
次に、図2の構成における対話型音声応答システムの動作について図6のフローチャートを用いて説明する。電話機を介して発信者から発信されると、対話型音声応答装置1は着呼し(ステップS101)、音声ガイダンス対話部12が「いらっしゃいませ。お客様のお名前をフルネームでお話下さい。」という音声ガイダンスを発信者の電話機に送出する(ステップS102)。そして、発信者から氏名が発話されると(ステップS103)、発話された氏名に基づいて声紋照合を行い、照合が成立すると、音声ガイダンス対話部12は、「西津さまですね。いつもご利用ありがとうございます。」という認証が成立されたこと通知する音声ガイダンスを送出する。
【0024】
次に、図6のステップS103からステップS105までの処理について、図7のフローチャートを用いてさらに説明する。発信者から発話された氏名を音声ガイダンス対話部12によって受信すると、音声ファイル生成部13は、音声ファイルを生成し、テキストデータ生成部22に出力する。一方、声紋データ生成部14は、音声ファイル生成部13によって生成された音声ファイルから声紋データを生成する。テキストデータ生成部22は、音声ファイルが生成されると、音声ファイルの音声認識を実施し、辞書データベース21を参照して音声ファイルからテキストデータを生成する(ステップS2)。ここでは、テキストデータとして「にしづさとる」が生成される。そして、生成されたテキストデータが音声認識結果として、テキストデータ生成部22から対話型音声応答装置1の母音抽出部15に出力される(ステップS3)。
【0025】
母音抽出部15は、テキストデータ生成部22から出力されたテキストデータ生成部22から母音キー情報を抽出し(ステップS4)、抽出された母音キー情報を顧客検索部16に出力する。ここで抽出される母音キー情報は、「IIU AOU」である。顧客検索部16は、母音抽出部15から出力された母音キー情報に対応する顧客IDを検索する(ステップS5)。ここでは、「石津 悟」と「西津 悟」との顧客の顧客IDが顧客データベース51に記憶されているので、顧客IDとして「A100」と「A110」とが検出される。そして、該当する顧客IDが対話型音声応答装置1に出力されると(ステップS6)、顧客検索部16は、検索された顧客IDと声紋データ生成部13によって生成された声紋データを声紋照合部33に出力する。声紋照合部33は、顧客IDに対応する声紋データを検索部32によって、声紋データベース31から読み出し、読み出した声紋データと、顧客検索部16から出力された声紋データとを照合を行い(ステップS7)、声紋データの一致の度合いに応じて、照合スコアを生成する(ステップS8)。そして、声紋照合部33は、顧客検索部16から複数の顧客IDが出力された場合、ステップS7とステップS8とを実行し、各顧客IDに対応する声紋データ毎に照合スコアを生成する(ステップS9)。ここでは、顧客IDが「A100」と「A110」とが顧客検索部16から出力されているので、それぞれについて照合スコアを生成し、図8に示すような照合スコアのテーブルを作成する。ここでいう照合スコアとは、生成された声紋データが予め登録されている声紋データにどれほど似ているかを示す値であり、例えば、0から100までの範囲の数値によって表現され、100の場合に完全一致していることを示す。
【0026】
照合スコアのテーブルが作成されると、声紋照合部33は、予め設定された基準照合スコア以上であって、最も高い照合スコアの顧客(照合スコアが「98」の顧客ID「A110」の顧客「西津 悟」)であると判定し、認証を成立させ(ステップS10)、音声ガイダンス対話部12に認証成立を指示する。音声ガイダンス対話部12は、認証成立が指示されると、認証が成立されたこと通知する音声ガイダンスを送出する(ステップS11)。
【0027】
一方、照合スコアが全て基準照合スコアに達していない場合、声紋照合部33は、再録音の指示を音声ガイダンス対話部12に出力する。音声ガイダンス対話部12は、再録音の指示に基づいて、「認証できませんでした。もうはっきりとお客様のお名前をフルネームでお話下さい。」という音声ガイダンスを電話機に送出する。そして、発信者が再度氏名を発声した場合に、ステップS1の処理から繰り返して行う。
【0028】
以上説明した実施形態によれば、照合スコアが基準照合スコア以下である場合、発信者に再度氏名を発声してもらうようにしたので、発信者が氏名の言い方を変えたり、アクセント、話す速度を変えたりして発声してもらうことが可能であるので、音声からテキストデータを生成する認識率を向上させ、照合率を向上させることができる。
また、バイオメトリクス承認のように特別な装置が不要であり、音声を検出することにより実現することが可能である。
【0029】
また、上述した音声認証システムを用いて認証を行い、通信販売、株取引、バンキングなどのサービスの提供を行うことができる。また、従来のパスワードを発声する場合では、セキュリティレベルの関係から、取扱商品が低額なものが主流であったが、従来に比べてセキュリティを向上させることができるので、なりすまし等を防止することができ、これにより、販売商品を低額の商品だけでなく、高額の商品を取り扱うことも可能である。
また、上述した音声認証システムをネットワーク側に設置しているので、声紋認証をASPサービスにて提供する個ことが可能である。
【0030】
なお、上述した実施形態において、対話型音声応答装置1と音声認識サーバ2と声紋認証サーバ3と顧客管理サーバ5とが別々の装置である場合について説明したが、各部を1つの装置内に設けるようにしてもよい。また、上述した実施形態において、声紋データベース31に記憶される声紋データは、認証対象の顧客の氏名のフルネームであったが、声紋データは、必ずしも氏名のフルネームに限られるものではなく、暗証番号や合い言葉など、氏名以外の文字や数字が組み合わされたキーワードであってもよい。
【0031】
また、上述した実施形態において、声紋データベース31には、顧客IDと声紋データとを対応付けて記憶する場合について説明したが、母音データと声紋データとを対応付けて記憶しておき、顧客データベース51には、母音データのみ記憶しておく。そして、母音キー情報が顧客データベース51に記憶されているか否かを顧客検索部16によって検出し、母音キー情報が顧客データベース51に記憶されている場合に、この母音キー情報に対応する声紋データを声紋照合部33が照合するようにしてもよい。また、上述した実施形態において、発信者が発話する端末として、電話機である場合について説明したが、認証対象のユーザの音声を検出できるものであれば、電話機に限られることなく、例えば、インターホン等であってもよい。これにより、建物の入り口や、金庫などの施錠が必要となる箇所を鍵ではなく、音声によって施錠・解錠を行うことができる。
【0032】
また、上述した実施形態においては、声紋データベース31に記憶された声紋データは、認証する対象となるユーザの氏名が該ユーザによって発音された場合における声紋の声紋データを利用するようにした。これにより、従来技術においては、ユーザがパスワードを忘れてしまった場合、パスワードの再登録作業が必要となり、認証処理のサービス提供業者側にとって業務内容が増大してしまうという問題点が生じてしまうが、上述した実施形態においては、暗証番号などのパスワードを利用する場合に比べて発話者が忘れてしまうことを防止でき、また、慣れ親しんだ自分の氏名を利用できるので、利便性を向上させることができる。また、ユーザがパスワードを忘れてしまうことを防止できるので、認証処理のサービス提供業者側にとって、パスワード忘れによるパスワード変更にかかる業務内容の増大を防止することができる。
【0033】
また、図2における音声ガイダンス対話部12、音声ファイル生成部13、声紋データ生成部14、母音抽出部15、顧客検索部16、テキストデータ生成部22、検索部32、声紋照合部33の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより音声認証処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
【0034】
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0035】
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【0036】
【発明の効果】
以上説明したように、この発明によれば、音声から声紋データとテキストデータとを生成し、生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、検索した検索結果に基づいて、テキストデータに一致する文字データに対応付けられている声紋データと、生成された声紋データとを照合して認証を行うようにしたので、声紋データが予め登録されているユーザの中から該当するユーザの候補を抽出することにより照合する可能性があるユーザを絞り込み、その候補の中から声紋データによって照合させることができ、これにより、予め記憶された全ての声紋データと生成された声紋データとを比較する場合に比べて、照合にかかる時間を短縮させることができる。
【0037】
また、これにより、キーワードが他人に聞き取られても、本人以外に認証されてしまう可能性を低減させることができ、これにより、セキュリティを向上させることができる効果が得られる。
【0038】
また、本発明によれば、生成されたテキストデータに含まれる母音を抽出し、抽出された母音に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、検索した検索結果に基づいて、母音キー情報に一致する母音データに対応付けられている声紋データと、生成された声紋データとを照合するようにしたので、キーワードとなる文字列をすべて検索に利用する場合に比べて、母音のみを用いるようにしたので、キーワードが一致しているか否かの照合にかかる時間を短縮させることができるとともに、暗証番号以外のキーワードをパスワードとして用いる場合においても、音声を誤認識してしまうことを低減させることができる。
【図面の簡単な説明】
【図1】この発明の一実施形態による音声認証システムの構成を示す概略構成図である。
【図2】音声認証システムの構成を示す概略ブロック図である。
【図3】氏名と母音キー情報との関係の一例を説明するための図面である。
【図4】声紋データベース31に記憶される情報の一例を示す図面である。
【図5】顧客データベース51に記憶される情報の一例を示す図面である。
【図6】図2の構成における対話型音声応答システムの動作について説明するためのフローチャートである。
【図7】対話型音声応答システムの動作について説明するためのフローチャートである。
【図8】照合スコアのテーブルの一例を示す図面である。
【符号の説明】
1 対話型音声応答装置 2 音声認識サーバ
3 声紋認証サーバ 5 顧客管理サーバ
11 ガイダンスデータベース 12 音声ガイダンス対話部
13 音声ファイル生成部 14 声紋データ生成部
15 母音抽出部 16 顧客検索部
22 テキストデータ生成部 32 検索部
33 声紋照合部 51 顧客データベース
【発明の属する技術分野】
この発明は、音声によって認証を行う母音検索を利用した声紋認証装置に関するものである。
【0002】
【従来の技術】
従来、音声を利用して認証を行う音声認証が利用されつつある。この音声認証を利用した本人性確認には、電話番号や暗証番号などの数字列によって構成されるパスワードを利用していた。すなわち、発話者から数字列を発話してもらい、発話された音声から数字の文字列のデータを生成し、予め登録されている暗証番号と一致している場合に認証を成立させる(例えば、非特許文献1参照。)。
【0003】
【非特許文献1】
著者不明、“オルフェス(Orpheus)”、[online]、掲載年月不明、パーセイ(Persay)、[平成14年9月3日検索]、インターネット〈http://persay.com/pages/Porpheus.asp〉
【0004】
この場合、発話者の発話内容を音声認識する際の誤認識を防止するために、音声パスワードには主に音声認識率の高い数字列(電話番号など)が利用されていた。また、音声を用いて認証を行う方法として、認証する対象のユーザの声紋を声紋データとして予め登録しておき、認証時にユーザに発話してもらい、声紋が一致するか否かの照合して認証する方法がある。
【0005】
【発明が解決しようとする課題】
しかしながら、数字列などの暗証番号をパスワードとして利用する場合、発話したパスワードを他人に聞き取られてしまうと、その他人も認証されてしまう可能性があり、セキュリティレベルが低下してしまうという問題点があった。また、暗証番号そのものを発話者が忘れてしまう可能性があり、利用者の利便性が低下してしまうという問題点があった。
さらに、パスワードとして暗証番号を利用すると、ひらがなやカタカナの文字列に比べ、音声を誤認識してしまうことを防止できるが、上述のように、ユーザが暗証番号を忘れてしまうという問題があるので、暗証番号以外のキーワードをパスワードとして用いる場合においても、音声の誤認識を低減できることが望ましい。
また、声紋を利用して認証を行うと、セキュリティを向上させることができるが、予め登録された声紋データが多数存在する場合、声紋照合時において、全ての声紋データと発話された声紋とを比較すると、照合にかかる時間が長くなってしまうという問題点がある。
【0006】
本発明は、このような事情に鑑みてなされたもので、その目的は、照合にかかる時間を短縮させることができる母音検索を利用した声紋認証装置を提供することにある。
また、本発明は、誤認識を低減させることができる母音検索を利用した声紋認証装置を提供することにある。
また、本発明は、発話者にとって利便性の高い母音検索を利用した声紋認証装置を提供することにある。
【0007】
【課題を解決するための手段】
上記目的を達成するために、本発明は、発音された音声によって認証を行う母音検索を利用した声紋認証装置であって、前記音声から声紋データを生成する声紋データ生成部と、前記音声からテキストデータを生成するテキストデータ生成部と、キーワードと声紋データとを対応付けて予め記憶する声紋データベースと、前記テキストデータ生成部が生成したテキストデータに一致するキーワードを前記声紋データベースから検索する検索部と、前記検索部の検索結果に基づいて、前記テキストデータに一致するキーワードに対応付けられている声紋データと、前記声紋データ生成部が生成した声紋データとを照合して認証を行う声紋照合部と、を有することを特徴とする。
【0008】
また、本発明は、発音された音声によって認証を行う母音検索を利用した声紋認証装置であって、前記音声から声紋データを生成する声紋データ生成部と、前記音声からテキストデータを生成するテキストデータ生成部と、前記テキストデータ生成部が生成したテキストデータに含まれる母音を抽出して母音キー情報を生成する母音抽出部と、母音データと声紋データとを対応付けて予め記憶する声紋データベースと、前記母音抽出部が生成した母音キー情報に一致する母音データを前記声紋データベースから検索する検索部と、前記検索部の検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記声紋データ生成部が生成した声紋データとを照合して認証を行う声紋照合部と、を有することを特徴とする。
【0009】
また、本発明は、発音された音声によって認証を行う音声認証方法であって、前記音声から声紋データを生成し、前記音声からテキストデータを生成し、前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うことを特徴とする。
【0010】
また、本発明は、発音された音声によって認証を行う音声認証方法であって、前記音声から声紋データを生成し、前記音声からテキストデータを生成し、前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成し、前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行う、ことを特徴とする。
【0011】
また、本発明は、発音された音声によって認証を行う音声認証プログラムであって、前記音声から声紋データを生成するステップと、前記音声からテキストデータを生成するステップと、前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、をコンピュータに実行させることを特徴とする。
【0012】
また、本発明は、発音された音声によって認証を行う音声認証プログラムであって、前記音声から声紋データを生成するステップと、前記音声からテキストデータを生成するステップと、前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成するステップと、前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、をコンピュータに実行させることを特徴とする。
【0013】
また、本発明は、発音された音声によって認証を行う音声認証プログラムを記憶したコンピュータ読み取り可能な記録媒体であって、前記音声から声紋データを生成するステップと、前記音声からテキストデータを生成するステップと、前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、をコンピュータに実行させる音声認証プログラムを記憶したことを特徴とする。
【0014】
また、本発明は、発音された音声によって認証を行う音声認証プログラムを記録したコンピュータ読み取り可能な記録媒体であって、前記音声から声紋データを生成するステップと、前記音声からテキストデータを生成するステップと、前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成するステップと、前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、をコンピュータに実行させる音声認証プログラムを記録したことを特徴とする。
【0015】
上述した構成によれば、氏名(フルネーム)の中から母音を抽出し、それをキーとして声紋データベースから照合対象の顧客を絞り込んでおき、絞り込まれた顧客の声紋の中から照合するユーザを検出することができ、全ての声紋データの中から発話者の声紋を検索して照合する場合に比べて、照合にかかる時間を短縮することができる。
【0016】
【発明の実施の形態】
以下、本発明の一実施形態による母音検索を利用した声紋認証装置を図面を参照して説明する。
図1は、この発明の一実施形態による母音検索を利用した声紋認証装置を適用した音声認証システムの構成を示す概略構成図である。
音声認証システムは、対話型音声応答装置1と音声認識サーバ2と声紋認証サーバ3と顧客管理サーバ5とがネットワーク7を介して接続される。対話型音声応答装置(IVR)1は、音声ガイダンス(コールフロー)の送出と、通話者からの音声情報(名前)の入力により、発信者8との対話処理を行う。また、音声認識サーバ2から出力される名前のテキストデータから、名前に含まれる母音を抽出し、その結果のテキストデータを声紋認証サーバ3に出力する。音声認識サーバ2は、発信者から入力された音声情報を規定された文法や認識辞書に従って認識し、名前のテキストデータを対話型音声応答装置1に出力する。声紋認証サーバ3は、対話型音声応答装置1で録音された音声ファイルと名前の母音をキーとして、声紋データベース32に登録されている声紋データと照合を実施し、その結果を対話型音声応答装置1に出力する。顧客管理サーバ5は、顧客管理データベース51が接続される。発信者8は、電話機などの通信端末を利用して対話型音声応答装置1に接続する。
【0017】
次に、上述した音声認証システムについてさらに説明する。図2は、音声認証システムの構成を示す概略ブロック図である。この図に示す対話型音声応答装置1において、ガイダンスデータベース11は、発信者に送出する音声ガイダンスとなる音声ガイダンスデータを記憶する。音声ガイダンス対話部12は、発信者からの発信に応じて、ガイダンスデータベース11に記憶されている音声ガイダンスデータを読み出して発信者に送出し、対話処理を行う。音声ファイル生成部13は、音声ガイダンス対話部12から出力される発信者から発声された音声を録音し、音声ファイルを作成する。声紋データ生成部14は、音声ファイル生成部13によって作成された音声ファイルから声紋データを生成する。
【0018】
母音抽出部15は、テキストデータ生成部22が生成したテキストデータに含まれる母音を抽出して母音キー情報を生成する。ここでいう母音キー情報とは、音声認識されたテキストデータに含まれている氏名から抽出される母音である。ここで、氏名と母音キー情報との関係の一例を図3に示す。この図に示すように、氏名が「石津 悟」である場合、氏名に含まれる母音が「IIU AOU」であるので、母音キー情報が「IIU AOU」となる。また、「西津 悟」の氏名についても母音キー情報は、「IIU AOU」である。
【0019】
顧客検索部16は、母音抽出部15によって生成された母音キー情報と一致する母音データが顧客データベース51に記憶されているか否かを検出することによって予め登録された顧客であるか否かを検索し、予め登録された顧客である場合、母音キー情報に対応する顧客IDを顧客管理データベースから読み出し、読み出した顧客IDと声紋データ生成部14によって生成された声紋データとを検索部33に出力する。
【0020】
次に、音声認識サーバ2において、辞書データベース21は、音声ファイルからテキストデータを生成するための文法や辞書に関するデータを記憶する。
テキストデータ生成部22は、辞書データベース21を参照し、音声ファイル生成部13から出力される音声ファイルからテキストデータを生成する。
【0021】
声紋認証サーバ3において、声紋データベース31は、図4に示すように、顧客IDとその顧客IDによって特定される顧客が自分の氏名(フルネーム)を発音した際の音声の声紋データとを対応付けて予め記憶する。検索部32は、顧客検索部16から出力される顧客IDに対応する声紋データを声紋データベース31から読み出す。声紋照合部33は、検索部32が読み出した声紋データと、顧客検索部16から出力された声紋データとを照合して認証を行う。
【0022】
顧客管理サーバ5における顧客データベース51は、図5に示すように、母音キー情報と顧客IDとを対応付けて記憶する。ここでは、複数の顧客の母音キー情報が同じである場合、1つの母音キー情報に、複数の顧客IDが対応付けられて記憶される。
【0023】
次に、図2の構成における対話型音声応答システムの動作について図6のフローチャートを用いて説明する。電話機を介して発信者から発信されると、対話型音声応答装置1は着呼し(ステップS101)、音声ガイダンス対話部12が「いらっしゃいませ。お客様のお名前をフルネームでお話下さい。」という音声ガイダンスを発信者の電話機に送出する(ステップS102)。そして、発信者から氏名が発話されると(ステップS103)、発話された氏名に基づいて声紋照合を行い、照合が成立すると、音声ガイダンス対話部12は、「西津さまですね。いつもご利用ありがとうございます。」という認証が成立されたこと通知する音声ガイダンスを送出する。
【0024】
次に、図6のステップS103からステップS105までの処理について、図7のフローチャートを用いてさらに説明する。発信者から発話された氏名を音声ガイダンス対話部12によって受信すると、音声ファイル生成部13は、音声ファイルを生成し、テキストデータ生成部22に出力する。一方、声紋データ生成部14は、音声ファイル生成部13によって生成された音声ファイルから声紋データを生成する。テキストデータ生成部22は、音声ファイルが生成されると、音声ファイルの音声認識を実施し、辞書データベース21を参照して音声ファイルからテキストデータを生成する(ステップS2)。ここでは、テキストデータとして「にしづさとる」が生成される。そして、生成されたテキストデータが音声認識結果として、テキストデータ生成部22から対話型音声応答装置1の母音抽出部15に出力される(ステップS3)。
【0025】
母音抽出部15は、テキストデータ生成部22から出力されたテキストデータ生成部22から母音キー情報を抽出し(ステップS4)、抽出された母音キー情報を顧客検索部16に出力する。ここで抽出される母音キー情報は、「IIU AOU」である。顧客検索部16は、母音抽出部15から出力された母音キー情報に対応する顧客IDを検索する(ステップS5)。ここでは、「石津 悟」と「西津 悟」との顧客の顧客IDが顧客データベース51に記憶されているので、顧客IDとして「A100」と「A110」とが検出される。そして、該当する顧客IDが対話型音声応答装置1に出力されると(ステップS6)、顧客検索部16は、検索された顧客IDと声紋データ生成部13によって生成された声紋データを声紋照合部33に出力する。声紋照合部33は、顧客IDに対応する声紋データを検索部32によって、声紋データベース31から読み出し、読み出した声紋データと、顧客検索部16から出力された声紋データとを照合を行い(ステップS7)、声紋データの一致の度合いに応じて、照合スコアを生成する(ステップS8)。そして、声紋照合部33は、顧客検索部16から複数の顧客IDが出力された場合、ステップS7とステップS8とを実行し、各顧客IDに対応する声紋データ毎に照合スコアを生成する(ステップS9)。ここでは、顧客IDが「A100」と「A110」とが顧客検索部16から出力されているので、それぞれについて照合スコアを生成し、図8に示すような照合スコアのテーブルを作成する。ここでいう照合スコアとは、生成された声紋データが予め登録されている声紋データにどれほど似ているかを示す値であり、例えば、0から100までの範囲の数値によって表現され、100の場合に完全一致していることを示す。
【0026】
照合スコアのテーブルが作成されると、声紋照合部33は、予め設定された基準照合スコア以上であって、最も高い照合スコアの顧客(照合スコアが「98」の顧客ID「A110」の顧客「西津 悟」)であると判定し、認証を成立させ(ステップS10)、音声ガイダンス対話部12に認証成立を指示する。音声ガイダンス対話部12は、認証成立が指示されると、認証が成立されたこと通知する音声ガイダンスを送出する(ステップS11)。
【0027】
一方、照合スコアが全て基準照合スコアに達していない場合、声紋照合部33は、再録音の指示を音声ガイダンス対話部12に出力する。音声ガイダンス対話部12は、再録音の指示に基づいて、「認証できませんでした。もうはっきりとお客様のお名前をフルネームでお話下さい。」という音声ガイダンスを電話機に送出する。そして、発信者が再度氏名を発声した場合に、ステップS1の処理から繰り返して行う。
【0028】
以上説明した実施形態によれば、照合スコアが基準照合スコア以下である場合、発信者に再度氏名を発声してもらうようにしたので、発信者が氏名の言い方を変えたり、アクセント、話す速度を変えたりして発声してもらうことが可能であるので、音声からテキストデータを生成する認識率を向上させ、照合率を向上させることができる。
また、バイオメトリクス承認のように特別な装置が不要であり、音声を検出することにより実現することが可能である。
【0029】
また、上述した音声認証システムを用いて認証を行い、通信販売、株取引、バンキングなどのサービスの提供を行うことができる。また、従来のパスワードを発声する場合では、セキュリティレベルの関係から、取扱商品が低額なものが主流であったが、従来に比べてセキュリティを向上させることができるので、なりすまし等を防止することができ、これにより、販売商品を低額の商品だけでなく、高額の商品を取り扱うことも可能である。
また、上述した音声認証システムをネットワーク側に設置しているので、声紋認証をASPサービスにて提供する個ことが可能である。
【0030】
なお、上述した実施形態において、対話型音声応答装置1と音声認識サーバ2と声紋認証サーバ3と顧客管理サーバ5とが別々の装置である場合について説明したが、各部を1つの装置内に設けるようにしてもよい。また、上述した実施形態において、声紋データベース31に記憶される声紋データは、認証対象の顧客の氏名のフルネームであったが、声紋データは、必ずしも氏名のフルネームに限られるものではなく、暗証番号や合い言葉など、氏名以外の文字や数字が組み合わされたキーワードであってもよい。
【0031】
また、上述した実施形態において、声紋データベース31には、顧客IDと声紋データとを対応付けて記憶する場合について説明したが、母音データと声紋データとを対応付けて記憶しておき、顧客データベース51には、母音データのみ記憶しておく。そして、母音キー情報が顧客データベース51に記憶されているか否かを顧客検索部16によって検出し、母音キー情報が顧客データベース51に記憶されている場合に、この母音キー情報に対応する声紋データを声紋照合部33が照合するようにしてもよい。また、上述した実施形態において、発信者が発話する端末として、電話機である場合について説明したが、認証対象のユーザの音声を検出できるものであれば、電話機に限られることなく、例えば、インターホン等であってもよい。これにより、建物の入り口や、金庫などの施錠が必要となる箇所を鍵ではなく、音声によって施錠・解錠を行うことができる。
【0032】
また、上述した実施形態においては、声紋データベース31に記憶された声紋データは、認証する対象となるユーザの氏名が該ユーザによって発音された場合における声紋の声紋データを利用するようにした。これにより、従来技術においては、ユーザがパスワードを忘れてしまった場合、パスワードの再登録作業が必要となり、認証処理のサービス提供業者側にとって業務内容が増大してしまうという問題点が生じてしまうが、上述した実施形態においては、暗証番号などのパスワードを利用する場合に比べて発話者が忘れてしまうことを防止でき、また、慣れ親しんだ自分の氏名を利用できるので、利便性を向上させることができる。また、ユーザがパスワードを忘れてしまうことを防止できるので、認証処理のサービス提供業者側にとって、パスワード忘れによるパスワード変更にかかる業務内容の増大を防止することができる。
【0033】
また、図2における音声ガイダンス対話部12、音声ファイル生成部13、声紋データ生成部14、母音抽出部15、顧客検索部16、テキストデータ生成部22、検索部32、声紋照合部33の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより音声認証処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
【0034】
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0035】
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【0036】
【発明の効果】
以上説明したように、この発明によれば、音声から声紋データとテキストデータとを生成し、生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、検索した検索結果に基づいて、テキストデータに一致する文字データに対応付けられている声紋データと、生成された声紋データとを照合して認証を行うようにしたので、声紋データが予め登録されているユーザの中から該当するユーザの候補を抽出することにより照合する可能性があるユーザを絞り込み、その候補の中から声紋データによって照合させることができ、これにより、予め記憶された全ての声紋データと生成された声紋データとを比較する場合に比べて、照合にかかる時間を短縮させることができる。
【0037】
また、これにより、キーワードが他人に聞き取られても、本人以外に認証されてしまう可能性を低減させることができ、これにより、セキュリティを向上させることができる効果が得られる。
【0038】
また、本発明によれば、生成されたテキストデータに含まれる母音を抽出し、抽出された母音に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、検索した検索結果に基づいて、母音キー情報に一致する母音データに対応付けられている声紋データと、生成された声紋データとを照合するようにしたので、キーワードとなる文字列をすべて検索に利用する場合に比べて、母音のみを用いるようにしたので、キーワードが一致しているか否かの照合にかかる時間を短縮させることができるとともに、暗証番号以外のキーワードをパスワードとして用いる場合においても、音声を誤認識してしまうことを低減させることができる。
【図面の簡単な説明】
【図1】この発明の一実施形態による音声認証システムの構成を示す概略構成図である。
【図2】音声認証システムの構成を示す概略ブロック図である。
【図3】氏名と母音キー情報との関係の一例を説明するための図面である。
【図4】声紋データベース31に記憶される情報の一例を示す図面である。
【図5】顧客データベース51に記憶される情報の一例を示す図面である。
【図6】図2の構成における対話型音声応答システムの動作について説明するためのフローチャートである。
【図7】対話型音声応答システムの動作について説明するためのフローチャートである。
【図8】照合スコアのテーブルの一例を示す図面である。
【符号の説明】
1 対話型音声応答装置 2 音声認識サーバ
3 声紋認証サーバ 5 顧客管理サーバ
11 ガイダンスデータベース 12 音声ガイダンス対話部
13 音声ファイル生成部 14 声紋データ生成部
15 母音抽出部 16 顧客検索部
22 テキストデータ生成部 32 検索部
33 声紋照合部 51 顧客データベース
Claims (8)
- 発音された音声によって認証を行う母音検索を利用した声紋認証装置であって、
前記音声から声紋データを生成する声紋データ生成部と、
前記音声からテキストデータを生成するテキストデータ生成部と、
キーワードと声紋データとを対応付けて予め記憶する声紋データベースと、
前記テキストデータ生成部が生成したテキストデータに一致するキーワードを前記声紋データベースから検索する検索部と、
前記検索部の検索結果に基づいて、前記テキストデータに一致するキーワードに対応付けられている声紋データと、前記声紋データ生成部が生成した声紋データとを照合して認証を行う声紋照合部と、
を有することを特徴とする母音検索を利用した声紋認証装置。 - 発音された音声によって認証を行う母音検索を利用した声紋認証装置であって、
前記音声から声紋データを生成する声紋データ生成部と、
前記音声からテキストデータを生成するテキストデータ生成部と、
前記テキストデータ生成部が生成したテキストデータに含まれる母音を抽出して母音キー情報を生成する母音抽出部と、
母音データと声紋データとを対応付けて予め記憶する声紋データベースと、
前記母音抽出部が生成した母音キー情報に一致する母音データを前記声紋データベースから検索する検索部と、
前記検索部の検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記声紋データ生成部が生成した声紋データとを照合して認証を行う声紋照合部と、
を有することを特徴とする母音検索を利用した声紋認証装置。 - 発音された音声によって認証を行う音声認証方法であって、
前記音声から声紋データを生成し、
前記音声からテキストデータを生成し、
前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、
前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行う
ことを特徴とする音声認証方法。 - 発音された音声によって認証を行う音声認証方法であって、
前記音声から声紋データを生成し、
前記音声からテキストデータを生成し、
前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成し、
前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索し、
前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行う、
ことを特徴とする音声認証方法。 - 発音された音声によって認証を行う音声認証プログラムであって、
前記音声から声紋データを生成するステップと、
前記音声からテキストデータを生成するステップと、
前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、
前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、
をコンピュータに実行させる音声認証プログラム。 - 発音された音声によって認証を行う音声認証プログラムであって、
前記音声から声紋データを生成するステップと、
前記音声からテキストデータを生成するステップと、
前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成するステップと、
前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、
前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、
をコンピュータに実行させる音声認証プログラム。 - 発音された音声によって認証を行う音声認証プログラムを記憶したコンピュータ読み取り可能な記録媒体であって、
前記音声から声紋データを生成するステップと、
前記音声からテキストデータを生成するステップと、
前記生成したテキストデータに一致する文字データを、文字データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、
前記検索した検索結果に基づいて、前記テキストデータに一致する文字データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、
をコンピュータに実行させる音声認証プログラムを記憶した記録媒体。 - 発音された音声によって認証を行う音声認証プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記音声から声紋データを生成するステップと、
前記音声からテキストデータを生成するステップと、
前記生成されたテキストデータに含まれる母音を抽出して母音キー情報を生成するステップと、
前記生成された母音キー情報に一致する母音データを、母音データと声紋データとが対応付けられて予め記憶された声紋データベースから検索するステップと、
前記検索した検索結果に基づいて、前記母音キー情報に一致する母音データに対応付けられている声紋データと、前記生成された声紋データとを照合して認証を行うステップと、
をコンピュータに実行させる音声認証プログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002258798A JP2004094158A (ja) | 2002-09-04 | 2002-09-04 | 母音検索を利用した声紋認証装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002258798A JP2004094158A (ja) | 2002-09-04 | 2002-09-04 | 母音検索を利用した声紋認証装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004094158A true JP2004094158A (ja) | 2004-03-25 |
Family
ID=32063334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002258798A Pending JP2004094158A (ja) | 2002-09-04 | 2002-09-04 | 母音検索を利用した声紋認証装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004094158A (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007201658A (ja) * | 2006-01-25 | 2007-08-09 | Megachips System Solutions Inc | インターホンシステム |
US20150095028A1 (en) * | 2013-09-30 | 2015-04-02 | Bank Of America Corporation | Customer Identification Through Voice Biometrics |
CN105244031A (zh) * | 2015-10-26 | 2016-01-13 | 北京锐安科技有限公司 | 说话人识别方法和装置 |
CN107704569A (zh) * | 2017-09-29 | 2018-02-16 | 努比亚技术有限公司 | 一种语音查询方法、终端及计算机可读存储介质 |
WO2018149209A1 (zh) * | 2017-02-15 | 2018-08-23 | 腾讯科技(深圳)有限公司 | 语音识别方法、电子设备以及计算机存储介质 |
JP2018180260A (ja) * | 2017-04-12 | 2018-11-15 | トヨタ自動車株式会社 | 音声認識装置 |
JP2019071061A (ja) * | 2018-10-18 | 2019-05-09 | マクセル株式会社 | 映像表示装置 |
US10489568B2 (en) | 2014-11-20 | 2019-11-26 | Huawei Technologies Co., Ltd. | Apparatus and methods for improving terminal security |
JP2020154061A (ja) * | 2019-03-19 | 2020-09-24 | 株式会社フュートレック | 話者識別装置、話者識別方法およびプログラム |
US11227356B2 (en) | 2012-11-30 | 2022-01-18 | Maxell, Ltd. | Picture display device, and setting modification method and setting modification program therefor |
WO2022025428A1 (ko) * | 2020-07-27 | 2022-02-03 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
WO2024077588A1 (en) * | 2022-10-14 | 2024-04-18 | Qualcomm Incorporated | Voice-based user authentication |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10154159A (ja) * | 1996-09-30 | 1998-06-09 | Fujitsu Ltd | 名称検索装置及びプログラム記憶媒体 |
JP2001265385A (ja) * | 2000-03-15 | 2001-09-28 | Omron Corp | 話者認識装置 |
JP2001274907A (ja) * | 2000-03-24 | 2001-10-05 | Nec Shizuoka Ltd | 発信者認識システムおよび発信者認識方法 |
-
2002
- 2002-09-04 JP JP2002258798A patent/JP2004094158A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10154159A (ja) * | 1996-09-30 | 1998-06-09 | Fujitsu Ltd | 名称検索装置及びプログラム記憶媒体 |
JP2001265385A (ja) * | 2000-03-15 | 2001-09-28 | Omron Corp | 話者認識装置 |
JP2001274907A (ja) * | 2000-03-24 | 2001-10-05 | Nec Shizuoka Ltd | 発信者認識システムおよび発信者認識方法 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007201658A (ja) * | 2006-01-25 | 2007-08-09 | Megachips System Solutions Inc | インターホンシステム |
US11823304B2 (en) | 2012-11-30 | 2023-11-21 | Maxell, Ltd. | Picture display device, and setting modification method and setting modification program therefor |
US11227356B2 (en) | 2012-11-30 | 2022-01-18 | Maxell, Ltd. | Picture display device, and setting modification method and setting modification program therefor |
US9607621B2 (en) | 2013-09-30 | 2017-03-28 | Bank Of America Corporation | Customer identification through voice biometrics |
US9396730B2 (en) * | 2013-09-30 | 2016-07-19 | Bank Of America Corporation | Customer identification through voice biometrics |
US20150095028A1 (en) * | 2013-09-30 | 2015-04-02 | Bank Of America Corporation | Customer Identification Through Voice Biometrics |
US10489568B2 (en) | 2014-11-20 | 2019-11-26 | Huawei Technologies Co., Ltd. | Apparatus and methods for improving terminal security |
CN105244031A (zh) * | 2015-10-26 | 2016-01-13 | 北京锐安科技有限公司 | 说话人识别方法和装置 |
US11562736B2 (en) | 2017-02-15 | 2023-01-24 | Tencent Technology (Shen Zhen) Company Limited | Speech recognition method, electronic device, and computer storage medium |
WO2018149209A1 (zh) * | 2017-02-15 | 2018-08-23 | 腾讯科技(深圳)有限公司 | 语音识别方法、电子设备以及计算机存储介质 |
US11043211B2 (en) | 2017-02-15 | 2021-06-22 | Tencent Technology (Shenzhen) Company Limited | Speech recognition method, electronic device, and computer storage medium |
JP2018180260A (ja) * | 2017-04-12 | 2018-11-15 | トヨタ自動車株式会社 | 音声認識装置 |
CN107704569A (zh) * | 2017-09-29 | 2018-02-16 | 努比亚技术有限公司 | 一种语音查询方法、终端及计算机可读存储介质 |
JP2019071061A (ja) * | 2018-10-18 | 2019-05-09 | マクセル株式会社 | 映像表示装置 |
JP2020154061A (ja) * | 2019-03-19 | 2020-09-24 | 株式会社フュートレック | 話者識別装置、話者識別方法およびプログラム |
WO2022025428A1 (ko) * | 2020-07-27 | 2022-02-03 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US11984122B2 (en) | 2020-07-27 | 2024-05-14 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
WO2024077588A1 (en) * | 2022-10-14 | 2024-04-18 | Qualcomm Incorporated | Voice-based user authentication |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9524719B2 (en) | Bio-phonetic multi-phrase speaker identity verification | |
US6119084A (en) | Adaptive speaker verification apparatus and method including alternative access control | |
US7386448B1 (en) | Biometric voice authentication | |
US7447632B2 (en) | Voice authentication system | |
JP4463526B2 (ja) | 声紋認証システム | |
Naik | Speaker verification: A tutorial | |
US6073101A (en) | Text independent speaker recognition for transparent command ambiguity resolution and continuous access control | |
EP0983587B1 (en) | Speaker verification method using multiple class groups | |
US20060293898A1 (en) | Speech recognition system for secure information | |
WO2006087799A1 (ja) | 音声認証システム | |
JPH09230887A (ja) | 発声音に関する話者の検証を行うためのシステム及び方法 | |
JP2003219038A (ja) | 顧客情報と連携させたコールセンタシステム装置及び顧客情報と連携させたコール方法 | |
JPH1173195A (ja) | 話者の申し出識別を認証する方法 | |
JP2004094158A (ja) | 母音検索を利用した声紋認証装置 | |
JP7339116B2 (ja) | 音声認証装置、音声認証システム、および音声認証方法 | |
US11416593B2 (en) | Electronic device, control method for electronic device, and control program for electronic device | |
JPH10173644A (ja) | 本人認証方法 | |
KR102604319B1 (ko) | 화자 인증 시스템 및 그 방법 | |
JP4245948B2 (ja) | 音声認証装置、音声認証方法及び音声認証プログラム | |
JPH1173196A (ja) | 話者の申し出識別を認証する方法 | |
WO1998054695A1 (en) | Method of accessing a dial-up service | |
JP2003302999A (ja) | 音声による個人認証システム | |
WO2000058947A1 (en) | User authentication for consumer electronics | |
KR100373989B1 (ko) | 음절 인식을 이용한 사용자 인증 방법 및 사용자 인증시스템 | |
JP2002221990A (ja) | 個人認証装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20041019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041227 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050607 |