JP2009146263A - 本人認証システム - Google Patents

本人認証システム Download PDF

Info

Publication number
JP2009146263A
JP2009146263A JP2007324513A JP2007324513A JP2009146263A JP 2009146263 A JP2009146263 A JP 2009146263A JP 2007324513 A JP2007324513 A JP 2007324513A JP 2007324513 A JP2007324513 A JP 2007324513A JP 2009146263 A JP2009146263 A JP 2009146263A
Authority
JP
Japan
Prior art keywords
speaker
user
speaker model
model
speaker recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007324513A
Other languages
English (en)
Inventor
Ario Sawada
有生 澤田
Kazuhiro Watada
和浩 綿田
Kota Yasunaga
宏太 安永
Hiroyuki Sakate
弘幸 坂手
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2007324513A priority Critical patent/JP2009146263A/ja
Priority to PCT/JP2008/002424 priority patent/WO2009078113A1/ja
Publication of JP2009146263A publication Critical patent/JP2009146263A/ja
Priority to US12/776,022 priority patent/US20100217594A1/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/30Individual registration on entry or exit not involving the use of a pass
    • G07C9/32Individual registration on entry or exit not involving the use of a pass in combination with an identity check
    • G07C9/37Individual registration on entry or exit not involving the use of a pass in combination with an identity check using biometric data, e.g. fingerprints, iris scans or voice recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2115Third party
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2117User registration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/41Electronic components, circuits, software, systems or apparatus used in telephone systems using speaker recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/38Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections
    • H04M3/382Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords
    • H04M3/385Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords using speech signals

Abstract

【課題】事業者が話者認識によりユーザの本人認証を行うシステムにおいて、取引先の事業者ごとにユーザが都度発話による話者モデルの登録を行う必要のないシステムを提供する。
【解決手段】ユーザ側装置20は音声入力手段24、話者モデル作成手段21、記憶手段22、話者モデルを転送する通信手段23を備え、事業者側の管理装置40は話者モデルの取得手段41、記憶手段42、通信手段43を備え、事業者側の話者認識装置50は話者モデルの取得手段51、話者モデル登録手段52、特徴取得手段53、話者認識手段54を備え、ユーザはユーザ側装置20を用いて話者認識に用いる話者モデルを作成して保持し、事業者はユーザを取引先として登録する際に、管理装置40を用いて取引に必要な個人情報とともに話者モデルをユーザから取得し、話者認識装置50において話者モデルを登録する。
【選択図】図1

Description

本発明は、話者認識を用いてユーザの本人認証を行うシステムに関する。
インターネット上での商品購入時などにおいては、取引におけるセキュリティを確保するために本人認証が行われている。例えば、インターネットを利用した通信販売(インターネット・ショッピング)では、発注内容の入力に加えて、ユーザの本人認証に必要なIDおよび暗証番号などを入力してもらっている。
しかしながら、IDおよび暗証番号の入力は正確に行わなければならず、ユーザに煩雑な操作を強いることがあった。また、ユーザの自己責任において、これらが他者に知られないように厳重に注意する必要があった。そこで、IDおよび暗証番号の入力など本人認証に必要な操作をユーザに行わせることなく、商品等の発注受付を行うことが可能な本人認証方法が提案されている(例えば、特許文献1参照)。
特許文献1に開示された発注受付方法は、初回の個人データ登録時に発話を行うことにより、ユーザの音声から抽出された特徴情報を話者モデルとして登録しておき、次回以降は、注文受付時の音声から抽出される特徴情報をすでに登録されている話者モデルと比較して話者を特定すること(話者認識)により、IDおよび暗証番号などの本人認証に必要な情報を入力する手間を省くものである。
上記技術によれば、話者認識技術を用いて本人認証を行うことにより、本人認証の際に、厳重な管理が必要なIDおよび暗証番号などを用いる必要がなくなる。
特開2002-279245号公報
しかしながら、上述した話者認識を用いた従来の本人認証方法は、通信販売などを行う事業者の取引管理システムにおいて、あらかじめユーザの話者モデルを作成するためにユーザからの複数回の発話が必要であり、ユーザが取引をしたい事業者を増やすと、その都度発話による話者モデルの登録が必要であった。
また、セキュリティ面については、商品購入時の本人認証のみが着目されており、商品配達時のセキュリティについてはあまり考慮がなされていなかった。
本発明は、以上のような実情に鑑みてなされたもので、話者認識を用いた本人認証システムにおいて、取引先となる事業者ごとにユーザが都度発話による話者モデルの登録を行う必要のないシステムを提供することを目的とする。また、商品の購入時に加え、商品配達時のセキュリティを向上させるシステムを提供することも目的とする。
本発明の本人認証システムは、ユーザの音声入力に基づいて話者モデルを作成するユーザ側装置と、前記ユーザ側装置から送信されたユーザの話者モデルを取得する事業者側管理装置と、前記事業者側管理装置から送信された話者モデルを登録しておき、登録されている話者モデルとユーザが入力した音声から抽出される特徴情報との比較に基づいて話者認識を行うことにより本人認証を行う話者認識装置と、を備える。
上記構成によれば、ユーザは話者認識に使用する話者モデルを手元に一つ用意しておくことで、取引先の事業者が増えるごとに都度発声による音声情報の登録を行う必要がなく、かつ精度の高い話者モデルを作成しておくことで、本人認証時の誤りを減らすことが可能となる。また、音声情報が登録時の周囲の雑音環境に依存することが無く、登録される話者モデルの高い精度が維持されるため、本人認証の精度を高めることができる。また、上記構成によれば、商品配達時の本人認証に話者認識技術を用いることが可能となるため、商品配達時のセキュリティ性の向上に繋げることが可能となる。
また、本発明のユーザ側装置は、本発明の本人認証システムに含まれるユーザ側装置であって、ユーザが発する音声の入力手段と、前記入力手段で入力された音声情報に基づき、話者認識に用いる話者モデルを作成する話者モデル作成手段と、前記話者モデル作成手段が作成した話者モデルを記憶する記憶手段と、前記記憶手段が記憶する話者モデルを前記事業者側管理装置へ送信する通信手段と、を有する。
また、本発明のユーザ側装置は、前記入力手段で入力された音声に対し、特徴抽出を行う特徴抽出手段を有し、前記通信手段が、前記特徴抽出手段による抽出結果を前記事業者側管理装置へ送信するものである。
上記構成によれば、認証時にユーザ側装置から音声を入力する際に、入力された音声を話者認識装置へ直接送る場合に比べ、通信による音声の品質低下を防ぎ、認証時の誤りを減らすことが可能となる。
また、本発明の事業者側管理装置は、本発明の本人認証システムに含まれる事業者側管理装置であって、前記ユーザ側装置から送信された話者モデルを取得する取得手段と、前記取得手段で取得した話者モデルを記憶する記憶手段と、前記記憶手段が記憶する話者モデルを前記話者認識装置へ送信する通信手段と、を有する。
また、本発明の事業者側管理装置は、予め設定された条件に従って、前記記憶手段が記憶する話者モデルを前記話者認識装置へ送信するよう制御する制御手段を有し、前記通信手段が、前記制御手段の指示に応じて前記話者モデルを送信するものである。
上記構成によれば、配達者が携行する携帯端末装置に話者認識装置を搭載しておけば、当該携帯端末装置に対して、事業者側管理装置が、予め設定された条件に従い自動的に話者モデルを転送するため、必要となるタイミングで話者モデルを転送したり、複数の携帯端末装置が用いられる場合に、必要な話者モデルのみを転送したりすることができる。例えば、話者モデルを配達日の前日に話者認識装置へ送付するというような制御が可能となり、取引先側が都度話者モデルを送付する手間が省ける。
また、本発明の話者認識装置は、本人認証システムに含まれる話者認識装置であって、前記事業者側管理装置から送信された話者モデルを取得する話者モデル取得手段と、前記取得手段で取得した話者モデルを登録する登録手段と、ユーザが発する音声に対する特徴抽出結果を取得する特徴取得手段と、前記登録手段で登録された話者モデルと前記特徴取得手段で取得した特徴抽出結果との比較に基づいて話者認識を行うことにより本人認証を行う話者認識手段と、を有する。
また、本発明の話者認識装置は、ユーザが発する音声の入力手段と、前記入力手段で入力された音声に対して特徴抽出を行う特徴抽出手段と、を有し、前記話者認識手段が、前記登録手段で登録された話者モデルと前記特徴抽出手段による特徴抽出結果との比較に基づいて話者認識を行うものである。
また、本発明の集積回路は、本発明の本人認証システムに含まれるユーザ側装置に搭載される集積回路であって、ユーザが発する音声の入力手段と、前記入力手段で入力された音声情報に基づき、話者認識に用いる話者モデルを作成する話者モデル作成手段と、前記話者モデル作成手段が作成した話者モデルを記憶する記憶手段と、前記記憶手段が記憶する話者モデルを前記事業者側管理装置へ送信する通信手段と、を有する。
また、本発明の集積回路は、本発明の本人認証システムに含まれる事業者側管理装置に搭載される集積回路であって、前記ユーザ側装置から送信された話者モデルを取得する取得手段と、前記取得手段で取得した話者モデルを記憶する記憶手段と、前記記憶手段が記憶する話者モデルを前記話者認識装置へ送信する通信手段と、を有する。
また、本発明の集積回路は、本発明の本人認証システムに含まれる話者認識装置に搭載される集積回路であって、前記事業者側管理装置から送信された話者モデルを取得する話者モデル取得手段と、前記取得手段で取得した話者モデルを登録する登録手段と、ユーザが発する音声に対する特徴抽出結果を取得する特徴取得手段と、前記登録手段で登録された話者モデルと前記特徴取得手段で取得した特徴抽出結果との比較に基づいて話者認識を行うことにより本人認証を行う話者認識手段と、を有する。
さらに、本発明の本人認証方法は、ユーザの音声入力に基づいて話者モデルを作成するユーザ側装置と、前記ユーザ側装置から送信されたユーザの話者モデルを取得する事業者側管理装置と、前記事業者側管理装置から送信された話者モデルを登録しておき、登録されている話者モデルとユーザが発する音声に対する特徴抽出結果との比較に基づいて話者認識を行う話者認識装置と、を備える本人認証システムにおける本人認証方法であって、前記ユーザ側装置が、ユーザの音声入力を受け付け、前記音声入力に基づいて話者モデルを作成し、作成した話者モデルを事業者側装置へ送信し、前記事業者側装置が、前記ユーザ側装置から送信された話者モデルを取得し、取得した話者モデルを前記話者認識装置へ送信し、前記話者認識装置が、前記事業者側装置から送信された話者モデルを取得し、取得した話者モデルを登録し、ユーザが発する音声に対する特徴抽出結果を取得し、登録されている話者モデルと取得した特徴抽出結果との比較に基づいて話者認識を行い、認識結果に基づいて本人認証を行うものである。
本発明によれば、ユーザは話者認識に使用する話者モデルを手元に一つ用意しておくことで、取引先の事業者が増えるごとに都度発声による音声情報の登録を行う必要がなくなり、かつ精度の高い話者モデルを作成しておくことで、本人認証時の誤りを減らすことが可能となる。
また、商品配達時に話者認識によりユーザの本人認証を行うことができるため、従来あまり考慮がされていなかった商品配達時のセキュリティを向上させることができる。
以下、本発明の実施の形態を添付の図面を用いて詳しく説明する。これらの実施の形態は本発明の一態様を示すものであり、本発明の技術的思想の範囲で任意に変更可能である。
図1は本発明の一実施の形態に係る本人認証システムの構成を示す図である。図1において、本人認証システム1はユーザ側装置20、事業者側の管理装置40および話者認識装置50で構成され、話者モデル3が装置間で転送される。
ユーザ側装置20は、パーソナルコンピュータなどを用いて構成され、ユーザが発する音声を入力するための音声入力手段24、入力された音声情報から話者認識用の話者モデルを作成する話者モデル作成手段21、作成された話者モデルを記憶しておく記憶手段22、記憶された話者モデルを事業者側へ送信する通信手段23を備えている。
ここで、話者モデルは、入力された音声から抽出された特徴情報により音声的個人情報として転送可能な所定の形式で作成されるものである。話者モデルは、取引を行う事業者に対してユーザとして個人情報の登録を行う際に、本人認証のための話者認識に用いられる話者モデル3として事業者側の管理装置40に転送される。
事業者側の管理装置40は、サーバ用コンピュータやパーソナルコンピュータなどを用いて構成される一般的なコンピュータシステムであり、ユーザ側装置20から送信された話者モデル3を取得する取得手段41、取得した話者モデル3を記憶しておく記憶手段42、記憶した話者モデル3を話者認識装置50に送信する通信手段43を備えている。
事業者側の話者認識装置50は、サーバ用コンピュータやパーソナルコンピュータなどを用いて構成することができ、管理装置40から送信された話者モデル3を取得する取得手段51、取得した話者モデル3を登録する話者モデル登録手段52、ユーザが発する音声に対する特徴抽出結果を取得する特徴取得手段53、特徴取得手段53で取得した特徴抽出結果を登録されている話者モデルと比較して話者認識を行う話者認識手段54を備えている。
また、図1に示す本人認証システムにおいては、取引情報の音声入力を行うことが望ましい。その場合は図示しない不特定話者を対象とする音声認識装置を備えた構成になる。取引情報の入力に音声認識を用いることは、特許文献1に示されるように一般に知られた技術である。
ここで、事業者側のシステムが管理装置40および話者認識装置50や音声認識装置で構成される例を説明したが、話者認識装置50の機能や音声認識装置の機能が管理装置40に内蔵される構成であってもよい。また、不特定話者を対象とする音声認識装置には、一般に高性能のサーバ用コンピュータなどが使用され、音声入力などの共通部分も多いので、話者認識装置の機能を音声認識装置用のコンピュータ上に実現してもよい。
図2は本実施の形態のユーザ側装置20、事業者側の管理装置40および話者認識装置50のそれぞれにおける本人認証の処理方法を説明するフローチャートである。
ユーザ側装置20では、まず、音声入力ステップS1で、音声入力手段24によりユーザが発する音声の入力を行う。次に話者モデル作成ステップS2で、話者モデル作成手段21が、入力された音声から抽出される特徴情報により話者認識用の話者モデル3を作成する。次に事業者側のシステムとの交信に応じて、話者モデル転送ステップS3で、作成された話者モデルを取引先事業者のシステムに転送する。
事業者側の管理装置40では、話者モデル取得ステップS11で、転送された話者モデルを取得する。次に話者モデル転送ステップS12で、取得した話者モデルを話者認識装置50へ転送する。話者認識装置50では、話者モデル取得ステップS21で、転送された話者モデルを取得する。次に話者モデル登録ステップS22で、取得した話者モデルを登録する。
その後、電話あるいは他の手段を用いた取引が開始されると、特徴取得ステップS23で、ユーザが発する音声に対する特徴抽出結果を取得する。次に話者認識ステップS24で、取得した特徴抽出結果を登録された話者モデルと比較することによりに話者認識を行う。話者認識により、登録された話者モデルの中からユーザが同定されると、その結果を受け、必要ならば他の取得情報の判断も併せて、話者認識装置50は本人認証を行う。
図3は本実施の形態における本人認証システムの運用例を説明する図である。図3において、事業者1の管理装置61と話者認識装置62、事業者2の管理装置63と話者認識装置64は、それぞれ図1の管理装置40および話者認識装置50と同等の機能を備えた装置である。
まず、ユーザはユーザ側装置20において話者モデル3の作成を行い記憶手段に記憶しておく。ユーザは本人認証が必要な取引相手の事業者が増えるごとに、事業者側のシステムとの交信に応じて、話者モデル3を事業者側の管理装置61や事業者側の管理装置63に転送する。事業者側は転送された話者モデル3を話者認識装置62や話者認識装置64に転送し、話者モデル3の登録を行う。
取引に際しては、ユーザが発する音声が話者認識装置62あるいは話者認識装置64に伝えられると、話者認識装置62あるいは話者認識装置64では音声から抽出される特徴情報を登録された話者モデルと比較することにより話者認識を行う。
本運用方法によれば、ユーザは話者認識に使用する話者モデルを手元に一つ用意しておくことで、取引先の事業者が増えるごとに都度発声による音声情報の登録を行う必要がなく、かつ精度の高い話者モデルを作成しておくことで、本人認証時の誤りを減らすことが可能となる。
また、都度発話による登録を行う場合は、音声情報が登録時の周囲の雑音環境に依存するため、精度が悪い話者モデルが登録される恐れがあるが、本発明によれば、精度の良い話者モデルを作成しておき、そのモデルを事業者側へ転送するので、本人認証の精度を高めることができる。
また、ユーザ側装置の通信手段は音声を通信するように構成することも可能である。ユーザ側装置から音声を通信可能にすることにより、話者モデルを事業者側へ転送した際にも本人認証を行うことができるようになり、転送した話者モデルが本人のものであることを確認することができ、話者モデルのコピーによるなりすましを防止することができる。このとき、ユーザ側装置は、入力された音声に対して特徴抽出を行っておき、特徴抽出結果のデータを事業者側装置へ送信するようにしてもよい。この場合、事業者側装置は、ユーザ側装置から取得した特徴抽出結果のデータを話者認識装置へ送信し、話者認識装置にて、特徴抽出結果のデータも加味して本人認証を行う。これにより、認証時にユーザ側装置から音声を入力する際に、入力された音声を話者認識装置へ直接送る場合に比べ、通信による音声の品質低下を防ぎ、認証時の誤りを減らすことが可能となる。
また、本実施の形態において、ユーザ側装置20を携帯端末装置上に構成することも可能である。ユーザ側装置20を携帯端末とすることで、携帯端末によるインターネットを利用したサービスにおいても、本発明の本人認証システムが利用可能となる。
図4は本実施の形態において携帯端末装置上にユーザ側装置を構成した例を示す図である。図4においては、ユーザ側装置を携帯端末装置71として構成しており、音声入力手段、話者モデルを作成する手段、話者モデルを記憶しておく手段、記憶した話者モデルを事業者側へ転送する無線通信による通信手段を備えている。
事業者側のシステムは、管理装置72に無線通信による通信手段を備えている点を除けば、図1に示した構成と同じものであるので説明を省略する。話者認識装置は図示を省略している。
ユーザは携帯端末装置71を使用して話者モデル3の作成を行っておく。ユーザは作成した話者モデル3を保持した携帯端末装置71を持ち運び、新たな事業者と取引を開始する際には、事業者側のシステムとの交信に応じて、話者モデル3を事業者のシステムに転送し、事業者側では話者認識装置において無線通信により転送された話者モデル3の登録を行う。
このように、ユーザ側装置を携帯端末装置上に構成することで話者モデルの持ち運びが可能となり、通信手段として無線通信機能を搭載することで、インターネット上での利用に限らず、ユーザが店舗などを訪れた際にも無線通信を使用して携帯端末装置から話者モデルを店舗側へ送ることで、通信費をかけることなく話者モデルの転送が可能となる。
また、本実施の形態において事業者側のシステムで携帯端末装置を活用することもできる。図5は事業者側のシステムにおいて話者認識装置の機能を商品の配達員が携行する携帯端末装置上に構成した例を示す図であり、図1の本人認証システムの構成において話者認識装置50を携帯端末装置80で置き換えた構成となっている。
携帯端末装置80は、話者モデルを登録する話者モデル登録手段、ユーザが発する音声の入力手段、入力された音声から抽出される特徴情報を登録されている話者モデルと比較して話者認識を行う話者認識手段を機能として備えている。
この構成において、話者モデル3がユーザ側装置20で作成され、事業者側のシステムとの交信に応じて、話者モデル3が取引先事業者のシステムに転送され、これが事業者側の管理装置40から無線通信手段により携帯端末装置80へ転送され、携帯端末装置80においてユーザの話者モデルとして登録される。
その後の取引に際しては、ユーザが発する音声が携帯端末装置80へ入力され、その音声から抽出される特徴情報を登録された話者モデルと比較して話者認識を行い、その結果を踏まえて本人認証を行うまでの処理は上述した通りである。
このような構成をとることで、商品配達時に話者認識を用いて本人認証を行うことが可能となり、商品配達時のセキュリティを向上させることができる。
また、事業者側の管理装置40に、設定した条件に従い自動的に話者モデルを携帯端末装置80へ転送するように制御する機能を持たせることも可能である。このような機能により、例えば、管理装置40に記憶しておいた話者モデルを配達日の前日に携帯端末装置80へ転送するというような制御が可能となり、管理装置40が全ての話者モデルを携帯端末装置80へ転送するという手間が省ける。
また、ユーザが自身の話者モデルだけでなく家族の話者モデルも作成しておき、ユーザが事業者に登録を行う際に、家族の話者モデルも一緒に登録するようにすれば、商品配達時に本人だけでなく家族でも商品を受け取ることが可能となる。
なお、図5に示した事業者側のシステムの構成例では話者認識装置50を携帯端末装置80で置き換えた構成としたが、話者認識装置50を置き換えるのではなく、図1の本人認証システムの構成において、さらに上述した機能を備えた携帯端末装置80を追加した構成とすることもできる。
このような構成により、通常は取引に際しての本人認証を話者認識装置50を使用して行い、商品配達時は携帯端末装置80を用いて本人認証を行うという運用を行うことができ、システムの負荷を適切に配分することができるとともに、商品配達時のセキュリティを向上させることができる。
また、上記構成例では話者認識装置の機能を携帯端末装置上に構成したが、携帯端末装置には話者認識機能を持たせず、商品配達時にユーザが発する音声を入力して話者認識装置に転送する役割にとどめることもできる。携帯端末装置は話者認識機能を持たない分だけ安価にすることができる。
図6は、このような本人認証システムの構成例を示す図であり、図1の本人認証システムの構成に対して商品の配達員が携行する携帯端末装置90を追加した構成となっている。携帯端末装置90は音声入力手段と、入力された音声を話者認識装置50へ送信し、本人認証の結果を受信する通信手段とを備えている。
この構成において、話者モデル3がユーザ側装置20で作成され、事業者側のシステムとの交信に応じて、話者モデル3が取引先事業者のシステムに転送され、これが事業者側の管理装置40から話者認識装置50へ転送され、話者認識装置50において話者モデル3が登録される。
その後の取引に際しては、ユーザが発する音声が話者認識装置50へ入力され、その音声から抽出される特徴情報を登録された話者モデルと比較して話者認識を行い、その結果を踏まえて本人認証を行うまでの処理は上述した通りである。
事業者側の配達員は携帯端末装置90を携行し、商品配達時にユーザから携帯端末装置90に対して発話を行ってもらう。携帯端末装置90は通信手段を用いて音声データを話者認識装置50に送り、本人認証の結果を受け取る。このような構成をとることで、商品配達時に話者認識を用いて本人認証を行うことが可能となり、商品配達時のセキュリティを向上させることができる。
さらに、携帯端末装置90に音声の特徴情報抽出を行う手段を持たせる構成にすることも可能である。このような構成をとることで、入力された音声を話者認識装置へ直接送る場合に比べて、通信による音声情報の品質低下を防ぎ、本人認証時の誤りを減らすことが可能となる。
以上、本実施の形態で説明した各装置の機能はLSIに構成することができる。図7は図1に示した各装置の主要な機能をLSI化した構成例を示す図である。ユーザ側装置20では、ユーザが発する音声の入力手段24、話者モデル作成手段21、話者モデルを記憶しておく記憶手段22、話者モデルを事業者側のシステムへ転送する通信手段23を話者モデル作成LSI25に集積している。
管理装置40では、話者モデルを取得する取得手段41、取得した話者モデルを記憶しておく記憶手段42、記憶した話者モデルを話者認識装置へ転送する通信手段43を通信LSI44に集積している。
話者認識装置50では、話者モデルを取得する取得手段51、取得した話者モデルを登録する話者モデル登録手段52、ユーザが発する音声に対する特徴抽出結果を取得する特徴取得手段53、特徴取得手段53で取得した特徴抽出結果を登録されている話者モデルと比較して話者認識を行う話者認識手段54を話者認識LSI55に集積している。
このように、各装置の主要な機能をLSIとして構成することで、システムの小型化、省電力化などを図ることが可能となる。
なお、各機能は図7に示したように、典型的には集積回路であるLSIとして実現される。
これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応化等が可能性としてありえる。
また、無線通信機能などの他の機能ブロックを含んでいてもよく、また、一部を別チップ構成としてもよい。
本発明の本人認証システムはインターネットを介した商取引における本人認証や、商品配達時の本人認証に有用である。また、本発明の本人認証システムの適用対象はこれらに限定されるものではなく、イベントなどへの参加時やホテルの予約時などの本人認証にも同様に適用が可能である。
本発明の一実施の形態に係る本人認証システムの構成を示す図 本発明の一実施の形態における本人認証の処理方法を説明するフローチャート 本発明の一実施の形態における本人認証システムの運用例を説明する図 本発明の本人認証システムにおいて携帯端末装置上にユーザ側装置を構成した例を示す図 本発明の本人認証システムにおいて話者認識装置の機能を商品の配達員が携行する携帯端末装置上に構成した例を示す図 本発明の本人認証システムにおいて商品の配達員が携行する携帯端末装置を加えて構成した例を示す図 本発明の本人認証システムにおける各装置の主要な機能をLSI化した構成例を示す図
符号の説明
1 本人認証システム
3 話者モデル
20 ユーザ側装置
21 ユーザ側装置内の話者モデル作成手段
22 ユーザ側装置内の記憶手段
23 ユーザ側装置内の通信手段
24 ユーザ側装置内の音声入力手段
25 ユーザ側装置の主要な機能を集積したLSI
40 事業者側の管理装置
41 管理装置内の取得手段
42 管理装置内の記憶手段
43 管理装置内の通信手段
44 事業者側の管理装置の主要な機能を集積したLSI
50 話者認識装置
51 話者認識装置内の取得手段
52 話者認識装置内の登録手段
53 話者認識装置内の特徴取得手段
54 話者認識装置内の話者認識手段
55 話者認識装置の主要な機能を集積したLSI
61 事業者1の管理装置
62 事業者1の話者認識装置
63 事業者2の管理装置
64 事業者2の話者認識装置
71 ユーザ側装置を構成した携帯端末装置
72 事業者側の管理装置
80 話者認識装置の機能を備えた事業者側の携帯端末装置
90 話者認識装置の機能を備えていない事業者側の携帯端末装置
S1 音声入力ステップ
S2 話者モデル作成ステップ
S3 話者モデル転送ステップ
S11 話者モデル取得ステップ
S12 話者モデル転送ステップ
S21 話者モデル取得ステップ
S22 話者モデル登録ステップ
S23 特徴取得ステップ
S24 話者認識ステップ

Claims (11)

  1. ユーザの音声入力に基づいて話者モデルを作成するユーザ側装置と、前記ユーザ側装置から送信されたユーザの話者モデルを取得する事業者側管理装置と、前記事業者側管理装置から送信された話者モデルを登録しておき、登録されている話者モデルとユーザが入力した音声から抽出される特徴情報との比較に基づいて話者認識を行うことにより本人認証を行う話者認識装置と、を備える本人認証システム。
  2. 請求項1記載の本人認証システムに含まれるユーザ側装置であって、
    ユーザが発する音声の入力手段と、
    前記入力手段で入力された音声情報に基づき、話者認識に用いる話者モデルを作成する話者モデル作成手段と、
    前記話者モデル作成手段が作成した話者モデルを記憶する記憶手段と、
    前記記憶手段が記憶する話者モデルを前記事業者側管理装置へ送信する通信手段と、
    を有するユーザ側装置。
  3. 請求項2記載のユーザ側装置であって、
    前記入力手段で入力された音声に対し、特徴抽出を行う特徴抽出手段を有し、
    前記通信手段は、前記特徴抽出手段による抽出結果を前記事業者側管理装置へ送信するユーザ側装置。
  4. 請求項1記載の本人認証システムに含まれる事業者側管理装置であって、
    前記ユーザ側装置から送信された話者モデルを取得する取得手段と、
    前記取得手段で取得した話者モデルを記憶する記憶手段と、
    前記記憶手段が記憶する話者モデルを前記話者認識装置へ送信する通信手段と、
    を有する事業者側管理装置。
  5. 請求項4記載の事業者側管理装置であって、
    予め設定された条件に従って、前記記憶手段が記憶する話者モデルを前記話者認識装置へ送信するよう制御する制御手段を有し、
    前記通信手段は、前記制御手段の指示に応じて前記話者モデルを送信する事業者側管理装置。
  6. 請求項1記載の本人認証システムに含まれる話者認識装置であって、
    前記事業者側管理装置から送信された話者モデルを取得する話者モデル取得手段と、
    前記取得手段で取得した話者モデルを登録する登録手段と、
    ユーザが発する音声に対する特徴抽出結果を取得する特徴取得手段と、
    前記登録手段で登録された話者モデルと前記特徴取得手段で取得した特徴抽出結果との比較に基づいて話者認識を行うことにより本人認証を行う話者認識手段と、
    を有する話者認識装置。
  7. 請求項6記載の話者認識装置であって、
    ユーザが発する音声の入力手段と、
    前記入力手段で入力された音声に対して特徴抽出を行う特徴抽出手段と、を有し、
    前記話者認識手段は、前記登録手段で登録された話者モデルと前記特徴抽出手段による特徴抽出結果との比較に基づいて話者認識を行う話者認識装置。
  8. 請求項1記載の本人認証システムに含まれるユーザ側装置に搭載される集積回路であって、
    ユーザが発する音声の入力手段と、
    前記入力手段で入力された音声情報に基づき、話者認識に用いる話者モデルを作成する話者モデル作成手段と、
    前記話者モデル作成手段が作成した話者モデルを記憶する記憶手段と、
    前記記憶手段が記憶する話者モデルを前記事業者側管理装置へ送信する通信手段と、
    を有する集積回路。
  9. 請求項1記載の本人認証システムに含まれる事業者側管理装置に搭載される集積回路であって、
    前記ユーザ側装置から送信された話者モデルを取得する取得手段と、
    前記取得手段で取得した話者モデルを記憶する記憶手段と、
    前記記憶手段が記憶する話者モデルを前記話者認識装置へ送信する通信手段と、
    を有する集積回路。
  10. 請求項1記載の本人認証システムに含まれる話者認識装置に搭載される集積回路であって、
    前記事業者側管理装置から送信された話者モデルを取得する話者モデル取得手段と、
    前記取得手段で取得した話者モデルを登録する登録手段と、
    ユーザが発する音声に対する特徴抽出結果を取得する特徴取得手段と、
    前記登録手段で登録された話者モデルと前記特徴取得手段で取得した特徴抽出結果との比較に基づいて話者認識を行うことにより本人認証を行う話者認識手段と、
    を有する集積回路。
  11. ユーザの音声入力に基づいて話者モデルを作成するユーザ側装置と、前記ユーザ側装置から送信されたユーザの話者モデルを取得する事業者側管理装置と、前記事業者側管理装置から送信された話者モデルを登録しておき、登録されている話者モデルとユーザが発する音声に対する特徴抽出結果との比較に基づいて話者認識を行う話者認識装置と、を備える本人認証システムにおける本人認証方法であって、
    前記ユーザ側装置が、ユーザの音声入力を受け付け、前記音声入力に基づいて話者モデルを作成し、作成した話者モデルを事業者側装置へ送信し、
    前記事業者側装置が、前記ユーザ側装置から送信された話者モデルを取得し、取得した話者モデルを前記話者認識装置へ送信し、
    前記話者認識装置が、前記事業者側装置から送信された話者モデルを取得し、取得した話者モデルを登録し、ユーザが発する音声に対する特徴抽出結果を取得し、登録されている話者モデルと取得した特徴抽出結果との比較に基づいて話者認識を行い、認識結果に基づいて本人認証を行う本人認証方法。
JP2007324513A 2007-12-17 2007-12-17 本人認証システム Withdrawn JP2009146263A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007324513A JP2009146263A (ja) 2007-12-17 2007-12-17 本人認証システム
PCT/JP2008/002424 WO2009078113A1 (ja) 2007-12-17 2008-09-03 本人認証システム
US12/776,022 US20100217594A1 (en) 2007-12-17 2010-05-07 Personal authentication system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007324513A JP2009146263A (ja) 2007-12-17 2007-12-17 本人認証システム

Publications (1)

Publication Number Publication Date
JP2009146263A true JP2009146263A (ja) 2009-07-02

Family

ID=40795237

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007324513A Withdrawn JP2009146263A (ja) 2007-12-17 2007-12-17 本人認証システム

Country Status (3)

Country Link
US (1) US20100217594A1 (ja)
JP (1) JP2009146263A (ja)
WO (1) WO2009078113A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020181016A (ja) * 2019-04-23 2020-11-05 コニカミノルタ株式会社 情報処理システム、情報処理装置、端末装置、およびプログラム
WO2021075820A1 (en) * 2019-10-15 2021-04-22 Samsung Electronics Co., Ltd. Method of generating wakeup model and electronic device therefor

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101749143B1 (ko) * 2011-12-26 2017-06-20 인텔 코포레이션 탑승자 오디오 및 시각적 입력의 차량 기반 결정
US10635800B2 (en) * 2016-06-07 2020-04-28 Vocalzoom Systems Ltd. System, device, and method of voice-based user authentication utilizing a challenge
US10304463B2 (en) * 2016-10-03 2019-05-28 Google Llc Multi-user personalization at a voice interface device
KR20180082033A (ko) * 2017-01-09 2018-07-18 삼성전자주식회사 음성을 인식하는 전자 장치
EP3451330A1 (en) * 2017-08-31 2019-03-06 Thomson Licensing Apparatus and method for residential speaker recognition

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5893057A (en) * 1995-10-24 1999-04-06 Ricoh Company Ltd. Voice-based verification and identification methods and systems
US5953700A (en) * 1997-06-11 1999-09-14 International Business Machines Corporation Portable acoustic interface for remote access to automatic speech/speaker recognition server
US5897616A (en) * 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
US6092192A (en) * 1998-01-16 2000-07-18 International Business Machines Corporation Apparatus and methods for providing repetitive enrollment in a plurality of biometric recognition systems based on an initial enrollment
US6336090B1 (en) * 1998-11-30 2002-01-01 Lucent Technologies Inc. Automatic speech/speaker recognition over digital wireless channels
KR100297833B1 (ko) * 1999-07-07 2001-11-01 윤종용 비고정 연속 숫자음을 이용한 화자 검증 시스템 및 그 방법
DE10150108B4 (de) * 2001-10-11 2004-03-11 Siemens Ag Fortwährende Sprecherauthentifizierung
JP4212825B2 (ja) * 2002-04-19 2009-01-21 株式会社アプコット 個人認証方法とその装置、及び個人認証システム
US7050973B2 (en) * 2002-04-22 2006-05-23 Intel Corporation Speaker recognition using dynamic time warp template spotting
US7379868B2 (en) * 2002-07-18 2008-05-27 Massachusetts Institute Of Technology Method and apparatus for differential compression of speaker models
US20040186724A1 (en) * 2003-03-19 2004-09-23 Philippe Morin Hands-free speaker verification system relying on efficient management of accuracy risk and user convenience
US7299177B2 (en) * 2003-05-30 2007-11-20 American Express Travel Related Services Company, Inc. Speaker recognition in a multi-speaker environment and comparison of several voice prints to many
US20060016869A1 (en) * 2004-07-01 2006-01-26 American Express Travel Related Services Company, Inc. Method and system for auditory emissions recognition biometrics on a smartcard
US7107220B2 (en) * 2004-07-30 2006-09-12 Sbc Knowledge Ventures, L.P. Centralized biometric authentication
JP4672003B2 (ja) * 2005-02-18 2011-04-20 富士通株式会社 音声認証システム
US20060277043A1 (en) * 2005-06-06 2006-12-07 Edward Tomes Voice authentication system and methods therefor
JP4714575B2 (ja) * 2005-12-19 2011-06-29 ヤフー株式会社 商品配送における受取人の本人認証システム及び方法、コンピュータプログラム
US7529669B2 (en) * 2006-06-14 2009-05-05 Nec Laboratories America, Inc. Voice-based multimodal speaker authentication using adaptive training and applications thereof

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020181016A (ja) * 2019-04-23 2020-11-05 コニカミノルタ株式会社 情報処理システム、情報処理装置、端末装置、およびプログラム
WO2021075820A1 (en) * 2019-10-15 2021-04-22 Samsung Electronics Co., Ltd. Method of generating wakeup model and electronic device therefor
US11670294B2 (en) 2019-10-15 2023-06-06 Samsung Electronics Co., Ltd. Method of generating wakeup model and electronic device therefor

Also Published As

Publication number Publication date
US20100217594A1 (en) 2010-08-26
WO2009078113A1 (ja) 2009-06-25

Similar Documents

Publication Publication Date Title
US9892354B2 (en) Suspending and resuming transactions through wireless beacon communications
US11580541B2 (en) Transaction authentication platform
JP2009146263A (ja) 本人認証システム
US20190251567A1 (en) In-store card activation
TWI529638B (zh) 藉由近場通訊技術在行動裝置上安全移轉電子票證的系統及方法
US20150178698A1 (en) Systems and methods for transportation check-in and payment using beacons
US20140090039A1 (en) Secure System Access Using Mobile Biometric Devices
US20170024713A1 (en) Wearable devices and systems for event administration and event related transactions
KR20120133706A (ko) 카드 등록 장치 및 그 방법
JP6660014B2 (ja) パスポート情報利用システム
KR102652762B1 (ko) 페이지를 통해 연동하는 뱅킹앱을 이용한 간편 가입 방법
JP6035048B2 (ja) 与信審査システム及び与信審査方法
US20150248264A1 (en) Using device identification information for payment via a printer
CN111445253A (zh) 用于价值转账的面部识别
KR101127142B1 (ko) 개인화된 정보 운용방법 및 시스템과 이를 위한 무선단말기, 운용장치, 기록매체, 정보 저장매체
KR20170134162A (ko) 결제 시스템, 결제 방법, 그리고 결제 프로그램
WO2018087994A1 (ja) 通信装置、制御方法、および情報処理プログラム
KR20090036616A (ko) 대기고객 순번현황정보 제공 시스템과 순번현황정보 제공을위한 휴대 전자장치
JP2005128899A (ja) 電子商取引システムおよび電子商取引方法
WO2020017659A1 (ja) 本人認証を必要とするサービスの利用を支援するためのユーザ装置、そのユーザ装置において実行されるプログラム、本人認証を必要とするサービスの利用を支援するためのシステム
KR101044640B1 (ko) 무선 애플리케이션(또는 데이터) 운용 시스템
JP2007243782A (ja) Ip通話端末
US20140025468A1 (en) Readable indicia for a rebate request
KR102149550B1 (ko) 엔에프씨를 이용한 실시간 양방향 정보 교환 방법
KR101044638B1 (ko) 무선 애플리케이션(또는 데이터) 운용 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100514

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20110623