JP2006017936A - 通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体 - Google Patents

通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2006017936A
JP2006017936A JP2004194533A JP2004194533A JP2006017936A JP 2006017936 A JP2006017936 A JP 2006017936A JP 2004194533 A JP2004194533 A JP 2004194533A JP 2004194533 A JP2004194533 A JP 2004194533A JP 2006017936 A JP2006017936 A JP 2006017936A
Authority
JP
Japan
Prior art keywords
voice
authentication
unit
information
identification information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004194533A
Other languages
English (en)
Inventor
Michitaka Toshimoto
道隆 利元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2004194533A priority Critical patent/JP2006017936A/ja
Publication of JP2006017936A publication Critical patent/JP2006017936A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】 特定個人の音声を認識するために、該特定個人に、音声の登録を要求するなどの煩雑な処理を必要とすることなく、特定個人の音声の認証を高精度に行える安価な通話装置を提供する。
【解決手段】 本発明の携帯電話2は、音素辞書33に基づき、入力された音声がユーザの音声であるか否かの認証を行う適合率計測確認部45と、特定個人の通話中の音声を取得する音声入力部25と、取得された音声に基づき、特定話者サンプル情報36を作成し音素辞書33を更新するサンプル作成部44とを備えている。
【選択図】 図1

Description

本発明は、個人認証に関するものであり、特には電子商取引等個人認証を必要とする場合において、音声による個人認証を行うことができる通話装置、中継処理装置に関するものである。
近年、ネットワーク上で商取引の一部あるいは全部を行う、いわゆる電子商取引(ネットショッピング)が普及しており、また携帯電話を利用者して電子決済を行うことができるシステムも提案されている。
その一方で、電子商取引において、決済等に利用するクレジットカードの番号が他人に漏洩したり、他人の携帯電話を使用して不正に商品を購買したりするなどの問題が生じ、取引の安全性の確保が重要となっている。特に、電子商取引において正規のユーザによる利用であるのか、提供された情報が正当な情報であるのかを判断する認証技術の重要性が高まっている。
例えば、この認証技術としては、指紋やアイリスといったバイオメトリクス技術を利用した個人識別方法が開発されており、セキュリティシステム、またはネットショッピング等の電子決済に利用されるようになってきている。
このようなバイオメトリック技術を利用して個人識別を行う方法としては、例えば、特許文献1では、主電話機と携帯電話機とからなるコードレス電話機において、携帯電話機の使用者の声紋を分析符号化する声紋分析器と、登録済みの該使用者の声紋と声紋分析器で分析した声紋とを比較し両者が一致するか否かを判定する比較器とを備え、この比較器の判定に応じて、主電話機の基本機能部の動作状態を切替える電話機方式が開示されている。
また、特許文献2では、人間の生物学的特徴のうち少なくとも1つを読み取る読取手段と、読み取ったデータを予め登録してある参照データとを対比し個人の認証を行う携帯個人認証装置が開示されている。
さらにまた、特許文献3では、ユーザの声紋データと認証プログラムに基づいて、ユーザが正当な権限を有するユーザであるか否かの認証を行うユーザ認証方法が開示されている。
特開平5−83359号公報(1993年4月2日公開) 特開2001−92786号公報(2001年4月6日公開) 特開2003−36246号公報(2003年2月7日公開)
しかし、特許文献1に示す構成では、予め利用者の音声を登録させておく必要がある。このため、例えば、利用者の体調、または利用者の周囲を取り巻く環境の影響によって登録時における利用者の音声の調子と、認証時における利用者の音声の調子とに差異が生じる場合、認証時に誤認することがある。
また、特許文献2に示す構成も特許文献1に示す構成と同様に、予め利用者の生物学的特徴を登録させておく必要があるため、この生物学的特徴が利用者の体調、または利用者の周囲を取り巻く環境の影響によって変化が生じるものである場合、認証時に誤認するといった問題が生じる。
また、特許文献1および特許文献2に示される構成では、予め登録する声紋または生物学的特徴と、認証時に入力される声紋または生物学的特徴との比較において、認識率を高めるためには高精度の声紋システムなど高価なシステムが必要となりコストがかかるという問題が生じる。特に、携帯電話やPDAなどの携帯端末では、小型化および低価格化が求められており、当該携帯電話に高価なシステムを備えることは困難である。
また、特許文献3に示す構成では、登録時において、ユーザによって5回入力された音声の声紋データに基づき、この声紋データの誤差データを算出し、当該声紋データとともに誤差データをサーバで記憶する構成である。しかし、登録時にユーザの音声を登録する構成であるため、やはり特許文献1および特許文献2と同様に、認証時における利用者の体調、利用者の周囲を取り巻く環境の影響により、認証時に入力されたユーザの音声を誤認する問題が生じる。また、特許文献3の構成は、登録時にユーザは複数回音声を登録する必要があり、ユーザに煩雑な処理を強いることとなる。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、特定個人の音声を認識するために、該特定個人に、音声の登録を要求するなどの煩雑な処理を必要とすることなく、特定個人の音声の認証を高精度に行える安価な通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体を提供することにある。
本発明に係る通話装置は、上記した課題を解決するために、音声を識別するための識別に基づき、入力された音声が特定個人の音声であるか否かの認証を行う認証手段を備えた通話装置であって、上記特定個人の通話中の音声を取得する音声取得手段と、上記音声取得手段によって取得された音声に基づき、上記識別情報を更新する識別情報更新手段とを備えていることを特徴とする。
また、本発明に係る通話装置の制御方法は、上記した課題を解決するために、音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行うステップと、上記特定個人の通話中の音声を取得するステップと、上記取得された音声に基づき、上記識別情報を更新するステップとを含むことを特徴とする。
ここで、上記識別情報とは、例えば、特定の単語などを発声した音声などを識別できるものである。例えば、特定の単語の音声を収集しその音響モデルを生成するなど、識別する音声の特徴量パターンを記録することで実現できる。
本発明に係る通話装置は、上記音声取得手段によって特定個人の通話から取得した音声に基づき、上記識別情報を更新することができるため、特定個人に特徴的な音声の特徴を反映した識別情報を加えて更新していくことができる。
すなわち、上記通話装置は、特定個人に特徴的な音声を識別できる識別情報を、特定個人の通話から取得した音声に基づき更新していくことができるため、上記認証手段によって特定個人に特徴的な音声を、特定個人以外の音声と区別して識別できる。
また、通話中の音声に基づき、識別情報を更新することができるため、特定個人の体調または特定個人を取り巻く周囲の状態等によって、通常の音声と異なる場合の音声に基づく識別情報を更新しておくことができる。このため、認証時に特定個人の体調の変化等で通常の音声と異なる音声であっても、認証手段は特定個人の音声として認証することができる。
したがって、本発明に係る通話装置または通話装置の制御方法は、特定個人の音声をいかなる場合でも、精度よく他の人の音声と区別して認証することができる。
また、上記音声取得手段は、特定個人の通話中の音声を取得しているため、識別情報を得るためにわざわざ該特定個人に対して音声の入力を要求する必要がない。このため、特定個人の音声の認証を行うために、予め該特定個人の音声の登録処理を行うなど特別の処理の要求を強いることがなく、特定個人の識別を行うことができる。
また、本発明に係る通話装置または通話装置の制御方法における入力された音声の認証は、上記したように利用者の通話中の音声から、該利用者の音声の特徴を示した情報を識別情報として更新し、更新された識別情報に基づき、認証時に認証手段は入力された音声が利用者のものであるのか否かを判定する構成である。このため、入力された音声に対して上記利用者の音声であるか否かを認証するための処理において、特に複雑なアルゴリズムを実現する装置を備える必要が無い。
したがって、本発明に係る通話装置または通話装置の制御方法は、特定個人の音声を認識するために、該特定個人に、音声の登録を要求するなどの煩雑な処理を予め行う必要がなく、特定個人の音声の認証を、コストをかけずに高精度に行うことができる。
よって、上記通話装置は、煩雑な処理を強いることなく安価に高精度に特定個人の音声に対する認証を行うことができる。
なお、上記通話装置は、例えば電話機、携帯電話装置など、通話中に特定個人の音声を取得できる装置によって実現することができる。
また、本発明に係る通話装置は、上記した構成において、上記識別情報は、特定個人の通話中における音声の特徴量に関する情報であり、上記認証手段は、入力された音声の特徴を示す特徴量と識別情報更新手段によって更新されている識別情報との適合度が所定の閾値以上であるか否かに応じて、入力された音声が特定個人の音声であるか否かの認証を行うように構成されていることが好ましい。
上記特徴量とは、上記特定の音素群を発声した場合に生じる音声の音響特性を示すものである。
また、識別情報が、特定個人の通話中における音声の特徴量に関する情報である。このため、上記通話装置は、例えば、特定個人の体調の状態や、特定個人の周囲を取り巻く環境の状態の違いによって影響された特定個人の音声の特徴量に関する情報も識別情報として更新しておくことができる。
したがって、上記通話装置は、特定個人の認証時の体調状態または該特定個人を取り巻く環境の影響に関わらず、特定個人によって入力される音声を正確に識別することができる。
また、上記通話装置は、上記認証手段が、入力された音声の特徴を示す特徴量と識別情報更新手段によって更新されている識別情報との適合度が所定の閾値以上であるか否かに応じて、入力された音声が特定個人の音声であるか否かの認証を行うように構成されている。
このため、入力された音声の特徴量と、識別情報として更新している特定個人の通話中における音声の特徴量とを比較しその適合度が閾値以上であるか否かを判定するだけで、容易に認証を行うことができる。
よって、本発明に係る通話装置は、認証時における特定個人の状態に関わらず、容易に該特定個人の音声に対する認証を行うことができる。
なお、上記所定の閾値は、入力された音声に対して行われる認証に求められる精度に応じて、入力された音声が特定個人の音声であるか否かの範囲において設定される。
また、本発明に係る通話装置は、上記した構成において、上記識別情報は、特定個人の通話中の音声に基づく、特定の音素群の特徴量に関する情報であり、上記認証手段は、特定個人の音声であるか否かの認証を、特定の音素群の入力に対してのみ行うように構成されていてもよい。
上記特定の音素群とは、例えば、単音である母音、子音を用いた特定の音素の組み合わせであってもよいし、特定の単語であってもよい。
このように、識別情報が特定の長さを有する音素群の特徴量に関する情報であるため、入力する音声をこの特定の長さを有する音素群とすることで、認証を容易に行うことができる。すなわち、特定の音素群の入力に対してのみ認証を行うことで、認証対象の音声が明確となるため、認証を容易に行うことができる。
また、この特定の音素群が上記特定個人しか知らない場合、特定個人以外の第3者によって、不正に認証を行うことを防ぐことができる。
また、本発明に係る通話装置は、上記した構成において、上記識別情報は、複数の不特定話者の音声における、特定の音素群の特徴量に関する情報をさらに含んでいることが好ましい。
識別情報は、複数の不特定話者の音声に基づく、特定の音素群の特徴量に関する情報を含んでいるため、上記通話装置において特定個人の通話実績がない場合であっても、特定個人の通話における音声の中から特定の音素群に対応する部分を容易に特定することができる。
したがって、上記特定個人の通話実績のない通話装置であっても、該特定個人の通話中の音声から、上記識別情報を更新するために利用する音声を上記音声取得手段は容易に取得できる。
また、本発明に係る通話装置は、上記した構成において、上記特定の音素群は、外部からの指示に応じて指定されることが好適である。
上記特定の音素群が外部からの指示に応じて指定されるため、音声を入力する前の段階では、どのような音声を入力すべきか分からない。このため、上記特定個人以外のものが予め該特定個人の音声を真似るように練習しておくなど、特定個人になりすまして音声を入力し認証を行うことを防ぐことができる。
このため、上記認証に対する安全性を向上させることができる。
また、本発明に係る通話装置は、上記した構成において、上記音声取得手段によって取得された音声の特徴量と、既に取得されている音声に基づいて更新されている識別情報との適合度を算出する適合度算出手段と、上記適合度算出手段によって算出された適合度が所定の閾値以上である場合、上記識別情報更新手段は、上記音声取得手段によって取得された音声に基づき、上記識別情報を更新するように構成されていてもよい。
ここでまず、上記特徴量情報の適合度とは、先に入力されている特定個人の音声の特徴量を示す特徴量情報と、次に入力された特定個人の音声の特徴量を示す特徴量情報との類似度である。したがって、この適合度が高い、すなわち類似度が高いということは、既に入力された音声の特徴量と、今回入力された音声の特徴量との類似度が高いということであり、入力された音声に対して上記特定個人によって発声された音声として識別できる確率が高いということである。
また、上記所定の閾値とは、上記適合度がどのくらいまでであれば、入力された音声が上記特定個人の音声としてみなすことができるという基準であり、この基準は、認証手段による認証処理に求められている認証精度に応じて決めることができる。
また、この閾値は、上記識別情報の情報量に応じて適合度が変化する場合は、情報量に応じて段階的に変化するものであってもよい。また、適合度の変化に応じて、段階的に変化するものであってもよい。
上記識別情報更新手段は、取得された音声の特徴量情報と識別情報との適合度が所定の閾値以上である場合に、該取得された音声に基づき識別情報を更新する。このため、識別更新手段は取得した音声を選択して識別情報を更新することができる。
すなわち、上記適合度が所定の閾値以上である音声にのみ基づいて、識別情報が更新されるため、特定個人の発声する音声に対する識別精度が悪い特徴量に関する情報を削除することができる。
このため、識別情報は識別精度がある一定水準以上の適合度を保った良質な情報のみとすることができる。このため、認証時において、入力された音声に対して行われる認証結果の信頼性を高めることができる
よって、上記識別情報は、特定個人の音声を識別するために必要となる音声に基づく情報となり、入力された音声に対する認証を認証手段が精度よく行うことができる。
また、本発明に係る通話装置は、上記した構成において、上記識別情報更新手段によって更新された識別情報の情報量に応じて、上記適合度が単調増加することを特徴とすることが好適である。
更新された識別情報の情報量に応じて、適合度が単調増加するため、例えばこの情報量と適合度との対応関係を示す履歴情報を記録すれば、故意に適合度を変更させたものであるか否かを判断することができる。したがって、この場合、適合度を故意に変更させ認証を行うことを防ぐことができるため、上記通話装置は信頼性の高い認証を行うことができる。
また、本発明に係る通話装置は、上記した構成において、上記適合度算出手段によって算出された適合度の履歴情報を記録する履歴情報記録手と、上記履歴情報記録手段によって記録された上記適合度の履歴情報を出力する履歴情報出力手段とを備えている構成であってもよい。
上記通話装置は、履歴情報記録手段を備えているため、上記適合度の履歴を記録することができる。そして、履歴情報出力手段を備えているため、記録した上記適合度の履歴を出力することができる。例えば、上記適合度の履歴を上記通話装置の外部に備えられた表示装置に出力される場合、適合度の変化を確認することができるため、故意にこの適合度を変更させたものであるか否かを確認することができる。
また、上記通話装置の認証結果を処理する装置を、例えば、該通話装置の外部に設けられている場合、この認証結果を処理する装置に、上記適合度の履歴を出力することによって、該認証結果を処理する装置は、通話装置で行われた認証結果の適否を確認することができる。
したがって、この場合、適合度を故意に変更させ認証を行うことを防ぐことができるため、上記通話装置は信頼性の高い認証を行うことができる。
また、本発明に係る通話装置は、上記した構成において、上記識別情報更新手段によって更新された識別情報の情報量を算出する識別情報量算出手段を備え、上記情報量算出手段が上記情報量が所定量に達したと判定した場合、上記認証手段に対し、入力された音声に対する認証の実行を許可する認証実行許可手段を備えていることが好ましい。
ここで、上記識別情報の情報量に応じて適合度は単調増加するため、該情報量との関係から、情報量が所定量に達した時点での適合度が分かる。
また、上記通話装置は、認証実行許可手段を備えているため、入力された音声の特徴を示す特徴量情報と識別情報との適合度が認証を行うために必要な適合度を確保できる時点で、認証を実行することができる。
よって、上記通話装置は、入力された音声に対して確実で正確な認証を行うことができる。
また、本発明に係る通話装置は、上記した構成において、上記識別情報量算出手段によって算出された上記情報量が所定量に達し、上記適合度算出手段によって算出された適合度が所定の閾値以上である場合、上記認証手段に対し、入力された音声に対する認証の実行を許可する認証実行許可手段を備えていてもよい。
上記認証実行許可手段は、上記情報量が所定量に達し、適合度が所定の閾値以上である場合に認証手段に対して入力された音声に対する認証の実行許可を与える。このため、認証を行うために必要な適合度を確保でき、さらに上記情報量からこの適合度の信頼性を確認することができる。
よって上記通話装置は、上記認証実行許可手段を備えているため、入力された音声の特徴を示す特徴量情報と識別情報との適合度が認証を行うために必要な適合度を確実に確保できる時点で、認証を実行することができる。
それ故、上記通話装置は、入力された音声に対して確実で正確な認証を行うことができる。
また、本発明に係る通話装置は、上記した構成において、上記認証実行許可手段は、さらに入力された音声に対する認証を実行可能な状態となったことを示す通知を出力する認証実行可能通知出力手段を備えていることが好ましい。
上記通話装置は、上記認証実行可能通知手段を備えているため、例えば、上記通話装置による認証結果を利用して処理を行う装置が、該通話装置の外部に備えられている場合、この外部に備えられた装置に認証処理を行うことができることを知らせることができる。
また、本発明に係る通話装置は、上記した構成において、上記認証手段が、入力された音声が上記特定個人の音声でないと認証した場合、各種機能の動作を制限する動作制限手段を備えていることが好ましい。
上記認証手段が、入力された音声が上記特定個人の音声でないと判断した場合とは、上記通話装置が上記特定の個人以外の第3者によって使用されている場合である。
そこで動作制限手段が各種機能の動作を制限するため、上記第3者によって不正に通話装置が使用されることを防ぐことができる。
なお、上記各種機能とは、例えば、通話機能、メール送信機能、データ送信機能等、第3者によって不正に使用されることで、上記特定の個人に不利益を与えるような機能である。上記制限するとは、例えば、上記各種機能を全く使用できなくするか、上記特定の個人に不利益を与える機能以外は有効とするなど、少なくとも第3者の使用によって特定の個人に不利益を与えるような機能に関しては使用不可能な状態にすることである。
よって、本発明に係る通話装置は、特定の個人以外の使用を防止することができる。
また、本発明に係る通話装置は、上記した構成において、上記認証手段による認証結果を出力する認証判定出力手段を備えていてもよい。
したがって、例えば本発明に係る通話装置において得られた認証結果を利用する装置が該通話装置の外部に備えられている場合、この装置はこの認証結果を利用して処理を実行することができる。
また、本発明に係る中継処理装置は、上記した課題を解決するために、上記音声取得手段、上記識別情報更新手段、上記適合度算出手段、上記履歴情報記録手段、上記履歴情報出力手段、上記認証判定出力手段、および上記認証実行可能通知出力手段を備え、音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行う認証手段を備えた通話装置と、通信によって入力された情報を処理し、出力する情報処理装置との間における通信の中継を行う中継処理装置であって、上記通話装置から通知された認証の結果に応じて、上記通話装置と上記情報処理装置との通信を許可するか否かを判定する通信許可判定手段とを備えている。
したがって、通話装置からの通信を特定個人によって行われているか否かを確認して、該通話装置から上記情報処理装置への通信を許可することができる。
また、本発明に係る通話装置は、上記した課題を解決するために、上記音声取得手段、上記識別情報更新手段、上記適合度算出手段、上記履歴情報記録手段、上記履歴情報出力手段、上記認証判定出力手段、および上記認証実行可能通知出力手段を備え、音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行う認証手段を備えた通話装置と、通信によって入力された情報を処理し、出力する情報処理装置との間における通信の中継を行う中継処理装置であって、上記通話装置から上記適合度の履歴情報を取得する適合度履歴情報取得手段を備えていることを特徴とする。
したがって、上記通話装置は、適合度履歴情報取得手段を備えているため、上記通話手段において、取得された音声に対する識別情報の適合度の履歴を管理することができる。したがって、上記中継処理装置は、例えば、認証時に入力された音声と識別情報との適合度の信用性を示す情報を提供することができる。なお、本発明に係る中継処理装置の構成と、上記にて示した、通信許可手段を備える中継処理装置の構成とを組み合わせた構成であってもよい。
また、本発明に係る中継処理装置は、上記した構成において、入力する音声を指定して認証を指示する認証指示手段を備えていることが好ましい。
すなわち、上記中継処理装置は、上記認証指示手段を備え、認証のために入力する音声を指定しているため、通話装置において勝手に認証用の音声を決定することができない。
このため、通話装置側で、例えば予め不正に準備した音声を使って認証を行うことを防ぐことができる。
したがって、上記中継処理装置は、認証結果の信頼性を確保し信頼性のある認証結果に基づき、上記情報処理装置への通信の中継を行うか否かを判断することができる。
また、本発明に係る中継処理装置は、上記した構成において、上記通話装置から受信した認証結果が、入力された音声が上記特定個人の音声でない場合、上記通話装置からの通信を遮断する通信遮断手段を備えていてもよい。
上記中継処理装置は、通信遮断手段を備えているため、例えば、上記中継処理装置が通信サービスを提供しており、通話装置がこのサービスの加入者である場合、入力された音声が上記特定個人の音声でないときは通話装置の通信を遮断させることができる。
よって、認証結果において入力された音声が上記特定個人の音声でないと判断した場合、上記中継処理装置は、通話装置の通信を遮断することができるため、上記特定個人以外の人によって、上記通話装置が利用されることを防ぐことができる。
また、本発明に係る中継処理装置は、上記した構成において、上記通話装置から入力された音声に対する認証を実行可能な状態となったことを示す通知を受信すると、該通話装置を認証可能な装置として記録する装置記録手段を備えていてもよい。
したがって、上記中継処理装置は、上記装置記録手段を備えているため、上記通話装置が入力された音声に対する認証が可能な装置であるか否かを管理しておくことができる。
したがって、通話装置に入力された音声の認証を要求する際に、当該通話装置が入力された音声に対する認証を行うことができ装置であるのか否かを即座に判定することができる。
また、本発明に係る通信認証システムは、上記した課題を解決するために、上記特定個人の通話中の音声を取得する音声取得手段を有する通話装置と、該通話装置と情報処理装置との間の通信を許可するかの中継を行う中継処理装置とを備えた通信認証システムであって、音声を識別するための識別情報に基づき、上記通話装置に入力された音声が特定個人の音声であるか否かの認証を行う認証手段と、音声取得手段によって取得された音声に基づき、上記識別情報を更新する識別情報更新手段と、上記認証手段によって認証された結果に基づき、上記通話装置と上記情報処理装置との間の通信を許可するか否かを判定する通信許可判定手段とを備えていることを特徴とする。
したがって、上記通信システムは、上記通話装置に入力された音声が特定個人の音声であるか否かの認証を行うことができ、また、取得された音声に基づき、上記識別情報を更新することができる。また、入力された音声に対して認証された結果に基づき、上記通話装置と上記情報処理装置との間の通信を許可するか否かを判定することができる。
なお、上記画像印刷装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各手段として動作させることにより上記画像印刷装置をコンピュータにて実現させる画像処理プログラム、およびそのアドレス供給装置の制御プログラムを記録したコンピュータ読取り可能な記録媒体も、本発明の範疇に入る。
本発明に係る通話装置は、以上のように音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行う認証手段を備えた通話装置であって、上記特定個人の通話中の音声を取得する音声取得手段と、上記音声取得手段によって取得された音声に基づき、上記識別情報を更新する識別情報更新手段とを備えていることを特徴とする。
また、本発明に係る通話装置の制御方法は、以上のように、音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行うステップと、上記特定個人の通話中の音声を取得するステップと、上記取得された音声に基づき、上記識別情報を更新するステップとを含むことを特徴とする。
したがって、本発明に係る通話装置または通話装置の制御方法は、特定個人の音声を認識するために、該特定個人に、音声の登録を要求するなどの煩雑な処理を予め行う必要がなく、特定個人の音声の認証を、コストをかけずに高精度に行うことができる。
よって、上記通話装置または通話装置の制御方法は、煩雑な処理を強いることなく安価に高精度に特定個人の音声に対する認証を行うことができるという効果を奏する。
本実施の形態に係るネットショッピングシステム1は、ユーザが携帯電話2を使用して、電子モール5の各電子商店4a〜4cが提供するサービスを利用できるシステムである。以下図2を参照して、本実施の形態に係るネットショッピングシステム1の概略構成について説明する。なお、この図2は、本実施の形態に係るネットショッピングシステム1の概略構成の一例を示す図である。
図2に示すように、上記ネットショッピングシステム1は、携帯電話2、基地局3、および電子モール5を備えている。そして、上記ネットショッピングシステム1では、携帯電話2と基地局3とは無線によって通信可能な状態である。また、基地局3は、インターネットあるいはイントラネット(以下通信ネットワーク6)を通じて、電子モール5の電子商店4a〜4cに通信可能に接続されている。
このように、ネットショッピングシステム1では、基地局3を介して携帯電話2と電子商店4a〜4cとが通信できるようになっており、両者の間における電子商取引(ネットショッピング)を実現可能とする。
上記携帯電話2は、通常の携帯電話が有する通話機能に加えて、後述するが音声識別機能(声紋識別部32)を有しおり、基地局3と無線によって通信を行うことによって、他の携帯電話との通信を確立したり、また電子モール5の電子商店4a〜4cいずれかとのネットショッピングを実現したりする。
また、上記基地局3は、広域電気通信サービスを提供するとともに、ネットワーク上に開設された電子商店4a〜4cのサイトを管理するものである。また、電子商店4a〜4cは、商品の販売や情報等のサービスを携帯電話2のユーザに提供する通信ネットワーク6上に開設されたサイトである。この電子商店4a〜4cは、携帯電話2の表示画面に適した仕様のショッピング案内画面を作成し、基地局3を介して携帯電話3にこのショッピング案内画面のデータを送信する。なお、電子商店4a〜4cを特に区別して説明する必要がある場合以外は、本明細書において単に電子商店4として示す。
以下、上記ネットショッピングシステム1における基地局3および携帯電話2の構成に関して図1,図3,および図4を参照して詳細に説明する。なお、図3は、本実施の形態に係る基地局3の概略構成の一例を示す図であり、図4は、本実施の形態に係る携帯電話2の概略構成の一例を示す図である。また、図1は、本実施の形態に係る携帯電話2が備える声紋識別部32の概略構成の一例を示すブロック図である。
(基地局の構成)
図3に示すように、上記基地局3は、基地局アンテナ10、ゲートウェイ(GW)11,移動通信制御部12,および基地局記憶部13,個人識別データ登録部14、契約サイト登録部15,電子商取引許可判定部16,および特定ワード指定部17を備えている。
基地局アンテナ10は、携帯電話2から基地局3に発信されたデータを受信したり、基地局3から携帯電話2にデータを発信したりするためのアンテナである。基地局アンテナ10は、移動制御部12に制御されることによって、携帯電話2からデータを受信したり、送信したり、移動通信制御部12の指示に応じて携帯電話2に対してデータの送受信を行う。
ゲートウェイ11は、通信ネットワーク6を通じて、基地局3が電子モール5の各電子商店4a〜4cと通信可能とするためのものである。ゲートウェイ11は、移動通信制御部12からの指示に応じて、媒体やプロトコルが異なるデータを相互に変換して、基地局3と各電子商店4a〜4cとの通信を可能とさせる。
基地局記憶部13は、読み書き可能な不揮発性の記憶媒体であり、例えばハードディスクやフラッシュEEPROM等によって実現できる。そして、この基地局記憶部13は、個人識別情報テーブル18および契約サイト情報19を記憶している。
この個人識別情報テーブル18には、機器ID番号34と、認証用特定ワードと、ヒストリー情報と、契約情報と、特定ワードの適合率(適合度)の履歴情報とが記録されている。
なお、上記機器ID番号34は、電子商店4a〜4cのいずれかとネットショッピングを行うことが許可された携帯電話2のID番号である。
認証用特定ワードとは、携帯電話2のユーザに認証を指示する際に、音声入力を要求する特定ワードである。
より具体的には、本実施の形態に係る携帯電話2では、当該携帯電話2を利用する正規ユーザの通話中における音声データの中から特定ワードに対する音声データを抽出する。
そして、抽出したこの音声データの特徴量パターンと、音声辞書33にある特定話者サンプル情報36として記憶されている過去にユーザの音声データから取得した特定ワードのサンプルとを比較するように構成されている。すなわち、通話中の中から抽出した音声データの特徴量パターンと、音素辞書33のサンプルの中で、当該音声データの特徴量パターンにもっとも類似する特徴量パターンを示すサンプル選択し比較する。
そして、上記認証用特定ワードとは、両者の比較において示される類似度、すなわち、適合率が99.5%以上であり、かつサンプル数が1、000に達している単語である。
なお、この適合率とは、入力された特定ワードの音声の特徴量パターンと、既に取得されているユーザの特定ワードの音声の特徴量パターンとの類似度を示す値であり、特定のユーザによって入力された音声に対する認識率と呼ぶこともできる。
また、特定ワードの適合率の履歴情報とは、特定ワードに関して上記適合率の変化を示す履歴情報である。つまり、後述するが、上記適合率は、一般的に、上記ユーザの音声データのサンプル数が増加すればするほど単調増加することが知られている。したがって、特定ワードの適合率の履歴情報とは、特定ワードに関する上記適合率の変化を示す情報である。
また、上記ヒストリー情報とは、該携帯電話2と電子商店4a〜4cとの間で実行されたネットショッピングの取引結果の履歴情報、上記携帯電話2のユーザの携帯電話使用料金の支払い状況の履歴、およびネットショッピングによる料金の支払い状況の履歴を示す情報である。
また、契約情報とは、当該携帯電話2のユーザと電子商店4a〜4cとの間で交わされたネットショッピングに関する契約情報である。
一方、上記契約サイト情報19は、基地局3を運営し通信サービスを提供するキャリアが、社会的な信頼を得ていると判断し、契約した電子商店4a〜4cのサイトの情報である。
移動通信制御部12は、基地局3によって実行される各種通信処理の制御を行うものである。具体的には、携帯電話2から他の携帯電話への通話要求を受信した場合、通話先が基地局3の管轄内にある他の携帯電話であれば、通話先に通信をつなげるように処理をしたり、あるいは、通話先が他の基地局の管轄内であれば、他の基地局につなげたりするなど、携帯電話2と携帯電話2のユーザが所望する通話先との中継処理を行うものである。
また、携帯電話2から電子商店4a〜4cいずれかのサイトへの接続が要求された場合、ゲートウェイ11に指示をして、通信ネットワーク6を通じてネットワーク上の電子商店4a〜4cのサイトとの接続を中継するものでもある。
個人識別データ登録部14は、上記した個人識別情報テーブル18に、機器ID番号34、認証用特定ワード、特定ワードの適合率の履歴情報、ヒストリー情報、料金支払い情報、および契約情報を記録するものである。
より具体的には、携帯電話2から当該携帯電話2の機器ID番号34、認証用特定ワード、特定ワードの上記適合率の履歴を、基地局アンテナ10を介して移動通信制御部12が受信すると、個人識別データ登録部14に指示して個人識別情報テーブル18に記録させる。また、電子商店4a〜4cから、携帯電話2のユーザのヒストリー情報、料金支払い情報、および契約情報の通知を、ゲートウェイ11を介して移動通信制御部12が受信すると、個人識別データ登録部14に指示して、個人識別情報テーブル18に記録させる。
またさらには、上記携帯電話2による通話によって発生する通話料金の情報も記憶させる。
上記契約サイト登録部15は、接続可能とする電子商店のサイトを、基地局3と契約したサイトのみに制限するものである。すなわち、基地局3では、当該基地局3を運営し通信サービスを提供するキャリアが、社会的な信頼を得ていると判断した電子商店のサイトとのみ契約するように設定され、不正なネットショッピングが行われることを防止している。
具体的には、契約サイト登録部15は、契約サイト情報19を参照して、契約している電子商店4a〜4cにセキュリティパスを発行し、ゲートウェイ11に接続許可されている電子商店4a〜4cを指示している。そして、ゲートウェイ11は、このセキュリティパスが発行されている電子商店4a〜4cからの接続要求のみを許可するようにしている。
電子商取引許可判定部16は、携帯電話2が電子商店4a〜4cとのネットショッピングを利用可能とする条件を満足しているか否かを判定するものである。なお、上記ネットショッピングを利用可能とする条件とは、上記個人識別情報テーブル18の各情報と、携帯電話2において行われたユーザの認証結果に基づき判定される。
すなわち、電子商取引許可判定部16は、携帯電話2において実行された認証結果によって、ネットショッピングの実行を携帯電話2から要求している人が、正規のユーザであるか否かを判断することができる。また、ヒストリー情報を参照することで、過去に上記携帯電話2と電子商店4a〜4cとのネットショッピングにおいて実行された取引状況を知ることができる。この取引状況から、上記携帯電話2と電子商店4a〜4cとの間で行われたネットショッピングが良好に行われた実績があるか否かを判断することができる。また、料金支払い情報を確認することで、携帯電話2の料金支払い実績が良好なものであるか否かを確認することができる。また、契約情報を確認することで、携帯電話2と電子商店4a〜4cとの間で結ばれた特別な契約条項がないか確認することができる。
ところで、欧米では、クレジットカードによるショッピングが主流であり、スーパーマーケットでの日常的な買い物から、ガソリンスタンドでの給油に至るまでクレジットカードあるいはチェック(小切手)による支払いが行われる。そして、欧米では、クレジットカードによる支払い実績を個人の信用度とみなしている。すなわち、最初に銀行でクレジットカードを作って利用する場合、一般的には、カードで支払い可能な上限が2000ドル程度に制限されている。そこで、数ヶ月間このカードを用いてショッピングをし、カード支払い代金が引き落とされる銀行口座から、遅延なく支払い代金が引き落とされていることが確認されると、個人の信用度が上がり、カードで支払い可能な上限が4000ドルへと拡大する。すなわち、このように個人の信用度がカードによる支払い実績に基づいて評価されるシステムである。このようなシステムのメリットは、個人も銀行も最初からリスクを犯すことなく万一不正が行われても最小限の損失で止めることが出来る。
そこで、上記電子商取引許可判定部16は、上記システムのアイデアを利用して、携帯電話2によるネットショッピングの許可の適否を、携帯電話2からネットショッピングを要求している人が正規のユーザであるかを確認するとともに、携帯電話2のユーザの信用度を確認した上で決定している。
上記特定ワード指定部17は、個人識別情報テーブル18の認証用特定ワードの中からランダムに認証用特定ワードを選択して、携帯電話2に当該ワードの音声認識を指示するものである。
特定ワード指定部17は、ランダムにワードを選択して、選択したワードの音声認識を携帯電話2に指示することで、携帯電話2が正規のユーザ以外によって操作されることを防ぐことができる。なお、この正規のユーザによる携帯電話2の使用か否かを判定する処理に関する詳細は後述する。
(携帯電話の構成)
次に、本実施の形態に係る携帯電話2の構成について図4を参照して説明する。
本実施の形態に係る携帯電話2は、声紋識別部32を備えている以外は通常の携帯電話と同じ構造である。
すなわち、上記携帯電話2は、アンテナ21,電源部22,表示部23,キー操作部24,音声入力部25,音声出力部26,記憶部27,携帯通信制御部28,声紋識別制御部29,無線通信部30,信号処理部31,および声紋識別部32を備えている。
音声入力部25は、ユーザの発生する音声を取得し、当該音声をアナログ信号に変化して信号処理部31に入力するマイクである。一方、音声出力部26は、信号処理部31から入力されたアナログ信号の音声データを音声として出力するスピーカである。
信号処理部31は、音声入力部25によって取得されたユーザの音声のアナログ信号を、携帯通信制御部28の指示に応じて、デジタル信号に変換処理して無線通信部30に入力するものである。より具体的には、信号処理部31は、音声入力部25から入力された音声データのアナログ信号をパルス符号変調し、サンプリングしてデジタル信号に変換する。そして、信号処理部31はデジタル信号に変換した音声データを無線通信部30に送信する。
また、この信号処理部31は、無線通信部30から入力された音声データをデジタル信号からアナログ信号に変換し音声出力部26に出力するものでもある。信号処理部31から出力されたアナログ信号の音声データは、音声出力部26で音声に変換される。
無線通信部30では、信号処理部31から入力された音声データを、アンテナ21を介して無線通信可能となるように変換するものである。また、アンテナ21を介して受信した音声データを信号処理部31においてデジタル信号からアナログ信号に変換できるように変換する。
アンテナ21は、無線通信部28によって制御され、基地局3にデータを無線で送信したり、基地局3から送信されたデータを受信して無線通信部30に送信したりするものである。
電源部22は、携帯電話2の各種部材を実行させるための本体電源である。
表示部23は、基地局3を介して、例えば電子商店4a〜4cから受信したデータ等をグラフィカルに示すための表示装置である。
キー操作部24は、ユーザが携帯電話に対して所望する動作を指示するもの、あるいはユーザが所望するデータを入力可能とするものである。例えば、ユーザは、このキー操作部24によって通話先の電話番号を入力したり、電子商店4a〜4cとのネットショッピングを行う際、所望するサービスを選択したりすることができる。
携帯通信制御部28は、本実施の形態に係る携帯電話2の各種制御を行うものである。また、携帯通信制御部28は、声紋識別制御部29に指示して声紋識別部32を実行させる。
声紋識別制御部29は、本実施の形態に係る携帯電話2において、電源がONとなり、キー操作部24の操作指示によって、通話が開始された場合、携帯通信制御部28からの指示に応じて、声紋識別部32に、ユーザの通話中に発声された音声に基づき、ユーザの音声を識別できるように学習するよう指示を出すものである。あるいは、声紋識別制御部29は、上記携帯電話2によって電子商店4a〜4cの何れかとネットショッピングを行う際に、携帯通信制御部29の指示に応じて、当該携帯電話2において発声する人(ユーザ)の音声が上記ユーザの音声と一致するか否かの認証を行うように声紋識別部32に指示を出す。
声紋識別部32は、音声入力部25によって、信号処理部31に入力された音声データの中から、所定の音声データを取得し、取得した音声データに基づき、該音声データの特徴を示す特徴量を抽出、比較して上記ユーザの音声を識別できるように学習するものである。あるいは、認証処理時に入力された音声が正規のユーザによって発声された音声であるか否かを判定するものである。この声紋識別部32の詳細な説明は後述する。
記憶部27は、読み書き可能な不揮発性の記憶媒体であり、例えばフラッシュEEPROM等によって実現できる。そして、この記憶部27には、声紋識別部32によって参照される音素辞書33および当該携帯電話2の機器ID番号34が記憶されている。なお、この音素辞書33については、後述する声紋識別部32に説明において説明する。
(声紋識別部の構造)
次に、図1を参照して上記した声紋識別部32の詳細な説明をする。図1は声紋識別部32の概略構成の一例を示すブロック図である。
上記声紋識別部32は、図1に示すように、音声符号化部40,サンプリング部41,アベレージ部42,符号化比較部43,サンプル作成部44,適合率計測確認部45,サンプル数カウンター部46,個人識別可能報知部48,機器シャットダウン部47,適合率結果通知部49,認証結果通知部51,およびサンプル作成・認証判定部50を備えている。
また、記憶部27には、上記したように、音素辞書33および機器ID番号34が記憶されている。
ここで、まず音素辞書33について説明する。この音素辞書33は、不特定話者音響モデル情報35と特定話者サンプル情報36とを含む情報である。
上記不特定話者音響モデル情報35は、不特定多数の老若男女からサンプリングした特定ワードの音声データの特徴量を用いて、隠れマルコフモデル(Hidden Markov Model;HMM)によって予めモデル化された、該音声データの特徴量パターン(音響モデル)の情報である。
この不特定話者音響モデル情報35は、本実施の形態に係る携帯電話2の使用開始時にユーザによって発声された特定ワードに対する音声認識率を確保するために準備されているものである。すなわち、予め該特定ワードの一般的な音響モデルを準備しておくことで
、ユーザの通話中の音声から、特定ワードに対応する音声データを探索し取得することが容易となる。
また、不特定話者音響モデル情報35として用意した特定ワードが、上記携帯電話2における認証時に用いられ得る特定ワードとなる。すなわち、不特定話者音響モデル情報35を準備しておくことで、認証時に用いられる特定ワードの候補を決めておくことができる。例えば、上記特定ワードとして、通話において出現頻度が高いワード、「もしもし」、「こんにちは」、「はい」等を指定することができる。
よって、出現頻度が高いワードを特定ワードに指定できるため、短時間でこれら特定ワードに対する音声の特徴を示す特徴量のサンプルを多数取得することができ、特定ワードに対する識別を効果的に行うことができる。
一方、特定話者サンプル情報36は、携帯電話2の正規のユーザによる通話から取得された特定ワードの音声データの特徴を示す特徴量のサンプルである。
すなわち、携帯電話2の使用開始時点では、記憶部27には、特定話者サンプル情報36は記憶されておらず、正規ユーザが携帯電話2を使って通話することによって、特定ワードに対する上記ユーザの音声データの特徴量サンプルが取得される。そして、携帯電話2のユーザの特定ワードに対する音声データの特徴量サンプルが取得されると、今後はこのサンプルと入力された音声データとの特徴量パターンが比較され、両者の類似度、すなわち適合率が算出される。なお、上記入力された音声データの特徴量パターンは、特定話者サンプル情報36の中で、当該入力された音声データと最も類似する特徴量パターンを示すサンプルと比較され、その適合率が算出される。
また、上記した当該携帯電話2の使用開始時に、不特定話者音響モデル情報35を用いて、正規ユーザの発声した特定ワードに対する音声を通話中の音声から取得する処理、あるいは、通話中の音声から特定ワードに対する正規ユーザの音声の特徴量サンプルを取得する処理に関する詳細は、下記に示す声紋識別部32が備える各部材の説明において記載する。
次に、声紋識別部32が備える各構成部材について説明する。
上記音声符号化部40は、音声入力部25から入力された、正規ユーザの音声のアナログ信号をパルス符号変調(Pulse code modulation;PCM)によって、一定の時間ごとに区切り、サンプリング部41によってサンプリングしてそれぞれの信号の大きさをデジタル信号のデータに変換しアベレージ部42に出力する。なお、この音声符号化部40は、上記信号処理部31と共有されるものであってもよい。
アベレージ部42は、サンプリング部41から入力されたデジタル信号のデータをフィルタによって雑音をカットし、音声伝送帯域の高域を強調する、いわゆるプリエンファシス処理を行うものである。
このようにして、本実施の形態に係る携帯電話2では、音声入力部25によって取得されたユーザの音声データは、音声の認識処理に適した強弱のあるデジタル信号に変換される。なお本実施の形態に係る携帯電話2において、この音声認識に適したデジタル信号に変換された音声データを、基礎信号と称する。
符号比較部43は、記憶部27にある音素辞書33を参照して、上記基礎信号と同じ音響モデルの音声データが当該音素辞書33に存在するか否かを確認するものである。すなわち、符号比較部43は、不特定話者音響モデル情報35として記憶されている特定ワードの音響モデルを参照して、該音響モデルと同一または類似する特徴量パターンを示す音声データを、入力された音声から探索する。
そして、符号化比較部43は、探索した音声データの基礎信号が示す特徴量パターンと音響モデルの特徴量パターンとの適合率を算出するように、適合率計測確認部45に指示を出す。
また、符号化比較部43は、適合率計測確認部45から、算出された適合率が所定の適合率以上である旨の通知受けると、基礎信号が示す特徴量のサンプルデータを作成するようにサンプル作成部44に指示を出す。
適合率計測確認部45は、符号比較部43によって選択された音響モデルの特徴量パターンと、基礎信号が示す特徴量パターンとの類似度、すなわち適合率を計算するものである。
適合率計測確認部45は、計測し確認した適合率の結果を符号比較部43に通知する。
また、適合率計測確認部45は、サンプル数タウンター部46から、サンプル作成部44で作成されたサンプル数が1,000に到達した旨の通知を受信すると、この通知の受信後に入力された音声データの基礎信号と特定話者サンプル情報36との適合率が99.5%以上あるか否かを確認するものでもある。適合率計測確認部45は、計測結果が99.5%以上であると確認した場合、個人識別可能報知部48および適合率結果通知部49に個人識別が設定値に達した旨通知する。
なお、上記所定の適合率は、携帯電話2の使用開始時点での初期設定では90%以上と設定されており、さらに適合率は、90%以上〜95%未満、95%以上〜97%未満、97%以上〜98%未満、98%以上〜99%未満、99%以上〜99.5%未満、99.5%以上〜100%までというふうにいくつかの段階が設けられている。
そして、符号化比較部43は、携帯電話2の使用開始時点では、基礎信号と不特定話者音響情報との適合率が90%以上であれば、この基礎信号の特徴量パターンをサンプルデータとして作成するようにサンプル作成部44に指示を出す。
また、特定話者サンプル情報36の特徴量パターンと、上記基礎信号の特徴量パターンとの適合率は、正規ユーザの体調の状態等の影響によって多少変動するが、一般的には特定ワードに対する上記ユーザの音声に基づく基礎信号のサンプル数が増加するにつれ限りなく100%に近づくことが知られている。
なお、上記基礎信号のサンプル数が1、000に到達した後に取得した音声に対して設定される上記適合率、99.5%は、これに限定されるものではなく、ユーザと他者との特定ワードに対する音声の特徴量パターンの相違をより正確に識別する必要がある場合、適合率の閾値を99.5%以上としてもよい。
また、適合率計測確認部45は、ユーザの認証処理時において、携帯電話2のユーザによって入力された特定ワードの上記基礎信号と、特定話者サンプル情報36との適合率が、所定回以内の音声入力において99.5%以上とならなかった場合、機器シャットダウン部47に、携帯電話2の動作状態を強制終了するように指示を出す。
なお、適合率計測確認部45は、上記したように、通話中の音声から、特定ワードに対する正規ユーザの基礎信号のサンプルを作成する場合に計測される適合率の閾値と、認証時に入力された音声の基礎信号と特定話者サンプル情報36との適合率の閾値とは変更されるように構成されている。この適合率における閾値の変更は、声紋制御部29からの指示に応じて、サンプル作成・認証判定部50からの通知に応じて行っている。
上記サンプル作成部44は、符号比較部43からの指示に応じて、基礎信号の特徴量のサンプルを作成し、特定話者サンプル情報36として音素辞書33に記録するものである。また、ある特定ワードに対する上記基礎信号のサンプルが作成されると、サンプル作成部44は、サンプルが作成された旨を伝える信号をサンプル数カウンター部46に入力する。
また、サンプル作成部44は、作成された基礎信号のサンプルデータがどの段階の適合率のものであるのか作成したサンプルデータと対応付けて特定話者サンプル情報36に記録する。したがって、作成された基礎信号のサンプル数と適合率の変化の履歴を記録しておくことができる。
サンプル数カウンター部46は、サンプル作成部44から入力された上記信号に応じて、当該サンプル作成部44で作成された音声データのサンプル数をカウントするものである。
サンプル数カウンター部46は、カウントした特定ワードのサンプル数が1,000に到達すると、適合率計測確認部45にその結果を通知する。
個人識別可能報知部48は、適合率確認部45から個人識別可能な条件に達した旨の通知を受信すると、声紋識別制御部29を介して、携帯通信制御部28に指示して、基地局3に、当該携帯電話2のユーザが発声する特定ワードの音声に対する認識が可能となった旨通知するものである。また、個人識別可能報知部48は、声紋識別制御部29を介して、携帯通信制御部28に指示して、表示部23に上記通知内容を表示させることでユーザに対しても通知する。なお、この通知が携帯電話2から基地局3に通知されることで、携帯電話2のユーザは、電子商店4a〜4cいずれかとのネットショッピングが可能な状態となる。
なお、この個人識別可能な条件とは、通話中から取得した特定ワードに対する基礎信号の特徴量のサンプル数が1,000となり、かつサンプル数が1,0000に達した直後に取得した基礎信号と、特定話者サンプル情報36との適合率が99.5%以上である場合である。
適合率結果通知部49は、適合率確認部45から個人識別が設定値に達した旨の通知を受信すると、記憶部27に記録されている上記携帯電話2の機器ID番号と、99.5%以上の適合率である特定ワードとを基地局3に送信するように、声紋識別制御部29を介して、携帯通信制御部28に指示するものである。
また、後述するが、適合率計測確認部45によって計測される適合率は、携帯電話2の使用開始時点での初期設定では90パーセント以上と設定されており、さらに適合率は、90%以上〜95%未満、95%以上〜97%未満、97%以上〜98%未満、98%以上〜99%未満、99%以上〜99.5%未満、99.5%以上〜100%までのいくつかの段階が設けられている。
そして、特定ワードの中で、例えば適合率が90%に達した場合、90%〜95%の段階の適合率が計測されたものとして、適合率計測確認部45からの指示を受け、適合率結果通知部49は、特定話者サンプル情報36を参照して該特定ワードを基地局2に通知する。なお、適合率結果通知部49は、このように特定ワードごとに、どの段階の適合率に達したかを基地局3に通知するようになっている。
機器シャットダウン部47は、適合率計測確認部45からの指示に応じて、声紋識別制御部29を介して、携帯電話2の電源部22を強制終了するように携帯通信制御部28に指示するものである。認証時において、入力された音声の基礎信号と特定話者サンプル情報36との適合率が、所定回数内の入力において99.5%以下である場合、適合率計測確認部45は、携帯電話2の電源部22を強制終了するように機器シャットダウン部47に指示する。
ここで、本実施の形態に係る携帯電話2における上記した声紋識別部32における各部材の動作をより明確にするために、具体例を挙げて説明する。なお、本実施の形態に係る携帯電話2は、上記したように、記憶部27に記録した音素辞書33に不特定話者音響モデル情報35が記憶されているものとする。なお、この不特定話者音響モデル情報35は、「もしもし」,「こんにちは」といった通話中において使用頻度が高いワードの音響モデルが音素辞書に記憶されている。
以下に、まず、携帯電話2を使用してユーザAが電子商店4a〜4cとのネットショッピング開始条件を満たすまでの処理、すなわちユーザAの音声に対する識別学習処理について説明する。
(ユーザの音声の識別学習処理)
まず、ユーザAが、携帯電話2の使用を開始し通話を行う。この通話の際にユーザAによって発声された音声は、音声入力部25を介して信号処理部31に入力され、携帯通信制御部28の指示に応じて、該信号処理部31によってデジタル信号の音声データに変換される。そして、この変換された音声データは、無線通信部30によって無線通信可能となるように処理されアンテナ21を介して基地局3に送信される。
このようにして、ユーザAは携帯電話2を使用して通話を行っている間、音声入力部25から入力されたユーザAの音声は信号処理部31で信号処理が行われる一方で、声紋識別制御部29の指示に応じて声紋識別部32でユーザAの音声に対する識別学習処理が行われる。
この識別学習処理とは、まず、音声入力部25から入力された音声データは、上記したように音声符号化部40でアナログ信号をPCMによって、一定の時間ごとに区切り、サンプリング部41によってサンプリングして、それぞれの信号の大きさをデジタル信号のデータに変換しアベレージ部42に出力する。
そして、アベレージ部42は、サンプリング部41から入力されたデジタル信号のデータをフィルタによって雑音をカットし、プリエンファシス処理を行い、音声の認識処理に適したデジタル信号である基礎信号を形成する。
ここで、携帯電話2の使用開始時点では、ユーザAの音声は初めて入力されたものであるため、符号化比較部43は、通話中から取得された音声の中から音素辞書33の不特定話者音響モデル情報35にもっとも類似する特徴量パターンを有する基礎信号を探索する。例えば、ユーザAの通話中に「もしもし」というワードが含まれている場合、この「もしもし」に対応する基礎信号部分を、不特定話者音響モデル情報35を参照して探索する。
そして、通話中の音声から「もしもし」に対応する基礎信号が探索されると、符号化比較部43は、適合率計測確認部45に指示をして、「もしもし」に対応する基礎信号と不特定話者音響モデル情報35との音響パターンを比較して両者の適合率を計測させる。
適合率計測確認部45は、計測した結果、上記両者の適合率が90%以上となった場合、符号化比較部43を介してサンプル作成部44に指示して、特定ワード「もしもし」に対応するユーザAの特徴量パターンのサンプルを作成させる。
サンプル作成部44は、作成した上記サンプルを、音素辞書33の特定話者サンプル情報36として記憶部27に、適合率計測確認部45によって計測された適合率とともに記録する。
また、サンプル作成部44が、ユーザAの通話中の音声から「もしもし」に対応する基礎信号の特徴量パターンのサンプルを作成すると、サンプル数カウンター部46は、サンプル作成部44からの指示に応じて、作成された上記サンプルの数をカウントする。この場合では、サンプル数カウンター部46はサンプル数1をカウントする。
このようにして、本実施の形態に係る携帯電話2では、ユーザAの「もしもし」に対する基礎信号の特徴量パターンのサンプルが取得され、特定話者サンプル情報36として記憶部27の音素辞書33に記録される。
ユーザAの「もしもし」の基礎信号に対する特徴量パターンのサンプルが作成されると、これ以降のユーザAの通話において「もしもし」と発声された音声の基礎信号に対して、符号比較部43は、特定話者サンプル情報36として記録されている、ユーザAの「もしもし」のサンプルを選択し、適合率計測確認部45が上記基礎信号と該サンプルとの適合率を計測する。
そして、適合率計測確認部45が、音声入力部25から入力された「もしもし」の基礎信号と特定話者サンプル情報36における「もしもし」のサンプルとの適合率を計測した結果、90%以上の適合率である場合、この基礎信号のサンプルをサンプル作成部44が作成し、特定話者サンプル情報36における「もしもし」のサンプルに加える。
そして、サンプル数カウンター部46は、「もしもし」に対するサンプル数を2とする。
このようにして、上記携帯電話2では、ユーザAが発声した「もしもし」の特徴量パターンのサンプルを増やしていく。
このように、上記携帯電話2は、取得した基礎信号が示す特徴量と、特定話者サンプル情報36と適合率が所定の閾値以上であるか否かに応じて、取得した基礎信号のサンプルを作成するか否かを決定するように構成されている。
このため、上記携帯電話2において、上記適合率が所定の閾値以上である基礎信号のみのサンプルをサンプル作成部44が作成することによって、ユーザAの発声する音声に対する識別精度が悪い基礎信号の特徴量に関する情報を削除することができる。このため、特定話者サンプル情報36として記録される情報は識別精度がある水準以上を保った良質な情報のみとすることができる。このため、認証時において、入力された音声に対して行われる認証結果の信頼性を高めることができる。
ところで、この基礎信号と特定話者サンプル情報36との適合率は、ユーザAの声の状態等により上がったり下がったりする。つまり、ユーザAの声質が、風邪などで変化したとしても声帯のスペクトラムは大きくは変化しない。しかし、ユーザAの発声する音声に対する識別を、この微妙な声質の変化によって誤認する場合がある。また、ユーザAが通話している周囲の環境の影響等によって生じるノイズ等によって、ユーザAの音声に対する識別率が大きく下がる場合がある。
しかし、一般的には、ユーザAの発声する音声に対する識別は、当該ユーザAが発声した音声データの特徴量パターンのサンプル数が増加すればするほど、この識別率が向上することが知られている。
そこで、本実施の形態に係る携帯電話2では、例えば、ユーザAの体調不良時に発声した音声に対する音響パターンのサンプルも取得しておく。このように、ユーザAの発声する音声の微妙な変化に対する音声データの特徴量パターンのサンプルも取得しておくことで、例えば、ユーザAが体調不良等により微妙に健康時と異なる音声を発声したとしても、誤認することなくユーザAの音声として識別することができる。
このように、本実施の形態に係る携帯電話2は、ユーザAの通話中の音声から、特定ワードに対する音響パターンのサンプルを取得して、サンプル数を増加させることができるため、A君の発声した特定ワード「もしもし」に対する識別率が限りなく向上する。
特に、特定ワードに対するユーザAの微妙な言い回しや癖、あるいは風邪で声の調子が悪い時の音響パターンを反映したサンプルを記憶しておくことができるため、ユーザA以外の第3者とユーザAとの特定ワードの音響パターンの相違をより正確に区別することができる。すなわち、特定話者サンプル情報36のサンプル数が増えれば、特定ワードに対して発声した、ユーザAと、このユーザA以外の人との音声の区別が明確となる。
なお、特定話者サンプル情報36のサンプル数の増加に伴う、上記適合率の変化は具体的には図8に示すようになる。図8は特定ワードに対するユーザの音声に関するサンプル数と、入力された特定ワードの音声に対する認識率(適合率)との対応関係を示すグラフである。
すなわち、ユーザAの発声した「もしもし」という特定ワードの音声データの特徴量パターンと、既に取得している「もしもし」の特徴量パターンのサンプルとの適合率は、上記サンプル数が1つの場合、90%であったとする。そして、このサンプル数が増えるごとに、入力された「もしもし」と既に取得している「もしもし」のサンプルとの適合率は、95%、93%、92%、96%、97%、95.5%、97.5%という様に、向上する傾向にある。この適合率の向上は、特定ワード「もしもし」に対するユーザAの音声と他者との音声とをより明確に区別する、すなわち、ユーザAが発声した特定ワードの音声に対する識別率が向上していることを示す。
また、上記したように、本実施の形態に係る携帯電話2の使用開始時点での初期設定では90パーセント以上と設定されており、さらに適合率は、90%以上〜95%未満、95%以上〜97%未満、97%以上〜98%未満、98%以上〜99%未満、99%以上〜99.5%未満、99.5%以上〜100%までというふうにいくつかの段階が設けられている。なお、この段階はこの実施例に限定されるものではなく、特定ワードのサンプル数に対する適合率の変化の傾向や、入力された音声の基礎信号の測定精度に応じて適宜変更して設定されることが好ましい。
例えば、ユーザAの発声した「もしもし」の基礎信号と不特定話者音響モデル情報35との比較において、適合率が91%であり、この基礎信号の特徴量パターンのサンプルデータが特定話者サンプル情報36として記録されたとする。
そして、次に入力された「もしもし」の基礎信号と上記特定話者サンプル情報36とを比較し、適合率を計測した結果が92%、さらに次に入力された「もしもし」の基礎信号と上記特定話者サンプル情報36との適合率が96%と変化したとする。
この場合、予め設定されている90%から95%の段階から95%〜97%の段階へと段階が変化しため、適合率計測確認部45は、適合率結果通知部49に指示して、適合率が95%〜97%の段階である旨とこの適合率を実現した特定ワード(「もしもし」)とを基地局3に通知させる。なお、適合率結果通知部49は、この通知を行う際、携帯電話2の機器ID番号34も共に送信する。
したがって、基地局3は、特定ワードの「もしもし」の適合率は、現在95%〜97%の段階にあると知ることができる。
なお、携帯電話2から通知された特定ワード「もしもし」と、適合率の段階の情報は、
基地局3側において、移動通信制御部12が個人識別データ登録部14に指示して携帯電話2の機器ID番号34に対応する情報として、個人識別情報テーブル18に通知された日時とともに記録する。
このように、設定された適合率の段階に達するごとに携帯電話2から基地局3に通知がなされることによって、基地局3は、特定ワード「もしもし」に対する適合率の変化を知ることができる。そして、上記したように適合率は、サンプル数の増加に伴い徐々に向上するものであるため、例えば、適合率がサンプル数の数が少ないにも関わらず急激に向上するなど、不正な適合率の操作が行われていないか監視することができる。
このようにして、本実施の形態に係る携帯電話2では、特定ワード「もしもし」に対するユーザAの特定話者音響情報36におけるサンプル数を増やす一方、ユーザAの通話中の中から例えば「さよなら」、「あした」、「なまえ」、および「じかん」といった他の特定ワードの種類も増やしていく。そして、特定ワードに対するサンプル数が1,000を超えると、携帯電話2は、電子商店4a〜4cとのネットショッピングを開始することができる条件となる。
上記したようにサンプル数カウンター部46は、特定ワードに対するユーザAの上記サンプル数が1,000に達すると、この到達した旨を適合率計測確認部45に通知する。そして、適合率計測確認部45は、この通知後に入力された特定ワードに対するユーザの音声の基礎信号と、特定話者サンプル情報36として記憶されているサンプルの中のもっとも近似する特徴量パターンのサンプルとを比較する。そして、両者の適合率が、99.5%以上であれば、適合率計測確認部45は、個人識別可能報知部48に指示して、携帯電話2による電子商店4a〜4cとネットショッピングが可能となったことを通知させる。
また、適合率計測確認部45は、適合率結果通知部49に指示して、適合率99.5%以上のサンプル数が1,000以上となった特定ワードと、携帯電話2の機器ID番号とを通知させる。
なお、適合率計測確認部45において、適合率の閾値を当初の90%から99.5%への変更は、サンプル数カウンター部46からの指示に応じて行う。
また、これら携帯電話2から送信された通知を基地局3が受信すると、移動通信制御部12は、個人識別データ登録部14に指示して、記憶部13の個人識別情報テーブル18に記録させる。
以下、携帯電話2が基地局3を介して、電子商店4a〜4cとのネットショッピングを実行する際に行われるユーザAに対する認証処理について説明する。より正確には、携帯電話2と電子商店4a〜4cとの間で行われるネットショッピングを許可するか否かを判定する、ユーザAの発声する音声に対する認証処理について図5および図7(a)、図7(b)を参照して説明する。
図5は、本実施の形態に係る携帯電話2におけるユーザの認証処理の一例を示すフローチャートである。また、図7は、本実施の形態に係る携帯電話2の表示部における、認証処理時およびネットショッピング実行時の表示状態の一例を示す図であり、同図(a)は、認証処理が成功しネットショッピングが実行された場合の表示状態の一例を示し、同図(b)は、認証処理に失敗した場合の表示状態の一例を示している。
(ユーザの認証処理)
ここで、本実施の形態に係る携帯電話2において、特定ワードの種類が10ワード、各特定ワードに対するユーザAの音声の特徴量パターンサンプル数が1,000となったとする。
また、携帯電話2は、基地局3に対して、当該携帯電話2は、電子商店4a〜4cとのネットショッピングを行うことが可能である旨通知している。
また、携帯電話2は、基地局3に対して、当該携帯電話2の機器ID番号と99.5%以上の適合率を計測できる特定ワードについても通知している。
したがって、基地局2における個人識別情報テーブル18には、ユーザが利用する携帯電話2の認証用特定ワードが記録される。
なお、個人識別情報テーブル18には、上記したように、上記機器ID番号34および上記認証用特定ワード以外に、ヒストリー情報、支払い情報、契約情報、および特定ワードの適合率の履歴情報も記録されている。
このように、ネットショッピングを実行可能とする条件に到達した携帯電話2において、ユーザが、キー操作部24を操作して、ネットショッピングを行うことを基地局3に対して要求する(ステップS1、これ以降S1のように称する)。なお、この携帯電話2から基地局3へのネットショッピング実行要求を送信する際、キー操作部24からのキー操作による指示に応じて、携帯通信制御部28は、記憶部27に記憶されている機器ID番号34も送信する。
また、キー操作部24によって操作する際に、表示部23において表示される情報は、図7(a)に示す表示状態1のように、携帯電話2において操作可能な機能を示したメニュー画面が表示される、そして、キー操作部24によって、このメニュー画面からネットショップを選択し、実行を押すことによって、ネットショッピングを実行することを基地局3に通知できる。
一方、基地局3は、無線によって、携帯電話2からネットショッピングの要求を受信すると(S2)、移動通信制御部12からの指示に応じて、電子商取引許可判定部16が、個人識別情報テーブル18を参照して、上記携帯電話2がネットショッピング可能な条件を満たした携帯電話2として登録がなされているか否かを判定する(S3)。
すなわち、電子商取引許可判定部16は、個人識別情報テーブル18を参照して、認証用特定ワードの存在の有無、電子商店4との契約の有無を確認する。さらに、個人識別情報テーブル18に記録されているヒストリー情報から電子商店4との取引実績の状態、支払い情報から電子商店4との取引における商品代金の支払い状況および、通話料金の支払い状況、特定ワードの履歴情報から認証用特定ワードの信用性の有無を確認する。
このように個人識別情報テーブル18を参照し、電子商取引判定部16が、上記携帯電話2がネットショッピング可能な携帯電話として登録がなされていないと判定した場合(S3において「NO」)、ネットショッピングの利用が許可されていない旨の通知を、移動通信制御部12を介して携帯電話2に通知する。
携帯電話2は、この通知を無線通信部30が受信すると、この通知内容を携帯通信制御部28に送信し、携帯通信制御部28は、この通知内容を表示するように表示部22に指示する。このようにしてネットショッピングの利用ができない旨を表示部23に表示させることによって、携帯電話2のユーザは、自身が所有する携帯電話2によってネットショッピングを行うことができないことを知ることができる。
一方、電子商取引判定部16が、上記携帯電話2がネットショッピング可能な携帯電話として登録がなされていると判定した場合(S3において「YES」)、特定ワード指定部17に、特定ワードを指定するように指示を出す。
特定ワード指定部17は、電子商取引判定部16からの指示に応じて、個人識別情報テーブル18を参照して、適合率99.5%以上である特定ワードの中から適当な特定ワードをランダムに選択する。そして、特定ワード指定部17は、選択した特定ワードを移動通信制御部12に渡し、該移動通信制御部12が、この選択された特定ワードに対する音声を入力するよう指示する要求を携帯電話2に送信する(S4)。
なお、基地局3側でステップS2〜ステップS4の処理が行われている間の携帯電話端末2における表示部23の表示状態は、図7(a)に示す表示状態2のように、ネットショッピング接続画面「しばらくお待ちください」といったことを示す画面によって、ユーザに待ち状態を示す。
携帯電話2では、基地局3から特定ワードの音声入力の要求を受信すると、携帯通信制御部28が、表示部23に指示して、基地局3から受信した要求の内容を表示させる。この時の表示状態は、図7(a)の表示状態3のように特定ワードの発声を要求する表示がされる。
このようにして表示部23が、上記要求の内容を表示し、ユーザに対して基地局3から指定された特定ワードの音声を発声するように要求する(S5)。
ユーザは、表示部23において表示された内容に応じて、基地局3によって選択された特定ワードを発声する。なお、ユーザは、この特定ワードを発声する前、キー操作部24によって、今回入力される特定ワードの音声は、ネットショッピングを実行する際の認証に用いるためのものである旨携帯電話2に通知する。キー操作部24からのユーザの通知は、携帯通信制御部28に渡され、携帯通信制御部28は、声紋識別制御部29を指示して、上記通知を声紋識別部32に送信するように指示する。
声紋制御部32は、携帯通信制御部2から上記ユーザの通知を受信すると、サンプル作成・認証判定部50に指示をして、符号化比較部43および適合率計測確認部45に、音声入力部25から入力される音声の基礎信号は、ネットショッピングの認証のために用いられるものである旨通知させる。そして、このサンプル作成・認証判定部50からの通知応じて、符号化比較部43および適合率計測確認部45は、入力された音声の基礎信号は、ネットショッピングを実行するにあたり、認証に用いられている音声の信号であることが分かる。
そこで、音声入力部25から、基地局3によって指定された特定ワードの音声が入力されると、音声符号化部40〜アベレージ部42によって、この音声の基礎信号が形成され、符号化比較部43は、この基礎信号と最も類似する特徴量パターンであるサンプルを特定話者サンプル情報36から選択し、適合率計測確認部45に、基礎信号と選択した特定話者サンプル情報36との適合率を計測するように指示する。
符号化比較部43からの指示に応じて、適合率計測確認部45は、上記基礎信号と選択した特定話者サンプル情報36との適合率を計測し、入力された音声が正規ユーザの音声と一致するか否か、すなわち、上記計測結果が99.5%以上であるか否かを確認する(S6)。
そして、計測結果が99.5%以上である場合(S6において「YES」)、適合率計測確認部45は、正規のユーザによる特定ワードの発声であるとみなし、ユーザに関する認証確認が完了した旨通知するように、認証結果通知部51に指示をする。認証結果通知部51は、適合率計測確認部45からの指示に応じて、声紋識別制御部29を介して、携帯通信制御部28に上記した通知を基地局3に送信するように指示を出す。
上記携帯通信制御部28は、認証結果通知部51からの上記指示を、声紋識別制御部29を介して受信すると、表示部23に指示して図7(a)の表示状態4に示すように、ユーザの個人認証が完了した旨を通知し、ネットショッピングの開始の確認をユーザに示す。この表示に対して、ユーザがキー操作部24によって、実行を選択しネットショッピングの実行指示を入力すると、この指示を携帯通信制御部28が受信する。そして、携帯通信制御部28は、基地局3に対して、携帯電話2のユーザの認証確認が終了した旨通知する(S7)。
一方、適合率計測確認部45は、上記基礎信号と選択した特定話者サンプル情報36との適合率を計測し、該計測結果が99.5%以下である場合(S6において「NO」)、認証結果通知部51に、認証確認ができなかった旨通知する。
認証結果通知部51は、適合率計測部45からのこの通知に応じて、声紋識別制御部29を介して携帯通信制御部28に、再度上記特定ワードの音声を入力するように指示する。
そして、携帯通信制御部28は、この声紋識別制御部29からの指示に応じて、表示部23に再度特定ワードの音声を入力するようユーザへの要求を表示させる(S9)。ここで、行われる表示は、図7(b)の表示状態21に示すように2回目の音声入力として特定ワードの発声をユーザに要求する。
そして、ユーザは、この表示部23において表示された要求に応じて、再度特定ワードの音声を入力する。なお、本実施の形態に係る携帯電話2において、適合率計測確認部45が基礎信号と特定話者音響情報36との適合率が99.5パーセント以上になるまで、特定ワードの音声を入力するように構成されている。
しかし、この特定ワードの音声の再入力には回数が限定されており、3回までとされている。したがって、特定ワードに対して2回目の音声の入力を試みたが、該音声と特定話者サンプル情報36との適合率がまた99.5%に満たない場合、図7(b)の表示状態22が示すように最後の音声の入力を要求する表示を行う。
なお、このユーザの認証処理時において、特定ワードの適合率の計測処理が何回行われたかについては、適合率計測確認部45は適合率が99.5%以下であると計測するたびに、この計測結果を符号化比較部43に通知する。そして、この通知を受信すると、符号比較部43は、サンプル作成部44を介してサンプル数カウンター部46に適合率が99.5%以下であった音声データの入力回数をカウントさせる。
サンプル数カウンター部46は、カウントが3回に達したと判定すると、適合率計測確認部45にその旨通知する。
したがって、3回目の音声の再入力において、適合率が99.5%に達しない場合(S10において「YES」)、適合率計測確認部45は、機器シャットダウン部47にユーザの認証に失敗した旨通知する。
機器シャットダウン部47は、適合率計測確認部45からの通知に応じて、声紋識別制御部29を介して、携帯通信制御部28に図7(b)の表示状態23に示すように、音声を入力した人に対して、発声された音声を正規ユーザの音声として識別できなかったため、認証ができなかった旨表示部23において表示する。そして、表示状態12に示されるように、もとのメニュー画面に戻る。
さらに、機器シャットダウン部47は、声紋識別制御部29を介して、携帯通信制御部28に対して、携帯電話2の本体の電源を強制終了するように指示を出す。そして携帯通信制御部28は、各種処理の指示を出している各部材への指示を停止し電源部22に本体電源をOFFするように指示を出す(S11)。
以上のようにして、本実施の形態に係る携帯電話2は、ユーザの特定ワードに対する音声を認証時の入力として用いることができる。また、入力された音声と、予め該ユーザから取得している特定話者サンプル情報36との適合率が99.5%以上とならなければ、認証が確認されたものとして基地局3に通知されないため、ユーザを高精度に識別することができる。すなわち、携帯電話2の正規のユーザ以外が、該携帯電話2を用いてネットショッピングを行おうとしても、この正規のユーザでない者の発声した特定ワードの音声は、上記適合率が99.5%以上とならないため、この携帯電話2によるネットショッピングは、正規ユーザのみによってしか実行できない。
つまり、携帯電話2の正規のユーザでない「B」が、該携帯電話2を用いてネットショッピングを行おうとした場合、「B」は、基地局3に対してネットショッピングの実行を要求する。そして、この「B」の要求に対して、基地局3から特定ワードの音声入力が要求される。
ここで、この特定ワードは、基地局3で選択したものであり、「B」が選択したものでないため、「B」は正規ユーザの声色を真似て発声することは困難である。
また、この特定ワードは、基地局3において、特定ワード指定部17が個人情報テーブル18に登録されている携帯電話2の機器ID番号34に対応する特定ワードの中から任意に選択したものである。このため、「B」が、例え正規ユーザが過去に入力した特定ワードを覚えておき正規ユーザの声色を練習したとしても、この覚えている特定ワードの入力を基地局3側から要求される可能性が低い上に、「B」の発声した特定ワードの音声と正規ユーザの音声から取得した特定話者サンプル情報36との比較において、適合率が99.5%以上を達成することはできない。
したがって、基地局3側からの特定ワードの音声入力に指示に応じて、「B」が特定ワードについて発声し、音声を入力した場合、正規ユーザの音声から取得された特定話者サンプル情報36と、この「B」によって入力された音声の基礎信号との適合率は99.5%以下と計測される。そこで、特定ワードの音声の再入力が求められ、「B」が発声した特定ワードの音声の特定話者サンプル情報に対する適合率が、3回とも99.5%以下になった時点で、上記したように機器シャットダウン部47の指示によって携帯電話2は強制終了される。
なお、この強制終了は、携帯通信制御部28が上記にて携帯電話2における各部材の全ての動作を停止させ、電源部22によって本体の電源をOFFにするように、携帯電話2は構成されていた。しかし、これに限定されるものではなく、携帯電話2において、携帯通信制御部28は、表示部23に指示してネットショッピングができない旨の通知を行い、例えば、通話機能等、当該携帯電話2を利用することによって課金される操作に関して実行できないように制御してもよい。
さらには、本実施の形態に係るネットショッピングシステム1において、認証処理時に、入力された特定ワードの音声の特定話者サンプル情報36に対する適合率が、3回とも99.5%以下になった場合、適合率計測確認部45は、適合率結果通知部49に指示して、携帯電話2の不正使用が行われている旨基地局3に通知するように指示を出す。
そして、適合率結果通知部49は、適合率計測確認部45からの指示に応じて、声紋識別制御部29を介して、携帯通信制御部28に上記通知を基地局3に送信するように指示する。このようにして、不正使用である旨基地局3に通知されると、基地局3は当該携帯電話2の通話権利を禁止するように設定されていてもよい。
したがって、本実施の形態に係るネットショッピングシステム1または携帯電話2では、正規のユーザ以外によるネットショッピングの実行を防止することができる。さらに、本実施の形態に係るネットショッピングシステム1または携帯電話2は、ネットショッピングの実行を試みた者が正規のユーザでないと判断した場合は、通話機能等、携帯電話2において課金される操作を停止させることができる。
なお、本実施の形態に係る携帯電話2の声紋識別部32では、音声入力部25によって入力された音声データの音響分析として例えば、ウェーブレット解析によるスペクトル分析を適用し、得られた特徴量を用いてHMMよって入力された音声データの特徴量パターンが得られるように構成されている。したがって、上記声紋識別部32では、標準的なアルゴリズムを用いており、アルゴリズムを実行するプログラムは数百Kバイト〜数Mバイトの容量に抑えることができる。
このため、声紋識別部2において実行される処理は、携帯電話2が備えるCPUあるいはDSP(Digital Signal Processor)によって十分実現できるものである。
また、本実施の形態に係る携帯電話2では、当該携帯電話2の正規ユーザの特定ワードに関する音声データを、正規ユーザの通話中に収集することができる構成である。このため、ユーザに特定ワードに対する音声の入力をわざわざ要求することなく、上記特定ワードに対するユーザの音声に関するサンプル数を増加させていくことができ、入力された正規ユーザの音声データに対する識別率を向上させることができる。
以上までが、携帯電話2においてユーザの認証を行う処理についての説明である。次に、ネットショッピングの認証が成功し、実際にネットショッピングを行う際の処理(ネットショッピング処理)について、図6および図7(a)、図7(b)を参照して説明する。
(ネットショッピング処理)
まず、携帯電話2からユーザの認証が完了した旨の通知を受信すると(S21)、基地局3は、ネットショッピング専用画面を携帯電話2に送信する(S22)。
すなわち、基地局3において、移動通信制御部12が携帯電話2からユーザの認証が完了した旨の通知を受信すると、契約サイト登録部15に指示してネットショッピング専用画面を記憶部13から取得する。そして、移動通信制御部12は、取得したネットショッピング専用画面を携帯電話2に基地局アンテナ10から無線で送信する。
一方携帯電話2は、基地局3から送信されたネットショッピング専用画面を、アンテナ21を介して無線通信部30で受信し、携帯通信制御部28に渡す。そして、携帯通信制御部28は、この受信したネットショッピング専用画面を表示するように表示部23に指示する。このようにして、表示部23によって表示された画面は、図7(a)の表示状態5に示すように、基地局3が契約している電子商店4a〜4cのサイト(サイトA〜サイトC)が示される。そして、この画面には、どの電子商店4a〜4cのサイトとのネットショッピングを行うかユーザに選択を促す内容が示される。
この表示画面に示された内容に対して、ユーザは、キー操作部24によってネットショッピングを所望する電子商店のサイトを選択する。そして、ユーザによって選択された上記サイトの情報は、携帯通信制御部28が、無線通信部30に指示してアンテナ21を介して無線で基地局3に送信する(S23)。
携帯電話2から送信された、上記サイトの情報は、基地局3側で、基地局アンテナ10を介して移動通信制御部12によって受信される。そして、移動通信制御部12は、受信した上記情報から携帯電話2のユーザが選択した電子商店4のサイトを確認し、ゲートウェイ11に指示して、通信ネットワーク6を通じて上記ネットショッピング先のサイトと接続を確立するように指示する。上記ネットショッピング先のサイトと基地局3との接続が確立すると、移動通信制御部12は、ゲートウェイ11に指示して、ネットショッピングの実行を要求する(S25)。
一方、基地局3から上記ネットショッピングの要求を受信すると、電子商店4は、ネットショッピング用画面のデータを、基地局3を介して携帯電話2に送信する(S27)。なお、ネットショッピング用画面のデータとは、電子商店4が取り扱うサービスのうちどのサービス(商品)の提供をユーザが所望するのかを選択できるように示すことが可能なデータである。
電子商店4から送信されたネットショッピング用画面のデータは、基地局3においてゲートウェイ11を介して、移動通信制御部12が受信する。そして、移動通信制御部12が、上記データを、基地局アンテナ10を制御して無線で携帯電話2に送信する。
携帯電話2は、基地局3を介して、電子商店4からネットショッピング用画面のデータを、アンテナ21を介して無線通信部30が受信すると(S28)、携帯通信制御部28が、この受信したデータを表示部23に送信して、このデータの表示指示を行う。そして、表示部23は、携帯通信制御部28からの指示に応じて、受信したデータを表示させる。
ここで、携帯電話2が選択した電子商店4のサイトがサイトAであり、該サイトAにおいて取り扱うサービス内容が、音楽CD(Compact disc)の販売である場合、上記表示部23に示される表示内容は、図7(a)に示す表示状態6〜表示状態10のように表示される。
すなわち、まず、上記ユーザに対して、該ユーザが購買を所望する音楽CDの属する音楽分野(種類)を表示し(表示状態6)、この音楽分野の中からユーザがクラシック音楽を、キー操作部24を操作して選択すると、クラシック音楽分野の作曲家の名前が表示される(表示状態7)。
この表示された作曲家の中からユーザが、ベートーベンを、キー操作部24を操作して選択すると、ベートーベンの作品が表示される(表示状態8)。さらに、ユーザがキー操作部24を操作して、ベートーベンの作品(音楽CDタイトル)の中からベストアルバムを選択すると、この選択した作品(音楽CDタイトル)の価格等詳細情報が表示される(表示状態9)。
このように上記サイトAから送信されたネットショッピング用画面のデータの表示内容を参照して、ユーザは購入品を決定し購入情報を確認する(S29)。そして、ユーザがキー操作部24を操作して、購入品を確定すると、ネットショッピング用画面では、表示状態10に示すように、購入商品の送付先とユーザがこの購入商品に対する代金を支払うクレジットカード情報の入力を促す表示がなされる。
上記表示状態10に示す表示内容に応じて、ユーザがキー操作部24を操作して、所望する商品の送付先と、商品代金の支払いを行うクレジットカード情報を入力し、これらの情報を、基地局3を介して電子商店のサイトに送信する(S30)。すなわち、携帯通信制御部28が、ユーザによって入力された商品の送付先情報と、クレジットカード情報とを無線通信部30に指示して、アンテナ21を介して基地局3に無線で送信する。
基地局3は、これらの情報を、携帯電話2から基地局アンテナ10を介して移動通信制御部12が受信すると、携帯電話2のネットショッピング先として接続している電子商店4のサイトに、受信した情報を送信するようにゲートウェイ11に指示を出す。
この指示に応じて、ゲートウェイ11は、上記受信した情報を、携帯電話2がネットショッピングを行っている電子商店4のサイトAに送信する。
電子商店4は、基地局3を介して、携帯電話2から上記送付先情報と、クレジットカード情報とを受信すると、これらの情報を確認する。そして、確認が完了すると、電子商店4は、ネットショッピング完了情報を基地局3に送信する(S32)。なお、このネットショッピング完了情報には、携帯電話2のユーザとの間において商取引が完了したことを示す情報のほかに、実際に取引が行われた商品および該商品の代金等を示す情報もふくまれている。
基地局3は、電子商店4からネットショッピング完了情報を受信すると、受信した該情報に基づき、携帯電話2のユーザと電子商店4との間で行われたネットショッピングの履歴情報を個人識別情報テーブル18に記録する(S34)。
すなわち、基地局3において、ゲートウェイ11を介して移動通信制御部12が上記ネットショッピング完了情報を電子商店4から受信すると、個人識別登録部14に指示して、ネットショッピングを行った履歴情報、すなわちクレジット決済を行った情報をヒストリー情報として個人識別情報テーブル18に記録させる。なお、この個人識別登録部14は、ネットショッピング開始要求時に携帯電話2から受信している機器ID番号34を参照して、該機器ID番号34の情報として上記ヒストリー情報を記録する。
このようにして、基地局3では、携帯電話2において行われたネットショッピングの履歴、すなわちクレジットカード決済の履歴情報をヒストリー情報として記録しておくことができる。
そして、上記ヒストリー情報が記録されると、移動通信制御部12は、基地局アンテナ10を制御して、携帯電話2にネットショッピングの完了通知を送信する(S35)。
この完了通知を、アンテナ21を介して無線通信部30が受信すると、携帯通信制御部28が、表示部23にネットショッピングが完了した旨を示す表示を指示する。そして、表示部23は、携帯通信制御部28からの指示に応じて、表示状態11に示すような、ネットショッピングを完了した旨を通知する表示を行う。そして、ユーザはこれ以上ネットショッピングを行う必要がない場合、キー操作部24を操作して、メニュー画面(表示状態12)に戻る。このようにして、携帯電話2と電子商店4との間におけるネットショッピングが実行される。
なお、上記にて、携帯電話2が電子商店4に対して、上記ユーザのクレジット情報を送信して、支払う商品代金のクレジット決済を行う構成であった。しかし、この構成に限定されるものではなく、ユーザが電子商店4のサイトから送信されたネットショッピング用画面において、所望する商品またはサービスの購入を決定した場合、このユーザによって決定された内容を示す情報と、購入する商品の送付先の情報とを基地局3を介して、電子商店4に送信する。
そして、電子商店4は、ユーザの所望する商品を確認し、該商品の購入代金を基地局3に請求する。この請求に応じて、基地局3がネットショッピングを行った携帯電話4の通話料金に、購入した商品の代金を上乗せして通話料金請求時にともに請求する構成であってもよい。この場合、ユーザは基地局3を介して電子商店にユーザのクレジット情報を送信する必要がないため、上記クレジット情報が漏洩したりする問題を防ぐことができる。
また、本実施の形態に係るネットショッピングシステム1では、上記認証処理時において、ユーザが入力する音声の特定ワードを基地局3側から任意に指定する構成であったが、これに限定されるものではなく、携帯電話2が任意に特定ワードを選択する構成であってもよい。この場合は、基地局3が、特定ワードを指定するための構成を省略することができるため、基地局3の設備投資にかかるコストを低減することができる。
また、本実施の形態に係るネットショッピングシステム1では、携帯電話2が上記声紋識別部32を備え、音素辞書33を記憶している構成であったが、基地局3がこの声紋識別部32を備え、音素辞書33を記憶している構成であってもよい。この場合、基地局3は、携帯電話2の通話を中継する際に、携帯電話2から通話中の音声も取得し、携帯電話2のユーザの音声の特徴量パターンを特定話者サンプル情報36として音素辞書33に記憶することとなる。このように、基地局3が声紋識別部32を備え、音素辞書33を記憶している構成の場合、通常の構成を有する携帯電話2を用いて携帯電話2のユーザの音声に対する認証処理を行うことができる。
また、本実施の形態に係るネットショッピングシステム1では、携帯電話2と基地局3と電子商店4を備えた構成であったが、携帯電話2の代わりに、特定のユーザによって使用される家庭内の電話器であってもよいし、基地局3と通信可能となる無線通信カードおよび、ユーザの音声を取得する集音装置を備えた、例えばPDAといった携帯情報機器であてもよい。携帯電話2の代わりに、集音装置を備えた、例えばPDAを用いる場合、該集音装置によって、PDAを所持する特定のユーザの日常会話から特定ワードの音声のサンプルを収集することとなる。
また、上記携帯電話3において、特定ワードに対する音声を探索し、この音声に対する特徴量パターンを音素辞書33に記録する構成であった。また、認証処理時に特定ワードの音声入力をユーザに要求する構成であったが、特定ワードといった単語に限定されるものではなく、単音である母音、子音を用いた音素の組み合わせであっても良い。
また、上記ユーザのみが知っている単語や音素の組み合わせであってもよい。
また、上記特定ワードは、携帯電話2および基地局3でのみ把握しており、上記ユーザすらも知らないものであってもよい。
また、上記携帯電話2が備える記憶部27の音素辞書33には、特定ワードに対して発声した不特定話者の音響モデルである不特定音響モデル情報35を予め記憶している構成であった。そこで、この不特定音響モデル情報35を音素辞書33に記憶せず、携帯電話2のユーザの通話中の音声を解析して、音声と音声との区切り(ブレイク)を基準にして、このブレイクで区切られる音素群を任意に選択し、この選択した音素群の特徴量のパターンが類似する音素群のサンプルを取得していく構成であってもよい。
この場合は、予め、不特定音響モデル情報35を備える必要がないため、予め携帯電話2において記憶しておくデータ量を低減させることができる。
なお、上記音声と音声との区切りとは、通話中において様々な単語が連続して出てくるが、単語間では必ず音声が発声されない区切り(ブレイク)が生じる。したがって、この区切り(ブレイク)を基準にして、通話中の音声から単語に該当する音素群を選択することができる。
なお、上記実施形態の携帯電話2および基地局3の各部や各処理ステップは、CPUまたはDSPなどの演算手段が、ROM(Read Only Memory)やRAMなどの記憶手段に記憶されたプログラムを実行し、キーボードなどの入力手段、ディスプレイなどの出力手段、あるいは、インターフェース回路などの通信手段を制御することにより実現することができる。
したがって、これらの手段を有するコンピュータが、上記プログラムを記録した記録媒体を読み取り、当該プログラムを実行するだけで、本実施形態の携帯電話2および基地局3の各種機能および各種処理を実現することができる。また、上記プログラムをリムーバブルな記録媒体に記録することにより、任意のコンピュータ上で上記の各種機能および各種処理を実現することができる。
この記録媒体としては、マイクロコンピュータで処理を行うために図示しないメモリ、例えばROMのようなものがプログラムメディアであっても良いし、また、図示していないが外部記憶装置としてプログラム読取り装置が設けられ、そこに記録媒体を挿入することにより読取り可能なプログラムメディアであっても良い。
また、何れの場合でも、格納されているプログラムは、マイクロプロセッサがアクセスして実行される構成であることが好ましい。さらに、プログラムを読み出し、読み出されたプログラムは、マイクロコンピュータのプログラム記憶エリアにダウンロードされて、そのプログラムが実行される方式であることが好ましい。なお、このダウンロード用のプログラムは予め本体装置に格納されているものとする。
また、上記プログラムメディアとしては、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやCD/MO/MD/DVD等のディスクのディスク系、ICカード(メモリカードを含む)等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する記録媒体等がある。
また、インターネットを含む通信ネットワークを接続可能なシステム構成であれば、通信ネットワークからプログラムをダウンロードするように流動的にプログラムを担持する記録媒体であることが好ましい。
さらに、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであることが好ましい。
以上より、本実施の形態に係る携帯電話2は、通話中のユーザの音声から、特定ワードの特徴量パターンのサンプルを作成し、該サンプル数を増加させることで、入力された音声に対する適合率を向上させることができるため、認証時において高精度の認証を行うことができる。また、これらは、安価で、比較的容易なアルゴリズムであるソフトウエアで実現できるため、携帯電話のような性能、使用状況が制限される装置においても利用することができる。このため、携帯電話2を使用するネットショッピングのセキュリティ対策に非常に有効となる。
また、携帯電話2においてユーザの音声に対する認証を行うことができるため、基地局3側は、高度な認証システムを構築したり、複雑な認証処理アルゴリズムを必要とするプログラムを実行させたりする必要がない。
なお、本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
また、上記した実施の形態では、携帯電話2のユーザの個人認証可能なシステムとして、ネットショッピングシステム1に関して説明したが、これに限定されるものではなく、携帯電話2のような通話機能を有する装置から特定の処理の要求を他の装置に行う際に、個人認証の必要となるシステム、例えば、ネットバンキングシステムなどにおいても利用できる。
例えば、上記したネットショッピングシステム1の代わりに、ネットバンキングシステムにおいて上記携帯電話2を利用する場合、電子商店4の代わりに、金融機関等のサイトとなる。
本発明に係る通話装置は、通話中の音声から収集した特定個人の音声に基づくサンプルを用いて、該特定個人の音声に対する認証に利用することができる。このため、上記通話装置は、特定の利用者によって使用されるような携帯電話やトランシーバ、電話機などの通話可能な装置を利用して個人識別を行う必要があるシステムに適用できる。
本実施の形態に係る携帯電話が備える声紋識別部の概略構成の一例を示すブロック図である。 本実施の形態に係るネットショッピングシステムの概略構成の一例を示す図である。 本実施の形態に係る基地局の概略構成の一例を示す図である。 本実施の形態に係る携帯電話の概略構成の一例を示す図である。 本実施の形態に係る携帯電話におけるユーザの認証処理の一例を示すフローチャートである。 本実施の形態に係る携帯電話におけるユーザのネットショッピング処理の一例を示すフローチャートである。 本実施の形態に係る携帯電話の表示部における、認証処理時およびネットショッピング実行時の表示状態の一例を示す図であり、同図(a)は、認証処理が成功しネットショッピングが実行された場合の表示状態の一例を示し、同図(b)は、認証処理に失敗した場合の表示状態の一例を示している。 特定ワードに対するユーザの音声に関するサンプル数と、該ユーザによって入力された特定ワードの音声に対する認識率(適合率)との対応関係を示すグラフである。
符号の説明
1 ネットショッピングシステム(通信認証システム)
2 携帯電話(通話装置)
3 基地局(中継処理装置)
4 電子商店(情報処理装置)
12 移動通信制御部(通信遮断手段)
14 個人識別データ登録部(適合度履歴情報取得手段)
16 電子商取引許可判定部(通信許可判定手段)
17 特定ワード指定部(認証指示手段)
25 音声入力部(音声取得手段)
33 音素辞書(識別情報)
43 符号比較部(識別情報更新手段)
44 サンプル作成(識別情報更新手段)(履歴情報記録手段)
45 適合率計測確認部(識別情報更新手段)(適合度算出手段)(認証手段)
46 サンプル数カウンター部(識別情報量算出手段)
47 機器シャットダウン部(動作制限手段)
48 個人識別可能放置部(認証実行可能通知出力手段)
49 適合率結果通知部(履歴情報出力手段)
50 サンプル作成・認証判定部(認証実行許可手段)
51 認証結果通知部(認証判定出力手段)

Claims (22)

  1. 音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行う認証手段を備えた通話装置であって、
    上記特定個人の通話中の音声を取得する音声取得手段と、
    上記音声取得手段によって取得された音声に基づき、上記識別情報を更新する識別情報更新手段とを備えていることを特徴とする通話装置。
  2. 上記識別情報は、特定個人の通話中における音声の特徴量に関する情報であり、
    上記認証手段は、入力された音声の特徴を示す特徴量と識別情報更新手段によって更新されている識別情報との適合度が所定の閾値以上であるか否かに応じて、入力された音声が特定個人の音声であるか否かの認証を行うことを特徴とする請求項1に記載の通話装置。
  3. 上記識別情報は、特定個人の通話中の音声に基づく、特定の音素群の特徴量に関する情報であり、
    上記認証手段は、特定個人の音声であるか否かの認証を、特定の音素群の入力に対してのみ行うことを特徴とする請求項1に記載の通話装置。
  4. 上記識別情報は、複数の不特定話者の音声における、特定の音素群の特徴量に関する情報をさらに含むことを特徴とする請求項2に記載の通話装置。
  5. 上記特定の音素群は、外部からの指示に応じて指定されることを特徴とする請求項3に記載の通話装置。
  6. 上記音声取得手段によって取得された音声の特徴量と、既に取得されている音声に基づいて更新されている識別情報との適合度を算出する適合度算出手段と、
    上記適合度算出手段によって算出された適合度が所定の閾値以上である場合、
    上記識別情報更新手段は、上記音声取得手段によって取得された音声に基づき、上記識別情報を更新することを特徴とする請求項1に記載の通話装置。
  7. 上記識別情報更新手段によって更新された識別情報の情報量に応じて、上記適合度が単調増加することを特徴とする請求項6に記載の通話装置。
  8. 上記適合度算出手段によって算出された適合度の履歴情報を記録する履歴情報記録手と、
    上記履歴情報記録手段によって記録された上記適合度の履歴情報を出力する履歴情報出力手段とを備えていることを特徴とする請求項6または7に記載の通話装置。
  9. 上記識別情報更新手段によって更新された識別情報の情報量を算出する識別情報量算出手段を備え、
    上記識別情報量算出手段が上記情報量が所定量に達したと判定した場合、上記認証手段に対し、入力された音声に対する認証の実行を許可する認証実行許可手段を備えていることを特徴とする請求項1に記載の通話装置。
  10. 上記識別情報量算出手段によって算出された上記情報量が所定量に達し、上記適合度算出手段によって算出された適合度が所定の閾値以上である場合、上記認証手段に対し、入力された音声に対する認証の実行を許可する認証実行許可手段を備えていることを特徴とする請求項9に記載の通話装置。
  11. 上記認証実行許可手段は、さらに入力された音声に対する認証を実行可能な状態となったことを示す通知を出力する認証実行可能通知出力手段を備えていることを特徴とする請求項9または10に記載の通話装置。
  12. 上記認証手段が、入力された音声が上記特定個人の音声でないと認証した場合、各種機能の動作を制限する動作制限手段を備えていることを特徴とする請求項1に記載の通話装置。
  13. 上記認証手段による認証結果を出力する認証判定出力手段を備えることを特徴とする請求項1に記載の通話装置。
  14. 請求項1ないし13のいずれか一項に記載の通話装置と、通信によって入力された情報を処理し、出力する情報処理装置との間における通信の中継を行う中継処理装置であって、
    上記通話装置から通知された認証の結果に応じて、上記通話装置と上記情報処理装置との通信を許可するか否かを判定する通信許可判定手段とを備えていることを特徴とする中継処理装置。
  15. 請求項1ないし13のいずれか一項に記載の通話装置と、通信によって入力された情報を処理し、出力する情報処理装置との間における通信の中継を行う中継処理装置であって、
    上記通話装置から上記適合度の履歴情報を取得する適合度履歴情報取得手段を備えていることを特徴とする中継処理装置。
  16. 入力する音声を指定して認証を指示する認証指示手段を備えていることを特徴とする請求項14または15に記載の中継処理装置。
  17. 上記通話装置から受信した認証結果が、入力された音声が上記特定個人の音声でない場合、上記通話装置からの通信を遮断する通信遮断手段を備えていることを特徴とする請求項14または15に記載の中継処理装置。
  18. 上記通話装置から入力された音声に対する認証を実行可能な状態となったことを示す通知を受信すると、該通話装置を認証可能な装置として記録する装置記録手段を備えていることを特徴とする請求項14または15に記載の中継処理装置。
  19. 上記特定個人の通話中の音声を取得する音声取得手段を有する通話装置と、該通話装置と情報処理装置との間の通信を許可するかの中継を行う中継処理装置とを備えた通信認証システムであって、
    音声を識別するための識別情報に基づき、上記通話装置に入力された音声が特定個人の音声であるか否かの認証を行う認証手段と、
    音声取得手段によって取得された音声に基づき、上記識別情報を更新する識別情報更新手段と、
    上記認証手段によって認証された結果に基づき、上記通話装置と上記情報処理装置との間の通信を許可するか否かを判定する通信許可判定手段とを備えていることを特徴とする通信認証システム。
  20. 音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行うステップと、
    上記特定個人の通話中の音声を取得するステップと、
    上記取得された音声に基づき、上記識別情報を更新するステップとを含むことを特徴とする通話装置の制御方法。
  21. 請求項1〜13の何れか1項に記載の通話装置を動作させるための制御プログラムであって、コンピュータを上記各手段として機能させるための通話装置の制御プログラム。
  22. 請求項21に記載の通話装置の制御プログラムが記録されたコンピュータの読取り可能な記録媒体。
JP2004194533A 2004-06-30 2004-06-30 通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体 Withdrawn JP2006017936A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004194533A JP2006017936A (ja) 2004-06-30 2004-06-30 通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004194533A JP2006017936A (ja) 2004-06-30 2004-06-30 通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2006017936A true JP2006017936A (ja) 2006-01-19

Family

ID=35792293

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004194533A Withdrawn JP2006017936A (ja) 2004-06-30 2004-06-30 通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2006017936A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007287050A (ja) * 2006-04-19 2007-11-01 Sankyo Kk 電子マネーシステム、および、取引装置
JP2007316930A (ja) * 2006-05-25 2007-12-06 Sankyo Kk 電子マネーシステム、および、取引装置
JP2008058452A (ja) * 2006-08-30 2008-03-13 Pioneer Electronic Corp 音声情報認証装置及び音声情報認証方法
JP2015516091A (ja) * 2012-07-09 2015-06-04 ▲華▼▲為▼終端有限公司Huawei Device Co., Ltd. 声紋特徴モデルを更新するための方法及び端末
JP2016017980A (ja) * 2014-07-04 2016-02-01 日本電信電話株式会社 声まね音声評価装置、声まね音声評価方法及びプログラム
JP2017529711A (ja) * 2015-06-30 2017-10-05 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 音声確認のための方法、装置、及びシステム
WO2018168369A1 (ja) * 2017-03-14 2018-09-20 株式会社Seltech 機械学習装置および機械学習プログラム
US10650825B2 (en) 2015-10-23 2020-05-12 Sharp Kabushiki Kaisha Communication device
CN111341325A (zh) * 2020-02-13 2020-06-26 平安科技(深圳)有限公司 声纹识别方法、装置、存储介质、电子装置
JPWO2021001998A1 (ja) * 2019-07-04 2021-01-07
WO2022034630A1 (ja) * 2020-08-11 2022-02-17 日本電気株式会社 音声処理装置、音声処理方法、記録媒体、および音声認証システム

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007287050A (ja) * 2006-04-19 2007-11-01 Sankyo Kk 電子マネーシステム、および、取引装置
JP2007316930A (ja) * 2006-05-25 2007-12-06 Sankyo Kk 電子マネーシステム、および、取引装置
JP2008058452A (ja) * 2006-08-30 2008-03-13 Pioneer Electronic Corp 音声情報認証装置及び音声情報認証方法
JP2015516091A (ja) * 2012-07-09 2015-06-04 ▲華▼▲為▼終端有限公司Huawei Device Co., Ltd. 声紋特徴モデルを更新するための方法及び端末
US9685161B2 (en) 2012-07-09 2017-06-20 Huawei Device Co., Ltd. Method for updating voiceprint feature model and terminal
JP2016017980A (ja) * 2014-07-04 2016-02-01 日本電信電話株式会社 声まね音声評価装置、声まね音声評価方法及びプログラム
US10423958B2 (en) 2015-06-30 2019-09-24 Baidu Online Network Technology (Beijing) Co., Ltd. Method, apparatus and system for voice verification
JP2017529711A (ja) * 2015-06-30 2017-10-05 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 音声確認のための方法、装置、及びシステム
US10650825B2 (en) 2015-10-23 2020-05-12 Sharp Kabushiki Kaisha Communication device
WO2018168369A1 (ja) * 2017-03-14 2018-09-20 株式会社Seltech 機械学習装置および機械学習プログラム
JPWO2018168369A1 (ja) * 2017-03-14 2020-01-30 積水ハウス株式会社 機械学習装置および機械学習プログラム
JP7082444B2 (ja) 2017-03-14 2022-06-08 積水ハウス株式会社 機械学習装置および機械学習プログラム
JPWO2021001998A1 (ja) * 2019-07-04 2021-01-07
WO2021001998A1 (ja) * 2019-07-04 2021-01-07 日本電気株式会社 音モデル生成装置、音モデル生成方法、および記録媒体
JP7294422B2 (ja) 2019-07-04 2023-06-20 日本電気株式会社 音モデル生成装置、音信号処理システム、音モデル生成方法、およびプログラム
US12106770B2 (en) 2019-07-04 2024-10-01 Nec Corporation Sound model generation device, sound model generation method, and recording medium
CN111341325A (zh) * 2020-02-13 2020-06-26 平安科技(深圳)有限公司 声纹识别方法、装置、存储介质、电子装置
WO2022034630A1 (ja) * 2020-08-11 2022-02-17 日本電気株式会社 音声処理装置、音声処理方法、記録媒体、および音声認証システム
JP7548316B2 (ja) 2020-08-11 2024-09-10 日本電気株式会社 音声処理装置、音声処理方法、プログラム、および音声認証システム

Similar Documents

Publication Publication Date Title
US10503469B2 (en) System and method for voice authentication
US8694315B1 (en) System and method for authentication using speaker verification techniques and fraud model
US6671672B1 (en) Voice authentication system having cognitive recall mechanism for password verification
JP6096333B2 (ja) 決済を検証するための方法、装置、およびシステム
US7657431B2 (en) Voice authentication system
AU2014281770B2 (en) Speech transaction processing
US6107935A (en) Systems and methods for access filtering employing relaxed recognition constraints
CN108040032A (zh) 一种声纹认证方法、账号注册方法及装置
JP4359887B2 (ja) 個人認証システム
US7949535B2 (en) User authentication system, fraudulent user determination method and computer program product
US20100114573A1 (en) Method and Device for Verifying a User
US20130103587A1 (en) Secure and portable payment system
KR20010022217A (ko) 휴대용 정보 및 거래 처리 디바이스 및 그것에서의 전자데이터 전송 거래 수행 방법
EP1902442A2 (en) Selective security masking within recorded speech utilizing speech recognition techniques
JP2007087081A (ja) 金融取引システム
US8032380B2 (en) Method of accessing a dial-up service
EP2879130A1 (en) Methods and systems for splitting a digital signal
JP2006017936A (ja) 通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体
US20130339245A1 (en) Method for Performing Transaction Authorization to an Online System from an Untrusted Computer System
JP7085437B2 (ja) 送金処理装置、及びプログラム
JP4440414B2 (ja) 話者照合装置及び方法
JP4408665B2 (ja) 音声認識用発話データ収集装置、音声認識用発話データ収集方法、及びコンピュータプログラム
JP3592415B2 (ja) 話者認識システム
CN108830604A (zh) 一种基于声音验证的交易支付方法
JP3715210B2 (ja) 金融機関口座特定方法及び金融機関口座特定システム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070904