JP2006017936A

JP2006017936A - 通話装置，中継処理装置，通信認証システム，通話装置の制御方法，通話装置の制御プログラム，および通話装置の制御プログラムを記録した記録媒体

Info

Publication number: JP2006017936A
Application number: JP2004194533A
Authority: JP
Inventors: Michitaka Toshimoto; 道隆利元
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2004-06-30
Filing date: 2004-06-30
Publication date: 2006-01-19

Abstract

【課題】特定個人の音声を認識するために、該特定個人に、音声の登録を要求するなどの煩雑な処理を必要とすることなく、特定個人の音声の認証を高精度に行える安価な通話装置を提供する。
【解決手段】本発明の携帯電話２は、音素辞書３３に基づき、入力された音声がユーザの音声であるか否かの認証を行う適合率計測確認部４５と、特定個人の通話中の音声を取得する音声入力部２５と、取得された音声に基づき、特定話者サンプル情報３６を作成し音素辞書３３を更新するサンプル作成部４４とを備えている。
【選択図】図１

Description

本発明は、個人認証に関するものであり、特には電子商取引等個人認証を必要とする場合において、音声による個人認証を行うことができる通話装置、中継処理装置に関するものである。

近年、ネットワーク上で商取引の一部あるいは全部を行う、いわゆる電子商取引（ネットショッピング）が普及しており、また携帯電話を利用者して電子決済を行うことができるシステムも提案されている。

その一方で、電子商取引において、決済等に利用するクレジットカードの番号が他人に漏洩したり、他人の携帯電話を使用して不正に商品を購買したりするなどの問題が生じ、取引の安全性の確保が重要となっている。特に、電子商取引において正規のユーザによる利用であるのか、提供された情報が正当な情報であるのかを判断する認証技術の重要性が高まっている。

例えば、この認証技術としては、指紋やアイリスといったバイオメトリクス技術を利用した個人識別方法が開発されており、セキュリティシステム、またはネットショッピング等の電子決済に利用されるようになってきている。

このようなバイオメトリック技術を利用して個人識別を行う方法としては、例えば、特許文献１では、主電話機と携帯電話機とからなるコードレス電話機において、携帯電話機の使用者の声紋を分析符号化する声紋分析器と、登録済みの該使用者の声紋と声紋分析器で分析した声紋とを比較し両者が一致するか否かを判定する比較器とを備え、この比較器の判定に応じて、主電話機の基本機能部の動作状態を切替える電話機方式が開示されている。

また、特許文献２では、人間の生物学的特徴のうち少なくとも１つを読み取る読取手段と、読み取ったデータを予め登録してある参照データとを対比し個人の認証を行う携帯個人認証装置が開示されている。

さらにまた、特許文献３では、ユーザの声紋データと認証プログラムに基づいて、ユーザが正当な権限を有するユーザであるか否かの認証を行うユーザ認証方法が開示されている。
特開平５−８３３５９号公報（１９９３年４月２日公開）特開２００１−９２７８６号公報（２００１年４月６日公開）特開２００３−３６２４６号公報（２００３年２月７日公開）

しかし、特許文献１に示す構成では、予め利用者の音声を登録させておく必要がある。このため、例えば、利用者の体調、または利用者の周囲を取り巻く環境の影響によって登録時における利用者の音声の調子と、認証時における利用者の音声の調子とに差異が生じる場合、認証時に誤認することがある。

また、特許文献２に示す構成も特許文献１に示す構成と同様に、予め利用者の生物学的特徴を登録させておく必要があるため、この生物学的特徴が利用者の体調、または利用者の周囲を取り巻く環境の影響によって変化が生じるものである場合、認証時に誤認するといった問題が生じる。

また、特許文献１および特許文献２に示される構成では、予め登録する声紋または生物学的特徴と、認証時に入力される声紋または生物学的特徴との比較において、認識率を高めるためには高精度の声紋システムなど高価なシステムが必要となりコストがかかるという問題が生じる。特に、携帯電話やＰＤＡなどの携帯端末では、小型化および低価格化が求められており、当該携帯電話に高価なシステムを備えることは困難である。

また、特許文献３に示す構成では、登録時において、ユーザによって５回入力された音声の声紋データに基づき、この声紋データの誤差データを算出し、当該声紋データとともに誤差データをサーバで記憶する構成である。しかし、登録時にユーザの音声を登録する構成であるため、やはり特許文献１および特許文献２と同様に、認証時における利用者の体調、利用者の周囲を取り巻く環境の影響により、認証時に入力されたユーザの音声を誤認する問題が生じる。また、特許文献３の構成は、登録時にユーザは複数回音声を登録する必要があり、ユーザに煩雑な処理を強いることとなる。

本発明は、上記の問題点に鑑みてなされたものであり、その目的は、特定個人の音声を認識するために、該特定個人に、音声の登録を要求するなどの煩雑な処理を必要とすることなく、特定個人の音声の認証を高精度に行える安価な通話装置，中継処理装置，通信認証システム，通話装置の制御方法，通話装置の制御プログラム，および通話装置の制御プログラムを記録した記録媒体を提供することにある。

本発明に係る通話装置は、上記した課題を解決するために、音声を識別するための識別に基づき、入力された音声が特定個人の音声であるか否かの認証を行う認証手段を備えた通話装置であって、上記特定個人の通話中の音声を取得する音声取得手段と、上記音声取得手段によって取得された音声に基づき、上記識別情報を更新する識別情報更新手段とを備えていることを特徴とする。

また、本発明に係る通話装置の制御方法は、上記した課題を解決するために、音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行うステップと、上記特定個人の通話中の音声を取得するステップと、上記取得された音声に基づき、上記識別情報を更新するステップとを含むことを特徴とする。

ここで、上記識別情報とは、例えば、特定の単語などを発声した音声などを識別できるものである。例えば、特定の単語の音声を収集しその音響モデルを生成するなど、識別する音声の特徴量パターンを記録することで実現できる。

本発明に係る通話装置は、上記音声取得手段によって特定個人の通話から取得した音声に基づき、上記識別情報を更新することができるため、特定個人に特徴的な音声の特徴を反映した識別情報を加えて更新していくことができる。

すなわち、上記通話装置は、特定個人に特徴的な音声を識別できる識別情報を、特定個人の通話から取得した音声に基づき更新していくことができるため、上記認証手段によって特定個人に特徴的な音声を、特定個人以外の音声と区別して識別できる。

また、通話中の音声に基づき、識別情報を更新することができるため、特定個人の体調または特定個人を取り巻く周囲の状態等によって、通常の音声と異なる場合の音声に基づく識別情報を更新しておくことができる。このため、認証時に特定個人の体調の変化等で通常の音声と異なる音声であっても、認証手段は特定個人の音声として認証することができる。

したがって、本発明に係る通話装置または通話装置の制御方法は、特定個人の音声をいかなる場合でも、精度よく他の人の音声と区別して認証することができる。

また、上記音声取得手段は、特定個人の通話中の音声を取得しているため、識別情報を得るためにわざわざ該特定個人に対して音声の入力を要求する必要がない。このため、特定個人の音声の認証を行うために、予め該特定個人の音声の登録処理を行うなど特別の処理の要求を強いることがなく、特定個人の識別を行うことができる。

また、本発明に係る通話装置または通話装置の制御方法における入力された音声の認証は、上記したように利用者の通話中の音声から、該利用者の音声の特徴を示した情報を識別情報として更新し、更新された識別情報に基づき、認証時に認証手段は入力された音声が利用者のものであるのか否かを判定する構成である。このため、入力された音声に対して上記利用者の音声であるか否かを認証するための処理において、特に複雑なアルゴリズムを実現する装置を備える必要が無い。

したがって、本発明に係る通話装置または通話装置の制御方法は、特定個人の音声を認識するために、該特定個人に、音声の登録を要求するなどの煩雑な処理を予め行う必要がなく、特定個人の音声の認証を、コストをかけずに高精度に行うことができる。

よって、上記通話装置は、煩雑な処理を強いることなく安価に高精度に特定個人の音声に対する認証を行うことができる。

なお、上記通話装置は、例えば電話機、携帯電話装置など、通話中に特定個人の音声を取得できる装置によって実現することができる。

また、本発明に係る通話装置は、上記した構成において、上記識別情報は、特定個人の通話中における音声の特徴量に関する情報であり、上記認証手段は、入力された音声の特徴を示す特徴量と識別情報更新手段によって更新されている識別情報との適合度が所定の閾値以上であるか否かに応じて、入力された音声が特定個人の音声であるか否かの認証を行うように構成されていることが好ましい。

上記特徴量とは、上記特定の音素群を発声した場合に生じる音声の音響特性を示すものである。

また、識別情報が、特定個人の通話中における音声の特徴量に関する情報である。このため、上記通話装置は、例えば、特定個人の体調の状態や、特定個人の周囲を取り巻く環境の状態の違いによって影響された特定個人の音声の特徴量に関する情報も識別情報として更新しておくことができる。

したがって、上記通話装置は、特定個人の認証時の体調状態または該特定個人を取り巻く環境の影響に関わらず、特定個人によって入力される音声を正確に識別することができる。

また、上記通話装置は、上記認証手段が、入力された音声の特徴を示す特徴量と識別情報更新手段によって更新されている識別情報との適合度が所定の閾値以上であるか否かに応じて、入力された音声が特定個人の音声であるか否かの認証を行うように構成されている。

このため、入力された音声の特徴量と、識別情報として更新している特定個人の通話中における音声の特徴量とを比較しその適合度が閾値以上であるか否かを判定するだけで、容易に認証を行うことができる。

よって、本発明に係る通話装置は、認証時における特定個人の状態に関わらず、容易に該特定個人の音声に対する認証を行うことができる。

なお、上記所定の閾値は、入力された音声に対して行われる認証に求められる精度に応じて、入力された音声が特定個人の音声であるか否かの範囲において設定される。

また、本発明に係る通話装置は、上記した構成において、上記識別情報は、特定個人の通話中の音声に基づく、特定の音素群の特徴量に関する情報であり、上記認証手段は、特定個人の音声であるか否かの認証を、特定の音素群の入力に対してのみ行うように構成されていてもよい。

上記特定の音素群とは、例えば、単音である母音、子音を用いた特定の音素の組み合わせであってもよいし、特定の単語であってもよい。

このように、識別情報が特定の長さを有する音素群の特徴量に関する情報であるため、入力する音声をこの特定の長さを有する音素群とすることで、認証を容易に行うことができる。すなわち、特定の音素群の入力に対してのみ認証を行うことで、認証対象の音声が明確となるため、認証を容易に行うことができる。

また、この特定の音素群が上記特定個人しか知らない場合、特定個人以外の第３者によって、不正に認証を行うことを防ぐことができる。

また、本発明に係る通話装置は、上記した構成において、上記識別情報は、複数の不特定話者の音声における、特定の音素群の特徴量に関する情報をさらに含んでいることが好ましい。

識別情報は、複数の不特定話者の音声に基づく、特定の音素群の特徴量に関する情報を含んでいるため、上記通話装置において特定個人の通話実績がない場合であっても、特定個人の通話における音声の中から特定の音素群に対応する部分を容易に特定することができる。

したがって、上記特定個人の通話実績のない通話装置であっても、該特定個人の通話中の音声から、上記識別情報を更新するために利用する音声を上記音声取得手段は容易に取得できる。

また、本発明に係る通話装置は、上記した構成において、上記特定の音素群は、外部からの指示に応じて指定されることが好適である。

上記特定の音素群が外部からの指示に応じて指定されるため、音声を入力する前の段階では、どのような音声を入力すべきか分からない。このため、上記特定個人以外のものが予め該特定個人の音声を真似るように練習しておくなど、特定個人になりすまして音声を入力し認証を行うことを防ぐことができる。

このため、上記認証に対する安全性を向上させることができる。

また、本発明に係る通話装置は、上記した構成において、上記音声取得手段によって取得された音声の特徴量と、既に取得されている音声に基づいて更新されている識別情報との適合度を算出する適合度算出手段と、上記適合度算出手段によって算出された適合度が所定の閾値以上である場合、上記識別情報更新手段は、上記音声取得手段によって取得された音声に基づき、上記識別情報を更新するように構成されていてもよい。

ここでまず、上記特徴量情報の適合度とは、先に入力されている特定個人の音声の特徴量を示す特徴量情報と、次に入力された特定個人の音声の特徴量を示す特徴量情報との類似度である。したがって、この適合度が高い、すなわち類似度が高いということは、既に入力された音声の特徴量と、今回入力された音声の特徴量との類似度が高いということであり、入力された音声に対して上記特定個人によって発声された音声として識別できる確率が高いということである。

また、上記所定の閾値とは、上記適合度がどのくらいまでであれば、入力された音声が上記特定個人の音声としてみなすことができるという基準であり、この基準は、認証手段による認証処理に求められている認証精度に応じて決めることができる。

また、この閾値は、上記識別情報の情報量に応じて適合度が変化する場合は、情報量に応じて段階的に変化するものであってもよい。また、適合度の変化に応じて、段階的に変化するものであってもよい。

上記識別情報更新手段は、取得された音声の特徴量情報と識別情報との適合度が所定の閾値以上である場合に、該取得された音声に基づき識別情報を更新する。このため、識別更新手段は取得した音声を選択して識別情報を更新することができる。

すなわち、上記適合度が所定の閾値以上である音声にのみ基づいて、識別情報が更新されるため、特定個人の発声する音声に対する識別精度が悪い特徴量に関する情報を削除することができる。

このため、識別情報は識別精度がある一定水準以上の適合度を保った良質な情報のみとすることができる。このため、認証時において、入力された音声に対して行われる認証結果の信頼性を高めることができる
よって、上記識別情報は、特定個人の音声を識別するために必要となる音声に基づく情報となり、入力された音声に対する認証を認証手段が精度よく行うことができる。

また、本発明に係る通話装置は、上記した構成において、上記識別情報更新手段によって更新された識別情報の情報量に応じて、上記適合度が単調増加することを特徴とすることが好適である。

更新された識別情報の情報量に応じて、適合度が単調増加するため、例えばこの情報量と適合度との対応関係を示す履歴情報を記録すれば、故意に適合度を変更させたものであるか否かを判断することができる。したがって、この場合、適合度を故意に変更させ認証を行うことを防ぐことができるため、上記通話装置は信頼性の高い認証を行うことができる。

また、本発明に係る通話装置は、上記した構成において、上記適合度算出手段によって算出された適合度の履歴情報を記録する履歴情報記録手と、上記履歴情報記録手段によって記録された上記適合度の履歴情報を出力する履歴情報出力手段とを備えている構成であってもよい。

上記通話装置は、履歴情報記録手段を備えているため、上記適合度の履歴を記録することができる。そして、履歴情報出力手段を備えているため、記録した上記適合度の履歴を出力することができる。例えば、上記適合度の履歴を上記通話装置の外部に備えられた表示装置に出力される場合、適合度の変化を確認することができるため、故意にこの適合度を変更させたものであるか否かを確認することができる。

また、上記通話装置の認証結果を処理する装置を、例えば、該通話装置の外部に設けられている場合、この認証結果を処理する装置に、上記適合度の履歴を出力することによって、該認証結果を処理する装置は、通話装置で行われた認証結果の適否を確認することができる。

したがって、この場合、適合度を故意に変更させ認証を行うことを防ぐことができるため、上記通話装置は信頼性の高い認証を行うことができる。

また、本発明に係る通話装置は、上記した構成において、上記識別情報更新手段によって更新された識別情報の情報量を算出する識別情報量算出手段を備え、上記情報量算出手段が上記情報量が所定量に達したと判定した場合、上記認証手段に対し、入力された音声に対する認証の実行を許可する認証実行許可手段を備えていることが好ましい。

ここで、上記識別情報の情報量に応じて適合度は単調増加するため、該情報量との関係から、情報量が所定量に達した時点での適合度が分かる。

また、上記通話装置は、認証実行許可手段を備えているため、入力された音声の特徴を示す特徴量情報と識別情報との適合度が認証を行うために必要な適合度を確保できる時点で、認証を実行することができる。

よって、上記通話装置は、入力された音声に対して確実で正確な認証を行うことができる。

また、本発明に係る通話装置は、上記した構成において、上記識別情報量算出手段によって算出された上記情報量が所定量に達し、上記適合度算出手段によって算出された適合度が所定の閾値以上である場合、上記認証手段に対し、入力された音声に対する認証の実行を許可する認証実行許可手段を備えていてもよい。

上記認証実行許可手段は、上記情報量が所定量に達し、適合度が所定の閾値以上である場合に認証手段に対して入力された音声に対する認証の実行許可を与える。このため、認証を行うために必要な適合度を確保でき、さらに上記情報量からこの適合度の信頼性を確認することができる。

よって上記通話装置は、上記認証実行許可手段を備えているため、入力された音声の特徴を示す特徴量情報と識別情報との適合度が認証を行うために必要な適合度を確実に確保できる時点で、認証を実行することができる。

それ故、上記通話装置は、入力された音声に対して確実で正確な認証を行うことができる。

また、本発明に係る通話装置は、上記した構成において、上記認証実行許可手段は、さらに入力された音声に対する認証を実行可能な状態となったことを示す通知を出力する認証実行可能通知出力手段を備えていることが好ましい。

上記通話装置は、上記認証実行可能通知手段を備えているため、例えば、上記通話装置による認証結果を利用して処理を行う装置が、該通話装置の外部に備えられている場合、この外部に備えられた装置に認証処理を行うことができることを知らせることができる。

また、本発明に係る通話装置は、上記した構成において、上記認証手段が、入力された音声が上記特定個人の音声でないと認証した場合、各種機能の動作を制限する動作制限手段を備えていることが好ましい。

上記認証手段が、入力された音声が上記特定個人の音声でないと判断した場合とは、上記通話装置が上記特定の個人以外の第３者によって使用されている場合である。

そこで動作制限手段が各種機能の動作を制限するため、上記第３者によって不正に通話装置が使用されることを防ぐことができる。

なお、上記各種機能とは、例えば、通話機能、メール送信機能、データ送信機能等、第３者によって不正に使用されることで、上記特定の個人に不利益を与えるような機能である。上記制限するとは、例えば、上記各種機能を全く使用できなくするか、上記特定の個人に不利益を与える機能以外は有効とするなど、少なくとも第３者の使用によって特定の個人に不利益を与えるような機能に関しては使用不可能な状態にすることである。

よって、本発明に係る通話装置は、特定の個人以外の使用を防止することができる。

また、本発明に係る通話装置は、上記した構成において、上記認証手段による認証結果を出力する認証判定出力手段を備えていてもよい。

したがって、例えば本発明に係る通話装置において得られた認証結果を利用する装置が該通話装置の外部に備えられている場合、この装置はこの認証結果を利用して処理を実行することができる。

また、本発明に係る中継処理装置は、上記した課題を解決するために、上記音声取得手段、上記識別情報更新手段、上記適合度算出手段、上記履歴情報記録手段、上記履歴情報出力手段、上記認証判定出力手段、および上記認証実行可能通知出力手段を備え、音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行う認証手段を備えた通話装置と、通信によって入力された情報を処理し、出力する情報処理装置との間における通信の中継を行う中継処理装置であって、上記通話装置から通知された認証の結果に応じて、上記通話装置と上記情報処理装置との通信を許可するか否かを判定する通信許可判定手段とを備えている。

したがって、通話装置からの通信を特定個人によって行われているか否かを確認して、該通話装置から上記情報処理装置への通信を許可することができる。

また、本発明に係る通話装置は、上記した課題を解決するために、上記音声取得手段、上記識別情報更新手段、上記適合度算出手段、上記履歴情報記録手段、上記履歴情報出力手段、上記認証判定出力手段、および上記認証実行可能通知出力手段を備え、音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行う認証手段を備えた通話装置と、通信によって入力された情報を処理し、出力する情報処理装置との間における通信の中継を行う中継処理装置であって、上記通話装置から上記適合度の履歴情報を取得する適合度履歴情報取得手段を備えていることを特徴とする。

したがって、上記通話装置は、適合度履歴情報取得手段を備えているため、上記通話手段において、取得された音声に対する識別情報の適合度の履歴を管理することができる。したがって、上記中継処理装置は、例えば、認証時に入力された音声と識別情報との適合度の信用性を示す情報を提供することができる。なお、本発明に係る中継処理装置の構成と、上記にて示した、通信許可手段を備える中継処理装置の構成とを組み合わせた構成であってもよい。

また、本発明に係る中継処理装置は、上記した構成において、入力する音声を指定して認証を指示する認証指示手段を備えていることが好ましい。

すなわち、上記中継処理装置は、上記認証指示手段を備え、認証のために入力する音声を指定しているため、通話装置において勝手に認証用の音声を決定することができない。

このため、通話装置側で、例えば予め不正に準備した音声を使って認証を行うことを防ぐことができる。

したがって、上記中継処理装置は、認証結果の信頼性を確保し信頼性のある認証結果に基づき、上記情報処理装置への通信の中継を行うか否かを判断することができる。

また、本発明に係る中継処理装置は、上記した構成において、上記通話装置から受信した認証結果が、入力された音声が上記特定個人の音声でない場合、上記通話装置からの通信を遮断する通信遮断手段を備えていてもよい。

上記中継処理装置は、通信遮断手段を備えているため、例えば、上記中継処理装置が通信サービスを提供しており、通話装置がこのサービスの加入者である場合、入力された音声が上記特定個人の音声でないときは通話装置の通信を遮断させることができる。

よって、認証結果において入力された音声が上記特定個人の音声でないと判断した場合、上記中継処理装置は、通話装置の通信を遮断することができるため、上記特定個人以外の人によって、上記通話装置が利用されることを防ぐことができる。

また、本発明に係る中継処理装置は、上記した構成において、上記通話装置から入力された音声に対する認証を実行可能な状態となったことを示す通知を受信すると、該通話装置を認証可能な装置として記録する装置記録手段を備えていてもよい。

したがって、上記中継処理装置は、上記装置記録手段を備えているため、上記通話装置が入力された音声に対する認証が可能な装置であるか否かを管理しておくことができる。

したがって、通話装置に入力された音声の認証を要求する際に、当該通話装置が入力された音声に対する認証を行うことができ装置であるのか否かを即座に判定することができる。

また、本発明に係る通信認証システムは、上記した課題を解決するために、上記特定個人の通話中の音声を取得する音声取得手段を有する通話装置と、該通話装置と情報処理装置との間の通信を許可するかの中継を行う中継処理装置とを備えた通信認証システムであって、音声を識別するための識別情報に基づき、上記通話装置に入力された音声が特定個人の音声であるか否かの認証を行う認証手段と、音声取得手段によって取得された音声に基づき、上記識別情報を更新する識別情報更新手段と、上記認証手段によって認証された結果に基づき、上記通話装置と上記情報処理装置との間の通信を許可するか否かを判定する通信許可判定手段とを備えていることを特徴とする。

したがって、上記通信システムは、上記通話装置に入力された音声が特定個人の音声であるか否かの認証を行うことができ、また、取得された音声に基づき、上記識別情報を更新することができる。また、入力された音声に対して認証された結果に基づき、上記通話装置と上記情報処理装置との間の通信を許可するか否かを判定することができる。

なお、上記画像印刷装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各手段として動作させることにより上記画像印刷装置をコンピュータにて実現させる画像処理プログラム、およびそのアドレス供給装置の制御プログラムを記録したコンピュータ読取り可能な記録媒体も、本発明の範疇に入る。

本発明に係る通話装置は、以上のように音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行う認証手段を備えた通話装置であって、上記特定個人の通話中の音声を取得する音声取得手段と、上記音声取得手段によって取得された音声に基づき、上記識別情報を更新する識別情報更新手段とを備えていることを特徴とする。

また、本発明に係る通話装置の制御方法は、以上のように、音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行うステップと、上記特定個人の通話中の音声を取得するステップと、上記取得された音声に基づき、上記識別情報を更新するステップとを含むことを特徴とする。

よって、上記通話装置または通話装置の制御方法は、煩雑な処理を強いることなく安価に高精度に特定個人の音声に対する認証を行うことができるという効果を奏する。

本実施の形態に係るネットショッピングシステム１は、ユーザが携帯電話２を使用して、電子モール５の各電子商店４ａ〜４ｃが提供するサービスを利用できるシステムである。以下図２を参照して、本実施の形態に係るネットショッピングシステム１の概略構成について説明する。なお、この図２は、本実施の形態に係るネットショッピングシステム１の概略構成の一例を示す図である。

図２に示すように、上記ネットショッピングシステム１は、携帯電話２、基地局３、および電子モール５を備えている。そして、上記ネットショッピングシステム１では、携帯電話２と基地局３とは無線によって通信可能な状態である。また、基地局３は、インターネットあるいはイントラネット（以下通信ネットワーク６）を通じて、電子モール５の電子商店４ａ〜４ｃに通信可能に接続されている。

このように、ネットショッピングシステム１では、基地局３を介して携帯電話２と電子商店４ａ〜４ｃとが通信できるようになっており、両者の間における電子商取引（ネットショッピング）を実現可能とする。

上記携帯電話２は、通常の携帯電話が有する通話機能に加えて、後述するが音声識別機能（声紋識別部３２）を有しおり、基地局３と無線によって通信を行うことによって、他の携帯電話との通信を確立したり、また電子モール５の電子商店４ａ〜４ｃいずれかとのネットショッピングを実現したりする。

また、上記基地局３は、広域電気通信サービスを提供するとともに、ネットワーク上に開設された電子商店４ａ〜４ｃのサイトを管理するものである。また、電子商店４ａ〜４ｃは、商品の販売や情報等のサービスを携帯電話２のユーザに提供する通信ネットワーク６上に開設されたサイトである。この電子商店４ａ〜４ｃは、携帯電話２の表示画面に適した仕様のショッピング案内画面を作成し、基地局３を介して携帯電話３にこのショッピング案内画面のデータを送信する。なお、電子商店４ａ〜４ｃを特に区別して説明する必要がある場合以外は、本明細書において単に電子商店４として示す。

以下、上記ネットショッピングシステム１における基地局３および携帯電話２の構成に関して図１，図３,および図４を参照して詳細に説明する。なお、図３は、本実施の形態に係る基地局３の概略構成の一例を示す図であり、図４は、本実施の形態に係る携帯電話２の概略構成の一例を示す図である。また、図１は、本実施の形態に係る携帯電話２が備える声紋識別部３２の概略構成の一例を示すブロック図である。

（基地局の構成）
図３に示すように、上記基地局３は、基地局アンテナ１０、ゲートウェイ（ＧＷ）１１，移動通信制御部１２，および基地局記憶部１３，個人識別データ登録部１４、契約サイト登録部１５，電子商取引許可判定部１６，および特定ワード指定部１７を備えている。

基地局アンテナ１０は、携帯電話２から基地局３に発信されたデータを受信したり、基地局３から携帯電話２にデータを発信したりするためのアンテナである。基地局アンテナ１０は、移動制御部１２に制御されることによって、携帯電話２からデータを受信したり、送信したり、移動通信制御部１２の指示に応じて携帯電話２に対してデータの送受信を行う。

ゲートウェイ１１は、通信ネットワーク６を通じて、基地局３が電子モール５の各電子商店４ａ〜４ｃと通信可能とするためのものである。ゲートウェイ１１は、移動通信制御部１２からの指示に応じて、媒体やプロトコルが異なるデータを相互に変換して、基地局３と各電子商店４ａ〜４ｃとの通信を可能とさせる。

基地局記憶部１３は、読み書き可能な不揮発性の記憶媒体であり、例えばハードディスクやフラッシュＥＥＰＲＯＭ等によって実現できる。そして、この基地局記憶部１３は、個人識別情報テーブル１８および契約サイト情報１９を記憶している。

この個人識別情報テーブル１８には、機器ＩＤ番号３４と、認証用特定ワードと、ヒストリー情報と、契約情報と、特定ワードの適合率（適合度）の履歴情報とが記録されている。

なお、上記機器ＩＤ番号３４は、電子商店４ａ〜４ｃのいずれかとネットショッピングを行うことが許可された携帯電話２のＩＤ番号である。

認証用特定ワードとは、携帯電話２のユーザに認証を指示する際に、音声入力を要求する特定ワードである。

より具体的には、本実施の形態に係る携帯電話２では、当該携帯電話２を利用する正規ユーザの通話中における音声データの中から特定ワードに対する音声データを抽出する。

そして、抽出したこの音声データの特徴量パターンと、音声辞書３３にある特定話者サンプル情報３６として記憶されている過去にユーザの音声データから取得した特定ワードのサンプルとを比較するように構成されている。すなわち、通話中の中から抽出した音声データの特徴量パターンと、音素辞書３３のサンプルの中で、当該音声データの特徴量パターンにもっとも類似する特徴量パターンを示すサンプル選択し比較する。

そして、上記認証用特定ワードとは、両者の比較において示される類似度、すなわち、適合率が９９．５％以上であり、かつサンプル数が１、０００に達している単語である。

なお、この適合率とは、入力された特定ワードの音声の特徴量パターンと、既に取得されているユーザの特定ワードの音声の特徴量パターンとの類似度を示す値であり、特定のユーザによって入力された音声に対する認識率と呼ぶこともできる。

また、特定ワードの適合率の履歴情報とは、特定ワードに関して上記適合率の変化を示す履歴情報である。つまり、後述するが、上記適合率は、一般的に、上記ユーザの音声データのサンプル数が増加すればするほど単調増加することが知られている。したがって、特定ワードの適合率の履歴情報とは、特定ワードに関する上記適合率の変化を示す情報である。

また、上記ヒストリー情報とは、該携帯電話２と電子商店４ａ〜４ｃとの間で実行されたネットショッピングの取引結果の履歴情報、上記携帯電話２のユーザの携帯電話使用料金の支払い状況の履歴、およびネットショッピングによる料金の支払い状況の履歴を示す情報である。

また、契約情報とは、当該携帯電話２のユーザと電子商店４ａ〜４ｃとの間で交わされたネットショッピングに関する契約情報である。

一方、上記契約サイト情報１９は、基地局３を運営し通信サービスを提供するキャリアが、社会的な信頼を得ていると判断し、契約した電子商店４ａ〜４ｃのサイトの情報である。

移動通信制御部１２は、基地局３によって実行される各種通信処理の制御を行うものである。具体的には、携帯電話２から他の携帯電話への通話要求を受信した場合、通話先が基地局３の管轄内にある他の携帯電話であれば、通話先に通信をつなげるように処理をしたり、あるいは、通話先が他の基地局の管轄内であれば、他の基地局につなげたりするなど、携帯電話２と携帯電話２のユーザが所望する通話先との中継処理を行うものである。

また、携帯電話２から電子商店４ａ〜４ｃいずれかのサイトへの接続が要求された場合、ゲートウェイ１１に指示をして、通信ネットワーク６を通じてネットワーク上の電子商店４ａ〜４ｃのサイトとの接続を中継するものでもある。

個人識別データ登録部１４は、上記した個人識別情報テーブル１８に、機器ＩＤ番号３４、認証用特定ワード、特定ワードの適合率の履歴情報、ヒストリー情報、料金支払い情報、および契約情報を記録するものである。

より具体的には、携帯電話２から当該携帯電話２の機器ＩＤ番号３４、認証用特定ワード、特定ワードの上記適合率の履歴を、基地局アンテナ１０を介して移動通信制御部１２が受信すると、個人識別データ登録部１４に指示して個人識別情報テーブル１８に記録させる。また、電子商店４ａ〜４ｃから、携帯電話２のユーザのヒストリー情報、料金支払い情報、および契約情報の通知を、ゲートウェイ１１を介して移動通信制御部１２が受信すると、個人識別データ登録部１４に指示して、個人識別情報テーブル１８に記録させる。

またさらには、上記携帯電話２による通話によって発生する通話料金の情報も記憶させる。

上記契約サイト登録部１５は、接続可能とする電子商店のサイトを、基地局３と契約したサイトのみに制限するものである。すなわち、基地局３では、当該基地局３を運営し通信サービスを提供するキャリアが、社会的な信頼を得ていると判断した電子商店のサイトとのみ契約するように設定され、不正なネットショッピングが行われることを防止している。

具体的には、契約サイト登録部１５は、契約サイト情報１９を参照して、契約している電子商店４ａ〜４ｃにセキュリティパスを発行し、ゲートウェイ１１に接続許可されている電子商店４ａ〜４ｃを指示している。そして、ゲートウェイ１１は、このセキュリティパスが発行されている電子商店４ａ〜４ｃからの接続要求のみを許可するようにしている。

電子商取引許可判定部１６は、携帯電話２が電子商店４ａ〜４ｃとのネットショッピングを利用可能とする条件を満足しているか否かを判定するものである。なお、上記ネットショッピングを利用可能とする条件とは、上記個人識別情報テーブル１８の各情報と、携帯電話２において行われたユーザの認証結果に基づき判定される。

すなわち、電子商取引許可判定部１６は、携帯電話２において実行された認証結果によって、ネットショッピングの実行を携帯電話２から要求している人が、正規のユーザであるか否かを判断することができる。また、ヒストリー情報を参照することで、過去に上記携帯電話２と電子商店４ａ〜４ｃとのネットショッピングにおいて実行された取引状況を知ることができる。この取引状況から、上記携帯電話２と電子商店４ａ〜４ｃとの間で行われたネットショッピングが良好に行われた実績があるか否かを判断することができる。また、料金支払い情報を確認することで、携帯電話２の料金支払い実績が良好なものであるか否かを確認することができる。また、契約情報を確認することで、携帯電話２と電子商店４ａ〜４ｃとの間で結ばれた特別な契約条項がないか確認することができる。

ところで、欧米では、クレジットカードによるショッピングが主流であり、スーパーマーケットでの日常的な買い物から、ガソリンスタンドでの給油に至るまでクレジットカードあるいはチェック（小切手）による支払いが行われる。そして、欧米では、クレジットカードによる支払い実績を個人の信用度とみなしている。すなわち、最初に銀行でクレジットカードを作って利用する場合、一般的には、カードで支払い可能な上限が２０００ドル程度に制限されている。そこで、数ヶ月間このカードを用いてショッピングをし、カード支払い代金が引き落とされる銀行口座から、遅延なく支払い代金が引き落とされていることが確認されると、個人の信用度が上がり、カードで支払い可能な上限が４０００ドルへと拡大する。すなわち、このように個人の信用度がカードによる支払い実績に基づいて評価されるシステムである。このようなシステムのメリットは、個人も銀行も最初からリスクを犯すことなく万一不正が行われても最小限の損失で止めることが出来る。

そこで、上記電子商取引許可判定部１６は、上記システムのアイデアを利用して、携帯電話２によるネットショッピングの許可の適否を、携帯電話２からネットショッピングを要求している人が正規のユーザであるかを確認するとともに、携帯電話２のユーザの信用度を確認した上で決定している。

上記特定ワード指定部１７は、個人識別情報テーブル１８の認証用特定ワードの中からランダムに認証用特定ワードを選択して、携帯電話２に当該ワードの音声認識を指示するものである。

特定ワード指定部１７は、ランダムにワードを選択して、選択したワードの音声認識を携帯電話２に指示することで、携帯電話２が正規のユーザ以外によって操作されることを防ぐことができる。なお、この正規のユーザによる携帯電話２の使用か否かを判定する処理に関する詳細は後述する。

（携帯電話の構成）
次に、本実施の形態に係る携帯電話２の構成について図４を参照して説明する。

本実施の形態に係る携帯電話２は、声紋識別部３２を備えている以外は通常の携帯電話と同じ構造である。

すなわち、上記携帯電話２は、アンテナ２１，電源部２２，表示部２３，キー操作部２４，音声入力部２５，音声出力部２６，記憶部２７，携帯通信制御部２８，声紋識別制御部２９，無線通信部３０，信号処理部３１，および声紋識別部３２を備えている。

音声入力部２５は、ユーザの発生する音声を取得し、当該音声をアナログ信号に変化して信号処理部３１に入力するマイクである。一方、音声出力部２６は、信号処理部３１から入力されたアナログ信号の音声データを音声として出力するスピーカである。

信号処理部３１は、音声入力部２５によって取得されたユーザの音声のアナログ信号を、携帯通信制御部２８の指示に応じて、デジタル信号に変換処理して無線通信部３０に入力するものである。より具体的には、信号処理部３１は、音声入力部２５から入力された音声データのアナログ信号をパルス符号変調し、サンプリングしてデジタル信号に変換する。そして、信号処理部３１はデジタル信号に変換した音声データを無線通信部３０に送信する。

また、この信号処理部３１は、無線通信部３０から入力された音声データをデジタル信号からアナログ信号に変換し音声出力部２６に出力するものでもある。信号処理部３１から出力されたアナログ信号の音声データは、音声出力部２６で音声に変換される。

無線通信部３０では、信号処理部３１から入力された音声データを、アンテナ２１を介して無線通信可能となるように変換するものである。また、アンテナ２１を介して受信した音声データを信号処理部３１においてデジタル信号からアナログ信号に変換できるように変換する。

アンテナ２１は、無線通信部２８によって制御され、基地局３にデータを無線で送信したり、基地局３から送信されたデータを受信して無線通信部３０に送信したりするものである。

電源部２２は、携帯電話２の各種部材を実行させるための本体電源である。

表示部２３は、基地局３を介して、例えば電子商店４ａ〜４ｃから受信したデータ等をグラフィカルに示すための表示装置である。

キー操作部２４は、ユーザが携帯電話に対して所望する動作を指示するもの、あるいはユーザが所望するデータを入力可能とするものである。例えば、ユーザは、このキー操作部２４によって通話先の電話番号を入力したり、電子商店４ａ〜４ｃとのネットショッピングを行う際、所望するサービスを選択したりすることができる。

携帯通信制御部２８は、本実施の形態に係る携帯電話２の各種制御を行うものである。また、携帯通信制御部２８は、声紋識別制御部２９に指示して声紋識別部３２を実行させる。

声紋識別制御部２９は、本実施の形態に係る携帯電話２において、電源がＯＮとなり、キー操作部２４の操作指示によって、通話が開始された場合、携帯通信制御部２８からの指示に応じて、声紋識別部３２に、ユーザの通話中に発声された音声に基づき、ユーザの音声を識別できるように学習するよう指示を出すものである。あるいは、声紋識別制御部２９は、上記携帯電話２によって電子商店４ａ〜４ｃの何れかとネットショッピングを行う際に、携帯通信制御部２９の指示に応じて、当該携帯電話２において発声する人（ユーザ）の音声が上記ユーザの音声と一致するか否かの認証を行うように声紋識別部３２に指示を出す。

声紋識別部３２は、音声入力部２５によって、信号処理部３１に入力された音声データの中から、所定の音声データを取得し、取得した音声データに基づき、該音声データの特徴を示す特徴量を抽出、比較して上記ユーザの音声を識別できるように学習するものである。あるいは、認証処理時に入力された音声が正規のユーザによって発声された音声であるか否かを判定するものである。この声紋識別部３２の詳細な説明は後述する。

記憶部２７は、読み書き可能な不揮発性の記憶媒体であり、例えばフラッシュＥＥＰＲＯＭ等によって実現できる。そして、この記憶部２７には、声紋識別部３２によって参照される音素辞書３３および当該携帯電話２の機器ＩＤ番号３４が記憶されている。なお、この音素辞書３３については、後述する声紋識別部３２に説明において説明する。

（声紋識別部の構造）
次に、図１を参照して上記した声紋識別部３２の詳細な説明をする。図１は声紋識別部３２の概略構成の一例を示すブロック図である。

上記声紋識別部３２は、図１に示すように、音声符号化部４０，サンプリング部４１，アベレージ部４２，符号化比較部４３，サンプル作成部４４，適合率計測確認部４５，サンプル数カウンター部４６，個人識別可能報知部４８，機器シャットダウン部４７，適合率結果通知部４９，認証結果通知部５１，およびサンプル作成・認証判定部５０を備えている。

また、記憶部２７には、上記したように、音素辞書３３および機器ＩＤ番号３４が記憶されている。

ここで、まず音素辞書３３について説明する。この音素辞書３３は、不特定話者音響モデル情報３５と特定話者サンプル情報３６とを含む情報である。

上記不特定話者音響モデル情報３５は、不特定多数の老若男女からサンプリングした特定ワードの音声データの特徴量を用いて、隠れマルコフモデル（Hidden Markov Model；ＨＭＭ）によって予めモデル化された、該音声データの特徴量パターン（音響モデル）の情報である。

この不特定話者音響モデル情報３５は、本実施の形態に係る携帯電話２の使用開始時にユーザによって発声された特定ワードに対する音声認識率を確保するために準備されているものである。すなわち、予め該特定ワードの一般的な音響モデルを準備しておくことで
、ユーザの通話中の音声から、特定ワードに対応する音声データを探索し取得することが容易となる。

また、不特定話者音響モデル情報３５として用意した特定ワードが、上記携帯電話２における認証時に用いられ得る特定ワードとなる。すなわち、不特定話者音響モデル情報３５を準備しておくことで、認証時に用いられる特定ワードの候補を決めておくことができる。例えば、上記特定ワードとして、通話において出現頻度が高いワード、「もしもし」、「こんにちは」、「はい」等を指定することができる。

よって、出現頻度が高いワードを特定ワードに指定できるため、短時間でこれら特定ワードに対する音声の特徴を示す特徴量のサンプルを多数取得することができ、特定ワードに対する識別を効果的に行うことができる。

一方、特定話者サンプル情報３６は、携帯電話２の正規のユーザによる通話から取得された特定ワードの音声データの特徴を示す特徴量のサンプルである。

すなわち、携帯電話２の使用開始時点では、記憶部２７には、特定話者サンプル情報３６は記憶されておらず、正規ユーザが携帯電話２を使って通話することによって、特定ワードに対する上記ユーザの音声データの特徴量サンプルが取得される。そして、携帯電話２のユーザの特定ワードに対する音声データの特徴量サンプルが取得されると、今後はこのサンプルと入力された音声データとの特徴量パターンが比較され、両者の類似度、すなわち適合率が算出される。なお、上記入力された音声データの特徴量パターンは、特定話者サンプル情報３６の中で、当該入力された音声データと最も類似する特徴量パターンを示すサンプルと比較され、その適合率が算出される。

また、上記した当該携帯電話２の使用開始時に、不特定話者音響モデル情報３５を用いて、正規ユーザの発声した特定ワードに対する音声を通話中の音声から取得する処理、あるいは、通話中の音声から特定ワードに対する正規ユーザの音声の特徴量サンプルを取得する処理に関する詳細は、下記に示す声紋識別部３２が備える各部材の説明において記載する。

次に、声紋識別部３２が備える各構成部材について説明する。

上記音声符号化部４０は、音声入力部２５から入力された、正規ユーザの音声のアナログ信号をパルス符号変調（Pulse code modulation；ＰＣＭ）によって、一定の時間ごとに区切り、サンプリング部４１によってサンプリングしてそれぞれの信号の大きさをデジタル信号のデータに変換しアベレージ部４２に出力する。なお、この音声符号化部４０は、上記信号処理部３１と共有されるものであってもよい。

アベレージ部４２は、サンプリング部４１から入力されたデジタル信号のデータをフィルタによって雑音をカットし、音声伝送帯域の高域を強調する、いわゆるプリエンファシス処理を行うものである。

このようにして、本実施の形態に係る携帯電話２では、音声入力部２５によって取得されたユーザの音声データは、音声の認識処理に適した強弱のあるデジタル信号に変換される。なお本実施の形態に係る携帯電話２において、この音声認識に適したデジタル信号に変換された音声データを、基礎信号と称する。

符号比較部４３は、記憶部２７にある音素辞書３３を参照して、上記基礎信号と同じ音響モデルの音声データが当該音素辞書３３に存在するか否かを確認するものである。すなわち、符号比較部４３は、不特定話者音響モデル情報３５として記憶されている特定ワードの音響モデルを参照して、該音響モデルと同一または類似する特徴量パターンを示す音声データを、入力された音声から探索する。

そして、符号化比較部４３は、探索した音声データの基礎信号が示す特徴量パターンと音響モデルの特徴量パターンとの適合率を算出するように、適合率計測確認部４５に指示を出す。

また、符号化比較部４３は、適合率計測確認部４５から、算出された適合率が所定の適合率以上である旨の通知受けると、基礎信号が示す特徴量のサンプルデータを作成するようにサンプル作成部４４に指示を出す。

適合率計測確認部４５は、符号比較部４３によって選択された音響モデルの特徴量パターンと、基礎信号が示す特徴量パターンとの類似度、すなわち適合率を計算するものである。

適合率計測確認部４５は、計測し確認した適合率の結果を符号比較部４３に通知する。

また、適合率計測確認部４５は、サンプル数タウンター部４６から、サンプル作成部４４で作成されたサンプル数が１，０００に到達した旨の通知を受信すると、この通知の受信後に入力された音声データの基礎信号と特定話者サンプル情報３６との適合率が９９．５％以上あるか否かを確認するものでもある。適合率計測確認部４５は、計測結果が９９．５％以上であると確認した場合、個人識別可能報知部４８および適合率結果通知部４９に個人識別が設定値に達した旨通知する。

なお、上記所定の適合率は、携帯電話２の使用開始時点での初期設定では９０％以上と設定されており、さらに適合率は、９０％以上〜９５％未満、９５％以上〜９７％未満、９７％以上〜９８％未満、９８％以上〜９９％未満、９９％以上〜９９．５％未満、９９．５％以上〜１００％までというふうにいくつかの段階が設けられている。

そして、符号化比較部４３は、携帯電話２の使用開始時点では、基礎信号と不特定話者音響情報との適合率が９０％以上であれば、この基礎信号の特徴量パターンをサンプルデータとして作成するようにサンプル作成部４４に指示を出す。

また、特定話者サンプル情報３６の特徴量パターンと、上記基礎信号の特徴量パターンとの適合率は、正規ユーザの体調の状態等の影響によって多少変動するが、一般的には特定ワードに対する上記ユーザの音声に基づく基礎信号のサンプル数が増加するにつれ限りなく１００％に近づくことが知られている。

なお、上記基礎信号のサンプル数が１、０００に到達した後に取得した音声に対して設定される上記適合率、９９．５％は、これに限定されるものではなく、ユーザと他者との特定ワードに対する音声の特徴量パターンの相違をより正確に識別する必要がある場合、適合率の閾値を９９．５％以上としてもよい。

また、適合率計測確認部４５は、ユーザの認証処理時において、携帯電話２のユーザによって入力された特定ワードの上記基礎信号と、特定話者サンプル情報３６との適合率が、所定回以内の音声入力において９９．５％以上とならなかった場合、機器シャットダウン部４７に、携帯電話２の動作状態を強制終了するように指示を出す。

なお、適合率計測確認部４５は、上記したように、通話中の音声から、特定ワードに対する正規ユーザの基礎信号のサンプルを作成する場合に計測される適合率の閾値と、認証時に入力された音声の基礎信号と特定話者サンプル情報３６との適合率の閾値とは変更されるように構成されている。この適合率における閾値の変更は、声紋制御部２９からの指示に応じて、サンプル作成・認証判定部５０からの通知に応じて行っている。

上記サンプル作成部４４は、符号比較部４３からの指示に応じて、基礎信号の特徴量のサンプルを作成し、特定話者サンプル情報３６として音素辞書３３に記録するものである。また、ある特定ワードに対する上記基礎信号のサンプルが作成されると、サンプル作成部４４は、サンプルが作成された旨を伝える信号をサンプル数カウンター部４６に入力する。

また、サンプル作成部４４は、作成された基礎信号のサンプルデータがどの段階の適合率のものであるのか作成したサンプルデータと対応付けて特定話者サンプル情報３６に記録する。したがって、作成された基礎信号のサンプル数と適合率の変化の履歴を記録しておくことができる。

サンプル数カウンター部４６は、サンプル作成部４４から入力された上記信号に応じて、当該サンプル作成部４４で作成された音声データのサンプル数をカウントするものである。

サンプル数カウンター部４６は、カウントした特定ワードのサンプル数が１，０００に到達すると、適合率計測確認部４５にその結果を通知する。

個人識別可能報知部４８は、適合率確認部４５から個人識別可能な条件に達した旨の通知を受信すると、声紋識別制御部２９を介して、携帯通信制御部２８に指示して、基地局３に、当該携帯電話２のユーザが発声する特定ワードの音声に対する認識が可能となった旨通知するものである。また、個人識別可能報知部４８は、声紋識別制御部２９を介して、携帯通信制御部２８に指示して、表示部２３に上記通知内容を表示させることでユーザに対しても通知する。なお、この通知が携帯電話２から基地局３に通知されることで、携帯電話２のユーザは、電子商店４ａ〜４ｃいずれかとのネットショッピングが可能な状態となる。

なお、この個人識別可能な条件とは、通話中から取得した特定ワードに対する基礎信号の特徴量のサンプル数が１，０００となり、かつサンプル数が１，００００に達した直後に取得した基礎信号と、特定話者サンプル情報３６との適合率が９９．５％以上である場合である。

適合率結果通知部４９は、適合率確認部４５から個人識別が設定値に達した旨の通知を受信すると、記憶部２７に記録されている上記携帯電話２の機器ＩＤ番号と、９９．５％以上の適合率である特定ワードとを基地局３に送信するように、声紋識別制御部２９を介して、携帯通信制御部２８に指示するものである。

また、後述するが、適合率計測確認部４５によって計測される適合率は、携帯電話２の使用開始時点での初期設定では９０パーセント以上と設定されており、さらに適合率は、９０％以上〜９５％未満、９５％以上〜９７％未満、９７％以上〜９８％未満、９８％以上〜９９％未満、９９％以上〜９９．５％未満、９９．５％以上〜１００％までのいくつかの段階が設けられている。

そして、特定ワードの中で、例えば適合率が９０％に達した場合、９０％〜９５％の段階の適合率が計測されたものとして、適合率計測確認部４５からの指示を受け、適合率結果通知部４９は、特定話者サンプル情報３６を参照して該特定ワードを基地局２に通知する。なお、適合率結果通知部４９は、このように特定ワードごとに、どの段階の適合率に達したかを基地局３に通知するようになっている。

機器シャットダウン部４７は、適合率計測確認部４５からの指示に応じて、声紋識別制御部２９を介して、携帯電話２の電源部２２を強制終了するように携帯通信制御部２８に指示するものである。認証時において、入力された音声の基礎信号と特定話者サンプル情報３６との適合率が、所定回数内の入力において９９．５％以下である場合、適合率計測確認部４５は、携帯電話２の電源部２２を強制終了するように機器シャットダウン部４７に指示する。

ここで、本実施の形態に係る携帯電話２における上記した声紋識別部３２における各部材の動作をより明確にするために、具体例を挙げて説明する。なお、本実施の形態に係る携帯電話２は、上記したように、記憶部２７に記録した音素辞書３３に不特定話者音響モデル情報３５が記憶されているものとする。なお、この不特定話者音響モデル情報３５は、「もしもし」，「こんにちは」といった通話中において使用頻度が高いワードの音響モデルが音素辞書に記憶されている。

以下に、まず、携帯電話２を使用してユーザＡが電子商店４ａ〜４ｃとのネットショッピング開始条件を満たすまでの処理、すなわちユーザＡの音声に対する識別学習処理について説明する。

（ユーザの音声の識別学習処理）
まず、ユーザＡが、携帯電話２の使用を開始し通話を行う。この通話の際にユーザＡによって発声された音声は、音声入力部２５を介して信号処理部３１に入力され、携帯通信制御部２８の指示に応じて、該信号処理部３１によってデジタル信号の音声データに変換される。そして、この変換された音声データは、無線通信部３０によって無線通信可能となるように処理されアンテナ２１を介して基地局３に送信される。

このようにして、ユーザＡは携帯電話２を使用して通話を行っている間、音声入力部２５から入力されたユーザＡの音声は信号処理部３１で信号処理が行われる一方で、声紋識別制御部２９の指示に応じて声紋識別部３２でユーザＡの音声に対する識別学習処理が行われる。

この識別学習処理とは、まず、音声入力部２５から入力された音声データは、上記したように音声符号化部４０でアナログ信号をＰＣＭによって、一定の時間ごとに区切り、サンプリング部４１によってサンプリングして、それぞれの信号の大きさをデジタル信号のデータに変換しアベレージ部４２に出力する。

そして、アベレージ部４２は、サンプリング部４１から入力されたデジタル信号のデータをフィルタによって雑音をカットし、プリエンファシス処理を行い、音声の認識処理に適したデジタル信号である基礎信号を形成する。

ここで、携帯電話２の使用開始時点では、ユーザＡの音声は初めて入力されたものであるため、符号化比較部４３は、通話中から取得された音声の中から音素辞書３３の不特定話者音響モデル情報３５にもっとも類似する特徴量パターンを有する基礎信号を探索する。例えば、ユーザＡの通話中に「もしもし」というワードが含まれている場合、この「もしもし」に対応する基礎信号部分を、不特定話者音響モデル情報３５を参照して探索する。

そして、通話中の音声から「もしもし」に対応する基礎信号が探索されると、符号化比較部４３は、適合率計測確認部４５に指示をして、「もしもし」に対応する基礎信号と不特定話者音響モデル情報３５との音響パターンを比較して両者の適合率を計測させる。

適合率計測確認部４５は、計測した結果、上記両者の適合率が９０％以上となった場合、符号化比較部４３を介してサンプル作成部４４に指示して、特定ワード「もしもし」に対応するユーザＡの特徴量パターンのサンプルを作成させる。

サンプル作成部４４は、作成した上記サンプルを、音素辞書３３の特定話者サンプル情報３６として記憶部２７に、適合率計測確認部４５によって計測された適合率とともに記録する。

また、サンプル作成部４４が、ユーザＡの通話中の音声から「もしもし」に対応する基礎信号の特徴量パターンのサンプルを作成すると、サンプル数カウンター部４６は、サンプル作成部４４からの指示に応じて、作成された上記サンプルの数をカウントする。この場合では、サンプル数カウンター部４６はサンプル数１をカウントする。

このようにして、本実施の形態に係る携帯電話２では、ユーザＡの「もしもし」に対する基礎信号の特徴量パターンのサンプルが取得され、特定話者サンプル情報３６として記憶部２７の音素辞書３３に記録される。

ユーザＡの「もしもし」の基礎信号に対する特徴量パターンのサンプルが作成されると、これ以降のユーザＡの通話において「もしもし」と発声された音声の基礎信号に対して、符号比較部４３は、特定話者サンプル情報３６として記録されている、ユーザＡの「もしもし」のサンプルを選択し、適合率計測確認部４５が上記基礎信号と該サンプルとの適合率を計測する。

そして、適合率計測確認部４５が、音声入力部２５から入力された「もしもし」の基礎信号と特定話者サンプル情報３６における「もしもし」のサンプルとの適合率を計測した結果、９０％以上の適合率である場合、この基礎信号のサンプルをサンプル作成部４４が作成し、特定話者サンプル情報３６における「もしもし」のサンプルに加える。
そして、サンプル数カウンター部４６は、「もしもし」に対するサンプル数を２とする。

このようにして、上記携帯電話２では、ユーザＡが発声した「もしもし」の特徴量パターンのサンプルを増やしていく。

このように、上記携帯電話２は、取得した基礎信号が示す特徴量と、特定話者サンプル情報３６と適合率が所定の閾値以上であるか否かに応じて、取得した基礎信号のサンプルを作成するか否かを決定するように構成されている。

このため、上記携帯電話２において、上記適合率が所定の閾値以上である基礎信号のみのサンプルをサンプル作成部４４が作成することによって、ユーザＡの発声する音声に対する識別精度が悪い基礎信号の特徴量に関する情報を削除することができる。このため、特定話者サンプル情報３６として記録される情報は識別精度がある水準以上を保った良質な情報のみとすることができる。このため、認証時において、入力された音声に対して行われる認証結果の信頼性を高めることができる。

ところで、この基礎信号と特定話者サンプル情報３６との適合率は、ユーザＡの声の状態等により上がったり下がったりする。つまり、ユーザＡの声質が、風邪などで変化したとしても声帯のスペクトラムは大きくは変化しない。しかし、ユーザＡの発声する音声に対する識別を、この微妙な声質の変化によって誤認する場合がある。また、ユーザＡが通話している周囲の環境の影響等によって生じるノイズ等によって、ユーザＡの音声に対する識別率が大きく下がる場合がある。

しかし、一般的には、ユーザＡの発声する音声に対する識別は、当該ユーザＡが発声した音声データの特徴量パターンのサンプル数が増加すればするほど、この識別率が向上することが知られている。

そこで、本実施の形態に係る携帯電話２では、例えば、ユーザＡの体調不良時に発声した音声に対する音響パターンのサンプルも取得しておく。このように、ユーザＡの発声する音声の微妙な変化に対する音声データの特徴量パターンのサンプルも取得しておくことで、例えば、ユーザＡが体調不良等により微妙に健康時と異なる音声を発声したとしても、誤認することなくユーザＡの音声として識別することができる。

このように、本実施の形態に係る携帯電話２は、ユーザＡの通話中の音声から、特定ワードに対する音響パターンのサンプルを取得して、サンプル数を増加させることができるため、Ａ君の発声した特定ワード「もしもし」に対する識別率が限りなく向上する。

特に、特定ワードに対するユーザＡの微妙な言い回しや癖、あるいは風邪で声の調子が悪い時の音響パターンを反映したサンプルを記憶しておくことができるため、ユーザＡ以外の第３者とユーザＡとの特定ワードの音響パターンの相違をより正確に区別することができる。すなわち、特定話者サンプル情報３６のサンプル数が増えれば、特定ワードに対して発声した、ユーザＡと、このユーザＡ以外の人との音声の区別が明確となる。

なお、特定話者サンプル情報３６のサンプル数の増加に伴う、上記適合率の変化は具体的には図８に示すようになる。図８は特定ワードに対するユーザの音声に関するサンプル数と、入力された特定ワードの音声に対する認識率（適合率）との対応関係を示すグラフである。

すなわち、ユーザＡの発声した「もしもし」という特定ワードの音声データの特徴量パターンと、既に取得している「もしもし」の特徴量パターンのサンプルとの適合率は、上記サンプル数が１つの場合、９０％であったとする。そして、このサンプル数が増えるごとに、入力された「もしもし」と既に取得している「もしもし」のサンプルとの適合率は、９５％、９３％、９２％、９６％、９７％、９５.５％、９７.５％という様に、向上する傾向にある。この適合率の向上は、特定ワード「もしもし」に対するユーザＡの音声と他者との音声とをより明確に区別する、すなわち、ユーザＡが発声した特定ワードの音声に対する識別率が向上していることを示す。

また、上記したように、本実施の形態に係る携帯電話２の使用開始時点での初期設定では９０パーセント以上と設定されており、さらに適合率は、９０％以上〜９５％未満、９５％以上〜９７％未満、９７％以上〜９８％未満、９８％以上〜９９％未満、９９％以上〜９９．５％未満、９９．５％以上〜１００％までというふうにいくつかの段階が設けられている。なお、この段階はこの実施例に限定されるものではなく、特定ワードのサンプル数に対する適合率の変化の傾向や、入力された音声の基礎信号の測定精度に応じて適宜変更して設定されることが好ましい。

例えば、ユーザＡの発声した「もしもし」の基礎信号と不特定話者音響モデル情報３５との比較において、適合率が９１％であり、この基礎信号の特徴量パターンのサンプルデータが特定話者サンプル情報３６として記録されたとする。

そして、次に入力された「もしもし」の基礎信号と上記特定話者サンプル情報３６とを比較し、適合率を計測した結果が９２％、さらに次に入力された「もしもし」の基礎信号と上記特定話者サンプル情報３６との適合率が９６％と変化したとする。

この場合、予め設定されている９０％から９５％の段階から９５％〜９７％の段階へと段階が変化しため、適合率計測確認部４５は、適合率結果通知部４９に指示して、適合率が９５％〜９７％の段階である旨とこの適合率を実現した特定ワード（「もしもし」）とを基地局３に通知させる。なお、適合率結果通知部４９は、この通知を行う際、携帯電話２の機器ＩＤ番号３４も共に送信する。

したがって、基地局３は、特定ワードの「もしもし」の適合率は、現在９５％〜９７％の段階にあると知ることができる。

なお、携帯電話２から通知された特定ワード「もしもし」と、適合率の段階の情報は、
基地局３側において、移動通信制御部１２が個人識別データ登録部１４に指示して携帯電話２の機器ＩＤ番号３４に対応する情報として、個人識別情報テーブル１８に通知された日時とともに記録する。

このように、設定された適合率の段階に達するごとに携帯電話２から基地局３に通知がなされることによって、基地局３は、特定ワード「もしもし」に対する適合率の変化を知ることができる。そして、上記したように適合率は、サンプル数の増加に伴い徐々に向上するものであるため、例えば、適合率がサンプル数の数が少ないにも関わらず急激に向上するなど、不正な適合率の操作が行われていないか監視することができる。

このようにして、本実施の形態に係る携帯電話２では、特定ワード「もしもし」に対するユーザＡの特定話者音響情報３６におけるサンプル数を増やす一方、ユーザＡの通話中の中から例えば「さよなら」、「あした」、「なまえ」、および「じかん」といった他の特定ワードの種類も増やしていく。そして、特定ワードに対するサンプル数が１，０００を超えると、携帯電話２は、電子商店４ａ〜４ｃとのネットショッピングを開始することができる条件となる。

上記したようにサンプル数カウンター部４６は、特定ワードに対するユーザＡの上記サンプル数が１，０００に達すると、この到達した旨を適合率計測確認部４５に通知する。そして、適合率計測確認部４５は、この通知後に入力された特定ワードに対するユーザの音声の基礎信号と、特定話者サンプル情報３６として記憶されているサンプルの中のもっとも近似する特徴量パターンのサンプルとを比較する。そして、両者の適合率が、９９．５％以上であれば、適合率計測確認部４５は、個人識別可能報知部４８に指示して、携帯電話２による電子商店４ａ〜４ｃとネットショッピングが可能となったことを通知させる。

また、適合率計測確認部４５は、適合率結果通知部４９に指示して、適合率９９．５％以上のサンプル数が１，０００以上となった特定ワードと、携帯電話２の機器ＩＤ番号とを通知させる。

なお、適合率計測確認部４５において、適合率の閾値を当初の９０％から９９．５％への変更は、サンプル数カウンター部４６からの指示に応じて行う。

また、これら携帯電話２から送信された通知を基地局３が受信すると、移動通信制御部１２は、個人識別データ登録部１４に指示して、記憶部１３の個人識別情報テーブル１８に記録させる。

以下、携帯電話２が基地局３を介して、電子商店４ａ〜４ｃとのネットショッピングを実行する際に行われるユーザＡに対する認証処理について説明する。より正確には、携帯電話２と電子商店４ａ〜４ｃとの間で行われるネットショッピングを許可するか否かを判定する、ユーザＡの発声する音声に対する認証処理について図５および図７（ａ）、図７（ｂ）を参照して説明する。

図５は、本実施の形態に係る携帯電話２におけるユーザの認証処理の一例を示すフローチャートである。また、図７は、本実施の形態に係る携帯電話２の表示部における、認証処理時およびネットショッピング実行時の表示状態の一例を示す図であり、同図（ａ）は、認証処理が成功しネットショッピングが実行された場合の表示状態の一例を示し、同図（ｂ）は、認証処理に失敗した場合の表示状態の一例を示している。

（ユーザの認証処理）
ここで、本実施の形態に係る携帯電話２において、特定ワードの種類が１０ワード、各特定ワードに対するユーザＡの音声の特徴量パターンサンプル数が１，０００となったとする。

また、携帯電話２は、基地局３に対して、当該携帯電話２は、電子商店４ａ〜４ｃとのネットショッピングを行うことが可能である旨通知している。

また、携帯電話２は、基地局３に対して、当該携帯電話２の機器ＩＤ番号と９９．５％以上の適合率を計測できる特定ワードについても通知している。

したがって、基地局２における個人識別情報テーブル１８には、ユーザが利用する携帯電話２の認証用特定ワードが記録される。

なお、個人識別情報テーブル１８には、上記したように、上記機器ＩＤ番号３４および上記認証用特定ワード以外に、ヒストリー情報、支払い情報、契約情報、および特定ワードの適合率の履歴情報も記録されている。

このように、ネットショッピングを実行可能とする条件に到達した携帯電話２において、ユーザが、キー操作部２４を操作して、ネットショッピングを行うことを基地局３に対して要求する（ステップＳ１、これ以降Ｓ１のように称する）。なお、この携帯電話２から基地局３へのネットショッピング実行要求を送信する際、キー操作部２４からのキー操作による指示に応じて、携帯通信制御部２８は、記憶部２７に記憶されている機器ＩＤ番号３４も送信する。

また、キー操作部２４によって操作する際に、表示部２３において表示される情報は、図７（ａ）に示す表示状態１のように、携帯電話２において操作可能な機能を示したメニュー画面が表示される、そして、キー操作部２４によって、このメニュー画面からネットショップを選択し、実行を押すことによって、ネットショッピングを実行することを基地局３に通知できる。

一方、基地局３は、無線によって、携帯電話２からネットショッピングの要求を受信すると（Ｓ２）、移動通信制御部１２からの指示に応じて、電子商取引許可判定部１６が、個人識別情報テーブル１８を参照して、上記携帯電話２がネットショッピング可能な条件を満たした携帯電話２として登録がなされているか否かを判定する（Ｓ３）。

すなわち、電子商取引許可判定部１６は、個人識別情報テーブル１８を参照して、認証用特定ワードの存在の有無、電子商店４との契約の有無を確認する。さらに、個人識別情報テーブル１８に記録されているヒストリー情報から電子商店４との取引実績の状態、支払い情報から電子商店４との取引における商品代金の支払い状況および、通話料金の支払い状況、特定ワードの履歴情報から認証用特定ワードの信用性の有無を確認する。

このように個人識別情報テーブル１８を参照し、電子商取引判定部１６が、上記携帯電話２がネットショッピング可能な携帯電話として登録がなされていないと判定した場合（Ｓ３において「ＮＯ」）、ネットショッピングの利用が許可されていない旨の通知を、移動通信制御部１２を介して携帯電話２に通知する。

携帯電話２は、この通知を無線通信部３０が受信すると、この通知内容を携帯通信制御部２８に送信し、携帯通信制御部２８は、この通知内容を表示するように表示部２２に指示する。このようにしてネットショッピングの利用ができない旨を表示部２３に表示させることによって、携帯電話２のユーザは、自身が所有する携帯電話２によってネットショッピングを行うことができないことを知ることができる。

一方、電子商取引判定部１６が、上記携帯電話２がネットショッピング可能な携帯電話として登録がなされていると判定した場合（Ｓ３において「ＹＥＳ」）、特定ワード指定部１７に、特定ワードを指定するように指示を出す。

特定ワード指定部１７は、電子商取引判定部１６からの指示に応じて、個人識別情報テーブル１８を参照して、適合率９９．５％以上である特定ワードの中から適当な特定ワードをランダムに選択する。そして、特定ワード指定部１７は、選択した特定ワードを移動通信制御部１２に渡し、該移動通信制御部１２が、この選択された特定ワードに対する音声を入力するよう指示する要求を携帯電話２に送信する（Ｓ４）。

なお、基地局３側でステップＳ２〜ステップＳ４の処理が行われている間の携帯電話端末２における表示部２３の表示状態は、図７（ａ）に示す表示状態２のように、ネットショッピング接続画面「しばらくお待ちください」といったことを示す画面によって、ユーザに待ち状態を示す。

携帯電話２では、基地局３から特定ワードの音声入力の要求を受信すると、携帯通信制御部２８が、表示部２３に指示して、基地局３から受信した要求の内容を表示させる。この時の表示状態は、図７（ａ）の表示状態３のように特定ワードの発声を要求する表示がされる。

このようにして表示部２３が、上記要求の内容を表示し、ユーザに対して基地局３から指定された特定ワードの音声を発声するように要求する（Ｓ５）。

ユーザは、表示部２３において表示された内容に応じて、基地局３によって選択された特定ワードを発声する。なお、ユーザは、この特定ワードを発声する前、キー操作部２４によって、今回入力される特定ワードの音声は、ネットショッピングを実行する際の認証に用いるためのものである旨携帯電話２に通知する。キー操作部２４からのユーザの通知は、携帯通信制御部２８に渡され、携帯通信制御部２８は、声紋識別制御部２９を指示して、上記通知を声紋識別部３２に送信するように指示する。

声紋制御部３２は、携帯通信制御部２から上記ユーザの通知を受信すると、サンプル作成・認証判定部５０に指示をして、符号化比較部４３および適合率計測確認部４５に、音声入力部２５から入力される音声の基礎信号は、ネットショッピングの認証のために用いられるものである旨通知させる。そして、このサンプル作成・認証判定部５０からの通知応じて、符号化比較部４３および適合率計測確認部４５は、入力された音声の基礎信号は、ネットショッピングを実行するにあたり、認証に用いられている音声の信号であることが分かる。

そこで、音声入力部２５から、基地局３によって指定された特定ワードの音声が入力されると、音声符号化部４０〜アベレージ部４２によって、この音声の基礎信号が形成され、符号化比較部４３は、この基礎信号と最も類似する特徴量パターンであるサンプルを特定話者サンプル情報３６から選択し、適合率計測確認部４５に、基礎信号と選択した特定話者サンプル情報３６との適合率を計測するように指示する。

符号化比較部４３からの指示に応じて、適合率計測確認部４５は、上記基礎信号と選択した特定話者サンプル情報３６との適合率を計測し、入力された音声が正規ユーザの音声と一致するか否か、すなわち、上記計測結果が９９．５％以上であるか否かを確認する（Ｓ６）。

そして、計測結果が９９．５％以上である場合（Ｓ６において「ＹＥＳ」）、適合率計測確認部４５は、正規のユーザによる特定ワードの発声であるとみなし、ユーザに関する認証確認が完了した旨通知するように、認証結果通知部５１に指示をする。認証結果通知部５１は、適合率計測確認部４５からの指示に応じて、声紋識別制御部２９を介して、携帯通信制御部２８に上記した通知を基地局３に送信するように指示を出す。

上記携帯通信制御部２８は、認証結果通知部５１からの上記指示を、声紋識別制御部２９を介して受信すると、表示部２３に指示して図７（ａ）の表示状態４に示すように、ユーザの個人認証が完了した旨を通知し、ネットショッピングの開始の確認をユーザに示す。この表示に対して、ユーザがキー操作部２４によって、実行を選択しネットショッピングの実行指示を入力すると、この指示を携帯通信制御部２８が受信する。そして、携帯通信制御部２８は、基地局３に対して、携帯電話２のユーザの認証確認が終了した旨通知する（Ｓ７）。

一方、適合率計測確認部４５は、上記基礎信号と選択した特定話者サンプル情報３６との適合率を計測し、該計測結果が９９．５％以下である場合（Ｓ６において「ＮＯ」）、認証結果通知部５１に、認証確認ができなかった旨通知する。

認証結果通知部５１は、適合率計測部４５からのこの通知に応じて、声紋識別制御部２９を介して携帯通信制御部２８に、再度上記特定ワードの音声を入力するように指示する。

そして、携帯通信制御部２８は、この声紋識別制御部２９からの指示に応じて、表示部２３に再度特定ワードの音声を入力するようユーザへの要求を表示させる（Ｓ９）。ここで、行われる表示は、図７（ｂ）の表示状態２１に示すように２回目の音声入力として特定ワードの発声をユーザに要求する。

そして、ユーザは、この表示部２３において表示された要求に応じて、再度特定ワードの音声を入力する。なお、本実施の形態に係る携帯電話２において、適合率計測確認部４５が基礎信号と特定話者音響情報３６との適合率が９９．５パーセント以上になるまで、特定ワードの音声を入力するように構成されている。

しかし、この特定ワードの音声の再入力には回数が限定されており、３回までとされている。したがって、特定ワードに対して２回目の音声の入力を試みたが、該音声と特定話者サンプル情報３６との適合率がまた９９．５％に満たない場合、図７（ｂ）の表示状態２２が示すように最後の音声の入力を要求する表示を行う。

なお、このユーザの認証処理時において、特定ワードの適合率の計測処理が何回行われたかについては、適合率計測確認部４５は適合率が９９．５％以下であると計測するたびに、この計測結果を符号化比較部４３に通知する。そして、この通知を受信すると、符号比較部４３は、サンプル作成部４４を介してサンプル数カウンター部４６に適合率が９９．５％以下であった音声データの入力回数をカウントさせる。

サンプル数カウンター部４６は、カウントが３回に達したと判定すると、適合率計測確認部４５にその旨通知する。

したがって、３回目の音声の再入力において、適合率が９９．５％に達しない場合（Ｓ１０において「ＹＥＳ」）、適合率計測確認部４５は、機器シャットダウン部４７にユーザの認証に失敗した旨通知する。

機器シャットダウン部４７は、適合率計測確認部４５からの通知に応じて、声紋識別制御部２９を介して、携帯通信制御部２８に図７（ｂ）の表示状態２３に示すように、音声を入力した人に対して、発声された音声を正規ユーザの音声として識別できなかったため、認証ができなかった旨表示部２３において表示する。そして、表示状態１２に示されるように、もとのメニュー画面に戻る。

さらに、機器シャットダウン部４７は、声紋識別制御部２９を介して、携帯通信制御部２８に対して、携帯電話２の本体の電源を強制終了するように指示を出す。そして携帯通信制御部２８は、各種処理の指示を出している各部材への指示を停止し電源部２２に本体電源をＯＦＦするように指示を出す（Ｓ１１）。

以上のようにして、本実施の形態に係る携帯電話２は、ユーザの特定ワードに対する音声を認証時の入力として用いることができる。また、入力された音声と、予め該ユーザから取得している特定話者サンプル情報３６との適合率が９９．５％以上とならなければ、認証が確認されたものとして基地局３に通知されないため、ユーザを高精度に識別することができる。すなわち、携帯電話２の正規のユーザ以外が、該携帯電話２を用いてネットショッピングを行おうとしても、この正規のユーザでない者の発声した特定ワードの音声は、上記適合率が９９．５％以上とならないため、この携帯電話２によるネットショッピングは、正規ユーザのみによってしか実行できない。

つまり、携帯電話２の正規のユーザでない「Ｂ」が、該携帯電話２を用いてネットショッピングを行おうとした場合、「Ｂ」は、基地局３に対してネットショッピングの実行を要求する。そして、この「Ｂ」の要求に対して、基地局３から特定ワードの音声入力が要求される。

ここで、この特定ワードは、基地局３で選択したものであり、「Ｂ」が選択したものでないため、「Ｂ」は正規ユーザの声色を真似て発声することは困難である。

また、この特定ワードは、基地局３において、特定ワード指定部１７が個人情報テーブル１８に登録されている携帯電話２の機器ＩＤ番号３４に対応する特定ワードの中から任意に選択したものである。このため、「Ｂ」が、例え正規ユーザが過去に入力した特定ワードを覚えておき正規ユーザの声色を練習したとしても、この覚えている特定ワードの入力を基地局３側から要求される可能性が低い上に、「Ｂ」の発声した特定ワードの音声と正規ユーザの音声から取得した特定話者サンプル情報３６との比較において、適合率が９９．５％以上を達成することはできない。

したがって、基地局３側からの特定ワードの音声入力に指示に応じて、「Ｂ」が特定ワードについて発声し、音声を入力した場合、正規ユーザの音声から取得された特定話者サンプル情報３６と、この「Ｂ」によって入力された音声の基礎信号との適合率は９９．５％以下と計測される。そこで、特定ワードの音声の再入力が求められ、「Ｂ」が発声した特定ワードの音声の特定話者サンプル情報に対する適合率が、３回とも９９．５％以下になった時点で、上記したように機器シャットダウン部４７の指示によって携帯電話２は強制終了される。

なお、この強制終了は、携帯通信制御部２８が上記にて携帯電話２における各部材の全ての動作を停止させ、電源部２２によって本体の電源をＯＦＦにするように、携帯電話２は構成されていた。しかし、これに限定されるものではなく、携帯電話２において、携帯通信制御部２８は、表示部２３に指示してネットショッピングができない旨の通知を行い、例えば、通話機能等、当該携帯電話２を利用することによって課金される操作に関して実行できないように制御してもよい。

さらには、本実施の形態に係るネットショッピングシステム１において、認証処理時に、入力された特定ワードの音声の特定話者サンプル情報３６に対する適合率が、３回とも９９．５％以下になった場合、適合率計測確認部４５は、適合率結果通知部４９に指示して、携帯電話２の不正使用が行われている旨基地局３に通知するように指示を出す。

そして、適合率結果通知部４９は、適合率計測確認部４５からの指示に応じて、声紋識別制御部２９を介して、携帯通信制御部２８に上記通知を基地局３に送信するように指示する。このようにして、不正使用である旨基地局３に通知されると、基地局３は当該携帯電話２の通話権利を禁止するように設定されていてもよい。

したがって、本実施の形態に係るネットショッピングシステム１または携帯電話２では、正規のユーザ以外によるネットショッピングの実行を防止することができる。さらに、本実施の形態に係るネットショッピングシステム１または携帯電話２は、ネットショッピングの実行を試みた者が正規のユーザでないと判断した場合は、通話機能等、携帯電話２において課金される操作を停止させることができる。

なお、本実施の形態に係る携帯電話２の声紋識別部３２では、音声入力部２５によって入力された音声データの音響分析として例えば、ウェーブレット解析によるスペクトル分析を適用し、得られた特徴量を用いてＨＭＭよって入力された音声データの特徴量パターンが得られるように構成されている。したがって、上記声紋識別部３２では、標準的なアルゴリズムを用いており、アルゴリズムを実行するプログラムは数百Ｋバイト〜数Ｍバイトの容量に抑えることができる。

このため、声紋識別部２において実行される処理は、携帯電話２が備えるＣＰＵあるいはＤＳＰ（Digital Signal Processor）によって十分実現できるものである。

また、本実施の形態に係る携帯電話２では、当該携帯電話２の正規ユーザの特定ワードに関する音声データを、正規ユーザの通話中に収集することができる構成である。このため、ユーザに特定ワードに対する音声の入力をわざわざ要求することなく、上記特定ワードに対するユーザの音声に関するサンプル数を増加させていくことができ、入力された正規ユーザの音声データに対する識別率を向上させることができる。

以上までが、携帯電話２においてユーザの認証を行う処理についての説明である。次に、ネットショッピングの認証が成功し、実際にネットショッピングを行う際の処理（ネットショッピング処理）について、図６および図７（ａ）、図７（ｂ）を参照して説明する。

（ネットショッピング処理）
まず、携帯電話２からユーザの認証が完了した旨の通知を受信すると（Ｓ２１）、基地局３は、ネットショッピング専用画面を携帯電話２に送信する（Ｓ２２）。

すなわち、基地局３において、移動通信制御部１２が携帯電話２からユーザの認証が完了した旨の通知を受信すると、契約サイト登録部１５に指示してネットショッピング専用画面を記憶部１３から取得する。そして、移動通信制御部１２は、取得したネットショッピング専用画面を携帯電話２に基地局アンテナ１０から無線で送信する。

一方携帯電話２は、基地局３から送信されたネットショッピング専用画面を、アンテナ２１を介して無線通信部３０で受信し、携帯通信制御部２８に渡す。そして、携帯通信制御部２８は、この受信したネットショッピング専用画面を表示するように表示部２３に指示する。このようにして、表示部２３によって表示された画面は、図７（ａ）の表示状態５に示すように、基地局３が契約している電子商店４ａ〜４ｃのサイト（サイトＡ〜サイトＣ）が示される。そして、この画面には、どの電子商店４ａ〜４ｃのサイトとのネットショッピングを行うかユーザに選択を促す内容が示される。

この表示画面に示された内容に対して、ユーザは、キー操作部２４によってネットショッピングを所望する電子商店のサイトを選択する。そして、ユーザによって選択された上記サイトの情報は、携帯通信制御部２８が、無線通信部３０に指示してアンテナ２１を介して無線で基地局３に送信する（Ｓ２３）。

携帯電話２から送信された、上記サイトの情報は、基地局３側で、基地局アンテナ１０を介して移動通信制御部１２によって受信される。そして、移動通信制御部１２は、受信した上記情報から携帯電話２のユーザが選択した電子商店４のサイトを確認し、ゲートウェイ１１に指示して、通信ネットワーク６を通じて上記ネットショッピング先のサイトと接続を確立するように指示する。上記ネットショッピング先のサイトと基地局３との接続が確立すると、移動通信制御部１２は、ゲートウェイ１１に指示して、ネットショッピングの実行を要求する（Ｓ２５）。

一方、基地局３から上記ネットショッピングの要求を受信すると、電子商店４は、ネットショッピング用画面のデータを、基地局３を介して携帯電話２に送信する（Ｓ２７）。なお、ネットショッピング用画面のデータとは、電子商店４が取り扱うサービスのうちどのサービス（商品）の提供をユーザが所望するのかを選択できるように示すことが可能なデータである。

電子商店４から送信されたネットショッピング用画面のデータは、基地局３においてゲートウェイ１１を介して、移動通信制御部１２が受信する。そして、移動通信制御部１２が、上記データを、基地局アンテナ１０を制御して無線で携帯電話２に送信する。

携帯電話２は、基地局３を介して、電子商店４からネットショッピング用画面のデータを、アンテナ２１を介して無線通信部３０が受信すると（Ｓ２８）、携帯通信制御部２８が、この受信したデータを表示部２３に送信して、このデータの表示指示を行う。そして、表示部２３は、携帯通信制御部２８からの指示に応じて、受信したデータを表示させる。

ここで、携帯電話２が選択した電子商店４のサイトがサイトＡであり、該サイトＡにおいて取り扱うサービス内容が、音楽ＣＤ（Compact disc）の販売である場合、上記表示部２３に示される表示内容は、図７（ａ）に示す表示状態６〜表示状態１０のように表示される。

すなわち、まず、上記ユーザに対して、該ユーザが購買を所望する音楽ＣＤの属する音楽分野（種類）を表示し（表示状態６）、この音楽分野の中からユーザがクラシック音楽を、キー操作部２４を操作して選択すると、クラシック音楽分野の作曲家の名前が表示される（表示状態７）。

この表示された作曲家の中からユーザが、ベートーベンを、キー操作部２４を操作して選択すると、ベートーベンの作品が表示される（表示状態８）。さらに、ユーザがキー操作部２４を操作して、ベートーベンの作品（音楽ＣＤタイトル）の中からベストアルバムを選択すると、この選択した作品(音楽ＣＤタイトル)の価格等詳細情報が表示される（表示状態９）。

このように上記サイトＡから送信されたネットショッピング用画面のデータの表示内容を参照して、ユーザは購入品を決定し購入情報を確認する（Ｓ２９）。そして、ユーザがキー操作部２４を操作して、購入品を確定すると、ネットショッピング用画面では、表示状態１０に示すように、購入商品の送付先とユーザがこの購入商品に対する代金を支払うクレジットカード情報の入力を促す表示がなされる。

上記表示状態１０に示す表示内容に応じて、ユーザがキー操作部２４を操作して、所望する商品の送付先と、商品代金の支払いを行うクレジットカード情報を入力し、これらの情報を、基地局３を介して電子商店のサイトに送信する（Ｓ３０）。すなわち、携帯通信制御部２８が、ユーザによって入力された商品の送付先情報と、クレジットカード情報とを無線通信部３０に指示して、アンテナ２１を介して基地局３に無線で送信する。

基地局３は、これらの情報を、携帯電話２から基地局アンテナ１０を介して移動通信制御部１２が受信すると、携帯電話２のネットショッピング先として接続している電子商店４のサイトに、受信した情報を送信するようにゲートウェイ１１に指示を出す。

この指示に応じて、ゲートウェイ１１は、上記受信した情報を、携帯電話２がネットショッピングを行っている電子商店４のサイトＡに送信する。

電子商店４は、基地局３を介して、携帯電話２から上記送付先情報と、クレジットカード情報とを受信すると、これらの情報を確認する。そして、確認が完了すると、電子商店４は、ネットショッピング完了情報を基地局３に送信する（Ｓ３２）。なお、このネットショッピング完了情報には、携帯電話２のユーザとの間において商取引が完了したことを示す情報のほかに、実際に取引が行われた商品および該商品の代金等を示す情報もふくまれている。

基地局３は、電子商店４からネットショッピング完了情報を受信すると、受信した該情報に基づき、携帯電話２のユーザと電子商店４との間で行われたネットショッピングの履歴情報を個人識別情報テーブル１８に記録する（Ｓ３４）。

すなわち、基地局３において、ゲートウェイ１１を介して移動通信制御部１２が上記ネットショッピング完了情報を電子商店４から受信すると、個人識別登録部１４に指示して、ネットショッピングを行った履歴情報、すなわちクレジット決済を行った情報をヒストリー情報として個人識別情報テーブル１８に記録させる。なお、この個人識別登録部１４は、ネットショッピング開始要求時に携帯電話２から受信している機器ＩＤ番号３４を参照して、該機器ＩＤ番号３４の情報として上記ヒストリー情報を記録する。

このようにして、基地局３では、携帯電話２において行われたネットショッピングの履歴、すなわちクレジットカード決済の履歴情報をヒストリー情報として記録しておくことができる。

そして、上記ヒストリー情報が記録されると、移動通信制御部１２は、基地局アンテナ１０を制御して、携帯電話２にネットショッピングの完了通知を送信する（Ｓ３５）。

この完了通知を、アンテナ２１を介して無線通信部３０が受信すると、携帯通信制御部２８が、表示部２３にネットショッピングが完了した旨を示す表示を指示する。そして、表示部２３は、携帯通信制御部２８からの指示に応じて、表示状態１１に示すような、ネットショッピングを完了した旨を通知する表示を行う。そして、ユーザはこれ以上ネットショッピングを行う必要がない場合、キー操作部２４を操作して、メニュー画面（表示状態１２）に戻る。このようにして、携帯電話２と電子商店４との間におけるネットショッピングが実行される。

なお、上記にて、携帯電話２が電子商店４に対して、上記ユーザのクレジット情報を送信して、支払う商品代金のクレジット決済を行う構成であった。しかし、この構成に限定されるものではなく、ユーザが電子商店４のサイトから送信されたネットショッピング用画面において、所望する商品またはサービスの購入を決定した場合、このユーザによって決定された内容を示す情報と、購入する商品の送付先の情報とを基地局３を介して、電子商店４に送信する。

そして、電子商店４は、ユーザの所望する商品を確認し、該商品の購入代金を基地局３に請求する。この請求に応じて、基地局３がネットショッピングを行った携帯電話４の通話料金に、購入した商品の代金を上乗せして通話料金請求時にともに請求する構成であってもよい。この場合、ユーザは基地局３を介して電子商店にユーザのクレジット情報を送信する必要がないため、上記クレジット情報が漏洩したりする問題を防ぐことができる。

また、本実施の形態に係るネットショッピングシステム１では、上記認証処理時において、ユーザが入力する音声の特定ワードを基地局３側から任意に指定する構成であったが、これに限定されるものではなく、携帯電話２が任意に特定ワードを選択する構成であってもよい。この場合は、基地局３が、特定ワードを指定するための構成を省略することができるため、基地局３の設備投資にかかるコストを低減することができる。

また、本実施の形態に係るネットショッピングシステム１では、携帯電話２が上記声紋識別部３２を備え、音素辞書３３を記憶している構成であったが、基地局３がこの声紋識別部３２を備え、音素辞書３３を記憶している構成であってもよい。この場合、基地局３は、携帯電話２の通話を中継する際に、携帯電話２から通話中の音声も取得し、携帯電話２のユーザの音声の特徴量パターンを特定話者サンプル情報３６として音素辞書３３に記憶することとなる。このように、基地局３が声紋識別部３２を備え、音素辞書３３を記憶している構成の場合、通常の構成を有する携帯電話２を用いて携帯電話２のユーザの音声に対する認証処理を行うことができる。

また、本実施の形態に係るネットショッピングシステム１では、携帯電話２と基地局３と電子商店４を備えた構成であったが、携帯電話２の代わりに、特定のユーザによって使用される家庭内の電話器であってもよいし、基地局３と通信可能となる無線通信カードおよび、ユーザの音声を取得する集音装置を備えた、例えばＰＤＡといった携帯情報機器であてもよい。携帯電話２の代わりに、集音装置を備えた、例えばＰＤＡを用いる場合、該集音装置によって、ＰＤＡを所持する特定のユーザの日常会話から特定ワードの音声のサンプルを収集することとなる。

また、上記携帯電話３において、特定ワードに対する音声を探索し、この音声に対する特徴量パターンを音素辞書３３に記録する構成であった。また、認証処理時に特定ワードの音声入力をユーザに要求する構成であったが、特定ワードといった単語に限定されるものではなく、単音である母音、子音を用いた音素の組み合わせであっても良い。

また、上記ユーザのみが知っている単語や音素の組み合わせであってもよい。

また、上記特定ワードは、携帯電話２および基地局３でのみ把握しており、上記ユーザすらも知らないものであってもよい。

また、上記携帯電話２が備える記憶部２７の音素辞書３３には、特定ワードに対して発声した不特定話者の音響モデルである不特定音響モデル情報３５を予め記憶している構成であった。そこで、この不特定音響モデル情報３５を音素辞書３３に記憶せず、携帯電話２のユーザの通話中の音声を解析して、音声と音声との区切り（ブレイク）を基準にして、このブレイクで区切られる音素群を任意に選択し、この選択した音素群の特徴量のパターンが類似する音素群のサンプルを取得していく構成であってもよい。

この場合は、予め、不特定音響モデル情報３５を備える必要がないため、予め携帯電話２において記憶しておくデータ量を低減させることができる。

なお、上記音声と音声との区切りとは、通話中において様々な単語が連続して出てくるが、単語間では必ず音声が発声されない区切り（ブレイク）が生じる。したがって、この区切り（ブレイク）を基準にして、通話中の音声から単語に該当する音素群を選択することができる。

なお、上記実施形態の携帯電話２および基地局３の各部や各処理ステップは、ＣＰＵまたはＤＳＰなどの演算手段が、ＲＯＭ（Read Only Memory）やＲＡＭなどの記憶手段に記憶されたプログラムを実行し、キーボードなどの入力手段、ディスプレイなどの出力手段、あるいは、インターフェース回路などの通信手段を制御することにより実現することができる。

したがって、これらの手段を有するコンピュータが、上記プログラムを記録した記録媒体を読み取り、当該プログラムを実行するだけで、本実施形態の携帯電話２および基地局３の各種機能および各種処理を実現することができる。また、上記プログラムをリムーバブルな記録媒体に記録することにより、任意のコンピュータ上で上記の各種機能および各種処理を実現することができる。

この記録媒体としては、マイクロコンピュータで処理を行うために図示しないメモリ、例えばＲＯＭのようなものがプログラムメディアであっても良いし、また、図示していないが外部記憶装置としてプログラム読取り装置が設けられ、そこに記録媒体を挿入することにより読取り可能なプログラムメディアであっても良い。

また、何れの場合でも、格納されているプログラムは、マイクロプロセッサがアクセスして実行される構成であることが好ましい。さらに、プログラムを読み出し、読み出されたプログラムは、マイクロコンピュータのプログラム記憶エリアにダウンロードされて、そのプログラムが実行される方式であることが好ましい。なお、このダウンロード用のプログラムは予め本体装置に格納されているものとする。

また、上記プログラムメディアとしては、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやＣＤ／ＭＯ／ＭＤ／ＤＶＤ等のディスクのディスク系、ＩＣカード（メモリカードを含む）等のカード系、あるいはマスクＲＯＭ、ＥＰＲＯＭ（Erasable Programmable Read Only Memory）、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read Only Memory）、フラッシュＲＯＭ等による半導体メモリを含めた固定的にプログラムを担持する記録媒体等がある。

また、インターネットを含む通信ネットワークを接続可能なシステム構成であれば、通信ネットワークからプログラムをダウンロードするように流動的にプログラムを担持する記録媒体であることが好ましい。

さらに、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであることが好ましい。

以上より、本実施の形態に係る携帯電話２は、通話中のユーザの音声から、特定ワードの特徴量パターンのサンプルを作成し、該サンプル数を増加させることで、入力された音声に対する適合率を向上させることができるため、認証時において高精度の認証を行うことができる。また、これらは、安価で、比較的容易なアルゴリズムであるソフトウエアで実現できるため、携帯電話のような性能、使用状況が制限される装置においても利用することができる。このため、携帯電話２を使用するネットショッピングのセキュリティ対策に非常に有効となる。

また、携帯電話２においてユーザの音声に対する認証を行うことができるため、基地局３側は、高度な認証システムを構築したり、複雑な認証処理アルゴリズムを必要とするプログラムを実行させたりする必要がない。

なお、本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

また、上記した実施の形態では、携帯電話２のユーザの個人認証可能なシステムとして、ネットショッピングシステム１に関して説明したが、これに限定されるものではなく、携帯電話２のような通話機能を有する装置から特定の処理の要求を他の装置に行う際に、個人認証の必要となるシステム、例えば、ネットバンキングシステムなどにおいても利用できる。

例えば、上記したネットショッピングシステム１の代わりに、ネットバンキングシステムにおいて上記携帯電話２を利用する場合、電子商店４の代わりに、金融機関等のサイトとなる。

本発明に係る通話装置は、通話中の音声から収集した特定個人の音声に基づくサンプルを用いて、該特定個人の音声に対する認証に利用することができる。このため、上記通話装置は、特定の利用者によって使用されるような携帯電話やトランシーバ、電話機などの通話可能な装置を利用して個人識別を行う必要があるシステムに適用できる。

本実施の形態に係る携帯電話が備える声紋識別部の概略構成の一例を示すブロック図である。本実施の形態に係るネットショッピングシステムの概略構成の一例を示す図である。本実施の形態に係る基地局の概略構成の一例を示す図である。本実施の形態に係る携帯電話の概略構成の一例を示す図である。本実施の形態に係る携帯電話におけるユーザの認証処理の一例を示すフローチャートである。本実施の形態に係る携帯電話におけるユーザのネットショッピング処理の一例を示すフローチャートである。本実施の形態に係る携帯電話の表示部における、認証処理時およびネットショッピング実行時の表示状態の一例を示す図であり、同図（ａ）は、認証処理が成功しネットショッピングが実行された場合の表示状態の一例を示し、同図（ｂ）は、認証処理に失敗した場合の表示状態の一例を示している。特定ワードに対するユーザの音声に関するサンプル数と、該ユーザによって入力された特定ワードの音声に対する認識率（適合率）との対応関係を示すグラフである。

符号の説明

１ネットショッピングシステム（通信認証システム）
２携帯電話（通話装置）
３基地局（中継処理装置）
４電子商店（情報処理装置）
１２移動通信制御部（通信遮断手段）
１４個人識別データ登録部（適合度履歴情報取得手段）
１６電子商取引許可判定部（通信許可判定手段）
１７特定ワード指定部（認証指示手段）
２５音声入力部（音声取得手段）
３３音素辞書（識別情報）
４３符号比較部（識別情報更新手段）
４４サンプル作成（識別情報更新手段）（履歴情報記録手段）
４５適合率計測確認部（識別情報更新手段）（適合度算出手段）（認証手段）
４６サンプル数カウンター部（識別情報量算出手段）
４７機器シャットダウン部（動作制限手段）
４８個人識別可能放置部（認証実行可能通知出力手段）
４９適合率結果通知部（履歴情報出力手段）
５０サンプル作成・認証判定部（認証実行許可手段）
５１認証結果通知部（認証判定出力手段）

Claims

音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行う認証手段を備えた通話装置であって、
上記特定個人の通話中の音声を取得する音声取得手段と、
上記音声取得手段によって取得された音声に基づき、上記識別情報を更新する識別情報更新手段とを備えていることを特徴とする通話装置。
上記識別情報は、特定個人の通話中における音声の特徴量に関する情報であり、
上記認証手段は、入力された音声の特徴を示す特徴量と識別情報更新手段によって更新されている識別情報との適合度が所定の閾値以上であるか否かに応じて、入力された音声が特定個人の音声であるか否かの認証を行うことを特徴とする請求項１に記載の通話装置。
上記識別情報は、特定個人の通話中の音声に基づく、特定の音素群の特徴量に関する情報であり、
上記認証手段は、特定個人の音声であるか否かの認証を、特定の音素群の入力に対してのみ行うことを特徴とする請求項１に記載の通話装置。
上記識別情報は、複数の不特定話者の音声における、特定の音素群の特徴量に関する情報をさらに含むことを特徴とする請求項２に記載の通話装置。
上記特定の音素群は、外部からの指示に応じて指定されることを特徴とする請求項３に記載の通話装置。
上記音声取得手段によって取得された音声の特徴量と、既に取得されている音声に基づいて更新されている識別情報との適合度を算出する適合度算出手段と、
上記適合度算出手段によって算出された適合度が所定の閾値以上である場合、
上記識別情報更新手段は、上記音声取得手段によって取得された音声に基づき、上記識別情報を更新することを特徴とする請求項１に記載の通話装置。
上記識別情報更新手段によって更新された識別情報の情報量に応じて、上記適合度が単調増加することを特徴とする請求項６に記載の通話装置。
上記適合度算出手段によって算出された適合度の履歴情報を記録する履歴情報記録手と、
上記履歴情報記録手段によって記録された上記適合度の履歴情報を出力する履歴情報出力手段とを備えていることを特徴とする請求項６または７に記載の通話装置。
上記識別情報更新手段によって更新された識別情報の情報量を算出する識別情報量算出手段を備え、
上記識別情報量算出手段が上記情報量が所定量に達したと判定した場合、上記認証手段に対し、入力された音声に対する認証の実行を許可する認証実行許可手段を備えていることを特徴とする請求項１に記載の通話装置。
上記識別情報量算出手段によって算出された上記情報量が所定量に達し、上記適合度算出手段によって算出された適合度が所定の閾値以上である場合、上記認証手段に対し、入力された音声に対する認証の実行を許可する認証実行許可手段を備えていることを特徴とする請求項９に記載の通話装置。
上記認証実行許可手段は、さらに入力された音声に対する認証を実行可能な状態となったことを示す通知を出力する認証実行可能通知出力手段を備えていることを特徴とする請求項９または１０に記載の通話装置。
上記認証手段が、入力された音声が上記特定個人の音声でないと認証した場合、各種機能の動作を制限する動作制限手段を備えていることを特徴とする請求項１に記載の通話装置。
上記認証手段による認証結果を出力する認証判定出力手段を備えることを特徴とする請求項１に記載の通話装置。
請求項１ないし１３のいずれか一項に記載の通話装置と、通信によって入力された情報を処理し、出力する情報処理装置との間における通信の中継を行う中継処理装置であって、
上記通話装置から通知された認証の結果に応じて、上記通話装置と上記情報処理装置との通信を許可するか否かを判定する通信許可判定手段とを備えていることを特徴とする中継処理装置。
請求項１ないし１３のいずれか一項に記載の通話装置と、通信によって入力された情報を処理し、出力する情報処理装置との間における通信の中継を行う中継処理装置であって、
上記通話装置から上記適合度の履歴情報を取得する適合度履歴情報取得手段を備えていることを特徴とする中継処理装置。
入力する音声を指定して認証を指示する認証指示手段を備えていることを特徴とする請求項１４または１５に記載の中継処理装置。
上記通話装置から受信した認証結果が、入力された音声が上記特定個人の音声でない場合、上記通話装置からの通信を遮断する通信遮断手段を備えていることを特徴とする請求項１４または１５に記載の中継処理装置。
上記通話装置から入力された音声に対する認証を実行可能な状態となったことを示す通知を受信すると、該通話装置を認証可能な装置として記録する装置記録手段を備えていることを特徴とする請求項１４または１５に記載の中継処理装置。
上記特定個人の通話中の音声を取得する音声取得手段を有する通話装置と、該通話装置と情報処理装置との間の通信を許可するかの中継を行う中継処理装置とを備えた通信認証システムであって、
音声を識別するための識別情報に基づき、上記通話装置に入力された音声が特定個人の音声であるか否かの認証を行う認証手段と、
音声取得手段によって取得された音声に基づき、上記識別情報を更新する識別情報更新手段と、
上記認証手段によって認証された結果に基づき、上記通話装置と上記情報処理装置との間の通信を許可するか否かを判定する通信許可判定手段とを備えていることを特徴とする通信認証システム。
音声を識別するための識別情報に基づき、入力された音声が特定個人の音声であるか否かの認証を行うステップと、
上記特定個人の通話中の音声を取得するステップと、
上記取得された音声に基づき、上記識別情報を更新するステップとを含むことを特徴とする通話装置の制御方法。
請求項１〜１３の何れか１項に記載の通話装置を動作させるための制御プログラムであって、コンピュータを上記各手段として機能させるための通話装置の制御プログラム。
請求項２１に記載の通話装置の制御プログラムが記録されたコンピュータの読取り可能な記録媒体。