JP2009508144A - 生体測定声紋認証方法および生体測定声紋認証装置 - Google Patents
生体測定声紋認証方法および生体測定声紋認証装置 Download PDFInfo
- Publication number
- JP2009508144A JP2009508144A JP2008513828A JP2008513828A JP2009508144A JP 2009508144 A JP2009508144 A JP 2009508144A JP 2008513828 A JP2008513828 A JP 2008513828A JP 2008513828 A JP2008513828 A JP 2008513828A JP 2009508144 A JP2009508144 A JP 2009508144A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- vocal tract
- user
- biometric
- voiceprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 230000001755 vocal effect Effects 0.000 claims description 116
- 230000008859 change Effects 0.000 claims description 40
- 239000011159 matrix material Substances 0.000 claims description 38
- 239000013598 vector Substances 0.000 claims description 35
- 238000001228 spectrum Methods 0.000 claims description 33
- 238000004891 communication Methods 0.000 claims description 18
- 238000004458 analytical method Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 9
- 238000012795 verification Methods 0.000 claims description 7
- 230000003595 spectral effect Effects 0.000 claims description 6
- 230000009471 action Effects 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 claims description 2
- 230000003213 activating effect Effects 0.000 claims 1
- 238000010295 mobile communication Methods 0.000 description 17
- 238000012790 confirmation Methods 0.000 description 14
- 238000007726 management method Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 208000001613 Gambling Diseases 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 210000003800 pharynx Anatomy 0.000 description 2
- 230000013707 sensory perception of sound Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013474 audit trail Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 208000016339 iris pattern Diseases 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 210000000088 lip Anatomy 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 210000002105 tongue Anatomy 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C9/00—Individual registration on entry or exit
- G07C9/30—Individual registration on entry or exit not involving the use of a pass
- G07C9/32—Individual registration on entry or exit not involving the use of a pass in combination with an identity check
- G07C9/37—Individual registration on entry or exit not involving the use of a pass in combination with an identity check using biometric data, e.g. fingerprints, iris scans or voice recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/10—Multimodal systems, i.e. based on the integration of multiple recognition engines or fusion of expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computer Security & Cryptography (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Collating Specific Patterns (AREA)
- Telephonic Communication Services (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
【課題】ユーザを認証するシステムと方法を提供する。
【解決手段】ユーザを認証する方法(700)とシステム(900)が提供される。本方法は、ユーザから一以上の話された言葉を受取り(702)、一以上の話された言葉に対応するフレーズを認識し(704)、フレーズにおける一以上の話された言葉から、ユーザの生体測定の声紋を識別し(706)、デバイスと関連付けられたデバイス識別子を決定し(708)、フレーズ,生体測定の声紋,およびデバイス識別子に基づき、ユーザを認証すること(710)を含む。一以上の資源に対するアクセスを許可する判断基準として、送受信機すなわちユーザの位置が用いられる(712)。
【選択図】図1
【解決手段】ユーザを認証する方法(700)とシステム(900)が提供される。本方法は、ユーザから一以上の話された言葉を受取り(702)、一以上の話された言葉に対応するフレーズを認識し(704)、フレーズにおける一以上の話された言葉から、ユーザの生体測定の声紋を識別し(706)、デバイスと関連付けられたデバイス識別子を決定し(708)、フレーズ,生体測定の声紋,およびデバイス識別子に基づき、ユーザを認証すること(710)を含む。一以上の資源に対するアクセスを許可する判断基準として、送受信機すなわちユーザの位置が用いられる(712)。
【選択図】図1
Description
本発明は、一般に発話認証、より詳しくは音声識別に関する。
電子技術とソフトウェアの進歩は、システムがより効果的に人を認証および確認するのを可能にしてきた。例えば、カメラのような画像処理システムは、人の画像を捕捉し、その画像から人を特定することができる。指紋走査システムは、接触を通して人を識別するために、指紋を捕えることができる。音声処理システムは、人々の声を通して人を識別することができる。これらの技術は、システムセキュリティを確実にし、システムへのアクセスを委任するために、使用前のユーザの識別に提供される。
音声識別(ID)システムは、様々なセキュリティ関連のアプリケーションで用いられている。音声IDは、時々音声認証と呼ばれているが、これは話者を確かめるために、声紋とパターン認識のソフトウェアを使用する一種のユーザ認証である。生体測定に適合して、音声IDは、声の特徴が指紋および人々の虹彩パターンのように、個人毎に唯一のものであるという前提を頼りにしている。
多くの人々は、移動体デバイスとコンピュータとの結合を通して、インターネット上でのオンラインと共に、情報のやり取りを行なうことができる。移動体デバイスは、オンライン状態になると、他の通信システムとの接続を確立することができる。こうした移動体デバイスのユーザを識別することは、安全なアクセスを提供するための重要な側面を有する。しかしながら、移動体デバイスにおけるユーザの識別は、一般に市販されていない。したがって、ユーザを認証するための必要性が存在する。
本発明の各実施例は、デバイス(装置)における音声認証方法に関する。この方法は、ユーザから一以上の話された言葉(spoken utterance)を受取ることと、前記一以上の話された言葉に対応するフレーズを認識することと、前記フレーズにおける前記一以上の話された言葉の変動性から、生体測定の声紋(voiceprint)を識別することと、デバイスと関連付けられたデバイス識別子を決定することと、前記フレーズ,前記生体測定の声紋,および前記デバイス識別子に基づき、前記ユーザを認証することを含む。生体測定の声紋を作成するために、前記一以上の話された言葉の変動性を決定することができる。この生体測定の声紋は、ユーザの声道に対して身体的に固有なものである声道構造となる。前記ユーザを認証することで、デバイスとの通信を有する一以上の資源に対して、アクセスが許可され得る。アクセスを許可するために、前記デバイスすなわち前記ユーザの位置を、決定することができる。
システムの特徴は、新規性を有するものと信じるが、これは添付の請求の範囲において詳しく記述される。ここにある各実施例は、添付図面と関連付けて、以下の説明を参照することで理解することができ、幾つかの図面において、同一の参照番号は同一の要素であると見なされる。
本発明における方法とシステムの詳細な各実施例は、ここに開示される。しかし、開示される各実施例は、単なる例示的なものに過ぎず、様々な形態で発明を具体化できることを理解すべきである。したがって、ここに開示される特定の構造および機能が、限定的なものとして解釈されるのではなく、殆どあらゆる適切に詳細化された構造において、本発明の各実施例を種々採用するために、請求の範囲に対する基礎として、また当業者を教示する基礎として解釈される。さらに、ここに使用される用語および語句は、限定のために意図されたのではなく、むしろ本実施例の理解可能な記述を提供するのに意図されたものである。
ここで用いられる用語「a」または「an」は、1以上と定義される。ここで用いられる用語「plurality(複数)」は、2以上と定義される。ここで用いられる用語「another(別)」は、少なくとも第2以上と定義される。ここで用いられる用語「including(含む)」や「having(有する)」は、構成する(すなわちオープン言語)ように定義される。ここで用いられる用語「coupled(結合された)」は、接続されたと定義されるが、直接的に接続さたとは限らず、また機械的に接続されたとは限らない。用語「suppressing(抑える)」は、部分的若しくは完全に減少するか、或いは除去することとして定義することができる。用語「processing(処理する)」は、予めプログラムされ、またはプログラムされた命令の集合を実行する多くの適当なプロセッサ,コントローラ,ユニットまたは同様のもので定義することができる。
ここで用いられる用語「program(プログラム)」,「software application(ソフトウェアアプリケーション)」およびそれと同様のものは、コンピュータシステム上での実行のために設計される命令シーケンスとして定義される。プログラム,コンピュータープログラムまたはソフトウェアアプリケーションは、サブルーチン,機能、手続、オブジェクト方法,オブジェクト実行,実行可能アプリケーション,ソースコード,オブジェクトコード、共有ライブラリ/ダイナミックロードライブラリ,および/またはコンピュータシステム上での実行のために設計される他の命令シーケンスを含んでもよい。
本発明の各実施例は、ユーザを認証するシステムと方法に関するものである。当該方法は、ユーザから一以上の話された言葉を受取り、一以上の話された言葉に対応するフレーズ(語句)を認識し、このフレーズにおける一以上の話された言葉の変動性から、生体測定の声紋を識別し、デバイスと関連付けられたデバイス識別子を決定し、前記フレーズ,生体測定の声紋,およびデバイス識別子に基づき、前記ユーザを認証することを含む。
本発明の各実施例はさらに、ユーザ固有の声紋と、この声紋を生成する間にユーザが話すフレーズと、例えばIMEI番号のようなユーザ自身の送受話器識別子とに基づくことが可能な認証システムを含む。一つの実施例では、一以上の資源へのアクセスを承認するためのさらなる基準として、送受話器すなわちユーザの位置を採用することができる。本システムは、ユーザ識別における例えば現時点の「社会保障番号/母方の旧姓」モデルを、生体測定の特徴、すなわちユーザの声を利用するより強力(robust)な方法に置換えることができる。
図1を参照すると、ここでは音声認証のための移動通信環境100が示されている。移動通信環境100は、音声認証サーバ130と、データベース130と、一以上の移動体デバイス102を含んでいる。データベース130はユーザプロファイルを保存することができ、移動体デバイス102のユーザを特定するのに利用可能である。ユーザプロファイルは、パスフレーズ、生体測定声紋,およびデバイス識別子を含むことができる。サーバ130はユーザの音声を認証するために、ユーザ自身のプロファイルをデータベース140に保存される他のユーザプロファイルと比較することができる。例えば移動体デバイス102のユーザは、その移動体デバイスが利用できる一以上の資源にアクセスするために、当該移動体デバイスに向けて話すことができる。ユーザの音声を認証すると、一以上の資源に対してアクセスが許可され得る。例えば資源は、サーバ,PBX,または他のあらゆる好適な通信システムとすることができる。当該資源は、音楽ダウンロード,オンラインギャンブル,申込,ゲームなどのように、前記デバイスが利用できる特徴またはサービスを提供できる。またこの資源は、個人情報や、リモートサーバや、財務データ若しくはビジネスデータを提供するデータストアのように、安全な若しくは安全でないウェブサイトへのアクセスを提供できるが、それらのものに限定されない。
サーバ130は、ユーザによって話されたパスフレーズが正しいパスフレーズかどうかを認識すると共に、そのフレーズの発音と関連付けられた生体測定の声紋が、データベース内におけるユーザプロファイルに正しくマッチするかどうかを認識することができる。とりわけ、ここでの生体測定の声紋は、前記パスフレーズの一以上の発音中に、ユーザの話すスタイル(形態)における一以上の変動性を分析することで取得される。例えば音声認証サーバ130は、一以上の資源へのアクセスを認証するために、パスフレーズの発音の間に取得されたユーザの声の特徴が、データベース140における一以上の生体測定の声紋にマッチするかどうかを決定できる。さらにサーバ130は、移動体デバイス102が資源にアクセスするためにユーザに対して認証されたデバイスで、またそのユーザにおける生体測定の声紋と関連付けられたデバイスであることを確認できる。特にサーバ130は、移動体デバイス102に向けて話しているユーザが、その移動体デバイスと関係していることを確認できる。ある例では、取得した生体測定の声紋と関連付けられたIMEI番号を通して、デバイスがユーザに登録されるかどうかを決定できる。このIMEI番号は、移動体デバイスに固有のデバイス識別子である。別な装置では、一以上の資源へのアクセスを認証するために、サーバ130がデバイスの位置を決定できる。例えば、移動体デバイス102はそのデバイス位置を特定するために、汎地球測位システム(GPS)を含むことができる。代わりに、前記サーバはユーザによって提示された場所に基づいて、資源へのアクセスを認証することができる。例えば、ユーザはそうした場所を話すことができ、サーバ130は、当該話した場所がデバイスすなわちユーザの認証若しくは受け入れられた位置と一致するかどうかを決定できる。ユーザの音声は、移動体デバイス102で、またはサーバ130で、ユーザの身元を確認するために処理され得る。
移動通信環境100は、システム上で一以上の音声認証サーバ130と無線周波数(RF)通信ネットワークまたはリンク越しに、無線接続性を提供することができる。サーバ130は、音声およびデータ配信をサポートできるゲートウェイ、PBXまたは他のあらゆる電気通信ネットワークデバイスとすることができる。あらゆる適切なプロトコル(例えばTCP/IP,HTTP,HTTPS,SIPなど)を利用して、無線,銅線,および/またはファイバ光接続を用いて、ネットワーク100中の通信を確立できる。一つの装置では、移動体デバイス102はCDMA,TDMA,OFDM,GSMまたはそれと同様のもののように、標準的な通信プロトコルを使用する基地受信機110と通信を行なうことができる。代わって基地受信機110は、パケット交換方式のリンク越しに、移動体デバイス102をインターネット120に接続することができる。インターネット120は、アプリケーションサービスとサービスの各層をサポートし、移動体デバイス102にメディアまたはコンテンツを提供できる。アプリケーションサービス層は、財務またはビジネスに基づくアプリケーションに対するデータベースアクセスを含むことができる。移動体デバイス160は、無線通信チャネルを利用するインターネット120を通して、他の通信デバイスとの接続も可能である。移動体デバイス160は、ネットワーク上でサーバ130と通信を確立し、音声,データおよびメディアを交換し合うために、他の移動体デバイスと通信を確立できる。このサーバは直接、または移動体デバイス102を通してアクセスされ得るインターネット120越しに、アプリケーションサービスをホスト提供することができる。
移動体デバイス102は、移動通信環境100上でサーバ130または他の遠隔サーバにデータを送受信できる。例えば、移動体デバイス160はWLAN上でインターネット120に接続することも可能である。無線ローカルアクセスネットワークス(WLANs)は、ローカルな地理的領域内において、移動通信環境100への無線アクセスを提供する。WLANsは一般に、基地局としても知られるアクセスポイント104の一群から構成される。移動通信デバイス102は、音声,データおよびメディアを交換し合うために、前記基地局の領域内でラップトップ103のような他のWLANステーションと通信を行なうことができる。標準的なWLANの実施に際し、802.11bまたは802.11gのWLANテクノロジーのように、物理層は様々な技術を使用する。この物理層は、赤外線による2.4GHz帯の周波数ホッピングスペクトラム拡散や、2.4GHz帯の直接シーケンススペクトラム拡散を利用してもよい。
移動体デバイス102は、回線交換RF接続110若しくはパケットベースのWLANアクセスポイント104越しに、サーバ130からおよびサーバ130にデータを送受信できるが、そうしたものに限定されない。特にここでのデータは、一以上の資源へのアクセスをユーザに与えるために、一以上の音声認証サーバ間で共有することが可能なユーザ自身のプロファイルを含むことができる。当然のことながら音声は、音声通信を提供するために、移動体デバイス160からおよび移動体デバイス160に伝送することが可能な音声のパケットとして提示される。例えば、移動体デバイス160のユーザは、その移動体デバイスが利用できる一以上の特徴にアクセスするために、サーバ130またはラップトップ103に呼出しを開始できる。移動通信環境100越しに音声データを伝送できることによって、音声通信を提供する。前記移動体デバイス160は、携帯電話や、パーソナル携帯情報機器や、携帯用の音楽プレーヤーや、他のあらゆる種類の通信デバイスとすることができる。
図2を参照すると、ここには前記移動通信環境100の範囲内で配置される音声認証システム200の典型的な実例が示されている。音声認証システム200は、音声認証サーバ130と、インターフェース150と、データベース140を含むことができる。サーバ130は、ユーザプロファイルを検索するために、インターフェース150を通してデータベース140にアクセスできる。このインターフェースは、ウェブ層152と、ビジネス層154と、データベースアクセス層156を含むことができる。ここでのインターフェース150は、単にネットワーク上で処理するデータと関係しているトランスポート層だけを説明しているに過ぎない点に留意すべきである。インターフェース150は、図示された構成要素の数よりも多少のものを有することができるが、それに限定されるものではない。
データベース140は、音声認証のために複数のユーザプロファイル142を含むことができる。ユーザプロファイル142はユーザに対し固有のもので、且つデバイスに対し固有のものでもあり得る。ユーザプロファイル142は、生体測定声紋144と、パスフレーズ146と、移動体デバイス識別子148を含むことができる。パスフレーズ146は、音声認証の間に話されたものに対し、ユーザによって特に選択された一以上のワードである。ユーザが移動体デバイス102に向けてパスフレーズを話すと、ユーザ自身の音声による声紋が取得され、ユーザプロファイル142に保存される。生体測定声紋142は、ユーザに対して固有である当該ユーザの話すスタイルの特徴を識別するものである。特に生体測定声紋142は、ユーザの声道に対し身体的に固有である声道の構造的な違いをあらわしている。つまり、ユーザの声道は、当該ユーザの声道の身体的な構造に依存する身体的変化を受けたものとすることができる。生体測定声紋は、個人に対し固有であるパスフレーズの発音の間に、声道のそうした特有の変化と関連した身体的な特徴を捕える。ユーザの声道構造は、食道,咽頭,喉頭,口,舌,および唇を含む。これらの身体的な特質(attribute)は、パスフレーズの明確な発言の間の発話生成中に、特定の身体的変化を受けることができ、ユーザの発声と話すスタイルに特有なものである。特に、話しが行なわれた発声における一以上の発音の間に、これらの身体的な特質が被った変化量を、ユーザの身元を確認するのに測定することができる。
図3を参照すると、前記音声認証システム200の典型的実施部300が示されている。当該典型的実施部300は、例えば携帯電話または他の移動コンピュータデバイスのような送受話器102と、移動通信環境100越しに当該送受話器と通信を行なう音声認証サーバ130とを含む。サーバ130は、あらゆる適切なコンピューティングまたはネットワークサーバとすることができる。これらに限られていないけれども、サーバ130上で動作するソフトウェアは、前記送受話器と通信を行なうためのウェブ層152(図2を参照)と、ビジネス層154と、データを格納および読み出すためのデータベースアクセス層154とを含むことができるが、そうしたものに限定されない。サーバ130は監視ページを含むこともでき、それにより前記サーバへの管理のアクセスを可能にする。例えば、この監視ページを通してユーザは自身のプロファイルを更新することができる。音声認証サーバ130は、ユーザプロファイルの作成と、ユーザプロファイルのメンテナンスとユーザ認証を提供する。例えば、ユーザプロファイルは、前記生体測定の声紋,パスフレーズおよびデバイス識別子から作成され、図2で記述したような声紋データベースに保存できる。ユーザプロファイルのメンテナンスは、生体測定声紋や、パスワードや、それに関連する情報のように、プロファイルの詳細を更新または変更する権限を、ユーザに与える。ユーザ認証は、予め生成された声紋に対してユーザが認証されるのを可能にするものである。当該認証は、ユーザ自身の記録された音声と、ユーザに提供される送受話器IMEIまたはPIN(個人認証番号:Personal Identification Number)を用いて行なうことが可能である。例えばIMEIの代わりとして、ユーザのプロファイルとデバイスを結びつけるために、PINを前記移動体デバイスに割り当てることができる。
図2に予め示したシステムの各構成要素に加えて、前記典型的実施部300は、音声認証サーバ130と図1における既存の呼処理移動通信環境100との間に挿入されるゲートウェイ145を含むことができる。1つの装置では、サーバ130は加入者のコンプライアンスであるLDAPと、監査証跡をサポートすることができる。1つの装置では、ゲートウェイ145は、移動体デバイス120によって提供されたGPS情報を用いて、発信者の位置を確かめることができる。位置確認能力を備えた生体測定声紋認知の組合せは、ギャンブル(例えば、幾つかの州または領土でのみ許可されているかもしれない)、または商取引(特定のアイテムの販売が、若干の管轄区域で許可されていないかもしれない)のようなアプリケーションに対し、とりわけ都合のよい解決をもたらす。ゲートウェイ145は、発信者の位置を確立するために、前記GPSデータからデバイスの位置を確認できる。
ゲートウェイ145は、移動通信環境100で呼のマッチングとルーティングを行なうことができる。例えば、技術的に知られているように、ゲートウェイはユーザと関連した呼出し番号と呼出された番号とを確認するのに、ANIとDNISをサポートできる。ユーザが呼出されている番号、若しくはユーザが呼出す番号によって、そのユーザを確認することができる。検討された一つの装置では、ユーザプロファイルの一部として呼び情報を含むことができ、この呼び情報はユーザの身元を確認するのに用いられる。実際には、音声認証サーバ130は、呼出し側の識別情報と場所情報についてゲートウェイ145を問合せることで、データベース130に保存されるユーザプロファイルを参照して、移動体デバイス160に向けて話しているユーザを認証できる。
図4を参照すると、ここでは典型的な音声認証システム200が示されている。音声認証システム200は、音声認証サーバ130への接続を有する移動体デバイス102を含むことができる。認証サーバ130は、認証サーブレット(servlet)420と、プロファイル管理モジュール420と、確認モジュール420と、声紋データベース140とを含むことができる。各モジュールは、移動通信環境100内のサーバ130に、若しくは遠隔位置での他のサーバに存在してもよい。図4では、クライアント−サーバに基づく構造概念を示しているが、本発明の態様は、当該構成に限定されるものではない。音声認証の原則は、分散ネットワークとピアツーピアネットワークで等しく適用され得る。
前記構成要素の幾つかは図1から繰り返され、また当該構成要素が、単に移動通信環境100(図1を参照)の範囲内で、音声認証システム200と一体化した一つの実施例を示すためだけに提供される点に注目すべきである。実際には、音声認証システム200は、資源またはサービスにアクセスするためのユーザ音声認証に基づいて、デバイスに対し利用可能な一つ以上の資源に、移動体デバイスのユーザがアクセスするのを許可することができる。音声認証システム200は、既に示されたプログラムモジュールや、そのプログラムモジュールの構造に限られるものではない。ここでのプログラムモジュールは、音声認証の発明的形態を展開するための一つの実施例として示しているに過ぎない。
音声認証システム200は、移動体デバイス102上で動作するアプリケーション410を含む。このアプリケーションは、C,C++,Java(登録商標),ボイス XML,Visual Basicのようなプログラミング言語で記述されるソフトウェアプログラムとすることができる。例えば、アプリケーション410は安全なウェブサイトに、および安全なウェブサイトから、秘密の若しくは安全な情報を送るための財政またはビジネスアプリケーションとすることができる。この秘密の情報は、音声,オーディオ,ビデオまたはデータの形態とすることができる。アプリケーション410は、移動体デバイスによってサポートされた潜在的な通信プロトコルへのアクセスを確保できる。例えば、アプリケーション410は、ジャバ 2 マイクロエディション(J2ME)アプレットとすることができ、このアプレットは、移動体デバイス410に通信接続される一以上のサーバに対し、HTTPをサポートするソケット接続を有する。例えば、サーバ130に接続するために、J2MEは移動体デバイス410上のネイティブCコードにアクセスすることができる。
アプリケーション410は、音声認証サーバ130(図1を参照)上で動いている認証サーブレット420と通信が可能である。この認証サーブレットは、移動体デバイスクライアント102へのフロントエンドとして動作し、リクエストの種類に依存して、音声認証サーバ130への直接の依頼を行なうことができる。例えば、リクエストの種類は、前述のようなユーザプロファイルの作成や、ユーザプロファイルの更新や、ユーザプロファイルの認証としてもよい。リクエストの種類に基づいて、認証サーブレット420は、適切なプロファイル管理機能を呼出すことができる。つまり、リクエストの種類を決定すると、プロファイル管理モジュール420は、それに関連した依頼を実行するために、アプリケーション410と通信を行なうことができる。
一つの装置において、前記認証サーブレット420とアプリケーション420は、安全なHTTP接続412越しに通信を行なうことが可能である。認証サーブレット420はユーザを認証するために、確認モジュール430と通信接続することができる。一つの装置では、認証サーブレット420は、ジャバ ネーティブ インターフェース(Java Native Interface:JNI)414越しに、確認モジュール430と通信が可能である。このJNI414は、各プログラム構成要素の間でプログラミング言語翻訳を提供する。例えば、認証サーブレット420はJavaで記述することができるが、確認モジュール430はCで記述してもよい。JNI414は、コードとデータの構造的な特徴を維持した状態で、一つのフォーマットから別なフォーマットにデータを変換するインターフェースを提供する。確認モジュール430は、アプリケーション410に対し、およびアプリケーション410から情報を通信することができる。特に、移動体デバイス102,HTTPS412,認証サーブレット420,およびJNI414は、移動体デバイス102上で音声認証サーバ130の確認モジュール420とアプリケーション410との間の通信経路(チャネル)を確立する。
実際には、移動体デバイス102は確認モジュール420にユーザプロファイル142(図2を参照)を送ることができる。例えば、移動体デバイスに提供される一以上の資源またはサービスへのアクセスをユーザが望むときに、移動体デバイス102はアプリケーション410を提示できる。さらに、ユーザがユーザプロファイルを作成するときにも、移動体デバイスはアプリケーションを提示できる。例えばアプリケーション410は、ユーザにパスワードフレーズを話すように依頼するJ2MEアプリケーションとすることができる。アプリケーション410は、IMEI数のような移動体デバイス102のデバイス識別子にアクセスすることもできる。この情報は、ユーザプロファイルを作成するのに用いられる。特定のデバイスでは、IMEI数の抽出メカニズムがJ2MEを通してサポートされないこともある。したがって、そのようなデバイスは、ユーザが簡単に覚えることができ、認証に利用できる短いPINをキーとするために、ユーザに対する条件を含んでもよい。IMEI数がサポートされない場合は、ユーザは前記PINをキーとすることを要求されるかもしれず、このPINは保存されたIMEI番号の送信を承認するのに用いられる。
一つの装置では、移動体デバイス102はパスフレーズを認証するための音声認識エンジンを含むことができる。当然のことながら、音声認識エンジンは、フレーズが認識されたことだけを評価するものであって、ユーザの身元を評価するものではない。従って、音声認証における第1の様相、すなわちパスフレーズの確認を、移動送受話器で行なうことができる。サーバでは、生体測定音声認証とデバイス識別子を評価できる。従って、音声認証における第2の様相を、サーバで行なうことができる。
代わりに、発話認識を含む完全な音声認証を、サーバ130で実行することができる。この場合にアプリケーション410は、パスフレーズ144と、生体測定声紋146と、IDEI148とを含むユーザプロファイル142(図2を参照)を作成できる。パスワードフレーズを話すと、J2MEアプリケーション410は、このユーザプロファイルを確認サーバに送信することができる。一つの装置では、J2MEアプリケーション410は、発声された言葉(すなわちパスフレーズ)の音声処理を実行して、ユーザプロファイルを作成する前に、一以上の生体測定による音声の特徴を符号化し、これを確認サーバ430に送出することができる。ここでの符号化は、発声された言葉を送るのに必要な音声パケットのサイズを減らすために、音声データを圧縮できる。例えば技術的に知られていているように、ボコーダを使って音声データを圧縮することができる。第2の装置では、前記発声された言葉を、確認モジュール430に非圧縮のフォーマットで伝送することができる。例えば、パルス符号変調(PCM)フォーマットまたはマイクロソフト ウェーブ フォーマット(WAV)で、音声を伝送することができる。
プロファイル管理モジュール420は、声紋データベース140に保存される一以上のユーザプロファイルを評価するために、認証サーブレット420と通信を行なうことが可能である。このプロファイル管理モジュール420は、ユーザプロファイルを作成し、更新し、削除することができる。プロファイル管理モジュール420は、他のプロファイル管理システムと同期することもできる。例えば、プロファイル管理モジュール420は、ユーザの成功した認証の後に、外部システムでの統合のためにAPIを公開することができる。一つの装置において、当該アプリケーションプログラミングインタフェース(API)は、ここに記述される音声認証システムの特徴に従って、アプリケーション開発者が素早くそれらのアプリケーションを統合するのを可能にする。例えば、図2に戻ってこれを参照すると、APIは生体測定声紋144を作成するためのモジュールと、パスフレーズ142を作成するためのモジュールと、デバイス146を識別するためのモジュールとを含むことができる。APIは、声紋作成および認証の各サービスにアクセスするために、インターフェースを認証サーブレット420に提供する。
プロファイル管理モジュール420は、ジャバ データベース コネクティビティ(Java Database Connectivity:JDBC)416のインターフェース越しに、声紋データベース140と通信を行なうことが可能である。JDBC416は、声紋データベース140からデータを検索して保存するためのデータアクセスを提供できる。例えば声紋データベース140は、技術的に知られていているように、各テーブルで構成されたリレーショナルデータベースとすることができ、このテーブルは行と列の書式設定でインデックスされる。JDBC140は、声紋データベース140内でのデータヘッダとフィールドを位置決めする構造化問合せ言語を提供する。プロファイル管理モジュール420は、生体測定声紋のためにユーザプロファイルを解析して、この生体測定声紋を声紋データベース140内における他の声紋と比較することができる。一つの装置では、インデックスのための移動体送受話器のIMEI番号を用いて、生体測定による声紋を保存できる。特に、声紋データベース140は、登録済の声紋を有する多数ユーザからの一以上の参照となる声紋を含んでいる。声紋でのマッチ(一致)を決定すると、プロファイル管理モジュール420は、一以上の資源へのアクセスをユーザに許可することができる。例えば、プロファイル管理モジュール420は、一以上の安全なウェブサイト,ビジネスデータベース,財務センターなどへのソケット接続を許可可能にする。
図5を参照すると、ユーザプロファイルを作成するためのフローチャートが示されている。ユーザプロファイルの作成は、ここで図示するステップの数よりも多く、或いは少なくてもよい。各ステップの記述に対して、図4が参照となるであろう。ステップ501では、ユーザがアプリケーションを起動する。例えば図4を参照すると、ユーザはJ2MEアプリケーション410を起動させる。代わりに、ユーザはウェブサイトやボイスメールにアクセスしたり、例えばログインスクリーンのように、認証を必要とするサービスを要請したりしてもよい。この場合、前記デバイスはユーザを認定するために、J2MEアプリケーション410を自動的に立ち上げてもよい。ステップ502において、ユーザは声紋作成のためにユーザ音声の記録が促される。ユーザは、そのユーザが音声認証の間に暗唱するはずの特定のフレーズを提示することができる。ステップ503では、提供されたアプリケーション410を使用して、ユーザがそれらの音声を記録する。ステップ504では、ユーザがPIN番号を入力することができる。この場合もまた、アプリケーションがデバイスからIMEI番号を検索できなければ、PIN番号を必要としてもよい。アプリケーション410がIMEIにアクセスできれば、PIN番号を必要としなくてもよい。ステップ505において、ユーザはプロファイルの登録が促される。例えば、ユーザは後の検索のために声紋データベース上に新しく作成されたユーザプロファイルの保存を選択できる。ステップ506では、記録された音声と共に、登録の詳細が認証サーバに送信される。ステップ507では、認証サーバ130がユーザ自身の声紋を作成する。ステップ508では、認証サーバ130が、前記ユーザ自身の声紋を用いてユーザのプロファイルを作成し、そしてIMEI(またはPIN)を作成する。例えば、ユーザプロファイルを声紋データベース140上に保存することができる。ステップ509で、認証サーバ130はユーザに対して肯定的な確証で返答する。
図6を参照すると、音声認証600を通してユーザを確かめるためのフローチャートが示されている。認証600は、ここで図示するステップの数よりも多く、或いは少なくてもよい。各ステップの実行と関連付けられた構成要素の記述に対して、図4も参照となるであろう。ステップ601では、ユーザがアプリケーションを起動する。このアプリケーションも、例えば認証を必要とする特徴またはサービスにアクセスするように、ユーザの行動に基づいて、自動的に起動してもよい。ステップ602において、ユーザは声紋作成のためにユーザ音声の記録が促される。これは、ユーザプロファイル作成500の間に記録された同じフレーズである。ステップ603では、提供されたアプリケーション410を使用して、ユーザがユーザ音声を記録する。ステップ604において、ユーザは、ユーザプロファイル作成500の間に前記認証サーバに登録するのに用いられたPINを打ち込む。ステップ605では、記録された音声と共に、登録の詳細が認証サーバ130に送信される。ステップ606では、認証サーバがユーザのPINを利用して、そのユーザ自身の声紋を検索する。ステップ607において、一以上の保存された声紋に対してユーザの録音された声を照合するために、認証サーバ130は前記確認モジュールを利用する。ステップ608で、認証サーバはユーザに返答する。ステップ609で、認証が成功していれば、ユーザはさらにサービスまたはアプリケーションを続行できる。ステップ610で、認証が不成功であれば、ユーザは認証失敗について指示され、そのアプリケーションを終了する。
図7を参照すると、ここではデバイスにおける音声認証のための方法700が示されている。本方法は、ユーザから一以上の話された言葉を受取り(702)、前記一以上の話された言葉と一致するフレーズを認識し(704)、前記フレーズにおける一以上の話された言葉の変動性から、ユーザの生体測定声紋を識別し(706)、デバイスと関連付けられたデバイス識別子を決定し(708)、フレーズ,生体測定声紋,およびデバイス識別子に基づき、ユーザを認証する(710)ことを含んでいる。特に、一つの装置では、その話された言葉(例えばパスフレーズ)をユーザが複数回話す。ユーザの声における変化は、ユーザの声道構成の変化を決定するのに評価することができる。一つの装置では、図3で前述したようなアクセスを許可するために、デバイスまたはユーザの位置を決定することができる(712)。
声道構造の変化は、前記生体測定の声紋にて取得され、一致性を確認するために、声紋データベースにおける複数の参照声紋と比較される。すなわち、話者の音声に応答して、第1の声紋と少なくとも第2の声紋を生成し、この第1の声紋と第2の声紋との違いを識別し、その違いが話者の声道における自然な変化に対応したものかどうかについて、決定を行なうことができる。特に生体測定声紋は、ユーザの声道に対して身体的に固有の声道構成である。従って、前記違いが話者の声道における自然の変化を示すものかどうかで、その話者を認証することができる。
例えば、図3に戻って参照すると、声認証方法700を実装している前記デバイス102は、少なくとも1つの認証サーバに対して接続を確立し、少なくとも1つの認証サーバにユーザプロファイルを送信し、少なくとも1つの認証サーバに保存された複数の参照プロファイルとユーザプロファイルを比較し、そのユーザを認証するために、前記ユーザプロファイルが複数の参照プロファイルのうちの1つに一致するかどうかを決定できる。フレーズを認識すると、音声認証サーバすなわちデバイスは、話された言葉の間で、一以上の声道構造の違いを評価することができる。この声道構造の違いに基づき、複数の参照プロファイルから一以上の声道の形状を一致させることができる。
前述において、方法700の各ステップを実行する音声認証システムの詳しい説明が提供される。特に図8を参照すると、ここでは音声認証システムにおける声認証を特徴付けるアルゴリズム800が提示される。アルゴリズム800は、基礎をなす音声処理方法を高レベルで記述したものであり、この音声処理方法は、生体測定の声紋分析に基づいて、ユーザの身元を認証するのに採用される。アルゴリズム800は、ここで図示するステップの数よりも多く、或いは少ないものも含むことができる点に、留意すべきである。実際に各々のステップは、本明細書で説明する以外に、図示しないステップをさらに含むことができる。方法800を記述する上で、図4が参照となるであろう。
ステップ802において、話された言葉を各発声化フレーム(vocalized frames)に分割することができる。例えば図4を参照すると、ユーザが移動体デバイス102に話すパスフレーズ(例えば、話された言葉)は、有声部分と無声部分に区分化することができる。つまり、母音のような周期的領域に対応する領域を、有声と分類することができ、子音のような非周期的領域に対応する領域を、無声と分類することができる。ステップ804では、前記有声の領域から線形予測符号化(LPC)係数を算出し、ステップ806では、このLPC係数を線形スペクトル対(LSP)に変換することができる。LSP係数は、圧縮とコーディングに適切である。ステップ808では、前記LSP係数からフォルマントを計算できる。フォルマントは、共鳴に対応する音声スペクトルの部分と、発声プロセスによって「形成される」ヌル(空値)である。特に、喉,舌,口,唇のような、人間の発話生成システムにおける身体的な構造は、肺から生じる圧力波に共鳴を作り出す空洞を形成する。スペクトル領域におけるフォルマントは、有声フレームでの発音の間に、ユーザの声道構造の特徴を表わしている。ステップ810では、前記LPC/LSPの分析の間に抽出されるフォルマント構造と特徴を、特徴マトリクスに含めることができる。ステップ812では、この特徴マトリクスを正規化できる。正規化の一態様は、バックグラウンドノイズを除去するのを含んでいる。正規化の第2態様は、声道形状の長さと面積を明らかにすることを含んでいる。ステップ814では、前記特徴マトリクスから、声紋と閾値を計算できる。この生体測定による声紋は、表1に示す各特徴を含むことができる。
実際には、ユーザは話された言葉を提示し、この話された言葉は、音声登録の間、すなわちユーザが音声認証サーバで生体測定声紋を登録したときに用いられたパスフレーズと一致する。例えば登録の間に、ユーザは同じパスフレーズを3回発音する。特徴マトリクスは、パスフレーズの各記録のために算出される。この特徴マトリクスは、話者の声の特徴を表わす数値行列である。この場合、3つの特徴マトリクスが、生体測定声紋を作成するのに用いられる。例えば、表1にて上記掲載される列挙された声紋に関して、平均と境界を含む様々な特徴が、その声紋中に用いられる。表1における各特徴は、声紋を定義するのに3つのマトリクスと共に用いられる。例えば、特徴マトリクスは声の特徴を定義するものであり、表1の各特性は声道構造の変化を記述する。例えば、表1の各特性は、声道の形状を意味する。特に、パスフレーズの発音における変化は、表1における生体測定声紋で定義される声フレーム毎に、特徴ベクトルの境界を確認することで取得される。例えば、表1における生体測定声紋の見出し3は、一以上の特徴ベクトルの要素毎に、最大値および最小限を確認する。例えば、パスフレーズを発音する間に、フォルマントの振幅の自然に生じる変化や、フォルマントのバンド幅の変化や、フォルマントの位置の変化を、前記境界が識別することができ、これはパスフレーズを話しているユーザに対し特有のものとなる。
確認の間、ユーザは前記パスフレーズと一致する同一の話された言葉を話すことで、生体測定声紋が発生する。この生体測定声紋は、一致性を確認するために、予め保存された声紋に対して比較される。確認プロセスの間に、登録に用いられるような声認証アルゴリズム800を用いて話されたフレーズからも、特徴マトリクスが算出される。この特徴マトリクスは、声紋データベースに保存された一以上の参照マトリクスに対して比較される。生体測定声紋の特徴マトリクス毎に、対数距離を算出できる。この対数距離が予め定められた閾値レベルより少なければ、一致であることを決定でき、話者を識別できる。確認プロセスにおける1つの固有な特徴は、声紋からの閾値に依存する比較閾値レベルを設定することを含む。この閾値は話者内における変動性に依存して、ユーザの声に基づいて適合することができる。代わりに、閾値とは独立して、ユーザの声に基づいて適合することなく、閾値を設定することもできる。
1つの実装例において、声紋を生成する前記方法800を送受話器で実行することができ、ユーザを許可する前記方法700を、送受話器と通信を行なうサーバによって実行することができる。図9を参照すると、音声認証システム900の様々な構成要素を表わす図が示されており、この音声認証システム900は声紋を生成する前記方法800を実行する。音声認証システム900は、音声プロセッサ144と生体測定音声アナライザ148を備えることができる。音声プロセッサ144は、ユーザから話された言葉と、その話された言葉の少なくとも1回の繰返しを受取ることができる。生体測定声アナライザ146は、話された言葉と少なくとも1回の繰返しから、一以上の声道形状を算出し、また話された言葉と少なくとも1回の繰返しにおいて変化する発音に基づき、一つ以上の声道形状の間での違いを算出できる。声道構造の違いは、一以上の話された言葉と関連付けられたユーザ声道の有界な身体的変化と一致する。例えば声道構造の違いを、時間と共に音声スペクトルのダイナミックな変化を明らかにする運動量スペクトルに基づくものにすることができる。この運動量スペクトルは、話し中における一以上の声部分に対して下限境界と上限境界とを含むことができ、それにより下限境界と上限境界との間の音声スペクトルにおける変化が、固有の声道形状に対応するようになる。
1つの装置において、必須のものではないが、音声プロセッサ144はスピーチ認識装置146を含むことができる。スピーチ認識装置146は、音声認証の間にユーザによって話されるフレーズを確認できる。1つの態様において、スピーチ認識装置146は、話された言葉の有声領域と無声領域を識別し、有声領域から一以上の音素を認識して、各発声化フレーム(例えば、有声部分)における一以上の音素の位置を識別することもできる。音声プロセッサは、話された言葉を一以上の発声化フレームに分割し、この一以上の発声化フレームから一以上の特徴ベクトルを生成し、一以上の特徴ベクトルから特徴マトリクスを算出して、一以上の発声化フレームの全体で特徴マトリクスを正規化することができる。例えば話したフレーズ毎に、特徴マトリクスを算出できる。発声した言葉は、5msから20msまでの間の時間長を有する一以上の発声フレームに仕切ることができる。
音声プロセッサは、音声フレームでの絶対最小値と絶対最大値を識別できる。これらの各値は、予め定められた閾値に対して比較することができる。最大値と最小値が共に振幅レベルより少なければ、声の構成要素を有しないものとして、当該フレームを分類化し、アルゴリズム800は次のフレームに進む。最大値と最小値が振幅レベルより大きいならば、その音声フレーム信号に対して、自己相関関数が算出される。一以上の前に特定された自己相関項が予め定義された閾値より少なければ、そのフレームは有声信号が欠落していると考えられて、アルゴリズム800は次のフレームに進む。
有声のウィンドウ化された音声フレームに、高速フーリエ変換(FFT)を適用することができる。音声フレームは、周波数分析前の不連続を捕えるために、重み付け窓で掛け算される。FFTは、N個のサンプルの各フレームを、時間領域から周波数領域に変換する。このステップの後で得られる結果は、振幅スペクトルすなわちスペクトルである。
音声信号における音の周波数コンテンツに関する人間の知覚は、線形なスケールに従わない。したがって、線形な周波数スケールから人間の聴力感度に近いスケールに変換するための振幅スペクトルに、Barkスケールを適用できる。つまり、知覚的なフィルタバンク分析を、一つ以上の発声化フレームで実行することができる。Bark周波数をシミュレートする1つのアプローチは、フィルタバンクを使うことであり、1つのフィルタは各々の望ましいメル−周波数構成要素を有する。フィルタバンクは、三角の帯域通過周波数レスポンスを持つことができる。帯域幅と同様に間隔は、1つのBark周波数区間で決定される。Barkスペクトル係数IBRの数は、周波数レンジに依存する。電話チャンネルにおいて、3400Hzの周波数レンジは、17のBarkに一致する。従って、0〜3400Hzの周波数レンジは、1つのBark帯域幅フィルタの17個分に一致する。各々のフィルタ帯域は三角の帯域通過周波数レスポンスを有することができ、帯域幅と同様に間隔は、一定のBark周波数区間で決定される。Barkスケールに基づきシフトされるスペクトル周波数を、Barkスペクトルと呼ぶことがある。
BarkスペクトルXF(n,k)は、bark−スケール周波数バンクの重み付け因数で掛け算され、各々の周波数帯のエネルギーを得るために、全ての重み付け因数に対する積が加算される。前記話された言葉の各音声フレームに対して、エネルギーマトリクスが算出される。例えば前記話されたパスフレーズを、マトリクスE(m,i)として表わすことができる。望ましくないインパルス雑音の幾らかを除去するのに、スムージング用の三点メジアンフィルタが利用される。平滑化されたエネルギーEs(m,i)は、バックグラウンド雑音の周波数エネルギーを除去することで正規化され、それにより音声信号と関連付けられた主要なエネルギーEv(m,i)を得る。1つの装置では、最初の8つの音声フレームにおけるエネルギーを平均化することで、バックグラウンド雑音のエネルギーEn(m,i)を推定できる。
m番目のフレームのi番目の帯域における平滑化および正規化されたエネルギーEv(m,i)で、i番目の帯域での音声信号の全エネルギーを、次のように計算できる。
閾値は次のように計算できる。
T(i)>1.5ならば、雑音より多くのスピーチが存在するものと見なされて、その帯域を完全のままにすることができる。反対に、閾値がそれよりも少なければ、その帯域は過度に雑音があると見なされて、更なる計算には用いられない。従って、1.5の閾値を上回る帯域がより多い程、より高度な音声内容が反映される。閾値を上回っている帯域は、新たな帯域数として計算され得る。つまり、知覚的なフィルタバンク分析は、Bark周波数スケールに沿った一以上の周波数帯域で、音声エネルギーと雑音エネルギーを推定することを含む。発声の閾値を越えない雑音エネルギーに対する音声エネルギーの比率を有するフィルタバンクを破棄することで、知覚的なフィルタバンク分析の間において、バックグラウンド雑音を抑えることができる。次の式により、全体の信号エネルギーを前記新たな帯域数で計算できる。
Ea(m)毎に、最小値と最大値を決定できる。適応可能な有声化された分割(セグメンテーション)閾値も、次の式により前記決定した最小値と二乗平均平方根の項に基づき算出できる。
Ea(m)>Tvなるフレームは、発声化されたものとして分類され、当該発声化だけを用いて、新たなマトリクスを計算できる。特に、前述した音声処理技術は、スピーチの有声部分を識別し、スピーチの各有声領域に基づく特徴マトリクスを計算するのに用いられる。スピーチの各有声領域は、話された言葉内で識別され、位置付けされ得る音素を含むことができる。例えば図9を参照すると、スピーチ認識装置146が音素を識別できる。
有声部分の活動分析に続いて、知覚的なフィルタバンク分析における各エネルギー帯域から、線形予測係数(LPC)を算出できる。スペクトルのダイナミックレンジを減らすために、プリエンファシスがEv(m,i)に適用される。これは、LPC分析アルゴリズムの数値特性を改善する。最大の振幅スペクトルが見つかると、その最大値の後の全ての点が重み付け係数で掛け算される。LPCは、その後で線形スペクトル対係数(LSP’s)に変換される。フォルマントと反フォルマント(anti-formants)はLSPから算出され、特徴ベクトルはフォルマントと反フォルマントから算出される。フォルマントと反フォルマントを決定すると、スピーチフレーム毎の特徴ベクトルを算出できる。前記話された言葉の有声部分を示す特徴ベクトルに対して、特徴マトリクスを作成できる。この特徴マトリクスは、フォルマント位置,フォルマント振幅,フォルマント帯域幅,反フォルマント位置,反フォルマント振幅,反フォルマント帯域幅,位相情報,平均振幅情報,差分情報,およびダイナミック特性を含むことができる。特に、フォルマントと反フォルマント情報は、Barkスケールに沿って表される。フォルマントと反フォルマント情報の違いは、声道構造の自然な変化における1つの様態を特徴付けるのに評価される。つまり、類似した声道構造から発生する声紋の一致性を識別するために、一以上の特徴ベクトルに対して歪みを評価できる。
声道スペクトルは、前記特徴マトリクスから算出される。特に、話された言葉における一以上の繰返しの間において、類似した特徴を有するフォルマントが、声道スペクトルを作成するのに用いられる。つまり、声の構造を一貫して表わすのに実質的に貢献しているフォルマントが、声道スペクトルを作成するのに用いられる。この声道スペクトルは、LPCまたは自己相関関数から算出される。声道形状は声道構造に対応しているが、この変化は声道スペクトルの変化から確認される。特に、声道構造を一以上の区分(セクション)として表わすことができ、この区分は、ユーザ声道の一以上の区分に対して特徴のある対応する長さと領域を有する。声道構造の違いは、一以上の話された言葉と関連付けられるユーザ声道の有界な身体的変化と一致する。例えば、声道構造の違いは、音声スペクトルの時間経過におけるダイナミックな変化を占有する運動量スペクトルに基づくことができる。このダイナミックな変化は、スペクトルの振幅またはスペクトルの位相に現われる。運動量スペクトルはスピーチの一以上の有声部分に対して下界(下限)と上界(上限)を含むことができ、それによりこの下界と上界との間の音声スペクトルの変化が、固有の声道構造と一致する。特徴マトリクスに対する上下の境界は、表1に示される。
例えば図9を参照すると、一以上の発声化フレームに対応する話された言葉の中の複数部分に対する特徴ベクトルから、音声プロセッサ944が特徴マトリクスを算出し、ここでの特徴マトリクスは、一以上の発声化フレームにおける特徴ベクトルを連結している。音声プロセッサ944はさらに、予め定めた長さよりも短い発声化フレームと、平均的な声道構造を上回る声道構造に対応する発声化フレームとを除去することで、特徴マトリクスを正規化する。この特徴マトリクスにおける多数の特徴によって、声道スペクトルを特徴付け、或いは提示することができる。話者内(intra-speaker)の変動を最小限にするために、そして話者間(inter-speaker)の変動を最大にする音声データベースの統計的な調査から、前記各特徴の特質が選択されている。
当然のことながら、音声認証の間に、生体測定声アナライザ(図9を参照)は、話者の声における保存された特徴ベクトルの識別パラメータに対して、特徴ベクトルの識別パラメータを比較する。このパラメータは、表1における生体測定声紋で取得されたフォルマント情報と反フォルマント情報を含んでいる。特に、生体測定された声紋は、3つの特徴マトリクス(3回のフレーズ繰返しと関係している)と、ユーザの声道形状を特徴付ける表1の特質とを含んでいる。つまり、ユーザの声道形状は、特徴マトリクスによって特徴付けられ、また特徴マトリクスから算出することができる。
声道形状を決定するために特徴マトリクスを計算する間に、特徴マトリクスで指定される最初の3つのフォルマントから、最初の声道形状が生成されるであろう。声道形状のカーブは、フォルマント周波数から0.2cmの増加で計算され得る。また声道長も、有声フレームに対して計算され得る。例えば、生体測定声アナライザは、最初の生体測定声紋における低域フォルマントから最初の声道形状を算出し、最初の声道形状に基づく声道構成の違いを決定し、最も少ない声道構成の違いを提供する相似の声道形状を識別して、最初の生体測定声紋における高域フォルマントから、前記相似の声道形状を形成する。高域フォルマント周波数は、話者の調音(articulation)スタイルにおける一つの様子を特徴付けるのに強調される。
再び図9を参照すると、生体測定声アナライザ944は、特徴ベクトルから一以上の声道断面領域を決定し、また一以上の声道断面領域に対して、一以上の声道長を決定する。さらに、声道形状を決定するときに、通信帯域幅を考慮することがある。例えば、一般的に140Hz〜4.6KHzの間にあって、F1=640,F2=1730,F3=2860,F4=3340である電話帯域幅に対して、フォルマント周波数を調節できる。
声道の横断面は、補償されたフォルマント周波数の位置に基づいて更新される。声道断面の平均は、スピーチにおける一以上の発声化フレームに基づく声道形状に対して決定される。たとえば、声道形状の変化が比較的一定である箇所で、発声したスピーチの音素領域に対して断面を決定することができる。
特徴マトリクスにおける特徴ベクトルに対して変化ベクトル(variation vector)を生成するために、変化境界を声道形状の変化に基づいて作成できる。例えば、生体測定声アナライザ944は、変化ベクトルの対数距離を算出し、この対数距離に基づく閾値を確立する。当該閾値は、ユーザを認証するための声道構造の違いが、変化境界の中にあるかどうかを決定するのに用いられる。変化境界は、表1で示されるもののように、各特徴ベクトルの平均と標準偏差として提示される。さらに生体測定声アナライザ944は、変化境界でのヒストグラムを算出し、当該ヒストグラムの最大値を決定し、当該最大値に基づく微分ベクトルを算出し、当該微分ベクトルに基づく個人のヒストグラムと第2の変化境界を算出する。
確認の間には、ユーザの身元を確かめるべく、生体測定声紋が前記複数の生体測定声紋の一つに一致するかどうかを決定するために、生体測定声アナライザ944が個人のヒストグラムを評価する。個人のヒストグラムにおける第1の複数のビン(bin)が満たされると、身元確認が有効にされ、個人のヒストグラムにおける第2の複数のビンが満たされると、身元確認が無効にされる。特に、ユーザの声道形状がいつ個人のヒストグラムに一致するのかを決定するために、生体測定声紋における表1の特徴情報が個人のヒストグラムを生成するのに用いられる。ヒストグラムは、生体測定声紋の特徴が話している人に特有なものであるかどうかを統計学的に確認する。つまり、話者の声道形状における変化は、特定のユーザの声道構造と関連付けられた変化に対し評価され、統計学的に比較される。再度云うならば、話された言葉を多数提示することは、声道形態の違い、すなわち声道形状の変化を決定するために提供される。個人のヒストグラムは、ユーザを分類化して認証するために、実用的な検出方法を提供する。例えば、確認の間に、生体測定声アナライザは対数距離を算出し、個人のヒストグラムにおける第1の複数のビンがいつ満たされるのかを決定するための閾値を評価する。さらに、ユーザの声に基づいて、この閾値を適合することもできる。
以上のように、利益,他の利点,および問題の解決が、特定の各実施例に関連して記述されてきた。しかし、利益,利点,問題の解決,およびより多く述べられることに気付き、またより多く述べられるようになる利益,利点,若しくは問題をもたらすあらゆる要素が、重要で、必要とされ、または本質的なあらゆるまたは全ての請求項における特徴または構成要素として、解釈されてはいない。
ここで用いられるように、「comprises:構成する」,「comprising:構成して」という用語や、それに関するあらゆる変化は、非独占的な包含をカバーすることを意図しており、それによりプロセス,方法,論文,または各要素のリストから成る装置は、それらの要素だけを含むものではないが、そうしたプロセス,方法,論文,または装置に明確にリストされておらず、或いは特有の別な構成要素を含んでもよい。さらには、第1と第2,上と下などのように、関連する用語の使用があったとしても、それは各実在物や各動作間におけるあらゆる実際の関係や順番を、必ずしも必要としたり暗示したりすることなく、他方から一方の実在物や動作を区別するためだけに用いられることが理解される。
ここで用いられるように、「comprises:構成する」,「comprising:構成して」という用語や、それに関するあらゆる変化は、非独占的な包含をカバーすることを意図しており、それによりプロセス,方法,論文,または各要素のリストから成る装置は、それらの要素だけを含むものではないが、そうしたプロセス,方法,論文,または装置に明確にリストされておらず、或いは特有の別な構成要素を含んでもよい。さらには、第1と第2,上と下などのように、関連する用語の使用があったとしても、それは各実在物や各動作間におけるあらゆる実際の関係や順番を、必ずしも必要としたり暗示したりすることなく、他方から一方の実在物や動作を区別するためだけに用いられることが理解される。
本発明の実施例を適応する場合に、これはハードウェア,ソフトウェア,またはハードウェアとソフトウェアとの組合せで実現できる。ここに記述される方法を実行するのに適したあらゆる種類のコンピュータシステムや他の装置が、適合している。ハードウェアとソフトウェアの典型的な組合せは、コンピュータープログラムを有する移動通信装置とすることができ、そのプログラムをロードして実行すると、移動通信装置を制御して、ここに記述されるような方法を実行することができる。本実施例における方法とシステムの一部を、コンピュータープログラム製品に埋め込んでもよく、その製品はここに記述される方法の実施を可能にする全ての特徴を備えていて、コンピュータシステムでロードされると、これらの方法を実行できる。
以上、本発明の好ましい各実施例が例示され、記述されてきたが、本発明の各実施例がそのように限定されないことは明らかである。添付の各請求項によって定義されるように、本発明の各実施例における精神と範囲から逸脱することなく、多数の修正,変更,変形,代用,および均等が、当業者おいて生じるであろう。
Claims (54)
- デバイスにおける音声認証方法であって、
ユーザから一以上の話された言葉を受取り、
前記一以上の話された言葉に対応するフレーズを認識し、
前記フレーズにおける前記一以上の話された言葉から、生体測定の声紋を識別し、
前記デバイスと関連付けられたデバイス識別子を決定し、
前記フレーズ,前記生体測定の声紋,および前記デバイス識別子に基づき、前記ユーザを認証する音声認証方法。 - 前記生体測定の声紋の識別では、さらに前記生体測定の声紋を作成するために、前記一以上の話された言葉の変動性を決定し、
当該生体測定の声紋は、前記ユーザの声道に対して身体的に固有な声道構造である請求項1記載の音声認証方法。 - 前記ユーザを認証すると、前記デバイスとの通信を有する一以上の資源に対してアクセスを許可することをさらに有する請求項1記載の音声認証方法。
- 前記デバイスの位置を確認することをさらに有する請求項1記載の音声認証方法。
- 前記デバイスの位置を確認するために、前記デバイスは汎地球測位システム(GPS)を備えた請求項4記載の音声認証方法。
- 前記ユーザの位置を識別するユーザ別の第2の話された言葉を受取り、
前記ユーザの位置が受け入れられた位置に対応することを認識する請求項1記載の音声認証方法。 - 前記移動体のデバイス識別子がIMEI番号である請求項1記載の音声認証方法。
- 前記IMEl番号はデータベースにおける前記生体測定の声紋と関連付けされ、この生体測定の声紋は、当該生体測定の声紋にインデックスを付けるために前記IMEl番号を用いる請求項7記載の音声認証方法。
- 前記移動体のデバイス識別子が、当該デバイスに割り当てられたPINである請求項1記載の音声認証方法。
- 前記デバイスが、移動送受話器,携帯電話,パーソナル携帯情報機器,ラップトップ型パソコン,ノート型パソコン,携帯用音楽プレーヤー,および通信装置のうちの一つである請求項1記載の音声認証方法。
- 少なくとも1つの認証サーバに対して接続を確立し、
前記少なくとも1つの認証サーバにユーザプロファイルを送信し、
前記少なくとも1つの認証サーバに保存された複数の参照プロファイルと前記ユーザプロファイルを比較し、
前記ユーザを認証するために、前記ユーザプロファイルが前記複数の参照プロファイルのうちの1つに一致するかどうかを決定することをさらに備え、
ユーザプロファイルは、フレーズ,生体測定の声紋,およびデバイス識別子の少なくとも1つを含む請求項1記載の音声認証方法。 - 前記認証における第1の部分が前記デバイスで生じ、前記認証における第2の部分が前記認証サーバで生じる請求項11記載の音声認証方法。
- 前記認証サーバが、ウェブ層や、ビジネス層や、データベースアクセス層のようなソフトウェアアプリケーションを含む請求項11記載の音声認証方法。
- 前記比較は、
前記フレーズを認識すると、前記話された言葉の間で、一以上の声道構造の違いを評価し、
前記声道構造の違いに基づき、複数の参照プロファイルから一以上の声道の形状を一致させることをさらに有する請求項11記載の音声認証方法。 - 前記声道構造の違いは、前記話された言葉における一以上の有声部分で評価される請求項14記載の音声認証方法。
- 声道構造の違いは、複数の話された言葉と関連付けられるユーザ声道の有界な肉体的変化に対応するものである請求項14記載の音声認証方法。
- 前記声道構造の違いは、音声スペクトルの時間経過におけるダイナミックな変化を占有する運動量スペクトルに基づくものである請求項14記載の音声認証方法。
- 前記運動量スペクトル、はスピーチの一以上の有声部分に対して下界と上界を含み、それによりこの下界と上界との間の音声スペクトルの変化が、固有の声道構造と一致する請求項17記載の音声認証方法。
- 前記声道構造は一以上の区分として表わされ、この区分は、ユーザ声道の一以上の区分に対して特徴のある対応する長さと領域を有する請求項14記載の音声認証方法。
- 話された言葉が繰り返される間の違いが、歪み範囲内であるかどうかを決定し、
前記違いが歪み範囲内であれば、声紋の一致を決定することをさらに有する請求項14記載の音声認証方法。 - 前記比較は、
少なくとも1つのフォルマント周波数を決定し、
少なくとも1つの反フォルマント周波数を決定し、
声道構造の自然な変化における1つの様態を特徴付けるのに、前記フォルマント周波数と反フォルマント周波数との間の違いを評価することをさらに有する請求項14記載の音声認証方法。 - 前記フォルマント周波数と反フォルマント周波数との間の違いを評価することが、電話帯域幅を補償する請求項21記載の音声認証方法。
- 高域のフォルマント周波数が、話者の調音スタイルにおける一つの様子を特徴付けるのに強調される請求項21記載の音声認証方法。
- 話者の声に応答して第1の声紋を生成し、
話者の声に応答して少なくとも第2の声紋を生成し、
前記第1の声紋と前記第2の声紋との間の違いを識別し、
前記違いが、話者の声道における自然な変化に対応したものかどうかを決定し、
前記違いが、前記話者の声道における自然な変化を示していれば、その話者を認証する話者検証方法。 - 自然な変化とは声道の身体的変化であって、この身体的変化は、話された言葉の発音中に、その話者の調音的ジェスチャーにおける変化に対して相互に関連付けられ、話者に固有のものである請求項24記載の話者検証方法。
- ユーザからの話された言葉およびこの話された言葉の少なくとも1回の繰返しを受取る音声プロセッサと、
前記話された言葉および前記少なくとも1回の繰返しから一以上の声道形状を算出し、前記話された言葉および前記少なくとも1回の繰返しにおける発音の変化に基づき、前記一以上の声道形状の間での声道構造の違いを算出する生体測定声アナライザと、を備えた生体測定声紋生成システム。 - 前記音声プロセッサは、
話された言葉を一以上の発声化フレームに分割し、
この一以上の発声化フレームから一以上の特徴ベクトルを生成し、
前記一以上の特徴ベクトルから特徴マトリクスを算出して、
前記一以上の発声化フレームの全体で特徴マトリクスを正規化するものである請求項26記載の生体測定声紋生成システム。 - 前記話された言葉の有声領域と無声領域を識別し、
前記有声領域から一以上の音素を認識して、
前記各発声化フレームにおける一以上の音素の位置を識別するスピーチ認識装置をさらに備えた請求項27記載の生体測定声紋生成システム。 - 話された言葉を一以上の発声化フレームに分割し、
前記一以上の発声化フレームで知覚的なフィルタバンク分析を実行し、
前記知覚的なフィルタバンク分析から線形予測係数(LPC)を算出し、
前記線形予測係数を線形スペクトル対係数(LSP’s)に変換し、
前記線形スペクトル対係数からフォルマントと反フォルマントを算出し、
前記フォルマントと反フォルマントから特徴ベクトルを算出することで、
前記音声プロセッサは一以上の特徴ベクトルを生成するものである請求項27記載の生体測定声紋生成システム。 - 前記音声プロセッサは、前記一以上の発声化フレームに対応する話された言葉の中の複数部分に対する特徴ベクトルから、特徴マトリクスを算出するものであり、
前記特徴マトリクスは、前記一以上の発声化フレームにおける特徴ベクトルを連結しており、
予め定めた長さよりも短い発声化フレームと、平均的な声道構造を上回る声道構造に対応する発声化フレームとを除去することで、特徴マトリクスを正規化するものである請求項29記載の生体測定声紋生成システム。 - 知覚的なフィルタバンク分析を実行することは、Bark周波数スケールに沿った一以上の周波数帯域で、音声エネルギーと雑音エネルギーを推定することを含む請求項29記載の生体測定声紋生成システム。
- 発声の閾値を越えない雑音エネルギーに対する音声エネルギーの比率を有するフィルタバンクを破棄することで、前記知覚的なフィルタバンク分析の間において、バックグラウンド雑音を抑えることをさらに備えた請求項31記載の生体測定声紋生成システム。
- 前記線形予測係数(LPC)を算出することは、音声信号に対してプリエンファシスを適用することを含む請求項29記載の生体測定声紋生成システム。
- 前記特徴ベクトルは、話者内の変動を最小限にし、話者間の変動を最大にする識別パラメータを含む請求項29記載の生体測定声紋生成システム。
- 前記生体測定声アナライザは、
前記特徴マトリクスから一以上の声道形状を算出し、
前記一以上の声道形状から声道構造の違いを算出し、
一以上の音素のスペクトルにおける変動を評価し、
前記変動に基づいて、声道構造の違いにおける変化境界を確立するものである請求項30記載の生体測定声紋生成システム。 - 前記生体測定声アナライザは、
話者の声における保存された特徴ベクトルの識別パラメータに対して、特徴ベクトルの識別パラメータを比較するものである請求項35記載の生体測定声紋生成システム。 - 前記生体測定声アナライザは、
特徴ベクトルから一以上の声道断面領域を決定し、
前記一以上の声道断面領域に対して、一以上の声道長を決定するものである請求項35記載の生体測定声紋生成システム。 - 前記生体測定声アナライザは、
特徴マトリクスにおける特徴ベクトルに対して変化ベクトルを生成するために、変化境界を算出し、
前記変化ベクトルの対数距離を算出し、
前記対数距離に基づく閾値を確立するものであり、
前記閾値は、ユーザを認証するための声道構造の違いが、変化境界の中にあるかどうかを決定するのに用いられる請求項37記載の生体測定声紋生成システム。 - 前記変化境界は、各特徴ベクトルの平均と標準偏差として提示される請求項38記載の生体測定声紋生成システム。
- 前記生体測定声アナライザは、
個人の声道形状における変化境界を決定し、
前記変化境界におけるヒストグラムを算出し、
前記ヒストグラムの最大値を決定し、
前記最大値に基づく微分ベクトルを算出し、
前記微分ベクトルに基づく個人のヒストグラムと第2の変化境界を算出する請求項38記載の生体測定声紋生成システム。 - 前記生体測定声アナライザは、
ユーザの身元を確かめるべく、生体測定声紋が前記複数の生体測定声紋の一つに一致するかどうかを決定するために、個人のヒストグラムを評価するものであり、
個人のヒストグラムにおける第1の複数のビンが満たされると、身元確認が有効にされ、個人のヒストグラムにおける第2の複数のビンが満たされると、身元確認が無効にされる請求項40記載の生体測定声紋生成システム。 - 前記生体測定声アナライザは、
対数距離を算出し、
個人のヒストグラムにおける前記第1の複数のビンがいつ満たされるのかを決定するための閾値を評価するものである請求項41記載の生体測定声紋生成システム。 - 前記閾値は、ユーザの声に基づいて適合される請求項42記載の生体測定声紋生成システム。
- 生体測定声紋の作成モジュールと、
パスフレーズの作成モジュールと、
デバイス識別子モジュールを有し、
前記生体測定声紋の作成モジュール,前記パスフレーズの作成モジュール,および前記デバイス識別子モジュールから生成される生体測定の声紋,パスフレーズ,およびデバイス識別子を含むユーザプロファイルを作成するアプリケーションプログラミングインターフェース(API)をさらに備えた請求項42記載の生体測定声紋生成システム。 - ユーザから受取った一以上の話された言葉から、一以上の声道形状を決定し、
前記一以上の声道形状の間における声道の違いを評価し、
ユーザの声における保存された参照声道形状を示すものに対して、前記声道の違いを比較し、
前記声道構造の違いが前記参照声道形状に対する自然な変化を示すかどうかを決定することからなり、
この自然な変化は、ユーザによって身体的に明瞭に発音され得る声道構造の変動である音声認証方法。 - 一以上の声道形状を決定することは、
最初の生体測定声紋における低域フォルマントから最初の声道形状を算出し、
前記最初の声道形状に基づく声道構成の違いを決定し、
最も少ない声道構成の違いを提供する相似の声道形状を識別して、
前記最初の生体測定声紋における高域フォルマントから、前記相似の声道形状を形成することをさらに有する請求項45記載の音声認証方法。 - 前記話された言葉の源を決定し、この源は、前記話された言葉をマイクロホンに話すユーザか、或いはマイクロホンに話し言葉を記録したものを再生するデバイスの内の一つであり、
前記源がユーザであればアクセスを許可し、前記源がデバイスであればアクセスを許可しない請求項45記載の音声認証方法。 - 前記源を決定することは、
前記話された言葉を示す音響信号が、ディジタル記録デバイスにより生成された波形の特徴を有するかどうかを識別し、
この識別は、前記ディジタル記録デバイスによって与えられるスペクトル傾斜の認識を含む請求項47記載の音声認証方法。 - 音声自動応答(IVR)システムでの呼び中における話された言葉を受取り、
前記話された言葉の認証に応答してプログラム動作を起動し、
前記話された言葉を提示するユーザの声紋を確認するのに、当該話された言葉を分析し、
前記声紋を認証したことに基づき、前記プログラム動作に対するアクセスをユーザに許可する音声認証方法。 - 前記話された言葉の中で一以上の数字を認識し、
前記音声自動応答システムの特徴部にアクセスするために、前記一以上の数字を自動的に入力することをさらに有し、
それにより前記プログラム動作が、前記特徴部にアクセスするために、前記話された言葉内で認識された一以上の数字に電話をかける請求項49記載の音声認証方法。 - 前記話された言葉を提出するのに用いられるデバイスから、デバイス識別子を受取り、
アクセスを許可する前に、前記デバイスの登録を有効にすることをさらに有する請求項49記載の音声認証方法。 - 前記プログラム動作は安全なトランザクションであり、前記話された言葉は、アカウント番号,銀行支店番号,電話番号,社会保障番号,およびピン番号のような安全な情報を確認する請求項49記載の音声認証方法。
- 前記アクセスを許可すると、前記プログラム動作に従ってコールセンターに呼出しを行ない、
前記コールセンターと接続すると、ユーザのアカウント情報を表示するのに、当該コールセンターでスクリーンポップを起動することをさらに有する請求項52記載の音声認証方法。 - 前記音声自動応答(IVR)システムは、PBX,ゲートウェイ,音声サーバ,およびインターネット音声サーバの一つに存在する請求項53記載の音声認証方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US68542705P | 2005-05-27 | 2005-05-27 | |
US11/420,190 US7536304B2 (en) | 2005-05-27 | 2006-05-24 | Method and system for bio-metric voice print authentication |
PCT/US2006/020907 WO2006128171A2 (en) | 2005-05-27 | 2006-05-26 | Method and system for bio-metric voice print authentication |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009508144A true JP2009508144A (ja) | 2009-02-26 |
Family
ID=37452992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008513828A Withdrawn JP2009508144A (ja) | 2005-05-27 | 2006-05-26 | 生体測定声紋認証方法および生体測定声紋認証装置 |
Country Status (5)
Country | Link |
---|---|
US (3) | US7536304B2 (ja) |
EP (1) | EP1915294A4 (ja) |
JP (1) | JP2009508144A (ja) |
CN (1) | CN101467204B (ja) |
WO (1) | WO2006128171A2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010039599A (ja) * | 2008-08-01 | 2010-02-18 | Universal Entertainment Corp | 内部統制制御システム |
JP2013502650A (ja) * | 2009-08-21 | 2013-01-24 | アバイア インク. | 電話で見いだされるマッシュアップとプレゼンス |
JP2014500991A (ja) * | 2010-09-30 | 2014-01-16 | アルカテル−ルーセント | 音声署名認証の方法および装置 |
KR20170010819A (ko) * | 2014-11-18 | 2017-02-01 | 선전 후이딩 테크놀로지 컴퍼니 리미티드 | 이동 단말기에서의 악성 동작 인식 방법 및 장치 |
JP2017506401A (ja) * | 2014-12-27 | 2017-03-02 | 小米科技有限責任公司Xiaomi Inc. | 資源移転方法、装置、プログラム及び記録媒体 |
KR20170139650A (ko) * | 2015-11-17 | 2017-12-19 | 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 | 계정 추가 방법, 단말, 서버, 및 컴퓨터 저장 매체 |
KR20210009645A (ko) * | 2019-07-17 | 2021-01-27 | 주식회사 케이티 | 고객센터 목소리 인증 시스템 및 목소리 인증 방법 |
WO2024111023A1 (ja) * | 2022-11-21 | 2024-05-30 | 楽天グループ株式会社 | 情報処理システム、情報処理方法、及び情報処理プログラム |
Families Citing this family (237)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7130800B1 (en) * | 2001-09-20 | 2006-10-31 | West Corporation | Third party verification system |
US9031880B2 (en) * | 2001-07-10 | 2015-05-12 | Iii Holdings 1, Llc | Systems and methods for non-traditional payment using biometric data |
US8412566B2 (en) | 2003-07-08 | 2013-04-02 | Yt Acquisition Corporation | High-precision customer-based targeting by individual usage statistics |
US7698566B1 (en) * | 2004-07-12 | 2010-04-13 | Sprint Spectrum L.P. | Location-based voice-print authentication method and system |
US7536304B2 (en) | 2005-05-27 | 2009-05-19 | Porticus, Inc. | Method and system for bio-metric voice print authentication |
US20060287863A1 (en) * | 2005-06-16 | 2006-12-21 | International Business Machines Corporation | Speaker identification and voice verification for voice applications |
ES2354702T3 (es) * | 2005-09-07 | 2011-03-17 | Biloop Tecnologic, S.L. | Método para el reconocimiento de una señal de sonido implementado mediante microcontrolador. |
US8234494B1 (en) * | 2005-12-21 | 2012-07-31 | At&T Intellectual Property Ii, L.P. | Speaker-verification digital signatures |
CN101051464A (zh) * | 2006-04-06 | 2007-10-10 | 株式会社东芝 | 说话人认证的注册和验证方法及装置 |
US20070244700A1 (en) * | 2006-04-12 | 2007-10-18 | Jonathan Kahn | Session File Modification with Selective Replacement of Session File Components |
US7512567B2 (en) | 2006-06-29 | 2009-03-31 | Yt Acquisition Corporation | Method and system for providing biometric authentication at a point-of-sale via a mobile device |
US7570167B2 (en) | 2006-06-30 | 2009-08-04 | Gene Fein | RFID ionosphere |
GB0616070D0 (en) * | 2006-08-12 | 2006-09-20 | Ibm | Speech Recognition Feedback |
US20080097851A1 (en) | 2006-10-17 | 2008-04-24 | Vincent Bemmel | Method of distributing information via mobile devices and enabling its use at a point of transaction |
US7992196B2 (en) * | 2006-11-06 | 2011-08-02 | Voice Identity, Inc. | Apparatus and method for performing hosted and secure identity authentication using biometric voice verification over a digital network medium |
US20080147389A1 (en) * | 2006-12-15 | 2008-06-19 | Motorola, Inc. | Method and Apparatus for Robust Speech Activity Detection |
US8384516B2 (en) * | 2007-01-12 | 2013-02-26 | Voorhuis Plc, Limited Liability Company | System and method for radio frequency identifier voice signature |
DE102007003094A1 (de) * | 2007-01-16 | 2008-07-31 | Vodafone Holding Gmbh | Betrieb von in Mobilfunknetzen nutzbaren mobilen Endgeräten, mobiles Endgerät und Mobilfunkteilnehmer-Identifikations-Modul zur Nutzung mit einem mobilen Endgerät |
US10304464B2 (en) * | 2007-01-22 | 2019-05-28 | Auraya Pty. Ltd. | Voice recognition system and methods |
US20110047605A1 (en) * | 2007-02-06 | 2011-02-24 | Vidoop, Llc | System And Method For Authenticating A User To A Computer System |
US8140331B2 (en) * | 2007-07-06 | 2012-03-20 | Xia Lou | Feature extraction for identification and classification of audio signals |
JP2009020291A (ja) * | 2007-07-11 | 2009-01-29 | Yamaha Corp | 音声処理装置および通信端末装置 |
US8660519B2 (en) * | 2007-09-26 | 2014-02-25 | Verizon Patent And Licensing Inc. | Apparatus, method, and computer program product for locating a mobile device |
CN101911584A (zh) * | 2007-10-22 | 2010-12-08 | 米高纳科技有限公司 | 用于发送安全访问信号的发送器 |
US8031981B2 (en) * | 2007-12-21 | 2011-10-04 | Daon Holdings Limited | Method and systems for generating a subset of biometric representations |
JP5479916B2 (ja) * | 2008-01-30 | 2014-04-23 | 京セラ株式会社 | 携帯端末装置およびその制御方法 |
US20110026690A1 (en) * | 2008-04-08 | 2011-02-03 | Marta Garcia Gomar | Method of informing a person of an event and method of receiving information about an event, a related computing |
GB2462800A (en) * | 2008-06-20 | 2010-02-24 | New Voice Media Ltd | Monitoring a conversation between an agent and a customer and performing real time analytics on the audio signal for determining future handling of the call |
JP2010033193A (ja) * | 2008-07-25 | 2010-02-12 | Fujitsu Ltd | 認証システム及び認証用サーバ装置 |
US8266249B2 (en) | 2008-08-22 | 2012-09-11 | At&T Mobility Ii Llc | Providing remote access to multimedia content |
US20100069148A1 (en) * | 2008-09-15 | 2010-03-18 | Katherine Cargill | Online Games Integrated with Offline Fitness, Environmental, and Other Activities |
US8345829B2 (en) * | 2008-10-13 | 2013-01-01 | International Business Machines Corporation | Authentication of a user to a telephonic communication device |
US8332223B2 (en) | 2008-10-24 | 2012-12-11 | Nuance Communications, Inc. | Speaker verification methods and apparatus |
TWI412941B (zh) * | 2008-11-25 | 2013-10-21 | Inst Information Industry | 產生及驗證一訊息之一語音簽章之裝置、方法及其電腦程式產品 |
US8442824B2 (en) | 2008-11-26 | 2013-05-14 | Nuance Communications, Inc. | Device, system, and method of liveness detection utilizing voice biometrics |
DE102008058883B4 (de) * | 2008-11-26 | 2023-07-27 | Lumenvox Corporation | Verfahren und Anordnung zur Steuerung eines Nutzerzugriffs |
GB2465782B (en) | 2008-11-28 | 2016-04-13 | Univ Nottingham Trent | Biometric identity verification |
US10257191B2 (en) | 2008-11-28 | 2019-04-09 | Nottingham Trent University | Biometric identity verification |
US8989704B2 (en) * | 2008-12-10 | 2015-03-24 | Symbol Technologies, Inc. | Invisible mode for mobile phones to facilitate privacy without breaching trust |
US9059991B2 (en) * | 2008-12-31 | 2015-06-16 | Bce Inc. | System and method for unlocking a device |
US20100192183A1 (en) * | 2009-01-29 | 2010-07-29 | At&T Intellectual Property I, L.P. | Mobile Device Access to Multimedia Content Recorded at Customer Premises |
US10853816B1 (en) * | 2009-02-02 | 2020-12-01 | United Services Automobile Association (Usaa) | Systems and methods for authentication of an individual on a communications device |
JP5178607B2 (ja) * | 2009-03-31 | 2013-04-10 | 株式会社バンダイナムコゲームス | プログラム、情報記憶媒体、口形状制御方法及び口形状制御装置 |
CN101923853B (zh) * | 2009-06-12 | 2013-01-23 | 华为技术有限公司 | 说话人识别方法、设备和系统 |
CN101923856B (zh) * | 2009-06-12 | 2012-06-06 | 华为技术有限公司 | 语音识别训练处理、控制方法及装置 |
US20110086712A1 (en) * | 2009-09-15 | 2011-04-14 | Katherine Cargill | Online games integrated with an online green mall |
CN101673544B (zh) * | 2009-10-10 | 2012-07-04 | 上海电虹软件有限公司 | 一种基于声纹识别和定位跟踪的交叉监控方法和系统 |
US8326625B2 (en) * | 2009-11-10 | 2012-12-04 | Research In Motion Limited | System and method for low overhead time domain voice authentication |
US8321209B2 (en) | 2009-11-10 | 2012-11-27 | Research In Motion Limited | System and method for low overhead frequency domain voice authentication |
EP2362600B1 (en) * | 2009-11-22 | 2016-07-27 | Avaya Inc. | Sending a user associated telecommunication address |
US8718246B2 (en) | 2009-11-22 | 2014-05-06 | Avaya Inc. | Providing a roster and other information before joining a participant into an existing call |
US9292731B2 (en) | 2009-12-30 | 2016-03-22 | Intel Corporation | Gesture-based signature authentication |
US9553727B2 (en) * | 2010-01-21 | 2017-01-24 | Omid Ebrahimi Kia | Secure and mobile biometric authentication for electronic health record management |
FR2956941A1 (fr) * | 2010-02-19 | 2011-09-02 | Ingenico Sa | Procede d'authentification biometrique, systeme d'authentification, programme et terminal correspondants. |
US8463705B2 (en) | 2010-02-28 | 2013-06-11 | International Business Machines Corporation | Systems and methods for transactions on the telecom web |
US9652802B1 (en) | 2010-03-24 | 2017-05-16 | Consumerinfo.Com, Inc. | Indirect monitoring and reporting of a user's credit data |
US9412381B2 (en) * | 2010-03-30 | 2016-08-09 | Ack3 Bionetics Private Ltd. | Integrated voice biometrics cloud security gateway |
US20110260832A1 (en) * | 2010-04-27 | 2011-10-27 | Joe Ross | Secure voice biometric enrollment and voice alert delivery system |
US8358745B2 (en) | 2011-02-09 | 2013-01-22 | Certicall, Llc | Recording identity data to enable on demand services in a communications system |
US8457601B2 (en) | 2011-02-09 | 2013-06-04 | Certicall, Llc | Key responsive record, navigation and marking controls for communications system |
US8428227B2 (en) | 2010-05-18 | 2013-04-23 | Certicall, Llc | Certified communications system and method |
EP2572498A4 (en) * | 2010-05-18 | 2013-10-02 | Certicall Llc | SYSTEM AND METHOD FOR CERTIFIED COMMUNICATIONS |
US20110320201A1 (en) * | 2010-06-24 | 2011-12-29 | Kaufman John D | Sound verification system using templates |
ES2377682B1 (es) * | 2010-09-02 | 2013-02-13 | Controlaboral-Sistemas Telematicos De Organizacion Y Control, S.L. | Procedimiento para validar de forma remota una acción de usuario a partir de una comunicación por voz. |
EP2622832B1 (en) * | 2010-09-30 | 2019-03-13 | British Telecommunications public limited company | Speech comparison |
CN102457845B (zh) * | 2010-10-14 | 2016-04-13 | 阿里巴巴集团控股有限公司 | 无线业务身份认证方法、设备及系统 |
US10339519B2 (en) * | 2010-11-29 | 2019-07-02 | Ncr Corporation | Visual access token |
US20140095169A1 (en) * | 2010-12-20 | 2014-04-03 | Auraya Pty Ltd | Voice authentication system and methods |
US20120200391A1 (en) * | 2011-02-03 | 2012-08-09 | Sony Corporation, A Japanese Corporation | Method to identify user with security |
EP2676197B1 (en) | 2011-02-18 | 2018-11-28 | CSidentity Corporation | System and methods for identifying compromised personally identifiable information on the internet |
US9767807B2 (en) | 2011-03-30 | 2017-09-19 | Ack3 Bionetics Pte Limited | Digital voice signature of transactions |
GB2489527B (en) * | 2011-04-01 | 2014-01-01 | Voicevault Ltd | Voice verification system |
TWI466527B (zh) * | 2011-04-20 | 2014-12-21 | Gamania Digital Entertainment Co Ltd | 根據裝置識別碼產生通行碼的系統、方法及該系統中的伺服端裝置 |
US8719019B2 (en) * | 2011-04-25 | 2014-05-06 | Microsoft Corporation | Speaker identification |
CN103765511B (zh) * | 2011-07-07 | 2016-01-20 | 纽昂斯通讯公司 | 嘈杂语音信号中的脉冲干扰的单信道抑制 |
US8706499B2 (en) * | 2011-08-16 | 2014-04-22 | Facebook, Inc. | Periodic ambient waveform analysis for enhanced social functions |
WO2013034192A1 (en) * | 2011-09-09 | 2013-03-14 | Naxos Finance Sa | Method for validating an electronic transaction, and system thereof |
US8819793B2 (en) | 2011-09-20 | 2014-08-26 | Csidentity Corporation | Systems and methods for secure and efficient enrollment into a federation which utilizes a biometric repository |
US9164648B2 (en) | 2011-09-21 | 2015-10-20 | Sony Corporation | Method and apparatus for establishing user-specific windows on a multi-user interactive table |
US9021565B2 (en) * | 2011-10-13 | 2015-04-28 | At&T Intellectual Property I, L.P. | Authentication techniques utilizing a computing device |
US11030562B1 (en) | 2011-10-31 | 2021-06-08 | Consumerinfo.Com, Inc. | Pre-data breach monitoring |
US9583108B2 (en) * | 2011-12-08 | 2017-02-28 | Forrest S. Baker III Trust | Voice detection for automated communication system |
US10008206B2 (en) * | 2011-12-23 | 2018-06-26 | National Ict Australia Limited | Verifying a user |
US9401058B2 (en) * | 2012-01-30 | 2016-07-26 | International Business Machines Corporation | Zone based presence determination via voiceprint location awareness |
US9042867B2 (en) * | 2012-02-24 | 2015-05-26 | Agnitio S.L. | System and method for speaker recognition on mobile devices |
US9471919B2 (en) | 2012-04-10 | 2016-10-18 | Hoyos Labs Ip Ltd. | Systems and methods for biometric authentication of transactions |
CN103390123B (zh) * | 2012-05-08 | 2018-01-09 | 腾讯科技(深圳)有限公司 | 用户认证方法、用户认证装置及智能终端 |
US8903360B2 (en) * | 2012-05-17 | 2014-12-02 | International Business Machines Corporation | Mobile device validation |
US10089625B2 (en) * | 2012-06-13 | 2018-10-02 | First Data Corporation | Systems and methods for tokenizing financial information |
WO2013190169A1 (en) * | 2012-06-18 | 2013-12-27 | Aplcomp Oy | Arrangement and method for accessing a network service |
US9996628B2 (en) * | 2012-06-29 | 2018-06-12 | Verisign, Inc. | Providing audio-activated resource access for user devices based on speaker voiceprint |
US8744995B1 (en) | 2012-07-30 | 2014-06-03 | Google Inc. | Alias disambiguation |
US8571865B1 (en) * | 2012-08-10 | 2013-10-29 | Google Inc. | Inference-aided speaker recognition |
US8520807B1 (en) | 2012-08-10 | 2013-08-27 | Google Inc. | Phonetically unique communication identifiers |
US8583750B1 (en) | 2012-08-10 | 2013-11-12 | Google Inc. | Inferring identity of intended communication recipient |
US10171458B2 (en) | 2012-08-31 | 2019-01-01 | Apple Inc. | Wireless pairing and communication between devices using biometric data |
US20140068725A1 (en) * | 2012-08-31 | 2014-03-06 | Apple Inc. | Wireless Pairing and Communication Between Devices Using Biometric Data |
US9286899B1 (en) * | 2012-09-21 | 2016-03-15 | Amazon Technologies, Inc. | User authentication for devices using voice input or audio signatures |
US9837078B2 (en) | 2012-11-09 | 2017-12-05 | Mattersight Corporation | Methods and apparatus for identifying fraudulent callers |
US8832813B1 (en) * | 2012-12-19 | 2014-09-09 | Emc Corporation | Voice authentication via trusted device |
WO2014186019A1 (en) * | 2013-02-19 | 2014-11-20 | Max Sound Corporation | Biometric audio security |
CA2905733A1 (en) * | 2013-03-11 | 2014-10-09 | Cfph, Llc | Devices for gaming |
US9025364B2 (en) * | 2013-03-14 | 2015-05-05 | Micron Technology, Inc. | Selective self-reference read |
US8812387B1 (en) | 2013-03-14 | 2014-08-19 | Csidentity Corporation | System and method for identifying related credit inquiries |
US9378065B2 (en) | 2013-03-15 | 2016-06-28 | Advanced Elemental Technologies, Inc. | Purposeful computing |
US9299350B1 (en) * | 2013-03-15 | 2016-03-29 | Amazon Technologies, Inc. | Systems and methods for identifying users of devices and customizing devices to users |
US9721086B2 (en) | 2013-03-15 | 2017-08-01 | Advanced Elemental Technologies, Inc. | Methods and systems for secure and reliable identity-based computing |
US9904579B2 (en) | 2013-03-15 | 2018-02-27 | Advanced Elemental Technologies, Inc. | Methods and systems for purposeful computing |
US10075384B2 (en) | 2013-03-15 | 2018-09-11 | Advanced Elemental Technologies, Inc. | Purposeful computing |
WO2014152542A2 (en) * | 2013-03-15 | 2014-09-25 | Forrest S. Baker Iii Trust, U/A/D 12/30/1992 | Voice detection for automated communication system |
CN103237030A (zh) * | 2013-04-25 | 2013-08-07 | 深圳市中兴移动通信有限公司 | 基于生物识别的用户认证方法及系统 |
US11210380B2 (en) | 2013-05-13 | 2021-12-28 | Veridium Ip Limited | System and method for authorizing access to access-controlled environments |
US9294475B2 (en) | 2013-05-13 | 2016-03-22 | Hoyos Labs Ip, Ltd. | System and method for generating a biometric identifier |
US9003196B2 (en) | 2013-05-13 | 2015-04-07 | Hoyos Labs Corp. | System and method for authorizing access to access-controlled environments |
EP2997721B1 (en) * | 2013-05-14 | 2020-03-18 | Thomson Licensing | Mobile device synchronization to a gateway |
US20140343943A1 (en) * | 2013-05-14 | 2014-11-20 | Saudi Arabian Oil Company | Systems, Computer Medium and Computer-Implemented Methods for Authenticating Users Using Voice Streams |
NO341316B1 (no) * | 2013-05-31 | 2017-10-09 | Pexip AS | Fremgangsmåte og system for å assosiere en ekstern enhet til en videokonferansesesjon. |
CN104217149B (zh) * | 2013-05-31 | 2017-05-24 | 国际商业机器公司 | 基于语音的生物认证方法及设备 |
US9236052B2 (en) | 2013-06-20 | 2016-01-12 | Bank Of America Corporation | Utilizing voice biometrics |
US9978065B2 (en) | 2013-06-25 | 2018-05-22 | Visa International Service Association | Voice filter system |
US10235509B2 (en) | 2013-08-22 | 2019-03-19 | Staton Techiya, Llc | Methods and systems for a voice ID verification database and service in social networking and commercial business transactions |
US20150056952A1 (en) * | 2013-08-22 | 2015-02-26 | Vonage Network Llc | Method and apparatus for determining intent of an end-user in a communication session |
EP2849448A1 (fr) * | 2013-09-13 | 2015-03-18 | Nagravision S.A. | Méthode pour contrôler l'accès à du contenu diffusé |
US9437195B2 (en) * | 2013-09-18 | 2016-09-06 | Lenovo (Singapore) Pte. Ltd. | Biometric password security |
US9767266B2 (en) * | 2013-12-20 | 2017-09-19 | The Mitre Corporation | Methods and systems for biometric-based user authentication by voice |
US9838388B2 (en) | 2014-08-26 | 2017-12-05 | Veridium Ip Limited | System and method for biometric protocol standards |
WO2015147945A2 (en) | 2013-12-31 | 2015-10-01 | Hoyos Labs Corp. | System and method for biometric protocol standards |
US10157272B2 (en) | 2014-02-04 | 2018-12-18 | Qualcomm Incorporated | Systems and methods for evaluating strength of an audio password |
US9552684B2 (en) | 2014-02-04 | 2017-01-24 | Secure Gravity Inc. | Methods and systems configured to detect and guarantee identity for the purpose of data protection and access control |
KR102204247B1 (ko) * | 2014-02-19 | 2021-01-18 | 삼성전자 주식회사 | 전자 장치의 생체 정보 처리 방법 및 장치 |
NL2012300C2 (en) * | 2014-02-21 | 2015-08-25 | Novolanguage B V | Automated audio optical system for identity authentication. |
CN105321514A (zh) * | 2014-05-28 | 2016-02-10 | 西安中兴新软件有限责任公司 | 一种告警方法和终端 |
US10410630B2 (en) | 2014-06-19 | 2019-09-10 | Robert Bosch Gmbh | System and method for speech-enabled personalized operation of devices and services in multiple operating environments |
US9620106B2 (en) * | 2014-07-30 | 2017-04-11 | At&T Intellectual Property I, L.P. | System and method for personalization in speech recogniton |
CN104184587B (zh) * | 2014-08-08 | 2016-04-20 | 腾讯科技(深圳)有限公司 | 声纹生成方法、服务器、客户端及系统 |
US20160055847A1 (en) * | 2014-08-19 | 2016-02-25 | Nuance Communications, Inc. | System and method for speech validation |
CN105357006A (zh) * | 2014-08-20 | 2016-02-24 | 中兴通讯股份有限公司 | 一种基于声纹特征进行安全认证的方法及设备 |
US9456070B2 (en) | 2014-09-11 | 2016-09-27 | Ebay Inc. | Methods and systems for recalling second party interactions with mobile devices |
KR20240011235A (ko) * | 2014-09-13 | 2024-01-25 | 어드밴스드 엘리멘탈 테크놀로지스 인코포레이티드 | 보안 및 신뢰성있는 아이덴티티 기반 컴퓨팅을 위한 방법들 및 시스템들 |
US10008208B2 (en) | 2014-09-18 | 2018-06-26 | Nuance Communications, Inc. | Method and apparatus for performing speaker recognition |
CN205050141U (zh) | 2014-09-30 | 2016-02-24 | 苹果公司 | 电子设备 |
CN105575391B (zh) | 2014-10-10 | 2020-04-03 | 阿里巴巴集团控股有限公司 | 声纹信息管理方法、装置以及身份认证方法、系统 |
US9659564B2 (en) * | 2014-10-24 | 2017-05-23 | Sestek Ses Ve Iletisim Bilgisayar Teknolojileri Sanayi Ticaret Anonim Sirketi | Speaker verification based on acoustic behavioral characteristics of the speaker |
US10339527B1 (en) | 2014-10-31 | 2019-07-02 | Experian Information Solutions, Inc. | System and architecture for electronic fraud detection |
US9817956B2 (en) * | 2014-12-12 | 2017-11-14 | Excalibur Ip, Llc | User authentication and data encryption |
FR3037692B1 (fr) * | 2015-06-16 | 2017-06-02 | Morpho | Procede d'identification biometrique |
CN105096121B (zh) | 2015-06-25 | 2017-07-25 | 百度在线网络技术(北京)有限公司 | 声纹认证方法和装置 |
US20220329589A1 (en) * | 2015-06-26 | 2022-10-13 | Gbl Systems Corporation | Methods and apparatus for providing biometric authentication and authorization services |
CN104967622B (zh) * | 2015-06-30 | 2017-04-05 | 百度在线网络技术(北京)有限公司 | 基于声纹的通讯方法、装置和系统 |
US11151468B1 (en) | 2015-07-02 | 2021-10-19 | Experian Information Solutions, Inc. | Behavior analysis using distributed representations of event data |
US11329980B2 (en) | 2015-08-21 | 2022-05-10 | Veridium Ip Limited | System and method for biometric protocol standards |
US10269372B1 (en) * | 2015-09-24 | 2019-04-23 | United Services Automobile Association (Usaa) | System for sound analysis and recognition |
US20170092278A1 (en) * | 2015-09-30 | 2017-03-30 | Apple Inc. | Speaker recognition |
CN105224849B (zh) | 2015-10-20 | 2019-01-01 | 广州广电运通金融电子股份有限公司 | 一种多生物特征融合身份鉴别方法以及装置 |
US10062388B2 (en) * | 2015-10-22 | 2018-08-28 | Motorola Mobility Llc | Acoustic and surface vibration authentication |
US10372889B2 (en) * | 2016-02-19 | 2019-08-06 | At&T Mobility Ii Llc | Event characteristic analysis for event input discrimination |
US10044710B2 (en) | 2016-02-22 | 2018-08-07 | Bpip Limited Liability Company | Device and method for validating a user using an intelligent voice print |
TWI574255B (zh) * | 2016-02-22 | 2017-03-11 | 華碩電腦股份有限公司 | 語音辨識方法、電子裝置及語音辨識系統 |
US9959885B2 (en) * | 2016-03-08 | 2018-05-01 | Samsung Eletrônica Da Amazônia Ltda | Method for user context recognition using sound signatures |
US20190066676A1 (en) * | 2016-05-16 | 2019-02-28 | Sony Corporation | Information processing apparatus |
US10127926B2 (en) * | 2016-06-10 | 2018-11-13 | Google Llc | Securely executing voice actions with speaker identification and authentication input types |
GB2552722A (en) * | 2016-08-03 | 2018-02-07 | Cirrus Logic Int Semiconductor Ltd | Speaker recognition |
US10559312B2 (en) * | 2016-08-25 | 2020-02-11 | International Business Machines Corporation | User authentication using audiovisual synchrony detection |
CN106448685B (zh) * | 2016-10-09 | 2019-11-22 | 北京远鉴科技有限公司 | 一种基于音素信息的声纹认证系统及方法 |
US10614813B2 (en) | 2016-11-04 | 2020-04-07 | Intellisist, Inc. | System and method for performing caller identity verification using multi-step voice analysis |
GB2555661A (en) * | 2016-11-07 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Methods and apparatus for biometric authentication in an electronic device |
US10446157B2 (en) | 2016-12-19 | 2019-10-15 | Bank Of America Corporation | Synthesized voice authentication engine |
US10049673B2 (en) * | 2016-12-19 | 2018-08-14 | Bank Of America Corporation | Synthesized voice authentication engine |
US11115403B2 (en) * | 2017-02-21 | 2021-09-07 | Baldev Krishan | Multi-level user device authentication system for internet of things (IOT) |
CN107068154A (zh) * | 2017-03-13 | 2017-08-18 | 平安科技(深圳)有限公司 | 基于声纹识别的身份验证的方法及系统 |
CN109146450A (zh) | 2017-06-16 | 2019-01-04 | 阿里巴巴集团控股有限公司 | 支付方法、客户端、电子设备、存储介质和服务器 |
CN109147770B (zh) | 2017-06-16 | 2023-07-28 | 阿里巴巴集团控股有限公司 | 声音识别特征的优化、动态注册方法、客户端和服务器 |
WO2019002831A1 (en) * | 2017-06-27 | 2019-01-03 | Cirrus Logic International Semiconductor Limited | REPRODUCTIVE ATTACK DETECTION |
GB2563953A (en) | 2017-06-28 | 2019-01-02 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201713697D0 (en) | 2017-06-28 | 2017-10-11 | Cirrus Logic Int Semiconductor Ltd | Magnetic detection of replay attack |
CN109218269A (zh) * | 2017-07-05 | 2019-01-15 | 阿里巴巴集团控股有限公司 | 身份认证的方法、装置、设备及数据处理方法 |
GB201801528D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
GB201801532D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for audio playback |
GB201801527D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
GB201801530D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201801526D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
WO2019013770A1 (en) * | 2017-07-11 | 2019-01-17 | Hewlett-Packard Development Company, L.P. | VOICE AUTHENTICATION BASED ON VOICE MODULATION |
US20190043509A1 (en) * | 2017-08-04 | 2019-02-07 | Cirrus Logic International Semiconductor Ltd. | Audio privacy based on user identification |
US11595381B2 (en) | 2017-08-23 | 2023-02-28 | Visa International Service Association | Secure authorization for access to private data in virtual reality |
US10699028B1 (en) | 2017-09-28 | 2020-06-30 | Csidentity Corporation | Identity security architecture systems and methods |
CN109583287B (zh) | 2017-09-29 | 2024-04-12 | 浙江莲荷科技有限公司 | 实物识别方法及验证方法 |
CN109583285B (zh) | 2017-09-29 | 2023-03-07 | 阿里巴巴集团控股有限公司 | 对象识别方法 |
GB201803570D0 (en) | 2017-10-13 | 2018-04-18 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201801663D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB201804843D0 (en) | 2017-11-14 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201801874D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Improving robustness of speech processing system against ultrasound and dolphin attacks |
GB201801661D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic International Uk Ltd | Detection of liveness |
GB201801664D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB2567503A (en) | 2017-10-13 | 2019-04-17 | Cirrus Logic Int Semiconductor Ltd | Analysing speech signals |
US10749855B2 (en) | 2017-10-30 | 2020-08-18 | Vmware, Inc. | Securely managing digital assistants that access third-party applications |
US10805301B2 (en) * | 2017-10-30 | 2020-10-13 | Vmware, Inc. | Securely managing digital assistants that access third-party applications |
GB201801659D0 (en) | 2017-11-14 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of loudspeaker playback |
US10896472B1 (en) | 2017-11-14 | 2021-01-19 | Csidentity Corporation | Security and identity verification system and architecture |
CN108154588B (zh) * | 2017-12-29 | 2020-11-27 | 深圳市艾特智能科技有限公司 | 解锁方法、系统、可读存储介质及智能设备 |
CN108268619B (zh) | 2018-01-08 | 2020-06-30 | 阿里巴巴集团控股有限公司 | 内容推荐方法及装置 |
US11475899B2 (en) | 2018-01-23 | 2022-10-18 | Cirrus Logic, Inc. | Speaker identification |
US11264037B2 (en) | 2018-01-23 | 2022-03-01 | Cirrus Logic, Inc. | Speaker identification |
US11735189B2 (en) | 2018-01-23 | 2023-08-22 | Cirrus Logic, Inc. | Speaker identification |
CN108446817B (zh) | 2018-02-01 | 2020-10-02 | 阿里巴巴集团控股有限公司 | 确定业务对应的决策策略的方法、装置和电子设备 |
CN108648760B (zh) * | 2018-04-17 | 2020-04-28 | 四川长虹电器股份有限公司 | 实时声纹辨识系统与方法 |
CN108711428B (zh) * | 2018-05-30 | 2021-05-25 | Oppo广东移动通信有限公司 | 指令执行方法、装置、存储介质及电子设备 |
US20210193152A1 (en) * | 2018-07-03 | 2021-06-24 | 3M Innovative Properties Company | Correlating Audio Signals For Authentication |
US10692490B2 (en) | 2018-07-31 | 2020-06-23 | Cirrus Logic, Inc. | Detection of replay attack |
CN110569856B (zh) | 2018-08-24 | 2020-07-21 | 阿里巴巴集团控股有限公司 | 样本标注方法及装置、损伤类别的识别方法及装置 |
US20200077190A1 (en) * | 2018-08-29 | 2020-03-05 | Soniphi Llc | Earbuds With Vocal Frequency-Based Equalization |
CN110569696A (zh) | 2018-08-31 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 用于车辆部件识别的神经网络系统、方法和装置 |
CN110570316A (zh) | 2018-08-31 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 训练损伤识别模型的方法及装置 |
US10915614B2 (en) | 2018-08-31 | 2021-02-09 | Cirrus Logic, Inc. | Biometric authentication |
CN110569837B (zh) | 2018-08-31 | 2021-06-04 | 创新先进技术有限公司 | 优化损伤检测结果的方法及装置 |
CN110569695B (zh) | 2018-08-31 | 2021-07-09 | 创新先进技术有限公司 | 基于定损图像判定模型的图像处理方法和装置 |
CN110569697A (zh) | 2018-08-31 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 车辆的部件检测方法、装置及设备 |
CN110569864A (zh) | 2018-09-04 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 基于gan网络的车损图像生成方法和装置 |
US11037574B2 (en) | 2018-09-05 | 2021-06-15 | Cirrus Logic, Inc. | Speaker recognition and speaker change detection |
CN110569699B (zh) | 2018-09-07 | 2020-12-29 | 创新先进技术有限公司 | 对图片进行目标采样的方法及装置 |
US11474801B1 (en) * | 2018-09-26 | 2022-10-18 | Amazon Technologies, Inc. | Automatic application installation based on proximity detection |
CN111385624B (zh) * | 2018-12-29 | 2021-10-01 | 深圳Tcl新技术有限公司 | 一种基于语音的数据传输控制方法、智能电视及存储介质 |
US12014740B2 (en) | 2019-01-08 | 2024-06-18 | Fidelity Information Services, Llc | Systems and methods for contactless authentication using voice recognition |
US12021864B2 (en) * | 2019-01-08 | 2024-06-25 | Fidelity Information Services, Llc. | Systems and methods for contactless authentication using voice recognition |
CN109979466B (zh) * | 2019-03-21 | 2021-09-17 | 广州国音智能科技有限公司 | 一种声纹身份同一性鉴定方法、装置及计算机可读存储介质 |
US11374976B2 (en) * | 2019-10-15 | 2022-06-28 | Bank Of America Corporation | System for authentication of resource actions based on multi-channel input |
JP7332518B2 (ja) * | 2020-03-30 | 2023-08-23 | 本田技研工業株式会社 | 会話支援装置、会話支援システム、会話支援方法およびプログラム |
CN111680173B (zh) * | 2020-05-31 | 2024-02-23 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 统一检索跨媒体信息的cmr模型 |
US11664033B2 (en) * | 2020-06-15 | 2023-05-30 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
US11741965B1 (en) * | 2020-06-26 | 2023-08-29 | Amazon Technologies, Inc. | Configurable natural language output |
US11436309B2 (en) | 2020-07-09 | 2022-09-06 | Bank Of America Corporation | Dynamic knowledge-based voice authentication |
US11720704B1 (en) | 2020-09-01 | 2023-08-08 | Cigna Intellectual Property, Inc. | System and method for authenticating access to private health information |
CN112185344A (zh) * | 2020-09-27 | 2021-01-05 | 北京捷通华声科技股份有限公司 | 语音交互方法、装置、计算机可读存储介质和处理器 |
US11626104B2 (en) * | 2020-12-08 | 2023-04-11 | Qualcomm Incorporated | User speech profile management |
CN112818316B (zh) * | 2021-03-08 | 2023-06-20 | 南京大正智能科技有限公司 | 基于声纹的身份识别及应用方法、装置与设备 |
CN113190508B (zh) * | 2021-04-26 | 2023-05-05 | 重庆市规划和自然资源信息中心 | 一种面向管理的自然语言识别方法 |
US20230122420A1 (en) * | 2021-10-15 | 2023-04-20 | Gulfstream Aerospace Corporation | Directional array intercom for internal communication on aircraft |
WO2023225078A1 (en) | 2022-05-20 | 2023-11-23 | Advanced Elemental Technologies, Inc. | Systems and methods for a connected computing resource and event/activity identification information infrastructure using near existential or existential biometric identification of humans |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH031200A (ja) * | 1989-05-29 | 1991-01-07 | Nec Corp | 規則型音声合成装置 |
US6594628B1 (en) * | 1995-09-21 | 2003-07-15 | Qualcomm, Incorporated | Distributed voice recognition system |
US6950810B2 (en) * | 1994-11-28 | 2005-09-27 | Indivos Corporation | Tokenless biometric electronic financial transactions via a third party identicator |
US6397198B1 (en) * | 1994-11-28 | 2002-05-28 | Indivos Corporation | Tokenless biometric electronic transactions using an audio signature to identify the transaction processor |
US5794205A (en) * | 1995-10-19 | 1998-08-11 | Voice It Worldwide, Inc. | Voice recognition interface apparatus and method for interacting with a programmable timekeeping device |
US6038528A (en) * | 1996-07-17 | 2000-03-14 | T-Netix, Inc. | Robust speech processing with affine transform replicated data |
US6266640B1 (en) * | 1996-08-06 | 2001-07-24 | Dialogic Corporation | Data network with voice verification means |
US6016476A (en) * | 1997-08-11 | 2000-01-18 | International Business Machines Corporation | Portable information and transaction processing system and method utilizing biometric authorization and digital certificate security |
US6213391B1 (en) * | 1997-09-10 | 2001-04-10 | William H. Lewis | Portable system for personal identification based upon distinctive characteristics of the user |
US6084967A (en) * | 1997-10-29 | 2000-07-04 | Motorola, Inc. | Radio telecommunication device and method of authenticating a user with a voice authentication token |
US6016479A (en) * | 1998-02-10 | 2000-01-18 | Interstate Solutions, Llc | Computer-based system, computer program product and method for recovering tax revenue |
IL129451A (en) * | 1999-04-15 | 2004-05-12 | Eli Talmor | System and method for authentication of a speaker |
EP1172771B1 (de) * | 2000-07-14 | 2006-04-19 | Voice.Trust Ag | Verfahren und System zur Autorisierung einer kommerziellen Transaktion |
US7013273B2 (en) * | 2001-03-29 | 2006-03-14 | Matsushita Electric Industrial Co., Ltd. | Speech recognition based captioning system |
US6601762B2 (en) * | 2001-06-15 | 2003-08-05 | Koninklijke Philips Electronics N.V. | Point-of-sale (POS) voice authentication transaction system |
US7158776B1 (en) * | 2001-09-18 | 2007-01-02 | Cisco Technology, Inc. | Techniques for voice-based user authentication for mobile access to network services |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
CN1172260C (zh) * | 2001-12-29 | 2004-10-20 | 浙江大学 | 基于指纹和声纹的交叉认证方法 |
US7898977B2 (en) * | 2002-03-01 | 2011-03-01 | Enterasys Networks Inc. | Using signal characteristics to determine the physical location of devices in a data network |
CN1547191A (zh) * | 2003-12-12 | 2004-11-17 | 北京大学 | 结合语义和声纹信息的说话人身份确认系统 |
US7490043B2 (en) * | 2005-02-07 | 2009-02-10 | Hitachi, Ltd. | System and method for speaker verification using short utterance enrollments |
US7536304B2 (en) | 2005-05-27 | 2009-05-19 | Porticus, Inc. | Method and system for bio-metric voice print authentication |
-
2006
- 2006-05-24 US US11/420,190 patent/US7536304B2/en active Active - Reinstated
- 2006-05-26 EP EP06771585A patent/EP1915294A4/en not_active Withdrawn
- 2006-05-26 WO PCT/US2006/020907 patent/WO2006128171A2/en active Application Filing
- 2006-05-26 CN CN2006800273727A patent/CN101467204B/zh active Active
- 2006-05-26 JP JP2008513828A patent/JP2009508144A/ja not_active Withdrawn
-
2009
- 2009-04-13 US US12/422,787 patent/US8280740B2/en active Active
-
2012
- 2012-09-13 US US13/614,163 patent/US8571867B2/en active Active
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010039599A (ja) * | 2008-08-01 | 2010-02-18 | Universal Entertainment Corp | 内部統制制御システム |
JP2013502650A (ja) * | 2009-08-21 | 2013-01-24 | アバイア インク. | 電話で見いだされるマッシュアップとプレゼンス |
JP2014500991A (ja) * | 2010-09-30 | 2014-01-16 | アルカテル−ルーセント | 音声署名認証の方法および装置 |
KR20170010819A (ko) * | 2014-11-18 | 2017-02-01 | 선전 후이딩 테크놀로지 컴퍼니 리미티드 | 이동 단말기에서의 악성 동작 인식 방법 및 장치 |
JP2017506401A (ja) * | 2014-12-27 | 2017-03-02 | 小米科技有限責任公司Xiaomi Inc. | 資源移転方法、装置、プログラム及び記録媒体 |
KR20170139650A (ko) * | 2015-11-17 | 2017-12-19 | 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 | 계정 추가 방법, 단말, 서버, 및 컴퓨터 저장 매체 |
JP2018522303A (ja) * | 2015-11-17 | 2018-08-09 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | アカウント追加方法、端末、サーバ、およびコンピュータ記憶媒体 |
KR102081495B1 (ko) * | 2015-11-17 | 2020-02-25 | 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 | 계정 추가 방법, 단말, 서버, 및 컴퓨터 저장 매체 |
KR20210009645A (ko) * | 2019-07-17 | 2021-01-27 | 주식회사 케이티 | 고객센터 목소리 인증 시스템 및 목소리 인증 방법 |
KR102306640B1 (ko) * | 2019-07-17 | 2021-09-28 | 주식회사 케이티 | 고객센터 목소리 인증 시스템 및 목소리 인증 방법 |
WO2024111023A1 (ja) * | 2022-11-21 | 2024-05-30 | 楽天グループ株式会社 | 情報処理システム、情報処理方法、及び情報処理プログラム |
JP7515030B1 (ja) | 2022-11-21 | 2024-07-11 | 楽天グループ株式会社 | 情報処理システム、情報処理方法、及び情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US8571867B2 (en) | 2013-10-29 |
US20070185718A1 (en) | 2007-08-09 |
EP1915294A4 (en) | 2009-10-21 |
WO2006128171A2 (en) | 2006-11-30 |
EP1915294A2 (en) | 2008-04-30 |
US20130018657A1 (en) | 2013-01-17 |
US7536304B2 (en) | 2009-05-19 |
US8280740B2 (en) | 2012-10-02 |
CN101467204A (zh) | 2009-06-24 |
WO2006128171A3 (en) | 2009-01-08 |
US20090206993A1 (en) | 2009-08-20 |
CN101467204B (zh) | 2013-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8571867B2 (en) | Method and system for bio-metric voice print authentication | |
US11735191B2 (en) | Speaker recognition with assessment of audio frame contribution | |
AU2016216737B2 (en) | Voice Authentication and Speech Recognition System | |
US10950245B2 (en) | Generating prompts for user vocalisation for biometric speaker recognition | |
US20160372116A1 (en) | Voice authentication and speech recognition system and method | |
US8160877B1 (en) | Hierarchical real-time speaker recognition for biometric VoIP verification and targeting | |
JP2023511104A (ja) | ディープ残差ニューラルネットワークを用いたロバストなスプーフィング検出システム | |
US20120143608A1 (en) | Audio signal source verification system | |
US20120290297A1 (en) | Speaker Liveness Detection | |
JP5311348B2 (ja) | 音声データ内の音声キーワード照合システム、その方法及び音声データ内の音声キーワード照合プログラム | |
JP2002514318A (ja) | 録音された音声を検出するシステムおよび方法 | |
WO2005013263A1 (ja) | 音声認証システム | |
KR101888058B1 (ko) | 발화된 단어에 기초하여 화자를 식별하기 위한 방법 및 그 장치 | |
US20200201970A1 (en) | Biometric user recognition | |
Kounoudes et al. | Voice biometric authentication for enhancing Internet service security | |
Mahanta et al. | Warping path and gross spectrum information for speaker verification under degraded condition | |
JP5436951B2 (ja) | 本人認証装置および本人認証方法 | |
US20230153815A1 (en) | Methods and systems for training a machine learning model and authenticating a user with the model | |
WO2023164332A1 (en) | Frequency mapping in the voiceprint domain | |
Pawlewski et al. | URU Plus—a scalable component-based speaker-verification system for BT’s 21st century network | |
Pawlewski et al. | URU Plus—a scalable component-based speaker-verification system for BT's 21st century network | |
WO2004015552A2 (en) | Method of authentication | |
Kounoudes et al. | Intelligent Speaker Verification based Biometric System for Electronic Commerce Applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20090804 |