JPH1138992A - 自動音声/話者認識サーバへのリモート・アクセス用ポータブル音響インタフェース装置、システム及び方法 - Google Patents
自動音声/話者認識サーバへのリモート・アクセス用ポータブル音響インタフェース装置、システム及び方法Info
- Publication number
- JPH1138992A JPH1138992A JP10152923A JP15292398A JPH1138992A JP H1138992 A JPH1138992 A JP H1138992A JP 10152923 A JP10152923 A JP 10152923A JP 15292398 A JP15292398 A JP 15292398A JP H1138992 A JPH1138992 A JP H1138992A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- data
- portable
- server
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004891 communication Methods 0.000 claims abstract description 65
- 239000013598 vector Substances 0.000 claims abstract description 33
- 230000005236 sound signal Effects 0.000 claims abstract description 29
- 230000008569 process Effects 0.000 claims abstract description 20
- 238000012546 transfer Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 18
- 230000006870 function Effects 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 25
- 230000008859 change Effects 0.000 claims description 6
- 238000013144 data compression Methods 0.000 claims description 3
- 238000013500 data storage Methods 0.000 claims description 2
- 238000007906 compression Methods 0.000 abstract description 7
- 230000006835 compression Effects 0.000 abstract description 7
- 230000001413 cellular effect Effects 0.000 description 6
- 238000007726 management method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000007420 reactivation Effects 0.000 description 3
- 235000014510 cooky Nutrition 0.000 description 2
- 235000019800 disodium phosphate Nutrition 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012419 revalidation Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
(57)【要約】
【課題】 話された音声及びバックグラウンド・ノイズ
を受信するマイクを持つポータブル音声信号前処理(S
SP)装置、受信されたノイズを処理してフィーチャ・
ベクトルを作成するデジタル信号プロセッサ(DS
P)、及び通信チャネルを通して転送するため通信装置
に接続するカプラを提供する。 【解決手段】 自動音声/話者認識(ASSR)サーバ
が通信チャネルを通して、前処理された音声データを受
信し、話された音声/話者を認識する。ポータブルSS
P装置及びASSRサーバは、スマートカード、磁気カ
ードまたは電子マネー・カードのPINコードの有効
化、リセット、または変更をリモートに行うため使用で
きる。
を受信するマイクを持つポータブル音声信号前処理(S
SP)装置、受信されたノイズを処理してフィーチャ・
ベクトルを作成するデジタル信号プロセッサ(DS
P)、及び通信チャネルを通して転送するため通信装置
に接続するカプラを提供する。 【解決手段】 自動音声/話者認識(ASSR)サーバ
が通信チャネルを通して、前処理された音声データを受
信し、話された音声/話者を認識する。ポータブルSS
P装置及びASSRサーバは、スマートカード、磁気カ
ードまたは電子マネー・カードのPINコードの有効
化、リセット、または変更をリモートに行うため使用で
きる。
Description
【0001】
【発明の属する技術分野】本発明は、自動音声/話者認
識(ASSR、Automatic Speech/Speaker Recognitio
n)に関し、特に電話回線等の通信チャネルを通してA
SSRサーバにリモートにアクセスするためのポータブ
ル音響カプラまたはインタフェースを用いたASSR法
に関する。
識(ASSR、Automatic Speech/Speaker Recognitio
n)に関し、特に電話回線等の通信チャネルを通してA
SSRサーバにリモートにアクセスするためのポータブ
ル音響カプラまたはインタフェースを用いたASSR法
に関する。
【0002】
【従来の技術】中央のサーバまたはサービス・プロバイ
ダのリソースを多数のクライアントまたは加入者がアク
セスする代表的なクライアント/サーバまたは加入者/
サービス・プロバイダのシステムでは、何らかの形のク
ライアント/加入者認証法により、クライアント/加入
者が有効なシステム・ユーザかどうか確認される。この
ようなシステムの多くはコードをキー入力するか、また
はテキストをオペレータに通信することによってPI
N、キーワードまたはパスワード等の認証コードをやり
とりする。いくつかのシステムの認証コードは音声によ
る。つまりコードはサーバに対して声で入力される。サ
ーバ(この場合はASSRサーバ)はその発音を認識
し、記憶された有効な音声認証コードと比較すること
で、そのユーザが有効なクライアントであることを確認
する。
ダのリソースを多数のクライアントまたは加入者がアク
セスする代表的なクライアント/サーバまたは加入者/
サービス・プロバイダのシステムでは、何らかの形のク
ライアント/加入者認証法により、クライアント/加入
者が有効なシステム・ユーザかどうか確認される。この
ようなシステムの多くはコードをキー入力するか、また
はテキストをオペレータに通信することによってPI
N、キーワードまたはパスワード等の認証コードをやり
とりする。いくつかのシステムの認証コードは音声によ
る。つまりコードはサーバに対して声で入力される。サ
ーバ(この場合はASSRサーバ)はその発音を認識
し、記憶された有効な音声認証コードと比較すること
で、そのユーザが有効なクライアントであることを確認
する。
【0003】ASSRサーバ/クライアント・システム
では、クライアントが電話回線等の通信チャネルを通し
て音声により認証コードをリモートに通信すれば都合が
よい。つまり電話回線が利用できるならどのクライアン
トもサーバにアクセスできるようにすることである。電
話回線は地上回線またはセルラ回線等である。セルラの
場合は、サーバへのアクセスは完全にポータブル、つま
りいつでもどこでもセルラ・フォンとセルラ接続が利用
できる。
では、クライアントが電話回線等の通信チャネルを通し
て音声により認証コードをリモートに通信すれば都合が
よい。つまり電話回線が利用できるならどのクライアン
トもサーバにアクセスできるようにすることである。電
話回線は地上回線またはセルラ回線等である。セルラの
場合は、サーバへのアクセスは完全にポータブル、つま
りいつでもどこでもセルラ・フォンとセルラ接続が利用
できる。
【0004】上に述べたような電話ASSRシステムの
運営上の困難には、1)電話回線で送られる音声データ
の劣化により正確さに欠ける、及び2)呼び出し側が公
衆電話からかけているとき、車を運転しているとき等、
ユーザがかけている電話の位置に応じて、ユーザ側でバ
ックグラウンド・ノイズ特性が変化するといったことが
含まれる。いずれの状況でもデータまたは信号の整合性
が失われ、よって音声/話者の認識精度が大きく低下す
る。
運営上の困難には、1)電話回線で送られる音声データ
の劣化により正確さに欠ける、及び2)呼び出し側が公
衆電話からかけているとき、車を運転しているとき等、
ユーザがかけている電話の位置に応じて、ユーザ側でバ
ックグラウンド・ノイズ特性が変化するといったことが
含まれる。いずれの状況でもデータまたは信号の整合性
が失われ、よって音声/話者の認識精度が大きく低下す
る。
【0005】データ及び認識の精度が失われるこの問題
は、クライアント側で信号が電話回線を通してサーバに
送られる前に、音声信号前処理(SSP、Speech Signa
l Preprocessing)が実行される場合は減らすことが、
またはなくすことができる。SSPは転送デバイス、環
境、話者及び通信チャネルの音響特性の把握を含む。S
SP情報はASSRサーバによって処理され、基準が設
定され、対応するデコード・モデルとアルゴリズムが選
択され、ワード・エラー・レートを小さくするため、ま
たは話者認識を正確に行うためにチャネル伝達関数とバ
ックグラウンド・ノイズをモデリングすることによっ
て、話者が認識されるか、または音声がデコードされ
る。しかしユーザ側でSSPを実行するには、SSPソ
フトウェアを持つコンピュータを含めたSSP機器が必
要になる。このようなSSP機能は、一般的には現在の
標準的な電話やNC(ネットワーク・コンピュータ)に
はない。
は、クライアント側で信号が電話回線を通してサーバに
送られる前に、音声信号前処理(SSP、Speech Signa
l Preprocessing)が実行される場合は減らすことが、
またはなくすことができる。SSPは転送デバイス、環
境、話者及び通信チャネルの音響特性の把握を含む。S
SP情報はASSRサーバによって処理され、基準が設
定され、対応するデコード・モデルとアルゴリズムが選
択され、ワード・エラー・レートを小さくするため、ま
たは話者認識を正確に行うためにチャネル伝達関数とバ
ックグラウンド・ノイズをモデリングすることによっ
て、話者が認識されるか、または音声がデコードされ
る。しかしユーザ側でSSPを実行するには、SSPソ
フトウェアを持つコンピュータを含めたSSP機器が必
要になる。このようなSSP機能は、一般的には現在の
標準的な電話やNC(ネットワーク・コンピュータ)に
はない。
【0006】従って、軽量コンパクトで持ち運びに便利
であり、任意の電話またはデータ通信デバイスに接続で
き、通信チャネルを通してASSRサーバにアクセスし
たときに、またサーバとの対話全体で正確な話者認識を
促進し、ポータブルSSP装置とASSRサーバの間で
正確な音声認識通信を行う機能を含む、ポータブルSS
P装置が求められる。
であり、任意の電話またはデータ通信デバイスに接続で
き、通信チャネルを通してASSRサーバにアクセスし
たときに、またサーバとの対話全体で正確な話者認識を
促進し、ポータブルSSP装置とASSRサーバの間で
正確な音声認識通信を行う機能を含む、ポータブルSS
P装置が求められる。
【0007】本発明の実施例は、音声、沈黙及びバック
グラウンド・ノイズの各信号を含むサウンドをアナログ
信号に変換するマイク、アナログ信号をデジタル信号に
変化するアナログ/デジタル・コンバータ、デジタル信
号から音声を表すフィーチャ・ベクトル・データと、沈
黙とバックグラウンド・ノイズの信号を表す特性データ
とを生成するDSP(デジタル信号プロセッサ)、遠隔
地でのASSRサーバによる音声認識を目的に及び通信
チャネルを通してフィーチャ・ベクトル・データを表す
信号を通信するために、音響またはデータの通信装置に
接続するカプラを含むポータブルSSP装置を含む。カ
プラは、好適にはフィーチャ・ベクトル・データを音響
信号に変換する音響カプラである。その場合、通信チャ
ネルも電話回線のようにアコースティック(acoustic)
である。またカプラはデータ通信チャネルを通して転送
するためデジタル転送装置に接続ようにコネクタ、ポー
ト、プロトコル等の対応するインタフェースを含む。
グラウンド・ノイズの各信号を含むサウンドをアナログ
信号に変換するマイク、アナログ信号をデジタル信号に
変化するアナログ/デジタル・コンバータ、デジタル信
号から音声を表すフィーチャ・ベクトル・データと、沈
黙とバックグラウンド・ノイズの信号を表す特性データ
とを生成するDSP(デジタル信号プロセッサ)、遠隔
地でのASSRサーバによる音声認識を目的に及び通信
チャネルを通してフィーチャ・ベクトル・データを表す
信号を通信するために、音響またはデータの通信装置に
接続するカプラを含むポータブルSSP装置を含む。カ
プラは、好適にはフィーチャ・ベクトル・データを音響
信号に変換する音響カプラである。その場合、通信チャ
ネルも電話回線のようにアコースティック(acoustic)
である。またカプラはデータ通信チャネルを通して転送
するためデジタル転送装置に接続ようにコネクタ、ポー
ト、プロトコル等の対応するインタフェースを含む。
【0008】ポータブルSSP装置は、好適には、フィ
ーチャ・ベクトル・データを暗号化する暗号化装置と、
フィーチャ・ベクトル・データを圧縮するデータ圧縮装
置を含む。ポータブルSSP装置は、好適には、ASS
Rサーバからの戻り信号を受信し処理する手段と、DS
Pによる処理を目的に戻り信号をデジタル戻りデータに
変換する手段を含む。この好適な実施例ではDSPは更
に、デジタル戻りデータを圧縮解除する手段とデジタル
戻りデータを解読する手段を含む。
ーチャ・ベクトル・データを暗号化する暗号化装置と、
フィーチャ・ベクトル・データを圧縮するデータ圧縮装
置を含む。ポータブルSSP装置は、好適には、ASS
Rサーバからの戻り信号を受信し処理する手段と、DS
Pによる処理を目的に戻り信号をデジタル戻りデータに
変換する手段を含む。この好適な実施例ではDSPは更
に、デジタル戻りデータを圧縮解除する手段とデジタル
戻りデータを解読する手段を含む。
【0009】ポータブルSSP装置は更に、好適には話
者、沈黙及びバックグラウンド・ノイズに関連する音響
特性を含めて、通信チャネルの伝達関数の予測を、好適
には1組の予測基準信号を遠隔地でチャネルに接続され
たASSRサーバに送ることによって促進する手段を含
む。ポータブルSSP装置は、そのデバイスに固有の暗
号化キー・データまたは認証データを含めてデータを格
納するメモリを含む。
者、沈黙及びバックグラウンド・ノイズに関連する音響
特性を含めて、通信チャネルの伝達関数の予測を、好適
には1組の予測基準信号を遠隔地でチャネルに接続され
たASSRサーバに送ることによって促進する手段を含
む。ポータブルSSP装置は、そのデバイスに固有の暗
号化キー・データまたは認証データを含めてデータを格
納するメモリを含む。
【0010】本発明の他の好適な実施例は、マイクに向
かって話されデジタル化された音声を処理し、音声を表
すフィーチャ・ベクトル・データを生成するDSP(デ
ジタル信号プロセッサ)と、電話回線またはデジタル・
ネットワーク接続等の通信チャネルに接続された通信装
置に接続し、通信チャネルを通して通信するためにフィ
ーチャ・ベクトル・データを信号に変換するカプラと、
ポータブルSSPから通信チャネルを介して転送された
信号を受信し、受信された信号を音声認識を目的に処理
するため、通信チャネルに接続された自動音声/話者認
識(ASSR)サーバを持つポータブルSSP装置を持
つASSRシステムを含む。
かって話されデジタル化された音声を処理し、音声を表
すフィーチャ・ベクトル・データを生成するDSP(デ
ジタル信号プロセッサ)と、電話回線またはデジタル・
ネットワーク接続等の通信チャネルに接続された通信装
置に接続し、通信チャネルを通して通信するためにフィ
ーチャ・ベクトル・データを信号に変換するカプラと、
ポータブルSSPから通信チャネルを介して転送された
信号を受信し、受信された信号を音声認識を目的に処理
するため、通信チャネルに接続された自動音声/話者認
識(ASSR)サーバを持つポータブルSSP装置を持
つASSRシステムを含む。
【0011】システムのASSRサーバは、登録または
認証のデータの格納モデルを含む。このモデルは加入者
またはクライアントの登録時に作成される。ASSRサ
ーバはまた音声認識のため、1組のボキャブラリと、言
語モデル、隠れマルコフ・モデル(HMM、Hidden Mar
kov Models)等他のモデルを格納する。ASSRサーバ
は、ポータブルSSP装置から受信された信号を処理
し、処理された信号を格納モデルと比較する。
認証のデータの格納モデルを含む。このモデルは加入者
またはクライアントの登録時に作成される。ASSRサ
ーバはまた音声認識のため、1組のボキャブラリと、言
語モデル、隠れマルコフ・モデル(HMM、Hidden Mar
kov Models)等他のモデルを格納する。ASSRサーバ
は、ポータブルSSP装置から受信された信号を処理
し、処理された信号を格納モデルと比較する。
【0012】ここで好都合なことは、リモート話者認証
機能があるとき、本発明の実施例に従ったシステムは、
遠隔地のスマートカードまたは磁気カードの活動化/非
活動化、またはパスワードもしくはPINコードの変更
と再活動化の機能を提供することである。
機能があるとき、本発明の実施例に従ったシステムは、
遠隔地のスマートカードまたは磁気カードの活動化/非
活動化、またはパスワードもしくはPINコードの変更
と再活動化の機能を提供することである。
【0013】更に、本発明の実施例に従ったリモート音
声認識装置は、シグナリングの悪い、または歪みの大き
い通信環境でも誤差が少なくボキャブラリの多い音声の
認識が可能なASSR機能を提供する。
声認識装置は、シグナリングの悪い、または歪みの大き
い通信環境でも誤差が少なくボキャブラリの多い音声の
認識が可能なASSR機能を提供する。
【0014】図1は、本発明の実施例に従ったポータブ
ル音声信号前処理(SSP)装置99のブロック図を示
す。マイク100は、ユーザが話した音声、沈黙及びバ
ックグラウンド・ノイズを含むサウンドを受信し、サウ
ンドをアナログ電気信号に変換するために用いられる。
マイク100は、デジタル信号プロセッサ(DSP)1
20に転送して処理するためにマイク100からのアナ
ログ電気信号をデジタル化信号に変換するアナログ/デ
ジタル(A/D)・コンバータ110に接続される。D
SP120は、好適にはプロセッサと、関連メモリ及び
データを処理しポータブルSSP装置99のデータの流
れを制御する格納プログラムを含む。好適な実施例でD
SP120の機能は、マイク100に向かって話された
音声データをフィーチャ・ベクトルに前処理する機能、
沈黙とバックグラウンド・ノイズのデータを処理して、
通信チャネルの伝達関数の確立または予測を補助する機
能、及びポータブルSSP装置との間でデータの転送と
受信を調整する、データを暗号化/解読する、必要に応
じてデータを圧縮/圧縮解除する機能を含めた他のAS
SR機能を実行する機能を含む。これらの機能及び通信
チャネルの伝達関数の予測については以下で詳しく説明
する。上に述べたDSPの機能または手法は当業者には
知られており、一般に入手できる多数のDSPによりこ
れらの機能を実行できる。例えばTexas Instruments、I
nc.のモデルTMS 32010、またはNippon Electric Co.
のUPD 7720は、ここで述べる用途に適したDSPであ
る。
ル音声信号前処理(SSP)装置99のブロック図を示
す。マイク100は、ユーザが話した音声、沈黙及びバ
ックグラウンド・ノイズを含むサウンドを受信し、サウ
ンドをアナログ電気信号に変換するために用いられる。
マイク100は、デジタル信号プロセッサ(DSP)1
20に転送して処理するためにマイク100からのアナ
ログ電気信号をデジタル化信号に変換するアナログ/デ
ジタル(A/D)・コンバータ110に接続される。D
SP120は、好適にはプロセッサと、関連メモリ及び
データを処理しポータブルSSP装置99のデータの流
れを制御する格納プログラムを含む。好適な実施例でD
SP120の機能は、マイク100に向かって話された
音声データをフィーチャ・ベクトルに前処理する機能、
沈黙とバックグラウンド・ノイズのデータを処理して、
通信チャネルの伝達関数の確立または予測を補助する機
能、及びポータブルSSP装置との間でデータの転送と
受信を調整する、データを暗号化/解読する、必要に応
じてデータを圧縮/圧縮解除する機能を含めた他のAS
SR機能を実行する機能を含む。これらの機能及び通信
チャネルの伝達関数の予測については以下で詳しく説明
する。上に述べたDSPの機能または手法は当業者には
知られており、一般に入手できる多数のDSPによりこ
れらの機能を実行できる。例えばTexas Instruments、I
nc.のモデルTMS 32010、またはNippon Electric Co.
のUPD 7720は、ここで述べる用途に適したDSPであ
る。
【0015】DSP120によって処理されたデータは
音響カプラ150に出力され、ここでデジタル・データ
はオーディオ信号に変換される。その場合、音響カプラ
からのオーディオ信号は、電話回線等のオーディオ通信
チャネルを通して転送するために、一般の電話機の受話
器等のオーディオ通信装置で再生または話すことができ
る。音響カプラ150は本発明の好適な実施例に従っ
て、デジタル信号をオーディオ信号に変換する変換器
と、一般の電話機の受話器のレシーバまたは送話口との
接続に適したカプラを含む。例えば音響カプラの接続部
分は、好適には、ポータブルSSP装置99を任意の一
般電話機に取り付け、取り外すこができ、ユーザがどこ
にいても、電話から電話へポータブル装置の携帯性、可
搬性を高めるように、一般電話機の送話口に確実に係合
または接続できるゴム等の可撓物質で作られる。ポータ
ブル装置は、好適にはバッテリにより自己給電される。
予想できるとおり、マイク、A/Dコンバータ、DS
P、カプラ及びバッテリを含むポータブル装置の基本コ
ンポーネントは軽量コンパクトである。ポータブル装置
はハンドヘルド型でもよく、或いはポケット電卓や財布
のようにシャツのポケットに入れて携帯することもでき
る。
音響カプラ150に出力され、ここでデジタル・データ
はオーディオ信号に変換される。その場合、音響カプラ
からのオーディオ信号は、電話回線等のオーディオ通信
チャネルを通して転送するために、一般の電話機の受話
器等のオーディオ通信装置で再生または話すことができ
る。音響カプラ150は本発明の好適な実施例に従っ
て、デジタル信号をオーディオ信号に変換する変換器
と、一般の電話機の受話器のレシーバまたは送話口との
接続に適したカプラを含む。例えば音響カプラの接続部
分は、好適には、ポータブルSSP装置99を任意の一
般電話機に取り付け、取り外すこができ、ユーザがどこ
にいても、電話から電話へポータブル装置の携帯性、可
搬性を高めるように、一般電話機の送話口に確実に係合
または接続できるゴム等の可撓物質で作られる。ポータ
ブル装置は、好適にはバッテリにより自己給電される。
予想できるとおり、マイク、A/Dコンバータ、DS
P、カプラ及びバッテリを含むポータブル装置の基本コ
ンポーネントは軽量コンパクトである。ポータブル装置
はハンドヘルド型でもよく、或いはポケット電卓や財布
のようにシャツのポケットに入れて携帯することもでき
る。
【0016】再び図1を参照する。暗号化装置130と
圧縮装置140はポータブルSSP装置99のオプショ
ンのコンポーネントである。DSP120に接続された
別々のチップもしくはモジュール、またはDSP130
の内部プログラム等の暗号化装置130は、DSP12
0によって前処理されたデータを予め設定された暗号鍵
で暗号化し、電話回線で信号の安全なやりとりを保証す
る。暗号鍵はユーザに依存するキー・コード等である。
圧縮装置140はポータブルSSP装置99のオプショ
ンのコンポーネントである。DSP120に接続された
別々のチップもしくはモジュール、またはDSP130
の内部プログラム等の暗号化装置130は、DSP12
0によって前処理されたデータを予め設定された暗号鍵
で暗号化し、電話回線で信号の安全なやりとりを保証す
る。暗号鍵はユーザに依存するキー・コード等である。
【0017】好適にはDSP120は既知の信号をAS
SRサーバ200による処理のためにフィーチャ・ベク
トルのストリームに追加する。この信号がASSRサー
バ200によって知られており予想されている場合は、
外部信号を簡単に抽出でき、サーバからクライアントへ
のプロセスの反転も簡単になる。例えば無線通信では、
信号の分散スペクトル変調が用いられる。他のこれまで
の暗号化法または暗号化アルゴリズムもこの暗号化/解
読プロセスに使用できる。例えばBruce Schenierによ
る"Applied Cryptography"、second edition、Wiley、1
996に述べられている暗号化アルゴリズムを参照された
い。
SRサーバ200による処理のためにフィーチャ・ベク
トルのストリームに追加する。この信号がASSRサー
バ200によって知られており予想されている場合は、
外部信号を簡単に抽出でき、サーバからクライアントへ
のプロセスの反転も簡単になる。例えば無線通信では、
信号の分散スペクトル変調が用いられる。他のこれまで
の暗号化法または暗号化アルゴリズムもこの暗号化/解
読プロセスに使用できる。例えばBruce Schenierによ
る"Applied Cryptography"、second edition、Wiley、1
996に述べられている暗号化アルゴリズムを参照された
い。
【0018】圧縮装置140はオプションであり、DS
P120の外部に置かれたコンポーネントまたはチップ
でよく、或いはDSP120の格納プログラム機能とし
て組み込むこともできる。圧縮装置140は前処理され
たデータを、暗号化されているかされていないかと無関
係に、電話回線を通して転送する前に圧縮し、電話回線
の帯域幅が小さい場合に転送されるオーディオ信号によ
り伝えられるデータの量を増やす。信号圧縮法は周知の
とおりである。圧縮装置140は好適にはロスなく圧縮
を行う。
P120の外部に置かれたコンポーネントまたはチップ
でよく、或いはDSP120の格納プログラム機能とし
て組み込むこともできる。圧縮装置140は前処理され
たデータを、暗号化されているかされていないかと無関
係に、電話回線を通して転送する前に圧縮し、電話回線
の帯域幅が小さい場合に転送されるオーディオ信号によ
り伝えられるデータの量を増やす。信号圧縮法は周知の
とおりである。圧縮装置140は好適にはロスなく圧縮
を行う。
【0019】マイク100からのデジタル化されたデー
タの前処理は、マイク100に向かって話された音声パ
ターンを表すフィーチャ・ベクトルのシーケンスを生成
するというこれまでの手法を含む。例えば米国特許番号
第5544277号はこのような前処理の手法を1つ説
明している。またDSP120は沈黙及びバックグラウ
ンド・ノイズのデータを処理して周囲データを作成し、
このデータを電話回線を通して処理のためASSRサー
バに転送する。ASSRサーバは、好適には中央に位置
し、任意の電話機またはネットワークのステーションか
ら簡単にアクセスできるように電話回線またはデジタル
・ネットワークに接続される。
タの前処理は、マイク100に向かって話された音声パ
ターンを表すフィーチャ・ベクトルのシーケンスを生成
するというこれまでの手法を含む。例えば米国特許番号
第5544277号はこのような前処理の手法を1つ説
明している。またDSP120は沈黙及びバックグラウ
ンド・ノイズのデータを処理して周囲データを作成し、
このデータを電話回線を通して処理のためASSRサー
バに転送する。ASSRサーバは、好適には中央に位置
し、任意の電話機またはネットワークのステーションか
ら簡単にアクセスできるように電話回線またはデジタル
・ネットワークに接続される。
【0020】DSP120は、本発明の他の好適な実施
例に従って、通信回線を通してASSRサーバから送ら
れるオーディオ・データのポータブルSSP装置99に
よる受信を調整する。ASSRサーバからのオーディオ
・データは、ユーザに更に情報や指示を求めるプロンプ
トを含む。この実施例で音響カプラ150は、電話機の
受話器の耳当てと係合するため音響カプラのトランスミ
ッタと同じように設定され大きさが決められたレシーバ
を含む。受信されたメッセージを伝えるために、耳当て
またはカプラにはもう1つのスピーカを接続できる。D
SP120は、オプションで、暗号化され圧縮されたデ
ータがASSRサーバから送られた場合は、受信された
データを圧縮解除し、また受信されたデータを解読でき
る格納プログラム機能を含む。音響カプラ150のレシ
ーバ部は、DSP120で処理するために、受話器の耳
当てからのオーディオ信号をデジタル信号に変換する。
例に従って、通信回線を通してASSRサーバから送ら
れるオーディオ・データのポータブルSSP装置99に
よる受信を調整する。ASSRサーバからのオーディオ
・データは、ユーザに更に情報や指示を求めるプロンプ
トを含む。この実施例で音響カプラ150は、電話機の
受話器の耳当てと係合するため音響カプラのトランスミ
ッタと同じように設定され大きさが決められたレシーバ
を含む。受信されたメッセージを伝えるために、耳当て
またはカプラにはもう1つのスピーカを接続できる。D
SP120は、オプションで、暗号化され圧縮されたデ
ータがASSRサーバから送られた場合は、受信された
データを圧縮解除し、また受信されたデータを解読でき
る格納プログラム機能を含む。音響カプラ150のレシ
ーバ部は、DSP120で処理するために、受話器の耳
当てからのオーディオ信号をデジタル信号に変換する。
【0021】図2に、本発明のポータブルSSP装置9
9を利用したシステムを示す。ASSRサーバ200
は、好適にはポータブルSSP装置99から遠い中央に
置かれ、電話回線を通して電話機からアクセスできる。
接続が確立されると、ASSRサーバ200とポータブ
ルSSP装置99、音声/話者認識装置との接続も確立
される。ASSRサーバ200はポータブルSSP装置
99と通信して、ユーザ側の沈黙及びバックグラウンド
・ノイズを読取ることによって、通信チャネルの伝達関
数を確立または予測する。通信チャネルの伝達関数の予
測法は周知のとおりである。例えばB.C.Kuoによる"Au
tomatic Control Systems"、Prentice Hall、1987及び
J.V.Candyによる"Signal Processing、the Modern Ap
proach"、McGraw Hill、1988を参照されたい。本発明に
従ったプロセス例を次に示す。DSP120は、転送ま
たは接続の初めに異なる信号を生成する。異なる信号
は、既知の特性の上昇音(ascending chirp)と下降音
(descending chirp)、等間隔の一連のサイン・トーン
(sign tone)、及びホワイト・ノイズ信号である。信
号間のオーダの期間と間隔は充分確立される。信号は入
力トーンがサーバ200からポータブル装置99によっ
て受信されるとすぐ生成される。これらの信号は2回生
成される。一度はDSP120から、一度はマイク10
0からである。サーバ200によって受信される音響信
号は既定の基準信号と比較され、チャネルとバックグラ
ウンドの伝達関数が推測され、チャネルのシグネチャが
作成される。このシグネチャは音声フィーチャ・ベクト
ルをデコンボルブ(deconvolve)するため用いられる。
ASSRサーバ200は、好適には音声または話者を認
識するためASSR格納プログラムを含む。例えば観測
された音響特性をそれらが対応する状態にある場合に観
測する可能性を記述し、最適経路での発音を認識するこ
とによって、lefemesを表す隠れマルコフ・モデル(H
MM)が用いられる。この可能性は、記述されたトレー
ニング・スピーチとHMMを整合させ、可能性を更新す
ることによって調整することができる。例えば米国特許
番号第5031217号及び第5276766号は、H
MM及び他のモデルを用いた音声認識法について述べて
いる。
9を利用したシステムを示す。ASSRサーバ200
は、好適にはポータブルSSP装置99から遠い中央に
置かれ、電話回線を通して電話機からアクセスできる。
接続が確立されると、ASSRサーバ200とポータブ
ルSSP装置99、音声/話者認識装置との接続も確立
される。ASSRサーバ200はポータブルSSP装置
99と通信して、ユーザ側の沈黙及びバックグラウンド
・ノイズを読取ることによって、通信チャネルの伝達関
数を確立または予測する。通信チャネルの伝達関数の予
測法は周知のとおりである。例えばB.C.Kuoによる"Au
tomatic Control Systems"、Prentice Hall、1987及び
J.V.Candyによる"Signal Processing、the Modern Ap
proach"、McGraw Hill、1988を参照されたい。本発明に
従ったプロセス例を次に示す。DSP120は、転送ま
たは接続の初めに異なる信号を生成する。異なる信号
は、既知の特性の上昇音(ascending chirp)と下降音
(descending chirp)、等間隔の一連のサイン・トーン
(sign tone)、及びホワイト・ノイズ信号である。信
号間のオーダの期間と間隔は充分確立される。信号は入
力トーンがサーバ200からポータブル装置99によっ
て受信されるとすぐ生成される。これらの信号は2回生
成される。一度はDSP120から、一度はマイク10
0からである。サーバ200によって受信される音響信
号は既定の基準信号と比較され、チャネルとバックグラ
ウンドの伝達関数が推測され、チャネルのシグネチャが
作成される。このシグネチャは音声フィーチャ・ベクト
ルをデコンボルブ(deconvolve)するため用いられる。
ASSRサーバ200は、好適には音声または話者を認
識するためASSR格納プログラムを含む。例えば観測
された音響特性をそれらが対応する状態にある場合に観
測する可能性を記述し、最適経路での発音を認識するこ
とによって、lefemesを表す隠れマルコフ・モデル(H
MM)が用いられる。この可能性は、記述されたトレー
ニング・スピーチとHMMを整合させ、可能性を更新す
ることによって調整することができる。例えば米国特許
番号第5031217号及び第5276766号は、H
MM及び他のモデルを用いた音声認識法について述べて
いる。
【0022】本発明の実施例に従ったASSRシステム
は、ユーザ側の沈黙及びバックグラウンド・ノイズの特
性を示す。ASSRシステムは好適には、先に述べたよ
うに、バックグラウンド・ノイズを接続の初め、ユーザ
が沈黙している間、またはDSP120から基準信号が
出される間にチェックする。バックグラウンド・ノイズ
はマイク100によって検出され、DSP120によっ
て処理されてから基準信号の第2部分の後に送られる。
ASSRサーバ200は、この情報からバックグラウン
ド・ノイズを推測し、受信済み入力ベクトルの処理に変
更を加える(例えばケプストラム平均減法(cepstral m
ean subtraction)、デコンボリューション等)。これ
に代えて、このような条件で調整された音声または話者
の認識のための格納モデルも使用できる。同様に沈黙期
間が検出され、単語間及びユーザが話す前の沈黙に関連
付けられた音響特性が、好適にはバックグラウンド・ノ
イズを予測するために用いられる。
は、ユーザ側の沈黙及びバックグラウンド・ノイズの特
性を示す。ASSRシステムは好適には、先に述べたよ
うに、バックグラウンド・ノイズを接続の初め、ユーザ
が沈黙している間、またはDSP120から基準信号が
出される間にチェックする。バックグラウンド・ノイズ
はマイク100によって検出され、DSP120によっ
て処理されてから基準信号の第2部分の後に送られる。
ASSRサーバ200は、この情報からバックグラウン
ド・ノイズを推測し、受信済み入力ベクトルの処理に変
更を加える(例えばケプストラム平均減法(cepstral m
ean subtraction)、デコンボリューション等)。これ
に代えて、このような条件で調整された音声または話者
の認識のための格納モデルも使用できる。同様に沈黙期
間が検出され、単語間及びユーザが話す前の沈黙に関連
付けられた音響特性が、好適にはバックグラウンド・ノ
イズを予測するために用いられる。
【0023】好都合なことは、本発明の実施例のASS
Rシステムが話者と音声の認識を実行することである。
話者認識は、ASSRサーバにリモートにアクセスする
ために利用できる。好適には本発明のASSRシステム
例は、通信されたデータをバックグラウンド・タスクと
してほぼ連続的に処理し、セッション全体で話者の存在
を確認する。
Rシステムが話者と音声の認識を実行することである。
話者認識は、ASSRサーバにリモートにアクセスする
ために利用できる。好適には本発明のASSRシステム
例は、通信されたデータをバックグラウンド・タスクと
してほぼ連続的に処理し、セッション全体で話者の存在
を確認する。
【0024】本発明に従ったASSRの装置とシステム
について、通信装置を電話、通信チャネルを電話回線、
ASSRサーバを電話回線に接続されたものとして示し
てきた。本発明では、通信チャネルはまた、インターネ
ット、イントラネット及びローカル・エリア・ネットワ
ーク等のデジタル通信チャネルでもあることを想定して
いる。ASSRサーバ200は従って、電話によってか
またはデジタル・ネットワークによってアクセスするこ
とができる。図3は、サーバ200とのインタフェース
をとるためにマルチメディア・パーソナル・コンピュー
タ160をもつポータブル装置99の用途を示す。この
実施例で受話器は、マイク及びスピーカを含むマルチメ
ディア・コンピュータ160に代わっている。音響カプ
ラ150のレシーバ部はコンピュータのスピーカから最
も近い位置に置かれ、音響カプラ150のトランスミッ
タ部はコンピュータのマイクから最も近い位置に置かれ
る。コンピュータ160は、電話回線を通してデータを
転送するためモデムを含むか、または内部サーバ300
を通してサーバ200に接続できる。内部サーバ300
はASSRサーバ200のようにASSR機能を含み、
コンピュータ160と内部サーバ300の間にASSR
システムまたはASSR接続を確立できる。この実施例
でマルチメディア・コンピュータはオーディオ通信装置
として機能する。
について、通信装置を電話、通信チャネルを電話回線、
ASSRサーバを電話回線に接続されたものとして示し
てきた。本発明では、通信チャネルはまた、インターネ
ット、イントラネット及びローカル・エリア・ネットワ
ーク等のデジタル通信チャネルでもあることを想定して
いる。ASSRサーバ200は従って、電話によってか
またはデジタル・ネットワークによってアクセスするこ
とができる。図3は、サーバ200とのインタフェース
をとるためにマルチメディア・パーソナル・コンピュー
タ160をもつポータブル装置99の用途を示す。この
実施例で受話器は、マイク及びスピーカを含むマルチメ
ディア・コンピュータ160に代わっている。音響カプ
ラ150のレシーバ部はコンピュータのスピーカから最
も近い位置に置かれ、音響カプラ150のトランスミッ
タ部はコンピュータのマイクから最も近い位置に置かれ
る。コンピュータ160は、電話回線を通してデータを
転送するためモデムを含むか、または内部サーバ300
を通してサーバ200に接続できる。内部サーバ300
はASSRサーバ200のようにASSR機能を含み、
コンピュータ160と内部サーバ300の間にASSR
システムまたはASSR接続を確立できる。この実施例
でマルチメディア・コンピュータはオーディオ通信装置
として機能する。
【0025】これに代えてポータブルSSP装置99は
コンピュータのI/Oポートとのコネクタを介してコン
ピュータに接続できる。この実施例で音響カプラ150
は使用せずに済ませることができる。DSP120から
のデータはコンピュータのプロセッサに直接送ることが
できるからである。マルチメディア・コンピュータ16
0は、本発明の他の実施例に従って、上に述べたポータ
ブルSSP装置99のコンポーネントを組み込んだポー
タブル・ラップトップ・マルチメディア・コンピュータ
等である。よってポータブル・マルチメディア・ラップ
トップ・コンピュータは、ポータブルSSP装置99に
よって実行される全ての機能を実行することができる。
ポータブル・ラップトップはモデムを通して、または内
部サーバ300を通して、例えばTCP/IP、Net
BEUI等のプロトコルによりASSRサーバ200に
直接接続できる。
コンピュータのI/Oポートとのコネクタを介してコン
ピュータに接続できる。この実施例で音響カプラ150
は使用せずに済ませることができる。DSP120から
のデータはコンピュータのプロセッサに直接送ることが
できるからである。マルチメディア・コンピュータ16
0は、本発明の他の実施例に従って、上に述べたポータ
ブルSSP装置99のコンポーネントを組み込んだポー
タブル・ラップトップ・マルチメディア・コンピュータ
等である。よってポータブル・マルチメディア・ラップ
トップ・コンピュータは、ポータブルSSP装置99に
よって実行される全ての機能を実行することができる。
ポータブル・ラップトップはモデムを通して、または内
部サーバ300を通して、例えばTCP/IP、Net
BEUI等のプロトコルによりASSRサーバ200に
直接接続できる。
【0026】ポータブルSSP装置99の機能とコンポ
ーネントは、本発明の他の実施例に従って、内蔵型セル
ラ・フォン(携帯電話)でもよい。従ってSSPセルラ
・フォンはDSP120を含み、ASSRサーバ200
との接続及びアクセスは、アナログまたはデジタル(例
えばCDMA、GSM等)であるセルラ通信チャネルに
よる。
ーネントは、本発明の他の実施例に従って、内蔵型セル
ラ・フォン(携帯電話)でもよい。従ってSSPセルラ
・フォンはDSP120を含み、ASSRサーバ200
との接続及びアクセスは、アナログまたはデジタル(例
えばCDMA、GSM等)であるセルラ通信チャネルに
よる。
【0027】好都合なことは、ASSRサーバ200か
らのデータを受信、解読または圧縮解除するポータブル
装置99の機能(前述)により、解読または認証の機能
を実行するために様々なデータを受信することができる
ことである。例えば、現在及び次の通信の間に受信さ
れ、受信された信号が暗号化される暗号鍵、鍵の有効期
間、鍵のPIN番号の有効期間等を確認するために受信
されるクッキー、先に受信され、期限切れになるまでユ
ーザを認証するために用いられるデジタル認証または認
証、ノイズのマスキングまたはアンマスキングのため受
信されるノイズ・パターン、スマートカードの組み込み
チップでまたはクレジット・カード型カードの磁気バン
ドに、PINの有効期限の特性を示すクッキーと共にエ
ンコードされるものの一部であるスマートカード用のP
IN番号またはコード等である。受信されたデータはD
SP200のメモリに格納できる。既知の手法によって
DSP120の読取り/書込み/再プログラムを行うた
めにポータブル装置200に接続されるインタフェース
を使用できる。
らのデータを受信、解読または圧縮解除するポータブル
装置99の機能(前述)により、解読または認証の機能
を実行するために様々なデータを受信することができる
ことである。例えば、現在及び次の通信の間に受信さ
れ、受信された信号が暗号化される暗号鍵、鍵の有効期
間、鍵のPIN番号の有効期間等を確認するために受信
されるクッキー、先に受信され、期限切れになるまでユ
ーザを認証するために用いられるデジタル認証または認
証、ノイズのマスキングまたはアンマスキングのため受
信されるノイズ・パターン、スマートカードの組み込み
チップでまたはクレジット・カード型カードの磁気バン
ドに、PINの有効期限の特性を示すクッキーと共にエ
ンコードされるものの一部であるスマートカード用のP
IN番号またはコード等である。受信されたデータはD
SP200のメモリに格納できる。既知の手法によって
DSP120の読取り/書込み/再プログラムを行うた
めにポータブル装置200に接続されるインタフェース
を使用できる。
【0028】よって本発明のデバイス例と方法は、加入
者またはクライアントのパスワード、ログオン、PI
N、或いはまた暗号化/解読鍵の認証、リセット、また
は取り消しに使用できる。このようなタスクは、スマー
トカードまたは磁気バンドを持つカード上でリモートに
実行できる。
者またはクライアントのパスワード、ログオン、PI
N、或いはまた暗号化/解読鍵の認証、リセット、また
は取り消しに使用できる。このようなタスクは、スマー
トカードまたは磁気バンドを持つカード上でリモートに
実行できる。
【0029】スマートカード認証/PINリセット装置
での本発明の実施例に従ったシステムの用途を図4に示
す。
での本発明の実施例に従ったシステムの用途を図4に示
す。
【0030】スマートカードの初期化:代表的なスマー
トカード・システムのスマートカードは、最初に機関の
認証と秘密/公開鍵のセットで初期化されることによっ
て、使用を目的としてアクティブにされる。登録サーバ
410側では、通常は管理者は新しいスマートカードを
管理者のスマートカードと共に挿入し、PIN番号を入
力して新しいユーザの登録を承認する。管理者は次にユ
ーザのスマートカードの初期化プログラムをアクティブ
にする。プログラムは通常、ユーザの秘密鍵及び公開鍵
のセット、ユーザの名前、シリアル番号、スマートカー
ド・シリアル番号等の認証用の情報をスマートカードに
スタンプする。
トカード・システムのスマートカードは、最初に機関の
認証と秘密/公開鍵のセットで初期化されることによっ
て、使用を目的としてアクティブにされる。登録サーバ
410側では、通常は管理者は新しいスマートカードを
管理者のスマートカードと共に挿入し、PIN番号を入
力して新しいユーザの登録を承認する。管理者は次にユ
ーザのスマートカードの初期化プログラムをアクティブ
にする。プログラムは通常、ユーザの秘密鍵及び公開鍵
のセット、ユーザの名前、シリアル番号、スマートカー
ド・シリアル番号等の認証用の情報をスマートカードに
スタンプする。
【0031】図3のワークステーション220と同等で
もよい登録サーバ410は、ユーザ・プロファイルを作
成し、リクエスト秘密/公開鍵及び認証を生成し、情報
をスマートカードにダウンロードする。登録サーバ41
0は次にユーザに識別のためにワークステーションのス
ピーカに向かって話すことを要求する。これらの音声メ
ッセージは話者認識サーバ420に送られる。サーバ4
20は図1乃至図3のASSRサーバ200と同一であ
る。音声メッセージ、認証及び一意のスマートカード・
シリアル番号は、将来の認証及び他の用途のためにAS
SRサーバ200に関連付けられるたデータベース、ま
たはASSRサーバ200内のデータベースに保存され
る。
もよい登録サーバ410は、ユーザ・プロファイルを作
成し、リクエスト秘密/公開鍵及び認証を生成し、情報
をスマートカードにダウンロードする。登録サーバ41
0は次にユーザに識別のためにワークステーションのス
ピーカに向かって話すことを要求する。これらの音声メ
ッセージは話者認識サーバ420に送られる。サーバ4
20は図1乃至図3のASSRサーバ200と同一であ
る。音声メッセージ、認証及び一意のスマートカード・
シリアル番号は、将来の認証及び他の用途のためにAS
SRサーバ200に関連付けられるたデータベース、ま
たはASSRサーバ200内のデータベースに保存され
る。
【0032】或いはまた認証が発行され、カスタマ・プ
ロファイルが作成されてから、登録サーバ410は登録
データを保管のため保管サーバ(vault server)430
及びディレクトリ・サーバ440にアップロードする。
登録データはまたワークステーション450及びスマー
トカード・リーダ460にダウンロードすることもでき
る。ワークステーション450はポータブルSSP99
のコンポーネントと機能を含むか、またはポータブルS
SP99をワークステーション450に接続して話者認
識サーバ420との話者/音声情報の通信を促進するこ
とができる。各機関に各スマートカードのために生成さ
れるRSAキー・ペアがある。秘密鍵は、後でPINを
リセットするときのためにカードに焼き込まれる。スマ
ートカードは、将来使用するために内部(焼き込み)、
外部(カードへの印刷)の両方とも、一意のシリアル番
号で初期化される。
ロファイルが作成されてから、登録サーバ410は登録
データを保管のため保管サーバ(vault server)430
及びディレクトリ・サーバ440にアップロードする。
登録データはまたワークステーション450及びスマー
トカード・リーダ460にダウンロードすることもでき
る。ワークステーション450はポータブルSSP99
のコンポーネントと機能を含むか、またはポータブルS
SP99をワークステーション450に接続して話者認
識サーバ420との話者/音声情報の通信を促進するこ
とができる。各機関に各スマートカードのために生成さ
れるRSAキー・ペアがある。秘密鍵は、後でPINを
リセットするときのためにカードに焼き込まれる。スマ
ートカードは、将来使用するために内部(焼き込み)、
外部(カードへの印刷)の両方とも、一意のシリアル番
号で初期化される。
【0033】上に述べたインストールまたは初期化の場
合、ユーザがPINを忘れるか、PINが期限切れでリ
セットされていない場合は、PCまたはハンドヘルド・
ポータブルSSP装置99とスマートカード・リーダ4
60(スマートカードの代わりに磁気バンド・カードが
用いられる場合は磁気ライタ)によりASSRサーバ2
00とリンクしてPINリセットを要求することによっ
て、次のようにして、PINをリモートにリセットまた
は再設定することができる。
合、ユーザがPINを忘れるか、PINが期限切れでリ
セットされていない場合は、PCまたはハンドヘルド・
ポータブルSSP装置99とスマートカード・リーダ4
60(スマートカードの代わりに磁気バンド・カードが
用いられる場合は磁気ライタ)によりASSRサーバ2
00とリンクしてPINリセットを要求することによっ
て、次のようにして、PINをリモートにリセットまた
は再設定することができる。
【0034】PCの場合、ユーザはASSRサーバ20
0との接続を(SSL V2等を通して)確立してスマ
ートカードのPINの変更を要求する。ダイアログ・ボ
ックスまたは音声プロンプトがユーザに提示され、ユー
ザのID、名前、スマートカード・シリアル番号等の入
力が求められる。ASSRサーバ200は、入力された
情報をもとに格納された認証とユーザ・プロファイルに
アクセスする。ASSRサーバ200は次にユーザに、
認証のためプリセットされた音声メッセージでPCのス
ピーカに向かって話すことを求める。
0との接続を(SSL V2等を通して)確立してスマ
ートカードのPINの変更を要求する。ダイアログ・ボ
ックスまたは音声プロンプトがユーザに提示され、ユー
ザのID、名前、スマートカード・シリアル番号等の入
力が求められる。ASSRサーバ200は、入力された
情報をもとに格納された認証とユーザ・プロファイルに
アクセスする。ASSRサーバ200は次にユーザに、
認証のためプリセットされた音声メッセージでPCのス
ピーカに向かって話すことを求める。
【0035】アクセスされたユーザ・プロファイルとデ
ータベースからの音声セグメントは、認証のためのユー
ザからの入力メッセージと比較される。ユーザには、確
認プログラムへの入力を訂正するためにいくつか機会を
与えることができる。確認に問題がなく、ユーザが現在
の有効なユーザならASSRサーバ200はスマートカ
ード認証及び公開鍵を使用してPINリセット・コマン
ドを暗号化し、ユーザのPC及び関連するスマートカー
ド・リーダに送る。ユーザのスマートカードはそこで自
体の固有の秘密鍵を使用してRESET PINコマンドを解読
する。
ータベースからの音声セグメントは、認証のためのユー
ザからの入力メッセージと比較される。ユーザには、確
認プログラムへの入力を訂正するためにいくつか機会を
与えることができる。確認に問題がなく、ユーザが現在
の有効なユーザならASSRサーバ200はスマートカ
ード認証及び公開鍵を使用してPINリセット・コマン
ドを暗号化し、ユーザのPC及び関連するスマートカー
ド・リーダに送る。ユーザのスマートカードはそこで自
体の固有の秘密鍵を使用してRESET PINコマンドを解読
する。
【0036】スマートカードの秘密鍵でRESET PINコマ
ンドを問題なく暗号化できた場合、スマートカードはそ
こで活動化される。スマートカードには、スマートカー
ドの焼き込まれた固有のシリアル番号をASSRサーバ
200によって与えられた番号と比較するための回路を
加えることができる。それらが同じなら、スマートカー
ドはPIN RESET操作のため自体をアンロックする。
ンドを問題なく暗号化できた場合、スマートカードはそ
こで活動化される。スマートカードには、スマートカー
ドの焼き込まれた固有のシリアル番号をASSRサーバ
200によって与えられた番号と比較するための回路を
加えることができる。それらが同じなら、スマートカー
ドはPIN RESET操作のため自体をアンロックする。
【0037】スマートカードが活動化されPINがリセ
ットされると、ユーザは新しいPINをスマートカード
に入力することができる。スマートカードは、任意の安
全なトランザクションを目的にして利用できる。
ットされると、ユーザは新しいPINをスマートカード
に入力することができる。スマートカードは、任意の安
全なトランザクションを目的にして利用できる。
【0038】電話によるPIN RESET:PCスピーカが利
用できない場合でも、電話でASSRサーバ200を呼
び出してスマートカードのPINリセットを行える。同
じ話者認証手順により、サーバに、後に使用するために
電子エンベロープで暗号化されたPIN RESETコマンドを
作成することを指示することができる。
用できない場合でも、電話でASSRサーバ200を呼
び出してスマートカードのPINリセットを行える。同
じ話者認証手順により、サーバに、後に使用するために
電子エンベロープで暗号化されたPIN RESETコマンドを
作成することを指示することができる。
【0039】このPC及びスマートカード・リーダによ
り、ユーザは、ASSRサーバ200を通してスマート
カード管理サーバとのSSL(Secure Socket Layer)
セッションを確立し(ホスト認証だけで)、PINリセ
ットを要求する。次にASSRサーバ200は、暗号化
されたエンベロープをPCのスマートカード・リーダに
送る。スマートカードが電子エンベロープを受け取る
と、スマートカードの秘密鍵により、エンベロープ内側
のコマンドが解読される。正しい秘密鍵を持つスマート
カードだけがPIN RESETコマンドを解読できる。スマー
トカードはまた、一意のスマートカード・シリアル番号
をスマートカード管理サーバにより与えられた番号と比
較する。データが一致すると、スマートカードは後のPI
N INIT及びSETのためにリセットされる。
り、ユーザは、ASSRサーバ200を通してスマート
カード管理サーバとのSSL(Secure Socket Layer)
セッションを確立し(ホスト認証だけで)、PINリセ
ットを要求する。次にASSRサーバ200は、暗号化
されたエンベロープをPCのスマートカード・リーダに
送る。スマートカードが電子エンベロープを受け取る
と、スマートカードの秘密鍵により、エンベロープ内側
のコマンドが解読される。正しい秘密鍵を持つスマート
カードだけがPIN RESETコマンドを解読できる。スマー
トカードはまた、一意のスマートカード・シリアル番号
をスマートカード管理サーバにより与えられた番号と比
較する。データが一致すると、スマートカードは後のPI
N INIT及びSETのためにリセットされる。
【0040】スマートカードのリモート無効化:スマー
トカードが失われるか盗まれた場合、ユーザはできるだ
け早くスマートカードを無効にする必要がある。その場
合、電話でASSRサーバ200を通してスマートカー
ド管理サーバに接続し、スマートカードを同じ認証手順
で無効化することができる。
トカードが失われるか盗まれた場合、ユーザはできるだ
け早くスマートカードを無効にする必要がある。その場
合、電話でASSRサーバ200を通してスマートカー
ド管理サーバに接続し、スマートカードを同じ認証手順
で無効化することができる。
【0041】上に示した、本発明の実施例に従ったシス
テム用途は、音声で確認するネットワークのアクセス・
ログオンまたはパスワードにもあてはまる。
テム用途は、音声で確認するネットワークのアクセス・
ログオンまたはパスワードにもあてはまる。
【0042】ネットワーク・ユーザは初期化プロセスを
実行し、ASSRサーバ・データベースへの記録のため
にプリセットされた1組の話者メッセージを記録する。
ASSRサーバ200は、管理サーバとして、スマート
カード・ユーザ認証について述べたように、話者認証プ
ロセスを用い、ログオンID及びパスワードの全ての管
理タスクを実行することができる。
実行し、ASSRサーバ・データベースへの記録のため
にプリセットされた1組の話者メッセージを記録する。
ASSRサーバ200は、管理サーバとして、スマート
カード・ユーザ認証について述べたように、話者認証プ
ロセスを用い、ログオンID及びパスワードの全ての管
理タスクを実行することができる。
【0043】スマートカードPINリセット・プロセス
と同様に、ユーザがログオン・パスワードを忘れた場合
またはパスワードが期限切れの場合、ユーザはASSR
サーバ200を通した認証により変更または再有効化を
要求し、新しいパスワードまたは再有効化(reactivati
on)をユーザ側にダウンロードできる。他の用途には、
電子マネー・カードまたはウォレット・カード(wallet
card)との対話がある。ここではICチップに、カー
ドに残っている金額に関する情報が含まれる。商品を購
入するためにカードが使われたときには金額が少なくな
る。本発明の実施例に従ったシステムは、上に述べたス
マートカード再有効化プロセスと同様の手順によりマネ
ー・カードをリフィル(refill)するために使用でき
る。
と同様に、ユーザがログオン・パスワードを忘れた場合
またはパスワードが期限切れの場合、ユーザはASSR
サーバ200を通した認証により変更または再有効化を
要求し、新しいパスワードまたは再有効化(reactivati
on)をユーザ側にダウンロードできる。他の用途には、
電子マネー・カードまたはウォレット・カード(wallet
card)との対話がある。ここではICチップに、カー
ドに残っている金額に関する情報が含まれる。商品を購
入するためにカードが使われたときには金額が少なくな
る。本発明の実施例に従ったシステムは、上に述べたス
マートカード再有効化プロセスと同様の手順によりマネ
ー・カードをリフィル(refill)するために使用でき
る。
【0044】まとめとして、本発明の構成に関して以下
の事項を開示する。
の事項を開示する。
【0045】(1)音声、沈黙、バックグラウンド・ノ
イズの各信号を含むサウンドをアナログ信号に変換する
マイクと、アナログ信号をデジタル信号に変換するアナ
ログ信号/デジタル・コンバータと、前記デジタル信号
から前記音声を表すフィーチャ・ベクトル・データを生
成するデジタル信号プロセッサ(DSP)と、前記フィ
ーチャ・ベクトル・データを音響信号に変換し、遠隔地
で前記音声を認識するために、前記音響信号を通信チャ
ネルを通して通信するために音響通信装置に接続する音
響カプラと、を含む、ポータブル音声認識装置。 (2)前記フィーチャ・ベクトル・データを暗号化する
暗号化装置を含む、前記(1)記載の装置。 (3)前記フィーチャ・ベクトル・データを圧縮するデ
ータ圧縮装置を含む、前記(1)記載の装置。 (4)前記音響カプラは、前記遠隔地からの前記通信チ
ャネルを通した戻り信号を受信し、前記戻り信号を前記
デジタル信号プロセッサによる処理のためにデジタル戻
りデータに変換する手段を含む、前記(1)記載の装
置。 (5)前記デジタル信号プロセッサは、前記デジタル戻
りデータを圧縮解除する手段を含む、前記(4)記載の
装置。 (6)前記デジタル信号プロセッサは、前記デジタル戻
りデータを解読する手段を含む、前記(4)記載の装
置。 (7)前記通信チャネルの伝達関数を予測する手段を含
む、前記(1)記載の装置。 (8)前記デジタル信号プロセッサは、前記遠隔地にて
前記チャネルに接続されたサーバからデータを受信し処
理する手段を含む、前記(1)記載の装置。 (9)前記デジタル信号プロセッサは、前記装置に固有
のキー・データを含むデータを格納するメモリを含む、
前記(1)記載の装置。 (10)前記装置を囲む沈黙とバックグラウンド・ノイ
ズに関連した通信チャネル特性を把握する手段を含む、
前記(1)記載の装置。 (11)デジタル信号プロセッサ(DSP)に向かって
話されたデジタル化された音声を処理し、前記音声を表
すフィーチャ・ベクトル・データを生成する前記デジタ
ル信号プロセッサと、前記フィーチャ・ベクトル・デー
タを表す信号を通信チャネルを通して通信するために通
信装置に接続するカプラと、を含む、ポータブル音声信
号プリプロセッサ(SSP)と、前記通信チャネルを介
して前記ポータブル音声信号プリプロセッサから転送さ
れた前記フィーチャ・ベクトル・データを表す前記信号
を受信し、前記音声または話者を認識するために前記信
号を処理するために、前記通信チャネルとリモートに接
続された自動音声/話者認識(ASSR)サーバと、を
含む、音声認識システム。 (12)前記自動音声/話者認識サーバは、前記ポータ
ブル音声信号プリプロセッサから受信された前記信号を
処理し、処理された信号を認証データの前記格納モデル
と比較することによって有効な加入者を認証する認証デ
ータ格納モデルを含む、前記(11)記載のシステム。 (13)前記自動音声/話者認識サーバは、前記ポータ
ブル音声信号プリプロセッサから受信された前記信号を
処理し、処理された信号をデータベースと比較すること
によって音声を認識するためのボキャブラリの前記デー
タベースを含む、前記(11)記載のシステム。 (14)前記自動音声/話者認識サーバは、前記ポータ
ブル音声信号プリプロセッサから受信された前記信号を
処理することによってユーザのパスワードを認証する、
前記(11)記載のシステム。 (15)前記自動音声/話者認識サーバは、前記ポータ
ブル音声信号プリプロセッサから受信された前記信号を
処理することによって呼び出し側を識別し、前記信号
は、前記呼び出し側によって前記ポータブル音声信号プ
リプロセッサに話された音声から発する、前記(11)
記載のシステム。 (16)前記ポータブル音声信号プリプロセッサは、前
記自動音声/話者認識サーバから戻り信号を受信し処理
する手段を含む、前記(11)記載のシステム。 (17)前記戻り信号は変更された認証データ及びプロ
ンプトの1つを含む、前記(16)記載のシステム。 (18)前記ポータブル音声信号プリプロセッサは、前
記自動音声/話者認識サーバから受信されたデータを含
むデータを格納する関連メモリを含む、前記(11)記
載のシステム。 (19)前記通信チャネルを通した前記ポータブル音声
信号プリプロセッサと前記自動音声/話者認識サーバの
間の接続の伝達関数を予測する手段を含む、前記(1
1)記載のシステム。 (20)前記カプラは、前記フィーチャ・ベクトル・デ
ータを音響信号に変換する音響カプラであり、前記通信
チャネルは音響通信チャネルである、前記(11)記載
のシステム。 (21)前記ポータブル音声信号プリプロセッサと前記
自動音声/話者認識サーバは、通信セッション全体で話
者認識を定期的に実行する手段を含む、前記(11)記
載のシステム。 (22)クライアント/サーバ・システムの有効なクラ
イアントを音声により認証する方法であって、登録デー
タの複数のモデルを自動音声認識(ASSR)サーバの
メモリに格納するステップと、通信チャネルを通して前
記自動音声認識サーバから遠く離れて配置されたポータ
ブル音声信号前処理(SSP)装置から前記自動音声認
識サーバに接続するステップと、前記登録データを前記
ポータブル音声信号前処理装置に話すステップと、前記
ポータブル音声信号前処理装置の前記登録データを前処
理してフィーチャ・ベクトルを作成するステップと、前
記フィーチャ・ベクトルを表す信号を前記通信チャネル
を通して前記自動音声認識サーバにより受信するステッ
プと、前記自動音声認識サーバから受信された前記信号
を処理し、処理された信号を前記有効なクライアントを
認証するために前記格納モデルと比較するステップと、
を含む、方法。 (23)変更されたパスワード・データを前記自動音声
認識サーバから前記ポータブル音声信号前処理装置に転
送することによってユーザ・パスワードを変更するステ
ップを含む、前記(22)記載の方法。 (24)変更されたスマートカード・データを前記自動
音声認識サーバから前記ポータブル音声信号前処理装置
に転送することによってスマートカードのPINを変更
するステップを含む、前記(22)記載の方法。 (25)前記変更されたスマートカード・データは前記
自動音声認識サーバによって暗号化され、前記ポータブ
ル音声信号前処理装置は前記スマートカードのPINを
変更するために前記変更されたスマートカード・データ
を解読する、前記(24)記載の方法。 (26)変更されたPINデータを前記自動音声認識サ
ーバから磁気カード・ライタと前記ポータブル音声信号
前処理装置に転送することによって磁気カードのPIN
を変更するステップを含む、前記(22)記載の方法。
イズの各信号を含むサウンドをアナログ信号に変換する
マイクと、アナログ信号をデジタル信号に変換するアナ
ログ信号/デジタル・コンバータと、前記デジタル信号
から前記音声を表すフィーチャ・ベクトル・データを生
成するデジタル信号プロセッサ(DSP)と、前記フィ
ーチャ・ベクトル・データを音響信号に変換し、遠隔地
で前記音声を認識するために、前記音響信号を通信チャ
ネルを通して通信するために音響通信装置に接続する音
響カプラと、を含む、ポータブル音声認識装置。 (2)前記フィーチャ・ベクトル・データを暗号化する
暗号化装置を含む、前記(1)記載の装置。 (3)前記フィーチャ・ベクトル・データを圧縮するデ
ータ圧縮装置を含む、前記(1)記載の装置。 (4)前記音響カプラは、前記遠隔地からの前記通信チ
ャネルを通した戻り信号を受信し、前記戻り信号を前記
デジタル信号プロセッサによる処理のためにデジタル戻
りデータに変換する手段を含む、前記(1)記載の装
置。 (5)前記デジタル信号プロセッサは、前記デジタル戻
りデータを圧縮解除する手段を含む、前記(4)記載の
装置。 (6)前記デジタル信号プロセッサは、前記デジタル戻
りデータを解読する手段を含む、前記(4)記載の装
置。 (7)前記通信チャネルの伝達関数を予測する手段を含
む、前記(1)記載の装置。 (8)前記デジタル信号プロセッサは、前記遠隔地にて
前記チャネルに接続されたサーバからデータを受信し処
理する手段を含む、前記(1)記載の装置。 (9)前記デジタル信号プロセッサは、前記装置に固有
のキー・データを含むデータを格納するメモリを含む、
前記(1)記載の装置。 (10)前記装置を囲む沈黙とバックグラウンド・ノイ
ズに関連した通信チャネル特性を把握する手段を含む、
前記(1)記載の装置。 (11)デジタル信号プロセッサ(DSP)に向かって
話されたデジタル化された音声を処理し、前記音声を表
すフィーチャ・ベクトル・データを生成する前記デジタ
ル信号プロセッサと、前記フィーチャ・ベクトル・デー
タを表す信号を通信チャネルを通して通信するために通
信装置に接続するカプラと、を含む、ポータブル音声信
号プリプロセッサ(SSP)と、前記通信チャネルを介
して前記ポータブル音声信号プリプロセッサから転送さ
れた前記フィーチャ・ベクトル・データを表す前記信号
を受信し、前記音声または話者を認識するために前記信
号を処理するために、前記通信チャネルとリモートに接
続された自動音声/話者認識(ASSR)サーバと、を
含む、音声認識システム。 (12)前記自動音声/話者認識サーバは、前記ポータ
ブル音声信号プリプロセッサから受信された前記信号を
処理し、処理された信号を認証データの前記格納モデル
と比較することによって有効な加入者を認証する認証デ
ータ格納モデルを含む、前記(11)記載のシステム。 (13)前記自動音声/話者認識サーバは、前記ポータ
ブル音声信号プリプロセッサから受信された前記信号を
処理し、処理された信号をデータベースと比較すること
によって音声を認識するためのボキャブラリの前記デー
タベースを含む、前記(11)記載のシステム。 (14)前記自動音声/話者認識サーバは、前記ポータ
ブル音声信号プリプロセッサから受信された前記信号を
処理することによってユーザのパスワードを認証する、
前記(11)記載のシステム。 (15)前記自動音声/話者認識サーバは、前記ポータ
ブル音声信号プリプロセッサから受信された前記信号を
処理することによって呼び出し側を識別し、前記信号
は、前記呼び出し側によって前記ポータブル音声信号プ
リプロセッサに話された音声から発する、前記(11)
記載のシステム。 (16)前記ポータブル音声信号プリプロセッサは、前
記自動音声/話者認識サーバから戻り信号を受信し処理
する手段を含む、前記(11)記載のシステム。 (17)前記戻り信号は変更された認証データ及びプロ
ンプトの1つを含む、前記(16)記載のシステム。 (18)前記ポータブル音声信号プリプロセッサは、前
記自動音声/話者認識サーバから受信されたデータを含
むデータを格納する関連メモリを含む、前記(11)記
載のシステム。 (19)前記通信チャネルを通した前記ポータブル音声
信号プリプロセッサと前記自動音声/話者認識サーバの
間の接続の伝達関数を予測する手段を含む、前記(1
1)記載のシステム。 (20)前記カプラは、前記フィーチャ・ベクトル・デ
ータを音響信号に変換する音響カプラであり、前記通信
チャネルは音響通信チャネルである、前記(11)記載
のシステム。 (21)前記ポータブル音声信号プリプロセッサと前記
自動音声/話者認識サーバは、通信セッション全体で話
者認識を定期的に実行する手段を含む、前記(11)記
載のシステム。 (22)クライアント/サーバ・システムの有効なクラ
イアントを音声により認証する方法であって、登録デー
タの複数のモデルを自動音声認識(ASSR)サーバの
メモリに格納するステップと、通信チャネルを通して前
記自動音声認識サーバから遠く離れて配置されたポータ
ブル音声信号前処理(SSP)装置から前記自動音声認
識サーバに接続するステップと、前記登録データを前記
ポータブル音声信号前処理装置に話すステップと、前記
ポータブル音声信号前処理装置の前記登録データを前処
理してフィーチャ・ベクトルを作成するステップと、前
記フィーチャ・ベクトルを表す信号を前記通信チャネル
を通して前記自動音声認識サーバにより受信するステッ
プと、前記自動音声認識サーバから受信された前記信号
を処理し、処理された信号を前記有効なクライアントを
認証するために前記格納モデルと比較するステップと、
を含む、方法。 (23)変更されたパスワード・データを前記自動音声
認識サーバから前記ポータブル音声信号前処理装置に転
送することによってユーザ・パスワードを変更するステ
ップを含む、前記(22)記載の方法。 (24)変更されたスマートカード・データを前記自動
音声認識サーバから前記ポータブル音声信号前処理装置
に転送することによってスマートカードのPINを変更
するステップを含む、前記(22)記載の方法。 (25)前記変更されたスマートカード・データは前記
自動音声認識サーバによって暗号化され、前記ポータブ
ル音声信号前処理装置は前記スマートカードのPINを
変更するために前記変更されたスマートカード・データ
を解読する、前記(24)記載の方法。 (26)変更されたPINデータを前記自動音声認識サ
ーバから磁気カード・ライタと前記ポータブル音声信号
前処理装置に転送することによって磁気カードのPIN
を変更するステップを含む、前記(22)記載の方法。
【図1】本発明の好適な実施例に従ったポータブル音声
認識装置を示す図である。
認識装置を示す図である。
【図2】本発明の好適な実施例に従った図1の装置を持
つシステムのブロック図である。
つシステムのブロック図である。
【図3】本発明の好適な実施例に従った図1のポータブ
ル装置を持つ他のシステムのブロック図である。
ル装置を持つ他のシステムのブロック図である。
【図4】本発明の好適な実施例に従ったスマートカード
PIN認証/リセット・システムの用法を示す図であ
る。
PIN認証/リセット・システムの用法を示す図であ
る。
99 ポータブル音声信号前処理(SSP)装置 100 マイク 110 アナログ・デジタル・コンバータ 120 デジタル信号プロセッサ(PSP) 130 暗号化装置 140 圧縮装置 150 音響カプラ 160 マルチメディア・パーソナル・コンピュータ 200 サーバ 220 ワークステーション 420 話者認識サーバ 430 保管サーバ 440 ディレクトリ・サーバ 460 スマートカード・リーダ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI // H04M 3/42 H04M 3/42 P (72)発明者 ステファン・ハーマン・メイス アメリカ合衆国06811、コネチカット州ダ ンバリー、シェルター・ロック・ロード 157−25 (72)発明者 ピーター・エス・プーン アメリカ合衆国10589、ニューヨーク州ソ マーズ、サミット・サークル 10 (72)発明者 カール・プロチロ アメリカ合衆国12498、ニューヨーク州ウ ッドストック、パーク・ドライブ 34
Claims (26)
- 【請求項1】音声、沈黙、バックグラウンド・ノイズの
各信号を含むサウンドをアナログ信号に変換するマイク
と、 アナログ信号をデジタル信号に変換するアナログ信号/
デジタル・コンバータと、 前記デジタル信号から前記音声を表すフィーチャ・ベク
トル・データを生成するデジタル信号プロセッサ(DS
P)と、 前記フィーチャ・ベクトル・データを音響信号に変換
し、遠隔地で前記音声を認識するために、前記音響信号
を通信チャネルを通して通信するために音響通信装置に
接続する音響カプラと、 を含む、ポータブル音声認識装置。 - 【請求項2】前記フィーチャ・ベクトル・データを暗号
化する暗号化装置を含む、請求項1記載の装置。 - 【請求項3】前記フィーチャ・ベクトル・データを圧縮
するデータ圧縮装置を含む、請求項1記載の装置。 - 【請求項4】前記音響カプラは、前記遠隔地からの前記
通信チャネルを通した戻り信号を受信し、前記戻り信号
を前記デジタル信号プロセッサによる処理のためにデジ
タル戻りデータに変換する手段を含む、請求項1記載の
装置。 - 【請求項5】前記デジタル信号プロセッサは、前記デジ
タル戻りデータを圧縮解除する手段を含む、請求項4記
載の装置。 - 【請求項6】前記デジタル信号プロセッサは、前記デジ
タル戻りデータを解読する手段を含む、請求項4記載の
装置。 - 【請求項7】前記通信チャネルの伝達関数を予測する手
段を含む、請求項1記載の装置。 - 【請求項8】前記デジタル信号プロセッサは、前記遠隔
地にて前記チャネルに接続されたサーバからデータを受
信し処理する手段を含む、請求項1記載の装置。 - 【請求項9】前記デジタル信号プロセッサは、前記装置
に固有のキー・データを含むデータを格納するメモリを
含む、請求項1記載の装置。 - 【請求項10】前記装置を囲む沈黙とバックグラウンド
・ノイズに関連した通信チャネル特性を把握する手段を
含む、請求項1記載の装置。 - 【請求項11】デジタル信号プロセッサ(DSP)に向
かって話されたデジタル化された音声を処理し、前記音
声を表すフィーチャ・ベクトル・データを生成する前記
デジタル信号プロセッサと、 前記フィーチャ・ベクトル・データを表す信号を通信チ
ャネルを通して通信するために通信装置に接続するカプ
ラと、 を含む、ポータブル音声信号プリプロセッサ(SSP)
と、 前記通信チャネルを介して前記ポータブル音声信号プリ
プロセッサから転送された前記フィーチャ・ベクトル・
データを表す前記信号を受信し、前記音声または話者を
認識するために前記信号を処理するために、前記通信チ
ャネルとリモートに接続された自動音声/話者認識(A
SSR)サーバと、 を含む、音声認識システム。 - 【請求項12】前記自動音声/話者認識サーバは、前記
ポータブル音声信号プリプロセッサから受信された前記
信号を処理し、処理された信号を認証データの前記格納
モデルと比較することによって有効な加入者を認証する
認証データ格納モデルを含む、請求項11記載のシステ
ム。 - 【請求項13】前記自動音声/話者認識サーバは、前記
ポータブル音声信号プリプロセッサから受信された前記
信号を処理し、処理された信号をデータベースと比較す
ることによって音声を認識するためのボキャブラリの前
記データベースを含む、請求項11記載のシステム。 - 【請求項14】前記自動音声/話者認識サーバは、前記
ポータブル音声信号プリプロセッサから受信された前記
信号を処理することによってユーザのパスワードを認証
する、請求項11記載のシステム。 - 【請求項15】前記自動音声/話者認識サーバは、前記
ポータブル音声信号プリプロセッサから受信された前記
信号を処理することによって呼び出し側を識別し、前記
信号は、前記呼び出し側によって前記ポータブル音声信
号プリプロセッサに話された音声から発する、請求項1
1記載のシステム。 - 【請求項16】前記ポータブル音声信号プリプロセッサ
は、前記自動音声/話者認識サーバから戻り信号を受信
し処理する手段を含む、請求項11記載のシステム。 - 【請求項17】前記戻り信号は変更された認証データ及
びプロンプトの1つを含む、請求項16記載のシステ
ム。 - 【請求項18】前記ポータブル音声信号プリプロセッサ
は、前記自動音声/話者認識サーバから受信されたデー
タを含むデータを格納する関連メモリを含む、請求項1
1記載のシステム。 - 【請求項19】前記通信チャネルを通した前記ポータブ
ル音声信号プリプロセッサと前記自動音声/話者認識サ
ーバの間の接続の伝達関数を予測する手段を含む、請求
項11記載のシステム。 - 【請求項20】前記カプラは、前記フィーチャ・ベクト
ル・データを音響信号に変換する音響カプラであり、前
記通信チャネルは音響通信チャネルである、請求項11
記載のシステム。 - 【請求項21】前記ポータブル音声信号プリプロセッサ
と前記自動音声/話者認識サーバは、通信セッション全
体で話者認識を定期的に実行する手段を含む、請求項1
1記載のシステム。 - 【請求項22】クライアント/サーバ・システムの有効
なクライアントを音声により認証する方法であって、 登録データの複数のモデルを自動音声認識(ASSR)
サーバのメモリに格納するステップと、 通信チャネルを通して前記自動音声認識サーバから遠く
離れて配置されたポータブル音声信号前処理(SSP)
装置から前記自動音声認識サーバに接続するステップ
と、 前記登録データを前記ポータブル音声信号前処理装置に
話すステップと、 前記ポータブル音声信号前処理装置の前記登録データを
前処理してフィーチャ・ベクトルを作成するステップ
と、 前記フィーチャ・ベクトルを表す信号を前記通信チャネ
ルを通して前記自動音声認識サーバにより受信するステ
ップと、 前記自動音声認識サーバから受信された前記信号を処理
し、処理された信号を前記有効なクライアントを認証す
るために前記格納モデルと比較するステップと、 を含む、方法。 - 【請求項23】変更されたパスワード・データを前記自
動音声認識サーバから前記ポータブル音声信号前処理装
置に転送することによってユーザ・パスワードを変更す
るステップを含む、請求項22記載の方法。 - 【請求項24】変更されたスマートカード・データを前
記自動音声認識サーバから前記ポータブル音声信号前処
理装置に転送することによってスマートカードのPIN
を変更するステップを含む、請求項22記載の方法。 - 【請求項25】前記変更されたスマートカード・データ
は前記自動音声認識サーバによって暗号化され、前記ポ
ータブル音声信号前処理装置は前記スマートカードのP
INを変更するために前記変更されたスマートカード・
データを解読する、請求項24記載の方法。 - 【請求項26】変更されたPINデータを前記自動音声
認識サーバから磁気カード・ライタと前記ポータブル音
声信号前処理装置に転送することによって磁気カードの
PINを変更するステップを含む、請求項22記載の方
法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/873,079 US5953700A (en) | 1997-06-11 | 1997-06-11 | Portable acoustic interface for remote access to automatic speech/speaker recognition server |
US08/873079 | 1997-06-11 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1138992A true JPH1138992A (ja) | 1999-02-12 |
Family
ID=25360941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10152923A Pending JPH1138992A (ja) | 1997-06-11 | 1998-06-02 | 自動音声/話者認識サーバへのリモート・アクセス用ポータブル音響インタフェース装置、システム及び方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US5953700A (ja) |
JP (1) | JPH1138992A (ja) |
KR (1) | KR100276846B1 (ja) |
CN (1) | CN1190774C (ja) |
TW (1) | TW394894B (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003501701A (ja) * | 1999-06-07 | 2003-01-14 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 重み付けされたスペクトル距離の計算機 |
JP2003526138A (ja) * | 1999-06-25 | 2003-09-02 | ヤコブス リンメル リミテッド | 自動化された接続サービスシステム |
US7050974B1 (en) | 1999-09-14 | 2006-05-23 | Canon Kabushiki Kaisha | Environment adaptation for speech recognition in a speech communication system |
Families Citing this family (129)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6292437B1 (en) * | 1996-12-16 | 2001-09-18 | Intermec Ip Corp. | Portable identification capture system for transaction verification |
US5953700A (en) * | 1997-06-11 | 1999-09-14 | International Business Machines Corporation | Portable acoustic interface for remote access to automatic speech/speaker recognition server |
US5897616A (en) | 1997-06-11 | 1999-04-27 | International Business Machines Corporation | Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases |
US6347299B1 (en) * | 1997-07-31 | 2002-02-12 | Ncr Corporation | System for navigation and editing of electronic records through speech and audio |
US6795406B2 (en) | 1999-07-12 | 2004-09-21 | Genesys Telecommunications Laboratories, Inc. | Methods and apparatus for enhancing wireless data network telephony, including quality of service monitoring and control |
US6078566A (en) * | 1998-04-28 | 2000-06-20 | Genesys Telecommunications Laboratories, Inc. | Noise reduction techniques and apparatus for enhancing wireless data network telephony |
US6687824B1 (en) * | 1998-07-01 | 2004-02-03 | Samsung Electronics Co., Ltd. | Digital image coding/decoding apparatus and method for recording and restoring a signature image using watermarking |
US6141644A (en) * | 1998-09-04 | 2000-10-31 | Matsushita Electric Industrial Co., Ltd. | Speaker verification and speaker identification based on eigenvoices |
US7003463B1 (en) * | 1998-10-02 | 2006-02-21 | International Business Machines Corporation | System and method for providing network coordinated conversational services |
JP2000187435A (ja) * | 1998-12-24 | 2000-07-04 | Sony Corp | 情報処理装置、携帯機器、電子ペット装置、情報処理手順を記録した記録媒体及び情報処理方法 |
GB2362461B (en) * | 1999-02-11 | 2003-07-23 | Cardax Internat Ltd | Improvements in or relating to control and/or monitoring systems |
US7035400B1 (en) | 1999-03-01 | 2006-04-25 | Wm. Marsh Rice University | Signaling Techniques in channels with asymmetric powers and capacities |
US20050091057A1 (en) * | 1999-04-12 | 2005-04-28 | General Magic, Inc. | Voice application development methodology |
US6408272B1 (en) | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
US20050261907A1 (en) * | 1999-04-12 | 2005-11-24 | Ben Franklin Patent Holding Llc | Voice integration platform |
US6308158B1 (en) * | 1999-06-30 | 2001-10-23 | Dictaphone Corporation | Distributed speech recognition system with multi-user input stations |
US6477493B1 (en) * | 1999-07-15 | 2002-11-05 | International Business Machines Corporation | Off site voice enrollment on a transcription device for speech recognition |
GB2356318A (en) * | 1999-09-04 | 2001-05-16 | Marconi Comm Ltd | Server with voice recognition |
US7194752B1 (en) | 1999-10-19 | 2007-03-20 | Iceberg Industries, Llc | Method and apparatus for automatically recognizing input audio and/or video streams |
IE20000789A1 (en) * | 1999-09-30 | 2001-04-04 | Buy Tel Innovations Ltd | Voice verification system |
US6868385B1 (en) | 1999-10-05 | 2005-03-15 | Yomobile, Inc. | Method and apparatus for the provision of information signals based upon speech recognition |
EP1093097A3 (en) | 1999-10-14 | 2004-01-07 | International Business Machines Corporation | System and method for providing secure financial transactions |
US6807574B1 (en) | 1999-10-22 | 2004-10-19 | Tellme Networks, Inc. | Method and apparatus for content personalization over a telephone interface |
US7941481B1 (en) | 1999-10-22 | 2011-05-10 | Tellme Networks, Inc. | Updating an electronic phonebook over electronic communication networks |
US7360248B1 (en) | 1999-11-09 | 2008-04-15 | International Business Machines Corporation | Methods and apparatus for verifying the identity of a user requesting access using location information |
WO2001039143A1 (de) * | 1999-11-19 | 2001-05-31 | Swisscom Mobile Ag | Verfahren und system zum bestellen und ausliefern von digitalen zertifikaten |
WO2001038950A2 (en) * | 1999-11-22 | 2001-05-31 | Ascom Hasler Mailing Systems, Inc. | Generation and management of customer pin's |
KR20010054621A (ko) * | 1999-12-07 | 2001-07-02 | 서평원 | 이동 통신 단말기의 잠금 기능 해제 방법 |
WO2001059759A1 (en) * | 2000-02-10 | 2001-08-16 | Randolphrand.Com Llp | Recorder adapted to interface with internet browser |
JP3385270B2 (ja) * | 2000-03-03 | 2003-03-10 | 株式会社エイティング | 個人認証方法 |
ATE375589T1 (de) * | 2000-03-24 | 2007-10-15 | Eliza Corp | Web-gestützte spracherkennung durch scripting und semantische objekte |
WO2001077991A2 (en) * | 2000-04-12 | 2001-10-18 | Configate Inc. | Voice-based authentication over a noisy channel |
US6785653B1 (en) * | 2000-05-01 | 2004-08-31 | Nuance Communications | Distributed voice web architecture and associated components and methods |
US6625335B1 (en) * | 2000-05-11 | 2003-09-23 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for assigning keywords to documents |
US6321151B1 (en) * | 2000-05-12 | 2001-11-20 | Paul Shultz | Automotive diagnostic interface device |
US20030055638A1 (en) * | 2000-05-23 | 2003-03-20 | Burns Stephen S. | Wireless speech recognition tool |
US7047196B2 (en) | 2000-06-08 | 2006-05-16 | Agiletv Corporation | System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery |
WO2002003604A2 (en) * | 2000-06-29 | 2002-01-10 | Cachestream Corporation | Digital rights management |
JP2002024182A (ja) * | 2000-07-11 | 2002-01-25 | Mitsubishi Electric Corp | ユーザ認証システム |
US7308408B1 (en) | 2000-07-24 | 2007-12-11 | Microsoft Corporation | Providing services for an information processing system using an audio interface |
JP2002041276A (ja) * | 2000-07-24 | 2002-02-08 | Sony Corp | 対話型操作支援システム及び対話型操作支援方法、並びに記憶媒体 |
US7143039B1 (en) * | 2000-08-11 | 2006-11-28 | Tellme Networks, Inc. | Providing menu and other services for an information processing system using a telephone or other audio interface |
US6823306B2 (en) | 2000-11-30 | 2004-11-23 | Telesector Resources Group, Inc. | Methods and apparatus for generating, updating and distributing speech recognition models |
US8135589B1 (en) | 2000-11-30 | 2012-03-13 | Google Inc. | Performing speech recognition over a network and using speech recognition results |
US6915262B2 (en) | 2000-11-30 | 2005-07-05 | Telesector Resources Group, Inc. | Methods and apparatus for performing speech recognition and using speech recognition results |
US7185197B2 (en) * | 2000-12-08 | 2007-02-27 | Itt Manufacturing Enterprises, Inc. | Method and apparatus to facilitate secure network communications with a voice responsive network interface device |
US7305550B2 (en) * | 2000-12-29 | 2007-12-04 | Intel Corporation | System and method for providing authentication and verification services in an enhanced media gateway |
FR2820872B1 (fr) * | 2001-02-13 | 2003-05-16 | Thomson Multimedia Sa | Procede, module, dispositif et serveur de reconnaissance vocale |
US8095370B2 (en) | 2001-02-16 | 2012-01-10 | Agiletv Corporation | Dual compression voice recordation non-repudiation system |
KR100402358B1 (ko) * | 2001-03-02 | 2003-10-22 | 설동석 | 간접적인 패스워드 입력을 통한 사용자 확인방법 및 그 장치 |
US6973575B2 (en) * | 2001-04-05 | 2005-12-06 | International Business Machines Corporation | System and method for voice recognition password reset |
US20030052165A1 (en) * | 2001-06-05 | 2003-03-20 | Dave Dodson | Method of delivering Web content to fuel dispenser |
US20030055530A1 (en) * | 2001-06-05 | 2003-03-20 | Dave Dodson | System for delivering web content to fuel dispenser |
US7366673B2 (en) * | 2001-06-15 | 2008-04-29 | International Business Machines Corporation | Selective enablement of speech recognition grammars |
JP3885523B2 (ja) * | 2001-06-20 | 2007-02-21 | 日本電気株式会社 | サーバ・クライアント型音声認識装置及び方法 |
US20030007609A1 (en) * | 2001-07-03 | 2003-01-09 | Yuen Michael S. | Method and apparatus for development, deployment, and maintenance of a voice software application for distribution to one or more consumers |
US7609829B2 (en) * | 2001-07-03 | 2009-10-27 | Apptera, Inc. | Multi-platform capable inference engine and universal grammar language adapter for intelligent voice application execution |
US7162736B2 (en) * | 2001-08-20 | 2007-01-09 | Schlumberger Omnes, Inc. | Remote unblocking with a security agent |
US20030048890A1 (en) * | 2001-09-10 | 2003-03-13 | Weiss David L. | System and method for changing a personal identification number |
US7240007B2 (en) * | 2001-12-13 | 2007-07-03 | Matsushita Electric Industrial Co., Ltd. | Speaker authentication by fusion of voiceprint match attempt results with additional information |
US7475250B2 (en) * | 2001-12-19 | 2009-01-06 | Northrop Grumman Corporation | Assignment of user certificates/private keys in token enabled public key infrastructure system |
US7062444B2 (en) * | 2002-01-24 | 2006-06-13 | Intel Corporation | Architecture for DSR client and server development platform |
US7533735B2 (en) * | 2002-02-15 | 2009-05-19 | Qualcomm Corporation | Digital authentication over acoustic channel |
US7966497B2 (en) * | 2002-02-15 | 2011-06-21 | Qualcomm Incorporated | System and method for acoustic two factor authentication |
GB2386236A (en) * | 2002-03-05 | 2003-09-10 | Marconi Comm Ltd | Cashless transactions via a telecommunications network |
US7401224B2 (en) * | 2002-05-15 | 2008-07-15 | Qualcomm Incorporated | System and method for managing sonic token verifiers |
US7263347B2 (en) * | 2002-05-24 | 2007-08-28 | Cingular Wireless Ii, Llc | Biometric authentication of a wireless device user |
US7224981B2 (en) * | 2002-06-20 | 2007-05-29 | Intel Corporation | Speech recognition of mobile devices |
KR100950662B1 (ko) * | 2003-01-30 | 2010-04-08 | 삼성전자주식회사 | 네트웍을 이용한 스마트 카드의 인증방법 |
US7979698B2 (en) * | 2003-02-19 | 2011-07-12 | Hewlett-Packard Development Company, L.P. | Apparatus and method for proving authenticity with personal characteristics |
CA2516941A1 (en) * | 2003-02-19 | 2004-09-02 | Custom Speech Usa, Inc. | A method for form completion using speech recognition and text comparison |
US8751801B2 (en) * | 2003-05-09 | 2014-06-10 | Emc Corporation | System and method for authenticating users using two or more factors |
US9240891B2 (en) * | 2003-06-11 | 2016-01-19 | Symantec Corporation | Hybrid authentication |
AU2004250720A1 (en) * | 2003-06-19 | 2004-12-29 | Qualcomm Incorporated | Apparatus and method for multiple function authentication device |
CN1308911C (zh) * | 2003-07-10 | 2007-04-04 | 上海优浪信息科技有限公司 | 一种说话者身份识别方法和系统 |
SG140445A1 (en) * | 2003-07-28 | 2008-03-28 | Sony Corp | Method and apparatus for automatically recognizing audio data |
US20050109052A1 (en) * | 2003-09-30 | 2005-05-26 | Albers Walter F. | Systems and methods for conditioning air and transferring heat and mass between airflows |
US20050163136A1 (en) * | 2003-11-17 | 2005-07-28 | Leo Chiu | Multi-tenant self-service VXML portal |
US7697673B2 (en) | 2003-11-17 | 2010-04-13 | Apptera Inc. | System for advertisement selection, placement and delivery within a multiple-tenant voice interaction service system |
CN1707612B (zh) * | 2004-06-08 | 2010-11-17 | 深圳市朗科科技有限公司 | 一种视听播放装置及其播放方法 |
US8646051B2 (en) * | 2004-09-10 | 2014-02-04 | At&T Intellectual Property I, L.P. | Automated password reset via an interactive voice response system |
KR100695127B1 (ko) * | 2004-10-08 | 2007-03-14 | 삼성전자주식회사 | 다 단계 음성 인식 장치 및 방법 |
US8311822B2 (en) * | 2004-11-02 | 2012-11-13 | Nuance Communications, Inc. | Method and system of enabling intelligent and lightweight speech to text transcription through distributed environment |
US8024194B2 (en) * | 2004-12-08 | 2011-09-20 | Nuance Communications, Inc. | Dynamic switching between local and remote speech rendering |
US20060287863A1 (en) * | 2005-06-16 | 2006-12-21 | International Business Machines Corporation | Speaker identification and voice verification for voice applications |
CN1905445B (zh) | 2005-07-27 | 2012-02-15 | 国际商业机器公司 | 使用可移动的语音标识卡的语音认证系统及语音认证方法 |
US20070078775A1 (en) * | 2005-09-14 | 2007-04-05 | Huapaya Luis M | System and method for preventing unauthorized use of digital works |
US8090082B2 (en) | 2006-01-23 | 2012-01-03 | Icall, Inc. | System, method and computer program product for extracting user profiles and habits based on speech recognition and calling history for telephone system advertising |
US7949103B2 (en) * | 2006-06-20 | 2011-05-24 | Vontoo, Llc | System and method for providing voice messaging with dynamic content |
KR101366277B1 (ko) * | 2006-09-07 | 2014-02-20 | 엘지전자 주식회사 | 도메인에서 ro 이동을 위한 멤버쉽 확인 방법 및 장치 |
US8010367B2 (en) * | 2006-12-22 | 2011-08-30 | Nuance Communications, Inc. | Spoken free-form passwords for light-weight speaker verification using standard speech recognition engines |
US20090018826A1 (en) * | 2007-07-13 | 2009-01-15 | Berlin Andrew A | Methods, Systems and Devices for Speech Transduction |
CN101796525A (zh) * | 2007-08-28 | 2010-08-04 | 松下电器产业株式会社 | 电子设备、解锁方法和程序 |
JP2009146263A (ja) * | 2007-12-17 | 2009-07-02 | Panasonic Corp | 本人認証システム |
US8407048B2 (en) * | 2008-05-27 | 2013-03-26 | Qualcomm Incorporated | Method and system for transcribing telephone conversation to text |
US8347103B2 (en) * | 2009-01-13 | 2013-01-01 | Nic, Inc. | System and method for authenticating a user using a graphical password |
TWI407322B (zh) * | 2009-06-19 | 2013-09-01 | Ipeer Multimedia Internat Ltd | 多媒體辨識系統與方法,及其應用之多媒體客製化方法 |
US8707413B2 (en) * | 2010-01-15 | 2014-04-22 | Bank Of America Corporation | Authenticating a chip card interface device |
US20110178903A1 (en) * | 2010-01-15 | 2011-07-21 | Bank Of America Corporation | Personal identification number changing system and method |
US9038188B2 (en) * | 2010-01-15 | 2015-05-19 | Bank Of America Corporation | Protecting data stored in a chip card interface device in the event of compromise |
EP2362620A1 (en) * | 2010-02-23 | 2011-08-31 | Vodafone Holding GmbH | Method of editing a noise-database and computer device |
US9525548B2 (en) | 2010-10-21 | 2016-12-20 | Microsoft Technology Licensing, Llc | Provisioning techniques |
US8805434B2 (en) | 2010-11-23 | 2014-08-12 | Microsoft Corporation | Access techniques using a mobile communication device |
US20120143769A1 (en) * | 2010-12-02 | 2012-06-07 | Microsoft Corporation | Commerce card |
US9509686B2 (en) | 2010-12-03 | 2016-11-29 | Microsoft Technology Licensing, Llc | Secure element authentication |
US9953653B2 (en) | 2011-01-07 | 2018-04-24 | Nuance Communications, Inc. | Configurable speech recognition system using multiple recognizers |
CN102223234B (zh) * | 2011-06-17 | 2013-11-20 | 飞天诚信科技股份有限公司 | 基于音频通信的电子签名系统及方法 |
US9386268B2 (en) | 2012-04-09 | 2016-07-05 | Intel Corporation | Communication using interactive avatars |
CN104170358B (zh) | 2012-04-09 | 2016-05-11 | 英特尔公司 | 用于化身管理和选择的系统和方法 |
US9124386B2 (en) * | 2012-09-28 | 2015-09-01 | Saurabh Dadu | System, device, and method for securing voice authentication and end-to-end speech interaction |
WO2014055076A1 (en) | 2012-10-04 | 2014-04-10 | Nuance Communications, Inc. | Improved hybrid controller for asr |
US9691377B2 (en) | 2013-07-23 | 2017-06-27 | Google Technology Holdings LLC | Method and device for voice recognition training |
US9275638B2 (en) | 2013-03-12 | 2016-03-01 | Google Technology Holdings LLC | Method and apparatus for training a voice recognition model database |
US8725842B1 (en) * | 2013-07-11 | 2014-05-13 | Khalid Al-Nasser | Smart watch |
US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
CN104143329B (zh) * | 2013-08-19 | 2015-10-21 | 腾讯科技(深圳)有限公司 | 进行语音关键词检索的方法及装置 |
US10014007B2 (en) | 2014-05-28 | 2018-07-03 | Interactive Intelligence, Inc. | Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system |
US10255903B2 (en) | 2014-05-28 | 2019-04-09 | Interactive Intelligence Group, Inc. | Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system |
US9830728B2 (en) | 2014-12-23 | 2017-11-28 | Intel Corporation | Augmented facial animation |
CN104967622B (zh) * | 2015-06-30 | 2017-04-05 | 百度在线网络技术(北京)有限公司 | 基于声纹的通讯方法、装置和系统 |
US10373608B2 (en) | 2015-10-22 | 2019-08-06 | Texas Instruments Incorporated | Time-based frequency tuning of analog-to-information feature extraction |
US10475225B2 (en) | 2015-12-18 | 2019-11-12 | Intel Corporation | Avatar animation system |
NZ749370A (en) * | 2016-06-02 | 2020-03-27 | Genesys Telecommunications Laboratories Inc | Technologies for authenticating a speaker using voice biometrics |
US10971157B2 (en) | 2017-01-11 | 2021-04-06 | Nuance Communications, Inc. | Methods and apparatus for hybrid speech recognition processing |
CN108665899A (zh) * | 2018-04-25 | 2018-10-16 | 广东思派康电子科技有限公司 | 一种语音交互系统及语音交互方法 |
KR102621881B1 (ko) * | 2018-09-05 | 2024-01-05 | 주식회사 케이티 | 상담사와 상담하는 화자를 인증하는 서버 및 방법 |
KR102227418B1 (ko) * | 2020-01-13 | 2021-03-12 | (주)인에이블 | 화자 인증 방법 |
KR102227624B1 (ko) * | 2020-03-09 | 2021-03-15 | 주식회사 퍼즐에이아이 | 워터마크를 삽입한 음성 인증 시스템 및 이에 대한 방법 |
US11295758B2 (en) | 2020-03-20 | 2022-04-05 | Seagate Technology Llc | Trusted listening |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BE787377A (fr) * | 1971-08-09 | 1973-02-09 | Waterbury Nelson J | Cartes de securite et systeme d'utilisation de telles cartes |
US4130731A (en) * | 1976-12-29 | 1978-12-19 | International Mobile Machines Incorporated | Portable telephone system |
US4720802A (en) * | 1983-07-26 | 1988-01-19 | Lear Siegler | Noise compensation arrangement |
US4811399A (en) * | 1984-12-31 | 1989-03-07 | Itt Defense Communications, A Division Of Itt Corporation | Apparatus and method for automatic speech recognition |
IT1211194B (it) * | 1987-07-10 | 1989-10-12 | Olivetti & Co Spa | Sistema di misura e compensazione automatica delle distorsioni di un collegamento tra un apparecchio telefonico e un unita centrale di trattamento voce |
US4827518A (en) * | 1987-08-06 | 1989-05-02 | Bell Communications Research, Inc. | Speaker verification system using integrated circuit cards |
EP0356568B1 (de) * | 1988-09-02 | 1994-01-19 | Siemens Aktiengesellschaft | Verfahren und Anordnung zur Sprechererkennung in einer Fernsprechvermittlungsanlage |
JPH04177977A (ja) | 1990-11-09 | 1992-06-25 | Tokyo Electric Co Ltd | 情報通信機器 |
WO1993001664A1 (en) * | 1991-07-08 | 1993-01-21 | Motorola, Inc. | Remote voice control system |
US5208848A (en) * | 1991-08-26 | 1993-05-04 | At&T Bell Laboratories | Telecommunications call processing |
US5293424A (en) * | 1992-10-14 | 1994-03-08 | Bull Hn Information Systems Inc. | Secure memory card |
US5414755A (en) * | 1994-08-10 | 1995-05-09 | Itt Corporation | System and method for passive voice verification in a telephone network |
DE4434255A1 (de) * | 1994-09-24 | 1996-03-28 | Sel Alcatel Ag | Vorrichtung zur Sprachaufzeichnung mit anschließender Texterstellung |
JPH08116385A (ja) | 1994-10-14 | 1996-05-07 | Hitachi Ltd | 個人情報端末装置および音声応答システム |
US5680506A (en) * | 1994-12-29 | 1997-10-21 | Lucent Technologies Inc. | Apparatus and method for speech signal analysis |
EP1460594B1 (en) * | 1995-04-28 | 2010-09-29 | Koninklijke KPN N.V. | A device for transparent interaction between an IC card and a remote terminal |
JPH0954757A (ja) | 1995-08-14 | 1997-02-25 | Toshiba Corp | 情報処理装置、登録方法及び情報処理方法 |
JP3601631B2 (ja) | 1995-10-24 | 2004-12-15 | 株式会社リコー | 話者認識システムおよび話者認識方法 |
US5960399A (en) * | 1996-12-24 | 1999-09-28 | Gte Internetworking Incorporated | Client/server speech processor/recognizer |
US5953700A (en) * | 1997-06-11 | 1999-09-14 | International Business Machines Corporation | Portable acoustic interface for remote access to automatic speech/speaker recognition server |
-
1997
- 1997-06-11 US US08/873,079 patent/US5953700A/en not_active Expired - Lifetime
-
1998
- 1998-02-24 TW TW087102629A patent/TW394894B/zh not_active IP Right Cessation
- 1998-05-08 CN CNB981079709A patent/CN1190774C/zh not_active Expired - Lifetime
- 1998-05-12 KR KR1019980016874A patent/KR100276846B1/ko not_active IP Right Cessation
- 1998-06-02 JP JP10152923A patent/JPH1138992A/ja active Pending
-
1999
- 1999-08-13 US US09/776,939 patent/US6615171B1/en not_active Expired - Lifetime
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003501701A (ja) * | 1999-06-07 | 2003-01-14 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 重み付けされたスペクトル距離の計算機 |
JP2003526138A (ja) * | 1999-06-25 | 2003-09-02 | ヤコブス リンメル リミテッド | 自動化された接続サービスシステム |
US7050974B1 (en) | 1999-09-14 | 2006-05-23 | Canon Kabushiki Kaisha | Environment adaptation for speech recognition in a speech communication system |
Also Published As
Publication number | Publication date |
---|---|
TW394894B (en) | 2000-06-21 |
KR100276846B1 (ko) | 2001-01-15 |
CN1229229A (zh) | 1999-09-22 |
CN1190774C (zh) | 2005-02-23 |
US5953700A (en) | 1999-09-14 |
US6615171B1 (en) | 2003-09-02 |
KR19990006431A (ko) | 1999-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5953700A (en) | Portable acoustic interface for remote access to automatic speech/speaker recognition server | |
KR100386044B1 (ko) | 음성 트랜잭션을 보안하기 위한 시스템 및 방법 | |
US8082448B2 (en) | System and method for user authentication using non-language words | |
US7142091B2 (en) | Self-authenticating identification substrate with encoded packet output | |
US8755501B2 (en) | Acoustic encoding of dynamic identification codes | |
US5717743A (en) | Transparent telephone access system using voice authorization | |
US20020104027A1 (en) | N-dimensional biometric security system | |
CN101467204A (zh) | 用于生物计量声纹认证的方法和系统 | |
JP2006505021A (ja) | 安全なアプリケーション環境のためのローバスト多要素認証 | |
US20030200447A1 (en) | Identification system | |
EP0890167A2 (en) | Speech recognition and verification system enabling authorized data transmission over networked computer systems | |
JP2002024182A (ja) | ユーザ認証システム | |
WO1999022362A1 (en) | Non-transferable bio-metric token-based identification methods and devices | |
KR101424962B1 (ko) | 음성 기반 인증시스템 및 방법 | |
JPH09120293A (ja) | 話者認識システムおよび話者認識方法 | |
JP4217412B2 (ja) | 個人認証機能を有する通話装置 | |
JP4679919B2 (ja) | 分散型話者照合装置および分散型話者照合端末装置、コンピュータプログラム | |
CN213152077U (zh) | 智能语音会议加密系统 | |
US20230120373A1 (en) | Strong authentication of a user of a communication terminal | |
Ibrahim et al. | Security enhancement of voice over Internet protocol using speaker recognition technique | |
CN113660378A (zh) | 智能化语音自动会议记录生成系统 | |
JP2004361769A (ja) | 音声認証システムおよび音声処理端末 | |
TW202107873A (zh) | 智能語音會議加密系統及方法 | |
TWM598010U (zh) | 智能語音會議加密系統 | |
JPS63167399A (ja) | 音声認識システム |