JPH1138992A - 自動音声/話者認識サーバへのリモート・アクセス用ポータブル音響インタフェース装置、システム及び方法 - Google Patents

自動音声/話者認識サーバへのリモート・アクセス用ポータブル音響インタフェース装置、システム及び方法

Info

Publication number
JPH1138992A
JPH1138992A JP10152923A JP15292398A JPH1138992A JP H1138992 A JPH1138992 A JP H1138992A JP 10152923 A JP10152923 A JP 10152923A JP 15292398 A JP15292398 A JP 15292398A JP H1138992 A JPH1138992 A JP H1138992A
Authority
JP
Japan
Prior art keywords
signal
data
portable
server
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10152923A
Other languages
English (en)
Inventor
Dmitrij Kanevskij
ディミトリ・カネフスキー
Herman Mace Stephen
ステファン・ハーマン・メイス
S Puun Peter
ピーター・エス・プーン
Purochiro Carl
カール・プロチロ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH1138992A publication Critical patent/JPH1138992A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】 話された音声及びバックグラウンド・ノイズ
を受信するマイクを持つポータブル音声信号前処理(S
SP)装置、受信されたノイズを処理してフィーチャ・
ベクトルを作成するデジタル信号プロセッサ(DS
P)、及び通信チャネルを通して転送するため通信装置
に接続するカプラを提供する。 【解決手段】 自動音声/話者認識(ASSR)サーバ
が通信チャネルを通して、前処理された音声データを受
信し、話された音声/話者を認識する。ポータブルSS
P装置及びASSRサーバは、スマートカード、磁気カ
ードまたは電子マネー・カードのPINコードの有効
化、リセット、または変更をリモートに行うため使用で
きる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自動音声/話者認
識(ASSR、Automatic Speech/Speaker Recognitio
n)に関し、特に電話回線等の通信チャネルを通してA
SSRサーバにリモートにアクセスするためのポータブ
ル音響カプラまたはインタフェースを用いたASSR法
に関する。
【0002】
【従来の技術】中央のサーバまたはサービス・プロバイ
ダのリソースを多数のクライアントまたは加入者がアク
セスする代表的なクライアント/サーバまたは加入者/
サービス・プロバイダのシステムでは、何らかの形のク
ライアント/加入者認証法により、クライアント/加入
者が有効なシステム・ユーザかどうか確認される。この
ようなシステムの多くはコードをキー入力するか、また
はテキストをオペレータに通信することによってPI
N、キーワードまたはパスワード等の認証コードをやり
とりする。いくつかのシステムの認証コードは音声によ
る。つまりコードはサーバに対して声で入力される。サ
ーバ(この場合はASSRサーバ)はその発音を認識
し、記憶された有効な音声認証コードと比較すること
で、そのユーザが有効なクライアントであることを確認
する。
【0003】ASSRサーバ/クライアント・システム
では、クライアントが電話回線等の通信チャネルを通し
て音声により認証コードをリモートに通信すれば都合が
よい。つまり電話回線が利用できるならどのクライアン
トもサーバにアクセスできるようにすることである。電
話回線は地上回線またはセルラ回線等である。セルラの
場合は、サーバへのアクセスは完全にポータブル、つま
りいつでもどこでもセルラ・フォンとセルラ接続が利用
できる。
【0004】上に述べたような電話ASSRシステムの
運営上の困難には、1)電話回線で送られる音声データ
の劣化により正確さに欠ける、及び2)呼び出し側が公
衆電話からかけているとき、車を運転しているとき等、
ユーザがかけている電話の位置に応じて、ユーザ側でバ
ックグラウンド・ノイズ特性が変化するといったことが
含まれる。いずれの状況でもデータまたは信号の整合性
が失われ、よって音声/話者の認識精度が大きく低下す
る。
【0005】データ及び認識の精度が失われるこの問題
は、クライアント側で信号が電話回線を通してサーバに
送られる前に、音声信号前処理(SSP、Speech Signa
l Preprocessing)が実行される場合は減らすことが、
またはなくすことができる。SSPは転送デバイス、環
境、話者及び通信チャネルの音響特性の把握を含む。S
SP情報はASSRサーバによって処理され、基準が設
定され、対応するデコード・モデルとアルゴリズムが選
択され、ワード・エラー・レートを小さくするため、ま
たは話者認識を正確に行うためにチャネル伝達関数とバ
ックグラウンド・ノイズをモデリングすることによっ
て、話者が認識されるか、または音声がデコードされ
る。しかしユーザ側でSSPを実行するには、SSPソ
フトウェアを持つコンピュータを含めたSSP機器が必
要になる。このようなSSP機能は、一般的には現在の
標準的な電話やNC(ネットワーク・コンピュータ)に
はない。
【0006】従って、軽量コンパクトで持ち運びに便利
であり、任意の電話またはデータ通信デバイスに接続で
き、通信チャネルを通してASSRサーバにアクセスし
たときに、またサーバとの対話全体で正確な話者認識を
促進し、ポータブルSSP装置とASSRサーバの間で
正確な音声認識通信を行う機能を含む、ポータブルSS
P装置が求められる。
【0007】本発明の実施例は、音声、沈黙及びバック
グラウンド・ノイズの各信号を含むサウンドをアナログ
信号に変換するマイク、アナログ信号をデジタル信号に
変化するアナログ/デジタル・コンバータ、デジタル信
号から音声を表すフィーチャ・ベクトル・データと、沈
黙とバックグラウンド・ノイズの信号を表す特性データ
とを生成するDSP(デジタル信号プロセッサ)、遠隔
地でのASSRサーバによる音声認識を目的に及び通信
チャネルを通してフィーチャ・ベクトル・データを表す
信号を通信するために、音響またはデータの通信装置に
接続するカプラを含むポータブルSSP装置を含む。カ
プラは、好適にはフィーチャ・ベクトル・データを音響
信号に変換する音響カプラである。その場合、通信チャ
ネルも電話回線のようにアコースティック(acoustic)
である。またカプラはデータ通信チャネルを通して転送
するためデジタル転送装置に接続ようにコネクタ、ポー
ト、プロトコル等の対応するインタフェースを含む。
【0008】ポータブルSSP装置は、好適には、フィ
ーチャ・ベクトル・データを暗号化する暗号化装置と、
フィーチャ・ベクトル・データを圧縮するデータ圧縮装
置を含む。ポータブルSSP装置は、好適には、ASS
Rサーバからの戻り信号を受信し処理する手段と、DS
Pによる処理を目的に戻り信号をデジタル戻りデータに
変換する手段を含む。この好適な実施例ではDSPは更
に、デジタル戻りデータを圧縮解除する手段とデジタル
戻りデータを解読する手段を含む。
【0009】ポータブルSSP装置は更に、好適には話
者、沈黙及びバックグラウンド・ノイズに関連する音響
特性を含めて、通信チャネルの伝達関数の予測を、好適
には1組の予測基準信号を遠隔地でチャネルに接続され
たASSRサーバに送ることによって促進する手段を含
む。ポータブルSSP装置は、そのデバイスに固有の暗
号化キー・データまたは認証データを含めてデータを格
納するメモリを含む。
【0010】本発明の他の好適な実施例は、マイクに向
かって話されデジタル化された音声を処理し、音声を表
すフィーチャ・ベクトル・データを生成するDSP(デ
ジタル信号プロセッサ)と、電話回線またはデジタル・
ネットワーク接続等の通信チャネルに接続された通信装
置に接続し、通信チャネルを通して通信するためにフィ
ーチャ・ベクトル・データを信号に変換するカプラと、
ポータブルSSPから通信チャネルを介して転送された
信号を受信し、受信された信号を音声認識を目的に処理
するため、通信チャネルに接続された自動音声/話者認
識(ASSR)サーバを持つポータブルSSP装置を持
つASSRシステムを含む。
【0011】システムのASSRサーバは、登録または
認証のデータの格納モデルを含む。このモデルは加入者
またはクライアントの登録時に作成される。ASSRサ
ーバはまた音声認識のため、1組のボキャブラリと、言
語モデル、隠れマルコフ・モデル(HMM、Hidden Mar
kov Models)等他のモデルを格納する。ASSRサーバ
は、ポータブルSSP装置から受信された信号を処理
し、処理された信号を格納モデルと比較する。
【0012】ここで好都合なことは、リモート話者認証
機能があるとき、本発明の実施例に従ったシステムは、
遠隔地のスマートカードまたは磁気カードの活動化/非
活動化、またはパスワードもしくはPINコードの変更
と再活動化の機能を提供することである。
【0013】更に、本発明の実施例に従ったリモート音
声認識装置は、シグナリングの悪い、または歪みの大き
い通信環境でも誤差が少なくボキャブラリの多い音声の
認識が可能なASSR機能を提供する。
【0014】図1は、本発明の実施例に従ったポータブ
ル音声信号前処理(SSP)装置99のブロック図を示
す。マイク100は、ユーザが話した音声、沈黙及びバ
ックグラウンド・ノイズを含むサウンドを受信し、サウ
ンドをアナログ電気信号に変換するために用いられる。
マイク100は、デジタル信号プロセッサ(DSP)1
20に転送して処理するためにマイク100からのアナ
ログ電気信号をデジタル化信号に変換するアナログ/デ
ジタル(A/D)・コンバータ110に接続される。D
SP120は、好適にはプロセッサと、関連メモリ及び
データを処理しポータブルSSP装置99のデータの流
れを制御する格納プログラムを含む。好適な実施例でD
SP120の機能は、マイク100に向かって話された
音声データをフィーチャ・ベクトルに前処理する機能、
沈黙とバックグラウンド・ノイズのデータを処理して、
通信チャネルの伝達関数の確立または予測を補助する機
能、及びポータブルSSP装置との間でデータの転送と
受信を調整する、データを暗号化/解読する、必要に応
じてデータを圧縮/圧縮解除する機能を含めた他のAS
SR機能を実行する機能を含む。これらの機能及び通信
チャネルの伝達関数の予測については以下で詳しく説明
する。上に述べたDSPの機能または手法は当業者には
知られており、一般に入手できる多数のDSPによりこ
れらの機能を実行できる。例えばTexas Instruments、I
nc.のモデルTMS 32010、またはNippon Electric Co.
のUPD 7720は、ここで述べる用途に適したDSPであ
る。
【0015】DSP120によって処理されたデータは
音響カプラ150に出力され、ここでデジタル・データ
はオーディオ信号に変換される。その場合、音響カプラ
からのオーディオ信号は、電話回線等のオーディオ通信
チャネルを通して転送するために、一般の電話機の受話
器等のオーディオ通信装置で再生または話すことができ
る。音響カプラ150は本発明の好適な実施例に従っ
て、デジタル信号をオーディオ信号に変換する変換器
と、一般の電話機の受話器のレシーバまたは送話口との
接続に適したカプラを含む。例えば音響カプラの接続部
分は、好適には、ポータブルSSP装置99を任意の一
般電話機に取り付け、取り外すこができ、ユーザがどこ
にいても、電話から電話へポータブル装置の携帯性、可
搬性を高めるように、一般電話機の送話口に確実に係合
または接続できるゴム等の可撓物質で作られる。ポータ
ブル装置は、好適にはバッテリにより自己給電される。
予想できるとおり、マイク、A/Dコンバータ、DS
P、カプラ及びバッテリを含むポータブル装置の基本コ
ンポーネントは軽量コンパクトである。ポータブル装置
はハンドヘルド型でもよく、或いはポケット電卓や財布
のようにシャツのポケットに入れて携帯することもでき
る。
【0016】再び図1を参照する。暗号化装置130と
圧縮装置140はポータブルSSP装置99のオプショ
ンのコンポーネントである。DSP120に接続された
別々のチップもしくはモジュール、またはDSP130
の内部プログラム等の暗号化装置130は、DSP12
0によって前処理されたデータを予め設定された暗号鍵
で暗号化し、電話回線で信号の安全なやりとりを保証す
る。暗号鍵はユーザに依存するキー・コード等である。
【0017】好適にはDSP120は既知の信号をAS
SRサーバ200による処理のためにフィーチャ・ベク
トルのストリームに追加する。この信号がASSRサー
バ200によって知られており予想されている場合は、
外部信号を簡単に抽出でき、サーバからクライアントへ
のプロセスの反転も簡単になる。例えば無線通信では、
信号の分散スペクトル変調が用いられる。他のこれまで
の暗号化法または暗号化アルゴリズムもこの暗号化/解
読プロセスに使用できる。例えばBruce Schenierによ
る"Applied Cryptography"、second edition、Wiley、1
996に述べられている暗号化アルゴリズムを参照された
い。
【0018】圧縮装置140はオプションであり、DS
P120の外部に置かれたコンポーネントまたはチップ
でよく、或いはDSP120の格納プログラム機能とし
て組み込むこともできる。圧縮装置140は前処理され
たデータを、暗号化されているかされていないかと無関
係に、電話回線を通して転送する前に圧縮し、電話回線
の帯域幅が小さい場合に転送されるオーディオ信号によ
り伝えられるデータの量を増やす。信号圧縮法は周知の
とおりである。圧縮装置140は好適にはロスなく圧縮
を行う。
【0019】マイク100からのデジタル化されたデー
タの前処理は、マイク100に向かって話された音声パ
ターンを表すフィーチャ・ベクトルのシーケンスを生成
するというこれまでの手法を含む。例えば米国特許番号
第5544277号はこのような前処理の手法を1つ説
明している。またDSP120は沈黙及びバックグラウ
ンド・ノイズのデータを処理して周囲データを作成し、
このデータを電話回線を通して処理のためASSRサー
バに転送する。ASSRサーバは、好適には中央に位置
し、任意の電話機またはネットワークのステーションか
ら簡単にアクセスできるように電話回線またはデジタル
・ネットワークに接続される。
【0020】DSP120は、本発明の他の好適な実施
例に従って、通信回線を通してASSRサーバから送ら
れるオーディオ・データのポータブルSSP装置99に
よる受信を調整する。ASSRサーバからのオーディオ
・データは、ユーザに更に情報や指示を求めるプロンプ
トを含む。この実施例で音響カプラ150は、電話機の
受話器の耳当てと係合するため音響カプラのトランスミ
ッタと同じように設定され大きさが決められたレシーバ
を含む。受信されたメッセージを伝えるために、耳当て
またはカプラにはもう1つのスピーカを接続できる。D
SP120は、オプションで、暗号化され圧縮されたデ
ータがASSRサーバから送られた場合は、受信された
データを圧縮解除し、また受信されたデータを解読でき
る格納プログラム機能を含む。音響カプラ150のレシ
ーバ部は、DSP120で処理するために、受話器の耳
当てからのオーディオ信号をデジタル信号に変換する。
【0021】図2に、本発明のポータブルSSP装置9
9を利用したシステムを示す。ASSRサーバ200
は、好適にはポータブルSSP装置99から遠い中央に
置かれ、電話回線を通して電話機からアクセスできる。
接続が確立されると、ASSRサーバ200とポータブ
ルSSP装置99、音声/話者認識装置との接続も確立
される。ASSRサーバ200はポータブルSSP装置
99と通信して、ユーザ側の沈黙及びバックグラウンド
・ノイズを読取ることによって、通信チャネルの伝達関
数を確立または予測する。通信チャネルの伝達関数の予
測法は周知のとおりである。例えばB.C.Kuoによる"Au
tomatic Control Systems"、Prentice Hall、1987及び
J.V.Candyによる"Signal Processing、the Modern Ap
proach"、McGraw Hill、1988を参照されたい。本発明に
従ったプロセス例を次に示す。DSP120は、転送ま
たは接続の初めに異なる信号を生成する。異なる信号
は、既知の特性の上昇音(ascending chirp)と下降音
(descending chirp)、等間隔の一連のサイン・トーン
(sign tone)、及びホワイト・ノイズ信号である。信
号間のオーダの期間と間隔は充分確立される。信号は入
力トーンがサーバ200からポータブル装置99によっ
て受信されるとすぐ生成される。これらの信号は2回生
成される。一度はDSP120から、一度はマイク10
0からである。サーバ200によって受信される音響信
号は既定の基準信号と比較され、チャネルとバックグラ
ウンドの伝達関数が推測され、チャネルのシグネチャが
作成される。このシグネチャは音声フィーチャ・ベクト
ルをデコンボルブ(deconvolve)するため用いられる。
ASSRサーバ200は、好適には音声または話者を認
識するためASSR格納プログラムを含む。例えば観測
された音響特性をそれらが対応する状態にある場合に観
測する可能性を記述し、最適経路での発音を認識するこ
とによって、lefemesを表す隠れマルコフ・モデル(H
MM)が用いられる。この可能性は、記述されたトレー
ニング・スピーチとHMMを整合させ、可能性を更新す
ることによって調整することができる。例えば米国特許
番号第5031217号及び第5276766号は、H
MM及び他のモデルを用いた音声認識法について述べて
いる。
【0022】本発明の実施例に従ったASSRシステム
は、ユーザ側の沈黙及びバックグラウンド・ノイズの特
性を示す。ASSRシステムは好適には、先に述べたよ
うに、バックグラウンド・ノイズを接続の初め、ユーザ
が沈黙している間、またはDSP120から基準信号が
出される間にチェックする。バックグラウンド・ノイズ
はマイク100によって検出され、DSP120によっ
て処理されてから基準信号の第2部分の後に送られる。
ASSRサーバ200は、この情報からバックグラウン
ド・ノイズを推測し、受信済み入力ベクトルの処理に変
更を加える(例えばケプストラム平均減法(cepstral m
ean subtraction)、デコンボリューション等)。これ
に代えて、このような条件で調整された音声または話者
の認識のための格納モデルも使用できる。同様に沈黙期
間が検出され、単語間及びユーザが話す前の沈黙に関連
付けられた音響特性が、好適にはバックグラウンド・ノ
イズを予測するために用いられる。
【0023】好都合なことは、本発明の実施例のASS
Rシステムが話者と音声の認識を実行することである。
話者認識は、ASSRサーバにリモートにアクセスする
ために利用できる。好適には本発明のASSRシステム
例は、通信されたデータをバックグラウンド・タスクと
してほぼ連続的に処理し、セッション全体で話者の存在
を確認する。
【0024】本発明に従ったASSRの装置とシステム
について、通信装置を電話、通信チャネルを電話回線、
ASSRサーバを電話回線に接続されたものとして示し
てきた。本発明では、通信チャネルはまた、インターネ
ット、イントラネット及びローカル・エリア・ネットワ
ーク等のデジタル通信チャネルでもあることを想定して
いる。ASSRサーバ200は従って、電話によってか
またはデジタル・ネットワークによってアクセスするこ
とができる。図3は、サーバ200とのインタフェース
をとるためにマルチメディア・パーソナル・コンピュー
タ160をもつポータブル装置99の用途を示す。この
実施例で受話器は、マイク及びスピーカを含むマルチメ
ディア・コンピュータ160に代わっている。音響カプ
ラ150のレシーバ部はコンピュータのスピーカから最
も近い位置に置かれ、音響カプラ150のトランスミッ
タ部はコンピュータのマイクから最も近い位置に置かれ
る。コンピュータ160は、電話回線を通してデータを
転送するためモデムを含むか、または内部サーバ300
を通してサーバ200に接続できる。内部サーバ300
はASSRサーバ200のようにASSR機能を含み、
コンピュータ160と内部サーバ300の間にASSR
システムまたはASSR接続を確立できる。この実施例
でマルチメディア・コンピュータはオーディオ通信装置
として機能する。
【0025】これに代えてポータブルSSP装置99は
コンピュータのI/Oポートとのコネクタを介してコン
ピュータに接続できる。この実施例で音響カプラ150
は使用せずに済ませることができる。DSP120から
のデータはコンピュータのプロセッサに直接送ることが
できるからである。マルチメディア・コンピュータ16
0は、本発明の他の実施例に従って、上に述べたポータ
ブルSSP装置99のコンポーネントを組み込んだポー
タブル・ラップトップ・マルチメディア・コンピュータ
等である。よってポータブル・マルチメディア・ラップ
トップ・コンピュータは、ポータブルSSP装置99に
よって実行される全ての機能を実行することができる。
ポータブル・ラップトップはモデムを通して、または内
部サーバ300を通して、例えばTCP/IP、Net
BEUI等のプロトコルによりASSRサーバ200に
直接接続できる。
【0026】ポータブルSSP装置99の機能とコンポ
ーネントは、本発明の他の実施例に従って、内蔵型セル
ラ・フォン(携帯電話)でもよい。従ってSSPセルラ
・フォンはDSP120を含み、ASSRサーバ200
との接続及びアクセスは、アナログまたはデジタル(例
えばCDMA、GSM等)であるセルラ通信チャネルに
よる。
【0027】好都合なことは、ASSRサーバ200か
らのデータを受信、解読または圧縮解除するポータブル
装置99の機能(前述)により、解読または認証の機能
を実行するために様々なデータを受信することができる
ことである。例えば、現在及び次の通信の間に受信さ
れ、受信された信号が暗号化される暗号鍵、鍵の有効期
間、鍵のPIN番号の有効期間等を確認するために受信
されるクッキー、先に受信され、期限切れになるまでユ
ーザを認証するために用いられるデジタル認証または認
証、ノイズのマスキングまたはアンマスキングのため受
信されるノイズ・パターン、スマートカードの組み込み
チップでまたはクレジット・カード型カードの磁気バン
ドに、PINの有効期限の特性を示すクッキーと共にエ
ンコードされるものの一部であるスマートカード用のP
IN番号またはコード等である。受信されたデータはD
SP200のメモリに格納できる。既知の手法によって
DSP120の読取り/書込み/再プログラムを行うた
めにポータブル装置200に接続されるインタフェース
を使用できる。
【0028】よって本発明のデバイス例と方法は、加入
者またはクライアントのパスワード、ログオン、PI
N、或いはまた暗号化/解読鍵の認証、リセット、また
は取り消しに使用できる。このようなタスクは、スマー
トカードまたは磁気バンドを持つカード上でリモートに
実行できる。
【0029】スマートカード認証/PINリセット装置
での本発明の実施例に従ったシステムの用途を図4に示
す。
【0030】スマートカードの初期化:代表的なスマー
トカード・システムのスマートカードは、最初に機関の
認証と秘密/公開鍵のセットで初期化されることによっ
て、使用を目的としてアクティブにされる。登録サーバ
410側では、通常は管理者は新しいスマートカードを
管理者のスマートカードと共に挿入し、PIN番号を入
力して新しいユーザの登録を承認する。管理者は次にユ
ーザのスマートカードの初期化プログラムをアクティブ
にする。プログラムは通常、ユーザの秘密鍵及び公開鍵
のセット、ユーザの名前、シリアル番号、スマートカー
ド・シリアル番号等の認証用の情報をスマートカードに
スタンプする。
【0031】図3のワークステーション220と同等で
もよい登録サーバ410は、ユーザ・プロファイルを作
成し、リクエスト秘密/公開鍵及び認証を生成し、情報
をスマートカードにダウンロードする。登録サーバ41
0は次にユーザに識別のためにワークステーションのス
ピーカに向かって話すことを要求する。これらの音声メ
ッセージは話者認識サーバ420に送られる。サーバ4
20は図1乃至図3のASSRサーバ200と同一であ
る。音声メッセージ、認証及び一意のスマートカード・
シリアル番号は、将来の認証及び他の用途のためにAS
SRサーバ200に関連付けられるたデータベース、ま
たはASSRサーバ200内のデータベースに保存され
る。
【0032】或いはまた認証が発行され、カスタマ・プ
ロファイルが作成されてから、登録サーバ410は登録
データを保管のため保管サーバ(vault server)430
及びディレクトリ・サーバ440にアップロードする。
登録データはまたワークステーション450及びスマー
トカード・リーダ460にダウンロードすることもでき
る。ワークステーション450はポータブルSSP99
のコンポーネントと機能を含むか、またはポータブルS
SP99をワークステーション450に接続して話者認
識サーバ420との話者/音声情報の通信を促進するこ
とができる。各機関に各スマートカードのために生成さ
れるRSAキー・ペアがある。秘密鍵は、後でPINを
リセットするときのためにカードに焼き込まれる。スマ
ートカードは、将来使用するために内部(焼き込み)、
外部(カードへの印刷)の両方とも、一意のシリアル番
号で初期化される。
【0033】上に述べたインストールまたは初期化の場
合、ユーザがPINを忘れるか、PINが期限切れでリ
セットされていない場合は、PCまたはハンドヘルド・
ポータブルSSP装置99とスマートカード・リーダ4
60(スマートカードの代わりに磁気バンド・カードが
用いられる場合は磁気ライタ)によりASSRサーバ2
00とリンクしてPINリセットを要求することによっ
て、次のようにして、PINをリモートにリセットまた
は再設定することができる。
【0034】PCの場合、ユーザはASSRサーバ20
0との接続を(SSL V2等を通して)確立してスマ
ートカードのPINの変更を要求する。ダイアログ・ボ
ックスまたは音声プロンプトがユーザに提示され、ユー
ザのID、名前、スマートカード・シリアル番号等の入
力が求められる。ASSRサーバ200は、入力された
情報をもとに格納された認証とユーザ・プロファイルに
アクセスする。ASSRサーバ200は次にユーザに、
認証のためプリセットされた音声メッセージでPCのス
ピーカに向かって話すことを求める。
【0035】アクセスされたユーザ・プロファイルとデ
ータベースからの音声セグメントは、認証のためのユー
ザからの入力メッセージと比較される。ユーザには、確
認プログラムへの入力を訂正するためにいくつか機会を
与えることができる。確認に問題がなく、ユーザが現在
の有効なユーザならASSRサーバ200はスマートカ
ード認証及び公開鍵を使用してPINリセット・コマン
ドを暗号化し、ユーザのPC及び関連するスマートカー
ド・リーダに送る。ユーザのスマートカードはそこで自
体の固有の秘密鍵を使用してRESET PINコマンドを解読
する。
【0036】スマートカードの秘密鍵でRESET PINコマ
ンドを問題なく暗号化できた場合、スマートカードはそ
こで活動化される。スマートカードには、スマートカー
ドの焼き込まれた固有のシリアル番号をASSRサーバ
200によって与えられた番号と比較するための回路を
加えることができる。それらが同じなら、スマートカー
ドはPIN RESET操作のため自体をアンロックする。
【0037】スマートカードが活動化されPINがリセ
ットされると、ユーザは新しいPINをスマートカード
に入力することができる。スマートカードは、任意の安
全なトランザクションを目的にして利用できる。
【0038】電話によるPIN RESET:PCスピーカが利
用できない場合でも、電話でASSRサーバ200を呼
び出してスマートカードのPINリセットを行える。同
じ話者認証手順により、サーバに、後に使用するために
電子エンベロープで暗号化されたPIN RESETコマンドを
作成することを指示することができる。
【0039】このPC及びスマートカード・リーダによ
り、ユーザは、ASSRサーバ200を通してスマート
カード管理サーバとのSSL(Secure Socket Layer)
セッションを確立し(ホスト認証だけで)、PINリセ
ットを要求する。次にASSRサーバ200は、暗号化
されたエンベロープをPCのスマートカード・リーダに
送る。スマートカードが電子エンベロープを受け取る
と、スマートカードの秘密鍵により、エンベロープ内側
のコマンドが解読される。正しい秘密鍵を持つスマート
カードだけがPIN RESETコマンドを解読できる。スマー
トカードはまた、一意のスマートカード・シリアル番号
をスマートカード管理サーバにより与えられた番号と比
較する。データが一致すると、スマートカードは後のPI
N INIT及びSETのためにリセットされる。
【0040】スマートカードのリモート無効化:スマー
トカードが失われるか盗まれた場合、ユーザはできるだ
け早くスマートカードを無効にする必要がある。その場
合、電話でASSRサーバ200を通してスマートカー
ド管理サーバに接続し、スマートカードを同じ認証手順
で無効化することができる。
【0041】上に示した、本発明の実施例に従ったシス
テム用途は、音声で確認するネットワークのアクセス・
ログオンまたはパスワードにもあてはまる。
【0042】ネットワーク・ユーザは初期化プロセスを
実行し、ASSRサーバ・データベースへの記録のため
にプリセットされた1組の話者メッセージを記録する。
ASSRサーバ200は、管理サーバとして、スマート
カード・ユーザ認証について述べたように、話者認証プ
ロセスを用い、ログオンID及びパスワードの全ての管
理タスクを実行することができる。
【0043】スマートカードPINリセット・プロセス
と同様に、ユーザがログオン・パスワードを忘れた場合
またはパスワードが期限切れの場合、ユーザはASSR
サーバ200を通した認証により変更または再有効化を
要求し、新しいパスワードまたは再有効化(reactivati
on)をユーザ側にダウンロードできる。他の用途には、
電子マネー・カードまたはウォレット・カード(wallet
card)との対話がある。ここではICチップに、カー
ドに残っている金額に関する情報が含まれる。商品を購
入するためにカードが使われたときには金額が少なくな
る。本発明の実施例に従ったシステムは、上に述べたス
マートカード再有効化プロセスと同様の手順によりマネ
ー・カードをリフィル(refill)するために使用でき
る。
【0044】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0045】(1)音声、沈黙、バックグラウンド・ノ
イズの各信号を含むサウンドをアナログ信号に変換する
マイクと、アナログ信号をデジタル信号に変換するアナ
ログ信号/デジタル・コンバータと、前記デジタル信号
から前記音声を表すフィーチャ・ベクトル・データを生
成するデジタル信号プロセッサ(DSP)と、前記フィ
ーチャ・ベクトル・データを音響信号に変換し、遠隔地
で前記音声を認識するために、前記音響信号を通信チャ
ネルを通して通信するために音響通信装置に接続する音
響カプラと、を含む、ポータブル音声認識装置。 (2)前記フィーチャ・ベクトル・データを暗号化する
暗号化装置を含む、前記(1)記載の装置。 (3)前記フィーチャ・ベクトル・データを圧縮するデ
ータ圧縮装置を含む、前記(1)記載の装置。 (4)前記音響カプラは、前記遠隔地からの前記通信チ
ャネルを通した戻り信号を受信し、前記戻り信号を前記
デジタル信号プロセッサによる処理のためにデジタル戻
りデータに変換する手段を含む、前記(1)記載の装
置。 (5)前記デジタル信号プロセッサは、前記デジタル戻
りデータを圧縮解除する手段を含む、前記(4)記載の
装置。 (6)前記デジタル信号プロセッサは、前記デジタル戻
りデータを解読する手段を含む、前記(4)記載の装
置。 (7)前記通信チャネルの伝達関数を予測する手段を含
む、前記(1)記載の装置。 (8)前記デジタル信号プロセッサは、前記遠隔地にて
前記チャネルに接続されたサーバからデータを受信し処
理する手段を含む、前記(1)記載の装置。 (9)前記デジタル信号プロセッサは、前記装置に固有
のキー・データを含むデータを格納するメモリを含む、
前記(1)記載の装置。 (10)前記装置を囲む沈黙とバックグラウンド・ノイ
ズに関連した通信チャネル特性を把握する手段を含む、
前記(1)記載の装置。 (11)デジタル信号プロセッサ(DSP)に向かって
話されたデジタル化された音声を処理し、前記音声を表
すフィーチャ・ベクトル・データを生成する前記デジタ
ル信号プロセッサと、前記フィーチャ・ベクトル・デー
タを表す信号を通信チャネルを通して通信するために通
信装置に接続するカプラと、を含む、ポータブル音声信
号プリプロセッサ(SSP)と、前記通信チャネルを介
して前記ポータブル音声信号プリプロセッサから転送さ
れた前記フィーチャ・ベクトル・データを表す前記信号
を受信し、前記音声または話者を認識するために前記信
号を処理するために、前記通信チャネルとリモートに接
続された自動音声/話者認識(ASSR)サーバと、を
含む、音声認識システム。 (12)前記自動音声/話者認識サーバは、前記ポータ
ブル音声信号プリプロセッサから受信された前記信号を
処理し、処理された信号を認証データの前記格納モデル
と比較することによって有効な加入者を認証する認証デ
ータ格納モデルを含む、前記(11)記載のシステム。 (13)前記自動音声/話者認識サーバは、前記ポータ
ブル音声信号プリプロセッサから受信された前記信号を
処理し、処理された信号をデータベースと比較すること
によって音声を認識するためのボキャブラリの前記デー
タベースを含む、前記(11)記載のシステム。 (14)前記自動音声/話者認識サーバは、前記ポータ
ブル音声信号プリプロセッサから受信された前記信号を
処理することによってユーザのパスワードを認証する、
前記(11)記載のシステム。 (15)前記自動音声/話者認識サーバは、前記ポータ
ブル音声信号プリプロセッサから受信された前記信号を
処理することによって呼び出し側を識別し、前記信号
は、前記呼び出し側によって前記ポータブル音声信号プ
リプロセッサに話された音声から発する、前記(11)
記載のシステム。 (16)前記ポータブル音声信号プリプロセッサは、前
記自動音声/話者認識サーバから戻り信号を受信し処理
する手段を含む、前記(11)記載のシステム。 (17)前記戻り信号は変更された認証データ及びプロ
ンプトの1つを含む、前記(16)記載のシステム。 (18)前記ポータブル音声信号プリプロセッサは、前
記自動音声/話者認識サーバから受信されたデータを含
むデータを格納する関連メモリを含む、前記(11)記
載のシステム。 (19)前記通信チャネルを通した前記ポータブル音声
信号プリプロセッサと前記自動音声/話者認識サーバの
間の接続の伝達関数を予測する手段を含む、前記(1
1)記載のシステム。 (20)前記カプラは、前記フィーチャ・ベクトル・デ
ータを音響信号に変換する音響カプラであり、前記通信
チャネルは音響通信チャネルである、前記(11)記載
のシステム。 (21)前記ポータブル音声信号プリプロセッサと前記
自動音声/話者認識サーバは、通信セッション全体で話
者認識を定期的に実行する手段を含む、前記(11)記
載のシステム。 (22)クライアント/サーバ・システムの有効なクラ
イアントを音声により認証する方法であって、登録デー
タの複数のモデルを自動音声認識(ASSR)サーバの
メモリに格納するステップと、通信チャネルを通して前
記自動音声認識サーバから遠く離れて配置されたポータ
ブル音声信号前処理(SSP)装置から前記自動音声認
識サーバに接続するステップと、前記登録データを前記
ポータブル音声信号前処理装置に話すステップと、前記
ポータブル音声信号前処理装置の前記登録データを前処
理してフィーチャ・ベクトルを作成するステップと、前
記フィーチャ・ベクトルを表す信号を前記通信チャネル
を通して前記自動音声認識サーバにより受信するステッ
プと、前記自動音声認識サーバから受信された前記信号
を処理し、処理された信号を前記有効なクライアントを
認証するために前記格納モデルと比較するステップと、
を含む、方法。 (23)変更されたパスワード・データを前記自動音声
認識サーバから前記ポータブル音声信号前処理装置に転
送することによってユーザ・パスワードを変更するステ
ップを含む、前記(22)記載の方法。 (24)変更されたスマートカード・データを前記自動
音声認識サーバから前記ポータブル音声信号前処理装置
に転送することによってスマートカードのPINを変更
するステップを含む、前記(22)記載の方法。 (25)前記変更されたスマートカード・データは前記
自動音声認識サーバによって暗号化され、前記ポータブ
ル音声信号前処理装置は前記スマートカードのPINを
変更するために前記変更されたスマートカード・データ
を解読する、前記(24)記載の方法。 (26)変更されたPINデータを前記自動音声認識サ
ーバから磁気カード・ライタと前記ポータブル音声信号
前処理装置に転送することによって磁気カードのPIN
を変更するステップを含む、前記(22)記載の方法。
【図面の簡単な説明】
【図1】本発明の好適な実施例に従ったポータブル音声
認識装置を示す図である。
【図2】本発明の好適な実施例に従った図1の装置を持
つシステムのブロック図である。
【図3】本発明の好適な実施例に従った図1のポータブ
ル装置を持つ他のシステムのブロック図である。
【図4】本発明の好適な実施例に従ったスマートカード
PIN認証/リセット・システムの用法を示す図であ
る。
【符号の説明】
99 ポータブル音声信号前処理(SSP)装置 100 マイク 110 アナログ・デジタル・コンバータ 120 デジタル信号プロセッサ(PSP) 130 暗号化装置 140 圧縮装置 150 音響カプラ 160 マルチメディア・パーソナル・コンピュータ 200 サーバ 220 ワークステーション 420 話者認識サーバ 430 保管サーバ 440 ディレクトリ・サーバ 460 スマートカード・リーダ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI // H04M 3/42 H04M 3/42 P (72)発明者 ステファン・ハーマン・メイス アメリカ合衆国06811、コネチカット州ダ ンバリー、シェルター・ロック・ロード 157−25 (72)発明者 ピーター・エス・プーン アメリカ合衆国10589、ニューヨーク州ソ マーズ、サミット・サークル 10 (72)発明者 カール・プロチロ アメリカ合衆国12498、ニューヨーク州ウ ッドストック、パーク・ドライブ 34

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】音声、沈黙、バックグラウンド・ノイズの
    各信号を含むサウンドをアナログ信号に変換するマイク
    と、 アナログ信号をデジタル信号に変換するアナログ信号/
    デジタル・コンバータと、 前記デジタル信号から前記音声を表すフィーチャ・ベク
    トル・データを生成するデジタル信号プロセッサ(DS
    P)と、 前記フィーチャ・ベクトル・データを音響信号に変換
    し、遠隔地で前記音声を認識するために、前記音響信号
    を通信チャネルを通して通信するために音響通信装置に
    接続する音響カプラと、 を含む、ポータブル音声認識装置。
  2. 【請求項2】前記フィーチャ・ベクトル・データを暗号
    化する暗号化装置を含む、請求項1記載の装置。
  3. 【請求項3】前記フィーチャ・ベクトル・データを圧縮
    するデータ圧縮装置を含む、請求項1記載の装置。
  4. 【請求項4】前記音響カプラは、前記遠隔地からの前記
    通信チャネルを通した戻り信号を受信し、前記戻り信号
    を前記デジタル信号プロセッサによる処理のためにデジ
    タル戻りデータに変換する手段を含む、請求項1記載の
    装置。
  5. 【請求項5】前記デジタル信号プロセッサは、前記デジ
    タル戻りデータを圧縮解除する手段を含む、請求項4記
    載の装置。
  6. 【請求項6】前記デジタル信号プロセッサは、前記デジ
    タル戻りデータを解読する手段を含む、請求項4記載の
    装置。
  7. 【請求項7】前記通信チャネルの伝達関数を予測する手
    段を含む、請求項1記載の装置。
  8. 【請求項8】前記デジタル信号プロセッサは、前記遠隔
    地にて前記チャネルに接続されたサーバからデータを受
    信し処理する手段を含む、請求項1記載の装置。
  9. 【請求項9】前記デジタル信号プロセッサは、前記装置
    に固有のキー・データを含むデータを格納するメモリを
    含む、請求項1記載の装置。
  10. 【請求項10】前記装置を囲む沈黙とバックグラウンド
    ・ノイズに関連した通信チャネル特性を把握する手段を
    含む、請求項1記載の装置。
  11. 【請求項11】デジタル信号プロセッサ(DSP)に向
    かって話されたデジタル化された音声を処理し、前記音
    声を表すフィーチャ・ベクトル・データを生成する前記
    デジタル信号プロセッサと、 前記フィーチャ・ベクトル・データを表す信号を通信チ
    ャネルを通して通信するために通信装置に接続するカプ
    ラと、 を含む、ポータブル音声信号プリプロセッサ(SSP)
    と、 前記通信チャネルを介して前記ポータブル音声信号プリ
    プロセッサから転送された前記フィーチャ・ベクトル・
    データを表す前記信号を受信し、前記音声または話者を
    認識するために前記信号を処理するために、前記通信チ
    ャネルとリモートに接続された自動音声/話者認識(A
    SSR)サーバと、 を含む、音声認識システム。
  12. 【請求項12】前記自動音声/話者認識サーバは、前記
    ポータブル音声信号プリプロセッサから受信された前記
    信号を処理し、処理された信号を認証データの前記格納
    モデルと比較することによって有効な加入者を認証する
    認証データ格納モデルを含む、請求項11記載のシステ
    ム。
  13. 【請求項13】前記自動音声/話者認識サーバは、前記
    ポータブル音声信号プリプロセッサから受信された前記
    信号を処理し、処理された信号をデータベースと比較す
    ることによって音声を認識するためのボキャブラリの前
    記データベースを含む、請求項11記載のシステム。
  14. 【請求項14】前記自動音声/話者認識サーバは、前記
    ポータブル音声信号プリプロセッサから受信された前記
    信号を処理することによってユーザのパスワードを認証
    する、請求項11記載のシステム。
  15. 【請求項15】前記自動音声/話者認識サーバは、前記
    ポータブル音声信号プリプロセッサから受信された前記
    信号を処理することによって呼び出し側を識別し、前記
    信号は、前記呼び出し側によって前記ポータブル音声信
    号プリプロセッサに話された音声から発する、請求項1
    1記載のシステム。
  16. 【請求項16】前記ポータブル音声信号プリプロセッサ
    は、前記自動音声/話者認識サーバから戻り信号を受信
    し処理する手段を含む、請求項11記載のシステム。
  17. 【請求項17】前記戻り信号は変更された認証データ及
    びプロンプトの1つを含む、請求項16記載のシステ
    ム。
  18. 【請求項18】前記ポータブル音声信号プリプロセッサ
    は、前記自動音声/話者認識サーバから受信されたデー
    タを含むデータを格納する関連メモリを含む、請求項1
    1記載のシステム。
  19. 【請求項19】前記通信チャネルを通した前記ポータブ
    ル音声信号プリプロセッサと前記自動音声/話者認識サ
    ーバの間の接続の伝達関数を予測する手段を含む、請求
    項11記載のシステム。
  20. 【請求項20】前記カプラは、前記フィーチャ・ベクト
    ル・データを音響信号に変換する音響カプラであり、前
    記通信チャネルは音響通信チャネルである、請求項11
    記載のシステム。
  21. 【請求項21】前記ポータブル音声信号プリプロセッサ
    と前記自動音声/話者認識サーバは、通信セッション全
    体で話者認識を定期的に実行する手段を含む、請求項1
    1記載のシステム。
  22. 【請求項22】クライアント/サーバ・システムの有効
    なクライアントを音声により認証する方法であって、 登録データの複数のモデルを自動音声認識(ASSR)
    サーバのメモリに格納するステップと、 通信チャネルを通して前記自動音声認識サーバから遠く
    離れて配置されたポータブル音声信号前処理(SSP)
    装置から前記自動音声認識サーバに接続するステップ
    と、 前記登録データを前記ポータブル音声信号前処理装置に
    話すステップと、 前記ポータブル音声信号前処理装置の前記登録データを
    前処理してフィーチャ・ベクトルを作成するステップ
    と、 前記フィーチャ・ベクトルを表す信号を前記通信チャネ
    ルを通して前記自動音声認識サーバにより受信するステ
    ップと、 前記自動音声認識サーバから受信された前記信号を処理
    し、処理された信号を前記有効なクライアントを認証す
    るために前記格納モデルと比較するステップと、 を含む、方法。
  23. 【請求項23】変更されたパスワード・データを前記自
    動音声認識サーバから前記ポータブル音声信号前処理装
    置に転送することによってユーザ・パスワードを変更す
    るステップを含む、請求項22記載の方法。
  24. 【請求項24】変更されたスマートカード・データを前
    記自動音声認識サーバから前記ポータブル音声信号前処
    理装置に転送することによってスマートカードのPIN
    を変更するステップを含む、請求項22記載の方法。
  25. 【請求項25】前記変更されたスマートカード・データ
    は前記自動音声認識サーバによって暗号化され、前記ポ
    ータブル音声信号前処理装置は前記スマートカードのP
    INを変更するために前記変更されたスマートカード・
    データを解読する、請求項24記載の方法。
  26. 【請求項26】変更されたPINデータを前記自動音声
    認識サーバから磁気カード・ライタと前記ポータブル音
    声信号前処理装置に転送することによって磁気カードの
    PINを変更するステップを含む、請求項22記載の方
    法。
JP10152923A 1997-06-11 1998-06-02 自動音声/話者認識サーバへのリモート・アクセス用ポータブル音響インタフェース装置、システム及び方法 Pending JPH1138992A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/873,079 US5953700A (en) 1997-06-11 1997-06-11 Portable acoustic interface for remote access to automatic speech/speaker recognition server
US08/873079 1997-06-11

Publications (1)

Publication Number Publication Date
JPH1138992A true JPH1138992A (ja) 1999-02-12

Family

ID=25360941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10152923A Pending JPH1138992A (ja) 1997-06-11 1998-06-02 自動音声/話者認識サーバへのリモート・アクセス用ポータブル音響インタフェース装置、システム及び方法

Country Status (5)

Country Link
US (2) US5953700A (ja)
JP (1) JPH1138992A (ja)
KR (1) KR100276846B1 (ja)
CN (1) CN1190774C (ja)
TW (1) TW394894B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003501701A (ja) * 1999-06-07 2003-01-14 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 重み付けされたスペクトル距離の計算機
JP2003526138A (ja) * 1999-06-25 2003-09-02 ヤコブス リンメル リミテッド 自動化された接続サービスシステム
US7050974B1 (en) 1999-09-14 2006-05-23 Canon Kabushiki Kaisha Environment adaptation for speech recognition in a speech communication system

Families Citing this family (129)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6292437B1 (en) * 1996-12-16 2001-09-18 Intermec Ip Corp. Portable identification capture system for transaction verification
US5953700A (en) * 1997-06-11 1999-09-14 International Business Machines Corporation Portable acoustic interface for remote access to automatic speech/speaker recognition server
US5897616A (en) 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
US6347299B1 (en) * 1997-07-31 2002-02-12 Ncr Corporation System for navigation and editing of electronic records through speech and audio
US6795406B2 (en) 1999-07-12 2004-09-21 Genesys Telecommunications Laboratories, Inc. Methods and apparatus for enhancing wireless data network telephony, including quality of service monitoring and control
US6078566A (en) * 1998-04-28 2000-06-20 Genesys Telecommunications Laboratories, Inc. Noise reduction techniques and apparatus for enhancing wireless data network telephony
US6687824B1 (en) * 1998-07-01 2004-02-03 Samsung Electronics Co., Ltd. Digital image coding/decoding apparatus and method for recording and restoring a signature image using watermarking
US6141644A (en) * 1998-09-04 2000-10-31 Matsushita Electric Industrial Co., Ltd. Speaker verification and speaker identification based on eigenvoices
US7003463B1 (en) * 1998-10-02 2006-02-21 International Business Machines Corporation System and method for providing network coordinated conversational services
JP2000187435A (ja) * 1998-12-24 2000-07-04 Sony Corp 情報処理装置、携帯機器、電子ペット装置、情報処理手順を記録した記録媒体及び情報処理方法
GB2362461B (en) * 1999-02-11 2003-07-23 Cardax Internat Ltd Improvements in or relating to control and/or monitoring systems
US7035400B1 (en) 1999-03-01 2006-04-25 Wm. Marsh Rice University Signaling Techniques in channels with asymmetric powers and capacities
US20050091057A1 (en) * 1999-04-12 2005-04-28 General Magic, Inc. Voice application development methodology
US6408272B1 (en) 1999-04-12 2002-06-18 General Magic, Inc. Distributed voice user interface
US20050261907A1 (en) * 1999-04-12 2005-11-24 Ben Franklin Patent Holding Llc Voice integration platform
US6308158B1 (en) * 1999-06-30 2001-10-23 Dictaphone Corporation Distributed speech recognition system with multi-user input stations
US6477493B1 (en) * 1999-07-15 2002-11-05 International Business Machines Corporation Off site voice enrollment on a transcription device for speech recognition
GB2356318A (en) * 1999-09-04 2001-05-16 Marconi Comm Ltd Server with voice recognition
US7194752B1 (en) 1999-10-19 2007-03-20 Iceberg Industries, Llc Method and apparatus for automatically recognizing input audio and/or video streams
IE20000789A1 (en) * 1999-09-30 2001-04-04 Buy Tel Innovations Ltd Voice verification system
US6868385B1 (en) 1999-10-05 2005-03-15 Yomobile, Inc. Method and apparatus for the provision of information signals based upon speech recognition
EP1093097A3 (en) 1999-10-14 2004-01-07 International Business Machines Corporation System and method for providing secure financial transactions
US6807574B1 (en) 1999-10-22 2004-10-19 Tellme Networks, Inc. Method and apparatus for content personalization over a telephone interface
US7941481B1 (en) 1999-10-22 2011-05-10 Tellme Networks, Inc. Updating an electronic phonebook over electronic communication networks
US7360248B1 (en) 1999-11-09 2008-04-15 International Business Machines Corporation Methods and apparatus for verifying the identity of a user requesting access using location information
WO2001039143A1 (de) * 1999-11-19 2001-05-31 Swisscom Mobile Ag Verfahren und system zum bestellen und ausliefern von digitalen zertifikaten
WO2001038950A2 (en) * 1999-11-22 2001-05-31 Ascom Hasler Mailing Systems, Inc. Generation and management of customer pin's
KR20010054621A (ko) * 1999-12-07 2001-07-02 서평원 이동 통신 단말기의 잠금 기능 해제 방법
WO2001059759A1 (en) * 2000-02-10 2001-08-16 Randolphrand.Com Llp Recorder adapted to interface with internet browser
JP3385270B2 (ja) * 2000-03-03 2003-03-10 株式会社エイティング 個人認証方法
ATE375589T1 (de) * 2000-03-24 2007-10-15 Eliza Corp Web-gestützte spracherkennung durch scripting und semantische objekte
WO2001077991A2 (en) * 2000-04-12 2001-10-18 Configate Inc. Voice-based authentication over a noisy channel
US6785653B1 (en) * 2000-05-01 2004-08-31 Nuance Communications Distributed voice web architecture and associated components and methods
US6625335B1 (en) * 2000-05-11 2003-09-23 Matsushita Electric Industrial Co., Ltd. Method and apparatus for assigning keywords to documents
US6321151B1 (en) * 2000-05-12 2001-11-20 Paul Shultz Automotive diagnostic interface device
US20030055638A1 (en) * 2000-05-23 2003-03-20 Burns Stephen S. Wireless speech recognition tool
US7047196B2 (en) 2000-06-08 2006-05-16 Agiletv Corporation System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery
WO2002003604A2 (en) * 2000-06-29 2002-01-10 Cachestream Corporation Digital rights management
JP2002024182A (ja) * 2000-07-11 2002-01-25 Mitsubishi Electric Corp ユーザ認証システム
US7308408B1 (en) 2000-07-24 2007-12-11 Microsoft Corporation Providing services for an information processing system using an audio interface
JP2002041276A (ja) * 2000-07-24 2002-02-08 Sony Corp 対話型操作支援システム及び対話型操作支援方法、並びに記憶媒体
US7143039B1 (en) * 2000-08-11 2006-11-28 Tellme Networks, Inc. Providing menu and other services for an information processing system using a telephone or other audio interface
US6823306B2 (en) 2000-11-30 2004-11-23 Telesector Resources Group, Inc. Methods and apparatus for generating, updating and distributing speech recognition models
US8135589B1 (en) 2000-11-30 2012-03-13 Google Inc. Performing speech recognition over a network and using speech recognition results
US6915262B2 (en) 2000-11-30 2005-07-05 Telesector Resources Group, Inc. Methods and apparatus for performing speech recognition and using speech recognition results
US7185197B2 (en) * 2000-12-08 2007-02-27 Itt Manufacturing Enterprises, Inc. Method and apparatus to facilitate secure network communications with a voice responsive network interface device
US7305550B2 (en) * 2000-12-29 2007-12-04 Intel Corporation System and method for providing authentication and verification services in an enhanced media gateway
FR2820872B1 (fr) * 2001-02-13 2003-05-16 Thomson Multimedia Sa Procede, module, dispositif et serveur de reconnaissance vocale
US8095370B2 (en) 2001-02-16 2012-01-10 Agiletv Corporation Dual compression voice recordation non-repudiation system
KR100402358B1 (ko) * 2001-03-02 2003-10-22 설동석 간접적인 패스워드 입력을 통한 사용자 확인방법 및 그 장치
US6973575B2 (en) * 2001-04-05 2005-12-06 International Business Machines Corporation System and method for voice recognition password reset
US20030052165A1 (en) * 2001-06-05 2003-03-20 Dave Dodson Method of delivering Web content to fuel dispenser
US20030055530A1 (en) * 2001-06-05 2003-03-20 Dave Dodson System for delivering web content to fuel dispenser
US7366673B2 (en) * 2001-06-15 2008-04-29 International Business Machines Corporation Selective enablement of speech recognition grammars
JP3885523B2 (ja) * 2001-06-20 2007-02-21 日本電気株式会社 サーバ・クライアント型音声認識装置及び方法
US20030007609A1 (en) * 2001-07-03 2003-01-09 Yuen Michael S. Method and apparatus for development, deployment, and maintenance of a voice software application for distribution to one or more consumers
US7609829B2 (en) * 2001-07-03 2009-10-27 Apptera, Inc. Multi-platform capable inference engine and universal grammar language adapter for intelligent voice application execution
US7162736B2 (en) * 2001-08-20 2007-01-09 Schlumberger Omnes, Inc. Remote unblocking with a security agent
US20030048890A1 (en) * 2001-09-10 2003-03-13 Weiss David L. System and method for changing a personal identification number
US7240007B2 (en) * 2001-12-13 2007-07-03 Matsushita Electric Industrial Co., Ltd. Speaker authentication by fusion of voiceprint match attempt results with additional information
US7475250B2 (en) * 2001-12-19 2009-01-06 Northrop Grumman Corporation Assignment of user certificates/private keys in token enabled public key infrastructure system
US7062444B2 (en) * 2002-01-24 2006-06-13 Intel Corporation Architecture for DSR client and server development platform
US7533735B2 (en) * 2002-02-15 2009-05-19 Qualcomm Corporation Digital authentication over acoustic channel
US7966497B2 (en) * 2002-02-15 2011-06-21 Qualcomm Incorporated System and method for acoustic two factor authentication
GB2386236A (en) * 2002-03-05 2003-09-10 Marconi Comm Ltd Cashless transactions via a telecommunications network
US7401224B2 (en) * 2002-05-15 2008-07-15 Qualcomm Incorporated System and method for managing sonic token verifiers
US7263347B2 (en) * 2002-05-24 2007-08-28 Cingular Wireless Ii, Llc Biometric authentication of a wireless device user
US7224981B2 (en) * 2002-06-20 2007-05-29 Intel Corporation Speech recognition of mobile devices
KR100950662B1 (ko) * 2003-01-30 2010-04-08 삼성전자주식회사 네트웍을 이용한 스마트 카드의 인증방법
US7979698B2 (en) * 2003-02-19 2011-07-12 Hewlett-Packard Development Company, L.P. Apparatus and method for proving authenticity with personal characteristics
CA2516941A1 (en) * 2003-02-19 2004-09-02 Custom Speech Usa, Inc. A method for form completion using speech recognition and text comparison
US8751801B2 (en) * 2003-05-09 2014-06-10 Emc Corporation System and method for authenticating users using two or more factors
US9240891B2 (en) * 2003-06-11 2016-01-19 Symantec Corporation Hybrid authentication
AU2004250720A1 (en) * 2003-06-19 2004-12-29 Qualcomm Incorporated Apparatus and method for multiple function authentication device
CN1308911C (zh) * 2003-07-10 2007-04-04 上海优浪信息科技有限公司 一种说话者身份识别方法和系统
SG140445A1 (en) * 2003-07-28 2008-03-28 Sony Corp Method and apparatus for automatically recognizing audio data
US20050109052A1 (en) * 2003-09-30 2005-05-26 Albers Walter F. Systems and methods for conditioning air and transferring heat and mass between airflows
US20050163136A1 (en) * 2003-11-17 2005-07-28 Leo Chiu Multi-tenant self-service VXML portal
US7697673B2 (en) 2003-11-17 2010-04-13 Apptera Inc. System for advertisement selection, placement and delivery within a multiple-tenant voice interaction service system
CN1707612B (zh) * 2004-06-08 2010-11-17 深圳市朗科科技有限公司 一种视听播放装置及其播放方法
US8646051B2 (en) * 2004-09-10 2014-02-04 At&T Intellectual Property I, L.P. Automated password reset via an interactive voice response system
KR100695127B1 (ko) * 2004-10-08 2007-03-14 삼성전자주식회사 다 단계 음성 인식 장치 및 방법
US8311822B2 (en) * 2004-11-02 2012-11-13 Nuance Communications, Inc. Method and system of enabling intelligent and lightweight speech to text transcription through distributed environment
US8024194B2 (en) * 2004-12-08 2011-09-20 Nuance Communications, Inc. Dynamic switching between local and remote speech rendering
US20060287863A1 (en) * 2005-06-16 2006-12-21 International Business Machines Corporation Speaker identification and voice verification for voice applications
CN1905445B (zh) 2005-07-27 2012-02-15 国际商业机器公司 使用可移动的语音标识卡的语音认证系统及语音认证方法
US20070078775A1 (en) * 2005-09-14 2007-04-05 Huapaya Luis M System and method for preventing unauthorized use of digital works
US8090082B2 (en) 2006-01-23 2012-01-03 Icall, Inc. System, method and computer program product for extracting user profiles and habits based on speech recognition and calling history for telephone system advertising
US7949103B2 (en) * 2006-06-20 2011-05-24 Vontoo, Llc System and method for providing voice messaging with dynamic content
KR101366277B1 (ko) * 2006-09-07 2014-02-20 엘지전자 주식회사 도메인에서 ro 이동을 위한 멤버쉽 확인 방법 및 장치
US8010367B2 (en) * 2006-12-22 2011-08-30 Nuance Communications, Inc. Spoken free-form passwords for light-weight speaker verification using standard speech recognition engines
US20090018826A1 (en) * 2007-07-13 2009-01-15 Berlin Andrew A Methods, Systems and Devices for Speech Transduction
CN101796525A (zh) * 2007-08-28 2010-08-04 松下电器产业株式会社 电子设备、解锁方法和程序
JP2009146263A (ja) * 2007-12-17 2009-07-02 Panasonic Corp 本人認証システム
US8407048B2 (en) * 2008-05-27 2013-03-26 Qualcomm Incorporated Method and system for transcribing telephone conversation to text
US8347103B2 (en) * 2009-01-13 2013-01-01 Nic, Inc. System and method for authenticating a user using a graphical password
TWI407322B (zh) * 2009-06-19 2013-09-01 Ipeer Multimedia Internat Ltd 多媒體辨識系統與方法,及其應用之多媒體客製化方法
US8707413B2 (en) * 2010-01-15 2014-04-22 Bank Of America Corporation Authenticating a chip card interface device
US20110178903A1 (en) * 2010-01-15 2011-07-21 Bank Of America Corporation Personal identification number changing system and method
US9038188B2 (en) * 2010-01-15 2015-05-19 Bank Of America Corporation Protecting data stored in a chip card interface device in the event of compromise
EP2362620A1 (en) * 2010-02-23 2011-08-31 Vodafone Holding GmbH Method of editing a noise-database and computer device
US9525548B2 (en) 2010-10-21 2016-12-20 Microsoft Technology Licensing, Llc Provisioning techniques
US8805434B2 (en) 2010-11-23 2014-08-12 Microsoft Corporation Access techniques using a mobile communication device
US20120143769A1 (en) * 2010-12-02 2012-06-07 Microsoft Corporation Commerce card
US9509686B2 (en) 2010-12-03 2016-11-29 Microsoft Technology Licensing, Llc Secure element authentication
US9953653B2 (en) 2011-01-07 2018-04-24 Nuance Communications, Inc. Configurable speech recognition system using multiple recognizers
CN102223234B (zh) * 2011-06-17 2013-11-20 飞天诚信科技股份有限公司 基于音频通信的电子签名系统及方法
US9386268B2 (en) 2012-04-09 2016-07-05 Intel Corporation Communication using interactive avatars
CN104170358B (zh) 2012-04-09 2016-05-11 英特尔公司 用于化身管理和选择的系统和方法
US9124386B2 (en) * 2012-09-28 2015-09-01 Saurabh Dadu System, device, and method for securing voice authentication and end-to-end speech interaction
WO2014055076A1 (en) 2012-10-04 2014-04-10 Nuance Communications, Inc. Improved hybrid controller for asr
US9691377B2 (en) 2013-07-23 2017-06-27 Google Technology Holdings LLC Method and device for voice recognition training
US9275638B2 (en) 2013-03-12 2016-03-01 Google Technology Holdings LLC Method and apparatus for training a voice recognition model database
US8725842B1 (en) * 2013-07-11 2014-05-13 Khalid Al-Nasser Smart watch
US9548047B2 (en) 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
CN104143329B (zh) * 2013-08-19 2015-10-21 腾讯科技(深圳)有限公司 进行语音关键词检索的方法及装置
US10014007B2 (en) 2014-05-28 2018-07-03 Interactive Intelligence, Inc. Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system
US10255903B2 (en) 2014-05-28 2019-04-09 Interactive Intelligence Group, Inc. Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system
US9830728B2 (en) 2014-12-23 2017-11-28 Intel Corporation Augmented facial animation
CN104967622B (zh) * 2015-06-30 2017-04-05 百度在线网络技术(北京)有限公司 基于声纹的通讯方法、装置和系统
US10373608B2 (en) 2015-10-22 2019-08-06 Texas Instruments Incorporated Time-based frequency tuning of analog-to-information feature extraction
US10475225B2 (en) 2015-12-18 2019-11-12 Intel Corporation Avatar animation system
NZ749370A (en) * 2016-06-02 2020-03-27 Genesys Telecommunications Laboratories Inc Technologies for authenticating a speaker using voice biometrics
US10971157B2 (en) 2017-01-11 2021-04-06 Nuance Communications, Inc. Methods and apparatus for hybrid speech recognition processing
CN108665899A (zh) * 2018-04-25 2018-10-16 广东思派康电子科技有限公司 一种语音交互系统及语音交互方法
KR102621881B1 (ko) * 2018-09-05 2024-01-05 주식회사 케이티 상담사와 상담하는 화자를 인증하는 서버 및 방법
KR102227418B1 (ko) * 2020-01-13 2021-03-12 (주)인에이블 화자 인증 방법
KR102227624B1 (ko) * 2020-03-09 2021-03-15 주식회사 퍼즐에이아이 워터마크를 삽입한 음성 인증 시스템 및 이에 대한 방법
US11295758B2 (en) 2020-03-20 2022-04-05 Seagate Technology Llc Trusted listening

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BE787377A (fr) * 1971-08-09 1973-02-09 Waterbury Nelson J Cartes de securite et systeme d'utilisation de telles cartes
US4130731A (en) * 1976-12-29 1978-12-19 International Mobile Machines Incorporated Portable telephone system
US4720802A (en) * 1983-07-26 1988-01-19 Lear Siegler Noise compensation arrangement
US4811399A (en) * 1984-12-31 1989-03-07 Itt Defense Communications, A Division Of Itt Corporation Apparatus and method for automatic speech recognition
IT1211194B (it) * 1987-07-10 1989-10-12 Olivetti & Co Spa Sistema di misura e compensazione automatica delle distorsioni di un collegamento tra un apparecchio telefonico e un unita centrale di trattamento voce
US4827518A (en) * 1987-08-06 1989-05-02 Bell Communications Research, Inc. Speaker verification system using integrated circuit cards
EP0356568B1 (de) * 1988-09-02 1994-01-19 Siemens Aktiengesellschaft Verfahren und Anordnung zur Sprechererkennung in einer Fernsprechvermittlungsanlage
JPH04177977A (ja) 1990-11-09 1992-06-25 Tokyo Electric Co Ltd 情報通信機器
WO1993001664A1 (en) * 1991-07-08 1993-01-21 Motorola, Inc. Remote voice control system
US5208848A (en) * 1991-08-26 1993-05-04 At&T Bell Laboratories Telecommunications call processing
US5293424A (en) * 1992-10-14 1994-03-08 Bull Hn Information Systems Inc. Secure memory card
US5414755A (en) * 1994-08-10 1995-05-09 Itt Corporation System and method for passive voice verification in a telephone network
DE4434255A1 (de) * 1994-09-24 1996-03-28 Sel Alcatel Ag Vorrichtung zur Sprachaufzeichnung mit anschließender Texterstellung
JPH08116385A (ja) 1994-10-14 1996-05-07 Hitachi Ltd 個人情報端末装置および音声応答システム
US5680506A (en) * 1994-12-29 1997-10-21 Lucent Technologies Inc. Apparatus and method for speech signal analysis
EP1460594B1 (en) * 1995-04-28 2010-09-29 Koninklijke KPN N.V. A device for transparent interaction between an IC card and a remote terminal
JPH0954757A (ja) 1995-08-14 1997-02-25 Toshiba Corp 情報処理装置、登録方法及び情報処理方法
JP3601631B2 (ja) 1995-10-24 2004-12-15 株式会社リコー 話者認識システムおよび話者認識方法
US5960399A (en) * 1996-12-24 1999-09-28 Gte Internetworking Incorporated Client/server speech processor/recognizer
US5953700A (en) * 1997-06-11 1999-09-14 International Business Machines Corporation Portable acoustic interface for remote access to automatic speech/speaker recognition server

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003501701A (ja) * 1999-06-07 2003-01-14 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 重み付けされたスペクトル距離の計算機
JP2003526138A (ja) * 1999-06-25 2003-09-02 ヤコブス リンメル リミテッド 自動化された接続サービスシステム
US7050974B1 (en) 1999-09-14 2006-05-23 Canon Kabushiki Kaisha Environment adaptation for speech recognition in a speech communication system

Also Published As

Publication number Publication date
TW394894B (en) 2000-06-21
KR100276846B1 (ko) 2001-01-15
CN1229229A (zh) 1999-09-22
CN1190774C (zh) 2005-02-23
US5953700A (en) 1999-09-14
US6615171B1 (en) 2003-09-02
KR19990006431A (ko) 1999-01-25

Similar Documents

Publication Publication Date Title
US5953700A (en) Portable acoustic interface for remote access to automatic speech/speaker recognition server
KR100386044B1 (ko) 음성 트랜잭션을 보안하기 위한 시스템 및 방법
US8082448B2 (en) System and method for user authentication using non-language words
US7142091B2 (en) Self-authenticating identification substrate with encoded packet output
US8755501B2 (en) Acoustic encoding of dynamic identification codes
US5717743A (en) Transparent telephone access system using voice authorization
US20020104027A1 (en) N-dimensional biometric security system
CN101467204A (zh) 用于生物计量声纹认证的方法和系统
JP2006505021A (ja) 安全なアプリケーション環境のためのローバスト多要素認証
US20030200447A1 (en) Identification system
EP0890167A2 (en) Speech recognition and verification system enabling authorized data transmission over networked computer systems
JP2002024182A (ja) ユーザ認証システム
WO1999022362A1 (en) Non-transferable bio-metric token-based identification methods and devices
KR101424962B1 (ko) 음성 기반 인증시스템 및 방법
JPH09120293A (ja) 話者認識システムおよび話者認識方法
JP4217412B2 (ja) 個人認証機能を有する通話装置
JP4679919B2 (ja) 分散型話者照合装置および分散型話者照合端末装置、コンピュータプログラム
CN213152077U (zh) 智能语音会议加密系统
US20230120373A1 (en) Strong authentication of a user of a communication terminal
Ibrahim et al. Security enhancement of voice over Internet protocol using speaker recognition technique
CN113660378A (zh) 智能化语音自动会议记录生成系统
JP2004361769A (ja) 音声認証システムおよび音声処理端末
TW202107873A (zh) 智能語音會議加密系統及方法
TWM598010U (zh) 智能語音會議加密系統
JPS63167399A (ja) 音声認識システム