JPH10507559A - 音声サンプルを音声作動データ処理システムに伝送するための方法及び装置 - Google Patents
音声サンプルを音声作動データ処理システムに伝送するための方法及び装置Info
- Publication number
- JPH10507559A JPH10507559A JP9504909A JP50490997A JPH10507559A JP H10507559 A JPH10507559 A JP H10507559A JP 9504909 A JP9504909 A JP 9504909A JP 50490997 A JP50490997 A JP 50490997A JP H10507559 A JPH10507559 A JP H10507559A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- transmission device
- speech
- wireless transmission
- recognition system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000005540 biological transmission Effects 0.000 claims abstract description 59
- 238000004891 communication Methods 0.000 claims description 15
- 230000004913 activation Effects 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 230000001755 vocal effect Effects 0.000 claims description 3
- 230000003213 activating effect Effects 0.000 claims 2
- MQJKPEGWNLWLTK-UHFFFAOYSA-N Dapsone Chemical compound C1=CC(N)=CC=C1S(=O)(=O)C1=CC=C(N)C=C1 MQJKPEGWNLWLTK-UHFFFAOYSA-N 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000006837 decompression Effects 0.000 description 2
- 230000033764 rhythmic process Effects 0.000 description 2
- 241000229094 Chordeiles Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 229940012720 subsys Drugs 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C9/00—Individual registration on entry or exit
- G07C9/20—Individual registration on entry or exit involving the use of a pass
- G07C9/22—Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder
- G07C9/25—Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder using biometric data, e.g. fingerprints, iris scans or voice recognition
- G07C9/257—Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder using biometric data, e.g. fingerprints, iris scans or voice recognition electronically
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
- Arrangements For Transmission Of Measured Signals (AREA)
- Selective Calling Equipment (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】
ユーザが携帯したワイヤレス伝送装置から、音声認識システムを有するリモート音声作動データ処理システムに、分析された音声サンプルを伝送する装置及び方法を提供する。この方法は、ユーザの音声特性をワイヤレス伝送装置におけるメモリ(例えば、RAMチップ)に記憶する第1ステップを含む。第2ステップは、その伝送装置及び音声認識システムを音声作動することを含む。第3ステップは、伝送装置及び音声認識システムが作動された後、音声特性をメモリから音声認識システムに伝送し、それによって、ユーザが音声作動データ処理システムと直接に口頭でコミュニケートすることを可能にする。
Description
【発明の詳細な説明】
音声サンプルを音声作動データ処理シ
ステムに伝送するための方法及び装置
技術分野
本発明は音声認識システムとのコミュニケーションの改良に関するものであり
、更に詳しく云えば、それに限定するものではないが、音声サンプルをデータ処
理システムにおける話者依存の音声認識システムに伝送するための方法及び装置
に関するものである。
背景技術
ヒューマン・コミュニケーションにおいて、及びヒューマン・ツー・マシン及
びマシン・ツー・ヒューマン・コミュニケーションにおいて、話し言葉は重要な
役割を演ずる。例えば、現在のボイス・メール・システム、ヘルプ・システム、
及びビデオ会議システムは音声を組み込んでいる。更に、テクノロジが発展する
につれて、人の音声はマシン/ヒューマン・コミュニケーションにおいて更に大
きな役割を演ずるであろう。特に、音声認識システムを組み込んだワイヤレスA
TMマシン(或いは、給油所、旅行情報案内所、POS端末のような任意のワイ
ヤレス・マシンのタイプ)を想像して欲しい。その音声認識システムを組み込む
ことによって、ユー
ザは単にそのATMマシンに話しかけるだけである。本発明は、そのようなマシ
ンにカード又は他の如何なるタイプの装置を挿入することを必要とせずに、ユー
ザがそのマシンと容易に且つ効率的に口頭でコミュニケートすることを意図する
ものである。しかし、幾つかの付加的な背景情報を、先ず、検討しなければなら
ない。
通常の音声認識システムは人の音声を聴取し及び理解する。しかし、受容し得
る音声認識精度を持つために、通常の音声認識システムはユーザの記憶された音
声サンプルを利用する。ユーザは、十分な音声特性を捕捉した約30個の慎重に
構成されたセンテンスを発声することによって音声サンプルを生成する。音声特
性は、律動、ピッチ、抑揚、及び速度を含むユーザの音声の韻律を含んでいる。
通常の音声分析器は、音声サンプルを処理して各ダイフォーン(diphone
)セグメントに対するオーディオ・サンプルを分離し、特徴ある韻律曲線を決定
する。音声分析器は、隠れマルコフ・モデルのような周知のディジタル信号処理
技法を使用してダイフォーン・セグメント及び韻律曲線を生成する。従って、記
憶された音声サンプルによって、通常の音声認識システムは約90%の正確度を
有する。しかし、ユーザがワイヤレス・マシンと口頭でコミュニケートすること
を望む都度それらの30個のセンテンスを反復することは極めて不都合なことで
あろう。
この背景情報を仮定すると、音声を介してワイヤレス対話
マシンと効率的に、効果的に、及び遠隔的にコミュニケートすることは、多くの
ユーザにとって極めて望ましい且つ有益なことであろう。しかし、ユーザが高い
精度でもってそのマシンと口頭でコミュニケートする前に、ユーザの分析された
音声サンプルをそのマシンに伝送する技法及び装置が開発されなければならない
。
発明の開示
第1の局面では、本発明は、音声認識システムを有する少なくとも1つのリモ
ート音声作動データ処理システムによる改良された音声コミュニケーションのた
めの方法を提供する。その方法は、
(a)ユーザの音声特性をワイヤレス伝送装置のメモリに記憶するステップと、
(b)音声作動コマンドに応答して、そのワイヤレス伝送装置及びリモート音声
認識システムを音声作動するステップと、
(c)そのワイヤレス伝送装置及び音声認識システムの作動に応答して、メモリ
からその音声認識システムに音声特性を伝送し、それによって、ユーザがその音
声作動データ処理システムと直接に口頭でコミュニケートすることを可能にする
ステップと、
を含む。
第2の局面では、本発明は、リモート・データ処理システムにあるリモート音
声認識システムとの音声コミュニケーシ
ョンを可能にするための音声伝送システムを提供する。その音声伝送システムは
、
ユーザの音声特性を記憶するためのメモリを有するワイヤレス伝送装置と、
そのワイヤレス伝送装置及び音声認識システムはそのワイヤレス伝送装置によ
る受信した音声作動コマンドに応答して作動するように適応すること、及び
そのワイヤレス伝送装置はその音声認識システム及びワイヤレス伝送装置の作
動に応答してメモリからその音声認識システムに音声特性を伝送し、それによっ
て、ユーザが音声認識システムと直接に口頭でコミュニケートするように適応す
ること
を特徴とする。
本発明の好適な実施例における装置及びコンピュータ実施される方法は、分析
された音声サンプルを、ユーザにより携帯されたワイヤレス伝送装置から音声認
識システムを有するリモート・データ処理システムに伝送する。その方法は、ユ
ーザの音声特性のセットをワイヤレス伝送装置のメモリ(例えば、RAMチップ
)に記憶する第1ステップを含む。第2ステップは、音声コマンドに応答してそ
の伝送装置及びリモート音声認識システムを音声作動することを含む。第3ステ
ップは、伝送装置及び音声認識システムが作動させられた後、メモリから音声認
識システムに音声特性を自動的に且つ遠隔的に伝送することを含み、それによっ
て、ユーザが音声作動
データ処理システムと直接に口頭でコミュニケートすることを可能にする。
本発明は、事前定義された音声コマンドに応答して、ユーザの音声特性をワイ
ヤレス・データ処理システムに自動的に伝送する改良された音声伝送システムを
提供する。
更に、本発明は、ユーザの音声特性を記憶し及びデータ処理システムに伝送す
るための装置(例えば、伝送装置)と、その音声特性を待ち及び受信するように
そのデータ処理システムを作動させるための装置とを提供する。
次に、添付図面を参照して、本発明を実施例によって更に詳しく説明すること
にする。
図面の簡単な説明
第1図は、本発明を実施するための代表的なハードウエア環境のブロック図を
示す。
第2図は、本発明による改良された音声伝送システムのブロック図を示す。
第3図は、リモート・データ処理システムとコミュニケートするためにユーザ
がワイヤレス伝送装置を携帯した状態の図を示す。
第4図は、ワイヤレス伝送装置からリモート・データ処理システムに音声特性
を伝送するための流れ図を示す。
発明を実施するための最良の形態
好適な実施例は、ユーザの音声特性を含む音声サンプルを音声認識システムに
遠隔的に及び自動的に伝送するための方法及び装置を含む。
その好適な実施例は、ラップトップ・コンピュータにおいて、或いは、代替的
には、第1図に示されたワークステーションにおいて実施される。ワークステー
ション100は、キャッシュ15、ランダム・アクセス・メモリ(RAM)14
、リード・オンリ・メモリ(ROM)16、及び不揮発性RAM(NVRAM)
32を処理するためのIBM(商標)社のPowerPC(商標)601、又は
Intel(商標)社の486マイクロプロセッサのような中央処理装置(CP
U)10を含む。I/Oアダプタ18によって制御される1つ又は複数のディス
ク20は長期記憶装置を提供する。テープ、CD−ROM、及びWORMドライ
ブを含むその他の種々の記憶媒体を使用することが可能である。データ又はコン
ピュータ・プロセス命令を記憶するために、取外し可能な記憶媒体も使用可能で
ある。
Sun社のSolaris(商標)、Microsoft社のWindows
NT(商標)、IBM社のOS/2(商標)、又はApple社のMAC OS
(商標)のような適当なオペレーティング・システムのそのデスクトップからの
命令及びデータがRAM14からCPU10を制御する。しかし、本発明を実施
するために、他のハードウエア・プラットフォーム及びオペレーティング・シス
テムが利用可能であ
ることは、当業者が容易に認めることである。
ユーザは、ユーザ・インターフェース22によって制御されるI/O装置(即
ち、ユーザ制御装置)を介してワークステーション100とコミュニケートする
。ディスプレイ38はユーザに情報を表示し、一方、キーボード24、ポインテ
ィング装置26、マイクロフォン30、及びスピーカ28は、ユーザがコンピュ
ータ・システムを指示することを可能にする。代替方法として、ジョイ・スティ
ック、タッチ・スクリーン、或いは仮想現実ヘッドセット(図示されていない)
のような別のタイプのユーザ制御装置も使用可能である。通信アダプタ34は、
このコンピュータ・システムとネットワーク・アダプタによってネットワークに
接続された他の処理装置との間の通信を制御する。ディスプレイ・アダプタ36
はこのコンピュータ・システムとディスプレイ38との間のコミュニケーション
を制御する。
第2図は、好適な実施例に従って、完全な音声伝送システム200のブロック
図を示す。音声伝送システム200は音声特性抽出装置210、伝送装置(単に
装置とも呼ばれる)220、及び音声認識システム230を含む。音声特性抽出
装置210はワークステーション100(第1図参照)のような任意の適当なワ
ークステーション内にあり、A/Dサブシステム204、音声分析器206、及
び音声コーディング回路207を含む。
第4図は、ワイヤレス伝送装置からリモート・データ処理
システムに音声特性を伝送するための流れ図を示す。第2図及び第4図を参照す
ると、好適な実施例では、ユーザは、話し手の十分な音声特性を含む音声サンプ
ル(例えば、約30個のセンテンス)をマイクロフォン202に与える(ステッ
プ410)。音声特性は、律動、ピッチ、抑揚、及び速度のようなその音声の韻
律を含む。このタイプのセンテンスは音声合成分野におけ当業者には周知である
。例えば、1つのセンテンスは、「The quick fox jumped over the lazy brown
dog(敏捷な狐がのろまな茶色の犬を飛び越えた)」でもよい。A/Dサブシス
テム204(及び222)はその音声サンプルをサンプルしそしてディジタル化
する。それは、IBM MACPA(即ち、マルチメディア音声捕捉及び再生ア
ダプタ)Creative LabのSound Blaster音声カード、
又はシングル・チップ・ソリューションのような任意の適当なアナログ・ツー・
ディジタル・システムを含む(ステップ412)。
一方、任意の適当な一般的な音声分析器206がそのディジタル化された音声
サンプルを処理して各ダイフォーン・セグメントに対する音声サンプルを分離し
、特性韻律曲線を決定する(ステップ414)。音声分析器206は、隠れマル
コフ・モデルのような周知のディジタル信号処理技法を使用してダイフォーン・
セグメント及び韻律曲線を生成する。米国特許第4,961,229号及び同第3
,816,722号は適当な音声分析器を開示している。
音声コーディング回路207は、通常のディジタル・コーディング技法を利用
してダイフォーン・セグメント及び韻律曲線を圧縮し、それによって、伝送帯域
幅及び記憶要件を少なくする(ステップ416)。音声コーディング回路207
はその結果の圧縮された韻律曲線及びダイフォーン・セグメントを伝送装置22
0のRAM226(例えば、メモリ)に記憶する。パイプライン・バースト・メ
モリ、フラッシュ・メモリ、又は縮小サイズDASDのような任意の適当なタイ
プのメモリ装置がRAM226の代わりになり得ることは当業者の認めるところ
である。又、伝送装置220は、音声作動コマンドを受けるための音声作動マイ
クロフォン221、A/Dサブシステム222、音声認識回路224、電源(図
示されていない)、及び送信装置229も含む。
第3図は、リモート・データ処理システム310とコミュニケートするために
、ユーザがワイヤレス伝送装置220を携帯した図を示す。第2図、第3図、及
び第4図を参照すると、好適な実施例でば、ユーザはブローチを身に付けるのと
同様に伝送装置220を身に付ける。別の方法として、ユーザは自分の口に送信
装置220を保持することもできる。ユーザがリモート・データ処理システム(
例えば、ATMマシン)310にある音声認識システム230とコミュニケート
したい時、そのユーザ(伝送装置220を携帯している)はリモート・データ処
理システム310に近づき、音声作動コマンド(例えば、「コンピュータ」、「
ログオン・コンピュ
ータ」)を伝送装置220の音声作動マイクロフォン221に対して発声する(
ステップ418)。「ワイヤレス」は、データ処理システム310が伝送装置2
20に関してワイヤレスであることを意味するということに注意することは重要
である。音声作動マイクロフォン221は音声作動コマンドを検出し、A/Dサ
ブシステム222はその音声作動コマンドをサンプルし、そしてそれをディジタ
ル化する。A/Dサブシステム222は、そのディジタル化された音声作動コマ
ンドを音声認識回路224に送る。
音声認識回路224(及び234)は、IBM Voicetype Dic
tation(商標)という製品、或いは、Dragon音声認識システムにお
ける音声認識回路のような任意の適当な音声認識回路を含む。音声認識回路22
4が音声作動コマンドを認識する場合、それは、そのようなことをプロセッサ2
28に表示する信号を送る。それに応答して、プロセッサ228は送信装置22
9に信号を送って、音声認識システム230の受信装置232へ音声作動コマン
ドを伝送させる(ステップ420)。送信装置229は任意の適当なタイプのワ
イヤレス送信装置(例えば、レーザ、赤外線発生ダイオード)であってもよい。
しかし、好適な実施例では、送信装置229はRF送信装置である。プロセッサ
228は、短いタイムアウト信号をRAM226に送り、音声認識システム23
0が起動させるのを可能にさせる(ステップ422)。
音声認識システム230は、受信装置232、音声圧縮解除回路233、及び
音声認識回路234を含み、ワークステーション100のような任意の適当なワ
ークステーションにある。受信装置232は受信した音声作動コマンドを音声圧
縮解除回路233に送る。そこで、それは圧縮解除される。音声圧縮解除回路2
33は音声作動コマンドを音声認識回路234に送る。音声認識回路234がそ
の音声作動コマンドを認識する場合、それは作動され、伝送装置220から韻律
曲線及びダイフォーン・セグメントを受信するために待機する。従って、単一の
音声作動コマンドが伝送装置220及び音声認識システム230を作動する。従
って、短いタイムアウトの後、プロセッサ228は、送信装置229及び受信装
置232を介して音声認識回路234に韻律曲線及びダイフォーン・セグメント
を送るようにRAM226に指示する(ステップ424及び426)。音声認識
回路234は、それらの韻律曲線及びダイフォーン・セグメントを使用してユー
ザの音声を認識させる。今や、ユーザは、音声認識装置230に直接に話しかけ
ることが可能である。
産業上の利用可能性
従って、好適な実施例は、ユーザが音声作動コマンドを発生すること以外に何
もする必要なしに、ユーザの音声特性をワイヤレス・リモート・マシンに伝送す
る。カードを挿入する必要もない。従って、ユーザは、複数のワイヤレス・リモ
ート・データ処理システムを同時に作動させることができる。これは、カードを
挿入することによっても達成されなかったことである。
特定の実施例に関連して本発明を示し且つ説明したけれども、形式及び詳細に
おける上記及びその他の変更を本発明の技術的範囲内で行い得ることは当業者に
は明らかであろう。
─────────────────────────────────────────────────────
フロントページの続き
(72)発明者 ポストン、リッキー、リー
アメリカ合衆国テキサス州オウスチン、4
デイー、ダブリュ.ランドバーグ 2018
(72)発明者 ウエーナー、ジョン、ハロルド
アメリカ合衆国カリフォルニア州オーシャ
ンサイド、ナイトホーク・ウエイ 5040
Claims (1)
- 【特許請求の範囲】 1.音声認識システムを有する少なくとも1つのリモート音声作動データ処理シ ステムによる改良された音声コミュニケーションのための方法にして、 (a)ユーザの音声特性をワイヤレス伝送装置のメモリに記憶するステップと、 (b)音声作動コマンドに応答して、前記ワイヤレス伝送装置及びリモート音声 認識システムを音声作動するステップと、 (c)前記ワイヤレス伝送装置及び音声認識システムの作動に応答して、メモリ から前記音声認識システムに音声特性を伝送し、それによって、ユーザが前記音 声作動データ処理システムと直接に口頭でコミュニケートすることを可能にする ステップと、 を含む方法。 2.前記ステップ(a)は、 ユーザの音声のサンプルを捕捉するステップと、 捕捉された音声サンプルをディジタル化し、それによってディジタル化音声を 形成するステップと、 音声分析器を使用して前記ディジタル化音声から音声特性を抽出するステップ と、 前記音声特性を前記メモリに記憶するステップと、 を含むことを特徴とする請求の範囲第1項に記載の方法。 3.前記ステップ(b)は、 ユーザからの音声作動コマンドを前記ワイヤレス伝送装置によって受信して前 記伝送装置を起動させるステップと、 前記音声作動コマンドを前記ワイヤレス伝送装置から前記音声認識システムに 伝送して前記音声伝送システムを起動させるステップと、 を含むことを特徴とする請求の範囲第1項又は第2項に記載の方法。 4.前記ステップ(b)は、更に、前記音声特性を伝送する前に、前記音声認識 システムが起動することを可能にするための信号を前記ワイヤレス伝送装置にお けるプロセッサから前記メモリに送るステップを含むことを特徴とする請求の範 囲第3項に記載の方法。 5.前記ステップ(c)は、前記音声特性を前記音声認識システムに伝送するた めの信号を前記プロセッサから前記メモリに送るステップを含むことを特徴とす る請求の範囲第4項に記載の方法。 6.リモート・データ処理システムにあるリモート音声認識システムとの音声コ ミュニケーションを可能にするための音声伝送システムにして、 ユーザの音声特性を記憶するためのメモリを有するワイヤレス伝送装置を含み 、 前記ワイヤレス伝送装置及び音声認識システムは前記ワイヤレス伝送装置によ る受信した音声作動コマンドに応答して作動するように適応すること、及び 前記ワイヤレス伝送装置は前記音声認識システム及びワイヤレス伝送装置の作 動に応答して前記メモリから前記音声認識システムに前記音声特性を伝送し、そ れによって、ユーザが前記音声認識システムと直接に口頭でコミュニケートする ように適応すること を特徴とする音声伝送システム。 7.更に、ユーザの音声サンプルから音声特性を生成するための音声特性抽出装 置を含むことを特徴とする請求の範囲第6項に記載のシステム。 8.前記ワイヤレス伝送装置は音声作動コマンドを受けるためのマイクロフォン と、音声作動コマンドを認識するための音声認識システムと、受け取った音声作 動コマンドを前記音声認識回路に送信するための送信装置とを含むことを特徴と する請求の範囲第6項又は第7項に記載のシステム。 9.前記送信装置はRFトランスミッタを含むことを特徴とする請求の範囲第8 項に記載のシステム。 10.前記ワイヤレス伝送装置は、更に、前記メモリ及び送信装置を制御するた めのプロセッサを含むことを特徴とする請求の範囲第8項又は第9項に記載のシ ステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/497,302 US5704009A (en) | 1995-06-30 | 1995-06-30 | Method and apparatus for transmitting a voice sample to a voice activated data processing system |
US08/497,302 | 1995-06-30 | ||
PCT/GB1996/001544 WO1997002526A1 (en) | 1995-06-30 | 1996-06-27 | Method and apparatus for transmitting a voice sample to a voice activated data processing system |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10507559A true JPH10507559A (ja) | 1998-07-21 |
JP3335178B2 JP3335178B2 (ja) | 2002-10-15 |
Family
ID=23976298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50490997A Expired - Fee Related JP3335178B2 (ja) | 1995-06-30 | 1996-06-27 | 音声サンプルを音声作動データ処理システムに伝送するための方法及び装置 |
Country Status (12)
Country | Link |
---|---|
US (1) | US5704009A (ja) |
EP (1) | EP0836720B1 (ja) |
JP (1) | JP3335178B2 (ja) |
KR (1) | KR100297076B1 (ja) |
CN (1) | CN1095563C (ja) |
CA (1) | CA2220861C (ja) |
CZ (1) | CZ287316B6 (ja) |
DE (1) | DE69606042T2 (ja) |
HU (1) | HUP9801839A3 (ja) |
PL (1) | PL182225B1 (ja) |
TW (1) | TW366483B (ja) |
WO (1) | WO1997002526A1 (ja) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3697748B2 (ja) * | 1995-08-21 | 2005-09-21 | セイコーエプソン株式会社 | 端末、音声認識装置 |
JP3674990B2 (ja) * | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
US5940476A (en) | 1996-06-28 | 1999-08-17 | Distributed Software Development, Inc. | System and method for identifying an unidentified caller |
US6205204B1 (en) | 1996-06-28 | 2001-03-20 | Distributed Software Development, Inc. | System and method for identifying an unidentified person using an ambiguity-resolution criterion |
US5901203A (en) | 1996-06-28 | 1999-05-04 | Distributed Software Development, Inc. | Computer-based system and method for identifying an unidentified caller |
US6529881B2 (en) * | 1996-06-28 | 2003-03-04 | Distributed Software Development, Inc. | System and method for identifying an unidentified customer at the point of sale |
US7006605B1 (en) * | 1996-06-28 | 2006-02-28 | Ochopee Big Cypress Llc | Authenticating a caller before providing the caller with access to one or more secured resources |
JPH10178490A (ja) * | 1996-10-15 | 1998-06-30 | Casio Comput Co Ltd | 音声記憶システム |
JPH10260692A (ja) * | 1997-03-18 | 1998-09-29 | Toshiba Corp | 音声の認識合成符号化/復号化方法及び音声符号化/復号化システム |
US7383200B1 (en) | 1997-05-05 | 2008-06-03 | Walker Digital, Llc | Method and apparatus for collecting and categorizing data at a terminal |
US6567787B1 (en) | 1998-08-17 | 2003-05-20 | Walker Digital, Llc | Method and apparatus for determining whether a verbal message was spoken during a transaction at a point-of-sale terminal |
US5987405A (en) * | 1997-06-24 | 1999-11-16 | International Business Machines Corporation | Speech compression by speech recognition |
US6003004A (en) | 1998-01-08 | 1999-12-14 | Advanced Recognition Technologies, Inc. | Speech recognition method and system using compressed speech data |
GB9824762D0 (en) * | 1998-11-11 | 1999-01-06 | Ncr Int Inc | Self-service terminal |
US6260016B1 (en) | 1998-11-25 | 2001-07-10 | Matsushita Electric Industrial Co., Ltd. | Speech synthesis employing prosody templates |
US6195636B1 (en) | 1999-02-19 | 2001-02-27 | Texas Instruments Incorporated | Speech recognition over packet networks |
US6185533B1 (en) | 1999-03-15 | 2001-02-06 | Matsushita Electric Industrial Co., Ltd. | Generation and synthesis of prosody templates |
NL1012860C2 (nl) * | 1999-08-19 | 2001-02-20 | Nedap Nv | Boerderijautomatiseringssysteem. |
EP1120752A1 (de) * | 2000-01-24 | 2001-08-01 | Franke & Co. Verwaltungs KG | System zur Kontrolle von Zugangs- bzw. Zugriffsberechtigungen |
DE10003617A1 (de) * | 2000-01-28 | 2001-08-02 | Volkswagen Ag | Verfahren und Vorrichtung zur Spracheingabe bei Autoradios |
EP1542120A4 (en) * | 2002-08-22 | 2006-03-01 | Matsushita Electric Ind Co Ltd | CONTROL SYSTEM, METHOD AND PROGRAM WITH A RHYTHM PATTERN |
US20060173681A1 (en) * | 2005-02-01 | 2006-08-03 | Bae Systems Information And Electronic Systems Integration Inc | Semi-covert emergency transmitter |
US20070083367A1 (en) * | 2005-10-11 | 2007-04-12 | Motorola, Inc. | Method and system for bandwidth efficient and enhanced concatenative synthesis based communication |
US10257191B2 (en) | 2008-11-28 | 2019-04-09 | Nottingham Trent University | Biometric identity verification |
WO2010075623A1 (en) * | 2008-12-31 | 2010-07-08 | Bce Inc. | System and method for unlocking a device |
WO2011082521A1 (en) * | 2010-01-06 | 2011-07-14 | Zoran Corporation | Method and apparatus for voice controlled operation of a media player |
ES2958183T3 (es) | 2011-08-05 | 2024-02-05 | Samsung Electronics Co Ltd | Procedimiento de control de aparatos electrónicos basado en el reconocimiento de voz y de movimiento, y aparato electrónico que aplica el mismo |
KR101262700B1 (ko) * | 2011-08-05 | 2013-05-08 | 삼성전자주식회사 | 음성 인식 및 모션 인식을 이용하는 전자 장치의 제어 방법 및 이를 적용한 전자 장치 |
CN102436813A (zh) * | 2011-12-21 | 2012-05-02 | 成都众询科技有限公司 | 一种可控语音控制系统 |
KR20130133629A (ko) * | 2012-05-29 | 2013-12-09 | 삼성전자주식회사 | 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 |
US9135915B1 (en) * | 2012-07-26 | 2015-09-15 | Google Inc. | Augmenting speech segmentation and recognition using head-mounted vibration and/or motion sensors |
CN106296867B (zh) * | 2015-06-11 | 2019-09-06 | 杭州萤石网络有限公司 | 影像记录设备及其影像标记方法 |
CN107256707B (zh) * | 2017-05-24 | 2021-04-30 | 深圳市冠旭电子股份有限公司 | 一种语音识别方法、系统及终端设备 |
US10283117B2 (en) * | 2017-06-19 | 2019-05-07 | Lenovo (Singapore) Pte. Ltd. | Systems and methods for identification of response cue at peripheral device |
JP7044633B2 (ja) * | 2017-12-28 | 2022-03-30 | シャープ株式会社 | 操作支援装置、操作支援システム、及び操作支援方法 |
CN109065058B (zh) * | 2018-09-30 | 2024-03-15 | 合肥鑫晟光电科技有限公司 | 语音通信方法、装置及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0633520B1 (en) * | 1993-07-01 | 2000-09-20 | Koninklijke Philips Electronics N.V. | Remote control having voice input |
US5657425A (en) * | 1993-11-15 | 1997-08-12 | International Business Machines Corporation | Location dependent verbal command execution in a computer based control system |
AU1298995A (en) * | 1993-12-01 | 1995-06-19 | Nhc Corporation | Wireless remote switching system |
US5444673A (en) * | 1994-07-12 | 1995-08-22 | Mathurin; Trevor S. | Audio controlled and activated wristwatch memory aid device |
-
1995
- 1995-06-30 US US08/497,302 patent/US5704009A/en not_active Expired - Lifetime
-
1996
- 1996-05-15 TW TW085105742A patent/TW366483B/zh active
- 1996-06-27 DE DE69606042T patent/DE69606042T2/de not_active Expired - Lifetime
- 1996-06-27 CZ CZ19973953A patent/CZ287316B6/cs not_active IP Right Cessation
- 1996-06-27 PL PL96324025A patent/PL182225B1/pl unknown
- 1996-06-27 KR KR1019970708903A patent/KR100297076B1/ko not_active IP Right Cessation
- 1996-06-27 EP EP96920991A patent/EP0836720B1/en not_active Expired - Lifetime
- 1996-06-27 JP JP50490997A patent/JP3335178B2/ja not_active Expired - Fee Related
- 1996-06-27 CN CN96195188A patent/CN1095563C/zh not_active Expired - Lifetime
- 1996-06-27 WO PCT/GB1996/001544 patent/WO1997002526A1/en active IP Right Grant
- 1996-06-27 HU HU9801839A patent/HUP9801839A3/hu unknown
- 1996-06-27 CA CA002220861A patent/CA2220861C/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
KR100297076B1 (ko) | 2001-08-07 |
JP3335178B2 (ja) | 2002-10-15 |
PL182225B1 (pl) | 2001-11-30 |
CN1095563C (zh) | 2002-12-04 |
US5704009A (en) | 1997-12-30 |
EP0836720B1 (en) | 2000-01-05 |
WO1997002526A1 (en) | 1997-01-23 |
HUP9801839A3 (en) | 2002-09-30 |
CA2220861A1 (en) | 1997-01-23 |
DE69606042T2 (de) | 2000-10-26 |
HUP9801839A2 (hu) | 1998-11-30 |
PL324025A1 (en) | 1998-05-11 |
TW366483B (en) | 1999-08-11 |
CZ395397A3 (cs) | 1999-01-13 |
KR19990022423A (ko) | 1999-03-25 |
DE69606042D1 (de) | 2000-02-10 |
CA2220861C (en) | 2002-11-05 |
CZ287316B6 (en) | 2000-10-11 |
EP0836720A1 (en) | 1998-04-22 |
CN1189900A (zh) | 1998-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH10507559A (ja) | 音声サンプルを音声作動データ処理システムに伝送するための方法及び装置 | |
US10614803B2 (en) | Wake-on-voice method, terminal and storage medium | |
US6167376A (en) | Computer system with integrated telephony, handwriting and speech recognition functions | |
US6415256B1 (en) | Integrated handwriting and speed recognition systems | |
US5960399A (en) | Client/server speech processor/recognizer | |
US20150325240A1 (en) | Method and system for speech input | |
CN112650831A (zh) | 虚拟形象生成方法、装置、存储介质及电子设备 | |
US20050114132A1 (en) | Voice interactive method and system | |
JP2002540477A (ja) | クライアント−サーバ音声認識 | |
WO2020024620A1 (zh) | 语音信息的处理方法以及装置、设备和存储介质 | |
JP2007102787A (ja) | インスタント・メッセージを可聴音信号によって注釈付けする方法、システム及びプログラム | |
CN107104994B (zh) | 语音识别方法、电子装置及语音识别系统 | |
KR102628211B1 (ko) | 전자 장치 및 그 제어 방법 | |
US20020198716A1 (en) | System and method of improved communication | |
JP2011504624A (ja) | 自動同時通訳システム | |
CN113611316A (zh) | 人机交互方法、装置、设备以及存储介质 | |
JPH06131108A (ja) | 情報入力装置 | |
JP2015052743A (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム | |
JP7091745B2 (ja) | 表示端末、プログラム、情報処理システム及び方法 | |
Roy et al. | Wearable audio computing: A survey of interaction techniques | |
KR950014504B1 (ko) | 전자문서를 음성 처리하는 휴대용 컴퓨터 디바이스 | |
CN110534084B (zh) | 一种基于FreeSWITCH的智能语音控制方法及系统 | |
JPH09319297A (ja) | 音声筆談器 | |
JP2015052744A (ja) | 情報処理装置、制御方法、及びプログラム | |
WO2021171417A1 (ja) | 発話終端検出装置、制御方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |