JP3088739B2 - 音声認識システム - Google Patents

音声認識システム

Info

Publication number
JP3088739B2
JP3088739B2 JP02261164A JP26116490A JP3088739B2 JP 3088739 B2 JP3088739 B2 JP 3088739B2 JP 02261164 A JP02261164 A JP 02261164A JP 26116490 A JP26116490 A JP 26116490A JP 3088739 B2 JP3088739 B2 JP 3088739B2
Authority
JP
Japan
Prior art keywords
input
interrupt
voice
keyboard
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP02261164A
Other languages
English (en)
Other versions
JPH03206521A (ja
Inventor
晴剛 安田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JPH03206521A publication Critical patent/JPH03206521A/ja
Application granted granted Critical
Publication of JP3088739B2 publication Critical patent/JP3088739B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Description

【発明の詳細な説明】 技術分野 本発明は、音声認識入力システム又はその一部を有す
るコンピュータの音声入力に関する。
従来技術 従来の音声認識システムでは、音声認識システムはコ
ンピュータからの指令により入力された音声を認識する
処理を実行し、その結果をコンピュータに出力した後、
次の命令を待つ様に動作する。
すなわち、音声によるデータ入力が必要なたびにコン
ピュータから音声認識装置に命令を送って認識動作を行
わせ、応答として認識結果を受けとる方式が用いられて
いる。従って、コンピュータのプログラムには音声認識
システムに命令を出力し、認識結果を受け取るルーチン
と、音声入力が必要となる毎に入力を促すルーチンを具
備しなければならなかった。従って、各種のプログラム
でこれを用いる場合、上記プログラムを各々のプログラ
ムに具備させねばならず、大幅な修正が必要であるとと
もに、キーボードとの並行入力が難しかった。また、従
来、認識終了時に割り込み信号を生成し、その割り込み
信号により認識結果に対応する文字列をキーバッファに
転送する方式をとっていたが、この場合、キー入力と音
声入力を同時に並行して行った場合、送られてくるキー
データの内容がこわれる事が予想され問題であった。更
に、音声認識結果に対応する文字列は予じめ、他のプロ
グラムで生成されており、変更する事が容易ではなかっ
た。
コンピュータに音声を用いて入力する場合の一方法と
してキーボード入力をエミュレーションする方法が考え
られる。すでに流通している市販のソフトウェアのコマ
ンドはその機能略称をキー入力のために記号化してあ
り、これに音声入力を用いる場合、機能略称を発声して
その認識結果としてキー入力記号をシステムに送ればそ
の機能を実現でき、一般に、これを音声キーエミュレー
ションと呼んでいる。
一般に、音声キーエミュレータはキーボードの各々の
キーに対応する様に単音節認識を行なう方法、また単語
単位のキーストロークに対応するように単語認識でおこ
なう方法などが考えられるが、前者の場合、機能名称に
対し必要なキーストロークを区切って発生することは非
常に不自然となり、一般には単語認識を用いて行う方が
より使いやすい。
単語認識によりキーエミュレーションを実現する場
合、認識に必要な音声辞書の各単語に対する発声ストリ
ングと認識結果にしたがってキーボードバッファに転送
するキーストロークストリングが必要となるが(例えば
「移動」に対して発声ストリングは「いどう」キースト
ロークストリングは「IDOU」),コマンド入力として用
いる場合は発声ストリングに対してキーストロークスト
リングをユーザの必要なキーストローク列に設定して用
いる。つまり「移動」という単語に対して使おうとする
アプリケーションのコマンドが「p/s」であるならば「p
/s」と設定する。この様に単語認識を用いる場合、アプ
リケーションプログラム(例えば、ワープロソフトやデ
ータベースソフト)のコマンド操作に置き換えると大変
有効に使える。
さらに、そのコマンドの複合動作にも用いることが可
能である。つまり、アプリケーションの個別のコマンド
の「移動」のコマンドキーストロークが“p/s/改行”、
「複写」のそれが“f/改行”であったとすると、発声ス
トリング「コピー」を有する音声辞書に対してこの文字
ストリング“p/s/改行/f/改行”をキーバッファに転送
することにより一回の発声でコマンドの複数駆動が可能
となる。
しかしながら、この様な音声キーエミュレータを実現
しようとする場合、何らかの形で主走行プログラムと認
識プログラムとの並行処理が必要となり、一般には、発
声トリガキーを用いて認識処理プログラムに切り換え
る。
この発声トリガキーは一般には特殊なキー操作(例え
ばALT−V,CTL−V…)を与え、必要に応じて変更する。
更に、第11図に示す様なキーストロークの編集も同様
に主走行プログラム上で行える様に同様の方法を用い
る。
この様に音声キーエミュレータを実現するためには、
走行中のプログラムからそのトリガキーを取得せねばな
らず、主走行プログラムに影響を及ぼさない様にする方
法が難しかった。
目的 本発明は、上述のごとき実情に鑑みてなされたもの
で、キーボードから入力されるキーデータの内容をチェ
ックし、その内容があらかじめ定められた内容の時のみ
音声認識のためのデータ入力を可能とし認識処理を行う
事により既存のプログラムを何ら修正せず、又、走行中
のプログラムに影響を与えないで、音声入力及び音声認
識処理を実行せしめることのできる音声入力システムを
提供することを目的としてなされたものである。
構成 本発明は、上記目的を達成するために、(1)キーボ
ードなどのキーデータを入力する手段と、演算処理を行
うCPUと、前記演算処理の結果を表示する表示手段と、
マイクから入力された音声を増幅、補正などを行う信号
処理手段と、得られた信号を周波数解析し、音声の特徴
パラメータを得る手段と、更にこの特徴パラメータをあ
る周期毎に入力する手段と、得られた特徴パラメータ列
から音声区間を検出する手段と、得られたデータに基い
て標準パターンを作成する手段と、その標準パターンを
メモリに格納する手段と、更に未知入力データに対して
標準パターンと比較認識する手段と、認識結果に対する
文字列データを有し、その文字列をキーボードバッファ
に転送する音声認識システムにおいて、キーボードが押
される毎に発声する割り込み信号によりキーボードデー
タの内容を確認し、その内容があらかじめ定められた内
容と合致する時は、割り込みプログラムにより音声入力
の割り込みを許可し、データの入力を行い認識処理を行
う事、更には、(2)前記(1)において、音声入力が
許可された時点では、音声入力の周期割り込みとキーボ
ードの入力割り込みが許可され、音声区間検出手段によ
り音声の始端が検出された時点でキーボード割り込みを
禁止する事、更には、(3)前記(1)又は(2)にお
いて、前記あらかじめ定められたキーとは別のあらかじ
め定めたキーが確認された場合、文字列の変更を可能に
する事、或いは、キーボードなどのキーデータを入力す
る手段と、演算処理を行うCPUと、前記演算処理の結果
を表示する表示手段と、マイクから入力された音声を増
幅、補正などを行う信号処理手段と、得られた信号を周
波数解析し、音声の特徴パラメータを得る手段と、この
特徴パラメータをある周期毎に入力する手段と、得られ
た特徴パラメータ列から音声区間を検出する手段と、得
られたデータに基いて標準パターンを作成する手段と、
その標準パターンをメモリに格納する手段と、未知入力
データに対して標準パターンと比較認識する手段と、認
識結果に対する文字列データを有し、その文字列をキー
ボードバッファに転送する音声認識システムにおいて、
キーボードが押される毎に発生する割り込み信号により
キーボードデータの内容を確認し、その内容があらかじ
め定められた内容と合致する時は、合致フラグをONとし
て本割り込みを終了し、このキー割り込み処理とは別の
第三の割り込み処理ルーチン又は主走行プログラム中
で、この合致フラグを検査してこれがONの時音声入力の
割り込みを許可し、データの入力を行って認識処理を行
う事を特徴とするものである。以下、本発明の実施例に
基いて説明する。
第1図は、本発明の一実施例を説明するための構成図
で、図中、1はマイクロフォン、2は前処理部、3は特
徴パラメータ抽出部、4は音声区間検出部、5は特徴パ
ラメータ入力制御部、6はキーボード割り込み制御部、
7はキーデータチェック部、8は周期信号発生部、9は
データ入力部、10は入力バッファ、11は標準パターンメ
モリ、12は認識処理部、13は結果出力部、14は文字列変
換部、15はキー入力データバッファで、マイク1から入
力された音声信号は前処理部2において増幅、補正さ
れ、特徴パラメータ抽出部3において周波数解析を行
い、例えば、パワースペクトルやLPCケプストラムなど
の認識処理に必要な特徴パラメータ列を生成する。一
方、前処理部2からの音声信号と、前記特徴パラメータ
に従って音声区間検出部4で音声区間が検出された特徴
パラメータ入力制御部5へその信号が送られる。
又、パーソナルコンピュータへ入力されるキーデータ
は、キーデータチェック部7で一旦データが格納され、
その内容がチェックされる。このチェックは具体的には
キーボードが押される事による割り込み信号に基いて、
第2図に示すフローを有する割り込み処理プログラムに
おいて、あらかじめ定めた特定のキーが押されたかどう
かをチェックする(例えば、“ALT−V"などの特殊キー
ストローク)。
第3図は、特定のキーが押された場合のフローを示す
図で、押されたキーが特殊キーであった場合は、この信
号が特徴パラメータ入力制御部5へ送られ、周期信号発
生部8で生成される周期時間パルスによる割り込みを許
可する。データ入力部9は、この周期信号(例えば5〜
20ms周期)に基いて、データの入力を開始する。更にこ
のデータ入力部9においては音声の入力が開始されるま
では音声データとキーデータの入力をチェックし、音声
区間検出部4から区間検出信号に従って音声の始端が検
出された事を確認して音声の特徴パラメータ列を入力バ
ッファ10に入れると同時に、認識処理12を開始させ、第
3図に示した音声処理を行う。この時、キーボードから
の不用意な割り込みを禁止するために、この時点でキー
ボードの割り込みを音声入力より先にキーボード割り込
みが生じた場合はキーデータの読み込みを優先して行
い、音声入力処理をキャンセルする。この様にして得ら
れた入力バッファの特徴パラメータ列とあらかじめ登録
されている標準パターン11を認識処理部12において認識
処理を行い、その結果を結果出力部13にて求めてその結
果に対応する文字列に文字列変換部14において変換し、
キー入力データバッファ15に転送し、キーボード入力と
等価する。
更に上記キーデータ入力キーとは別に、第4図に示す
ように、あらかじめ第2の特定キーを設定しておき(例
えば、CTL−Sなど)、そのキーが確認された場合は、
認識結果に対応する文字列データーを例えばディスプレ
イ等で変更できる様構成する事により、同様に即座に結
果に対する文字列データが変更され有効である。
なお、以上には、特定のキーを用いてパソコン上で走
行しているアプリケーションに割り込む例について説明
したが、第2図に破線で示したように入力音声の始端を
検出して割り込みをするようにしてもよい。第5図は、
その場合のフローを示す図で、周期信号発生部8よりの
パルス信号により入力音声の始端を常時検出しており、
始端が検出された場合には、前記キー割り込みと同様に
して割り込みをかける。この場合、音声入力を行うため
の周期割り込みパルスにより駆動させる割り込みプログ
ラムを有しており、この割り込みにより、音声のデータ
入力及び認識処理を行うものであるが、始端が検出され
る前にキーボードが押された場合にはキーボードの処理
を行い、また、音声の入力、認識処理が行われている途
中でキー入力があった場合には、上記の処理をキャンセ
ルする。
而して、以上に説明した例では、ある特定のキー入力
があった場合、音声入力のトリガキーとして受けつけ、
以後、主走行プログラムから音声入力処理ルーチンに処
理を切り換えて認識処理を行っており、この場合、認識
処理ルーチンは主走行プログラム又は対象コンピュータ
の走行環境を考慮しておらず、場合によっては、クリテ
ィカルな処理を中断し、システムエラーをもたらす心配
があった。つまり、キーボード割り込み処理は、一般に
は、ハードウェア割り込み処理でキーが押される事によ
り物理的な信号が発生し割り込み処理を行うものであ
り、従って、本処理ルーチンは、主走行ルーチン又はそ
の他の環境を考慮していないため、本キー割り込み処理
ルーチン内で音声入力を促す事がシステム(PC)にとっ
て良いタイミングとは限らない。つまり、アプリケーシ
ョン等がキー入力を期待しないフェーズでも発生する。
以下に、上述のごとき不具合を回避するための実施例
について説明する。
前述のように、キー割り込み中で予め設定されている
トリガキーと押されたキーが合致した時にそのまま音声
処理にジャンプさせた場合、走行している主プログラム
やシステムの事を考慮せずに音声の入力待ちとなり、こ
れが停止するため、不具合を生ずる。従って、本キー入
力割り込み処理では、その場合、別途合致フラグを設
け、合致フラグをONにしてそのキー割り込み処理を抜
け、主プログラムに戻る。つまり、第6図(a)に示す
キー割り込み処理ルーチン間で、押されたキーが合致し
た場合は合致フラグをONにする事により、この時点では
通常のキー処理ルーチンを実行し、第6図(b)に示す
他割込み処理ルーチン内で、合致フラグを検査し合致フ
ラグがONならば音声入力処理を行う。この第6図(b)
に示した処理は、例えば、主走行プログラムが安定状態
にある時に発生する割り込みやキーボード待ちになった
時に発生する割り込み等を用いる。具体的には、例え
ば、MS−DOSのシステムコールにおいてMS−DOS状態にあ
る時に発生する割り込みやキー入力待ちになった時に発
生するBIOS等がある。
第7図及び第8図は、第6図に示した実施例の有効性
を説明するための図で、第7図に示すように、クリティ
カルなJOBを行っている時に、音声入力のためのキー割
り込みが発生しても、この時はクリティカルなJOBを行
っているため、音声入力処理に移ると不具合が生じる。
つまり、キー割り込みが発声して、その内容が音声入力
の場合かどうかの判断は、第8図に示す割り込み処理ル
ーチン内で行うが、その処理を行うかどうかは主走行プ
ロプログラム又はシステムの状態を鑑みて行う必要があ
る。従って、キー割り込み処理ルーチン内ではその内容
が音声入力を促すものかどうかのみを判断し、主走行プ
ログラムがキー待ちルーチンに入った時点で音声処理に
移行する方が望ましい。
第9図は、前述の合致フラグを主走プログラムで検査
する場合の例を説明するためのフローチャートである。
この合致フラグは主走行プログラムで検査しても良
く、具体的には主走行プログラムの最も都合の良いタイ
ミングを待ってその合致フラグのチェックを行えば良
い。この場合、キー割り込みが生じ合致フラグがONされ
て、ユーザの発声を待たせる場合は、例えば、Busy,Rea
dy等の表示を行って多少の入力タイミングの表示を行っ
ても良い。つまり、主走行プログラムの最も都合の良い
時(一般的にはキー入力を要求している時)に音声入力
を促し、その認識結果に対応する文字例をキーボードバ
ッファに転送する。而して、上記処理において、例え
ば、複数の割り込み処理内で合致フラグのチェックを行
う事も考えられる。つまり、MS−DOSの安定状態に発生
する割り込みとキー入力待ちのBIOSが呼ばれた時に発生
する割り込み等の複数の割り込みのどれかで検知された
場合に、その処理を行う様にし、その処理が終了したら
合致フラグをOFFとする。例えば、MS−DOSのキー入力待
ちには、MS−DOSのシステムコール、キー入力待ちのBIO
Sコール等が用意されており、システムコールではMS−D
OSのコマンド入力待ち時の安定状態で呼ばれる内部割り
込み等があり、同様にキー入力待ちのコール等もある。
更に、上記の合致フラグのチェックは、例えば第10図
に示すように、認識装置20内に設けられているノイズ検
知装置21からの信号によって行ってもよい。つまり、ノ
イズ検知装置により周囲雑音が比較的静かな時に合致フ
ラグのチェックを行いONならば音声入力処理を行う。
効果 以上の説明から明らかなように、本発明によると、音
声入力を用いたプログラムを修正する事もなく、又、現
在走行中のプログラムに影響を与えずに音声認識結果を
キーボード入力と同様に用いる事ができ、更には、現在
走行中のプログラムに影響を与えずに音声入力によるキ
ーエミュレーションを実現できる。
【図面の簡単な説明】 第1図は、本発明の一実施例を説明するための構成図、
第2図は、割り込み処理のフローチャート、第3図は、
請求項1及び2に記載のキーが押された時のフローを示
す図、第4図は、請求項3に記載のキーが押された時の
フローを示す図、第5図は、入力音声の始端を検出して
割り込みをする時のフローを示す図、第6図は、キー割
り込み及びキー以外の割り込みルーチンを説明するため
のフローチャート、第7図及び第8図は、第6図に示し
た実施例の有効性を説明するための図、第9図は、合致
フラグを主走査プログラムで検査する場合の例を示す
図、第10図は、合致フラグチェックを説明するための
図、第11図は、結集画面の一例を示すための図である。 1……マイクロフォン、2……前処理部、3……特徴パ
ラメータ抽出部、4……音声区間検出部、5……特徴パ
ラメータ入力制御部、6……キーボード割り込み制御
部、7……キーデータチェック部、8……周期信号発生
部、9……データ入力部、10……入力バッファ、11……
標準パターンメモリ、12……認識処理部、13……結果出
力部、14……文字列変換部、15……キー入力データバッ
ファ。

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】キーボードなどのキーデータを入力する手
    段と、演算処理を行うCPUと、前記演算処理の結果を表
    示する表示手段と、マイクから入力された音声を増幅、
    補正などを行う信号処理手段と、得られた信号を周波数
    解析し、音声の特徴パラメータを得る手段と、この特徴
    パラメータをある周期毎に入力する手段と、得られた特
    徴パラメータ列から音声区間を検出する手段と、得られ
    たデータに基いて標準パターンを作成する手段と、その
    標準パターンをメモリに格納する手段と、未知入力デー
    タに対して標準パターンと比較認識する手段と、認識結
    果に対する文字列データを有し、その文字列をキーボー
    ドバッファに転送する音声認識システムにおいて、キー
    ボードが押される毎に発生する割り込み信号によりキー
    ボードデータの内容を確認し、その内容があらかじめ定
    められた内容と合致する時は、割り込みプログラムによ
    り音声入力の割り込みを許可し、データの入力を行って
    認識処理を行う事を特徴とする音声認識システム。
  2. 【請求項2】音声入力が許可された時点では音声入力の
    周期割り込みとキーボードの入力割り込みが許可され、
    音声区間検出手段により音声の始端が検出された時点で
    キーボード割り込みを禁止する事を特徴とする請求項1
    に記載の音声認識システム。
  3. 【請求項3】前記あらかじめ定められたキーとは別のあ
    らかじめ定めたキーが確認された場合に、文字列の変更
    を可能にする事を特徴とする請求項1又は2に記載の音
    声認識システム。
  4. 【請求項4】キーボードなどのキーデータを入力する手
    段と、演算処理を行うCPUと、前記演算処理の結果を表
    示する表示手段と、マイクから入力された音声を増幅、
    補正などを行う信号処理手段と、得られた信号を周波数
    解析し、音声の特徴パラメータを得る手段と、この特徴
    パラメータをある周期毎に入力する手段と、得られた特
    徴パラメータ列から音声区間を検出する手段と、得られ
    たデータに基いて標準パターンを作成する手段と、その
    標準パターンをメモリに格納する手段と、未知入力デー
    タに対して標準パターンと比較認識する手段と、認識結
    果に対する文字列データを有し、その文字列をキーボー
    ドバッファに転送する音声認識システムにおいて、キー
    ボードが押される毎に発生する割り込み信号によりキー
    ボードデータの内容を確認し、その内容があらかじめ定
    められた内容と合致する時は、合致フラグをONとして本
    割り込みを終了し、このキー割り込み処理とは別の第三
    の割り込み処理ルーチン又は主走行プログラム中で、こ
    の合致フラグを検査し、これがONの時は音声入力の割り
    込みを許可し、データの入力を行って認識処理を行う事
    を特徴とする音声認識システム。
JP02261164A 1989-10-06 1990-09-28 音声認識システム Expired - Lifetime JP3088739B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP1-261295 1989-10-06
JP26129589 1989-10-06

Publications (2)

Publication Number Publication Date
JPH03206521A JPH03206521A (ja) 1991-09-09
JP3088739B2 true JP3088739B2 (ja) 2000-09-18

Family

ID=17359815

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02261164A Expired - Lifetime JP3088739B2 (ja) 1989-10-06 1990-09-28 音声認識システム

Country Status (2)

Country Link
US (1) US5231691A (ja)
JP (1) JP3088739B2 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7242988B1 (en) * 1991-12-23 2007-07-10 Linda Irene Hoffberg Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
JP3286339B2 (ja) * 1992-03-25 2002-05-27 株式会社リコー ウインドウ画面制御装置
US5983179A (en) * 1992-11-13 1999-11-09 Dragon Systems, Inc. Speech recognition system which turns its voice response on for confirmation when it has been turned off without confirmation
US5546565A (en) * 1993-06-21 1996-08-13 Casio Computer Co., Ltd. Input/output apparatus having a pen, and method of associating and processing handwritten image data and voice data
JP3267047B2 (ja) * 1994-04-25 2002-03-18 株式会社日立製作所 音声による情報処理装置
US5764852A (en) * 1994-08-16 1998-06-09 International Business Machines Corporation Method and apparatus for speech recognition for distinguishing non-speech audio input events from speech audio input events
US5659665A (en) * 1994-12-08 1997-08-19 Lucent Technologies Inc. Method and apparatus for including speech recognition capabilities in a computer system
GB2296349A (en) * 1994-12-19 1996-06-26 Secr Defence Maintaining order of input data events
US5748191A (en) * 1995-07-31 1998-05-05 Microsoft Corporation Method and system for creating voice commands using an automatically maintained log interactions performed by a user
US5857172A (en) * 1995-07-31 1999-01-05 Microsoft Corporation Activation control of a speech recognizer through use of a pointing device
US5864815A (en) * 1995-07-31 1999-01-26 Microsoft Corporation Method and system for displaying speech recognition status information in a visual notification area
US5761641A (en) * 1995-07-31 1998-06-02 Microsoft Corporation Method and system for creating voice commands for inserting previously entered information
EP2184864A3 (en) 1996-04-26 2011-12-14 AT & T Corp. Method and apparatus for data transmission using multiple transmit antennas
JPH09330336A (ja) * 1996-06-11 1997-12-22 Sony Corp 情報処理装置
US5864807A (en) * 1997-02-25 1999-01-26 Motorola, Inc. Method and apparatus for training a speaker recognition system
US6856960B1 (en) * 1997-04-14 2005-02-15 At & T Corp. System and method for providing remote automatic speech recognition and text-to-speech services via a packet network
US8209184B1 (en) 1997-04-14 2012-06-26 At&T Intellectual Property Ii, L.P. System and method of providing generated speech via a network
US6078886A (en) * 1997-04-14 2000-06-20 At&T Corporation System and method for providing remote automatic speech recognition services via a packet network
US6292857B1 (en) * 1997-06-05 2001-09-18 Microsoft Corporation Method and mechanism for coordinating input of asynchronous data
US6038534A (en) * 1997-09-11 2000-03-14 Cowboy Software, Inc. Mimicking voice commands as keyboard signals
DE19914631A1 (de) * 1999-03-31 2000-10-12 Bosch Gmbh Robert Eingabeverfahren in ein Fahrerinformationssystem
CN100488214C (zh) * 2000-11-17 2009-05-13 三洋电机株式会社 具有话音输入操作功能的电话装置
US8942985B2 (en) 2004-11-16 2015-01-27 Microsoft Corporation Centralized method and system for clarifying voice commands
US20060123220A1 (en) * 2004-12-02 2006-06-08 International Business Machines Corporation Speech recognition in BIOS
US7703037B2 (en) * 2005-04-20 2010-04-20 Microsoft Corporation Searchable task-based interface to control panel functionality
US7925975B2 (en) * 2006-03-10 2011-04-12 Microsoft Corporation Searching for commands to execute in applications
US20080282154A1 (en) * 2006-09-11 2008-11-13 Nurmi Mikko A Method and apparatus for improved text input
WO2008100518A1 (en) * 2007-02-13 2008-08-21 Ntera Limited Voltage feedback circuit for active matrix reflective display devices
US20220308718A1 (en) * 2021-03-23 2022-09-29 Microsoft Technology Licensing, Llc Voice assistant-enabled client application with user view context and multi-modal input support

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH644246B (fr) * 1981-05-15 1900-01-01 Asulab Sa Dispositif d'introduction de mots a commande par la parole.
DE3129282A1 (de) * 1981-07-24 1983-02-10 Siemens AG, 1000 Berlin und 8000 München Verfahren zur sprecherabhaengigen erkennung von einzelnen gesprochenen worten in fernmeldesystemen
DE3129353A1 (de) * 1981-07-24 1983-02-10 Siemens AG, 1000 Berlin und 8000 München Verfahren zur sprecherunabhaengigen erkennung von gesprochenen worten in fernmeldesystemen
JPS58195957A (ja) * 1982-05-11 1983-11-15 Casio Comput Co Ltd 音声によるプログラム実行方式
US4741036A (en) * 1985-01-31 1988-04-26 International Business Machines Corporation Determination of phone weights for markov models in a speech recognition system
US4776016A (en) * 1985-11-21 1988-10-04 Position Orientation Systems, Inc. Voice control system
US4931950A (en) * 1988-07-25 1990-06-05 Electric Power Research Institute Multimedia interface and method for computer system

Also Published As

Publication number Publication date
US5231691A (en) 1993-07-27
JPH03206521A (ja) 1991-09-09

Similar Documents

Publication Publication Date Title
JP3088739B2 (ja) 音声認識システム
JP3662780B2 (ja) 自然言語を用いた対話システム
US7260529B1 (en) Command insertion system and method for voice recognition applications
JP3286339B2 (ja) ウインドウ画面制御装置
US7827035B2 (en) Speech recognition system and method
JP2746875B2 (ja) 辞書操作装置
US20020123894A1 (en) Processing speech recognition errors in an embedded speech recognition system
US5794189A (en) Continuous speech recognition
US5799279A (en) Continuous speech recognition of text and commands
US20020103644A1 (en) Speech auto-completion for portable devices
JP2661701B2 (ja) 情報処理方法
JPH03163623A (ja) 音声制御コンピュータ・インターフェース
US20110264452A1 (en) Audio output of text data using speech control commands
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
JP2002116796A (ja) 音声処理装置、音声処理方法及び記憶媒体
US5870705A (en) Method of setting input levels in a voice recognition system
JP2003005789A (ja) 文字処理装置および方法
JP2008051883A (ja) 音声合成制御方法および装置
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JPH10111784A (ja) パーソナルコンピュータおよびコマンド制御方法
JPH064264A (ja) 音声入出力システム
JPH07219584A (ja) 音声処理装置及び方法
KR20020040300A (ko) 컴퓨터를 이용한 음성인식시스템 및 그 제어방법
JPS6248855B2 (ja)
JPS60120429A (ja) 音声入力装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070714

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080714

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090714

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090714

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100714

Year of fee payment: 10