JPH03253938A - 音声認識システム - Google Patents

音声認識システム

Info

Publication number
JPH03253938A
JPH03253938A JP2053016A JP5301690A JPH03253938A JP H03253938 A JPH03253938 A JP H03253938A JP 2053016 A JP2053016 A JP 2053016A JP 5301690 A JP5301690 A JP 5301690A JP H03253938 A JPH03253938 A JP H03253938A
Authority
JP
Japan
Prior art keywords
recognition
word
processing
result
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2053016A
Other languages
English (en)
Inventor
Harutake Yasuda
安田 晴剛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2053016A priority Critical patent/JPH03253938A/ja
Publication of JPH03253938A publication Critical patent/JPH03253938A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 圧樫立互 本発明は、音声認識システム、より詳細には、音声認識
置を有するシステム(例えば音声認識システムを有する
パーソナルコンピュータ)の音声認識ニよるキーエミュ
レータの認識制御方式に関する。
丈来技先 従来より音声認識装置またはシステムをパーソナルコン
ピュータなどの入力に音声を用いる方式が検討されてい
るが、キーエミュレータはユーザが入力するキーストロ
ークの代わりに音声認識を利用して認識結果に従った結
果のキーストリングをキーボード人カバツファに転送し
キーボードでの入力と同様の効果を得ようとするもので
ある。
特に単語認識を用いる場合は、アプリケーションプログ
ラムなどのコマンド入力などに有用で、複雑なキースト
ロークを音声で置き換えることが可能である。
また、このキーエミュレータはキーボードの制御と同様
に走行中のアプリケーションプログラムと並行して走行
することが必要で、これは、例えば、特願平1−261
295号で提案したように、キーボードが押される毎に
発生する割り込み信号によりキーボードデータの内容を
確認し、その内容があらかじめ定められた内容と合致す
る時は、割り込みプログラムにより音声入力の割り込み
を許可し、データの入力を行って認識処理を行うことに
より実現可能となる。
上記のキーエミュレータでは対象単語に対するキースト
リングの一回の実行に対して一回の発声となる。従って
、何回も繰り返して実行するコマンド、例えばカーソル
移動キーや画面のスクロールキー等は繰り返して発声せ
ねばならず、現実的にはキー繰作で行った方が早く、使
用されなかった。
一般に、音声キーエミュレータはキーボードの各々のキ
ーに対応する様に単音節認識を行なう方法、また、単語
単位のキーストロークに対応するように単語認識でおこ
なう方法などが考えられるが、前者の場合、必要なキー
ストロークを区切って発生することは非常に不自然とな
り、一般には、単語認識を用いて行う方がより使いやす
い。
単語認識によりキーエミュレータを実現する場合、認識
に必要な音声辞書の各単語に対する発声ストリングと認
識結果にしたがってキーボードバッファに転送するキー
ストロークストリングが必要となるが(例えば「移動」
に対して発声ストリングは「いどう」、キーストローク
ストリングはrIDOUJ)、コマンド入力として用い
る場合は発声ストリングに対してキーストロークストリ
ングをユーザの必要なキーストローク列に設定して用い
る。つまり「移動」という単語に対して使おうとするア
プリケーションのコマンドがrp/S」であるならば文
字ストリングはr p / s Jと設定する。この様
に単語認識を用いる場合アプリケーションプログラム(
例えば、ワープロソフトやデータベースソフト)のコマ
ンド繰作に置き換えると大変有効に使える。
さらにそのコマンドの複合動作にも用いることが可能で
ある。つまりアプリケーションの個別のコマンドの「移
動」のコマンドキーストロークが” p / s /改
行”、「複写」のそれが“f/改行”であったとすると
、発声ストリング「コピー」を有する音声辞書に対して
この文字ストリング” p / s /改行/f/改行
″をキーバッファに転送することにより一回の発声でコ
マンドの複数騨動が可能となる。
このようなメリットを持つ音声キーエミュレータに対し
て、このキーストロークストリングをどのように編集す
るかが問題で、従来においては、予めなんらかの方法で
セットしておくか、上記特願平1−261295号での
キーエミュレータに編集機能を付加しその編集画面上で
編集する。第3図にその編集の一例を示すが、図に示す
様な一般的な編集エディタで容易に達成される。
しかしながら、従来方式で指摘したように、このキーエ
ミュレータではキーストリングに対する実行処理は一発
声に一回となりカーソル移動や画面スクロールなどを音
声で制御しようとすると多数回発声せねばならず、非現
実的である。従って、このような繰り返し処理を音声を
用いて行う方法が望まれていた。
且−一灯 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声キーエミュレータのカーソルや画面等の繰り
返し処理を円滑に音声で制御できるようにすることを目
的としてなされたものである。
遺−−」又 本発明は、上記目的を達成するために、(1)キーボー
ド、ディスプレイなどを有する入力手段と表示手段を有
するシステムであって、音声を入力して得られた特徴量
と予め登録されている標準パターンとのそれの比較演算
を行なってL!!mする手段と、その予め登録された個
々の単語パターンに対して予めユーザにより編集された
文字ストリング列を有し、先の認識結果に基いてそれに
対応する文字ストリング列をキーボードバッファに転送
して、キーボード入力とするキーエミュレータ手段を有
する音声入力システムにおいて、第1の予め定められた
単語を認識した場合に限り第2の音声入力を待ち、その
認識結果のキーストリング列をキーボードバッファにあ
る時間周期で転送しアプリケーションの動作を行うとと
もに、音声の区間検出及びその認識処理を並行して行い
、認識結果が予め定められた第3の単語であった場合に
前記処理を中止することを特徴としたものであり、更に
は、(2)上記(1)において第2、第3の単語の入力
待ち状態、または認識途中に特定のキー人力があった場
合は上記処理を中止するようにしたこと、或いは、(3
)上記(1)においである予め定められた時間内に音声
の入力がない場合。
前記処理を中止するようにしたこと、或いは。
(4)上記(1)において認識された第3の単語が予め
定められた第3の単語でない場合、その認識結果を第2
の認識結果に対するキーストリングに入れ替え、再度同
様に次音声入力を待ち、認識結果が予め定められた第3
の結果に一致したとき、前記処理を中止するようにした
こと、或いは、(5)上記(1)において認識された第
3の単語が予め定められた単語でない場合、前記処理を
継続するか中止するかをユーザに決定させるようにした
こと、或いは、(6)上記(1)において第3認識単語
を「リピート」、「繰り返し」に限定して用いどちらで
も同様の効果を与えるようにしたこと、或いは、(7)
上記(1)において第3の認識単語を「ストップ」、「
リピートストップ」、更には「中止」に限定して用いど
ちらでも同様の効果を与えるようにしたことを特徴とす
るものである。
本発明は、上述のごとき繰り返し処理時の不具合点を解
消するために、ある特定の単語1例えば「リピート」等
が認識された場合、次入力を待ち。
次認識結果に対するキーストリングをキーボードバッフ
ァに周期的に繰り返して転送して繰り返し処理を行い、
更に、アプリケーションの処理と並行して音声入力を待
ち、得られた認識結果が予め定められた第3の単語の場
合、例えば「リピートストップ」等の単語の場合にその
処理を中止するようにしたものである。以下、本発明を
例えばパーソナルコンピュータに適用した音声キーエミ
ュレータを用いて詳細に説明する。
第1図は、本発明による音声キーエミュレータの一実施
例を説明するためのブロック図、第2図は、その動作動
作説明をするためのフローチャートで、図中、1は特徴
抽出部、2は認識演算部、3は登録演算部、4は辞書部
で、該辞書部4は音声辞書4a、キーストリング辞書4
bより成っている。5は結果処理部、6は結果比較部、
7は文字列出力部、10は周期信号発声部、11.12
はレジスタ、工3.14は制御部、15は入力制御部、
20はパーソナルコンピュータシステムで、該パーソナ
ルコンピュータシステム20はキーボードバッファ20
a及びキーボード制御部20bを有している。
最初に、システムの動作の概要を説明する。入力された
音声の未知パラメータを特徴抽出部1で抽出し、認識演
算部2においてすでに登録されている音声辞書4aのそ
れと比較演算を行ない、最も類似性の高い単語をその結
果として結果処理部5に送る。結果処理部5においては
認識結果に対応するキーストロークストリングを検索し
文字列出力部7を介して例えばパーソナルコンピュータ
20のキーボードバッファ20aに転送することにより
、キーボード制御部20bから入力されたものとして処
理される。
次に本発明の詳細な説明する。結果処理部5から得られ
た認識結果は、結果比較部5において比較され、その結
果がレジスタ11に予めセットされている単語1例えば
「リピート」と一致した場合、その真偽の信号を第1制
御部13に送り、かつその認識結果は文字列出力部へ送
られずに保持され、入力制御部工5を通して次入力を促
す。この場合、この情報はパーソナルコンピュータ20
にも送られディスプレイ上にそれを表示しても良し)。
次に入力された音声の認識結果が例えば「カーソルアッ
プ」であった場合、その認識結果を文字列出力部7を通
してパーソナルコンピュータ20へ送られる。ここでは
前認識単語が「リピート」で、すでに繰り返し制御がセ
ットされているため周期信号発生部の周期信号にしたが
って文字列出力部7にある前記認識結果(「カーソルア
ップ」)のキーストリングを周期的に転送する。これに
よりパーソナルコンピュータ20ではこのキーストリン
グをキーボードバッファにとり込みその処理を行う。次
に、次入力での認識結果が結果比較部6で比較され、そ
れがレジスタエ2に予めセットされている例えば「リピ
ートストップ」の場合、第2制御部14では第1制御部
工3の結果をクリアし周期信号の発生を止めキーボード
バッファへの繰り返し転送を中止する。
次に、この処理の実行途中に、第3の単語の認識が誤認
識した場合等は、この繰り返し処理を中断できなくなる
ため、パーソナルコンピュータの特定のキー、例えば、
ESC等が押された場合はパーソナルコンピュータ側か
ら第1制御部にクリア信号を発生し同様に処理を中止す
る。さらに第2、第3の認識時にある一定時間音声の入
力のない場合も同様に処理を中止する。
更に第2の認識結果が例えば「カーソルアップ」で、そ
の次の入力の認識結果が予め定められた第3の認識結果
「リピートストップ」でない場合、例えば「カーソルレ
フト」等の場合は、第2の認識結果を入れ替え、それに
対する繰り返し処理を行う。
上述のように制御することにより繰り返し処理の内容を
適時入れ替えられることになる。
夏−一果 以上の説明から明らかなように、本発明によると、音声
キーエミュレータのカーソルや画面等の繰り返し処理を
円滑に音声で制御できることが可能となる。
【図面の簡単な説明】
第工図は、本発明による音声キーエミュレータの一実施
例を説明するためのブロック図、第2図は、その動作説
明をするためのフローチャート、第3図は、従来の一編
集例を示す図である。 1・・・特徴抽出部、2・・・認識演算部、3・・・登
録演算部、4・・・辞書部、5・・・結果処理部、6・
・・結果比較部、7・・・文字列出力部、10・・・周
期信号発声部、11.12・・・レジスタ、13.14
・・・制御部、15・・・入力制御部、20・・・パー
ソナルコンピュータシステム。 第1図

Claims (1)

    【特許請求の範囲】
  1. 1、キーボード、ディスプレイなどを有する入力手段及
    び表示手段と、音声を入力し得られた特徴量と予め登録
    されている標準パターンの特徴量との比較演算を行なっ
    て認識する手段と、予め登録された個々の単語パターン
    に対して予めユーザにより編集された文字ストリング列
    を有し、先の認識結果に基いてそれに対応する文字スト
    リング列をキーボードバッファに転送して、キーボード
    入力とするキーエミュレータ手段とを有する音声入力シ
    ステムにおいて、第1の予め定められた単語を認識した
    場合に限り第2の音声入力を待ち、その認識結果のキー
    ストリング列をキーボードバッファにある時間周期で転
    送しアプリケーションの動作を行うとともに、音声の区
    間検出及びその認識処理を並行して行い、認識結果が予
    め定められた第3の単語であった場合に前記処理を中止
    することを特徴とする音声認識システム。
JP2053016A 1990-03-05 1990-03-05 音声認識システム Pending JPH03253938A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2053016A JPH03253938A (ja) 1990-03-05 1990-03-05 音声認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2053016A JPH03253938A (ja) 1990-03-05 1990-03-05 音声認識システム

Publications (1)

Publication Number Publication Date
JPH03253938A true JPH03253938A (ja) 1991-11-13

Family

ID=12931104

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2053016A Pending JPH03253938A (ja) 1990-03-05 1990-03-05 音声認識システム

Country Status (1)

Country Link
JP (1) JPH03253938A (ja)

Similar Documents

Publication Publication Date Title
US7260529B1 (en) Command insertion system and method for voice recognition applications
Johnston et al. Unification-based multimodal integration
JP3662780B2 (ja) 自然言語を用いた対話システム
US6477499B1 (en) Window control apparatus and method having function for controlling windows by means of voice-input
JPH08123648A (ja) 対話ボックスを持つデータ処理装置
JPH06138815A (ja) 手話/単語変換システム
JPH08263258A (ja) 入力装置、入力方法、情報処理システムおよび入力情報の管理方法
JPH03206521A (ja) 音声認識システム
JPH08166866A (ja) 対話型インターフェースを具備した編集支援システム
Suhm Multimodal interactive error recovery for non-conversational speech user interfaces
JPH03253938A (ja) 音声認識システム
JP2003271389A (ja) 自然言語によるソフトウェア・オブジェクトの操作方法及びそのためのプログラム
JP2002156996A (ja) 音声認識装置、認識結果修正方法及び記録媒体
JPH03253937A (ja) 音声認識システム
JPH04238530A (ja) 音声入力システム
Dabre et al. A framework for system interfacing of voice user interface for personal computers
JPS60146327A (ja) 計算機対話方法
JP2638119B2 (ja) 音声ウィンドウシステム
JP3071805B2 (ja) 音声入力システム
JPH11102196A (ja) 音声対話システム及び音声対話方法及び記録媒体
JPH03123931A (ja) 音声認識システム
JPH1091309A (ja) 情報入出力装置及び情報入出力方法
KR20030010279A (ko) 음성인식이 가능한 컴퓨터시스템 및 그 제어방법
JPH01130262A (ja) 音声ワードプロセッサ
Rampriya et al. Speech Recognition System for Upper-Limb Impairment: A Text Editor for Programming via Voice