JPH07219585A - 情報処理装置及び方法 - Google Patents

情報処理装置及び方法

Info

Publication number
JPH07219585A
JPH07219585A JP6008496A JP849694A JPH07219585A JP H07219585 A JPH07219585 A JP H07219585A JP 6008496 A JP6008496 A JP 6008496A JP 849694 A JP849694 A JP 849694A JP H07219585 A JPH07219585 A JP H07219585A
Authority
JP
Japan
Prior art keywords
voice
vocabulary
input
command
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6008496A
Other languages
English (en)
Inventor
Takanari Ueda
隆也 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6008496A priority Critical patent/JPH07219585A/ja
Publication of JPH07219585A publication Critical patent/JPH07219585A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声の登録されている認識語彙が限られてい
る場合の、入力しようとする語彙が登録されているか否
かの確認を容易に、しかも確実にする。 【構成】 入力音声を認識する音声認識部102と、認
識結果が確認要求コマンドであるか否か判定する入力判
定部104と、確認要求コマンドであると判定された場
合に入力音声の認識結果を出力する音声出力部108を
有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声を用いて情報入力
を行なう情報処理装置及び方法に関するものである。
【0002】
【従来の技術】従来、計算機へのコマンド等の入力はキ
ーボードやポインティングデバイスによって行なわれて
いたが、音声認識技術の進歩により音声でも行なえるよ
うになってきている。ここで、現状の音声認識技術では
処理の効率化のために、受理できる語彙を限定してい
る。このため、あらかじめ登録されている語彙に限って
入力音声が認識できるという状態になっている。
【0003】このようにどのような語彙でも認識される
わけではないので、ユーザは登録されている語彙を選ん
で入力しなければならない。どの語彙が登録されている
かがわかりにくいという短所があるが、これを改善する
ための一つの方法として、受理できる語彙の一覧をディ
スプレイ上に表示しておくということが行なわれてい
る。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の装置ではディスプレイ上に一度に表示できる語彙の
数には制限があり、登録されている語彙を全ては表示で
きない場合も生じ、確認が容易とは言えない。また、電
話を通して入力を行なうときのようにディスプレイが存
在しない場合には表示自体不可能である。
【0005】また不特定話者を対象とした音声認識で
は、仮にユーザが登録されている語彙であると確認して
から発声した音声であっても話者の音声の特徴によって
は誤認識されてしまう場合がある。この場合、確認した
にも関わらずユーザの望まない処理が実行されてしまう
といった問題がある。
【0006】本発明は、上述した従来の課題を解決し、
音声による入力を容易にする情報処理装置及び方法を提
供することを目的とする。
【0007】
【課題を解決するための手段】上記課題を解決するため
に、本発明の情報処理装置及び方法は、受理可能な語彙
かどうかを確認するためのコマンドを音声によって入力
する手段と、入力された語彙が該コマンドであるかどう
かを判定する手段と、該コマンドであった場合に、確認
対象の語彙を音声認識した結果を出力する手段とを具え
る。
【0008】
【作用】本発明によれば、入力された語彙が確認要求の
コマンドであった場合、続いて入力された語彙を音声認
識し、その結果得られた語彙をディスプレイに表示した
り、音声合成によってスピーカに出力したりする。
【0009】
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。
【0010】図1は、本発明の一実施例に係る情報処理
装置の構成を示すブロック図である。
【0011】同図において101は音声によってコマン
ド等を入力する音声入力部、102は音声入力部101
から入力された語彙を認識する音声認識部、103は音
声認識部102で認識した結果を保持する認識結果保持
部、104は認識結果保持部103に保持された語彙が
確認要求コマンドかどうかを判定する入力判定部、10
5は入力判定部104において判定を行う際に比較に用
いる為の確認要求コマンドを保持する確認要求コマンド
保持部、106は入力のモード(通常モードまたは確認
モード)を保持する入力モード保持部、107は音声を
合成する音声合成部、108は音声合成部107で合成
された音声を出力する音声出力部である。
【0012】図2は上述の情報処理装置のハードウェア
構成を示す図である。同図において、201は音声を入
力するマイクである。202は音声を出力するスピーカ
である。203はマイク201から入力、スピーカ20
2から出力される信号を変換するA/D、D/A変換装
置である。204は図3似示すフローチャートの制御手
順を記憶する制御メモリである。これはROMであって
もよいし、RAMであってもよい。205は制御メモリ
204に記憶されている制御手段にしたがって処理を行
なう中央処理装置である。206はメモリで、認識結果
保持部103、確認要求コマンド保持部105、入力モ
ード保持部106を有する。207は各構成要素を接続
するためのバスである。
【0013】図3は図1に示した装置における動作の処
理手順を示すフローチャートである。本図を参照しなが
ら本発明の一実施例の動作を説明する。
【0014】なお入力モード保持部106に保持される
入力モードの値は「通常モード」もしくは「確認モー
ド」であるが、初期値としては「通常モード」を保持す
るものとする。また、当然のことながら確認要求コマン
ド保持部105に保持される確認要求コマンドは音声認
識部102に受理可能な語彙として登録しておく。
【0015】まずステップS301でマイク201から
の音声入力があったかどうかを調べる。このステップは
音声入力があるまで繰り返される。音声が入力されたと
S301で判断されたら、ステップS302に移り、S
301で入力された語彙を、音声認識部102で音声認
識処理を行なう。認識した結果は認識結果保持部103
に保持する。
【0016】ステップS303では、入力モード保持部
106に現在設定されている入力モードを調べる。現在
の入力モードが「通常モード」の場合はステップS30
1に移り、S302で認識結果保持部103に保持され
た語彙と確認要求コマンド保持部105の内容を比較す
ることにより、認識結果保持部103に保持されている
語彙が確認要求コマンドかどうかを調べる。認識結果保
持部103に保持された語彙と確認要求コマンド保持部
105の内容が一致し、確認要求コマンドと判断される
場合はステップS305に移り、入力モード保持部10
6に入力モードを「確認モード」に設定する。そしてス
テップS301に戻り、ユーザが確認した語彙を入力す
るのを待つ。ここで、例えば「確認したい語を発声して
ください」と音声によって出力して、ユーザに入力を促
すようにしてもよい。
【0017】ステップS304で確認要求コマンドでな
いと判断された場合は、ステップS306に移り、認識
結果保持部103に保持されている語彙をそのままアプ
リケーションに送り、ステップS301に戻る。
【0018】ステップS303で入力モード保持部10
6に保持されている入力モードが「確認モード」だと判
断される場合は、ステップS307に移り、音声合成部
107で確認結果保持部103に保持されている語彙の
音声合成処理を行ない、その結果をステップS308で
音声出力する。音声出力の際には単に語彙だけを出力す
るのでなく「認識結果は××です」のように出力しても
よい。そして、ステップS309で、入力モード保持部
106に保持されている入力モードを「通常モード」に
設定してステップS301に戻る。
【0019】次に、実例を示して、本実施例のさらなる
説明を行なう。確認要求コマンドとしては「登録確認」
という語彙が用意されているものとする。また、受理可
能な語彙として「表示」「削除」「選択」は登録されて
いるが、「デリート」は登録されていないものとする。
このときユーザとシステムの間では例えば次のようなや
りとりが行なわれる。
【0020】usr1:表示 sys1:<ファイルを表示する> usr2:登録確認 sys2:確認したい語を発声してください。
【0021】usr3:デリート sys3:認識した結果は「選択」です。
【0022】usr4:登録確認 sys4:確認したい語を発声してください。
【0023】usr5:削除 sys5:認識した結果は「削除」です。
【0024】usr6:削除 sys6:<ファイルを削除する> (usriはユーザの入力、sysiはシステムの出力
もしくは処理を表す)
【0025】ユーザが「登録確認」と入力し(usr
2)、確認したい語「デリート」を発声したが(usr
3)、これは登録されていないので別の単語「選択」と
誤認識される(sys3)。改めてユーザが「登録確
認」と入力し(usr4)、確認したい語「削除」を発
声すると(usr5)、今度は登録されているため、
「削除」と正しく出力される(sys5)。
【0026】このように、ユーザ自身の音声で使用した
いコマンドを登録確認することによって、そのコマンド
が登録されていること、及びユーザの発声が正しく認識
されることを確認することができる。
【0027】尚、本実施例では、確認要求があった場合
に、認識した結果を音声合成によって出力するようにし
たが、その代わりにディスプレイ上に文字で表示するこ
とにより、より確実に認識結果を確認できるようにして
もよい。また両出力手段を併用してもよい。
【0028】尚、本実施例では、確認をして受理される
ことがわかった場合、改めてその語彙を入力するように
した。しかし、確認をしたときにその語彙をアプリケー
ションに送るかどうかをユーザが選択できるようにして
もよい。これによって2度同じ語彙を入力する手間を省
くことができる。
【0029】尚、本実施例では、一度に確認できる語彙
は1語だけで、別の語彙を確認したい場合は改めて確認
要求をしなければならなかった。しかし、確認要求開始
と確認要求終了のコマンドをそれぞれ用意して、確認要
求開始のコマンドが入力されたときは、確認要求終了の
コマンドが入力されるまで「確認モード」を続けるよう
にして、複数の語彙を続けて確認できるようにしてもよ
い。
【0030】尚、本実施例では確認要求コマンドはシス
テム側に用意されているとしたが、各ユーザが自分の使
いたい語彙を個別に登録できるようにしてもよい。
【0031】尚、本実施例では確認要求コマンドは1語
だけであったが、これは複数受け付けるようにしてもよ
い。
【0032】尚、本実施例では日本語を例にとって説明
したが、これに限るものでなく、他の言語でも同様に実
施できる。
【0033】
【発明の効果】以上説明したように、本発明によれば、
音声認識で受理可能な語彙かどうかを音声によって確認
できるので、音声による入力が容易になるという効果が
ある。
【図面の簡単な説明】
【図1】本発明の一実施例に係る情報処理装置の基本構
成図
【図2】本発明の一実施例に係るシステム構成を示すブ
ロック図
【図3】本発明の一実施例に係る処理手順を示すフロー
チャート

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力する入力手段と、 前記入力された音声を認識する認識手段と、 前記認識手段で認識可能な音声であるか否かを確認する
    よう指示するコマンドを保持するコマンド保持手段と、 前記入力された音声が前記コマンドに該当するか否かを
    判定する判定手段と、 前記入力された音声が前記コマンドに該当すると判定さ
    れる場合に、前記確認の対象として入力された音声の認
    識結果を出力するよう制御する制御手段を有することを
    特徴とする情報処理装置。
  2. 【請求項2】 前記認識結果を音声で出力することを特
    徴とする請求項1に記載の情報処理装置。
  3. 【請求項3】 前記認識結果を文字で表示することを特
    徴とする請求項1に記載の情報処理装置。
  4. 【請求項4】 前記判定手段により前記コマンドが入力
    されたと判定された場合に、確認モードを設定すること
    を特徴とする請求項1に記載の情報処理装置。
  5. 【請求項5】 入力された音声を認識し、 前記認識の結果を出力するよう指示がなされているか否
    かを判定し、 前記指示がなされていると判定される場合に、前記認識
    の結果を出力するよう制御することを特徴とする情報処
    理方法。
  6. 【請求項6】 前記認識結果を音声で出力することを特
    徴とする請求項5に記載の情報処理方法。
  7. 【請求項7】 前記認識結果を文字で表示することを特
    徴とする請求項5に記載の情報処理方法。
JP6008496A 1994-01-28 1994-01-28 情報処理装置及び方法 Withdrawn JPH07219585A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6008496A JPH07219585A (ja) 1994-01-28 1994-01-28 情報処理装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6008496A JPH07219585A (ja) 1994-01-28 1994-01-28 情報処理装置及び方法

Publications (1)

Publication Number Publication Date
JPH07219585A true JPH07219585A (ja) 1995-08-18

Family

ID=11694731

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6008496A Withdrawn JPH07219585A (ja) 1994-01-28 1994-01-28 情報処理装置及び方法

Country Status (1)

Country Link
JP (1) JPH07219585A (ja)

Similar Documents

Publication Publication Date Title
US7260529B1 (en) Command insertion system and method for voice recognition applications
US6801897B2 (en) Method of providing concise forms of natural commands
JPH096390A (ja) 音声認識対話処理方法および音声認識対話装置
US7181397B2 (en) Speech dialog method and system
JPH11161464A (ja) 日本語文章作成装置
JP2001268669A (ja) 移動電話端末を利用した機器制御装置、方法、及び記録媒体
JP2009104047A (ja) 情報処理方法及び情報処理装置
JP3058125B2 (ja) 音声認識装置
JPH07219585A (ja) 情報処理装置及び方法
JP2655086B2 (ja) 電話回線音声入力システム
JP3277579B2 (ja) 音声認識方法および装置
JP2000250587A (ja) 音声認識装置及び音声認識翻訳装置
JPH07199989A (ja) 音声認識装置
JPH09179578A (ja) 単音節認識装置
JP2001005482A (ja) 音声認識方法及び装置
JP2001188668A (ja) 会話処理装置および方法、情報処理装置、会話処理システム、並びに記録媒体
US20080256071A1 (en) Method And System For Selection Of Text For Editing
US20060053013A1 (en) Selection of a user language on purely acoustically controlled telephone
EP1426924A1 (en) Speaker recognition for rejecting background speakers
JP2004037813A (ja) 車載用音声認識装置およびそれを用いた音声認識システム
EP1422691B1 (en) Method for adapting a speech recognition system
JPH08297673A (ja) 音声入力翻訳装置
KR100484665B1 (ko) 음성합성 서비스 시스템 및 그의 제어방법
JPH07210193A (ja) 音声対話装置
JP2000112490A (ja) 音声認識方法及び音声認識装置並びに音声認識処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010403